ES2937927T3 - Método para la amplificación de ácidos nucleicos - Google Patents

Método para la amplificación de ácidos nucleicos Download PDF

Info

Publication number
ES2937927T3
ES2937927T3 ES19743724T ES19743724T ES2937927T3 ES 2937927 T3 ES2937927 T3 ES 2937927T3 ES 19743724 T ES19743724 T ES 19743724T ES 19743724 T ES19743724 T ES 19743724T ES 2937927 T3 ES2937927 T3 ES 2937927T3
Authority
ES
Spain
Prior art keywords
nucleotides
cases
nucleic acid
methods
cell
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
ES19743724T
Other languages
English (en)
Inventor
Charles Gawad
John Easton
Veronica Gonzalez-Pena
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
St Jude Childrens Research Hospital
Original Assignee
St Jude Childrens Research Hospital
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by St Jude Childrens Research Hospital filed Critical St Jude Childrens Research Hospital
Application granted granted Critical
Publication of ES2937927T3 publication Critical patent/ES2937927T3/es
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6844Nucleic acid amplification reactions
    • C12Q1/686Polymerase chain reaction [PCR]
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/10Processes for the isolation, preparation or purification of DNA or RNA
    • C12N15/1034Isolating an individual clone by screening libraries
    • C12N15/1093General methods of preparing gene libraries, not provided for in other subgroups
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6806Preparing nucleic acids for analysis, e.g. for polymerase chain reaction [PCR] assay
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6869Methods for sequencing
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6876Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
    • C12Q1/6883Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material
    • CCHEMISTRY; METALLURGY
    • C40COMBINATORIAL TECHNOLOGY
    • C40BCOMBINATORIAL CHEMISTRY; LIBRARIES, e.g. CHEMICAL LIBRARIES
    • C40B40/00Libraries per se, e.g. arrays, mixtures
    • C40B40/04Libraries containing only organic compounds
    • C40B40/06Libraries containing nucleotides or polynucleotides, or derivatives thereof
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/156Polymorphic or mutational markers

Landscapes

  • Chemical & Material Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Organic Chemistry (AREA)
  • Health & Medical Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Wood Science & Technology (AREA)
  • Zoology (AREA)
  • Genetics & Genomics (AREA)
  • Molecular Biology (AREA)
  • Biochemistry (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Biotechnology (AREA)
  • General Engineering & Computer Science (AREA)
  • Analytical Chemistry (AREA)
  • Physics & Mathematics (AREA)
  • Biophysics (AREA)
  • General Health & Medical Sciences (AREA)
  • Microbiology (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • Immunology (AREA)
  • Biomedical Technology (AREA)
  • Medicinal Chemistry (AREA)
  • General Chemical & Material Sciences (AREA)
  • Pathology (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Crystallography & Structural Chemistry (AREA)
  • Plant Pathology (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
  • Saccharide Compounds (AREA)

Abstract

En el presente documento se proporcionan composiciones y métodos para métodos de amplificación y secuenciación de ácidos nucleicos de amplificación primaria dirigida por plantilla (PTA) precisos y escalables, y sus aplicaciones para investigación, diagnóstico y tratamiento. (Traducción automática con Google Translate, sin valor legal)

Description

DESCRIPCIÓN
Método para la amplificación de ácidos nucleicos
Antecedentes
En el documento WO 03/002736 A2 se describe un método para la mutagénesis in vitro aleatoria y la recombinación de secuencias de polinucleótidos basado en recorrido “walk-through” con moléculas de elongación de la cadena y determinación de la cadena seguido de reensamblaje y amplificación. En el documento WO 2013/177220 A1 se describe un método de generación y secuenciación de amplicones. Stepanauskas et al. (Nature Communications, 8(1):84, 2017) describen un método basado en la amplificación de ADN por desplazamiento múltiple utilizando un mutante termoestable de la polimerasa phi29. En el documento US 2010/0330556 A1 se describe el uso de nucleósidos alfa-tiotrifosfatos para inhibir la degradación de ADN por la actividad exonucleasa 3' a 5' de la polimerasa correctora de errores.
Los métodos de investigación que utilizan la amplificación nucleica, p. ej., la Secuenciación de Próxima Generación, proporcionan una gran cantidad de información sobre muestras complejas, genomas y otras fuentes de ácidos nucleicos. Sin embargo, existe la necesidad de métodos de amplificación y secuenciación de ácidos nucleicos altamente precisos, ampliables a escala y eficientes para la investigación, el diagnóstico y el tratamiento que involucran muestras pequeñas.
Breve compendio
En el presente documento se proporcionan composiciones como se definen en las reivindicaciones que comprenden:
al menos una molécula de ácido nucleico diana y una biblioteca de amplicones, en donde la biblioteca de amplicones comprende una pluralidad de polinucleótidos obtenidos a partir de la amplificación de al menos una molécula de ácido nucleico diana, en donde al menos algunos de los polinucleótidos comprenden un nucleótido terminador, en donde al menos 5% de los polinucleótidos son copias directas de la al menos una molécula de ácido nucleico diana. En realizaciones de dichas composiciones, al menos 10% de los polinucleótidos son copias directas de la al menos una molécula de ácido nucleico diana; o al menos 15% de los polinucleótidos son copias direct molécula de ácido nucleico diana; o al
Figure imgf000002_0001
menos 25% de los polinucleótidos son copias direct molécula de ácido nucleico diana; o al menos 50% de los polinucleótidos son copias direct molécula de ácido nucleico diana; o 5-50% de los polinucleótidos son copias directas de la al menos una molécula de ácido nucleico diana; o 5-25% de los polinucleótidos son copias directas de la al menos una molécula de ácido nucleico diana. En realizaciones adicionales de las composiciones, no más de 50% de una fracción acumulativa de polinucleótidos comprende secuencias de al menos 80%, al menos 85% o al menos 90% de la fracción acumulativa de secuencias de ácido nucleico diana. En realizaciones adicionales de las composiciones, la biblioteca de amplicones tiene un índice de Gini de no más de 0,5 o de no más de 0,4. En realizaciones adicionales de las composiciones, la pluralidad de polinucleótidos tiene entre aproximadamente 50 y aproximadamente 2.000 nucleótidos de longitud, o los polinucleótidos tienen entre aproximadamente 400 y aproximadamente 600 nucleótidos de longitud. El número de polinucleótidos es al menos 100, tal como 100-5.000 o 250-1.250. En realizaciones de las composiciones, el número de polinucleótidos es de al menos 500 o al menos 1.000. En realizaciones adicionales de las composiciones, al menos algunos de los polinucleótidos comprenden un código de barras. El código de barras puede comprender un código de barras celular. El código de barras puede comprender un código de barras de muestra. En realizaciones adicionales de las composiciones, al menos algunos de los polinucleótidos comprenden un identificador molecular único. En realizaciones adicionales de las composiciones, la pluralidad de polinucleótidos comprende secuencias al menos parcialmente representativas de un genoma. En realizaciones adicionales de las composiciones, la pluralidad de polinucleótidos comprende secuencias al menos parcialmente representativas de al menos dos genomas. En realizaciones adicionales de las composiciones, la pluralidad de polinucleótidos comprende secuencias de ADNc. En realizaciones adicionales de las composiciones, al menos 90% o al menos 98% de los polinucleótidos comprenden un nucleótido terminador. En realizaciones adicionales de las composiciones, el nucleótido terminador se ancla al extremo terminal 3' de al menos algunos polinucleótidos. El nucleótido terminador es un terminador irreversible seleccionado del grupo que consiste en nucleótidos con modificación en el grupo alfa, nucleótidos espaciadores C3, ácidos nucleicos bloqueados (LNA), ácidos nucleicos invertidos, nucleótidos fluorados en 2', nucleótidos fosforilados en 3', nucleótidos modificados con 2'-O-metilo y ácidos nucleicos trans. Los nucleótidos con modificación del grupo alfa pueden ser alfatio didesoxinucleótidos. Adicionalmente, los nucleótidos terminadores pueden seleccionarse del grupo que consiste en nucleótidos fosforilados en 3', nucleótidos espaciadores C3 en 3' y combinaciones de los mismos. En realizaciones adicionales de las composiciones, la composición está contenida en una gotita.
En el presente documento se proporcionan composiciones como se definen en las reivindicaciones que comprenden:
al menos una molécula de ácido nucleico diana y una biblioteca de amplicones, en donde la biblioteca de amplicones comprende una pluralidad de polinucleótidos obtenidos a partir de la amplificación de al menos una molécula de ácido nucleico diana, en donde al menos algunos de los polinucleótidos comprenden un nucleótido terminador, en donde no más de 50% de una fracción acumulativa de polinucleótidos comprende secuencias de al menos 80% de una fracción acumulativa de secuencias de la al menos una molécula de ácido nucleico diana. En realizaciones adicionales de las composiciones, no más de 50% de la fracción acumulativa de la pluralidad de polinucleótidos comprende secuencias de la al menos 85% o al menos 90% de la fracción acumulativa de secuencias de ácido nucleico diana. En realizaciones adicionales de las composiciones, la pluralidad de polinucleótidos tiene entre aproximadamente 50 y aproximadamente 2.000 nucleótidos de longitud, o los polinucleótidos tienen entre aproximadamente 400 y aproximadamente 600 nucleótidos de longitud. El número de polinucleótidos es al menos 100, tal como 100-5.000 o 250-1.250. En realizaciones de las composiciones, el número de polinucleótidos es de al menos 500 o al menos 1.000. En realizaciones adicionales de las composiciones, al menos algunos de los polinucleótidos comprenden un código de barras. El código de barras puede comprender un código de barras celular. El código de barras puede comprender un código de barras de muestra. En realizaciones adicionales de las composiciones, al menos algunos de los polinucleótidos comprenden un identificador molecular único. En realizaciones adicionales de las composiciones, la pluralidad de polinucleótidos comprende secuencias al menos parcialmente representativas de un genoma. En realizaciones adicionales de las composiciones, la pluralidad de polinucleótidos comprende secuencias al menos parcialmente representativas de al menos dos genomas. En realizaciones adicionales de las composiciones, la pluralidad de polinucleótidos comprende secuencias de ADNc. En realizaciones adicionales de las composiciones, al menos 90% o al menos 98% de los polinucleótidos comprenden un nucleótido terminador. En realizaciones adicionales de las composiciones, el nucleótido terminador se ancla al extremo terminal 3' de al menos algunos polinucleótidos. El nucleótido terminador es un terminador irreversible seleccionado del grupo que consiste en nucleótidos con modificación en el grupo alfa, nucleótidos espaciadores C3, ácidos nucleicos bloqueados (LNA), ácidos nucleicos invertidos, nucleótidos fluorados en 2’, nucleótidos fosforilados en 3’, nucleótidos modificados con 2'-O-metilo y ácidos nucleicos trans. Los nucleótidos con modificación del grupo alfa pueden ser alfa-tio didesoxinucleótidos. Adicionalmente, los nucleótidos terminadores pueden seleccionarse del grupo que consiste en nucleótidos fosforilados en 3', nucleótidos espaciadores C3 en 3' y combinaciones de los mismos. En realizaciones adicionales de las composiciones, la composición está contenida en una gotita.
Adicionalmente, en el presente documento se describen métodos para amplificar una molécula de ácido nucleico diana, comprendiendo el método: poner en contacto una muestra que comprende la molécula de ácido nucleico diana, al menos un cebador de amplificación, al menos una polimerasa de ácido nucleico y una mezcla de nucleótidos, en donde la mezcla de nucleótidos comprende al menos un nucleótido terminador que termina la replicación del ácido nucleico por la polimerasa, y amplificar la molécula de ácido nucleico diana para generar una pluralidad de productos de amplificación terminados, en donde la replicación prosigue mediante replicación por desplazamiento de cadena. En el presente documento se describen adicionalmente métodos en donde la amplificación se realiza en condiciones sustancialmente isotérmicas. En el presente documento se describen adicionalmente métodos en donde la amplificación se realiza en condiciones donde la temperatura varía en no más de 10 grados C. En el presente documento se describen adicionalmente métodos en donde la amplificación se realiza en condiciones en donde la temperatura varía en no más de 5 grados C. En el presente documento se describen adicionalmente métodos en donde la polimerasa de ácido nucleico es una ADN polimerasa. En el presente documento se describen adicionalmente métodos en donde la ADN polimerasa es una ADN polimerasa de desplazamiento de cadena. En el presente documento se describen adicionalmente métodos en donde la polimerasa de ácido nucleico es polimerasa del bacteriófago phi29 (029), ADN polimerasa de phi29 (029) modificada genéticamente, fragmento Klenow de la ADN polimerasa I, ADN polimerasa del fago M2, ADN polimerasa del fago phiPRD1, ADN polimerasa de Bst, fragmento grande de ADN polimerasa de Bst, polimerasa de Bst exo(-), ADN polimerasa de Bca exo(-),ADN polimerasa de Bsu, ADN polimerasa VentR, ADN polimerasa VentR (exo-), ADN polimerasa Deep Vent, ADN polimerasa Deep Vent (exo-), ADN polimerasa IsoPol, ADN polimerasa I, ADN polimerasa Therminator, ADN polimerasa T5, Sequenasa, ADN polimerasa de T7, Sequenasa de T7 o ADN polimerasa de T4. En el presente documento se describen adicionalmente métodos en donde la polimerasa de ácido nucleico comprende actividad exonucleasa 3'->5' y el al menos un nucleótido terminador inhibe la actividad exonucleasa 3'->5'. En el presente documento se describen adicionalmente métodos en donde la polimerasa de ácido nucleico no comprende actividad exonucleasa 3' -> 5'. En el presente documento se describen adicionalmente métodos en donde la polimerasa es ADN polimerasa de Bst, polimerasa de Bst exo(-), ADN polimerasa de Bca exo(-), ADN polimerasa de Bsu, ADN polimerasa VentR (exo-), ADN polimerasa Deep Vent (exo-), Fragmento de Klenow de ADN polimerasa (exo-) o ADN polimerasa Therminator. En el presente documento se describen adicionalmente métodos en donde el al menos un nucleótido terminador comprende modificaciones del grupo r del carbono 3' de la desoxirribosa. En el presente documento se describen adicionalmente métodos en donde el al menos un nucleótido terminador se selecciona del grupo que consiste en nucleótidos que contienen terminador reversible bloqueado en 3', nucleótidos que contienen terminador reversible desbloqueado en 3', terminadores que contienen modificaciones en 2' de desoxinucleótidos, terminadores que contienen modificaciones en la base nitrogenada de desoxinucleótidos, y combinaciones de los mismos. En el presente documento se describen adicionalmente métodos en donde el al menos un nucleótido terminador se selecciona del grupo que consiste en didesoxinucleótidos, didesoxinucleótidos invertidos, nucleótidos biotinilados en 3', nucleótidos con amino en 3', nucleótidos fosforilados en 3', nucleótidos con 3'-O-metilo, nucleótidos espaciadores de carbono 3' que incluyen nucleótidos espaciadores C3 en 3’, nucleótidos C18 en 3', nucleótidos espaciadores de Hexanodiol en 3', aciclonucleótidos y combinaciones de los mismos. En el presente documento se describen adicionalmente métodos en donde el al menos un nucleótido terminador se selecciona del grupo que consiste en nucleótidos con modificación del grupo alfa, nucleótidos espaciadores C3, ácidos nucleicos bloqueados (LNA), ácidos nucleicos invertidos, nucleótidos fluorados en 2’, nucleótidos fosforilados en 3', nucleótidos modificados con 2'-O-metilo y ácidos nucleicos trans. En el presente documento se describen adicionalmente métodos en donde los nucleótidos con modificación del grupo alfa son alfa-tio didesoxinucleótidos. En el presente documento se describen adicionalmente métodos en donde los cebadores de amplificación tienen de 4 a 70 nucleótidos de longitud. En el presente documento se describen adicionalmente métodos en donde el al menos un cebador de amplificación tiene de 4 a 20 nucleótidos de longitud.
En el presente documento se describen adicionalmente métodos en donde el método comprende adicionalmente una etapa de amplificación adicional utilizando PCR. En el presente documento se describen adicionalmente métodos en donde el al menos un cebador de amplificación comprende una región aleatorizada. En el presente documento se describen adicionalmente métodos en donde la región aleatorizada tiene de 4 a 20 nucleótidos de longitud. En el presente documento se describen adicionalmente métodos en donde la región aleatorizada tiene de 8 a 15 nucleótidos de longitud. En el presente documento se describen adicionalmente métodos en donde los productos de amplificación tienen entre aproximadamente 50 y aproximadamente 2.000 nucleótidos de longitud. En el presente documento se describen adicionalmente métodos en donde los productos de amplificación tienen entre aproximadamente 200 y aproximadamente 1.000 nucleótidos de longitud. En el presente documento se describen adicionalmente métodos en donde se identifican variantes de secuencias de baja frecuencia. En el presente documento se describen adicionalmente métodos en donde las variantes de secuencia de baja frecuencia constituyen >0,01% de las secuencias totales. En el presente documento se describen adicionalmente métodos en donde las variantes de secuencias de baja frecuencia constituyen >0,05% de las secuencias totales. En el presente documento se describen adicionalmente métodos en donde las variantes de secuencias de baja frecuencia constituyen >0,10% de las secuencias totales.
Adicionalmente, en el presente documento se describen métodos para secuenciar una molécula de ácido nucleico diana, comprendiendo el método: poner en contacto una muestra que comprende la molécula de ácido nucleico diana, al menos un cebador de amplificación, al menos una polimerasa de ácido nucleico y una mezcla de nucleótidos, en donde la mezcla de nucleótidos comprende al menos un nucleótido terminador que termina la replicación del ácido nucleico por la polimerasa, y amplificar la molécula de ácido nucleico diana para generar una pluralidad de productos de amplificación terminados, en donde la replicación prosigue mediante replicación por desplazamiento de cadena; eliminar al menos un nucleótido terminador de los productos de amplificación terminados; ligar las moléculas obtenidas en el método a los adaptadores, generando así una biblioteca de productos de amplificación; y secuenciar la biblioteca de productos de amplificación. En el presente documento se describen adicionalmente métodos que comprenden adicionalmente la reparación de extremos y la adición de colas de A. En el presente documento se describen adicionalmente métodos en donde el ácido nucleico diana es ADN. En el presente documento se describen adicionalmente métodos en donde el ADN es un ADNc. En el presente documento se describen adicionalmente métodos en donde el ADN es un ADN genómico. En el presente documento se describen adicionalmente métodos en donde el al menos un cebador de amplificación comprende dos o más cebadores. En el presente documento se describen adicionalmente métodos en donde el al menos un cebador de amplificación es un cebador aleatorio. En el presente documento se describen adicionalmente métodos en donde el al menos un cebador de amplificación comprende un código de barras. En el presente documento se describen adicionalmente métodos en donde el código de barras comprende un código de barras celular. En el presente documento se describen adicionalmente métodos en donde el código de barras comprende un código de barras de muestra. En el presente documento se describen adicionalmente métodos en donde los cebadores de amplificación comprenden un identificador molecular único (“UMI en sus siglas inglesas”). En el presente documento se describen adicionalmente métodos en donde el método comprende adicionalmente desnaturalizar el ácido nucleico diana o el ADN genómico antes de la reasociación inicial del cebador. En el presente documento se describen adicionalmente métodos en donde la desnaturalización se lleva a cabo en condiciones alcalinas seguida de neutralización. En el presente documento se describen adicionalmente métodos en donde la muestra, los cebadores de amplificación, la polimerasa de ácido nucleico y la mezcla de nucleótidos están contenidos en un dispositivo microfluídico. En el presente documento se describen adicionalmente métodos en donde la muestra, los cebadores de amplificación, la polimerasa de ácido nucleico y la mezcla de nucleótidos están contenidos en una gotita. Adicionalmente, en el presente documento se describen métodos en donde la muestra se selecciona entre muestras de tejido, células, muestras de fluidos biológicos, muestras de médula ósea, muestras de semen, muestras de biopsia, muestras de cáncer, muestras de tumores, muestras de producto lisado celular, muestras forenses, muestras arqueológicas, muestras paleontológicas, muestras de infección, muestras de producción, plantas enteras, partes de plantas, muestras de microbiota, preparaciones virales, muestras de suelo, muestras marinas, muestras de agua dulce, muestras domésticas o industriales, y combinaciones y productos aislados de las mismas. En el presente documento se describen adicionalmente métodos en donde los fluidos biológicos se seleccionan entre sangre, orina, saliva, líquido linfático, líquido cefalorraquídeo (LCR), líquido amniótico, líquido pleural, líquido pericárdico, ascitis y humor acuoso. En el presente documento se describen adicionalmente métodos en donde el método comprende adicionalmente una etapa de amplificación adicional utilizando PCR.
Adicionalmente, en el presente documento se describen métodos para secuenciar una única célula, comprendiendo el método: proporcionar un producto lisado celular de la única célula; poner en contacto el producto lisado celular con al menos un cebador de amplificación, al menos una polimerasa de ácido nucleico y una mezcla de nucleótidos, en donde la mezcla de nucleótidos comprende al menos un nucleótido terminador que termina la replicación del ácido nucleico por la polimerasa, y amplificar la molécula de ácido nucleico diana para generar una pluralidad de productos de amplificación terminados, en donde la replicación prosigue mediante replicación por desplazamiento de cadena; eliminar al menos un nucleótido terminador de los productos de amplificación terminados; ligar las moléculas obtenidas en el método a adaptadores, generando así una biblioteca de productos de amplificación; y secuenciar la biblioteca de productos de amplificación. En el presente documento se describen adicionalmente métodos en donde la lisis celular va acompañada de proteólisis. En el presente documento se describen adicionalmente métodos en donde la muestra, al menos un cebador de amplificación, la polimerasa de ácido nucleico y la mezcla de nucleótidos están contenidos en un dispositivo microfluídico. En el presente documento se describen adicionalmente métodos en donde la muestra, el al menos un cebador de amplificación, la polimerasa de ácido nucleico y la mezcla de nucleótidos están contenidos en una gotita. En el presente documento se describen adicionalmente métodos en donde el al menos un cebador de amplificación se ancla a un soporte sólido. En el presente documento se describen adicionalmente métodos en donde el soporte sólido es una cuenta. En el presente documento se describen adicionalmente métodos en donde el al menos un cebador de amplificación se ancla a un soporte sólido a través de un conector escindible. En el presente documento se describen adicionalmente métodos en donde el al menos un cebador de amplificación comprende un código de barras. En el presente documento se describen adicionalmente métodos en donde el método comprende adicionalmente escindir el conector escindible antes de la amplificación. En el presente documento se describen adicionalmente métodos en donde la célula se selecciona entre una célula animal, una célula vegetal, una célula fúngica, una célula bacteriana y una célula protozoaria. En el presente documento se describen adicionalmente métodos en donde la célula animal es una célula humana. En el presente documento se describen adicionalmente métodos en donde la célula se selecciona entre una célula de un embrión previo a la implantación, una célula madre, una célula fetal, una célula tumoral, una célula sospechosa de ser cancerosa, una célula cancerosa, una célula sometida a un procedimiento de edición de genes, una célula de un organismo patógeno, una célula obtenida de una muestra forense, una célula obtenida de una muestra arqueológica y una célula obtenida de una muestra paleontológica. En el presente documento se describen adicionalmente métodos en donde la célula embrionaria previa a la implantación es un blastómero. En el presente documento se describen adicionalmente métodos en donde el blastómero se obtiene a partir de un embrión en fase de ocho células producido mediante fertilización in vitro. En el presente documento se describen adicionalmente métodos que comprenden adicionalmente determinar la presencia de variantes somáticas o de línea germinal que predisponen a la enfermedad en la célula embrionaria. En el presente documento se describen adicionalmente métodos en donde el organismo patógeno es una bacteria, un hongo o un protozoo. En el presente documento se describen adicionalmente métodos en donde la célula obtenida de un organismo patógeno se obtiene a partir de líquido extraído de un paciente, una muestra de microbiota o un dispositivo médico permanente. En el presente documento se describen adicionalmente métodos que comprenden adicionalmente la etapa de determinar la identidad del organismo patógeno. En el presente documento se describen adicionalmente métodos que comprenden adicionalmente determinar la presencia de variantes genéticas responsables de la resistencia del organismo patógeno a un tratamiento. En el presente documento se describen adicionalmente métodos en donde la célula es una célula tumoral, una célula sospechosa de ser cancerosa o una célula cancerosa. En el presente documento se describen adicionalmente métodos que comprenden adicionalmente determinar la presencia de una o más mutaciones de diagnóstico o pronóstico. Adicionalmente, en el presente documento se describen métodos que comprenden adicionalmente determinar la presencia de variantes somáticas o de línea germinal responsables de la resistencia a un tratamiento. En el presente documento se describen adicionalmente métodos en donde la célula es una célula sometida a un procedimiento de edición de genes. Adicionalmente, en el presente documento se describen métodos que comprenden adicionalmente determinar la presencia de mutaciones no planificadas causadas por el procedimiento de edición de genes. Adicionalmente, en el presente documento se describen métodos que comprenden adicionalmente determinar la historia de un linaje celular. En el presente documento se describen adicionalmente métodos en donde se identifican variantes de secuencias de baja frecuencia. En el presente documento se describen adicionalmente métodos en donde las variantes de secuencia de baja frecuencia constituyen >0,01% de las secuencias totales. En el presente documento se describen adicionalmente métodos en donde las variantes de secuencias de baja frecuencia constituyen >0,05% de las secuencias totales. En el presente documento se describen adicionalmente métodos en donde las variantes de secuencias de baja frecuencia constituyen >0,10% de las secuencias totales. En el presente documento se describen adicionalmente métodos en donde el método comprende adicionalmente una etapa de amplificación adicional utilizando PCR.
Adicionalmente, en el presente documento se describen métodos para determinar la mutagenicidad de una condición ambiental, comprendiendo el método: exponer las células a la condición ambiental; aislar células individuales de la población; proporcionar un producto lisado celular de una única célula; poner en contacto el producto lisado celular con al menos un cebador de amplificación, al menos una polimerasa de ácido nucleico y una mezcla de nucleótidos, en donde la mezcla de nucleótidos comprende al menos un nucleótido terminador que termina la replicación del ácido nucleico por la polimerasa, y amplificar la molécula de ácido nucleico diana para generar una pluralidad de productos de amplificación terminados, en donde la replicación prosigue mediante replicación por desplazamiento de cadena; eliminar al menos un nucleótido terminador de los productos de amplificación terminados; ligar las moléculas obtenidas en el método a adaptadores, generando así una biblioteca de productos de amplificación; y secuenciar la biblioteca de productos de amplificación y comparar las secuencias de productos de amplificación con al menos una secuencia de referencia para identificar mutaciones. En el presente documento se describen adicionalmente métodos en donde la única célula es una célula humana. En el presente documento se describen adicionalmente métodos en donde la condición ambiental comprende una sustancia química. En el presente documento se describen adicionalmente métodos en donde la condición ambiental comprende radiación. En el presente documento se describen adicionalmente métodos en donde la condición ambiental comprende luz ultravioleta. En el presente documento se describen adicionalmente métodos en donde las células individuales se originan a partir de hígado, piel, riñón, sangre o pulmón. En el presente documento se describen adicionalmente métodos en donde al menos algunos de los productos de amplificación comprenden un código de barras. En el presente documento se describen adicionalmente métodos en donde el código de barras comprende un código de barras celular. En el presente documento se describen adicionalmente métodos en donde el código de barras comprende un código de barras de muestra. En el presente documento se describen adicionalmente métodos en donde al menos algunos de los cebadores de amplificación comprenden un identificador molecular único (UMI). En el presente documento se describen adicionalmente métodos en donde el método comprende adicionalmente una etapa de amplificación adicional utilizando PCR.
Breve descripción de los dibujos
Las características novedosas de la invención se exponen con particularidad en las reivindicaciones adjuntas. Se obtendrá una mejor comprensión de las características y ventajas de la presente invención con referencia a la siguiente descripción detallada que establece realizaciones ilustrativas, en las que se utilizan los principios de la invención, y los dibujos adjuntos:
La Figura 1A ilustra una comparación de un método anterior de amplificación de desplazamiento múltiple (MDA) con un tipo de método de Amplificación Dirigida por Molde Primario (PTA), a saber, el método de PTA-Terminador Irreversible.
La Figura 1B ilustra una comparación del método de PTA-Terminador irreversible con un tipo diferente, a saber, el método de PTA-Terminador reversible.
La Figura 1C ilustra una comparación de MDA y el método de PTA-Terminador Irreversible relacionados con la propagación de mutaciones.
La Figura 1D ilustra las etapas del método realizadas después de la amplificación, que incluyen la eliminación del terminador, la reparación de los extremos y la adición de colas de A antes de la ligación del adaptador. La biblioteca de células agrupadas puede someterse a continuación a un enriquecimiento mediado por hibridación para todos los exones u otras regiones específicas de interés antes de la secuenciación. La célula de origen de cada lectura se identifica mediante el código de barras celular (que se muestra como secuencias de color verde y azul).
La Figura 2A muestra la distribución de tamaño de los amplicones después de someterse a PTA con la adición de concentraciones crecientes de terminadores (gel superior). El gel inferior muestra la distribución de tamaño de los amplicones después de someterse a PTA con la adición de concentraciones crecientes de terminador reversible o la adición de concentraciones crecientes de terminador irreversible.
La Figura 2B (GC) muestra la comparación del contenido de GC de bases secuenciadas para MDA y PTA.
La Figura 2C muestra el mapeo de puntuaciones (e) de calidad del mapa (mapQ) con respecto al genoma humano (p_mapped) después de que las células individuales se sometieran a PTA o MDA.
Figura 2D porcentaje de lecturas mapeadas con respecto al genoma humano (p_mapped) después de que las células individuales se sometieran a PTA o MDA.
La Figura 2E (PCR) muestra la comparación del porcentaje de lecturas que son duplicados de PCR para 20 millones de lecturas de submuestras después de que las células individuales se sometieran a MDA y PTA.
La Figura 3A muestra el mapeo de puntuaciones (c) de calidad del mapa (mapQ2) con respecto al genoma humano (p_mapped2) después de que las células individuales se sometieran a PTA con terminadores reversibles o irreversibles.
La Figura 3B muestra el porcentaje de lecturas mapeadas con respecto al genoma humano (p_mapped2) después de que las células individuales se sometieran a PTA con terminadores reversibles o irreversibles.
La Figura 3C muestra una serie de diagramas de caja que describen lecturas alineadas para el porcentaje medio de lecturas solapantes con elementos Alu utilizando varios métodos. La PTA tuvo el mayor número de lecturas alineadas con respecto al genoma.
La Figura 3D muestra una serie de diagramas de caja que describen las duplicaciones de PCR para el porcentaje medio de lecturas que se solapan con los elementos Alu utilizando diversos métodos.
La Figura 3E muestra una serie de diagramas de caja que describen el contenido de lecturas de GC para el porcentaje medio de lecturas que se superponen con elementos Alu utilizando diversos métodos.
La Figura 3F muestra una serie de diagramas de caja que describen la calidad del mapeo del porcentaje medio de lecturas que se solapan con elementos Alu utilizando diversos métodos. La PTA tuvo la calidad de mapeo más alta de los métodos probados.
La Figura 3G muestra una comparación de la amplitud de cobertura del genoma mitocondrial SC con diferentes métodos de WGA a una profundidad de secuenciación fija de 7,5X.
La Figura 4A muestra una profundidad de cobertura media de ventanas de 10 kilobases en el cromosoma 1 después de seleccionar una célula de MDA de alta calidad (representativa de ~50% de células) en comparación con una célula amplificada por PTA con cebador aleatorio después de reducir la muestra de cada célula a 40 millones de lecturas emparejadas. La figura muestra que la MDA tiene menos uniformidad con muchas más ventanas que tienen más (recuadro A) o menos (recuadro C) que el doble de la profundidad de cobertura media. Hay ausencia de cobertura tanto en MDA como en PTA en el centrómero debido al alto contenido de GC y la baja calidad de mapeo de las regiones repetitivas (recuadro B).
La Figura 4B muestra diagramas de cobertura de secuenciación frente a la posición del genoma para los métodos MDA y PTA (parte superior). Los diagramas de caja inferiores muestran las frecuencias alélicas de los métodos MDA y PTA en comparación con la muestra masiva.
La Figura 4C muestra un diagrama de la cobertura media frente a la ventana del genoma para la uniformidad de la cobertura de los experimentos de MDA y PTA. La PTA condujo a una cobertura significativamente más uniforme en todo el genoma que MDA.
La Figura 5A muestra un diagrama de la fracción del genoma cubierto frente al número de lecturas del genoma para evaluar la cobertura al aumentar la profundidad de secuenciación para una variedad de métodos. El método de PTA se acerca a las dos muestras masivas a todas las profundidades, lo que es una mejora con respecto a otros métodos probados.
La Figura 5B muestra un diagrama del coeficiente de variación de la cobertura del genoma frente al número de lecturas para evaluar la uniformidad de la cobertura. Se encontró que el método de PTA tiene la mayor uniformidad de los métodos probados.
La Figura 5C muestra un diagrama de Lorenz de la fracción acumulativa del total de lecturas frente a la fracción acumulativa del genoma. Se encontró que el método de PTA tiene la mayor uniformidad de los métodos probados.
La Figura 5D muestra una serie de diagramas de caja de los Indices de Gini calculados para cada uno de los métodos probados con el fin de estimar la diferencia de cada reacción de amplificación a partir de la uniformidad perfecta. Se encontró que el método de PTA era reproduciblemente más uniforme que otros métodos probados.
La Figura 5E muestra un diagrama de la fracción de variantes masivas detectadas frente al número de lecturas. Las tasas de asignación de variantes para cada uno de los métodos se compararon con la muestra masiva correspondiente a una profundidad de secuenciación creciente. Para estimar la sensibilidad, se calculó el porcentaje de variantes detectadas en las muestras masivas correspondientes que se habían submuestreado a 650 millones de lecturas encontradas en cada célula a cada profundidad de secuenciación (Figura 3A). La cobertura y la uniformidad mejoradas de la PTA dieron como resultado la detección de 30% más de variantes con respecto al método Q-MDA, que fue el siguiente método más sensible.
La Figura 5F muestra una serie de diagramas de caja del porcentaje medio de lecturas solapantes con elementos Alu. El método de PTA disminuyó significativamente la desviación alélica en estos sitios heterocigotos. El método de PTA amplifica más uniformemente dos alelos en la misma célula con relación a otros métodos probados.
La Figura 5G muestra un diagrama de especificidad de las detecciones de variantes frente al número de lecturas para evaluar la especificidad de las detecciones de mutación. Las variantes encontradas utilizando varios métodos que no se encontraron en las muestras masivas se consideraron falsos positivos. El método de PTA dio como resultado las detecciones de falsos positivos más bajas (la mayor especificidad) de los métodos probados.
La Figura 5H muestra la fracción de cambios de base falsos positivos para cada tipo de cambio de base a través de varios métodos. Sin estar vinculados a la teoría, tales patrones pueden depender de la polimerasa.
La Figura 5I muestra una serie de diagramas de caja del porcentaje medio de lecturas solapantes con elementos Alu para detecciones de variantes falsos positivos. El método de PTA dio como resultado las frecuencias alélicas más bajas para detecciones de variantes de falsos positivos.
La Figura 6A representa una descripción esquemática de un catálogo de sensibilidad a fármacos de los clonotipos según la divulgación. Mediante la identificación de las sensibilidades a los fármacos de distintos clonotipos, se puede crear un catálogo a partir del cual los oncólogos pueden traducir los clonotipos identificados en el tumor de un paciente a una lista de fármacos que se dirigirán mejor a las poblaciones resistentes.
La Figura 6B muestra un cambio en el número de clones leucémicos con un número creciente de células leucémicas por clon después de 100 simulaciones. Utilizando tasas de mutación por célula, las simulaciones predicen una diversidad masiva de clones más pequeños creados a medida que una célula se expande a 10-100 mil millones de células (recuadro A). Solo los clones 1-5 de mayor frecuencia (recuadro C) se detectan con los métodos de secuenciación actuales. Se describen los métodos para determinar la resistencia a los fármacos de los cientos de clones que están justo por debajo del nivel de detección del método actual (recuadro B).
La Figura 7 muestra un método ilustrativo de la divulgación. En comparación con la muestra de diagnóstico de la fila inferior, el cultivo sin quimioterapia seleccionó un clon (recuadro de color rojo, esquina inferior derecha) que albergaba una mutación KRAS activadora. Por el contrario, ese clon fue destruido por prednisolona o daunorrubicina (recuadro de color verde, esquina superior derecha) mientras que los clones de menor frecuencia se sometieron a selección positiva (recuadro de líneas discontinuas).
La Figura 8 es una descripción general de un método de la divulgación, a saber, el diseño experimental para cuantificar las sensibilidades relativas de clones con genotipos específicos a fármacos específicos.
La Figura 9 (parte A) muestra cuentas con oligonucleótidos anclados con un conector escindible, un código de barras celular único y un cebador aleatorio. La Parte B muestra una célula individual y una cuenta encapsuladas en la misma gotita, seguida de la lisis de la célula y la escisión del cebador. A continuación, la gotita se puede fusionar con otra gotita que comprende la mezcla de amplificación de PTA. La parte C muestra que las gotitas se rompen después de la amplificación y se combinan los amplicones de todas las células. A continuación, se utiliza el protocolo de acuerdo con la divulgación para eliminar el terminador, la reparación del extremo y la cola de A antes de la ligación del adaptador. La biblioteca de células agrupadas se somete después a un enriquecimiento mediado por hibridación de los exones de interés antes de la secuenciación. A continuación, la célula de origen de cada lectura se identifica mediante el código de barras celular.
La Figura 10A demuestra la incorporación de códigos de barras celulares y/o identificadores moleculares únicos en las reacciones de PTA utilizando cebadores que comprenden códigos de barras celulares y/o identificadores moleculares únicos.
La Figura 10B demuestra la incorporación de códigos de barras celulares y/o identificadores moleculares únicos en las reacciones de PTA utilizando cebadores en horquilla que comprenden códigos de barras celulares y/o identificadores moleculares únicos.
La Figura 11A (PTAJJMI) muestra que la incorporación de identificadores moleculares únicos (UMI) permite la creación de lecturas consenso, lo que reduce la tasa de falsos positivos causada por la secuenciación y otros errores que conducen a una mayor sensibilidad al realizar detecciones de variantes de línea germinal o somáticas.
La Figura 11B muestra que la compilación de las lecturas con el mismo UMI permite la corrección de la amplificación y otros sesgos que podrían dar como resultado una detección falsa o una sensibilidad limitada al detectar las variantes del número de copias.
La Figura 12A muestra un diagrama del número de mutaciones frente a los grupos de tratamiento para una medición directa del experimento de mutagenicidad ambiental. Se expusieron células humanas individuales a vehículo (VHC), manosa (MAN) o al mutágeno directo N-etil-N-nitrosourea (ENJ) a diferentes niveles de tratamiento, y se midió el número de mutaciones.
La Figura 12B muestra una serie de diagramas del número de mutaciones frente a diferentes grupos y niveles de tratamiento, divididos además por el tipo de mutaciones de base.
La Figura 12C muestra una representación de patrón de mutaciones en un contexto de trinucleótido. Las bases en el eje y están en la posición n-1 y las bases en el eje x están en la posición n+1. Las regiones más oscuras indican una frecuencia mutacional más baja y las regiones más claras indican una frecuencia mutacional más alta. Los recuadros de color negro rellenos en la fila superior (mutaciones de citosina) indican que la mutagénesis de citosina es menos frecuente cuando la citosina va seguida de una guanina. Los recuadros de color negro con línea discontinua en la fila inferior (mutaciones de timina) indican que la mayoría de las mutaciones de timina aparecen en posiciones donde la adenina precede inmediatamente a la timina.
La Figura 12D muestra un gráfico que compara las ubicaciones de los sitios hipersensibles a ADNasa I conocidos en las células CD34+ con las ubicaciones correspondientes de las células tratadas con N-etil-N-nitrosourea. No se observó un enriquecimiento significativo en variantes de citosina.
La Figura 12E muestra la proporción de mutaciones inducidas por ENJ en sitios Hipersensibles a ADNasa I (DH). Los sitios DH en células CD34+ catalogados previamente por Roadmap Epigenomics Project se utilizaron para investigar si las mutaciones ENJ son más frecuentes en los sitios DH que representan sitios de cromatina abierta. No se identificó un enriquecimiento significativo en las ubicaciones de variantes en los sitios DH, y no se observó un enriquecimiento de variantes restringidas a citosinas en los sitios DH.
La Figura 12F muestra una serie de diagramas de caja de la proporción de mutaciones inducidas por ENJ en ubicaciones genómicas con anotaciones específicas. No se observó un enriquecimiento específico en anotaciones específicas para variantes (recuadros de la izquierda) en cada célula con relación a la proporción del genoma (recuadros de la derecha) que comprende cada anotación.
Descripción detallada de la invención
Existe la necesidad de desarrollar nuevos métodos ampliables a escala, precisos y eficientes para la amplificación de ácidos nucleicos (incluida la amplificación de genomas unicelulares y multicelulares) y la secuenciación que superen las limitaciones de los métodos actuales al aumentar la representación, la uniformidad y la precisión de las secuencias de forma reproducible. En el presente documento se describen composiciones y métodos para proporcionar Amplificación Dirigida por Molde Primario (PTA) y secuenciación precisas y ampliables a escala. En el presente documento se describen adicionalmente métodos de determinación de variantes de un solo nucleótido, variación del número de copias, clonotipificación y medición de la mutagenicidad ambiental. Tales métodos y composiciones facilitan la amplificación altamente precisa de los ácidos nucleicos diana (o "molde"), lo que aumenta la precisión y la sensibilidad de las aplicaciones aguas abajo, tales como la Secuenciación de Próxima Generación.
Definiciones
A menos que se defina de otro modo, todos los términos técnicos y científicos utilizados en el presente documento tienen el mismo significado que comúnmente entiende un experto en la técnica a la que pertenecen estas invenciones.
A lo largo de esta divulgación, las características numéricas se presentan en un formato de rango. Debe entenderse que la descripción en formato de rango es meramente por conveniencia y brevedad y no debe interpretarse como una limitación inflexible del alcance de cualquier realización. En consecuencia, se debe considerar que la descripción de un rango ha divulgado específicamente todos los subrangos posibles, así como los valores numéricos individuales dentro de ese rango hasta la décima parte de la unidad del límite inferior, a menos que el contexto indique claramente lo contrario. Por ejemplo, se debe considerar que la descripción de un rango tal como de 1 a 6 tiene subrangos divulgados específicamente tales como de 1 a 3, de 1 a 4, de 1 a 5, de 2 a 4, de 2 a 6, de 3 a 6, etc., así como valores individuales dentro de ese rango, por ejemplo, 1,1,2, 2,3, 5 y 5,9. Esto se aplica independientemente de la amplitud del rango. Los límites superior e inferior de estos rangos intermedios pueden incluirse independientemente en los rangos más pequeños y también están incluidos dentro de la invención, sujeto a cualquier límite específicamente excluido en el rango establecido. Cuando el rango establecido incluye uno o ambos límites, los rangos que excluyen uno o ambos de esos límites incluidos también se incluyen en la invención, a menos que el contexto indique claramente lo contrario.
La terminología utilizada en el presente documento tiene el propósito de describir realizaciones particulares únicamente y no se pretende que sea limitante de ninguna realización. Como se emplean en el presente documento, se pretende que las formas singulares "un", "uno", "una", y "el" y "la" también incluyan las formas plurales, a menos que el contexto indique claramente lo contrario. Se entenderá adicionalmente que los términos "comprende" y/o "que comprende", cuando se utilizan en esta memoria descriptiva, especifiquen la presencia de características, números enteros, etapas, operaciones, elementos y/o componentes establecidos, pero no excluyan la presencia o adición de una o más de otras características, números enteros, etapas, operaciones, elementos, componentes y/o grupos de los mismos. Como se emplea en el presente documento, el término "y/o" incluye cualquiera y todas las combinaciones de uno o más de los puntos enumerados asociados.
A menos que se indique específicamente o sea obvio por el contexto, como se emplea en el presente documento, se entiende que el término "aproximadamente" en referencia a un número o rango de números significa el número y los números indicados /- 10% del mismo, o 10% por debajo del límite inferior indicado y 10% por encima del límite superior indicado para los valores indicados para un rango.
Los términos "sujeto" o "paciente" o "individuo", como se emplean en el presente documento, se refieren a animales, incluidos mamíferos, tales como, p. ej., seres humanos, animales veterinarios (p. ej., gatos, perros, vacas, caballos, ovejas, cerdos, etc.) y modelos animales experimentales de enfermedades (p. ej., ratones, ratas). De acuerdo con la presente invención, pueden emplearse mecanismos convencionales de biología molecular, microbiología y ADN recombinante dentro del conocimiento práctico de la técnica. Tales mecanismos se explican completamente en la bibliografía. Véanse, p.ej., Sambrook, Fritsch y Maniatis, Molecular Cloning: A Laboratory Manual, segunda edición (1989) Cold Spring Harbor Laboratory Press, Cold Spring Harbor, Nueva York (en adelante "Sambrook et al., 1989"); DNA Cloning: A practical Approach, volúmenes I y II (D.N. Glover ed. 1985); Oligonucleotide Synthesis (MJ. Gait ed.
1984); Nucleic Acid Hybridization (B.D. Hames & S.J. Higgins eds. (1985»; Transcription and Translation (B.D. Hames y S.J. Higgins, eds. (1984»; AnimalCellCulture (R.I. Freshney, ed. (1986»; Immobilized Cells andEnzymes (lRL Press, (1986)»; B. Perbal, A practical Guide To Molecular Cloning (1984)); FM Ausubel et al. (eds.), Current Protocols in Molecular Biology, John Wiley & Sons, Inc. (1994); entre otros.
El término "ácido nucleico" abarca moléculas de hebras múltiples, así como moléculas de hebra sencilla. En los ácidos nucleicos de doble o triple hebra, no se necesita que las hebras de ácido nucleico sean coextensivas (es decir, no se necesita que un ácido nucleico de doble hebra sea de doble hebra a lo largo de toda la longitud de ambas hebras). Las moldes de ácido nucleico descritos en el presente documento pueden tener cualquier tamaño según la muestra (desde pequeños fragmentos de ADN sin células hasta genomas completos), incluidos, pero sin limitarse a, 50-300 bases, 100-2.000 bases, 100-750 bases, 170-500 bases, 100-5.000 bases, 50-10.000 bases o 50-2.000 bases de longitud. En algunos casos, los moldes tienen al menos 50, 100, 200, 500, 1.000, 2.000, 5.000, 10.000, 20.00050.000, 100.000, 200.000, 500.000, 1.000.000 o más de 1.000.000 de bases de longitud. Los métodos descritos en el presente documento proporcionan la amplificación de ácidos nucleicos, tales como moldes de ácidos nucleicos. Los métodos descritos en el presente documento proporcionan adicionalmente la generación de ácidos nucleicos y bibliotecas de ácidos nucleicos aislados y al menos parcialmente purificados. Los ácidos nucleicos incluyen, pero sin limitarse a, los que comprenden ADN, ARN, ARN circular, ADNsc (ADN sin células), ARNsc (ARN sin células), ARNip (ARN de interferencia pequeño), ADNfsc (ADN fetal sin células), ARNm, ARNt, ARNr, miARN (microARN), polinucleótidos sintéticos, análogos de polinucleótidos, cualquier otro ácido nucleico compatible con la memoria descriptiva o cualquier combinación de los mismos. La longitud de los polinucleótidos, cuando se proporciona, se describe como el número de bases y se abrevia, como nt (nucleótidos), pb (bases), kb (kilobases) o Gb (gigabases).
El término "gotita", como se emplea en el presente documento, se refiere a un volumen de líquido en un accionador de gotitas. Las gotitas en algunos casos, por ejemplo, pueden ser acuosas o no acuosas o pueden ser mezclas o emulsiones que incluyen componentes acuosos y no acuosos. Como ejemplos no limitantes de líquidos en gotitas que pueden estar sujetos a operaciones de gotitas, véase, p. ej., la Publicación de Solicitud de Patente Internacional Núm. WO2007/120241. Se puede utilizar cualquier sistema adecuado para formar y manipular gotitas en las realizaciones presentadas en el presente documento. Por ejemplo, en algunos casos se utiliza un accionador de gotitas. Como ejemplos no limitantes de accionadores de gotitas que se pueden utilizar, véanse, p. ej., las Patentes de Estados Unidos Núm. 6.911.132, 6.977.033, 6.773.566, 6.565.727, 7.163.612, 7.052.244, 7.328.979, 7.547.380, 7.641.779, las Publicaciones de Solicitud de Patente de Estados Unidos Núm. US20060194331, US20030205632, US20060164490, US20070023292, US20060039823, US20080124252, US20090283407, US20090192044, US20050179746, US20090321262, US20100096266, US20110048951, la Publicación de Solicitud de Patente Internacional Núm. WO2007/120241. En algunos casos, las cuentas se proporcionan en una gotita, en un espacio de operaciones de gotitas o en una superficie de operaciones de gotitas. En algunos casos, las cuentas se proporcionan en un reservorio que es externo a un espacio de operaciones de gotitas o está situado aparte de una superficie de operaciones de gotitas, y el reservorio puede estar asociado con una ruta de flujo que permite que una gotita, que incluye las cuentas, se introduzca en un espacio de operaciones de gotitas o en contacto con una superficie de operaciones de gotitas. Los ejemplos no limitantes de técnicas de accionadores de gotitas para inmovilizar cuentas magnéticamente sensibles y/o cuentas no magnéticamente sensibles y/o realizar protocolos de operaciones de gotitas utilizando cuentas se describen en la Publicación de Solicitud de Patente de Estados Unidos Núm. US20080053205, las Publicaciones de Solicitud de Patente Internacional Núm. WO2008/098236, WO2008/134153, WO2008/116221, WO2007/120241. Las características de las cuentas se pueden emplear en los tipos de multiplexación de los métodos descritos en el presente documento. Se pueden encontrar ejemplos de cuentas que tienen características adecuadas para la multiplexación, así como métodos de detección y análisis de señales emitidas por dichas cuentas, en las Publicaciones de Solicitud de Patente de Estados Unidos Núm. US20080305481, US20080151240, US20070207513, US20070064990, US20060159962, US20050277197, US20050118574.
Como se emplea en el presente documento, el término "identificador molecular único (UMI)" se refiere a una secuencia de ácido nucleico única que se ancla a cada una de una pluralidad de moléculas de ácido nucleico. Cuando se incorpora a una molécula de ácido nucleico, en algunos casos se utiliza un UMI para corregir el sesgo de amplificación posterior mediante el recuento directo de los UMI que se secuencian después de la amplificación. El diseño, incorporación y aplicación de UMI se describen, por ejemplo, en la Publicación de Solicitud de Patente Internacional Núm. WO 2012/142213, Islam et al. Nat. Methods (2014) 11:163-166, y Kivioja, T. et al. Nat. Methods (2012) 9: 72-74.
Como se emplea en el presente documento, el término "código de barras" se refiere a una etiqueta de ácido nucleico que se puede utilizar para identificar una muestra o fuente del material de ácido nucleico. Por lo tanto, cuando las muestras de ácido nucleico se obtienen a partir de múltiples fuentes, los ácidos nucleicos en cada muestra de ácido nucleico se etiquetan en algunos casos con diferentes etiquetas de ácido nucleico de modo que se pueda identificar la fuente de la muestra. Los códigos de barras, también denominados comúnmente índices, etiquetas y similares, son bien conocidos por los expertos en la técnica. Puede utilizarse cualquier código de barras o conjunto de códigos de barras adecuado. Véanse, p. ej., los ejemplos no limitantes proporcionados en la Patente de Estados Unidos Núm.
8.053.192 y en la Publicación de Solicitud de Patente Internacional Núm. WO2005/068656. La aplicación de códigos de barras celulares individuales se puede realizar como se describe, por ejemplo, en la Publicación de Solicitud de Patente de Estados Unidos Núm. 2013/0274117.
Los términos "superficie sólida", "soporte sólido" y otros equivalentes gramaticales en el presente documento se refieren a cualquier material que sea apropiado o que pueda modificarse para que sea apropiado para el anclaje de los cebadores, códigos de barras y secuencias descritos en el presente documento. Los sustratos ilustrativos incluyen, pero sin limitarse a, vidrio y vidrio modificado o funcionalizado, plásticos (incluidos acrílicos, poliestireno y copolímeros de estireno y otros materiales, polipropileno, polietileno, polibutileno, poliuretanos, teflón™, etc.), polisacáridos, nailon, nitrocelulosa, cerámica, resinas, sílice, materiales a base de sílice (p. ej., silicio o silicio modificado), carbono, metales, vidrios inorgánicos, plásticos, haces de fibra óptica y una variedad de otros polímeros. En algunas realizaciones, el soporte sólido comprende una superficie estampada adecuada para la inmovilización de cebadores, códigos de barras y secuencias en un patrón ordenado.
Como se emplea en el presente documento, el término "muestra biológica" incluye, pero sin limitarse a, tejidos, células, líquidos biológicos y productos aislados de los mismos. Las células u otras muestras utilizadas en los métodos descritos en el presente documento se aíslan en algunos casos de pacientes humanos, animales, plantas, suelo u otras muestras que comprenden microbios tales como bacterias, hongos, protozoos, etc. En algunos casos, la muestra biológica es de origen humano. En algunos casos, la muestra biológica es de origen no humano. Las células, en algunos casos, se someten a métodos de PTA descritos en el presente documento y secuenciación. Las variantes detectadas en todo el genoma o en ubicaciones específicas se pueden comparar con todas las demás células aisladas de ese sujeto para rastrear la historia de un linaje celular con fines de investigación o diagnóstico.
Amplificación dirigida por molde primario
En el presente documento se describen métodos de amplificación de ácidos nucleicos, tales como "amplificación dirigida por molde primario (PTA)". Por ejemplo, los métodos de PTA descritos en el presente documento se representan esquemáticamente en las Figuras 1A-1D. Con el método de PTA, los amplicones se generan preferentemente a partir del molde primario ("copias directas") utilizando una polimerasa (p. ej., una polimerasa de desplazamiento de cadena). En consecuencia, los errores se propagan a una tasa más baja desde los amplicones hijos durante las amplificaciones posteriores en comparación con MDA. El resultado es un método fácil de ejecutar que, a diferencia de los protocolos de WGA existentes, puede amplificar una entrada de ADN baja, incluidos los genomas de células individuales con una gran amplitud de cobertura y uniformidad de manera precisa y reproducible. Por otra parte, los productos de amplificación terminados pueden someterse a una ligación directa después de la eliminación de los terminadores, lo que permite el anclaje de un código de barras celular a los cebadores de amplificación para que los productos de todas las células puedan agruparse después de experimentar reacciones de amplificación paralelas (Figura 1B).
En el presente documento se describen métodos que emplean polimerasas de ácido nucleico con actividad de desplazamiento de cadena para la amplificación. En algunos casos, tales polimerasas comprenden actividad de desplazamiento de cadena y baja tasa de error. En algunos casos, tales polimerasas comprenden actividad de desplazamiento de cadena y actividad exonucleasa correctora de errores, tal como actividad correctora de errores 3'->5'. En algunos casos, las polimerasas de ácido nucleico se utilizan junto con otros componentes, tales como terminadores reversibles o irreversibles, o factores de desplazamiento de cadena adicionales. En algunos casos, la polimerasa tiene actividad de desplazamiento de cadena, pero no tiene actividad exonucleasa correctora de errores. Por ejemplo, en algunos casos tales polimerasas incluyen la polimerasa del bacteriófago phi29 (029), que también tiene una tasa de error muy baja que es el resultado de la actividad exonucleasa correctora de errores 3'->5' (véanse, por ejemplo, las Patentes de Estados Unidos Núm. 5.198.543 y 5.001.050). En algunos casos, los ejemplos no limitantes de polimerasas de ácido nucleico que desplazan cadenas incluyen, por ejemplo, ADN polimerasa de phi29 (029) modificada genéticamente, fragmento de Klenow de ADN polimerasa I (Jacobsen et al., Eur. J. Biochem.45:623-627 (1974)), ADN polimerasa del fago M2 (Matsumoto et al., Gene 84:247 (1989)), ADN polimerasa del fago phiPRD1 (Jung et al., Proc. Natl. Acad. Sci. USA 84: 8287 (1987); Zhu e Ito, Biochim. Biophys. Acta. 1219:267-276 (1994)), ADN polimerasa de Bst (p. ej., fragmento grande de ADN polimerasa de Bst (Bst Exo(-); Aliotta et al., Genet. Anal. (Países Bajos) 12:185-195 (1996)), ADN polimerasa de Bca exo(-) (Walker y Linn, Clinical Chemistry 42:1604-1608 (1996)), ADN polimerasa de Bsu, ADN polimerasa VentR incluyendo ADN polimerasa VentR (exo-) (Kong et al., J. Biol. Chem. 268:1965-1975 (1993)), ADN polimerasa Deep Vent, incluyendo ADN polimerasa Deep Vent (exo-), ADN polimerasa IsoPol, ADN polimerasa I, ADN polimerasa Therminator, ADN polimerasa T5 (Chatterjee et al., Gene 97:13-19 (1991)), Sequenasa (U.S. Biochemicals), ADN polimerasa de T7, Sequenasa de T7, ADN polimerasa de T7 gp5, ADN polimerasa PRDI, ADN polimerasa de T4 (Kaboord y Benkovic, Curr. Biol. 5:149-157 (1995)). Las polimerasas de ácido nucleico que desplazan cadenas adicionales también son compatibles con los métodos descritos en el presente documento. La capacidad de una polimerasa dada para llevar a cabo la replicación por desplazamiento de cadena se puede determinar, por ejemplo, utilizando la polimerasa en un ensayo de replicación por desplazamiento de cadena (p. ej., como se divulga en la Patente de Estados Unidos Núm. 6.977.148). Tales ensayos en algunos casos se realizan a una temperatura adecuada para la actividad óptima de la enzima que se utiliza, por ejemplo, 32°C para la ADN polimerasa de phi29, de 46°C a 64 °C para la ADN polimerasa de Bst exo(-), o de aproximadamente 60°C a 70°C para una enzima de un organismo hipertermófilo. Otro ensayo útil para seleccionar una polimerasa es el ensayo de bloque de cebadores descrito por Kong et al., J. Biol. Chem. 268:1965-1975 (1993). El ensayo consiste en un ensayo de extensión del cebador que utiliza un molde de ADNhs de M13 en presencia o ausencia de un oligonucleótido que se hibrida aguas arriba del cebador de extensión para bloquear su progreso. Otras enzimas capaces de desplazar el cebador de bloqueo en este ensayo son, en algunos casos, útiles para el método divulgado. En algunos casos, las polimerasas incorporan dNTP y terminadores a tasas aproximadamente iguales. En algunos casos, la razón de tasas de incorporación de dNTP y terminadores para una polimerasa descrita en el presente documento es de aproximadamente 1:1, aproximadamente 1,5:1, aproximadamente 2:1, aproximadamente 3:1 aproximadamente 4:1 aproximadamente 5:1, aproximadamente 10:1, aproximadamente 20:1, aproximadamente 50:1, aproximadamente 100:1, aproximadamente 200:1, aproximadamente 500:1 o aproximadamente 1.000:1. En algunos casos, la razón de tasas de incorporación de dNTP y terminadores para una polimerasa descrita en el presente documento es de 1:1 a 1.000:1, de 2:1 a 500:1, de 5:1 a 100:1, de 10:1 a 1.000: 1, 100:1 a 1.000:1,500:1 a 2.000:1,50:1 a 1.500:1 o 25:1 a 1.000:1.
En el presente documento se describen métodos de amplificación en donde se puede facilitar el desplazamiento de la cadena mediante el uso de un factor de desplazamiento de la cadena, tal como, p. ej., una helicasa. Tales factores se utilizan en algunos casos junto con componentes de amplificación adicionales, tales como polimerasas, terminadores u otros componentes. En algunos casos, se utiliza un factor de desplazamiento de cadena con una polimerasa que no tiene actividad de desplazamiento de cadena. En algunos casos, se utiliza un factor de desplazamiento de cadena con una polimerasa que tiene actividad de desplazamiento de cadena. Sin estar vinculados a la teoría, los factores de desplazamiento de la cadena pueden aumentar la velocidad a la que se vuelven a cebar los amplicones bicatenarios más pequeños. En algunos casos, cualquier ADN polimerasa que pueda realizar la replicación por desplazamiento de cadena en presencia de un factor de desplazamiento de cadena es adecuada para su uso en el método de PTA, incluso si la ADN polimerasa no realiza la replicación por desplazamiento de cadena en ausencia de dicho factor. Los factores de desplazamiento de cadena útiles en la replicación de desplazamiento de cadena en algunos casos incluyen (pero no se limitan a) la subunidad accesoria de la polimerasa BMRF1 (Tsurumi et al., J. Virology 67(12):7648-7653 (1993)), proteína de unión a ADN de adenovirus (Zijderveld y van der Vliet, J. Virology 68(2): 1158-1164 (1994)), proteína viral del herpes simple ICP8 (Boehmer y Lehman, J. Virology 67(2):711 -715 (1993); Skaliter y Lehman, Proc. Natl. Sci. USA 91(22):10665-10669 (1994)); proteínas de unión a ADN de hebra sencilla (SSB; Rigler y Romano, J. Biol. Chem. 270:8910-8919 (1995))); proteína del gen 32 del fago T4 (Villemain y Giedroc, Biochemistry 35:1439514404 (1996); helicasa-primasa de T7; proteína SSB de T7 gp2.5; Tte-UvrD (de Thermoanaerobacter tengcongensis), helicasa de timo de ternera (Siegel et al., J. Biol. Chem. 267:13629-13635 (1992))); SSB bacteriana (p. ej., SSB de E. coli), Proteína A de Replicación (RPA) en eucariotas, SSB mitocondrial humana (mtSSB) y recombinasas (p. ej., proteínas de la familia Recombinasa A (RecA), UvsX de T4, Sak4 del fago HK620, Rad51, Dmc1 o Radb). Las combinaciones de factores que facilitan el desplazamiento de la cadena y el cebado también son compatibles con los métodos descritos en el presente documento. Por ejemplo, se utiliza una helicasa junto con una polimerasa. En algunos casos, el método de PTA comprende el uso de una proteína de unión a ADN de hebra sencilla (SSB, gp32 de T4 u otra proteína de unión a ADN de hebra sencilla), una helicasa y una polimerasa (p. ej., ADN polimerasa de Sau, polimerasa de Bsu, Bst2.0, GspM, GspM2.0, GspSSD u otra polimerasa adecuada). En algunos casos, las transcriptasas inversas se utilizan junto con los factores de desplazamiento de cadena descritos en el presente documento.
En el presente documento se describen métodos de amplificación que comprenden el uso de nucleótidos terminadores, polimerasas y factores o condiciones adicionales. Por ejemplo, tales factores se utilizan en algunos casos para fragmentar el molde o los moldes de ácido nucleico o los amplicones durante la amplificación. En algunos casos, tales factores comprenden endonucleasas. En algunos casos, los factores comprenden transposasas. En algunos casos, se utiliza cizallamiento mecánico para fragmentar los ácidos nucleicos durante la amplificación. En algunos casos, se añaden nucleótidos durante la amplificación que pueden fragmentarse mediante la adición de proteínas o condiciones adicionales. Por ejemplo, el uracilo se incorpora a los amplicones; el tratamiento con uracilo D-glicosilasa fragmenta ácidos nucleicos en posiciones que contienen uracilo. También se emplean en algunos casos sistemas adicionales para la fragmentación selectiva de ácidos nucleicos, por ejemplo, una ADN glicosilasa modificada genéticamente que escinde pares de bases de citosina-pireno modificados. (Kwon, et al. Chem. Biol. 2003, 10(4), 351).
En el presente documento se describen métodos de amplificación que comprenden el uso de nucleótidos terminadores, que terminan la replicación de ácidos nucleicos, disminuyendo así el tamaño de los productos de amplificación. Tales terminadores se utilizan en algunos casos junto con polimerasas, factores de desplazamiento de cadena u otros componentes de amplificación descritos en el presente documento. En algunos casos, los nucleótidos terminadores reducen o disminuyen la eficacia de la replicación de ácidos nucleicos. Tales terminadores en algunos casos reducen las tasas de extensión en al menos 99,9%, 99%, 98%, 95%, 90%, 85%, 80%, 75%, 70% o al menos 65%. Tales terminadores en algunos casos reducen las tasas de extensión en 50%-90%, 60%-80%, 65%-90%, 70%-85%, 60%-90%, 70%-99%, 80%-99%, o 50%-80%. En algunos casos, los terminadores reducen la longitud promedio del producto de amplicón en al menos 99,9%, 99%, 98%, 95%, 90%, 85%, 80%, 75%, 70% o al menos 65%. Los terminadores en algunos casos reducen la longitud promedio del amplicón en 50%-90%, 60%-80%, 65%-90%, 70%-85%, 60%-90%, 70%-99%, 80%-99%, o 50%-80%. En algunos casos, los amplicones que comprenden nucleótidos terminadores forman bucles u horquillas que reducen la capacidad de una polimerasa para utilizar tales amplicones como moldes. El uso de terminadores en algunos casos reduce la tasa de amplificación en los sitios de amplificación inicial mediante la incorporación de nucleótidos terminadores (p. ej., didesoxinucleótidos que han sido modificados para hacerlos resistentes a la exonucleasa para terminar la extensión del ADN), lo que da como resultado productos de amplificación más pequeños. Al producir productos de amplificación más pequeños que los métodos utilizados actualmente (p. ej., una longitud promedio de 50 a 2.000 nucleótidos de longitud para los métodos de PTA en comparación con una longitud de producto promedio de >10.000 nucleótidos para los métodos de MDA), los productos de amplificación de PTA en algunos casos se someten a la ligación directa de adaptadores sin necesidad de fragmentación, lo que permite la incorporación eficaz de códigos de barras celulares e identificadores moleculares únicos (UMI) (véanse las Figuras 1D, 2B-3E, 9, 10 A, y 10B).
Los nucleótidos terminadores están presentes a varias concentraciones dependiendo de factores tales como la polimerasa, el molde u otros factores. Por ejemplo, la cantidad de nucleótidos terminadores en algunos casos se expresa como una razón de nucleótidos no terminadores con respecto a nucleótidos terminadores en un método descrito en el presente documento. Tales concentraciones en algunos casos permiten el control de las longitudes de amplicón. En algunos casos, la razón de nucleótidos no terminadores con respecto a terminadores es de aproximadamente 2:1,5:1,7:1, 10:1,20:1,50:1, 100:1,200:1,500:1, 1.000:1,2.000:1 o 5.000:1. En algunos casos, la razón de nucleótidos no terminadores con respecto a terminadores es 2:1-10:1,5:1-20:1, 10:1-100:1,20:1-200:1,50:1-1.000 :1,50:1-500:1,75:1 -150:1 o 100:1 -500:1. En algunos casos, al menos uno de los nucleótidos presentes durante la amplificación utilizando un método descrito en el presente documento es un nucleótido terminador. No es necesario que cada terminador esté presente a aproximadamente la misma concentración; en algunos casos, las razones de cada terminador presente en un método descrito en el presente documento se optimizan para un conjunto particular de condiciones de reacción, tipo de muestra o polimerasa. Sin estar vinculados a la teoría, cada terminador puede poseer una eficacia diferente para la incorporación a la cadena de polinucleótidos en crecimiento de un amplicón, en respuesta al emparejamiento con el nucleótido correspondiente en la hebra molde. Por ejemplo, en algunos casos, un emparejamiento de terminador con citosina está presente a una concentración aproximadamente 3%, 5%, 10%, 15%, 20%, 25% o 50% mayor que la concentración promedio de terminador. En algunos casos, un terminador emparejado con timina está presente a una concentración aproximadamente 3%, 5%, 10%, 15%, 20%, 25% o 50% mayor que la concentración promedio de terminador. En algunos casos, un emparejamiento de terminador con guanina está presente a una concentración aproximadamente 3%, 5%, 10%, 15%, 20%, 25% o 50% mayor que la concentración promedio de terminador. En algunos casos, un emparejamiento de terminador con adenina está presente a una concentración aproximadamente 3%, 5%, 10%, 15%, 20%, 25% o 50% mayor que la concentración promedio de terminador. En algunos casos, un emparejamiento de terminador con uracilo está presente a una concentración aproximadamente 3%, 5%, 10%, 15%, 20%, 25% o 50% mayor que la concentración promedio de terminador. En algunos casos, en los métodos descritos en el presente documento se utiliza como nucleótido terminador cualquier nucleótido capaz de terminar la extensión del ácido nucleico mediante una polimerasa de ácido nucleico. En algunos casos, se utiliza un terminador reversible para terminar la replicación del ácido nucleico. En algunos casos, se utiliza un terminador no reversible para terminar la replicación del ácido nucleico. En algunos casos, los ejemplos no limitantes de terminadores incluyen ácidos nucleicos reversibles y no reversibles y análogos de ácidos nucleicos, tales como, por ejemplo, terminador reversible bloqueado en 3' que comprende nucleótidos, terminador reversible no bloqueado en 3' que comprende nucleótidos, terminadores que comprenden modificaciones en 2' de desoxinucleótidos, terminadores que comprenden modificaciones de la base nitrogenada de desoxinucleótidos, o cualquier combinación de los mismos. En un caso, los nucleótidos terminadores son didesoxinucleótidos. Otras modificaciones de nucleótidos que terminan la replicación de ácidos nucleicos y que pueden ser adecuadas incluyen, sin imitación, cualquier modificación del grupo r del carbono 3' de la desoxirribosa, tal como didesoxinucleótidos invertidos, nucleótidos biotinilados en 3', nucleótidos con amino en 3', nucleótidos fosforilados en 3', nucleótidos con 3'-O-metilo, nucleótidos espaciadores de carbono 3’ que incluyen nucleótidos espaciadores C33’, nucleótidos C183', nucleótidos espaciadores de Hexanodiol 3', aciclonucleótidos y combinaciones de los mismos. En algunos casos, los terminadores son polinucleótidos que comprenden 1, 2, 3, 4 o más bases de longitud. En algunos casos, los terminadores no comprenden un radical o etiqueta detectables (p. ej., etiqueta de masa, etiqueta fluorescente, tinte, átomo radiactivo u otro radical detectable). En algunos casos, los terminadores no comprenden un radical químico que permita el anclaje de un radical o etiqueta detectables (p. ej., "clic" azida/alquino, pareja de adición conjugada u otra asa química para el anclaje de una etiqueta). En algunos casos, todos los nucleótidos terminadores comprenden la misma modificación que reduce la amplificación a una región (p. ej., el radical azúcar, el radical de la base o el radical fosfato) del nucleótido. En algunos casos, al menos un terminador tiene una modificación diferente que reduce la amplificación. En algunos casos, todos los terminadores tienen longitudes de onda de excitación o emisión fluorescentes sustancialmente similares. En algunos casos, los terminadores sin modificación del grupo fosfato se utilizan con polimerasas que no tienen actividad exonucleasa correctora de errores. Los terminadores, cuando se utilizan con polimerasas que tienen actividad exonucleasa correctora de errores 3'->5' (tales como, p. ej., phi29) que pueden eliminar el nucleótido terminador, en algunos casos se modifican adicionalmente para hacerlos resistentes a la exonucleasa. Por ejemplo, los didesoxinucleótidos se modifican con un grupo alfa-tio que crea un enlace fosforotioato que hace que estos nucleótidos sean resistentes a la actividad exonucleasa correctora de errores 3'->5' de las polimerasas de ácido nucleico. Tales modificaciones en algunos casos reducen la actividad exonucleasa correctora de errores de las polimerasas en al menos 99,5%, 99%, 98%, 95%, 90% o al menos 85%. Los ejemplos no limitantes de otras modificaciones de nucleótidos terminadores que proporcionan resistencia a la actividad exonucleasa 3'->5' incluyen en algunos casos: nucleótidos con modificación en el grupo alfa, tales como alfa-tio didesoxinucleótidos que crean un enlace fosforotioato, nucleótidos espaciadores C3, ácidos nucleicos bloqueados (LNA), ácidos nucleicos invertidos, bases fluoradas en 2', fosforilación en 3', modificaciones en 2'-O-metilo (u otra modificación en 2'-O-alquilo), bases modificadas con propino (p. ej., desoxicitosina, desoxiuridina), nucleótidos de L-ADN, nucleótidos de L-ARN, nucleótidos con enlaces invertidos (p. ej., 5'-5' o 3'-3'), bases invertidas en 5' (p. ej., 2',3'-didesoxi dT invertida en 5'), cadenas principales de metilfosfonato y ácidos nucleicos trans. En algunos casos, los nucleótidos con modificación incluyen ácidos nucleicos con bases modificadas que comprenden grupos 3' OH libres (p. ej., trifosfatos HOMedU alquilados con 2-nitrobencilo, bases que comprenden modificación con grupos químicos grandes, tales como soportes sólidos u otro radical grande). En algunos casos, se utiliza una polimerasa con actividad de desplazamiento de cadena pero sin actividad exonucleasa correctora de errores 3' -> 5' con nucleótidos terminadores con o sin modificaciones para hacerlos resistentes a la exonucleasa. Tales polimerasas de ácido nucleico incluyen, sin limitación, ADN polimerasa de Bst, ADN polimerasa de Bsu, ADN polimerasa Deep Vent (exo-), Fragmento de Klenow de ADN polimerasa (exo-), ADN polimerasa Therminator y VentR (exo).
Cebadores y bibliotecas de amplicones
En el presente documento se describen bibliotecas de amplicones resultantes de la amplificación de al menos una molécula de ácido nucleico diana. Tales bibliotecas se generan en algunos casos utilizando los métodos descritos en el presente documento, tales como los que utilizan terminadores. Tales métodos comprenden el uso de polimerasas o factores de desplazamiento de cadena, nucleótidos terminadores (reversibles o irreversibles) u otras características descritas en el presente documento. En algunos casos, las bibliotecas de amplicones generadas mediante el uso de terminadores descritos en el presente documento se amplifican adicionalmente en una reacción de amplificación posterior (p. ej., PCR). En algunos casos, las reacciones de amplificación posteriores no incluyen terminadores. En algunos casos, las bibliotecas de amplicones comprenden polinucleótidos, en donde al menos 50%, 60%, 70%, 80%, 90%, 95% o al menos 98% de los polinucleótidos comprenden al menos un nucleótido terminador. En algunos casos, la biblioteca de amplicones comprende la molécula de ácido nucleico diana a partir de la que se obtuvo la biblioteca de amplicones. La biblioteca de amplicones comprende una pluralidad de polinucleótidos, en donde al menos algunos de los polinucleótidos son copias directas (p. ej., replicadas directamente a partir de una molécula de ácido nucleico diana, tal como ADN genómico, ARN u otro ácido nucleico diana). Por ejemplo, al menos 5%, 10%, 20%, 30%, 40%, 50%, 60%, 70%, 80%, 90%, 95% o más de 95% de los polinucleótidos de los amplicones son copias directas de la al menos una molécula de ácido nucleico diana. En algunos casos, al menos 5% de los polinucleótidos de los amplicones son copias directas de la al menos una molécula de ácido nucleico diana. En algunos casos, al menos 10% de los polinucleótidos de los amplicones son copias directas de la al menos una molécula de ácido nucleico diana. En algunos casos, al menos 15% de los polinucleótidos de los amplicones son copias directas de la al menos una molécula de ácido nucleico diana. En algunos casos, al menos 20% de los polinucleótidos de los amplicones son copias directas de la al menos una molécula de ácido nucleico diana. En algunos casos, al menos 50% de los polinucleótidos de los amplicones son copias directas de la al menos una molécula de ácido nucleico diana. En algunos casos, 3%-5%, 3-10%, 5%-10%, 10%-20%, 20%-30%, 30%-40%, 5%-30%, 10%-50%, o 15%-75% de los polinucleótidos de los amplicones son copias directas de la al menos una molécula de ácido nucleico diana. En algunos casos, al menos algunos de los polinucleótidos son copias directas de la molécula de ácido nucleico diana, o progenie hija (una primera copia del ácido nucleico diana). Por ejemplo, al menos 5%, 10%, 20%, 30%, 40%, 50%, 60%, 70%, 80%, 90%, 95% o más de 95% de los polinucleótidos de los amplicones son copias directas de la al menos una molécula de ácido nucleico diana o progenie hija. En algunos casos, al menos 5% de los polinucleótidos de los amplicones son copias directas de la al menos una molécula de ácido nucleico diana o progenie hija. En algunos casos, al menos 10% de los polinucleótidos de los amplicones son copias directas de la al menos una molécula de ácido nucleico diana o progenie hija. En algunos casos, al menos 20% de los polinucleótidos de los amplicones son copias directas de la al menos una molécula de ácido nucleico diana o progenie hija. En algunos casos, al menos 30% de los polinucleótidos de los amplicones son copias directas de la al menos una molécula de ácido nucleico diana o progenie hija. En algunos casos, 3%-5%, 3%-10%, 5%-10%, 10%-20%, 20%-30%, 30%-40%, 5%-30%, 10%-50%, o 15%-75% de los polinucleótidos de los amplicones son copias directas de la al menos una molécula de ácido nucleico diana o progenie hija. En algunos casos, las copias directas del ácido nucleico diana tienen una longitud de 50-2.500, 75-2.000, 50­ 2.000, 25-1.000, 50-1.000, 500-2.000 o 50-2.000 bases. En algunos casos, la progenie hija tiene una longitud de 1.000­ 5.000, 2.000-5.000, 1.000-10.000, 2.000-5.000, 1.500-5.000, 3.000-7.000 o 2.000-7.000 bases. En algunos casos, la longitud promedio de los productos de amplificación de PTA es de 25-3.000 nucleótidos, 50-2.500, 75-2.000, 50-2.000, 25-1.000, 50-1.000, 500-2.000 o 50-2.000 bases. En algunos casos, los amplicones generados a partir de PTA no tienen más de 5.000, 4.000, 3.000, 2.000, 1.700, 1.500, 1.200, 1.000, 700, 500 o no más de 300 bases de longitud. En algunos casos, los amplicones generados a partir de PTA tienen una longitud de 1.000-5.000, 1.000-3.000, 200­ 2.000, 200-4.000, 500-2.000, 750-2.500 o 1.000-2.000 bases. Las bibliotecas de amplicones generadas utilizando los métodos descritos en el presente documento en algunos casos comprenden al menos 1.000, 2.000, 5.000, 10.000, 100.000, 200.000, 500.000 o más de 500.000 amplicones que comprenden secuencias únicas. En algunos casos, la biblioteca comprende al menos 100, 200, 300, 400, 500, 600, 700, 800, 900, 1.000, 1.100, 1.200, 1.300, 1.400, 1.500, 2.000, 2.500, 3.000 o al menos 3.500 amplicones. En algunos casos, al menos 5%, 10%, 15%, 20%, 25%, 30% o más de 30% de los polinucleótidos de los amplicones que tienen una longitud de menos de 1.000 bases son copias directas de la al menos una molécula de ácido nucleico diana. En algunos casos, al menos 5%, 10%, 15%, 20%, 25%, 30% o más de 30% de los polinucleótidos de los amplicones que tienen una longitud de no más de 2.000 bases son copias directas de la al menos una molécula de ácido nucleico diana. En algunos casos, al menos 5%, 10%, 15%, 20%, 25%, 30% o más de 30% de los polinucleótidos de los amplicones que tienen una longitud de 3.000-5.000 bases son copias directas de la al menos una molécula de ácido nucleico diana. En algunos casos, la razón de amplicones de copia directa con respecto a moléculas de ácido nucleico diana es de al menos 10:1, 100:1, 1.000:1, 10.000:1, 100.000:1, 1.000. 000:1, 10.000.000:1 o más de 10.000.000:1. En algunos casos, la razón de amplicones de copia directa con respecto a moléculas de ácido nucleico diana es de al menos 10:1, 100:1, 1.000:1, 10.000:1, 100.000:1, 1.000.000:1, 10.000. 000:1 o más de 10.000.000:1, en donde los amplicones de copia directa no tienen más de 700-1.200 bases de longitud. En algunos casos, la razón de amplicones de copia directa y amplicones hijos con respecto a las moléculas de ácido nucleico diana es de al menos 10:1, 100:1, 1.000:1, 10.000:1, 100.000:1, 1.000.000:1, 10.000.000:1 o más de 10.000.000:1. En algunos casos, la razón de amplicones de copia directa y amplicones hijos con respecto a las moléculas de ácido nucleico diana es de al menos 10:1, 100:1, 1.000:1, 10.000:1, 100.000:1, 1.000.000:1, 10.000. 000:1 o más de 10.000.000:1, en donde los amplicones de copia directa tienen una longitud de 700-1.200 bases, y los amplicones hijos tienen una longitud de 2.500-6.000 bases. En algunos casos, la biblioteca comprende aproximadamente 50-10-000, aproximadamente 50-5.000, aproximadamente 50-2.500, aproximadamente 50-1.000, aproximadamente 150-2.000, aproximadamente 250-3.000, aproximadamente 50-2.000, aproximadamente 500-2.000 o aproximadamente 500-1.500 amplicones que son copias directas de la molécula de ácido nucleico diana. En algunos casos, la biblioteca comprende aproximadamente 50-10.000, aproximadamente 50-5.000, aproximadamente 50-2.500, aproximadamente 50-1.000, aproximadamente 150-2.000, aproximadamente 250-3.000, aproximadamente 50-2.000, aproximadamente 500-2.000 o aproximadamente 500-1.500 amplicones que son copias directas de la molécula de ácido nucleico diana o amplicones hijos. Las bibliotecas de amplicones generadas mediante los métodos descritos en el presente documento se someten en algunos casos a etapas adicionales, tales como la ligación del adaptador y una amplificación por PCR adicional. En algunos casos, tales etapas adicionales preceden a una etapa de secuenciación.
Las bibliotecas de amplicones de polinucleótidos de generadas a partir de los métodos y composiciones de PTA (terminadores, polimerasas, etc.) descritos en el presente documento en algunos casos tienen una mayor uniformidad. La uniformidad, en algunos casos, se describe utilizando una curva de Lorenz (p. ej., Figura 5C), u otro método similar. Tales aumentos en algunos casos conducen a lecturas de secuenciación más bajas necesarias para la cobertura deseada de una molécula de ácido nucleico diana (p. ej., ADN genómico, ARN u otra molécula de ácido nucleico diana). Por ejemplo, no más de 50% de una fracción acumulativa de polinucleótidos comprende secuencias de al menos 80% de una fracción acumulativa de secuencias de la molécula de ácido nucleico diana. En algunos casos, no más de 50% de una fracción acumulativa de polinucleótidos comprende secuencias de al menos 60% de una fracción acumulativa de secuencias de la molécula de ácido nucleico diana. En algunos casos, no más de 50% de una fracción acumulativa de polinucleótidos comprende secuencias de al menos 70% de una fracción acumulativa de secuencias de la molécula de ácido nucleico diana. En algunos casos, no más de 50% de una fracción acumulativa de polinucleótidos comprende secuencias de al menos 90% de una fracción acumulativa de secuencias de la molécula de ácido nucleico diana. En algunos casos, la uniformidad se describe utilizando un índice de Gini (en donde un índice de 0 representa la igualdad perfecta de la biblioteca y un índice de 1 representa la desigualdad perfecta). En algunos casos, las bibliotecas de amplicones descritas en el presente documento tienen un índice de Gini de no más de 0,55, 0,50, 0,45, 0,40 o 0,30. En algunos casos, las bibliotecas de amplicones descritas en el presente documento tienen un índice de Gini de no más de 0,50. En algunos casos, las bibliotecas de amplicones descritas en el presente documento tienen un índice Gini de no más de 0,40. Tales métricas de uniformidad en algunos casos dependen del número de lecturas obtenidas. Por ejemplo, no se obtienen más de 100 millones, 200 millones, 300 millones, 400 millones o no más de 500 millones de lecturas. En algunos casos, la longitud de lectura es de aproximadamente 50, 75, 100, 125, 150, 175, 200, 225 o aproximadamente 250 bases de longitud. En algunos casos, las métricas de uniformidad dependen de la profundidad de cobertura de un ácido nucleico diana. Por ejemplo, la profundidad media de cobertura es de aproximadamente 10X, 15X, 20X, 25X o aproximadamente 30X. En algunos casos, la profundidad media de cobertura es 10-30X, 20-50X, 5-40X, 20-60X, 5-20X o 10-20X. En algunos casos, las bibliotecas de amplicones descritas en el presente documento tienen un índice de Gini de no más de 0,55, en donde se obtuvieron aproximadamente 300 millones de lecturas. En algunos casos, las bibliotecas de amplicones descritas en el presente documento tienen un índice de Gini de no más de 0,50, en donde se obtuvieron aproximadamente 300 millones de lecturas. En algunos casos, las bibliotecas de amplicones descritas en el presente documento tienen un índice de Gini de no más de 0,45, en donde se obtuvieron aproximadamente 300 millones de lecturas. En algunos casos, las bibliotecas de amplicones descritas en el presente documento tienen un índice de Gini de no más de 0,55, en donde no se obtuvieron más de 300 millones de lecturas. En algunos casos, las bibliotecas de amplicones descritas en el presente documento tienen un índice de Gini de no más de 0,50, en donde no se obtuvieron más de 300 millones de lecturas. En algunos casos, las bibliotecas de amplicones descritas en el presente documento tienen un índice de Gini de no más de 0,45, en donde no se obtuvieron más de 300 millones de lecturas. En algunos casos, las bibliotecas de amplicones descritas en el presente documento tienen un índice de Gini de no más de 0,55, en donde la profundidad media de cobertura de secuenciación es de aproximadamente 15X. En algunos casos, las bibliotecas de amplicones descritas en el presente documento tienen un índice de Gini de no más de 0,50, en donde la profundidad media de cobertura de secuenciación es de aproximadamente 15X. En algunos casos, las bibliotecas de amplicones descritas en el presente documento tienen un índice de Gini de no más de 0,45, en donde la profundidad media de cobertura de secuenciación es de aproximadamente 15X. En algunos casos, las bibliotecas de amplicones descritas en el presente documento tienen un índice de Gini de no más de 0,55, en donde la profundidad media de cobertura de secuenciación es de al menos 15X. En algunos casos, las bibliotecas de amplicones descritas en el presente documento tienen un índice de Gini de no más de 0,50, en donde la profundidad media de cobertura de secuenciación es de al menos 15X. En algunos casos, las bibliotecas de amplicones descritas en el presente documento tienen un índice de Gini de no más de 0,45, en donde la profundidad media de cobertura de secuenciación es de al menos 15X. En algunos casos, las bibliotecas de amplicones descritas en el presente documento tienen un índice de Gini de no más de 0,55, en donde la profundidad media de cobertura de secuenciación no es más de 15X. En algunos casos, las bibliotecas de amplicones descritas en el presente documento tienen un índice de Gini de no más de 0,50, en donde la profundidad media de cobertura de secuenciación no es más de 15X. En algunos casos, las bibliotecas de amplicones descritas en el presente documento tienen un índice de Gini de no más de 0,45, en donde la profundidad media de cobertura de secuenciación no es más de 15X. Las bibliotecas de amplicones uniformes generadas mediante los métodos descritos en el presente documento se someten en algunos casos a etapas adicionales, tales como la ligación del adaptador y una amplificación por PCR adicional. En algunos casos, tales etapas adicionales preceden a una etapa de secuenciación.
Los cebadores comprenden ácidos nucleicos utilizados para cebar las reacciones de amplificación descritas en el presente documento. Tales cebadores en algunos casos incluyen, sin limitación, desoxinucleótidos aleatorios de cualquier longitud con o sin modificaciones para hacerlos resistentes a exonucleasas, ribonucleótidos aleatorios de cualquier longitud con o sin modificaciones para hacerlos resistentes a exonucleasas, ácidos nucleicos modificados tales como ácidos nucleicos bloqueados, ADN o cebadores de ARN que se dirigen a una región genómica específica y reacciones que se ceban con enzimas tales como primasa. En el caso de PTA de genoma completo, se prefiere utilizar un conjunto de cebadores que tengan secuencias de nucleótidos aleatorias o parcialmente aleatorias. En una muestra de ácido nucleico de complejidad significativa, no es necesario conocer las secuencias de ácido nucleico específicas presentes en la muestra y no es necesario diseñar los cebadores para que sean complementarios a ninguna secuencia particular. Más bien, la complejidad de la muestra de ácido nucleico da como resultado un gran número de diferentes secuencias diana de hibridación en la muestra, que serán complementarias a varios cebadores de secuencia aleatoria o parcialmente aleatoria. En algunos casos, la porción complementaria de los cebadores para uso en PTA es completamente aleatoria, comprende solo una porción que está aleatorizada o, de lo contrario, se aleatorizan selectivamente. El número de posiciones de bases aleatorias en la porción complementaria de los cebadores en algunos casos, por ejemplo, es de 20% a 100% del número total de nucleótidos en la porción complementaria de los cebadores. En algunos casos, el número de posiciones de bases aleatorias en la porción complementaria de los cebadores es de 10% a 90%, 15-95%, 20%-100%, 30%-100%, 50%-100%, 75-100% o 90-95% del número total de nucleótidos en la porción complementaria de los cebadores. En algunos casos, el número de posiciones de bases aleatorias en la porción complementaria de los cebadores es al menos 10%, 20%, 30%, 40%, 50%, 60%, 70%, 80% o al menos 90% del número total de nucleótidos en la porción complementaria de los cebadores. Los conjuntos de cebadores que tienen secuencias aleatorias o parcialmente aleatorias se sintetizan en algunos casos utilizando técnicas convencionales permitiendo que se aleatorice la adición de cualquier nucleótido en cada posición. En algunos casos, los conjuntos de cebadores están compuestos por cebadores de longitud y/o características de hibridación similares. En algunos casos, el término "cebador aleatorio" se refiere a un cebador que puede exhibir una degeneración cuadruple en cada posición. En algunos casos, el término "cebador aleatorio" se refiere a un cebador que puede exhibir una degeneración triple en cada posición. Los cebadores aleatorios utilizados en los métodos descritos en el presente documento en algunos casos comprenden una secuencia aleatoria que tiene 3, 4, 5, 6, 7, 8, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, o más bases de longitud. En algunos casos, los cebadores comprenden secuencias aleatorias que tienen de 3-20, 5-15, 5-20, 6-12 o 4-10 bases de longitud. Los cebadores también pueden comprender elementos no extensibles que limitan la posterior amplificación de los amplicones generados por los mismos. Por ejemplo, los cebadores con elementos no extensibles en algunos casos comprenden terminadores. En algunos casos, los cebadores comprenden nucleótidos terminadores, tales como 1, 2, 3, 4, 5, 10 o más de 10 nucleótidos terminadores. Los cebadores no tienen por qué limitarse a los componentes que se añaden externamente a una reacción de amplificación. En algunos casos, los cebadores se generan in situ mediante la adición de nucleótidos y proteínas que promueven el cebado. Por ejemplo, en algunos casos se utilizan enzimas similares a la primasa combinadas con nucleótidos para generar cebadores aleatorios para los métodos descritos en el presente documento. Las enzimas de tipo primasa en algunos casos son miembros de la superfamilia de enzimas DnaG o AEP. En algunos casos, una enzima similar a primasa es TthPrimPol. En algunos casos, una enzima similar a primasa es helicasaprimasa de T7 gp4. Tales primasas se utilizan en algunos casos con las polimerasas o factores de desplazamiento de cadena descritos en el presente documento. En algunos casos, las primasas inician el cebado con desoxirribonucleótidos. En algunos casos, las primasas inician el cebado con ribonucleótidos.
La amplificación PTA puede ir seguida de la selección de un subconjunto específico de amplicones. Tales selecciones dependen en algunos casos del tamaño, la afinidad, la actividad, la hibridación con las sondas u otro factor de selección conocido en la técnica. En algunos casos, las selecciones preceden o siguen a las etapas adicionales descritas en el presente documento, tales como la ligación de adaptadores y/o la amplificación de la biblioteca. En algunos casos, las selecciones se basan en el tamaño (longitud) de los amplicones. En algunos casos, se seleccionan amplicones más pequeños que tienen menos probabilidades de haber sufrido una amplificación exponencial, lo que enriquece los productos que se obtuvieron a partir del molde primario mientras convierte aún más la amplificación de un procedimiento de amplificación exponencial a cuasi lineal (Figura 1A). En algunos casos, se seleccionan amplicones que comprenden 50-2.000, 25-5.000, 40-3.000, 50-1.000, 200-1.000, 300-1.000, 400-1.000, 400-600, 600-2.000 u 800-1.000 bases de longitud. La selección de tamaño en algunos casos ocurre con el uso de protocolos, por ejemplo, utilizando inmovilización reversible en fase sólida (SPRI) sobre cuentas paramagnéticas carboxiladas para enriquecer en fragmentos de ácido nucleico de tamaños específicos u otro protocolo conocido por los expertos en la técnica. Opcionalmente o de manera combinada, la selección se produce a través de la amplificación preferencial de fragmentos más pequeños durante la PCR mientras se preparan bibliotecas de secuenciación, así como también como resultado de la formación preferencial de agrupaciones a partir de fragmentos de bibliotecas de secuenciación más pequeños durante la secuenciación Illumina. Otras estrategias para seleccionar fragmentos más pequeños también son compatibles con los métodos descritos en el presente documento e incluyen, sin limitarse a, el aislamiento de fragmentos de ácido nucleico de tamaños específicos después de la electroforesis en gel, el uso de columnas de sílice que unen fragmentos de ácido nucleico de tamaños específicos y el uso de otras estrategias de PCR que enriquecen más fuertemente en fragmentos más pequeños.
La porción no complementaria de un cebador utilizado en PTA puede incluir secuencias que pueden utilizarse para manipular y/o analizar adicionalmente secuencias amplificadas. Un ejemplo de tal secuencia es una "etiqueta de detección". Las etiquetas de detección tienen secuencias complementarias a las sondas de detección y se detectan utilizando sus sondas de detección afines. Puede haber una, dos, tres, cuatro o más de cuatro etiquetas de detección en un cebador. No existe un límite fundamental para el número de etiquetas de detección que pueden estar presentes en un cebador, excepto el tamaño del cebador. En algunos casos, hay una sola etiqueta de detección en un cebador. En algunos casos, hay dos etiquetas de detección en un cebador. Cuando hay múltiples etiquetas de detección, pueden tener la misma secuencia o pueden tener secuencias diferentes, con cada secuencia diferente complementaria a una sonda de detección diferente. En algunos casos, varias etiquetas de detección múltiples tienen la misma secuencia. En algunos casos, etiquetas de detección múltiples tienen una secuencia diferente.
Otro ejemplo de una secuencia que se puede incluir en la porción no complementaria de un cebador es una "etiqueta de dirección". Una etiqueta de dirección tiene una secuencia complementaria a una sonda de dirección. Las etiquetas de dirección se incorporan en los extremos de las hebras amplificadas. Si está presente, puede haber una o más de una etiqueta de dirección en un cebador. No existe un límite fundamental para el número de etiquetas de dirección que pueden estar presentes en un cebador, excepto el tamaño del cebador. Cuando hay múltiples etiquetas de dirección, pueden tener la misma secuencia o pueden tener secuencias diferentes, con cada secuencia diferente complementaria a una sonda de dirección diferente. La porción de la etiqueta de dirección puede tener cualquier longitud que admita una hibridación específica y estable entre la etiqueta de dirección y la sonda de dirección. En algunos casos, los ácidos nucleicos de más de una fuente pueden incorporar una secuencia etiqueta variable. Esta secuencia etiqueta puede tener una longitud de hasta 100 nucleótidos, preferiblemente de 1 a 10 nucleótidos de longitud, más preferiblemente de 4, 5 o 6 nucleótidos de longitud y comprende combinaciones de nucleótidos. En algunos casos, una secuencia etiqueta tiene 1-20, 2-15, 3-13, 4-12, 5-12 o 1-10 nucleótidos de longitud. Por ejemplo, si se eligen seis pares de bases para formar la etiqueta y se utiliza una permutación de cuatro nucleótidos diferentes, se puede hacer un total de 4096 anclajes de ácido nucleico (p. ej., horquillas), cada uno con una etiqueta única de 6 bases.
Los cebadores descritos en el presente documento pueden estar presentes en solución o inmovilizados sobre un soporte sólido. En algunos casos, los cebadores que portan códigos de barras de muestra y/o secuencias UMI pueden inmovilizarse sobre un soporte sólido. El soporte sólido puede ser, por ejemplo, una o más cuentas. En algunos casos, las células individuales se ponen en contacto con una o más cuentas que tienen un conjunto único de códigos de barras de muestra y/o secuencias UMI para identificar la célula individual. En algunos casos, los productos lisados de células individuales se ponen en contacto con una o más cuentas que tienen un conjunto único de códigos de barras de muestra y/o secuencias UMI para identificar los productos lisados de células individuales. En algunos casos, el ácido nucleico purificado de células individuales se pone en contacto con una o más cuentas que tienen un conjunto único de códigos de barras de muestra y/o secuencias UMI para identificar el ácido nucleico purificado de la célula individual. Las cuentas se pueden manipular de cualquier manera adecuada como se conoce en la técnica, por ejemplo, utilizando accionadores de gotitas como se describe en el presente documento. Las cuentas pueden tener cualquier tamaño adecuado, incluyendo, por ejemplo, microcuentas, micropartículas, nanocuentas y nanopartículas. En algunos casos, las cuentas responden magnéticamente; en otros casos, las cuentas no responden magnéticamente de forma significativa. Los ejemplos no limitantes de cuentas adecuadas incluyen microcuentas de citometría de flujo, micropartículas y nanopartículas de poliestireno, micropartículas y nanopartículas de poliestireno funcionalizadas, micropartículas y nanopartículas de poliestireno recubiertas, microesferas de sílice, microesferas y nanoesferas fluorescentes, microesferas y nanoesferas fluorescentes funcionalizadas, microesferas y nanoesferas fluorescentes recubiertas, micropartículas y nanopartículas teñidas, micropartículas y nanopartículas magnéticas, micropartículas y nanopartículas superparamagnéticas (p. ej., DYNABEADS® disponible de Invitrogen Group, Carlsbad, CA), micropartículas y nanopartículas fluorescentes, micropartículas y nanopartículas magnéticas recubiertas, micropartículas y nanopartículas ferromagnéticas, micropartículas y nanopartículas ferromagnéticas recubiertas, y las descritas en las Publicaciones de Solicitud de Patente de Estados Unidos Núm. US20050260686, US20030132538, US20050118574, 20050277197, 20060159962. Las cuentas se pueden acoplar previamente con un anticuerpo, una proteína o un antígeno, una sonda de ADN/ARN o cualquier otra molécula con afinidad por una diana deseada. En algunos casos, los cebadores que portan códigos de barras de muestra y/o secuencias UMI pueden estar en solución. En ciertos casos, se puede presentar una pluralidad de gotitas, en donde cada gotita de la pluralidad lleva un código de barras de muestra que es único para una gotita y el UMI que es único para una molécula, de modo que el UMI se repite muchas veces dentro de una colección de gotitas. En algunos casos, las células individuales se ponen en contacto con una gotita que tiene un conjunto único de códigos de barras de muestra y/o secuencias UMI para identificar la célula individual. En algunos casos, los productos lisados de células individuales se ponen en contacto con una gotita que tiene un conjunto único de códigos de barras de muestra y/o secuencias UMI para identificar los productos lisados de células individuales. En algunos casos, el ácido nucleico purificado de células individuales se pone en contacto con una gotita que tiene un conjunto único de códigos de barras de muestra y/o secuencias UMI para identificar el ácido nucleico purificado de la célula individual.
Los cebadores de PTA pueden comprender un cebador aleatorio o específico de secuencia, un código de barras celular y/o un identificador molecular único (UMI) (véanse, p. ej., las Figuras 10A (cebador lineal) y 10B (cebador en horquilla)). En algunos casos, el cebador comprende un cebador específico de secuencia. En algunos casos, el cebador comprende un cebador aleatorio. En algunos casos, el cebador comprende un código de barras celular. En algunos casos, el cebador comprende un código de barras de muestra. En algunos casos, el cebador comprende un identificador molecular único. En algunos casos, los cebadores comprenden dos o más códigos de barras celulares. Tales códigos de barras en algunos casos identifican una fuente de muestra única o un flujo de trabajo único. Tales códigos de barras o UMI tienen en algunos casos 5, 6, 7, 8, 9, 10, 11, 12, 15, 20, 25, 30 o más de 30 bases de longitud. Los cebadores en algunos casos comprenden al menos 1.000, 10.000, 50.000, 100.000, 250.000, 500.000, 106, 107, 108, 109, o al menos 1010 códigos de barras o UMI únicos. En algunos casos, los cebadores comprenden al menos 8, 16, 96 o 384 códigos de barras o UMI únicos. En algunos casos, se liga a continuación un adaptador convencional a los productos de amplificación antes de la secuenciación; después de la secuenciación, las lecturas se asignan primero a una célula específica según el código de barras celular. Los adaptadores adecuados que se pueden utilizar con el método de PTA incluyen, p. ej., Adaptadores UMI xGen® Dual Index disponibles en Integrated DNA Technologies (IDT). Después, las lecturas de cada célula se agrupan utilizando el UMI, y las lecturas con el mismo UMI pueden compilarse en una lectura consenso. El uso de un código de barras celular permite agrupar todas las células antes de la preparación de la biblioteca, ya que más tarde pueden identificarse mediante el código de barras celular. El uso del UMI para formar una lectura de consenso en algunos casos corrige el sesgo de la PCR, mejorando la detección de la variación del número de copias (CNV) (Figuras 11A y 11B). Adicionalmente, los errores de secuenciación pueden corregirse exigiendo que un porcentaje fijo de lecturas de la misma molécula tengan el mismo cambio de base detectado en cada posición. Este enfoque se ha utilizado para mejorar la detección de CNV y corregir errores de secuenciación en muestras masivas. En algunos casos, los UMI se utilizan con los métodos descritos en el presente documento, por ejemplo, la patente de Estados Unidos Núm. 8.835.358 divulga el principio del recuento digital después de anclar un código de barras amplificable aleatorio. Schmitt. et al y Fan et al. divulgan métodos similares para corregir errores de secuenciación.
Los métodos descritos en el presente documento pueden comprender adicionalmente otras etapas, incluyendo etapas realizados en la muestra o molde. Tales muestras o moldes en algunos casos se someten a una o más etapas antes de la PTA. En algunos casos, las muestras que comprenden células se someten a una etapa de pretratamiento. Por ejemplo, las células se someten a lisis y proteólisis para aumentar la accesibilidad a la cromatina utilizando una combinación de congelación-descongelación, Triton X-100, Tween 20 y Proteinasa K. Otras estrategias de lisis también son adecuadas para poner en práctica los métodos descritos en el presente documento. Tales estrategias incluyen, sin limitación, lisis utilizando otras combinaciones de tratamiento con detergente y/o lisozima y/o proteasa y/o rotura física de las células tal como sonicación y/o lisis alcalina y/o lisis hipotónica. En algunos casos, el molde primario o la molécula o moléculas diana se somete a una etapa de pretratamiento. En algunos casos, el molde primario (o diana) se desnaturaliza con hidróxido de sodio, seguido de neutralización de la solución. Otras estrategias de desnaturalización también pueden ser adecuadas para poner en práctica los métodos descritos en el presente documento. Tales estrategias pueden incluir, sin limitación, combinaciones de lisis alcalina con otras soluciones básicas, aumento de la temperatura de la muestra y/o alteración de la concentración de sal en la muestra, adición de aditivos tales como disolventes o aceites, otras modificaciones o cualquier combinación de las mismas. En algunos casos, las etapas adicionales incluyen clasificar, filtrar o aislar muestras, moldes o amplicones por tamaño. Por ejemplo, después de la amplificación con los métodos descritos en el presente documento, las bibliotecas de amplicones se enriquecen en amplicones que tienen la longitud deseada. En algunos casos, las bibliotecas de amplicones se enriquecen en amplicones que tienen una longitud de 50-2.000, 25-1.000, 50-1.000, 75-2.000, 100­ 3.000, 150-500, 75-250, 170-500, 100-500, o 75-2.000 bases. En algunos casos, las bibliotecas de amplicones se enriquecen en amplicones que tienen una longitud de no más de 75, 100, 150, 200, 500, 750, 1.000, 2.000, 5.000 o no más de 10.000 bases. En algunos casos, las bibliotecas de amplicones se enriquecen en amplicones que tienen una longitud de al menos 25, 50, 75, 100, 150, 200, 500, 750, 1.000 o al menos 2.000 bases.
Los métodos y composiciones descritos en el presente documento pueden comprender tampones u otras formulaciones. Tales tampones en algunos casos comprenden tensioactivos/agentes detergentes o desnaturalizantes (Tween-20, DMSO, DMF, polímeros pegilados que comprenden un grupo hidrófobo u otro tensioactivo), sales (fosfato de potasio o sodio (monobásico o dibásico), cloruro de sodio, cloruro de potasio, TrisHCl, cloruro o sulfato de magnesio, sales de amonio tales como fosfato, nitrato o sulfato, EDTA), agentes reductores (DTT, THP, DTE, betamercaptoetanol, TCEP u otro agente reductor) u otros componentes (glicerol, polímeros hidrófilos tales como PEG). En algunos casos, los tampones se utilizan junto con componentes tales como polimerasas, factores de desplazamiento de cadena, terminadores u otros componentes de reacción descritos en el presente documento.
Las moléculas de ácido nucleico amplificadas según los métodos descritos en el presente documento pueden secuenciarse y analizarse utilizando métodos conocidos por los expertos en la técnica. Los ejemplos no limitantes de los métodos de secuenciación que en algunos casos se utilizan incluyen, p. ej., secuenciación por hibridación (SBH), secuenciación por ligación (SBL) (Shendure et al. (2005) Science 309:1728), secuenciación cuantitativa incremental de adición de nucleótidos fluorescentes (QIFNAS), ligación y escisión por etapas, transferencia de energía por resonancia de fluorescencia (FRET), balizas moleculares, digestión con sonda indicadora TaqMan, pirosecuenciación, secuenciación in situ fluorescente (FISSEQ), cuentas FISSEQ (Patente de Estados Unidos Núm. 7.425.431), secuenciación por balanceo “wobble” (Publicación de Solicitud de Patente Internacional Núm. WO2006/073504), secuenciación multiplex (Publicación de Solicitud de Patente de Estados Unidos Núm. US2008/0269068; Porreca et al., 2007, Nat. Methods 4:931), secuenciación de colonias polimerizadas (POLONY) (Patentes de Estados Unidos Núm. 6.432.360, 6.485.944 y 6.511.803, y Publicación de Solicitud de Patente Internacional Núm. WO2005/082098), secuenciación de círculo rodante con nanorejilla “nanogrid” (ROLONY) (Patente de Estados Unidos Núm. 9.624.538), ensayos de ligación de oligos específicos de alelo (p. ej., ensayo de ligación de oligos (OLA), OLA de molécula molde única utilizando una sonda lineal ligada y una lectura de amplificación de círculo rodante (RCA), sondas candado ligadas y/u OLA de molécula molde única utilizando una sonda candado circular ligada y una lectura de amplificación de círculo rodante (RCA), métodos de secuenciación de alto rendimiento tales como, p. ej., métodos que utilizan las plataformas Roche 454, Illumina Solexa, AB-SOLiD, Helicos, Polonator y similares, y tecnologías de secuenciación basadas en luz (Landegren et al. (1998) Genome Res. 8:769-76; Kwok (2000) Pharmacogenomics 1:95-100; y Shi (2001) Clin. Chem.
47:164-172). En algunos casos, las moléculas de ácido nucleico amplificadas se secuencian mediante perdigonada.
Métodos y Aplicaciones
En el presente documento se describen métodos para identificar mutaciones en células con los métodos de PTA. El uso del método de PTA en algunos casos da como resultado mejoras sobre los métodos conocidos, por ejemplo, MDA. La PTA en algunos casos tiene tasas de asignación (“call rate”) de variantes falsos positivos y falsos negativos más bajas que el método MDA. Los genomas, tales como los genomas platino NA12878, se utilizan en algunos casos para determinar si la mayor cobertura del genoma y la uniformidad de la PTA darían como resultado una menor tasa de asignación de variantes falsos negativos. Sin estar vinculados a la teoría, se puede determinar que la falta de propagación de errores en la PTA disminuye la tasa de asignación de variantes falsos positivos. El equilibrio de amplificación entre alelos con los dos métodos se estima en algunos casos comparando las frecuencias alélicas de los genotipos válidos de mutación heterocigótica en loci positivos conocidos. En algunos casos, las bibliotecas de amplicones generadas mediante PTA se amplifican adicionalmente mediante PCR.
Las células analizadas utilizando los métodos descritos en el presente documento en algunos casos comprenden células tumorales. Por ejemplo, las células tumorales circulantes pueden aislarse de un líquido extraído de pacientes, tal como, pero sin limitarse a, sangre, médula ósea, orina, saliva, líquido cefalorraquídeo, líquido pleural, líquido pericárdico, ascitis o humor acuoso. A continuación, las células se someten a los métodos descritos en el presente documento (p. ej., PTA) y secuenciación para determinar la carga de mutación y la combinación de mutaciones en cada célula. Estos datos se utilizan en algunos casos para el diagnóstico de una enfermedad específica o como herramientas para predecir la respuesta al tratamiento. De manera similar, en algunos casos, las células de potencial maligno desconocido en algunos casos se aíslan del líquido extraído de pacientes, tal como, pero sin limitarse a, sangre, médula ósea, orina, saliva, líquido cefalorraquídeo, líquido pleural, líquido pericárdico, ascitis o humor acuoso. Después de la utilización de los métodos descritos en el presente documento y la secuenciación, tales métodos se utilizan adicionalmente para determinar la carga de mutaciones y la combinación de mutaciones en cada célula. Estos datos se utilizan en algunos casos para el diagnóstico de una enfermedad específica o como herramientas para predecir la progresión de un estado premaligno a una neoplasia maligna manifiesta. En algunos casos, las células pueden aislarse de muestras de tumores primarios. A continuación, las células pueden someterse a PTA y secuenciación para determinar la carga de mutación y la combinación de mutaciones en cada célula. Estos datos se pueden utilizar para el diagnóstico de una enfermedad específica o como herramientas para predecir la probabilidad de que la neoplasia maligna de un paciente sea resistente a los fármacos contra el cáncer disponibles. Al exponer las muestras a diferentes agentes quimioterapéuticos, se descubrió que los clones principales y secundarios tienen una sensibilidad diferencial a fármacos específicos que no necesariamente se correlaciona con la presencia de una "mutación conductora" conocida, lo que sugiere que las combinaciones de mutaciones dentro de una población clonal determinan sus sensibilidades a fármacos quimioterapéuticos específicos. Sin estar vinculados a la teoría, estos hallazgos sugieren que una neoplasia maligna puede ser más fácil de erradicar si se detectan lesiones premalignas que aún no se han expandido y evolucionado en clones cuyo mayor número de modificaciones del genoma puede hacer que sean más resistentes al tratamiento. Véase, Ma et al., 2018, "Pan-cancer genome and transcriptome analyses of 1699 pediatric leukemias and solid tumors". En algunos casos, se utiliza un protocolo de genómica de una célula individual para detectar las combinaciones de variantes genéticas somáticas en una célula individual cancerosa, o clonotipo, dentro de una mezcla de células normales y malignas que se aíslan de muestras de pacientes. En algunos casos, esta tecnología es utilizada adicionalmente para identificar clonotipos que experimentan una selección positiva después de la exposición a fármacos, in vitro y/o en pacientes. Como se muestra en Figura 6A, al comparar los clones supervivientes expuestos a la quimioterapia con los clones identificados en el momento del diagnóstico, se puede crear un catálogo de clonotipos de cáncer que documente su resistencia a fármacos específicos. Los métodos de PTA en algunos casos detectan la sensibilidad de clones específicos en una muestra compuesta de múltiples clonotipos a fármacos nuevos o existentes, así como combinaciones de los mismos, donde el método puede detectar la sensibilidad de clones específicos al fármaco. En algunos casos, este enfoque muestra la eficacia de un fármaco para un clon específico que puede no detectarse con las mediciones actuales de sensibilidad al fármaco que consideran la sensibilidad de todos los clones de cáncer juntos en una sola medición. Cuando la PTA descrita en el presente documento se aplica a muestras de pacientes recolectadas en el momento del diagnóstico para detectar los clonotipos de cáncer en el cáncer de un paciente determinado, se puede utilizar un catálogo de sensibilidades a fármacos para buscar esos clones y, por lo tanto, informar a los oncólogos sobre qué fármaco o combinación de fármacos no funcionará y qué fármaco o combinación de fármacos es más probable que sea eficaz contra el cáncer de ese paciente.
En el presente documento se describen métodos para medir la mutagenicidad de un factor ambiental. Por ejemplo, las células (individuales o de una población) están expuestas a una condición ambiental potencial. Por ejemplo, en algunos casos se utilizan con el método células que se originan de órganos (hígado, páncreas, pulmón, colon, tiroides u otro órgano), tejidos (piel u otro tejido), sangre u otra fuente biológica. En algunos casos, la condición ambiental comprende calor, luz (p. ej., ultravioleta), radiación, una sustancia química o cualquier combinación de los mismos. Después de una cantidad de exposición a la condición ambiental, en algunos casos minutos, horas, días o más, las células individuales se aíslan y se someten al método de PTA. En algunos casos, se utilizan códigos de barras moleculares e identificadores moleculares únicos para etiquetar la muestra. La muestra se secuencia y a continuación, se analiza para identificar mutaciones resultantes de la exposición a la condición ambiental. En algunos casos, tales mutaciones se comparan con una condición ambiental de control, tal como una sustancia no mutagénica conocida, un vehículo/disolvente o la falta de una condición ambiental. Tal análisis en algunos casos no solo proporciona el número total de mutaciones causadas por la condición ambiental, sino también las ubicaciones y la naturaleza de tales mutaciones. En algunos casos, los patrones se identifican a partir de los datos y pueden utilizarse para el diagnóstico de enfermedades o afecciones. En algunos casos, los patrones se utilizan para predecir futuros estados o condiciones de enfermedad. En algunos casos, los métodos descritos en el presente documento miden la carga, las ubicaciones y los patrones de mutación en una célula después de la exposición a un agente ambiental, tal como, por ejemplo, un mutágeno o teratógeno potencial. En algunos casos, este enfoque se utiliza para evaluar la seguridad de un agente determinado, incluido su potencial para inducir mutaciones que pueden contribuir al desarrollo de una enfermedad. Por ejemplo, el método podría utilizarse para predecir la carcinogenicidad o teratogenicidad de un agente para tipos de células específicos después de la exposición a una concentración específica del agente específico.
En el presente documento se describen métodos para identificar mutaciones en células animales, vegetales o microbianas que se han sometido a la edición del genoma (p. ej., utilizando tecnologías CRISPR). Tales células en algunos casos pueden aislarse y someterse a PTA y secuenciación para determinar la carga de mutación y la combinación de mutaciones en cada célula. La tasa de mutación por célula y las ubicaciones de las mutaciones que resultan de un protocolo de edición del genoma se utilizan en algunos casos para evaluar la seguridad de un método de edición del genoma determinado.
En el presente documento se describen métodos para determinar mutaciones en células que se utilizan para terapia celular, tales como, pero sin limitarse a, el trasplante de células madre pluripotentes inducidas, el trasplante de células hematopoyéticas u otras células que no han sido manipuladas, o el trasplante de células hematopoyéticas u otras células que se han sometido a ediciones del genoma. A continuación, las células pueden someterse a PTA y secuenciación para determinar la carga de mutación y la combinación de mutaciones en cada célula. La tasa de mutación por célula y las ubicaciones de las mutaciones en el producto de terapia celular se pueden utilizar para evaluar la seguridad y la eficacia potencial del producto.
Las células se pueden aislar a partir de blastómeros que se crean mediante fertilización in vitro. A continuación, las células pueden someterse a PTA y secuenciación para determinar la carga y la combinación de variantes genéticas que potencialmente predisponen a la enfermedad en cada célula. El perfil de mutación de la célula se puede utilizar a continuación, para extrapolar la predisposición genética del blastómero a enfermedades específicas antes de la implantación.
Alternativamente, las células microbianas (p. ej., bacterias, hongos, protozoos) se pueden aislar de plantas o animales (p. ej., de muestras de microbiota [p. ej., microbiota GI, microbiota cutánea, etc.] o de líquidos corporales tales como, p. ej., sangre, médula ósea, orina, saliva, líquido cefalorraquídeo, líquido pleural, líquido pericárdico, ascitis o humor acuoso). Adicionalmente, las células microbianas pueden aislarse de dispositivos médicos permanentes, tales como, pero sin limitarse a, catéteres intravenosos, catéteres uretrales, derivaciones cerebroespinales, válvulas protésicas, articulaciones artificiales o tubos endotraqueales. A continuación, las células pueden someterse a PTA y secuenciación para determinar la identidad de un microbio específico, así como para detectar la presencia de variantes genéticas microbianas que predicen la respuesta (o resistencia) a agentes antimicrobianos específicos. Estos datos se pueden utilizar para el diagnóstico de una enfermedad infecciosa específica y/o como herramientas para predecir la respuesta al tratamiento.
En el presente documento se describen métodos que generan bibliotecas de amplicones a partir de muestras que comprenden ácidos nucleicos cortos utilizando los métodos de PTA descritos en el presente documento. En algunos casos, la PTA conduce a una mayor fidelidad y uniformidad de amplificación de ácidos nucleicos más cortos. En algunos casos, los ácidos nucleicos no tienen más de 2.000 bases de longitud. En algunos casos, los ácidos nucleicos no tienen más de 1.000 bases de longitud. En algunos casos, los ácidos nucleicos no tienen más de 500 bases de longitud. En algunos casos, los ácidos nucleicos no tienen más de 200, 400, 750, 1.000, 2.000 o 5.000 bases de longitud. En algunos casos, las muestras que comprenden fragmentos cortos de ácido nucleico incluyen, pero sin limitarse a, ADN antiguo (de cientos, miles, millones o incluso miles de millones de años), muestras FFPE (fijadas en formalina e incluidas en parafina), ADN libre de células u otra muestra que comprende ácidos nucleicos cortos.
En el presente documento se describen métodos para amplificar una molécula de ácido nucleico diana, comprendiendo el método: a) poner en contacto una muestra que comprende la molécula de ácido nucleico diana, uno o más cebadores de amplificación, una polimerasa de ácido nucleico y una mezcla de nucleótidos que comprende uno o más más nucleótidos terminadores que terminan la replicación del ácido nucleico por la polimerasa, y b) incubar la muestra en condiciones que promuevan la replicación de la molécula de ácido nucleico diana para obtener una pluralidad de productos de amplificación terminados, en donde la replicación prosigue mediante replicación por desplazamiento de cadena. En cualquiera de los métodos anteriores, el método puede comprender adicionalmente aislar de la pluralidad de productos de amplificación terminados los productos que tienen entre aproximadamente 50 y aproximadamente 2.000 nucleótidos de longitud. En cualquiera de los métodos anteriores, el método puede comprender adicionalmente aislar de la pluralidad de productos de amplificación terminados los productos que tienen entre aproximadamente 400 y aproximadamente 600 nucleótidos de longitud. En cualquiera de los métodos anteriores, el método puede comprender adicionalmente: c) eliminar los nucleótidos terminadores terminales de los productos de amplificación terminados; d) reparar extremos y añadir colas de A, y e) ligar las moléculas obtenidas en la etapa (d) a adaptadores, y así generar una biblioteca de productos de amplificación. En cualquiera de los métodos anteriores, el método puede comprender adicionalmente la secuenciación de los productos de amplificación. En cualquiera de los métodos anteriores, la amplificación se puede realizar en condiciones sustancialmente isotérmicas. En cualquiera de los métodos anteriores, la polimerasa de ácido nucleico puede ser una ADN polimerasa.
En cualquiera de los métodos anteriores, la ADN polimerasa puede ser una ADN polimerasa de desplazamiento de cadena. En cualquiera de los métodos anteriores, la polimerasa de ácido nucleico se puede seleccionar entre polimerasa del bacteriófago phi29 (029), ADN polimerasa de phi29 (029) modificada genéticamente, Fragmento de Klenow de ADN polimerasa I, ADN polimerasa del fago M2, ADN polimerasa del fago phiPRD1, ADN polimerasa de Bst, fragmento grande de ADN polimerasa de Bst, polimerasa de Bst exo(-), ADN polimerasa de Bca exo(-), ADN polimerasa de Bsu, ADN polimerasa VentR, ADN polimerasa VentR (exo-), ADN polimerasa Deep Vent, ADN polimerasa Deep Vent (exo-), ADN polimerasa IsoPol, ADN polimerasa I, ADN polimerasa Therminator, ADN polimerasa de T5, Sequenasa, ADN polimerasa de T7, Sequenasa de T7 y ADN polimerasa de T4. En cualquiera de los métodos anteriores, la polimerasa de ácido nucleico puede tener actividad de exonucleasa 3'->5' y los nucleótidos terminadores pueden inhibir tal actividad de exonucleasa 3'->5'. En los métodos descritos en el presente documento, los nucleótidos terminadores se pueden seleccionar entre nucleótidos con modificación del grupo alfa (p. ej., alfa-tio didesoxinucleótidos que crean un enlace fosforotioato), nucleótidos espaciadores C3, ácidos nucleicos bloqueados (LNA), ácidos nucleicos invertidos, 2' fluoronucleótidos, nucleótidos fosforilados en 3', nucleótidos modificados en 2'-O-metilo y ácidos nucleicos trans. En cualquiera de los métodos anteriores, la polimerasa de ácido nucleico puede no tener actividad exonucleasa 3' -> 5'. En los métodos descritos en el presente documento, la polimerasa se puede seleccionar entre ADN polimerasa de Bst, polimerasa de Bst exo(-), ADN polimerasa de Bca exo(-), ADN polimerasa de Bsu, ADN polimerasa VentR (exo-), ADN polimerasa Deep Vent (exo-), Fragmento de Klenow de ADN polimerasa (exo-) y ADN polimerasa Therminator. En los métodos descritos en el presente documento, los nucleótidos terminadores pueden comprender modificaciones del grupo r del carbono 3' de la desoxirribosa. En los métodos descritos en el presente documento, los nucleótidos terminadores pueden seleccionarse entre terminador reversible bloqueado en 3' que comprende nucleótidos, terminador reversible desbloqueado en 3' que comprende nucleótidos, terminadores que comprenden modificaciones en 2' de desoxinucleótidos, terminadores que comprenden modificaciones en la base nitrogenada de desoxinucleótidos y combinaciones de los mismos. En los métodos descritos en el presente documento, los nucleótidos terminadores se pueden seleccionar entre didesoxinucleótidos, didesoxinucleótidos invertidos, nucleótidos biotinilados en 3', nucleótidos con amino en 3', nucleótidos fosforilados en 3', nucleótidos con 3'-O-metilo, nucleótidos espaciadores de carbono en 3' que incluyen nucleótidos espaciadores C3 en 3’, nucleótidos C18 3', nucleótidos espaciadores de Hexanodiol 3', aciclonucleótidos y combinaciones de los mismos. En cualquiera de los métodos anteriores, los cebadores de amplificación pueden tener una longitud de entre 4 y 70 nucleótidos. En cualquiera de los métodos anteriores, los productos de amplificación pueden tener entre aproximadamente 50 y aproximadamente 2.000 nucleótidos de longitud. En cualquiera de los métodos anteriores, el ácido nucleico diana puede ser ADN (p. ej., un ADNc o un ADN genómico). En cualquiera de los métodos anteriores, los cebadores de amplificación pueden ser cebadores aleatorios. En cualquiera de los métodos anteriores, los cebadores de amplificación pueden comprender un código de barras. El código de barras puede comprender un código de barras celular. El código de barras puede comprender un código de barras de muestra. En cualquiera de los métodos anteriores, los cebadores de amplificación pueden comprender un identificador molecular único (UMI). En cualquiera de los métodos anteriores, el método puede comprender la desnaturalización del ácido nucleico diana o del ADN genómico antes de la reasociación inicial del cebador. La desnaturalización puede realizarse en condiciones alcalinas seguida de neutralización. En cualquiera de los métodos anteriores, la muestra, los cebadores de amplificación, la polimerasa de ácido nucleico y la mezcla de nucleótidos pueden estar contenidos en un dispositivo microfluídico. En cualquiera de los métodos anteriores, la muestra, los cebadores de amplificación, la polimerasa de ácido nucleico y la mezcla de nucleótidos pueden estar contenidos en una gotita. En cualquiera de los métodos anteriores, la muestra se puede seleccionar entre muestras de tejido, células, muestras de líquidos biológicos (p. ej., sangre, orina, saliva, líquido linfático, líquido cefalorraquídeo (LCR), líquido amniótico, líquido pleural, líquido pericárdico, ascitis, humor acuoso), muestras de médula ósea, muestras de semen, muestras de biopsia, muestras de cáncer, muestras de tumores, muestras de producto lisado celular, muestras forenses, muestras arqueológicas, muestras paleontológicas, muestras de infecciones, muestras de producción, plantas enteras, partes de plantas, muestras de microbiota, preparaciones virales, muestras de suelo, muestras marinas, muestras de agua dulce, muestras domésticas o industriales, y combinaciones y productos aislados de las mismas. En cualquiera de los métodos anteriores, la muestra puede ser una célula (p. ej., una célula animal [p. ej., una célula humana], una célula vegetal, una célula fúngica, una célula bacteriana y una célula protozoaria). La célula puede lisarse antes de la replicación. La lisis celular puede ir acompañada de proteólisis. La célula se puede seleccionar entre una célula de un embrión de preimplantación, una célula madre, una célula fetal, una célula tumoral, una célula sospechosa de ser cancerosa, una célula cancerosa, una célula sometida a un procedimiento de edición de genes, una célula de un organismo patógeno, una célula obtenida de una muestra forense, una célula obtenida de una muestra arqueológica y una célula obtenida de una muestra paleontológica. En cualquiera de los métodos anteriores, la muestra puede ser una célula de un embrión de preimplantación (p. ej., un blastómero [p. ej., un blastómero obtenido de un embrión en una fase de ocho células producido por fertilización in vitro]). El método puede comprender adicionalmente la determinación de la presencia de variantes somáticas o de línea germinal que predisponen a la enfermedad en la célula embrionaria. En cualquiera de los métodos anteriores, la muestra puede ser una célula de un organismo patógeno (p. ej., una bacteria, un hongo, un protozoo). La célula del organismo patógeno puede obtenerse del líquido extraído de un paciente, una muestra de microbiota (p. ej., muestra de microbiota GI, muestra de microbiota vaginal, muestra de microbiota de la piel, etc.) o un dispositivo médico permanente (p. ej., un catéter intravenoso, un catéter uretral, una derivación cerebroespinal, una válvula protésica, una articulación artificial, un tubo endotraqueal, etc.). El método puede comprender adicionalmente la etapa determinar la identidad del organismo patógeno. El método puede comprender adicionalmente la determinación de la presencia de variantes genéticas responsables de la resistencia del organismo patógeno a un tratamiento. En cualquiera de los métodos anteriores, la muestra puede ser una célula tumoral, una célula sospechosa de ser cancerosa o una célula cancerosa. El método puede comprender adicionalmente la determinación de la presencia de una o más mutaciones de diagnóstico o pronóstico. El método puede comprender adicionalmente determinar la presencia de variantes somáticas o de línea germinal responsables de la resistencia a un tratamiento. En cualquiera de los métodos anteriores, la muestra puede ser una célula sometida a un procedimiento de edición de genes. El método puede comprender adicionalmente determinar la presencia de mutaciones no planificadas causadas por el procedimiento de edición de genes. En cualquiera de los métodos anteriores, el método puede comprender adicionalmente determinar la historia de un linaje celular. Adicionalmente, en el presente documento se describe un uso de cualquiera de los métodos anteriores para identificar variantes de secuencias de baja frecuencia (p. ej., variantes que constituyen >0,01% de las secuencias totales).
Adicionalmente, en el presente documento se describe un kit que comprende una polimerasa de ácido nucleico, uno o más cebadores de amplificación, una mezcla de nucleótidos que comprende uno o más nucleótidos terminadores y, opcionalmente, instrucciones de uso. En los kits descritos en el presente documento, la polimerasa de ácido nucleico puede ser una ADN polimerasa de desplazamiento de cadena. En los kits descritos en el presente documento, la polimerasa de ácido nucleico se puede seleccionar entre polimerasa del bacteriófago phi29 (029), ADN polimerasa phi29 (029) modificada genéticamente, el fragmento de Klenow de ADN polimerasa I, ADN polimerasa del fago M2, ADN polimerasa del fago phiPRD1, ADN polimerasa de Bst, fragmento grande de ADN polimerasa de Bst, polimerasa de Bst exo(-), ADN polimerasa de Bca exo(-), ADN polimerasa de Bsu, ADN polimerasa VentR, ADN polimerasa VentR (exo-), ADN polimerasa Deep Vent, ADN polimerasa Deep Vent (exo-), ADN polimerasa IsoPol, ADN polimerasa I, ADN polimerasa Therminator, ADN polimerasa de T5, Sequenasa, ADN polimerasa de T7, Sequenasa de T7 y ADN polimerasa de T4. En los kits descritos en el presente documento, la polimerasa de ácido nucleico puede tener actividad de exonucleasa 3'->5' y los nucleótidos terminadores pueden inhibir tal actividad de exonucleasa 3'->5' (p. ej., nucleótidos con modificación del grupo alfa [p. ej., alfa-tio didesoxinucleótidos], nucleótidos espaciadores C3, ácidos nucleicos bloqueados (LNA), ácidos nucleicos invertidos, nucleótidos fluorados en 2’, nucleótidos fosforilados en 3’, nucleótidos modificados con 2'-O-metilo, ácidos nucleicos trans. En los kits descritos en el presente documento, la polimerasa de ácido nucleico puede no tener actividad de exonucleasa 3'->5' (p. ej., ADN polimerasa de Bst, polimerasa de Bst exo(-), ADN polimerasa de Bca exo(-), ADN polimerasa de Bsu, ADN polimerasa VentR (exo-), ADN polimerasa Deep Vent (exo-), Fragmento de Klenow de ADN polimerasa (exo-), ADN polimerasa Therminator). Los nucleótidos terminadores pueden comprender modificaciones del grupo r del carbono 3' de la desoxirribosa. Los nucleótidos terminadores se pueden seleccionar entre terminador reversible bloqueado en 3' que comprende nucleótidos, terminador reversible desbloqueado en 3' que comprende nucleótidos, terminadores que comprenden modificaciones en 2' de desoxinucleótidos, terminadores que comprenden modificaciones en la base nitrogenada de desoxinucleótidos y combinaciones de los mismos. Los nucleótidos terminadores se pueden seleccionar entre didesoxinucleótidos, didesoxinucleótidos invertidos, nucleótidos biotinilados en 3', nucleótidos con amino en 3', nucleótidos fosforilados en 3', nucleótidos con 3'-O-metilo, nucleótidos espaciadores de carbono en 3' que incluyen nucleótidos espaciadores C3 en 3', nucleótidos C18 en 3', nucleótidos espaciadores de Hexanodiol en 3', aciclonucleótidos y combinaciones de los mismos.
En el presente documento se describen métodos para amplificar un genoma, comprendiendo el método: a) poner en contacto una muestra que comprende el genoma, una pluralidad de cebadores de amplificación (p. ej., dos o más cebadores), una polimerasa de ácido nucleico y una mezcla de nucleótidos que comprende uno o más nucleótidos terminadores que terminan la replicación del ácido nucleico por la polimerasa, y b) incubar la muestra en condiciones que promuevan la replicación del genoma para obtener una pluralidad de productos de amplificación terminados, en donde la replicación prosigue mediante replicación por desplazamiento de cadena. En cualquiera de los métodos anteriores, el método puede comprender adicionalmente aislar de la pluralidad de productos de amplificación terminados los productos que tienen entre aproximadamente 50 y aproximadamente 2.000 nucleótidos de longitud. En cualquiera de los métodos anteriores, el método puede comprender adicionalmente aislar de la pluralidad de productos de amplificación terminados los productos que tienen entre aproximadamente 400 y aproximadamente 600 nucleótidos de longitud. En cualquiera de los métodos anteriores, el método puede comprender adicionalmente: c) eliminar los nucleótidos terminadores terminales de los productos de amplificación terminados; d) reparar extremos y añadir colas de A, y e) ligar las moléculas obtenidas en la etapa (d) a adaptadores, y así generar una biblioteca de productos de amplificación. En cualquiera de los métodos anteriores, el método comprende adicionalmente la secuenciación de los productos de amplificación. En cualquiera de los métodos anteriores, la amplificación se puede realizar en condiciones sustancialmente isotérmicas. En cualquiera de los métodos anteriores, la polimerasa de ácido nucleico puede ser una ADN polimerasa.
En cualquiera de los métodos anteriores, la ADN polimerasa puede ser una ADN polimerasa de desplazamiento de cadena. En cualquiera de los métodos anteriores, la polimerasa de ácido nucleico se puede seleccionar entre polimerasa del bacteriófago phi29 (029), ADN polimerasa phi29 (029) modificada genéticamente, fragmento de Klenow de ADN polimerasa I, ADN polimerasa del fago M2, ADN polimerasa del fago phiPRDI, ADN polimerasa de Bst, fragmento grande de ADN polimerasa de Bst, polimerasa de Bst exo(-), ADN polimerasa de Bca exo(-), ADN polimerasa de Bsu, ADN polimerasa VentR, ADN polimerasa VentR (exo-), ADN polimerasa Deep Vent, ADN polimerasa Deep Vent (exo-), ADN polimerasa IsoPol, ADN polimerasa I, ADN polimerasa Therminator, ADN polimerasa de T5, Sequenasa, ADN polimerasa de T7, Sequenasa de T7 y ADN polimerasa de T4. En cualquiera de los métodos anteriores, la polimerasa de ácido nucleico puede tener actividad exonucleasa 3'->5' y los nucleótidos terminadores pueden inhibir tal actividad exonucleasa 3'->5'. En cualquiera de los métodos anteriores, los nucleótidos terminadores se pueden seleccionar entre nucleótidos con modificación del grupo alfa (p. ej., alfa-tio didesoxinucleótidos que crean un enlace fosforotioato), nucleótidos espaciadores C3, ácidos nucleicos bloqueados (LNA), ácidos nucleicos invertidos, nucleótidos fluorados en 2', nucleótidos fosforilados en 3', nucleótidos modificados con 2'-O-metilo y ácidos nucleicos trans. En cualquiera de los métodos anteriores, la polimerasa de ácido nucleico puede no tener actividad de exonucleasa 3' -> 5'. En los métodos descritos en el presente documento, la polimerasa se puede seleccionar entre ADN polimerasa de Bst, polimerasa de Bst exo(-), ADN polimerasa de Bca exo(-), ADN polimerasa de Bsu, ADN polimerasa VentR (exo-), ADN polimerasa Deep Vent (exo-), Fragmento de Klenow de ADN polimerasa (exo-) y ADN polimerasa Therminator. En los métodos descritos en el presente documento, los nucleótidos terminadores pueden comprender modificaciones del grupo r del carbono 3' de la desoxirribosa. En los métodos descritos en el presente documento, los nucleótidos terminadores se pueden seleccionar entre terminador reversible bloqueado en 3' que comprende nucleótidos, terminador reversible desbloqueado en 3' que comprende nucleótidos, terminadores que comprenden modificaciones en 2' de desoxinucleótidos, terminadores que comprenden modificaciones en la base nitrogenada de desoxinucleótidos y combinaciones de los mismos. En los métodos descritos en el presente documento, los nucleótidos terminadores se pueden seleccionar entre didesoxinucleótidos, didesoxinucleótidos invertidos, nucleótidos biotinilados en 3', nucleótidos con amino en 3', nucleótidos fosforilados en 3', nucleótidos con 3'-O-metilo, nucleótidos espaciadores de carbono en 3' que incluyen nucleótidos espaciadores C3 en 3', nucleótidos C18 en 3', nucleótidos espaciadores de Hexanodiol en 3', aciclonucleótidos y combinaciones de los mismos. En cualquiera de los métodos anteriores, los cebadores de amplificación pueden tener una longitud de entre 4 y 70 nucleótidos. En cualquiera de los métodos anteriores, los productos de amplificación pueden tener entre aproximadamente 50 y aproximadamente 2.000 nucleótidos de longitud. En cualquiera de los métodos anteriores, el ácido nucleico diana puede ser ADN (p. ej., un ADNc o un ADN genómico). En cualquiera de los métodos anteriores, los cebadores de amplificación pueden ser cebadores aleatorios. En cualquiera de los métodos anteriores, los cebadores de amplificación pueden comprender un código de barras. El código de barras puede comprender un código de barras celular. El código de barras puede comprender un código de barras de muestra. En cualquiera de los métodos anteriores, los cebadores de amplificación pueden comprender un identificador molecular único (UMI). En cualquiera de los métodos anteriores, el método puede comprender la desnaturalización del ácido nucleico diana o del ADN genómico antes de la reasociación inicial del cebador. La desnaturalización puede realizarse en condiciones alcalinas seguida de neutralización. En cualquiera de los métodos anteriores, la muestra, los cebadores de amplificación, la polimerasa de ácido nucleico y la mezcla de nucleótidos pueden estar contenidos en un dispositivo microfluídico. En cualquiera de los métodos anteriores, la muestra, los cebadores de amplificación, la polimerasa de ácido nucleico y la mezcla de nucleótidos pueden estar contenidos en una gotita. En cualquiera de los métodos anteriores, la muestra se puede seleccionar entre muestras de tejido, células, muestras de líquidos biológicos (p. ej., sangre, orina, saliva, líquido linfático, líquido cefalorraquídeo (LCR), líquido amniótico, líquido pleural, líquido pericárdico, ascitis, humor acuoso), muestras de médula ósea, muestras de semen, muestras de biopsia, muestras de cáncer, muestras de tumores, muestras de producto lisado celular, muestras forenses, muestras arqueológicas, muestras paleontológicas, muestras de infecciones, muestras de producción, plantas enteras, partes de plantas, muestras de microbiota, preparaciones virales, muestras de suelo, muestras marinas, muestras de agua dulce, muestras domésticas o industriales, y combinaciones y productos aislados de las mismas. En cualquiera de los métodos anteriores, la muestra puede ser una célula (p. ej., una célula animal [p. ej., una célula humana], una célula vegetal, una célula fúngica, una célula bacteriana y una célula protozoaria). La célula puede lisarse antes de la replicación. La lisis celular puede ir acompañada de proteólisis. La célula se puede seleccionar entre una célula de un embrión de preimplantación, una célula madre, una célula fetal, una célula tumoral, una célula sospechosa de ser cancerosa, una célula cancerosa, una célula sometida a un procedimiento de edición de genes, una célula de un organismo patógeno, una célula obtenida de una muestra forense, una célula obtenida de una muestra arqueológica y una célula obtenida de una muestra paleontológica. En cualquiera de los métodos anteriores, la muestra puede ser una célula de un embrión de preimplantación (p. ej., un blastómero [p. ej., un blastómero obtenido de un embrión en fase de ocho células producido por fertilización in vitro]). El método puede comprender adicionalmente determinar la presencia de variantes somáticas o de línea germinal que predisponen a la enfermedad en la célula embrionaria. En cualquiera de los métodos anteriores, la muestra puede ser una célula de un organismo patógeno (p. ej., una bacteria, un hongo, un protozoo). La célula del organismo patógeno puede obtenerse del líquido extraído de un paciente, una muestra de microbiota (p. ej., muestra de microbiota GI, muestra de microbiota vaginal, muestra de microbiota de la piel, etc.) o un dispositivo médico permanente (p. ej., un catéter intravenoso, un catéter uretral, una derivación cerebroespinal, una válvula protésica, una articulación artificial, un tubo endotraqueal, etc.). El método puede comprender adicionalmente la etapa de determinar la identidad del organismo patógeno. El método puede comprender adicionalmente determinar la presencia de variantes genéticas responsables de la resistencia del organismo patógeno a un tratamiento. En cualquiera de los métodos anteriores, la muestra puede ser una célula tumoral, una célula sospechosa de ser cancerosa o una célula cancerosa. El método puede comprender adicionalmente determinar la presencia de una o más mutaciones de diagnóstico o pronóstico. El método puede comprender adicionalmente determinar la presencia de variantes somáticas o de línea germinal responsables de la resistencia a un tratamiento. En cualquiera de los métodos anteriores, la muestra puede ser una célula sometida a un procedimiento de edición de genes. El método puede comprender adicionalmente determinar la presencia de mutaciones no planificadas causadas por el procedimiento de edición de genes. En cualquiera de los métodos anteriores, el método puede comprender adicionalmente determinar la historia de un linaje celular. Adicionalmente, en el presente documento se describe un uso de cualquiera de los métodos anteriores para identificar variantes de secuencias de baja frecuencia (p. ej., variantes que constituyen >0,01% de las secuencias totales).
Adicionalmente, en el presente documento se describe un kit que comprende una polimerasa de ácido nucleico, uno o más cebadores de amplificación, una mezcla de nucleótidos que comprende uno o más nucleótidos terminadores y, opcionalmente, instrucciones de uso. En los kits descritos en el presente documento, la polimerasa de ácido nucleico puede ser una ADN polimerasa de desplazamiento de cadena. En los kits descritos en el presente documento, la polimerasa de ácido nucleico se puede seleccionar entre polimerasa del bacteriófago phi29 (029), ADN polimerasa phi29 (029) modificada genéticamente, Fragmento de Klenow de ADN polimerasa I, ADN polimerasa del fago M2, ADN polimerasa del fago phiPRD1, ADN polimerasa de Bst, fragmento grande de ADN polimerasa de Bst, polimerasa de Bst exo(-), ADN polimerasa de Bca exo(-), ADN polimerasa de Bsu, ADN polimerasa VentR, ADN polimerasa VentR (exo-), ADN polimerasa Deep Vent, (ADN polimerasa Deep Vent exo-), ADN polimerasa IsoPol, ADN polimerasa I, ADN polimerasa Therminator, ADN polimerasa de T5, Sequenasa, ADN polimerasa de T7, Sequenasa de T7 y ADN polimerasa de T4 En los kits descritos en el presente documento, la polimerasa de ácido nucleico puede tener actividad exonucleasa 3'->5' y los nucleótidos terminadores pueden inhibir tal actividad de exonucleasa 3'->5' (p. ej., nucleótidos con modificación del grupo alfa [p. ej., alfa-tio didesoxinucleótidos], nucleótidos espaciadores C3, ácidos nucleicos bloqueados (LNA), ácidos nucleicos invertidos, nucleótidos fluorados en 2’, nucleótidos fosforilados en 3’, nucleótidos modificados con 2'-O-metilo, ácidos nucleicos trans). En los kits descritos en el presente documento, la polimerasa de ácido nucleico puede no tener actividad exonucleasa 3'->5' (p. ej., ADN polimerasa de Bst, polimerasa de Bst exo(-), ADN polimerasa de Bca exo(-), ADN polimerasa de Bsu, ADN polimerasa VentR (exo-), ADN polimerasa Deep Vent (exo-), Fragmento de Klenow de ADN polimerasa (exo-), ADN polimerasa Therminator). En los kits descritos en el presente documento, los nucleótidos terminadores pueden comprender modificaciones del grupo r del carbono 3' de la desoxirribosa. En los kits descritos en el presente documento, los nucleótidos terminadores se pueden seleccionar entre terminador reversible bloqueado en 3' que comprende nucleótidos, terminador reversible desbloqueado en 3' que comprende nucleótidos, terminadores que comprenden modificaciones en 2' de desoxinucleótidos, terminadores que comprenden modificaciones en la base nitrogenada de desoxinucleótidos y combinaciones de los mismos. En los kits descritos en el presente documento, los nucleótidos terminadores se pueden seleccionar entre didesoxinucleótidos, didesoxinucleótidos invertidos, nucleótidos biotinilados en 3', aminonucleótidos en 3', nucleótidos fosforilados en 3', nucleótidos con 3'-O-metilo, nucleótidos espaciadores de carbono en 3' que incluyen nucleótidos espaciadores C3 en 3', nucleótidos C18 en 3', nucleótidos espaciadores de Hexanodiol en 3', aciclonucleótidos y combinaciones de los mismos.
Ejemplos
Los siguientes ejemplos se exponen para ilustrar más claramente el principio y la práctica de las realizaciones divulgadas en el presente documento a los expertos en la técnica y no deben interpretarse como una limitación del alcance de las realizaciones reivindicadas. A menos que se indique lo contrario, todas las partes y porcentajes son en peso.
Ejemplo 1: Amplificación Dirigida por Molde Primario (PTA)
Si bien la PTA se puede utilizar para cualquier amplificación de ácido nucleico, es particularmente útil para la amplificación del genoma completo, ya que permite capturar un mayor porcentaje del genoma celular de una manera más uniforme y reproducible y con tasas de error más bajas que los métodos utilizados actualmente, tales como, p. ej., Amplificación de Desplazamiento Múltiple (MDA), evitando inconvenientes de los métodos utilizados actualmente tales como la amplificación exponencial en lugares donde la polimerasa extiende primero los cebadores aleatorios, lo que da como resultado una sobrerrepresentación aleatoria de loci y alelos y la propagación de mutaciones (véanse las Figuras 1A-1C).
Cultivo de células
Se mantuvieron células humanas NA12878 (Coriell Institute) en medio RPMI, con un suplemento de FBS al 15% y L-glutamina 2 mM, y 100 unidades/ml de penicilina, 100 pg/ml de estreptomicina y 0,25 pg/ml de Anfotericina B (Gibco, Life Technologies). Las células se sembraron a una densidad de 3,5 x 105 células/ml. Los cultivos se dividieron cada 3 días y se mantuvieron en una incubadora humidificada a 37C con 5% de CO2.
Aislamiento de células individuales y WGA
Después de cultivar células NA12878 durante un mínimo de tres días después de la siembra a una densidad de 3,5 x 105 células/ml, se sedimentaron 3 ml de suspensión celular a 300xg durante 10 minutos. A continuación, se descartó el medio y las células se lavaron tres veces con 1 ml de tampón de lavado celular (1X PBS que contenía FBS al 2% sin Mg2 o Ca2) centrifugando a 300xg, 200xg y finalmente 100xg durante 5 minutos. A continuación, las células se resuspendieron en 500 pl de tampón de lavado celular. A esto le siguió la tinción con 100 nM de Calceína AM (Molecular Probes) y 100 ng/ml de yoduro de propidio (PI; Sigma-Aldrich) para distinguir la población de células vivas. Las células se cargaron en un citómetro de flujo BD FACScan (FACSAria II) (BD Biosciences) que se había limpiado a fondo con ELIMINase (Decon Labs) y se calibró con cuentas fluorescentes Accudrop (BD Biosciences) para la clasificación celular. Se clasificó una única célula de la fracción positiva para calceína AM y negativa para PI en cada pocillo de una placa de 96 pocillos que contenía 3 pL de PBS (Qiagen, kit REPLI-g SC) con Tween 20 al 0,2% en las células que se someterían a PTA (Sigma-Aldrich). Múltiples pocillos se dejaron vacíos intencionadamente para utilizarlos como controles sin molde (NTC). Inmediatamente después de la clasificación, las placas se centrifugaron brevemente y se colocaron sobre hielo. A continuación, las células se congelaron como mínimo durante la noche a -20°C. Al día siguiente, las Reacciones de WGA se ensamblaron en una estación de trabajo previa a la PCR que proporciona una presión positiva constante de aire filtrado con HEPA y que se descontaminó con luz ultravioleta durante 30 minutos antes de cada experimento.
La MDA se llevó a cabo utilizando el Kit de Células Únicas REPLI-g (Qiagen) con modificaciones que previamente se ha demostrado que mejoran la uniformidad de la amplificación. En concreto, se añadieron cebadores aleatorios resistentes a exonucleasas (ThermoFisher) al Tampón D2 (Kit de Células Únicas REPLI-g, Qiagen) hasta una concentración final de 125 pM en el Tampón D2. Se añadieron 4 pl de la mezcla de lisis/desnaturalización resultante a los tubos que contenían las células individuales, se sometieron a agitación vorticial, se centrifugaron brevemente y se incubaron sobre hielo durante 10 minutos. Los productos lisados celulares se neutralizaron añadiendo 3 pl de Solución de Parada (REPLI-g Single Cell Kit, Qiagen), se mezclaron mediante agitación vorticial, se centrifugaron brevemente y se colocaron a temperatura ambiente. Esto estuvo seguido por la adición de 40 pl de mezcla de amplificación antes de la incubación a 30°C durante 8 horas, después de lo cual la amplificación se terminó calentando a 65°C durante 3 minutos.
La PTA se llevó a cabo lisando primero las células después de la congelación y descongelación añadiendo 2 pl de una solución preenfriada de una mezcla 1:1 de Triton X-100 al 5% (Sigma-Aldrich) y 20 mg/ml de Proteinasa K (Promega). A continuación, las células se sometieron a agitación vorticial y se centrifugaron brevemente antes de colocarlas a 40 grados durante 10 minutos. A continuación, se añadieron 4 pl de Tampón D2 (REPLI-g Single Cell Kit, Qiagen) y 1 pl de cebador aleatorio resistente a exonucleasa 500 pM a las células lisadas para desnaturalizar el ADN antes de someter a agitación vorticial, centrifugar y colocar a 65 grados durante 15 minutos. A continuación, se añadieron 4 gl de Solución de Parada a temperatura ambiente (REPLI-g Single Cell Kit, Qiagen) y las muestras se sometieron a agitación vorticial y se centrifugaron. Se añadieron 56 gl de mezcla de amplificación (REPLI-g Single Cell Kit, Qiagen) que contenía alfa-tio-ddNTP a razones iguales a una concentración 1200 gM en la reacción de amplificación final. A continuación, las muestras se colocaron a 30°C durante 8 horas, después de lo cual se terminó la amplificación calentándola a 65°C durante 3 minutos.
Después de la etapa de amplificación, el ADN de las reacciones de MDA y PTA se purificó utilizando cuentas magnéticas AMPure XP (Beckman Coulter) a una razón de cuentas con respecto a muestra de 2:1 y el rendimiento se midió utilizando el kit de ensayo Qubit dsDNA HS con un fluorómetro Qubit 3.0 de acuerdo con las instrucciones del fabricante (Life Technologies).
Preparación de la biblioteca
Las reacciones de MDA dieron como resultado la producción de 40 gg de ADN amplificado. Se fragmentó 1 gg de producto durante 30 minutos según el protocolo KAPA HyperPlus después de la adición de la solución acondicionadora (KAPA Biosystems). A continuación, las muestras se sometieron a una preparación de biblioteca convencional con 15 gM de adaptadores de doble índice (Integrated DNA Technologies) y 4 ciclos de PCR. Cada reacción de PTA generó entre 40 y 60 ng de material que se utilizó para la preparación de la biblioteca de secuenciación de ADN en su totalidad utilizando el kit KAPA HyperPlus sin fragmentación. En la ligación se utilizaron adaptadores de 2,5 gM con UMI e índices duales (Integrated DNA Technologies) y en la amplificación final se utilizaron 15 ciclos de PCR. A continuación, las bibliotecas se limpiaron utilizando una SPRI de doble cara utilizando proporciones de 0,65X y 0,55X para la selección del lado derecho e izquierdo, respectivamente. Las bibliotecas finales se cuantificaron con el kit de ensayo Qubit dsDNA BR y el bioanalizador 2100 (Agilent Technologies) antes de la secuenciación en la plataforma Illumina NextSeq. Todas las plataformas de secuenciación de Illumina, incluido NovaSeq, también son compatibles con el protocolo.
Análisis de datos
Las lecturas de secuenciación se desmultiplexaron en función del código de barras celular utilizando Bcl2fastq. A continuación, las lecturas se recortaron con trimmomatic, lo que estuvo seguido por el alineamiento con hg 19 con BWA. Las lecturas se marcaron por duplicado con Picard, seguido de realineamiento local y recalibración de la base con GATK 4.0. Todos los archivos utilizados para calcular las métricas de calidad se redujeron a veinte millones de lecturas mediante Picard DownSampleSam. Las métricas de calidad se adquirieron del archivo bam final utilizando qualimap, así como Picard AlignmentSummaryMetrics y CollectWgsMetrics. La cobertura total del genoma también se estimó utilizando Preseq.
Detección de variantes
Las variantes de un solo nucleótido y las de tipo Indel se detectaron usando el GATK UnifiedGenotyper de GATK 4.0. Se utilizaron criterios de filtrado convencionales que utilizan las mejores prácticas de GATK para todas los etapas del procedimiento (https://software.broadinstitute.org/gatk/best-practices/). Las variantes del número de copias se llamaron utilizando Control-FREEC (Boeva et al., Bioinformatics, 2012, 28(3):423-5). También se detectaron variantes estructurales utilizando CREST (Wang et al., Nat Methods, 2011,8(8):652-4).
Resultados
Como se muestra en Figura 3A y Figura 3B, las tasas de mapeo y las puntuaciones de calidad de mapeo de la amplificación con didesoxinucleótidos ("reversible") solos son 15,0 /- 2,2 y 0,8 /- 0,08, respectivamente, mientras que la incorporación de terminadores alfa-tio didesoxinucleótidos resistentes a la exonucleasa ("irreversible") da como resultado tasas de mapeo y puntuaciones de calidad de 97,9 /- 0,62 y 46,3 /- 3,18, respectivamente. También se realizaron experimentos utilizando un ddNTP reversible y diferentes concentraciones de terminadores. (Figura 2A, parte inferior)
Las Figuras 2B-2E muestran los datos comparativos producidos a partir de células individuales humanas NA12878 que se sometieron a MDA (siguiendo el método de Dong, X. et al., Nat Methods. 2017, 14(5):491-493) o PTA. Si bien ambos protocolos produjeron tasas de duplicación de PCR bajas comparables (MDA 1,26% /- 0,52 frente a PTA 1,84% /- 0,99) y GC% (MDA 42,0 /- 1,47 frente a PTA 40,33 /- 0,45), PTA produjo tamaños de amplicón más pequeños. El porcentaje de lecturas mapeadas y las puntuaciones de calidad de mapeo también fueron significativamente más altos para PTA en comparación con MDA (PTA 97,9 /- 0,62 vs MDA 82,13 /- 0,62 y PTA 46,3 /- 3,18 vs MDA 43,2 /- 4,21, respectivamente). En general, PTA produce datos mapeados más utilizables en comparación con MDA. La Figura 4A muestra que, en comparación con MDA, PTA ha mejorado significativamente la uniformidad de la amplificación con una mayor amplitud de cobertura y menos regiones donde la cobertura cae cerca de 0. El uso de PTA permite identificar variantes de secuencia de baja frecuencia en una población de ácidos nucleicos, incluidas variantes que constituyen >0,01% del total de secuencias. PTA se puede utilizar con éxito para la amplificación del genoma de una célula individual.
Ejemplo 2: Análisis comparativo de PTA
Evaluación comparativa del mantenimiento y aislamiento de células por PTA y SCMDA
Las células linfoblastoides del sujeto NA12878 del Proyecto Genoma 1000 (Coriell Institute, Camden, NJ, EE. UU.) se mantuvieron en medio RPMI, que se complementó con FBS al 15%, L-glutamina 2 mM, 100 unidades/ml de penicilina, 100 pg/ml de estreptomicina y 0,25 pg/mL de Anfotericina B). Las células se sembraron a una densidad de 3,5 x 105 células/ml y se dividieron cada 3 días. Se mantuvieron en una incubadora humidificada a 37°C con 5% de CO2. Antes del aislamiento de células individuales, se centrifugaron 3 ml de suspensión de células que se habían expandido durante los 3 días anteriores a 300xg durante 10 minutos. Las células sedimentadas se lavaron tres veces con 1 ml de tampón de lavado de células (1X PBS que contenía FBS al 2% sin Mg2+ o Ca2+)) donde se centrifugaron secuencialmente a 300xg, 200xg y finalmente a 100xg durante 5 minutos para eliminar las células muertas. A continuación, las células se resuspendieron en 500 ul de tampón de lavado celular, seguido de tinción con 100 nM de Calceína AM y 100 ng/ml de yoduro de propidio (PI) para distinguir la población de células vivas. Las células se cargaron en un citómetro de flujo BD FACScan (FACSAria II) que se limpió a fondo con ELIMINase y se calibró con cuentas fluorescentes Accudrop. Se clasificó una célula individual de la fracción positiva para Calceína AM y negativa para PI en cada pocillo de una placa de 96 pocillos que contenía 3 uL de PBS con Tween 20 al 0,2%. Se dejaron vacíos intencionadamente varios pocillos para utilizarlos como controles sin molde. Inmediatamente después de la clasificación, las placas se centrifugaron brevemente y se colocaron sobre hielo. A continuación, las células se congelaron como mínimo durante la noche a -80°C.
Experimentos de PTA y SCMDA
Las reacciones de WGA se ensamblaron en una estación de trabajo previa a la PCR que proporciona una presión positiva constante con aire filtrado por HEPA y que se descontaminó con luz ultravioleta durante 30 minutos antes de cada experimento. La MDA se llevó a cabo de acuerdo con la metodología SCMDA utilizando el REPLI-g Single Cell Kit de acuerdo con el protocolo publicado (Dong et al. Nat. Meth. 2017, 14, 491-493). Específicamente, se añadieron cebadores aleatorios resistentes a exonucleasas a una concentración final de 12,5 uM al tampón de lisis. Se añadieron 4 uL de la mezcla de lisis resultante a los tubos que contenían las células individuales, se pipetearon tres veces para mezclar, se centrifugaron brevemente y se incubaron sobre hielo durante 10 minutos. Los productos lisados celulares se neutralizaron añadiendo 3 ul de tampón de extinción, se mezclaron pipeteando 3 veces, se centrifugaron brevemente y se colocaron sobre hielo. A esto le siguió la adición de 40 ul de mezcla de amplificación antes de la incubación a 30°C durante 8 horas, después de lo cual la amplificación se terminó calentando a 65°C durante 3 minutos. La PTA se llevó a cabo mediante la lisis adicional de las células después de la congelación y descongelación mediante la adición de 2 pl de una solución preenfriada de una mezcla 1:1 de Triton X-100 al 5% y 20 mg/ml de Proteinasa K. A continuación, las células se sometieron a agitación vorticial y se centrifugaron brevemente antes de colocarlas a 40 grados durante 10 minutos. A continuación, se añadieron 4 pl de tampón desnaturalizante y 1 pl de cebador aleatorio resistente a exonucleasa 500 pM a las células lisadas para desnaturalizar el ADN antes de someter a agitación vorticial, centrifugar y colocar a 65°C durante 15 minutos. A continuación, se añadieron 4 pl de solución de extinción a temperatura ambiente y las muestras se sometieron a agitación vorticial y se centrifugaron. Se añadieron 56 pl de mezcla de amplificación que contenía alfa-tio-ddNTP a razones iguales a una concentración de 1200 pM en la reacción de amplificación final. A continuación, las muestras se colocaron a 30°C durante 8 horas, después de lo cual se terminó la amplificación calentándola a 65°C durante 3 minutos. Después de la amplificación SCMDA o PTA, el ADN se purificó utilizando cuentas magnéticas AMPure XP a una razón de cuentas a muestra de 2:1 y el rendimiento se midió utilizando el kit de ensayo Qubit dsDNA HS con un fluorómetro Qubit 3.0 de acuerdo con las instrucciones del fabricante. Los experimentos de PTA también se realizaron utilizando ddNTP reversibles y diferentes concentraciones de terminadores. (Figura 2A, parte superior)
Preparación de la biblioteca
Se fragmentó 1 ug de producto de SCMDA durante 30 minutos según el protocolo HyperPlus después de la adición de la solución acondicionadora. A continuación, las muestras se sometieron a una preparación de biblioteca convencional con 15 uM de adaptadores de índice dual únicos y 4 ciclos de PCR. El producto completo de cada reacción de PTA se utilizó para la preparación de la biblioteca de secuenciación de ADN utilizando el kit KAPA HyperPlus sin fragmentación. Se utilizaron 2,5 uM de adaptador de índice dual único en la ligación, y se utilizaron 15 ciclos de PCR en la amplificación final. A continuación, las bibliotecas de SCMDA y PTA se visualizaron en un Gel de agarosa E al 1%. Los fragmentos de entre 400 y 700 pb se extrajeron del gel y se recuperaron utilizando un Kit de Recuperación de ADN en Gel. Las bibliotecas finales se cuantificaron con el kit de ensayo Qubit dsDNA BR y el Bioanalizador Agilent 2100 antes de la secuenciación en NovaSeq 6000.
Análisis de datos
Los datos se recortaron utilizando trimmomatic, seguido de un alineamiento con hg 19 utilizando BWA. Las lecturas fueron marcadas por duplicado por Picard, seguido de un realineamiento local y una recalibración de bases utilizando las mejores prácticas de GATK 3.5. Todos los archivos se redujeron al número especificado de lecturas utilizando Picard DownSampleSam. Las métricas de calidad se adquirieron del archivo bam final utilizando qualimap, así como Picard AlignmentMetricsAummary y CollectWgsMetrics. Se dibujaron las curvas de Lorenz y se calcularon los Índices de Gini utilizando htSeqTools. Las detecciones de SNV se realizaron con UnifiedGenotyper, que después se filtraron con los criterios convencionales recomendados (QD < 2,0 II FS > 60,0 II MQ < 40,0 y So r > 4,0 y MQRankSum < -12,5 y ReadPosRankSum < -8,0). No se excluyó ninguna región de los análisis y no se realizó ninguna otra normalización o manipulación de datos. Las métricas de secuenciación para los métodos probados se encuentran en Tabla 1.
Tabla 1: Comparación de las métricas de secuenciación entre los métodos probados.
Figure imgf000027_0001
Amplitud y uniformidad de la cobertura del genoma
Se realizaron comparaciones exhaustivas de PTA con todos los métodos de WGA de célula individual comunes. Para lograr esto, se realizaron PTA y una versión mejorada de MDA llamada MDA de célula individual (Dong et al. Nat. Meth. 2017, 14, 491-493) (SCm Da ) en 10 células NA12878 cada una. Adicionalmente, esos resultados para las células que habían sido amplificadas con DOP-PCR (Zhang et al. PNAS 1992, 89, 5847-5851), Kit 1 de m Da (Dean et al. PNAS 2002, 99, 5261-5266), kit 2 de MDA, MALBAC (Zong et al. Science 2012, 338, 1622-1626), LIANTI (Chen et al., Science 2017, 356, 189-194) o PicoPlex (Langmore, Pharmacogenomics 3, 557-560 (2002)) se compararon utilizando datos producidos como parte del estudio LIANTI.
Para normalizar las muestras, los datos sin procesar de todas las muestras se alinearon y se sometieron a un procesamiento previo para la asignación de variantes utilizando la misma canalización. A continuación, los archivos bam se submuestrearon en 300 millones de lecturas cada uno antes de realizar las comparaciones. Es importante destacar que los productos de PTA y SCMDA no se escrutaron antes de realizar más análisis, mientras que todos los demás métodos se sometieron a un escrutinio de cobertura y uniformidad del genoma antes de seleccionar las células de la más alta calidad que se utilizaron en los análisis posteriores. Es de destacar que SCMDA y PTA se compararon con muestras diploides masivas de NA12878, mientras que todos los demás métodos se compararon con fibroblastos diploides BJ1 masivos que se habían utilizado en el estudio LIANTI. Como se observó en las Figuras 3C-3F, PTA tuvo el porcentaje más alto de lecturas alineadas con el genoma, así como la calidad de mapeo más alta. PTA, LIANTI y SCMDA tuvieron un contenido de GC similar, todos los cuales eran más bajos que los otros métodos. Las tasas de duplicación de PCR fueron similares en todos los métodos. Adicionalmente, el método de PTA permitió que moldes más pequeños, tales como el genoma mitocondrial, ofrecieran tasas de cobertura más altas (similares a los cromosomas canónicos más grandes) con relación a otros métodos probados (Figura 3G).
A continuación, se compararon la amplitud y uniformidad de cobertura de todos los métodos. Se muestran ejemplos de gráficos de cobertura en el cromosoma 1 para SCMDA y PTA, donde se muestra que PTA tiene una uniformidad de cobertura significativamente mejorada (Figuras 4B y 4C). A continuación, se calcularon las tasas de cobertura para todos los métodos utilizando un número creciente de lecturas. PTA se acerca a las dos muestras masivas en cada profundidad, lo que es una mejora significativa con respecto a todos los demás métodos (Figura 5A). Después, los autores de la presente invención utilizaron dos estrategias para medir la uniformidad de cobertura. El primer enfoque fue calcular el coeficiente de variación de la cobertura al aumentar la profundidad de secuenciación donde se encontró que PTA era más uniforme que todos los demás métodos (Figura 5B). La segunda estrategia fue calcular las curvas de Lorenz para cada archivo bam submuestreado donde nuevamente se encontró que PTA tenía la mayor uniformidad (Figura 5C). Para medir la reproducibilidad de la uniformidad de la amplificación, se calcularon los Índices de Gini para estimar la diferencia de cada reacción de amplificación a partir de la uniformidad perfecta (de Bourcy et al., PloS one 9, e105585 (2014)). Se demostró nuevamente que PTA es reproduciblemente más uniforme que los otros métodos (Figura 5D).
Sensibilidad de SNV
Para determinar los efectos de estas diferencias en el rendimiento de los métodos de amplificación sobre la asignación de SNV, se compararon las tasas de asignación de variantes para cada una con la muestra masiva correspondiente a una profundidad de secuenciación creciente. Para estimar la sensibilidad, se comparó el porcentaje de variantes detectadas en las muestras masivas correspondientes que se habían submuestreado a 650 millones de lecturas que se encontraron en cada célula a cada profundidad de secuenciación (Figura 5E). La cobertura y la uniformidad mejoradas de PTA dieron como resultado la detección de 45,6% más de variantes con respecto al Kit 2 de MDA, que fue el siguiente método más sensible. Un examen de los sitios detectados como heterocigotos en la muestra masiva mostró que la PTA había disminuido significativamente la desviación alélica en esos sitios heterocigotos (Figura 5F). Este hallazgo respalda la afirmación de que la PTA no solo tiene una amplificación más uniforme en todo el genoma, sino que también amplifica de manera más uniforme dos alelos en la misma célula.
Especificidad de SNV
Para estimar la especificidad de las detecciones de mutaciones, las variantes detectadas en cada célula individual que no se encontraron en la muestra masiva correspondiente se consideraron falsos positivos. La lisis a temperatura más baja de SCMDA redujo significativamente el número de detecciones de variantes falsas positivas (Figura 5G). Los métodos que utilizan polimerasas termoestables (MALBAC, PicoPlex y DOP-PCR) mostraron disminuciones adicionales en la especificidad de asignación de SNV con una mayor profundidad de secuenciación. Sin estar vinculados a la teoría, esto es probablemente el resultado de la tasa de error significativamente mayor de esas polimerasas en comparación con la ADN polimerasa de phi29. Adicionalmente, los patrones de cambio de base observados en las asignaciones falsos positivos también parecen depender de la polimerasa (Figura H). Como se observa en Figura 5G, el modelo de propagación de errores suprimida en PTA es compatible con la menor tasa de asignaciones de SNV de falsos positivos en PTA en comparación con los protocolos MDA convencionales. Además, PTA tiene las frecuencias alélicas más bajas de asignaciones de variantes falsas positivas, lo que nuevamente es compatible con el modelo de propagación de error suprimida con PTA (Figura 5I).
Ejemplo 3: Medición directa de mutagenicidad ambiental (DMEM)
La PTA se utilizó para realizar un nuevo ensayo de mutagenicidad que proporciona un marco para realizar estudios de toxicogenómica humana de alta resolución en todo el genoma. Estudios anteriores, tales como la prueba de Ames, se basan en la genética bacteriana para realizar mediciones que se supone que son representativas de las células humanas y solo brindan información limitada sobre el número de mutaciones y los patrones inducidos en cada célula expuesta. Para superar estas limitaciones, se desarrolló un sistema de mutagénesis humana "medición directa de la mutagenicidad ambiental (DMEM)", en donde se expusieron células humanas individuales a un compuesto ambiental, se aislaron como células individuales y se sometieron a secuenciación de células individuales para identificar las nuevas mutaciones inducidas en cada célula.
Las células de la sangre del cordón umbilical que expresan el marcador madre/progenitor CD34 se expusieron a concentraciones crecientes del mutágeno directo N-etil-N-nitrosourea (ENU). Se sabe que ENU tiene una constante de sustrato de Swain-Scott relativamente baja y, en consecuencia, se ha demostrado que actúa predominantemente a través de un mecanismo SN1 de dos etapas que da como resultado la alquilación preferencial de O4-timina, O2-timina y O2-citosina. A través de la secuenciación limitada de los genes diana, también se ha demostrado que ENU tiene preferencia por los cambios de T a A (A a T), T a C (A a G) y C a T (G a A) en ratones, lo que difiere significativamente del patrón visto en E. coli.
Aislamiento y expansión de células de sangre de cordón umbilical para experimentos de mutagenicidad
Se pusieron en solución ENU (CAS 759-73-9) y D-manitol (CAS 69-65-8) a su máxima solubilidad. Se obtuvo sangre de cordón umbilical (CB) de nueva aportación tratada con anticoagulante del St. Louis Cord Blood Bank. La CB se diluyó 1:2 con PBS y las células mononucleares (MNC) se aislaron mediante centrifugación en gradiente de densidad en Ficoll-Paque Plus de acuerdo con las instrucciones del fabricante. A continuación, se seleccionaron inmunomagnéticamente las MNC de CB que expresaban CD34 utilizando el kit de microcuentas de CD34 humano y el sistema de clasificación de células magnéticas (MACS) según el fabricante. El recuento de células y la viabilidad se evaluaron utilizando el contador de células Luna FL. Se sembraron células CB CD34+ a una densidad de 2,5 x 104 células/mL en StemSpan SFEM complementado con 1X CD34+ Expansion Supplement, 100 unidades/mL de penicilina y 100 ug/mL de estreptomicina donde se expandieron durante 96 horas antes de proceder a la exposición al mutágeno.
Medición Directa de Mutagenicidad Ambiental (DMEM)
Se cultivaron células CD34+ de sangre de cordón expandidas en StemSpan SFEM complementado con 1X CD34+ Expansion Supplement, 100 unidades/mL de penicilina y 100 ug/mL de estreptomicina. Las células se expusieron a ENU a concentraciones de 8,54, 85,4 y 854 uM, D-manitol a 1152,8 y 11528 uM, o cloruro de sodio al 0,9% (control de vehículo) durante 40 horas. Se recogieron suspensiones de células individuales de células tratadas con fármaco y muestras de control de vehículo y se tiñeron para determinar la viabilidad como se describe anteriormente. Las clasificaciones de células individuales se llevaron a cabo como se describe anteriormente. Se realizó PTA y se prepararon bibliotecas utilizando un protocolo simplificado y mejorado según los métodos generales de los métodos descritos en el presente documento, y el Ejemplo 2.
Análisis de datos de DMEM
Los datos adquiridos de las células en los experimentos de DMEM se recortaron con Trimmomatic, se alinearon con GRCh38 con BWA y se procesaron adicionalmente con las mejores prácticas de GATK 4.0.1 sin desviarse de los parámetros recomendados. El genotipado se realizó utilizando HaplotypeCaller, donde los genotipos conjuntos se filtraron nuevamente utilizando parámetros convencionales. Solo se consideró que una variante era el resultado del mutágeno si tenía una puntuación de calidad de Phred de al menos 100 y solo se encontraba en una célula mientras no se encontraba en la muestra masiva. El contexto de trinucleótidos de cada SNV se determinó extrayendo las bases circundantes del genoma de referencia utilizando BEDtools. Los recuentos de mutaciones y el contexto se visualizaron utilizando ggplot2 y heatmap2 en R.
Para determinar si las mutaciones se enriquecieron en los sitios de hipersensibilidad de ADNasa I (DHS) en las células CD34+, se calculó la proporción de SNV en cada muestra que se solapan con los sitios DHS de 10 conjuntos de datos de células primarias CD34+ producidos por Roadmap Epigenomics Project. Los sitios DHS se extendieron por 2 nucleosomas, o 340 bases en cualquier dirección. Cada conjunto de datos de DHS se emparejó con una muestra de una célula individual donde los autores de la presente invención determinaron la proporción del genoma humano con una cobertura de al menos 10x en esa célula que se solapaba con un DHS, que se comparó con la proporción de SNV que se encontraron dentro de los sitios DHS cubiertos.
Resultados
De acuerdo con estos estudios, se observó un aumento dependiente de la dosis en el número de mutaciones de cada célula, donde se detectó un número similar de mutaciones a la dosis más baja de ENU en comparación con el control del vehículo o las dosis tóxicas de manitol (Figura 12A). También de acuerdo con el trabajo previo en ratones utilizando ENU, las mutaciones más comunes son T a A (A a T), T a C (A a G) y C a T (G a A). También se observaron los otros tres tipos de cambios de base, aunque la transversión de C a G (G a C) parece ser rara (Figura 12B). Un examen del contexto de trinucleótidos de los SNV ilustra dos patrones distintos (Figura 12C). El primer patrón es que la mutagénesis de citosina parece ser rara cuando la citosina va seguida de guanina. La citosina seguida de guanina suele estar metilada en el sitio del quinto carbono en los genomas humanos, que es un marcador de heterocromatina. Sin estar vinculados a la teoría, se planteó la hipótesis de que la 5-metilcitosina no experimenta alquilación por ENU debido a la inaccesibilidad en la heterocromatina o como resultado de condiciones de reacción desfavorables con 5-metilcitosina en comparación con la citosina. Para probar la primera hipótesis, las ubicaciones de los sitios de mutación se compararon con los sitios hipersensibles a ADNasa I conocidos en las células CD34+ que fueron catalogadas por el Roadmap Epigenomics Project. Como se vio en Figura 12D, no se observó enriquecimiento en variantes de citosina en los sitios de hipersensibilidad a ADNasa I. Adicionalmente, no se observó enriquecimiento en variantes restringidas a citosinas en los sitios DH (Figura 12E). Adicionalmente, la mayoría de las variantes de timina aparecen cuando la adenina está presente antes que la timina. La anotación de características genómicas para las variantes no fue significativamente diferente de la anotación de esas características en el genoma (Figura 12F).
Ejemplo 4: Secuenciación de ADN de una célula individual masivamente paralela
Utilizando PTA, se establece un protocolo para la secuenciación de ADN masivamente paralela. Primero, se añade un código de barras celular al cebador aleatorio. Se emplean dos estrategias para minimizar cualquier sesgo en la amplificación introducido por el código de barras celular: 1) alargar el tamaño del cebador aleatorio y/o 2) crear un cebador que retroceda sobre sí mismo para evitar que el código de barras celular se una al molde (Figura 10B). Una vez que se establece la estrategia de cebador óptima, se aumentan a escala hasta 384 células clasificadas utilizando, p. ej., Manipulador de líquidos Mosquito HTS, que puede pipetear incluso líquidos viscosos hasta un volumen de 25 nL con alta precisión. Este manipulador de líquidos también reduce los costes de los reactivos aproximadamente 50 veces al utilizar una reacción de PTA de 1 pL en lugar del volumen de reacción convencional de 50 pL.
El protocolo de amplificación se convierte en gotitas mediante el suministro de un cebador con un código de barras celular a una gotita. Se utilizan opcionalmente soportes sólidos, tales como las cuentas que se han creado utilizando la estrategia de dividir y agrupar. Las cuentas adecuadas están disponibles, p. ej., de ChemGenes. En algunos casos, el oligonucleótido contiene un cebador aleatorio, un código de barras celular, un identificador molecular único y una secuencia escindible o espaciador para liberar el oligonucleótido después de que la cuenta y la célula estén encapsuladas en la misma gotita. Durante este procedimiento, se optimizan las concentraciones de molde, cebador, dNTP, alfa-tio-ddNTP y polimerasa para el bajo volumen de nanolitros en las gotitas. La optimización en algunos casos incluye el uso de gotitas más grandes para aumentar el volumen de reacción. Como se vio en Figura 9, este procedimiento requiere dos reacciones secuenciales para lisar las células, seguidas de WGA. La primera gotita, que contiene la célula lisada y la cuenta, se combina con una segunda gotita con la mezcla de amplificación. Alternativamente o de manera combinada, la célula se encapsula en una cuenta de hidrogel antes de la lisis y a continuación se pueden añadir ambas cuentas a una gotita de aceite. Véase Lan, F. et al., Nature Biotechnol., 2017, 35:640-646).
Los métodos adicionales incluyen el uso de micropocillos, que en algunos casos capturan 140000 células individuales en cámaras de reacción de 20 picolitros en un dispositivo que tiene el tamaño de un portaobjetos de microscopio de 7,62 cm x 5,08 cm (3" x 2"). De manera similar a los métodos basados en gotitas, estos pocillos combinan una célula con una cuenta que contiene un código de barras celular, lo que permite un procesamiento masivamente paralelo. Véase Gole et al., Nature Biotechnol., 2013, 31:1126-1132).
Ejemplo 5: Aplicación de PTA a la leucemia linfoblástica aguda (LLA) pediátrica
Se ha realizado la secuenciación del exoma de una sola célula de células de leucemia individuales que albergan una translocación ETV6-RUNX1, midiendo aproximadamente 200 mutaciones de codificación por célula, de las cuales solo 25 han estado presentes en suficientes células para ser detectadas con la secuenciación masiva convencional en ese paciente. La carga de mutación por célula se ha incorporado a continuación a otras características conocidas de este tipo de leucemia, tales como la tasa de mutación asociada a la replicación (1 mutación codificante/300 divisiones celulares), el tiempo desde el inicio hasta el diagnóstico (4,2 años) y el tamaño de la población en el momento del diagnóstico (100 mil millones de células) para crear una simulación in silico del desarrollo de la enfermedad. Se ha descubierto inesperadamente que incluso en lo que se pensaba que era un cáncer genéticamente simple tal como la LLA pediátrica, hay aproximadamente 330 millones de clones con distintos perfiles de mutación codificantes en el momento del diagnóstico en ese paciente. Curiosamente, como se observa en la Figura 6B, solo se detectan los clones uno a cinco más abundantes (recuadro C) con la secuenciación masiva convencional; hay decenas de millones de clones que se componen de un pequeño número de células y, por lo tanto, es menos probable que sean clínicamente significativos (recuadro A). En este sentido, se proporcionan métodos para aumentar la sensibilidad de detección de forma que se puedan detectar clones que supongan al menos 0,01% (1:10.000) de las células (recuadro B), ya que es el estrato en el que se supone que reside la enfermedad más resistente que provoca la recaída.
Dada una diversidad genética de población tan masiva, se ha planteado la hipótesis de que existen clones que son más resistentes al tratamiento dentro de un paciente determinado. Para probar esa hipótesis, la muestra se coloca en cultivo y las células de leucemia se exponen a concentraciones crecientes de fármacos de quimioterapia contra LLA convencionales. Como se observa en Figura 7, en las muestras de control y aquellas que recibieron la dosis más baja de asparraginasa, el clon que albergaba una mutación KRAS activadora continuó expandiéndose. Sin embargo, ese clon demostró ser más sensible a la prednisolona y a la daunorrubicina, mientras que otros clones previamente indetectables podrían detectarse con mayor claridad después del tratamiento con esos fármacos (Figura 7, recuadro de línea discontinua). Este enfoque también empleó la secuenciación masiva de las muestras tratadas. El uso de la secuenciación del ADN de una célula individual en algunos casos permite determinar la diversidad y los clonotipos de las poblaciones en expansión.
Creación de un catálogo de las sensibilidades a fármacos de clonotipos de LLA
Como se muestra en Figura 8, para hacer un catálogo de las sensibilidades a fármacos de los clonotipos de LLA, se toma una alícuota de la muestra de diagnóstico y se realiza la secuenciación de células individuales de 10.000 células para determinar la abundancia de cada clonotipo. Paralelamente, las células leucémicas diagnósticas se exponen a fármacos convencionales contra LLA (vincristina, daunorrubicina, mercaptopurina, prednisolona y asparraginasa), así como a un grupo de fármacos dirigidos (ibrutinib, dasatanib y ruxolitinib) in vitro. Se seleccionan células vivas y se realiza la secuenciación del ADN de una célula individual en al menos 2.500 células por exposición al fármaco. Finalmente, las muestras de médula ósea de los mismos pacientes después de que hayan completado 6 semanas de tratamiento se clasifican para detectar leucemia y preleucemia residual viva, utilizando protocolos establecidos para los estudios de secuenciación masiva. A continuación, la PTA se utiliza para realizar la secuenciación del ADN de una célula individual de decenas de miles de células de una manera ampliable a escala, eficiente y rentable, lo que logra los siguientes objetivos.
De los clonotipos a un catálogo de sensibilidad de fármacos de sensibilidades a fármacos
Una vez que se adquieren los datos de secuenciación, se establecen los clonotipos de cada célula. Para lograr esto, se detectan las variantes y se determinan los clonotipos. Al utilizar PTA, el sesgo de cobertura y deserción alélica introducido durante los métodos de WGA utilizados actualmente es limitado. Se realizó una comparación sistemática de herramientas para detectar variantes de células individuales que se sometieron a MDA, y se encontró que la herramienta Monovar recientemente desarrollada tiene la mayor sensibilidad y especificidad (Zafar et al., Nature Methods, 2016, 13:505-507). Una vez que se han realizado las detecciones de variantes, se determina si dos células tienen el mismo clonotipo, a pesar de que faltan algunas detecciones de variantes debido a la deserción alélica. Para lograr esto, se puede utilizar un modelo mixto de distribuciones multivariadas de Bernoulli (Gawad et al., Proc. Natl. Acad. Sci. USA, 2014, 111 (50):17947-52). Después de establecer que las células tienen el mismo clonotipo, se determina qué variantes incluir en el catálogo. Se incluyen los genes que cumplen cualquiera de los siguientes criterios: 1) son variantes no sinónimas detectadas en cualquiera de los puntos críticos mutacionales o variantes de pérdida de función (desplazamiento de marco, sin sentido, empalme) que ocurren en un gen supresor de tumores conocido identificado en los grandes proyectos de secuenciación del genoma del cáncer pediátrico; 2) son variantes que se detectan de forma recurrente en muestras de cáncer en recaída; y 3) son variantes recurrentes que experimentan selección positiva en los estudios actuales de secuenciación masiva de enfermedad residual, ya que los pacientes con LLA se someten a 6 semanas de tratamiento. Si los clones no tienen al menos dos variantes que cumplan con estos criterios, no se incluyen en el catálogo. A medida que se identifican más genes asociados con la resistencia al tratamiento o la recurrencia de la enfermedad, los clones pueden "rescatarse" e incluirse en el catálogo. Para determinar si un clonotipo experimentó una selección positiva o negativa entre el control y el tratamiento farmacológico, se utiliza la prueba exacta de Fisher para identificar clones que son significativamente diferentes del control. Los clones solo se añadirán al catálogo cuando se demuestre que al menos dos combinaciones concordantes de mutaciones tienen la misma correlación con la exposición a un fármaco específico. Las mutaciones activadoras conocidas en oncogenes o las mutaciones de pérdida de función en supresores de tumores en el mismo gen se considerarán equivalentes entre clones. Si los clonotipos no son exactamente concordantes, las mutaciones en común se incluirán en el catálogo. Por ejemplo, si el clonotipo 1 es A+B+C y el clonotipo 2 es B+C+D, el clonotipo B+C se ingresará en el catálogo. Si se identifican genes que mutan recurrentemente en células resistentes con un número limitado de mutaciones concurrentes, esos clones pueden compilarse en clonotipos funcionalmente equivalentes.
Ejemplo 6: Método de PTA
El método de PTA se realiza utilizando los métodos generales del Ejemplo 1, con modificación. En un caso, los terminadores se reemplazan con dNTP convencionales y se utilizan aditivos para retardar la extensión durante la amplificación. En otro caso, los terminadores se reemplazan con dNTP convencionales y la polimerasa de desplazamiento de cadena se modifica para disminuir su tasa de extensión. En otro caso, los terminadores se reemplazan con dNTP que se incorporan más lentamente durante la extensión que los nucleótidos convencionales, o que dan como resultado una reacción de extensión más lenta después de la incorporación que a partir de un molde que comprende nucleótidos convencionales. Tales dNTP de incorporación lenta en algunos casos son resistentes a las nucleasas.
Ejemplo 7: Método de horquilla o bucle con terminadores
Opcionalmente, se lisa una muestra (tal como una célula individual) y el ADN del molde de muestra ("molécula de ácido nucleico diana) se somete a cebado cuasi aleatorio y amplificación lineal. Se utiliza una mezcla de terminadores y dNTP durante la etapa de cebado cuasi aleatorio. Los cebadores están diseñados para generar estructuras en horquilla o en bucle, que son moldes menos eficientes para una mayor amplificación que el ADN del molde de la muestra original. Esto da como resultado una mayor proporción de amplicones que se originan a partir del molde de la muestra original. A continuación, la biblioteca de amplicones se amplifica adicionalmente con una etapa de amplificación exponencial para generar una biblioteca para la secuenciación. En algunos casos, la lisis, la amplificación lineal y la amplificación exponencial ocurren en el mismo recipiente. Alternativamente o de manera combinada, se utilizan terminadores en la etapa de amplificación exponencial. En algunos casos, los dNTP convencionales se utilizan durante la amplificación lineal, y los terminadores se utilizan durante las etapas de amplificación exponencial. El uso de terminadores da como resultado una disminución en la amplificación del molde no original en comparación con los nucleótidos no terminadores.
Ejemplo 8: Amplificación mediante recombinasa y polimerasa (RPA) con terminadores
Opcionalmente, se lisa una muestra (tal como una célula individual), y el ADN molde de la muestra se somete a una mezcla de reacción de RPA (para un procedimiento ilustrativo, Daher et al., Clin. Chem. 2016, 62(7), 947-958) que comprende una recombinasa, una proteína de unión a ADN de hebra sencilla, cebadores, una polimerasa y una mezcla de terminadores y dNTP. Por ejemplo, la recombinasa es RecA y la proteína de unión a ADN de hebra sencilla es SSB. En algunos casos, la recombinasa es UvsX de T4 y la proteína de unión al ADN de hebra sencilla es gp32 de T4. Diversas polimerasas incluyen, pero no se limitan a, polimerasa Sau o polimerasa Bsu. En algunos casos, se añaden a la mezcla de reacción agentes adicionales tales como polietilenglicol o Carbowax20M. En algunos casos, se añade una transcriptasa inversa para amplificar los moldes de muestras de ARN. En algunos casos, se utilizan cebadores total o parcialmente aleatorizados. Los amplicones generados por RPA se someten opcionalmente a etapas adicionales, tales como ligación a adaptadores, amplificación exponencial, secuenciación o cualquier combinación de las mismas. El uso de terminadores da como resultado una disminución en la amplificación del molde no original en comparación con los nucleótidos no terminadores.
Ejemplo 9: Amplificación dependiente de helicasa (HDA) con terminadores
Opcionalmente, se lisa una muestra (tal como una célula individual), y el ADN molde de la muestra se somete a una mezcla de reacción de HDA (para un procedimiento ilustrativo, Yang et al., Chembiochem 2015, 16(9), 1365-1370) que comprende una helicasa, una polimerasa y una mezcla de terminadores y dNTP. Por ejemplo, la polimerasa es Bst2.0, GspM, GspM2.0, GspSSD u otra polimerasa) y la helicasa es una helicasa termófila, Tte-UvrD u otra helicasa. En algunos casos, se añade una proteína de unión a ADN de hebra sencilla adicional. En algunos casos, se añade una transcriptasa inversa para amplificar los moldes de muestras de ARN. En algunos casos, se utilizan cebadores total o parcialmente aleatorizados. Los amplicones generados por HDA se someten opcionalmente a etapas adicionales, tales como ligación a adaptadores, amplificación exponencial, secuenciación o cualquier combinación de las mismas. El uso de terminadores da como resultado una disminución en la amplificación del molde no original en comparación con los nucleótidos no terminadores.
Si bien aquí se han mostrado y descrito en el presente documento realizaciones preferidas de la presente invención, será obvio para los expertos en la técnica que tales realizaciones se proporcionan únicamente a modo de ejemplo. A los expertos en la técnica se les ocurrirán ahora numerosas variaciones, cambios y sustituciones. Las siguientes reivindicaciones definen el alcance de la invención.

Claims (14)

REIVINDICACIONES
1. Una composición que comprende:
una polimerasa que comprende actividad exonucleasa 3'-5',
al menos una molécula de ácido nucleico diana que es un ADN genómico, y
una biblioteca de amplicones,
en donde la biblioteca de amplicones comprende al menos 100 polinucleótidos obtenidos de la amplificación de al menos una molécula de ácido nucleico diana, en donde al menos algunos de los polinucleótidos comprenden un nucleótido terminador,
en donde el nucleótido terminador es un terminador irreversible y seleccionado entre nucleótidos con modificación en el grupo alfa, nucleótidos espaciadores C3, ácidos nucleicos bloqueados (LNA), ácidos nucleicos invertidos, nucleótidos fluorados en 2’, nucleótidos fosforilados en 3’, nucleótidos modificados 2'-O-metilo y ácidos nucleicos trans, y
en donde al menos 5% de los polinucleótidos son copias directas de la al menos una molécula de ácido nucleico diana.
2. La composición de la reivindicación 1, en donde al menos 10% de los polinucleótidos son copias directas de la al menos una molécula de ácido nucleico diana.
3. La composición de la reivindicación 1 o la reivindicación 2, en donde la razón de amplicones de copia directa con respecto a moléculas de ácido nucleico diana es de al menos 10:1.
4. La composición de la reivindicación 1, en donde 5-50% de los polinucleótidos son copias directas de la al menos una molécula de ácido nucleico diana.
5. La composición de una cualquiera de las reivindicaciones 1 -4, en donde no más de 50% de una fracción acumulativa de polinucleótidos comprende secuencias de al menos 80% de una fracción acumulativa de secuencias de la al menos una molécula de ácido nucleico diana.
6. La composición de una cualquiera de las reivindicaciones 1-5, en donde la pluralidad de polinucleótidos tiene una longitud de entre aproximadamente 50 y aproximadamente 2.000 nucleótidos.
7. La composición de una cualquiera de las reivindicaciones 1 -6, en donde el número de polinucleótidos es 100-5.000.
8. La composición de una cualquiera de las reivindicaciones 1 -7, en donde el número de polinucleótidos es al menos 1.000.
9. La composición de una cualquiera de las reivindicaciones 1 -8, en donde la pluralidad de polinucleótidos comprende secuencias al menos parcialmente representativas de un genoma.
10. La composición de una cualquiera de las reivindicaciones 1-9, en donde al menos 90% de los polinucleótidos comprenden un nucleótido terminador.
11. La composición de una cualquiera de las reivindicaciones 1 -10, en donde el nucleótido terminador está anclado al extremo 3' de los al menos algunos polinucleótidos.
12. La composición de una cualquiera de las reivindicaciones 1-11, en donde los nucleótidos terminadores con modificación del grupo alfa son alfa-tio didesoxinucleótidos.
13. La composición de una cualquiera de las reivindicaciones 1-12, en donde el nucleótido terminador comprende modificaciones del grupo r del carbono 3' de la desoxirribosa.
14. La composición de una cualquiera de las reivindicaciones 1-13, en donde los nucleótidos terminadores se seleccionan del grupo que consiste en didesoxinucleótidos, didesoxinucleótidos invertidos, nucleótidos biotinilados en 3', nucleótidos con amino en 3', nucleótidos fosforilados en 3', nucleótidos con 3'-O-metilo, nucleótidos espaciadores de carbono 3' que incluyen nucleótidos espaciadores C3 en 3', nucleótidos C18 en 3', nucleótidos espaciadores de Hexanodiol en 3', aciclonucleótidos y combinaciones de los mismos.
ES19743724T 2018-01-29 2019-01-28 Método para la amplificación de ácidos nucleicos Active ES2937927T3 (es)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US201862623471P 2018-01-29 2018-01-29
PCT/US2019/015452 WO2019148119A1 (en) 2018-01-29 2019-01-28 Method for nucleic acid amplification

Publications (1)

Publication Number Publication Date
ES2937927T3 true ES2937927T3 (es) 2023-04-03

Family

ID=67396233

Family Applications (1)

Application Number Title Priority Date Filing Date
ES19743724T Active ES2937927T3 (es) 2018-01-29 2019-01-28 Método para la amplificación de ácidos nucleicos

Country Status (14)

Country Link
US (3) US11905553B2 (es)
EP (2) EP4183886B1 (es)
JP (1) JP7457434B2 (es)
KR (1) KR102653725B1 (es)
CN (1) CN112041459A (es)
AU (2) AU2019212953B2 (es)
CA (1) CA3089756A1 (es)
DK (2) DK3746564T3 (es)
EA (1) EA202091673A1 (es)
ES (1) ES2937927T3 (es)
IL (1) IL276343B1 (es)
PL (1) PL3746564T3 (es)
SG (1) SG11202007225TA (es)
WO (1) WO2019148119A1 (es)

Families Citing this family (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2019148119A1 (en) 2018-01-29 2019-08-01 St. Jude Children's Research Hospital, Inc. Method for nucleic acid amplification
CN114466935A (zh) * 2019-07-31 2022-05-10 铂赛基因组学公司 基因突变分析
US11795450B2 (en) * 2019-09-06 2023-10-24 Microsoft Technology Licensing, Llc Array-based enzymatic oligonucleotide synthesis
CN112831543B (zh) * 2019-11-25 2023-08-29 中国科学院青岛生物能源与过程研究所 单细胞全基因组扩增试剂盒及其应用
EP4103745A4 (en) * 2020-02-10 2024-03-13 Bioskryb Genomics Inc PHI29 MUTANTS AND USE THEREOF
CA3177586A1 (en) * 2020-05-07 2021-11-11 Charles GAWAD Detection of low abundance nucleic acids
US11702683B2 (en) 2020-05-28 2023-07-18 Microsoft Technology Licensing, Llc De novo polynucleotide synthesis with substrate-bound polymerase
GB202111194D0 (en) 2021-08-03 2021-09-15 Cergentis B V Method
WO2023107453A1 (en) * 2021-12-06 2023-06-15 Chan Zuckerberg Biohub, Inc. Method for combined genome methylation and variation analyses
WO2023215524A2 (en) * 2022-05-05 2023-11-09 BioSkryb Genomics, Inc. Primary template-directed amplification and methods thereof
WO2024049276A1 (ko) * 2022-09-01 2024-03-07 주식회사 키오믹스 다중 표적 dna의 선택적 증폭용 조성물 및 이를 이용한 증폭 방법
CN117343999B (zh) * 2023-12-05 2024-03-01 上海锐赛循益生物技术有限公司 基于左侧探针退火和右侧探针退火延伸的核酸扩增方法

Family Cites Families (77)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5001050A (en) 1989-03-24 1991-03-19 Consejo Superior Investigaciones Cientificas PHφ29 DNA polymerase
US5198543A (en) 1989-03-24 1993-03-30 Consejo Superior Investigaciones Cientificas PHI29 DNA polymerase
DE69638321D1 (de) 1995-10-11 2011-03-03 Luminex Corp Gleichzeitige mehrfachanalyse klinischer proben
US6511803B1 (en) 1997-10-10 2003-01-28 President And Fellows Of Harvard College Replica amplification of nucleic acid arrays
JP2001519538A (ja) 1997-10-10 2001-10-23 プレジデント・アンド・フェローズ・オブ・ハーバード・カレッジ 核酸アレイのレプリカ増幅
US6485944B1 (en) 1997-10-10 2002-11-26 President And Fellows Of Harvard College Replica amplification of nucleic acid arrays
EP0965044B1 (en) 1997-11-18 2003-03-19 Bio-Rad Laboratories, Inc. Multiplex flow immunoassays with magnetic particles as solid phase
WO1999058724A1 (en) * 1998-05-08 1999-11-18 Life Technologies, Inc. A method for synthesizing a nucleic acid molecule using a ribonuclease
US6565727B1 (en) 1999-01-25 2003-05-20 Nanolytics, Inc. Actuators for microfluidics without moving parts
US6294063B1 (en) 1999-02-12 2001-09-25 Board Of Regents, The University Of Texas System Method and apparatus for programmable fluidic processing
EP1204869B1 (en) 1999-08-17 2008-10-22 Luminex Corporation Method for analyzing a number of samples from a variety of sources for a single analyte
EP1208382B1 (en) 1999-08-17 2006-04-26 Luminex Corporation Encapsulation of fluorescent particles
BR0014182A (pt) * 1999-09-13 2002-05-21 Nugen Technologies Inc Processos e composições para amplificação isotérmica linear de sequências polinucleotìdicas
US8529743B2 (en) 2000-07-25 2013-09-10 The Regents Of The University Of California Electrowetting-driven micropumping
US6773566B2 (en) 2000-08-31 2004-08-10 Nanolytics, Inc. Electrostatic actuators for microfluidics and methods for using same
GB0102568D0 (en) 2001-02-01 2001-03-21 Magnetic Biosolutions Sweden A Method
JP3967319B2 (ja) * 2001-06-27 2007-08-29 エフ.ホフマン−ラ ロシュ アーゲー ポリヌクレオチド配列のインビトロ組換えのためのウォークスルー技術
US6977148B2 (en) 2001-10-15 2005-12-20 Qiagen Gmbh Multiple displacement amplification
WO2003045556A2 (en) 2001-11-26 2003-06-05 Keck Graduate Institute Method, apparatus and article for microfluidic control via electrowetting, for chemical, biochemical and biological assays and the like
WO2004034013A2 (en) 2002-05-06 2004-04-22 Colorado State University Research Foundation Genotoxicity analysis
FR2841063B1 (fr) 2002-06-18 2004-09-17 Commissariat Energie Atomique Dispositif de deplacement de petits volumes de liquide le long d'un micro-catenaire par des forces electrostatiques
US6911132B2 (en) 2002-09-24 2005-06-28 Duke University Apparatus for manipulating droplets by electrowetting-based techniques
US7547380B2 (en) 2003-01-13 2009-06-16 North Carolina State University Droplet transportation devices and methods having a fluid surface
ATE434131T1 (de) 2003-11-17 2009-07-15 Koninkl Philips Electronics Nv System zur handhabung einer fluidmenge
GB0400584D0 (en) 2004-01-12 2004-02-11 Solexa Ltd Nucleic acid chacterisation
CN1910440A (zh) 2004-01-14 2007-02-07 卢米尼克斯股份有限公司 用于动态范围扩展的方法和系统
US20060141487A1 (en) 2004-01-26 2006-06-29 Applera Corporation Methods, compositions, and kits for amplifying and sequencing polynucleotides
FR2866493B1 (fr) 2004-02-16 2010-08-20 Commissariat Energie Atomique Dispositif de controle du deplacement d'une goutte entre deux ou plusieurs substrats solides
WO2005082098A2 (en) 2004-02-27 2005-09-09 President And Fellows Of Harvard College Polony fluorescent in situ sequencing beads
FR2872715B1 (fr) 2004-07-08 2006-11-17 Commissariat Energie Atomique Microreacteur goutte
FR2872809B1 (fr) 2004-07-09 2006-09-15 Commissariat Energie Atomique Methode d'adressage d'electrodes
WO2006073504A2 (en) 2004-08-04 2006-07-13 President And Fellows Of Harvard College Wobble sequencing
JP2006058031A (ja) 2004-08-17 2006-03-02 Hitachi High-Technologies Corp 化学分析装置
JP5042859B2 (ja) 2005-01-20 2012-10-03 ルミネックス コーポレーション 蛍光ベースの応用で使用される磁性ミクロスフェア
US7458661B2 (en) 2005-01-25 2008-12-02 The Regents Of The University Of California Method and apparatus for promoting the complete transfer of liquid drops from a nozzle
DK1859330T3 (da) 2005-01-28 2012-10-15 Univ Duke Apparater og fremgangsmåder til håndtering af små dråber på et trykt kredsløbskort
US9040237B2 (en) * 2005-03-04 2015-05-26 Intel Corporation Sensor arrays and nucleic acid sequencing applications
US20070023292A1 (en) 2005-07-26 2007-02-01 The Regents Of The University Of California Small object moving on printed circuit board
WO2007030759A2 (en) 2005-09-07 2007-03-15 Nugen Technologies, Inc. Improved nucleic acid amplification procedure
EP4071458A1 (en) 2005-09-21 2022-10-12 Luminex Corporation Methods and systems for image data processing
CA2624634A1 (en) * 2005-10-03 2007-04-12 Applera Corporation Compositions, methods, and kits for amplifying nucleic acids
WO2007120208A2 (en) 2005-11-14 2007-10-25 President And Fellows Of Harvard College Nanogrid rolling circle dna sequencing
US20070207513A1 (en) 2006-03-03 2007-09-06 Luminex Corporation Methods, Products, and Kits for Identifying an Analyte in a Sample
US7901947B2 (en) 2006-04-18 2011-03-08 Advanced Liquid Logic, Inc. Droplet-based particle sorting
EP2016091B1 (en) 2006-04-18 2010-12-08 Advanced Liquid Logic, Inc. Droplet-based biochemistry
CN101490562B (zh) 2006-07-10 2012-12-19 株式会社日立高新技术 液体输送设备
US9266076B2 (en) 2006-11-02 2016-02-23 The Regents Of The University Of California Method and apparatus for real-time feedback control of electrical manipulation of droplets on chip
US20080242560A1 (en) 2006-11-21 2008-10-02 Gunderson Kevin L Methods for generating amplified nucleic acid arrays
US7893227B2 (en) * 2006-12-05 2011-02-22 Lasergen, Inc. 3′-OH unblocked nucleotides and nucleosides base modified with non-cleavable, terminating groups and methods for their use in DNA sequencing
US7897737B2 (en) * 2006-12-05 2011-03-01 Lasergen, Inc. 3′-OH unblocked, nucleotides and nucleosides, base modified with photocleavable, terminating groups and methods for their use in DNA sequencing
CN102851369B (zh) 2006-12-13 2015-01-21 卢米耐克斯公司 用于实时pcr多重分析的系统和方法
WO2008093098A2 (en) 2007-02-02 2008-08-07 Illumina Cambridge Limited Methods for indexing samples and sequencing multiple nucleotide templates
US20080269068A1 (en) 2007-02-06 2008-10-30 President And Fellows Of Harvard College Multiplex decoding of sequence tags in barcodes
JP5156762B2 (ja) 2007-02-09 2013-03-06 アドヴァンスト リキッド ロジック インコーポレイテッド 液滴アクチュエータデバイスおよび磁性ビーズを使用する方法
WO2008116221A1 (en) 2007-03-22 2008-09-25 Advanced Liquid Logic, Inc. Bead sorting on a droplet actuator
US20100130369A1 (en) 2007-04-23 2010-05-27 Advanced Liquid Logic, Inc. Bead-Based Multiplexed Analytical Methods and Instrumentation
CN101679932A (zh) 2007-06-27 2010-03-24 数字化生物系统 用于热交换化学过程的基于数字微流体的装置
US8093064B2 (en) 2008-05-15 2012-01-10 The Regents Of The University Of California Method for using magnetic particles in droplet microfluidics
US20110319298A1 (en) * 2009-04-21 2011-12-29 Benner Steven A Differential detection of single nucleotide polymorphisms
US20100330556A1 (en) 2009-06-30 2010-12-30 Brian Jon Peter Genome analysis using a nicking endonuclease
WO2011038241A1 (en) * 2009-09-25 2011-03-31 President And Fellows Of Harvard College Nucleic acid amplification and sequencing by synthesis with fluorogenic nucleotides
WO2011050000A2 (en) * 2009-10-20 2011-04-28 The Regents Of The University Of California Single molecule nucleic acid nanoparticles
US8835358B2 (en) 2009-12-15 2014-09-16 Cellular Research, Inc. Digital counting of individual molecules by stochastic attachment of diverse labels
ES2731460T3 (es) 2010-10-08 2019-11-15 Harvard College Alto rendimiento de células individuales con código de barra
GB201106254D0 (en) 2011-04-13 2011-05-25 Frisen Jonas Method and product
WO2012142213A2 (en) 2011-04-15 2012-10-18 The Johns Hopkins University Safe sequencing system
AU2012253271A1 (en) 2011-05-12 2014-01-09 Netbio, Inc. Methods and compositions for rapid multiplex amplification of STR loci
US20130309676A1 (en) 2012-05-18 2013-11-21 Alfred E. Mann Foundation For Scientific Research Biased n-mers identification methods, probes and systems for target amplification and detection
CN109082462B (zh) * 2012-05-21 2022-10-28 斯克利普斯研究所 样品制备方法
US8895249B2 (en) * 2012-06-15 2014-11-25 Illumina, Inc. Kinetic exclusion amplification of nucleic acid libraries
ES2873850T3 (es) 2013-08-19 2021-11-04 Abbott Molecular Inc Bibliotecas de secuenciación de próxima generación
EP3110975B1 (en) 2014-02-27 2021-07-07 Jumpcode Genomics, Inc. Methods for analysis of somatic mobile elements, and uses thereof
US20150353989A1 (en) 2014-06-09 2015-12-10 Illumina Cambridge Limited Sample preparation for nucleic acid amplification
US10450562B2 (en) 2014-09-09 2019-10-22 Igenomx International Genomics Corporation Methods and compositions for rapid nucleic acid library preparation
EP3227464B1 (en) 2014-12-05 2022-04-20 Foundation Medicine, Inc. Multigene analysis of tumor samples
EP3465502B1 (en) 2016-05-26 2024-04-10 Becton, Dickinson and Company Molecular label counting adjustment methods
WO2019148119A1 (en) 2018-01-29 2019-08-01 St. Jude Children's Research Hospital, Inc. Method for nucleic acid amplification

Also Published As

Publication number Publication date
EP3746564B1 (en) 2023-01-04
PL3746564T3 (pl) 2023-05-22
US20200362394A1 (en) 2020-11-19
US20230022451A1 (en) 2023-01-26
US11905553B2 (en) 2024-02-20
US20240035080A1 (en) 2024-02-01
AU2019212953B2 (en) 2023-02-02
IL276343B1 (en) 2024-06-01
WO2019148119A1 (en) 2019-08-01
AU2023202656A1 (en) 2023-05-18
CN112041459A (zh) 2020-12-04
DK4183886T3 (da) 2024-06-03
JP2021511794A (ja) 2021-05-13
JP7457434B2 (ja) 2024-03-28
EP3746564A1 (en) 2020-12-09
EP3746564A4 (en) 2021-10-27
KR102653725B1 (ko) 2024-04-01
KR20200138183A (ko) 2020-12-09
IL276343A (en) 2020-09-30
SG11202007225TA (en) 2020-08-28
US11643682B2 (en) 2023-05-09
EP4183886B1 (en) 2024-04-17
DK3746564T3 (da) 2023-01-30
EP4183886A1 (en) 2023-05-24
CA3089756A1 (en) 2019-08-01
EA202091673A1 (ru) 2021-02-03
AU2019212953A1 (en) 2020-08-27

Similar Documents

Publication Publication Date Title
ES2937927T3 (es) Método para la amplificación de ácidos nucleicos
ES2959047T3 (es) Bibliotecas de genoma completo de célula individual para la secuenciación de metilación
US20220033890A1 (en) Method for highly sensitive dna methylation analysis
ES2788948T3 (es) Preparación de muestras para la amplificación de ácidos nucleicos
US20230220377A1 (en) Single cell analysis
EP4119679A1 (en) Polynucleotide adapter design for reduced bias
US20220277805A1 (en) Genetic mutational analysis
US20230095295A1 (en) Phi29 mutants and use thereof
WO2024073510A2 (en) Methods and compositions for fixed sample analysis