ES2626058T3 - Cebadores y métodos de amplificación - Google Patents

Cebadores y métodos de amplificación Download PDF

Info

Publication number
ES2626058T3
ES2626058T3 ES12859854.7T ES12859854T ES2626058T3 ES 2626058 T3 ES2626058 T3 ES 2626058T3 ES 12859854 T ES12859854 T ES 12859854T ES 2626058 T3 ES2626058 T3 ES 2626058T3
Authority
ES
Spain
Prior art keywords
sequences
sequence
mixed population
primers
sequencing
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
ES12859854.7T
Other languages
English (en)
Inventor
Phillip N. GRAY
Mark W. Eshoo
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ibis Biosciences Inc
Original Assignee
Ibis Biosciences Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ibis Biosciences Inc filed Critical Ibis Biosciences Inc
Application granted granted Critical
Publication of ES2626058T3 publication Critical patent/ES2626058T3/es
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/10Processes for the isolation, preparation or purification of DNA or RNA
    • C12N15/1096Processes for the isolation, preparation or purification of DNA or RNA cDNA Synthesis; Subtracted cDNA library construction, e.g. RT, RT-PCR
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P19/00Preparation of compounds containing saccharide radicals
    • C12P19/26Preparation of nitrogen-containing carbohydrates
    • C12P19/28N-glycosides
    • C12P19/30Nucleotides
    • C12P19/34Polynucleotides, e.g. nucleic acids, oligoribonucleotides
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6844Nucleic acid amplification reactions
    • C12Q1/6853Nucleic acid amplification reactions using modified primers or templates
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6844Nucleic acid amplification reactions
    • C12Q1/6853Nucleic acid amplification reactions using modified primers or templates
    • C12Q1/6855Ligating adaptors

Landscapes

  • Chemical & Material Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Organic Chemistry (AREA)
  • Engineering & Computer Science (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Genetics & Genomics (AREA)
  • General Engineering & Computer Science (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Biotechnology (AREA)
  • Molecular Biology (AREA)
  • Biochemistry (AREA)
  • General Health & Medical Sciences (AREA)
  • Microbiology (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Physics & Mathematics (AREA)
  • Biophysics (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • Biomedical Technology (AREA)
  • Analytical Chemistry (AREA)
  • Immunology (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Crystallography & Structural Chemistry (AREA)
  • Plant Pathology (AREA)
  • General Chemical & Material Sciences (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)

Abstract

Un procedimiento para generar ácido nucleico amplificado a partir de ARN que comprende: a) exponer una secuencia molde de ARN a un conjunto de cebadores en condiciones de transcripción inversa, de tal manera que se genere una población mixta de las primeras cadenas de ADNc, en la que dicho conjunto de cebadores comprende cebadores individuales, comprendiendo cada uno: i) un sitio de secuencia de restricción en 5', (ii) una secuencia hexamérica aleatoria en 3' y (iii) una secuencia de código de barras localizada entre el sitio de secuencia de restricción en 5' y la secuencia hexamérica aleatoria en 3', en la que dicho sitio de secuencia de restricción en cada uno de dichos cebadores individuales es idéntico y en la que dicho conjunto de cebadores comprende todas o casi todas las posibles secuencias hexaméricas aleatorias y en la que cada uno de dichas primeras cadenas de ADNc tiene uno de dichos cebadores individuales en su extremo 5'; b) exponer dicha población mixta de las primeras cadenas de ADNc a dicho conjunto de cebadores en condiciones de polimerización, de tal manera que se genera una población mixta de moléculas de ADNc de doble cadena, c) digerir dicha población mixta de moléculas de ADNc de doble cadena con una enzima de restricción específica de dicho sitio de secuencia de restricción en 5', d) tratar dicha población mixta de moléculas de ADNc de doble cadena con un agente de unión, de tal manera que las moléculas individuales de ADNc de doble cadena se ligan entre sí para formar una población mixta de concatémeros; e) exponer dicha población mixta de concatémeros a cebadores aleatorios en condiciones de amplificación del genoma completo de tal manera que se genere ácido nucleico amplificado; f) digerir, al menos parcialmente, dicho ácido nucleico amplificado con la misma enzima de restricción específica de dicho sitio de secuencia de restricción en 5', generando de este modo una pluralidad de secuencias digeridas; y g) ligar las secuencias adaptadoras de la secuenciación a los extremos de dicha pluralidad de secuencias digeridas para generar una población mixta de moldes de secuenciación ligados al adaptador, en los que dichas secuencias adaptadoras de la secuenciación contienen un sitio de enzima de restricción que es idéntico al sitio de secuencia de restricción en 5' en el conjunto de cebadores.

Description

5
10
15
20
25
30
35
40
45
50
55
60
65
Cebadores y metodos de amplificacion
DESCRIPCION
Campo de la invencion
La presente invencion se refiere a procedimientos para realizar la amplificacion (por ejemplo, amplificacion del genoma completo) empleando cebadores que tienen un sitio de restriccion en 5', una secuencia aleatoria en 3' (por ejemplo, un hexamero aleatorio) y una secuencia de codigo de barras identifiable.
Antecedentes
En muchos campos de investigacion, tales como diagnostico genetico, investigacion del cancer o medicina forense, la escasez de ADN genomico puede ser un factor muy limitante del tipo y la cantidad de pruebas geneticas que se pueden realizar en una muestra. Un enfoque disenado para superar este problema es la amplificacion del genoma completo. El objetivo es amplificar una muestra limitada de aDn de una manera no espedfica para generar una nueva muestra que sea indistinguible del original pero con una concentracion de ADN mas alta. El objetivo de una tecnica tfpica de amplificacion del genoma completo es amplificar una muestra hasta un nivel de microgramos respetando la representacion de la secuencia original.
Los primeros procedimientos de amplificacion del genoma completo se describieron en 1992 y se basaron en los principios de la reaccion en cadena de la polimerasa. Zhang y col. (Zhang, L., y col., Proc. Natl. Acad. Sci. USA, 1992, 89: 5847-5851) Desarrollaron la tecnica de PCR de extension por cebadores (PEP) y Telenius y col., (Telenius y col., Genomics. 1992, 13(3):718-25) disenaron el procedimiento de PCR cebado con oligonucleotidos degenerados (DOP-PCR). La PEP implica un numero alto de ciclos de PCR, generalmente usando Taq polimerasa y cebadores aleatorios de 15 bases que hibridan a una temperatura de rigurosidad baja. La DOP-PCR es un procedimiento que generalmente usa Taq polimerasa y oligonucleotidos semidegenerados que se unen a una temperatura de hibridacion baja a aproximadamente un millon de sitios dentro del genoma humano. A los primeros ciclos les sigue un gran numero de ciclos con una temperatura de hibridacion mas alta, lo que permite solamente la amplificacion de los fragmentos que se marcaron en la primera etapa.
La amplificacion de desplazamiento multiple (MDA, tambien conocida como amplificacion por desplazamiento de cadena, SDA) es un procedimiento isotermico no basado en PCR fundamentado en la hibridacion de hexameros aleatorios al ADN desnaturalizado, seguido de una smtesis por desplazamiento de cadena a temperatura constante (Blanco y col., 1989, J. Biol. Chem. 264:8935-40; Dean, F.B. y col., (2002) Comprehensive human genome amplification using multiple displacement amplification; Proc. Natl. Acad. Sci. USA 99.5261; y Van, J. y col., (2004) Assessment of multiple displacement amplification in molecular epidemiology. Biotechniques 37, 136). Se ha aplicado a muestras pequenas de ADN genomico, dando lugar a la smtesis de ADN de peso molecular alto con una desviacion de la representacion de secuencia limitada (Lizardi y col., Nature Genetics 1998, 19, 225-232; Dean y col., Proc. Natl. Acad. Sci. U.S.A. 2002, 99, 5261-5266). A medida que el ADN se sintetiza mediante desplazamiento de cadena, se produce un numero gradualmente creciente de acontecimientos de cebado, formando una red de estructuras de ADN hiperramificadas. La reaccion puede ser catalizada mediante la ADN polimerasa de Phi29 o mediante el fragmento grande de la Bst ADN polimerasa. La ADN polimerasa de Phi29 posee una actividad de correccion que da como resultado tasas de error 100 veces mas bajas que la Taq polimerasa. Sin embargo, los procedimientos de tipo MDA requieren muchas horas (por ejemplo, 6 horas) para generar una amplificacion suficiente.
El documento WO 2011/151777 (Tullo y col.,) se refiere a un procedimiento para preparar y amplificar bibliotecas de ADNc representativas para secuenciacion de alto rendimiento de proxima generacion y a kits y cartuchos para kits de automatizacion que utilizan el procedimiento.
Sumario de la invencion
La invencion proporciona un procedimiento para generar acido nucleico amplificado a partir de ARN que comprende: a) exponer una secuencia molde de ARN a un conjunto de cebadores en condiciones de transcripcion inversa, de tal manera que se genere una poblacion mixta de las primeras cadenas de ADNc, en la que dicho conjunto de cebadores comprende cebadores individuales, comprendiendo cada uno: (i) un sitio de secuencia de restriccion en 5', (ii) una secuencia hexamerica aleatoria en 3' y (iii) una secuencia de codigo de barras localizada entre el sitio de secuencia de restriccion en 5' y la secuencia hexamerica aleatoria en 3', en la que dicho sitio de secuencia de restriccion en cada uno de dichos cebadores individuales es identico y en la que dicho conjunto de cebadores comprende todas o casi todas las posibles secuencias hexamericas aleatorias y en la que cada uno de dichas primeras cadenas del ADNc tiene uno de dichos cebadores individuales en su extremo 5'; (b) exponer dicha poblacion mixta de las primeras cadenas del ADNc a dicho conjunto de cebadores en condiciones de polimerizacion, de tal manera que se genera una poblacion mixta de moleculas de ADNc de doble cadena, (c) digerir dicha poblacion mixta de moleculas de ADNc de doble cadena con una enzima de restriccion espedfica de dicho sitio de secuencia de restriccion en 5', (d) tratar dicha poblacion mixta de moleculas de ADNc de doble cadena con un
5
10
15
20
25
30
35
40
45
50
55
60
65
agente de union, de tal manera que las moleculas individuales de ADNc de doble cadena se ligan entre sf para formar una poblacion mixta de concatemeros; (e) exponer dicha poblacion mixta de concatemeros a cebadores aleatorios en condiciones de amplificacion del genoma completo de tal manera que se genere acido nucleico amplificado; (f) digerir, al menos parcialmente, dicho acido nucleico amplificado con la misma enzima de restriccion espedfica de dicho sitio de secuencia de restriccion en 5', generando de este modo una pluralidad de secuencias digeridas; y (g) ligar secuencias adaptadoras de la secuenciacion a los extremos de dicha pluralidad de secuencias digeridas para generar una poblacion mixta de moldes de secuenciacion ligados al adaptador, en los que dichas secuencias adaptadoras de la secuenciacion contienen un sitio de enzima de restriccion que es identico al sitio de secuencia de restriccion en 5' en el conjunto de cebadores.
En el presente documento se divulgan procedimientos, composiciones y kits para realizar amplificacion (por ejemplo, amplificacion del genoma completo) empleando cebadores que tienen un sitio de restriccion en 5', una secuencia aleatoria en 3' (por ejemplo, un hexamero aleatorio) y una secuencia de codigo de barras identificable. En ciertas realizaciones, la amplificacion genera secuencias amplificadas individuales que se ligan entre sf para formar concatemeros que contienen al menos dos secuencias amplificadas (por ejemplo, no contiguas en la secuencia diana original) que estan separadas por las secuencias de codigos de barras. En realizaciones particulares, se secuencia una pluralidad de concatemeros y se alinean con un algoritmo de alineacion que utiliza las secuencias de codigos de barras para identificar uniones artificiales entre secuencias amplificadas.
En algunas realizaciones, en el presente documento se divulgan procedimientos para generar acido nucleico amplificado a partir de ARN, que comprende: a) exponer una secuencia molde de ARN a un conjunto de cebadores en condiciones de transcripcion inversa, de tal manera que se genere una poblacion mixta de las primeras cadenas de ADNc, en la que el conjunto de cebadores comprende cebadores individuales, comprendiendo cada uno: i) un sitio de secuencia de restriccion en 5', ii) una secuencia aleatoria en 3' (por ejemplo, una secuencia pentamerica, una secuencia hexamerica o una secuencia aleatoria mas larga) y iii) una secuencia de codigo de barras (por ejemplo, secuencias de 2-15 bases identificables o secuencias de 5-10 bases identificables), en la que el conjunto de cebadores comprende todas o casi todas las posibles secuencias aleatorias, pentamericas, hexamericas o mas largas, y en la que cada una de las primeras cadenas del ADNc tiene uno de los cebadores individuales en su extremo 5'; b) exponer la poblacion mixta de primeras cadenas del ADNc al conjunto de cebadores en condiciones de polimerizacion, de manera que se genera una poblacion mixta de moleculas de ADNc de doble cadena, c) digerir la poblacion mixta de moleculas de ADNc de doble cadena con una enzima de restriccion espedfica del sitio de la secuencia de restriccion en 5', d) tratar la poblacion mixta de moleculas de ADNc de doble cadena con un agente de union, de forma tal que moleculas individuales de ADNc de doble cadena se ligan entre sf para formar una poblacion mixta de concatemeros; y e) exponer la poblacion mixta de concatemeros a cebadores aleatorios en condiciones de amplificacion del genoma completo de tal manera que se genera acido nucleico amplificado. En ciertas realizaciones, los concatemeros contienen dos, tres, cuatro, cinco, seis o mas de las moleculas de ADNc de doble cadena individuales.
En ciertas realizaciones, el molde de ARN tiene una longitud inferior a 2.000 bases. En otras realizaciones, la poblacion mixta de concatemeros comprende concatemeros individuales que tienen aproximadamente 2.000 bases de longitud o mas. En realizaciones adicionales, las secuencias adaptadoras de secuenciacion contienen un sitio de enzima de restriccion que es identico al sitio de secuencia de restriccion en 5' en los cebadores. En realizaciones adicionales, los procedimientos comprenden ademas digerir, al menos parcialmente, el acido nucleico amplificado con una enzima de restriccion espedfica del sitio de secuencia de restriccion en 5', generando de este modo una pluralidad de secuencias digeridas.
En otras realizaciones, los procedimientos comprenden ademas ligar secuencias adaptadoras de la secuenciacion a los extremos de la pluralidad de secuencias digeridas para generar una poblacion mixta de moldes de secuenciacion ligadas al adaptador. En ciertas realizaciones, las secuencias adaptadoras de la secuenciacion contienen un sitio de enzima de restriccion. En realizaciones concretas, el sitio de restriccion en los adaptadores de la secuenciacion es el mismo que el sitio de restriccion presente en los cebadores. En otras realizaciones, las secuencias adaptadoras de la secuenciacion son secuencias en horquilla.
En algunas realizaciones, la pluralidad de secuencias digeridas comprende secuencias digeridas individuales que contienen, cada una, las secuencias de bases de solo una de las moleculas de ADNc de doble cadena de la poblacion mixta de moleculas de ADNc de doble hebra. En otras realizaciones, la pluralidad de secuencias digeridas comprende secuencias digeridas individuales que contienen cada una de ellas las secuencias de bases de dos o mas de las moleculas de ADNc de doble cadena de la poblacion mixta de moleculas de ADNc de doble hebra, en la que las secuencias de bases estan separadas entre sf por las secuencias de codigo de barras (por ejemplo, si hay dos secuencias, hay un codigo de barras que las separa, si hay tres secuencias (o mas) hay una secuencia de codigos de barras entre cada secuencia). En realizaciones concretas, los procedimientos comprenden ademas secuenciar al menos una de las secuencias digeridas individuales para generar informacion de secuencia electronica y procesar la informacion de secuencia electronica con un algoritmo de alineacion en el que las secuencias de codigos de barras se usan para identificar uniones artificiales entre las secuencias de base de dos o mas de las moleculas de ADNc de doble cadena.
5
10
15
20
25
30
35
40
45
50
55
60
65
En ciertas realizaciones, la secuenciacion se lleva a cabo mediante un procedimiento seleccionado del grupo que consiste en: secuenciacion didesoxi de Sanger, 454-pirosecuenciacion, secuenciacion Solexa/Illumina, secuenciacion de moleculas verdaderas Helicos, secuenciacion SMRT de Pacific Biosciences o secuenciacion de Ion Torrent. En realizaciones concretas, el sitio de secuencia de restriccion en 5' en cada uno de los cebadores individuales es identico. En realizaciones adicionales, la secuencia de codigo de barras en cada uno de los cebadores individuales es identica.
En algunas realizaciones, en el presente documento se divulgan procedimientos para generar acido nucleico amplificado a partir de ADN, que comprende: a) tratar una poblacion mixta de secuencias molde de ADN con un agente de union, de forma tal que las secuencias molde de ADN individuales (por ejemplo, dos, tres, cuatro o mas) se ligan entre sf para formar una poblacion mixta de concatemeros, en la que la poblacion mixta de secuencias molde de ADN comprende diferentes secuencias molde de ADN individuales; y b) exponer los concatemeros a un conjunto de cebadores en condiciones de amplificacion del genoma completo de manera que se genere una poblacion mixta de moleculas de ADN de doble cadena amplificadas, en la que el conjunto de cebadores comprende cebadores individuales que comprenden cada uno: i) un sitio de secuencia de restriccion 5', ii) una secuencia aleatoria en 3' (por ejemplo, pentamero o hexamero o secuencia mas larga) y iii) una secuencia de codigo de barras, en la que el conjunto de cebadores comprende todas o casi todas las posibles secuencias pentamericas o hexamericas aleatorias (por ejemplo, todas o el 90 %... 95 % ... 99 % ... de cada hexamero aleatorio posible).
En ciertas realizaciones, los procedimientos comprenden ademas: c) digerir al menos parcialmente la poblacion mixta de moleculas de ADN de doble cadena amplificadas con una enzima de restriccion espedfica para el sitio de secuencia de restriccion en 5', generando de este modo una pluralidad de secuencias digeridas. En realizaciones adicionales, los procedimientos comprenden ademas: d) ligar secuencias adaptadoras de la secuenciacion a los extremos de la pluralidad de secuencias digeridas para generar una poblacion mixta de moldes de secuenciacion ligadas al adaptador. En otras realizaciones, las diferentes secuencias molde de ADN individuales son de menos de 2.000 bases de longitud (por ejemplo, menos de 2.000 bases, menos de 1.500 bases, menos de 1.000 bases, menos de 500 bases, menos de 250 bases o menos de 150 bases; o entre 100-1000 bases o entre 250-1.500 bases). En realizaciones adicionales, la poblacion mixta de concatemeros comprende concatemeros individuales que tienen aproximadamente 2.000 bases de longitud o mas (por ejemplo, 2.000 bases., 2.500 bases ... 3.000 bases, 4.000 bases o mas). En otras realizaciones, las secuencias adaptadoras de la secuenciacion contienen un sitio de enzima de restriccion (por ejemplo, el mismo sitio que el presente en los cebadores). En otras realizaciones, las secuencias adaptadoras de la secuenciacion son secuencias en horquilla.
En realizaciones particulares, la pluralidad de secuencias digeridas comprende secuencias digeridas individuales que contienen cada una de las secuencias de bases de solo una de las diferentes secuencias molde de ADN individuales. En otras realizaciones, la pluralidad de secuencias digeridas comprende secuencias digeridas individuales que contienen cada una las secuencias de bases de dos o mas (por ejemplo, 2, 3, 4, 5, 6 o mas) de las diferentes secuencias molde de ADN individuales, en las que las secuencias de bases estan separadas entre sf por las secuencias de codigos de barras. En realizaciones adicionales, la poblacion mixta de moldes de secuenciacion ligadas a adaptadores comprende moldes de secuenciacion ligadas a adaptadores individuales, en los que el procedimiento comprende ademas secuenciar al menos uno (o la mayona o la totalidad) de los moldes de secuenciacion ligados a adaptadores individuales para generar informacion de secuencia electronica y procesar la informacion de secuencia electronica con un algoritmo de alineacion en el que las secuencias de codigos de barras se usan para identificar uniones artificiales entre las secuencias de bases de dos o mas de las secuencias de molde de ADN individuales. En ciertas realizaciones, el sitio de secuencia de restriccion en 5' en cada uno de los cebadores individuales es identico. En realizaciones adicionales, la secuencia de codigo de barras en cada uno de los cebadores individuales es identica.
En algunas realizaciones, en el presente documento se divulgan composiciones que comprenden un conjunto de cebadores, en el que el conjunto de cebadores comprende cebadores individuales que comprenden cada uno: i) un sitio de secuencia de restriccion 5', ii) una secuencia aleatoria pentamerica, hexamerica o mayor aleatoria y iii) una secuencia de codigo de barras, en la que el conjunto de cebadores comprende todas o casi todas las posibles secuencias aleatorias pentamericas, hexamericas o mayores. En ciertas realizaciones, el sitio de secuencia de restriccion en 5' en cada uno de los cebadores individuales es identico. En otras realizaciones, la secuencia de codigo de barras en cada uno de los cebadores individuales es identica.
En algunas realizaciones, en el presente documento se divulgan kits y sistemas que comprenden: a) una composicion que comprende un conjunto de cebadores, en la que el conjunto de cebadores comprende cebadores individuales que comprenden cada uno: i) un sitio de secuencia de restriccion 5', ii) una secuencia aleatoria pentamerica, hexamerica o mayor aleatoria y iii) una secuencia de codigo de barras, en la que el conjunto de cebadores comprende todas o casi todas las posibles secuencias aleatorias pentamericas, hexamericas o mayores; y b) una polimerasa adecuada para realizar amplificacion del genoma completa. En ciertas realizaciones, la polimerasa comprende Phi29 o el fragmento grande de la Bst ADN polimerasa, o enzima de funcionamiento similar.
En ciertas realizaciones, en el presente documento se divulgan procedimientos para generar alineaciones de secuencias, que comprenden: a) secuenciar una poblacion mixta de concatemeros para generar informacion de
5
10
15
20
25
30
35
40
45
50
55
60
65
secuencia, en la que la poblacion mixta de concatemeros comprende una pluralidad de concatemeros individuales, comprendiendo cada uno: i) al menos dos secuencias de bibliotecas diferentes del genoma de un organismo, en las que las al menos dos secuencias de biblioteca diferentes no son contiguas en el genoma; y ii) al menos una secuencia de codigos de barras situada entre las al menos dos secuencias de biblioteca diferentes; e b) introducir la informacion de secuencia en un sistema, en el que el sistema comprende: i) un procesador informatico para recibir, procesar y comunicar datos, ii) un programa informatico, incrustado en el procesador informatico, que esta configurado para procesar la informacion de secuencia para formar alineaciones de secuencia; c) procesar la informacion de secuencia con el programa informatico de manera que las secuencias de codigos de barras se usen para formar alineaciones de secuencia identificando uniones artificiales entre las al menos dos secuencias de biblioteca diferentes; y d) comunicar el resultado del programa informatico a un usuario. En realizaciones particulares, los procedimientos comprenden ademas una etapa antes de la etapa a) de generacion de la poblacion mixta de concatemeros mediante amplificacion del genoma completo y union de los productos de amplificacion del genoma completo.
En algunas realizaciones, en el presente documento se divulgan composiciones que comprenden: un conjunto de secuencias de biblioteca, en el que dicho conjunto de secuencias de biblioteca comprende secuencias de biblioteca individuales que comprenden: i) al menos una secuencia de codigos de barras; ii) al menos dos insertos de ADN, en los que cada uno de dichos insertos de ADN es una porcion amplificada de una secuencia diana y en los que dichos al menos dos insertos de ADN estan separados por una de dichas secuencias de codigos de barras; iii) un sitio de secuencia de restriccion, iv) una secuencia aleatoria pentamerica, hexamerica o una secuencia mas larga y v) secuencias adaptadoras (por ejemplo, una en cada extremo), en las que dicho conjunto de secuencias de biblioteca comprende todas o casi todas las secuencias de una secuencia diana. En ciertas realizaciones, el sitio de la secuencia de restriccion es adyacente a dicha al menos una secuencia de codigo de barras. En realizaciones adicionales, la secuencia aleatoria pentamerica o hexamerica mas larga es adyacente a la al menos una secuencia de codigo de barras. En realizaciones adicionales, la secuencia diana tiene mas de 2.000 bases de longitud. En realizaciones adicionales, la secuencia diana tiene mas de 20.000 bases de longitud.
Los presentes procedimientos no estan limitados por el sitio de la enzima de restriccion endonucleasa o de la enzima que se utilice. En ciertas realizaciones, el sitio de restriccion es reconocido por, o la enzima empleada es: BamHI, EcoRI, EcoRII, Hindll, HindIII, Hinfl, Hpal, MspI y Smal. En la materia se conocen muchos otros sitios de restriccion y enzimas.
Descripcion de las figuras
Las figuras 1A-C muestran un diagrama de flujo de ejemplo de la utilizacion de los cebadores descritos en el
presente documento para amplificar ARN y, en combinacion con la amplificacion de WGA y la union de
productos, para generar una biblioteca de secuenciacion adaptada a cebadores.
Las figuras 2A-B muestran un diagrama de flujo de ejemplo de la utilizacion de los cebadores descritos en el
presente documento para amplificar ADN y generar una biblioteca de secuenciacion adaptada a cebadores.
Descripcion detallada
En el presente documento se divulgan procedimientos, composiciones y kits para realizar amplificacion (por ejemplo, amplificacion del genoma completo) empleando cebadores que tienen un sitio de restriccion en 5', una secuencia aleatoria en 3' (por ejemplo, un hexamero aleatorio) y una secuencia de codigo de barras identificable. En ciertas realizaciones, la amplificacion genera secuencias amplificadas individuales que se ligan entre sf para formar concatemeros que contienen al menos dos secuencias amplificadas (por ejemplo, no contiguas originalmente en la secuencia diana original) que estan separadas por las secuencias de codigos de barras. En realizaciones particulares, se secuencia una pluralidad de concatemeros y se alinean con un algoritmo de alineacion que utiliza las secuencias de codigos de barras para identificar uniones artificiales entre secuencias amplificadas. En realizaciones concretas, en el presente documento se divulgan procedimientos y composiciones para la preparacion de una biblioteca de moldes cortos de ARN y ADN para la secuenciacion de proxima generacion usando amplificacion del genoma completo y enzimas de restriccion.
La amplificacion del genoma completo (WGA) de los virus ARN (u otras moleculas pequenas de ARNsc) utilizando Phi29 se ha descrito en la bibliograffa, asf como un proceso muy ineficiente. Se ha informado de que la ADN polimerasa de Phi29 no puede amplificar ARN o fragmentos pequenos de ADNc de menos de 2.000 bases generadas a partir de la transcriptasa inversa. Berthet y col., BMC Molecular Biology, 2008, 9:77 describen un enfoque de este problema, generando fragmentos de ADNc de virus de ARN usando hexameros aleatorios y uniendo los fragmentos de ADNc de doble cadena de una manera aleatoria mediante union de extremos romos. Las moleculas de cana concatenadas se utilizaron como sustrato para Phi29. La principal desventaja de este enfoque es que crea fragmentos de ADN quimericos con uniones artificiales en la biblioteca de WGA. Estos fragmentos de ADN quimericos plantean un reto para los algoritmos de alineacion creados para los datos de secuenciacion de proxima generacion y tfpicamente se descartan durante el proceso de alineacion. El presente procedimiento incorpora secuencias de ADN espedficas en el ADN concatenado, lo que permite una facil identificacion de las uniones artificiales. Como resultado, se pueden recuperar lecturas de secuencias individuales de la molecula de ADN
5
10
15
20
25
30
35
40
45
50
55
60
65
concatenada.
En ciertas realizaciones, en el presente documento se divulgan procedimientos que usan cebado aleatorio de acido nucleico diana usando cebadores que contienen un sitio de enzima de restriccion en el extremo 5'. Para el ARN, las moleculas de ADNc de doble cadena que son el resultado de los cebadores aleatorios y la transcriptasa inversa (u otra polimerasa capaz de realizar transcripcion inversa), seguido de la smtesis de la segunda cadena, se digieren con una enzima de restriccion que cortara los extremos de los hexameros aleatorios y creara moleculas de ADNc con un sitio de enzima de restriccion espedfico en los extremos 5 'y 3' de cada molecula (vease, por ejemplo, la figura 1). A continuacion, estas moleculas de ADNc se ligan para formar moldes grandes de ADNc concatenado para la amplificacion del genoma completo. Despues de la amplificacion del genoma completo, los productos amplificados se digieren con la misma enzima de restriccion, de modo que se producen fragmentos de ADNc flanqueados con el sitio de la enzima de restriccion. Los cebadores aleatorios con el sitio de restriccion tienen una secuencia de codigos de barras para distinguirlos de un sitio de restriccion natural en el genoma de interes. A continuacion, se disenan adaptadores espedficos de una plataforma de secuenciacion en particular (por ejemplo, Pacific Biosciences, Illumina, Ion Torrent, 454, SOLiD, etc.) de modo que contengan el sitio de la enzima de restriccion que coincide con el sitio contenido en la biblioteca de ADNc amplificada del genoma completo. Los adaptadores que contienen los sitios de restriccion ("RE-adaptadores") se mezclan despues con los fragmentos de ADNc amplificados del genoma completo que contienen los sitios de restriccion ("RE-ADNc”) y se ligan para producir una biblioteca de ADNc flanqueada con los adaptadores y lista para la secuenciacion (Adaptador-RE-ADNc-RE-adaptador). Este procedimiento puede utilizarse, por ejemplo, con ADN o ARN, o acidos nucleicos degradados de muestras/tejidos embebidos en parafina, fijados con formalina (FFPE).
Como se ha indicado anteriormente, una de las principales desventajas del enfoque de la tecnica anterior es que crea uniones artificiales en la biblioteca de WGA que no pueden identificarse facilmente mediante ordenador. Los algoritmos de secuenciacion de proxima generacion que alinean lecturas cortas estan limitados en su capacidad para procesar datos con uniones artificiales. En ciertas realizaciones, el presente procedimiento genera dos tipos de productos en la biblioteca. El primer tipo contiene fragmentos aleatorios de ADN flanqueados por los RE- adaptadores, que no contienen uniones artificiales. El segundo tipo contiene multiples fragmentos aleatorios de ADN flanqueados por los RE-adaptadores. Estos fragmentos de ADN concatenados estan separados por una secuencia conocida (sitio de RE con codigo de barras, seguido de una secuencia aleatoria de X unidades) que se puede identificar facilmente por ordenador. Como resultado, la secuencia lefda puede dividirse en sus lecturas individuales, no concatenadas.
En ciertas realizaciones, el presente procedimiento puede usarse para tomar muestras desconocidas que contienen acido nucleico (por ejemplo, ARN o ADN) y producir moldes para WGA usando phi29 (u otras polimerasas de WGA). Los adaptadores espedficos para las plataformas de secuenciacion (o secuenciacion por smtesis) de proxima generacion (Pacific Biosciences, Illumina, Ion Torrent, etc.) pueden ligarse a los datos de la biblioteca y de secuencias obtenidos de cantidades residuales de entrada.
Las secuencias de codigos de barras se usan en ciertos cebadores del presente procedimiento. La secuencia del codigo de barras puede ser cualquier secuencia identificable localizada entre el sitio de la enzima de restriccion y la secuencia hexamerica aleatoria. Generalmente, estas secuencias tienen aproximadamente 5-10 nucleotidos de longitud. Su proposito es distinguir los sitios para enzimas de restriccion introducidos desde el cebado con los oligos aleatorios de X unidades/codigo de barras/enzima de restriccion de los sitios para las enzimas de restriccion de origen natural en el genoma diana (que producina una union artificial). Los codigos de barras del ADN pueden variar ampliamente en tamano y composiciones. Las siguientes referencias proporcionan una grna para seleccionar conjuntos de codigos de barras de oligonucleotidos apropiados para realizaciones particulares: Brenner, patente de Estados Unidos n.° 5.635,400; Brenner y col., Proc. Natl. Acad. Sci. 97:1665-1670 (2000), Shoemaker y col., Nature Genetics, 14:450-456 (1996); Morris y col., publicacion de patente europea 0799897A1; Wallace, patente de Estados Unidos n.° 5.981.179; y similares. En diferentes aplicaciones del procedimiento, los codigos de barras de oligonucleotidos pueden tener cada uno una longitud dentro de un intervalo de 4 a 36 nucleotidos o de 6 a 30 nucleotidos, o de 8 a 20 o de 5 a 10 nucleotidos, respectivamente.
En ciertas realizaciones, se secuencian las secuencias amplificadas que se generan. El presente procedimiento no esta limitado por la tecnica de secuenciacion empleada. A continuacion se describen ejemplos de procedimientos de secuenciacion. Entre los ejemplos no limitantes ilustrativos de las tecnicas de secuenciacion de acidos nucleicos se incluyen, pero no se limitan a, secuenciacion de terminacion de cadena (Sanger), secuenciacion por terminador colorante y procedimientos de secuenciacion de la proxima generacion.
La secuenciacion de terminacion de cadena utiliza la terminacion espedfica de secuencia de una reaccion de smtesis de ADN usando sustratos de nucleotidos modificados. La extension se inicia en un sitio espedfico en el ADN molde utilizando un cebador oligonucleotfdico radioactivo corto, u otro marcado, complementario del molde en esa region. El cebador oligonucleotfdico se extiende utilizando una ADN polimerasa, cuatro bases de desoxinucleotidos estandar y una concentracion baja de un nucleotido de terminacion de cadena, mas habitualmente un didesoxinucleotido. Esta reaccion se repite en cuatro tubos separados, turnandose cada una de las bases como didesoxinucleotido. La incorporacion limitada del nucleotido de terminacion de cadena por la ADN polimerasa da
5
10
15
20
25
30
35
40
45
50
55
60
65
como resultado una serie de fragmentos de ADN relacionados que se terminan solamente en las posiciones en las que se utiliza dicho didesoxinucleotido particular. Para cada tubo de reaccion, los fragmentos se separan por tamano mediante electroforesis en un gel de poliacrilamida plano o un tubo capilar relleno con un polfmero viscoso. La secuencia se determina leyendo que calle produce una marca visualizada desde el cebador marcado mientras se escanea desde la parte superior del gel hasta la parte inferior.
La secuenciacion por terminador colorante marca, alternativamente los terminadores. La secuenciacion completa se puede llevar a cabo en una sola reaccion marcando cada uno de los terminadores de cadena de los didesoxinucleotidos con un colorante fluorescente separado, que brilla a una longitud de onda diferente.
Un conjunto de procedimientos conocidos como tecnicas de "secuenciacion de proxima generacion" han surgido como alternativas a los procedimientos de secuenciacion de Sanger y por terminador colorante (Voelkerding y col., Clinical Chem., 55: 641-658, 2009; MacLean y col., Nature Rev. Microbiol., 7: 287-296). La tecnologfa de secuenciacion de proxima generacion permite la secuenciacion de novo de genomas completos para determinar la secuencia de acidos nucleicos primaria de un organismo. La tecnologfa de secuenciacion de proxima generacion tambien proporciona resecuenciacion espedfica (secuenciacion profunda), que permite la deteccion de mutaciones sensibles dentro de una poblacion de secuencias de tipo salvaje. Algunos ejemplos incluyen trabajos recientes que describen la identificacion de variantes de VIH resistentes a farmacos, asf como mutaciones del EGFR para determinar la respuesta a farmacos terapeuticos anti-TK. Las publicaciones que describen la secuenciacion de proxima generacion permiten la secuenciacion simultanea de multiples muestras durante un ciclo de secuenciacion tfpica, incluyendo, por ejemplo: Margulies, M. y col., "Genome Sequencing in Microfabricated High-Density Picolitre Reactors", Nature, 437, 376-80 (2005); Mikkelsen, T. y col., "Genome-Wide Maps of Chromatin State in Pluripotent and Lineage-Committed Cells", Nature, 448, 553-60 (2007); McLaughlin, S. y col., "Whole-Genome Resequencing with Short Reads: Accurate Mutation Discovery with Mate Pairs and Quality Values", ASHG Annual Meeting (2007); Shendure J. y col., "Accurate Multiplex Polony Sequencing of an Evolved Bacterial Genome", Science, 309, 1728-32 (2005); Harris, T. y col., "Single-Molecule DNA Sequencing of a Viral Genome", Science, 320, 106-9 (2008); Simen, B. y col., "Prevalence of Low Abundance Drug Resistant Variants by Ultra Deep Sequencing in Chronically HIV- infected Antiretroviral (ARV) Naive Patients and the Impact on Virologic Outcomes", 16th International HlV Drug Resistance Workshop, Barbados (2007); Thomas, R. y col., "Sensitive Mutation Detection in Heterogeneous Cancer Specimens by Massively Parallel Picoliter Reactor Sequencing", Nature Med., 12, 852-855 (2006); Mitsuya, Y. y col., "Minority Human Immunodeficiency Virus Type 1 Variants in Antiretroviral-Naive Persons with Reverse Transcriptase Codon 215 Revertant Mutations", J. Vir., 82, 10747-10755 (2008); Binladen, J. y col., "The Use of Coded PCR Primers Enables High-Throughput Sequencing of Multiple Homolog Amplification Products by 454 Parallel Sequencing", PLoS ONE, 2, e197 (2007); y Hoffmann, C. y col., "DNA Bar Coding and Pyrosequencing to Identify Rare HIV Drug Resistance Mutations", Nuc. Acids Res., 35, e91 (2007).
En comparacion con la secuenciacion tradicional de Sanger, la tecnologfa de secuenciacion de proxima generacion produce grandes cantidades de puntos de datos de secuenciacion. Un ciclo tfpico puede generar facilmente de decenas a cientos de megabases por ciclo, con una potencia salida diaria que llega al rango de gigabases. Esto se traduce en varios ordenes de magnitud mayor que una placa estandar de 96 pocillos, que puede generar varios cientos de puntos de datos en ciclo multiplex tfpico. Los amplicones diana que difieren en tan poco como un nucleotido pueden distinguirse facilmente, incluso cuando estan presentes multiples dianas de especies u organismos relacionados. Esto mejora en gran medida la capacidad de realizar un genotipado exacto. Los programas de software de alineacion de secuencia de proxima generacion usados para producir secuencias consenso pueden identificar facilmente nuevas mutaciones puntuales, lo que podna dar lugar a nuevas cepas con resistencias a farmacos asociadas. El uso de la codificacion de barras de cebadores tambien permite la multiplexacion de diferentes muestras de pacientes dentro de un solo ciclo de secuenciacion.
Los procedimientos de secuenciacion de proxima generacion (NGS) comparten la caractenstica comun de las estrategias masivas paralelas de alto rendimiento, con el objetivo de reducir los costes en comparacion con los procedimientos de secuenciacion mas antiguos. Los procedimientos de NGS pueden dividirse en lmeas generales en aquellos que requieren amplificacion del molde y los que no lo hacen. Los procedimientos que requieren amplificacion incluyen la pirosecuenciacion comercializada por Roche como las plataformas tecnologicas 454 (por ejemplo, GS 20 y GS FLX), la plataforma Solexa comercializada por Illumina y la plataforma de Supported Oligonucleotide Ligation and Detection (SOLiD) comercializada por Applied Biosystems. Los enfoques de no amplificacion, tambien conocidos como secuenciacion de una sola molecula, se ilustran mediante la plataforma HeliScope comercializada por Helicos BioSciences, Ion Torrent y plataformas emergentes comercializadas por VisiGen y Pacific Biosciences, respectivamente.
En la pirosecuenciacion (Voelkerding y col., Clinical Chem., 55: 641-658, 2009; MacLean y col., Nature Rev. Microbiol., 7: 287-296; patente de Estados Unidos n.° 6.210,891; patente de Estados Unidos n.° 6.258,568), el ADN molde se fragmenta, se reparan los extremos, se liga a los adaptadores y se amplifica clonalmente in situ capturando moleculas molde sencillas con perlas que llevan oligonucleotidos complementarios a los adaptadores. Cada perla portadora de un solo tipo de molde se compartimenta en una microvesfcula de agua en aceite y el molde se amplifica clonalmente utilizando una tecnica denominada PCR en emulsion. La emulsion se rompe despues de la amplificacion y las perlas se depositan en pocillos individuales de una placa de picotitulacion que funciona como una
5
10
15
20
25
30
35
40
45
50
55
60
65
celda de flujo durante las reacciones de secuenciacion. La introduccion iterativa ordenada de cada uno de los cuatro reactivos de dNTP se produce en la celda de flujo en presencia de enzimas de secuenciacion e indicador luminiscente, tal como luciferasa. En el caso de que se anada un dNTP apropiado al extremo 3' del cebador de secuenciacion, la produccion resultante de ATP provoca una explosion de luminiscencia dentro del pocillo, que se registra utilizando una camara CCD. Es posible conseguir longitudes de lectura mayores o iguales a 400 bases 400 bases y se pueden conseguir 1x106 lecturas de secuencias, dando como resultado hasta 500 millones de pares de bases (Mb) de secuencia.
En la plataforma Solexa/Illumina (Voelkerding y col., Clinical Chem., 55: 641-658, 2009; MacLean y col., Nature Rev. Microbiol., 7: 287-296; patente de Estados Unidos n.° 6.833.246; patente de Estados Unidos n.° 7.115,400; patente de Estados Unidos n.° 6.969,488), los datos de secuenciacion se producen en forma de lecturas de longitud mas corta. En este procedimiento, el ADN fragmentado monocatenario se repara en los extremos para generar extremos romos fosforilados en ', seguido de la adicion mediada por el fragmento Klenow de una unica base A al extremo 3' de los fragmentos. La adicion de A facilita la adicion de oligonucleotidos adaptadores sobresalientes de T, que se utilizan posteriormente para capturar las moleculas adaptadoras del molde sobre la superficie de una celda de flujo que esta tachonada con anclajes de oligonucleotidos. El anclaje se utiliza como cebador de PCR, pero debido a la longitud del molde y su proximidad a otros oligonucleotidos de anclaje cercanos, la extension por PCR da como resultado el "arqueamiento" de la molecula para hibridar con un oligonucleotido de anclaje adyacente para formar una estructura de puente sobre la superficie de la celda de flujo. Estos bucles de ADN son desnaturalizados y escindidos. A continuacion, las hebras delanteras se secuencian con terminadores colorantes reversibles. La secuencia de los nucleotidos incorporados se determina mediante deteccion de fluorescencia posterior a la incorporacion, con cada fluorescencia y bloque eliminados antes del siguiente ciclo de adicion de dNTP. La longitud de la lectura de la secuencia vana desde 36 nucleotidos a mas de 50 nucleotidos, con una produccion total superior a mil millones de pares de nucleotidos por analisis.
La secuenciacion de moleculas de acido nucleico usando tecnologfa SOLiD (Voelkerding y col., Clinical Chem., 55: 641-658, 2009; MacLean y col., Nature Rev. Microbiol., 7: 287-296; patente de Estados Unidos n.° 5.912.148; patente de Estados Unidos n.° 6.130,073) tambien implica la fragmentacion del molde la union a los adaptadores de oligonucleotidos, la union a perlas y la amplificacion clonal por PCR en emulsion. Despues de esto, las perlas portadoras de molde se inmovilizan sobre una superficie derivatizada de una celda de flujo de vidrio y se hibrida un cebador complementario al oligonucleotido adaptador. Sin embargo, en lugar de utilizar este cebador para la extension en 3', en lugar de ello se utiliza para proporcionar un grupo fosfato en 5' para la union sondas identificadoras que contienen dos bases espedficas de sonda seguidas de 6 bases degeneradas y uno de cuatro marcadores fluorescentes. En el sistema SOLiD, las sondas identificadoras tienen 16 posibles combinaciones de las dos bases en el extremo 3' de cada sonda y uno de cuatro fluorescencias en el extremo 5'. El color fluorado y, por lo tanto, la identidad de cada sonda corresponde a esquemas de codificacion de espacio de color especificados. A varias rondas (normalmente 7) de hibridacion de la sonda, union y deteccion de fluorescencia les sigue desnaturalizacion y, despues, una segunda ronda de secuenciacion usando un cebador que esta compensado por una base con respecto al cebador inicial. De esta manera, la secuencia molde puede reconstruirse por ordenador y las bases del molde se interrogan dos veces, lo que da como resultado una mayor precision. La longitud de lectura de la secuencia es de 35 nucleotidos y la produccion total supera los 4 mil millones de bases por ciclo de secuenciacion.
En ciertas realizaciones, se usa secuenciacion en nanoporos (vease, por ejemplo, Astier y col., J Am Chem Soc. 2006 Feb. 8; 128(5):1705-10). La teona detras de la secuenciacion en nanoporos tiene que ver con lo que se produce cuando el nanoporo se sumerge en un fluido conductor y se aplica un potencial (voltaje) a su traves: en estas condiciones se puede observar una ligera corriente electrica debido a la conduccion de iones a traves del nanoporo y la cantidad de corriente es extremadamente sensible al tamano del nanoporo. Si las moleculas de ADN pasan (o parte de la molecula de ADN pasa) a traves del nanoporo, se puede crear un cambio en la magnitud de la corriente a traves del nanoporo, lo que permite determinar las secuencias de la molecula de ADN.
HeliScope de Helicos BioSciences (Voelkerding y col., Clinical Chem., 55: 641-658, 2009; MacLean y col., Nature Rev. Microbiol., 7: 287-296; patente de Estados Unidos n.° 7.169,560; patente de Estados Unidos n.° 7.282,337; patente de Estados Unidos n.° 7.482,120; patente de Estados Unidos n.° 7.501,245; patente de Estados Unidos n.° 6.818,395; patente de Estados Unidos n.° 6.911,345; patente de Estados Unidos n.° 7.501,245) es la primera plataforma de secuenciacion de una sola molecula comercializada. Este procedimiento no requiere amplificacion clonal. El ADN molde se fragmenta y poliadenila en el extremo 3', portando la adenosina final un marcador fluorescente. Los fragmentos del molde poliadenilados desnaturalizados se ligan a oligonucleotidos poli(dT) sobre la superficie de una celda de flujo. Las localizaciones ffsicas iniciales de las moleculas molde capturadas son grabadas por una camara CCD y, despues, se escinde el marcador y se elimina mediante lavado. La secuenciacion se consigue mediante la adicion de polimerasa y la adicion en serie de reactivos de dNTP marcados con fluorescencia. Los acontecimientos de incorporacion producen una senal de fluorescencia correspondiente al dNTP y la senal es capturada por una camara cCd antes de cada ronda de adicion de dNTP. La longitud de la lectura de la secuencia vana desde 25 nucleotidos a 50 nucleotidos, con una produccion total superior a mil millones de pares de nucleotidos por analisis.
5
10
15
20
25
30
Otros procedimientos emergentes de secuenciacion de moleculas individuales incluyen la secuenciacion en tiempo real mediante la smtesis utilizando una plataforma VisiGen (Voelkerding y col., Clinical Chem., 55: 641-658, 2009; patente de Estados Unidos n.° 7.329,492; solicitud de patente de Estados Unidos n.° de serie 11/671.956; solicitud de patente de Estados Unidos n.° de serie 11/781.166) en la que el molde de ADN cebado inmovilizado se somete a extension de cadena usando una polimerasa modificada por fluorescencia y moleculas aceptoras fluorescentes, lo que da como resultado una transferencia de energfa de resonancia de fluorescencia detectable (FRET) despues de la adicion de nucleotidos.
Otro sistema de secuenciacion de moleculas individuales en tiempo real desarrollado por Pacific Biosciences (Voelkerding y col., Clinical Chem., 55: 641-658, 2009; MacLean y col., Nature Rev. Microbiol., 7: 287-296; patente de Estados Unidos n.° 7.170.050; patente de Estados Unidos n.° 7.302,146; patente de Estados Unidos n.° 7.313.308; patente de Estados Unidos n.° 7.476.503) utiliza pocillos de reaccion de 50-100 nm de diametro y que abarca un volumen de reaccion de aproximadamente 20 zeptolitros (10x10-21 l). Las reacciones de secuenciacion se llevan a cabo usando un molde inmovilizado, ADN polimerasa de phi29 modificada y concentraciones locales altas de dNTP marcados con fluorescencia. Las concentraciones locales altas y las condiciones de reaccion continuas permiten capturar acontecimientos de incorporacion en tiempo real mediante la deteccion de la senal fluorescente mediante excitacion por laser, una grna de ondas optica y una camara CCD.
La secuenciacion Ion torrent es un procedimiento de secuenciacion de ADN basado en la deteccion de iones de hidrogeno que se liberan durante la polimerizacion de ADN. Este es un procedimiento de "secuenciacion mediante smtesis", durante el cual se construye una cadena complementaria basada en la secuencia de un soporte del molde. Un micropocillo que contiene una cadena de ADN molde para secuenciar se inunda con una sola especie de desoxirribonucleotido (dNTP). Si el dNTP introducido es complementario al nucleotido molde principal, se incorpora en la cadena complementaria en crecimiento. Esto provoca la liberacion de un ion de hidrogeno que desencadena un sensor de iones hipersensible, lo que indica que se ha producido una reaccion. Si hay repeticiones de homopolfmero presentes en la secuencia molde, se incorporaran multiples moleculas de dNTP en un unico ciclo. Esto conduce a un numero correspondiente de hidrogenos liberados y una senal electronica proporcionalmente mas alta.
Diversas modificaciones y variaciones de los procedimientos y realizaciones descritos en la presente invencion seran evidentes para los expertos en la materia. Aunque la presente invencion se ha descrito en relacion con realizaciones preferidas espedficas, debe entenderse que la invencion, tal como se reivindica, no debe limitarse indebidamente a dichas realizaciones espedficas.

Claims (8)

  1. 5
    10
    15
    20
    25
    30
    35
    40
    45
    50
    55
    60
    65
    REIVINDICACIONES
    1. Un procedimiento para generar acido nucleico amplificado a partir de ARN que comprende:
    a) exponer una secuencia molde de ARN a un conjunto de cebadores en condiciones de transcripcion inversa, de tal manera que se genere una poblacion mixta de las primeras cadenas de ADNc,
    en la que dicho conjunto de cebadores comprende cebadores individuales, comprendiendo cada uno: i) un sitio de secuencia de restriccion en 5', (ii) una secuencia hexamerica aleatoria en 3' y (iii) una secuencia de codigo de barras localizada entre el sitio de secuencia de restriccion en 5' y la secuencia hexamerica aleatoria en 3', en la que dicho sitio de secuencia de restriccion en cada uno de dichos cebadores individuales es identico y en la que dicho conjunto de cebadores comprende todas o casi todas las posibles secuencias hexamericas aleatorias y en la que cada uno de dichas primeras cadenas de ADNc tiene uno de dichos cebadores individuales en su extremo 5';
    b) exponer dicha poblacion mixta de las primeras cadenas de ADNc a dicho conjunto de cebadores en condiciones de polimerizacion, de tal manera que se genera una poblacion mixta de moleculas de ADNc de doble cadena,
    c) digerir dicha poblacion mixta de moleculas de ADNc de doble cadena con una enzima de restriccion espedfica de dicho sitio de secuencia de restriccion en 5',
    d) tratar dicha poblacion mixta de moleculas de ADNc de doble cadena con un agente de union, de tal manera que las moleculas individuales de ADNc de doble cadena se ligan entre sf para formar una poblacion mixta de concatemeros;
    e) exponer dicha poblacion mixta de concatemeros a cebadores aleatorios en condiciones de amplificacion del genoma completo de tal manera que se genere acido nucleico amplificado;
    f) digerir, al menos parcialmente, dicho acido nucleico amplificado con la misma enzima de restriccion espedfica de dicho sitio de secuencia de restriccion en 5', generando de este modo una pluralidad de secuencias digeridas; y
    g) ligar las secuencias adaptadoras de la secuenciacion a los extremos de dicha pluralidad de secuencias digeridas para generar una poblacion mixta de moldes de secuenciacion ligados al adaptador, en los que dichas secuencias adaptadoras de la secuenciacion contienen un sitio de enzima de restriccion que es identico al sitio de secuencia de restriccion en 5' en el conjunto de cebadores.
  2. 2. El procedimiento de la reivindicacion 1, en el que dichas secuencias adaptadoras de la secuenciacion son secuencias en horquilla.
  3. 3. El procedimiento de la reivindicacion 1, en el que dicha pluralidad de secuencias digeridas comprende secuencias digeridas individuales que contienen, cada una, las secuencias de bases de solo una de dichas moleculas de ADNc de doble cadena de dicha poblacion mixta de moleculas de ADNc de doble hebra.
  4. 4. El procedimiento de la reivindicacion 1, en el que dicha pluralidad de secuencias digeridas comprende secuencias digeridas individuales que contienen, cada una, las secuencias de bases de solo una de dichas moleculas de ADNc de doble cadena de dicha poblacion mixta de moleculas de ADNc de doble hebra, en el que dichas secuencias de base estan separadas entre sf por dichas secuencias de codigo de barras.
  5. 5. El procedimiento de la reivindicacion 4, que comprende ademas secuenciar al menos una de dichas secuencias digeridas individuales para generar informacion de secuencia electronica y procesar dicha informacion de secuencia electronica con un algoritmo de alineacion en el que dichas secuencias de codigos de barras se usan para identificar uniones artificiales entre dichas secuencias de bases de dos o mas de dichas moleculas de ADNc de doble cadena.
  6. 6. El procedimiento de la reivindicacion 1, en el que dicha secuencia de codigo de barras en cada uno de dichos cebadores individuales es identica.
  7. 7. El procedimiento de la reivindicacion 1, en el que dicho molde de ARN tiene una longitud inferior a 2.000 bases.
  8. 8. El procedimiento de la reivindicacion 1, en el que dicha poblacion mixta de concatemeros comprende concatemeros individuales que tienen aproximadamente 2.000 bases de longitud o mas.
ES12859854.7T 2011-12-22 2012-12-21 Cebadores y métodos de amplificación Active ES2626058T3 (es)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US201161578976P 2011-12-22 2011-12-22
US201161578976P 2011-12-22
PCT/US2012/071308 WO2013096802A1 (en) 2011-12-22 2012-12-21 Amplification primers and methods

Publications (1)

Publication Number Publication Date
ES2626058T3 true ES2626058T3 (es) 2017-07-21

Family

ID=48669545

Family Applications (1)

Application Number Title Priority Date Filing Date
ES12859854.7T Active ES2626058T3 (es) 2011-12-22 2012-12-21 Cebadores y métodos de amplificación

Country Status (4)

Country Link
US (1) US20150329855A1 (es)
EP (2) EP2794927B1 (es)
ES (1) ES2626058T3 (es)
WO (1) WO2013096802A1 (es)

Families Citing this family (36)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8835358B2 (en) 2009-12-15 2014-09-16 Cellular Research, Inc. Digital counting of individual molecules by stochastic attachment of diverse labels
GB2504240B (en) 2012-02-27 2015-05-27 Cellular Res Inc Compositions and kits for molecular counting of nucleic acids
EP2959019B1 (en) * 2013-02-20 2019-09-04 Emory University Methods of sequencing nucleic acids in mixtures and compositions related thereto
JP6545682B2 (ja) 2013-08-28 2019-07-17 ベクトン・ディキンソン・アンド・カンパニーBecton, Dickinson And Company 大規模並列単一細胞分析
EP3055431B1 (en) 2013-10-09 2020-06-24 Stc.Unm Synthetic long read dna sequencing
RU2613489C2 (ru) * 2014-09-17 2017-03-16 Общество с ограниченной ответственностью "Новые Молекулярные Технологии" (ООО "НОМОТЕК") Способ выявления мутаций в сложных смесях днк
EP3208343B1 (en) * 2014-10-13 2022-01-05 MGI Tech Co., Ltd. Nucleic acid fragmentation method and sequence combination
WO2016058173A1 (zh) * 2014-10-17 2016-04-21 深圳华大基因研究院 一种用于核酸随机片段化的引物及核酸随机片段化方法
EP3262192B1 (en) 2015-02-27 2020-09-16 Becton, Dickinson and Company Spatially addressable molecular barcoding
ES2934982T3 (es) 2015-03-30 2023-02-28 Becton Dickinson Co Métodos para la codificación con códigos de barras combinatorios
GB2541904B (en) * 2015-09-02 2020-09-02 Oxford Nanopore Tech Ltd Method of identifying sequence variants using concatenation
CN108026524A (zh) 2015-09-11 2018-05-11 赛卢拉研究公司 用于核酸文库标准化的方法和组合物
KR101651817B1 (ko) 2015-10-28 2016-08-29 대한민국 Ngs 라이브러리 제작용 프라이머 세트 및 이를 이용한 ngs 라이브러리 제작방법 및 키트
US10301677B2 (en) 2016-05-25 2019-05-28 Cellular Research, Inc. Normalization of nucleic acid libraries
US10202641B2 (en) 2016-05-31 2019-02-12 Cellular Research, Inc. Error correction in amplification of samples
US10640763B2 (en) 2016-05-31 2020-05-05 Cellular Research, Inc. Molecular indexing of internal sequences
CN107488656B (zh) * 2016-06-13 2020-07-17 陆欣华 一种核酸等温自扩增方法
KR102522023B1 (ko) 2016-09-26 2023-04-17 셀룰러 리서치, 인크. 바코딩된 올리고뉴클레오티드 서열을 갖는 시약을 이용한 단백질 발현의 측정
EP3555305B1 (en) * 2016-12-16 2021-02-17 H. Hoffnabb-La Roche Ag Method for increasing throughput of single molecule sequencing by concatenating short dna fragments
US11319583B2 (en) 2017-02-01 2022-05-03 Becton, Dickinson And Company Selective amplification using blocking oligonucleotides
EP3635107A4 (en) * 2017-05-14 2021-01-13 Foresee Genomic Ltd CONSTRUCTION OF DNA FOR SEQUENCING AND ITS PREPARATION PROCESS
CN118048419A (zh) * 2017-10-04 2024-05-17 生捷科技控股公司 酶法合成寡核苷酸的方法和系统
CN112272710A (zh) 2018-05-03 2021-01-26 贝克顿迪金森公司 高通量多组学样品分析
CN112243461B (zh) 2018-05-03 2024-07-12 贝克顿迪金森公司 在相对的转录物末端进行分子条形码化
WO2020072380A1 (en) 2018-10-01 2020-04-09 Cellular Research, Inc. Determining 5' transcript sequences
US11932849B2 (en) * 2018-11-08 2024-03-19 Becton, Dickinson And Company Whole transcriptome analysis of single cells using random priming
CN113195717A (zh) 2018-12-13 2021-07-30 贝克顿迪金森公司 单细胞全转录组分析中的选择性延伸
US11661631B2 (en) 2019-01-23 2023-05-30 Becton, Dickinson And Company Oligonucleotides associated with antibodies
WO2021016395A1 (en) * 2019-07-22 2021-01-28 Igenomx International Genomics Corporation Methods and compositions for high throughput sample preparation using double unique dual indexing
EP4004231A1 (en) 2019-07-22 2022-06-01 Becton, Dickinson and Company Single cell chromatin immunoprecipitation sequencing assay
GB201911515D0 (en) * 2019-08-12 2019-09-25 Univ London Queen Mary Methods for generating a population of polynucleotide molecules
CN114729350A (zh) 2019-11-08 2022-07-08 贝克顿迪金森公司 使用随机引发获得用于免疫组库测序的全长v(d)j信息
CN115244184A (zh) 2020-01-13 2022-10-25 贝克顿迪金森公司 用于定量蛋白和rna的方法和组合物
US11661625B2 (en) 2020-05-14 2023-05-30 Becton, Dickinson And Company Primers for immune repertoire profiling
US11932901B2 (en) 2020-07-13 2024-03-19 Becton, Dickinson And Company Target enrichment using nucleic acid probes for scRNAseq
WO2022109343A1 (en) 2020-11-20 2022-05-27 Becton, Dickinson And Company Profiling of highly expressed and lowly expressed proteins

Family Cites Families (27)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5981179A (en) 1991-11-14 1999-11-09 Digene Diagnostics, Inc. Continuous amplification reaction
JP3102800B2 (ja) 1994-08-19 2000-10-23 パーキン−エルマー コーポレイション 増幅及び連結反応の共役法
US5604097A (en) 1994-10-13 1997-02-18 Spectragen, Inc. Methods for sorting polynucleotides using oligonucleotide tags
US6458530B1 (en) 1996-04-04 2002-10-01 Affymetrix Inc. Selecting tag nucleic acids
GB9620209D0 (en) 1996-09-27 1996-11-13 Cemu Bioteknik Ab Method of sequencing DNA
US20020172965A1 (en) * 1996-12-13 2002-11-21 Arcaris, Inc. Methods for measuring relative amounts of nucleic acids in a complex mixture and retrieval of specific sequences therefrom
GB9626815D0 (en) 1996-12-23 1997-02-12 Cemu Bioteknik Ab Method of sequencing DNA
US6969488B2 (en) 1998-05-22 2005-11-29 Solexa, Inc. System and apparatus for sequential processing of analytes
US6124120A (en) * 1997-10-08 2000-09-26 Yale University Multiple displacement amplification
AR021833A1 (es) 1998-09-30 2002-08-07 Applied Research Systems Metodos de amplificacion y secuenciacion de acido nucleico
WO2000075371A1 (fr) * 1999-06-04 2000-12-14 Tosoh Corporation Procede d'amplification d'acide nucleique potentialise
US6818395B1 (en) 1999-06-28 2004-11-16 California Institute Of Technology Methods and apparatus for analyzing polynucleotide sequences
US7501245B2 (en) 1999-06-28 2009-03-10 Helicos Biosciences Corp. Methods and apparatuses for analyzing polynucleotide sequences
CA2383264A1 (en) * 1999-08-13 2001-02-22 Yale University Binary encoded sequence tags
EP1218543A2 (en) 1999-09-29 2002-07-03 Solexa Ltd. Polynucleotide sequencing
CA2415897A1 (en) 2000-07-07 2002-01-17 Susan H. Hardin Real-time sequence determination
US7668697B2 (en) 2006-02-06 2010-02-23 Andrei Volkov Method for analyzing dynamic detectable events at the single molecule level
WO2004070053A2 (en) * 2003-02-03 2004-08-19 Amersham Biosciences Corporation cDNA AMPLIFICATION FOR EXPRESSION PROFILING
US7169560B2 (en) 2003-11-12 2007-01-30 Helicos Biosciences Corporation Short cycle methods for sequencing polynucleotides
US7170050B2 (en) 2004-09-17 2007-01-30 Pacific Biosciences Of California, Inc. Apparatus and methods for optical analysis of molecules
CN101914620B (zh) 2004-09-17 2014-02-12 加利福尼亚太平洋生命科学公司 核酸测序的方法
US7482120B2 (en) 2005-01-28 2009-01-27 Helicos Biosciences Corporation Methods and compositions for improving fidelity in a nucleic acid synthesis reaction
EP1910537A1 (en) * 2005-06-06 2008-04-16 454 Life Sciences Corporation Paired end sequencing
US7282337B1 (en) 2006-04-14 2007-10-16 Helicos Biosciences Corporation Methods for increasing accuracy of nucleic acid sequencing
US20080241951A1 (en) 2006-07-20 2008-10-02 Visigen Biotechnologies, Inc. Method and apparatus for moving stage detection of single molecular events
JP5702902B2 (ja) * 2007-01-29 2015-04-15 公益財団法人地球環境産業技術研究機構 cis−アコニット酸脱炭酸酵素およびそれをコードする遺伝子
ITRM20100293A1 (it) 2010-05-31 2011-12-01 Consiglio Nazionale Ricerche Metodo per la preparazione e amplificazione di librerie rappresentative di cdna per il sequenziamento massivo, loro uso, kit e cartucce per kit di automazione

Also Published As

Publication number Publication date
EP3211100A1 (en) 2017-08-30
EP2794927A4 (en) 2015-08-05
WO2013096802A1 (en) 2013-06-27
EP2794927B1 (en) 2017-04-12
US20150329855A1 (en) 2015-11-19
EP2794927A1 (en) 2014-10-29

Similar Documents

Publication Publication Date Title
ES2626058T3 (es) Cebadores y métodos de amplificación
ES2764096T3 (es) Bibliotecas de secuenciación de próxima generación
US9909121B2 (en) Expanded radix for polymeric tags
DK3161152T3 (en) Methods and compositions using one-sided transposition
ES2573277T3 (es) Métodos, composiciones y kits de generación de muestras empobrecidas en ARNr o de aislamiento del ARNr de las muestras
ES2889875T3 (es) Secuenciación a partir de cebadores múltiples para incrementar la velocidad y la densidad de los datos
JP7332733B2 (ja) 次世代シークエンシングのための高分子量dnaサンプル追跡タグ
CN104334739A (zh) 通过新一代测序进行基因分型
CN103119439A (zh) 用于多重测序的方法和组合物
CN106795554A (zh) 使用核苷酸可逆终止子的离子传感器dna和rna合成测序
ES2877205T3 (es) Preparación de muestras para la amplificación de ácido nucleico
US20160115473A1 (en) Multifunctional oligonucleotides
US10011866B2 (en) Nucleic acid ligation systems and methods
ES2683707T3 (es) Secuenciación de ADN
US20140287946A1 (en) Nucleic acid control panels
ES2645418T3 (es) Amplificación de una secuencia de un ácido ribonucleico
ES2833524T3 (es) Secuenciación de ADN
ES2683978T3 (es) Secuenciación de ADN
US20200002759A1 (en) Methods for studying nucleotide accessibility in dna and rna based on low-yield bisulfite conversion and next-generation sequencing
WO2016065298A1 (en) Systems, compositions and methods for size selective nucleic acid purification