ES2947757T3

ES2947757T3 - Composiciones de transposasas para reducir el sesgo de inserción

Info

Publication number: ES2947757T3
Application number: ES19187628T
Authority: ES
Inventors: Christian Gloeckner; Kia Amirali; Molly He; Trina Faye Osothprarop; Frank J Steemers; Kevin L Gunderson; Sasan Amini; Jerome Jendrisak
Original assignee: Illumina Inc
Current assignee: Illumina Inc
Priority date: 2014-11-05
Filing date: 2015-11-05
Publication date: 2023-08-18
Anticipated expiration: 2035-11-05
Also published as: DK3628732T3; AU2015343034B2; US12180468B2; SG11201703472YA; DK3215618T3; EP3215618B1; EP3628732B1; WO2016073690A1; FI3628732T3; EP3628732A1; EP4239067A2; EP3215618A1; EP4239067A3; AU2022201248B2; CN107532164A; US10815478B2; CA2965995A1; AU2022201248A1; AU2015343034A1; AU2015343034A9

Abstract

En el presente documento se presentan métodos y composiciones para el etiquetado de ácidos nucleicos. Los métodos son útiles para generar fragmentos de ADN marcados que son cualitativa y cuantitativamente representativos de los ácidos nucleicos diana en la muestra a partir de la cual se generan. (Traducción automática con Google Translate, sin valor legal)

Description

DESCRIPCIÓN

Composiciones de transposasas para reducir el sesgo de inserción

Antecedentes

Las enzimas transposasas son útiles en sistemas de transposición in vitro. Permiten la fragmentación y el etiquetado a gran escala del ADN genómico y son útiles para crear bibliotecas de fragmentos de ADN etiquetados a partir del ADN objetivo para su uso en métodos de análisis de ácidos nucleicos, como los métodos de secuenciación y amplificación de última generación. Sigue existiendo la necesidad de composiciones de transposasa y métodos de tagmentación con propiedades mejoradas y que generen fragmentos de ADN etiquetados que sean cualitativa y cuantitativamente representativos de los ácidos nucleicos diana en la muestra a partir de la cual se generan.

Breve resumen

En el presente documento se presentan métodos y composiciones para la tagmentación de ácidos nucleicos. Las composiciones de transposasa y los métodos de tagmentación proporcionados en el presente documento tienen propiedades sorprendentemente mejoradas que incluyen, por ejemplo, generar fragmentos de ADN etiquetados que son representativos cualitativa y cuantitativamente de los ácidos nucleicos diana en la muestra a partir de la cual se generan.

Por consiguiente, se proporciona un método de la reivindicación 1. En el presente documento se analiza un método de tagmentación secuencial que comprende: (a) proporcionar un primer transposoma, comprendiendo el primer transposoma una primera enzima transposasa que tiene un primer perfil de tagmentación; (b) combinar un ácido nucleico diana con la primera enzima transposasa en condiciones adecuadas para la tagmentación, generando así un ácido nucleico tagmentado; (c) combinar el ácido nucleico marcado con un segundo transposoma en condiciones adecuadas para la tagmentación, comprendiendo el transposoma una segunda enzima transposasa que tiene un perfil de tagmentación. Convenientemente, el primer perfil de tagmentación y el segundo perfil de tagmentación son diferentes. Convenientemente, el método comprende una etapa de lavado entre las etapas (b) y (c) para separar sustancialmente el ácido nucleico tagmentado del tampón de reacción usado en el paso (b). En algunas realizaciones, el paso de lavado comprende la unión del ácido nucleico tagmentado a un soporte sólido. En algunas realizaciones, el soporte sólido comprende perlas. En algunas realizaciones, el soporte sólido comprende una columna de centrifugación. En algunas realizaciones, el primer transposoma y el segundo transposoma tienen un sesgo de inserción diferente. En algunas realizaciones, la etapa (c) comprende agregar el segundo transposoma a una mezcla de reacción que comprende el primer transposoma.

En el presente documento también se presenta un método de tagmentación que comprende: (a) proporcionar un primer transposoma, comprendiendo el primer transposoma una primera enzima transposasa que tiene un primer perfil de tagmentación; (b) proporcionar un segundo transposoma, comprendiendo el segundo transposoma una segunda enzima transposasa que tiene un segundo perfil de tagmentación; (c) combinar un ácido nucleico diana con el primer transposoma y el segundo transposoma en condiciones adecuadas para la tagmentación, generando de este modo un ácido nucleico tagmentado.

Los detalles de una o más realizaciones se exponen en los dibujos adjuntos y la siguiente descripción. Otras características, objetos y ventajas serán evidentes a partir de la descripción y los dibujos y a partir de las reivindicaciones.

Breve descripción de los dibujos

La Fig. 1 muestra un diagrama de barras del número de moléculas únicas en las bibliotecas de ADN tagmentadas con EZ-Tn5™ y EZ-Tn5™ Mos1 preparadas utilizando diferentes concentraciones de transposomas.

La Fig. 2 muestra un diagrama de barras del tamaño del inserto en las bibliotecas tagmentadas de la figura 1.

La Fig. 3 muestra un diagrama de barras del porcentaje de omisión de AT y el porcentaje de omisión de GC en las bibliotecas tagmentadas de la figura 1.

La Fig. 4 muestra una gráfica del número de moléculas únicas en las bibliotecas de ADN tagmentadas preparadas utilizando diferentes formulaciones de tampón de tagmentación.

La Fig. 5 muestra un diagrama de barras del tamaño del inserto en las bibliotecas tagmentadas de la figura 4;

La Fig. 6 muestra un diagrama de barras del porcentaje de omisión de AT y el porcentaje de omisión de GC en las bibliotecas tagmentadas de la figura 4.

La Fig. 7 muestra un diagrama de barras del número total de lecturas y la diversidad en bibliotecas tagmentadas con TS-Tn5059 Mos1 preparadas utilizando diferentes concentraciones de transposomas.

La Fig. 8 muestra un diagrama de barras del tamaño del inserto en las bibliotecas tagmentadas de la figura 7.

La Fig. 9 muestra un diagrama de barras del porcentaje de omisión de AT y el porcentaje de omisión de GC en las bibliotecas tagmentadas de la figura 7.

La Fig. 10 muestra una gráfica del número de moléculas únicas en bibliotecas de ADN tagmentadas secuencialmente con Mos1 Tn5.

La Fig. 11 muestra una gráfica del tamaño del inserto en las bibliotecas tagmentadas de la figura 10;

La Fig. 12 muestra una gráfica del porcentaje de omisión de AT y el porcentaje de omisión de GC en las bibliotecas tagmentadas de la figura 10.

La Fig. 13 muestra un diagrama de barras del número de moléculas únicas en las bibliotecas de ADN tagmentadas con Mos1 Tn5 preparadas utilizando diferentes concentraciones de transposomas; y

La Fig. 14 muestra un diagrama de barras del porcentaje de omisión de AT y el porcentaje de omisión de GC en las bibliotecas tagmentadas de la figura 13.

La Fig. 15 muestra la secuencia del transposón HyperMu™.

La Fig. 16 muestra las secuencias del transposón HyperMu™ y varios cebadores usados.

La Fig. 17 muestra el análisis de electroforesis en gel de agarosa de los productos de fragmentación del genoma de bacteriófago a concentraciones variables de transposoma HyperMu™.

La Fig. 18 muestra el análisis de electroforesis en gel de agarosa de los productos amplificados por PCR del cromosoma de E. coli marcado después de la tagmentación con el transposoma Hyper-Mu™.

La Fig. 19 muestra las estadísticas de un experimento de secuenciación del cromosoma de E. coli usando tagmentación con HyperMu™.

La Fig. 20 muestra la distribución de la longitud de los fragmentos después de la tagmentación del cromosoma de E. coli utilizando HyperMu™.

La Fig. 21 muestra la uniformidad de la cobertura de Tn5 solo, HyperMu™ solo, TruSeq solo o una combinación de HyperMu™ y Tn5.

La Fig. 22 A-D muestra el sesgo de secuencia de TruSeq, HyperMu™ y Tn5 (Nextera) y se compara con una tagmentación de referencia. El ADN utilizado en los estudios de referencia es ADN de E. coli. El % de GC se muestra en el eje x y la frecuencia se muestra en el eje y. La Fig. 22A es una comparación de la referencia con los resultados de la tagmentación utilizando 3,2 ng de HyperMu™.

La Fig. 22B es una comparación de la referencia con los resultados de la tagmentación utilizando 1 ng de Nextera (T n5) y 3,2 ng de HyperMu™. La Fig. 22C es una comparación de la referencia con el método T ruSeq. La Fig. 22D es una comparación de la referencia con el método TruSeq, tagmentación con Nextera e HyperMu™.

La Fig. 23 muestra un esquema ilustrativo de preparación de una biblioteca de secuencias mediante tagmentación secuencial utilizando transposomas HyperMu™ y Nextera.

La Fig. 24 muestra un gráfico de la fracción de cobertura normalizada en función del % de GC utilizando la tagmentación con Mos-1 seguida de la tagmentación con TsTn5059/Nextera. Los experimentos incluyen dos flujos de trabajo diferentes, uno con una etapa de limpieza entre dos pasos de tagmentación y el otro donde el tampón se ajusta por dilución entre dos etapas de tagmentación.

La Fig. 25 muestra un gráfico de la fracción de cobertura normalizada en función del % de GC utilizando la tagmentación con TsTn5059/Nextera seguida de la tagmentación con Mos-1.

La Fig. 26 muestra un gráfico de la uniformidad de cobertura utilizando diversas combinaciones de enzimas Mos-1 y TsTn5059/Nextera a varias concentraciones.

La Fig. 27 muestra un diagrama de barras del porcentaje de omisión de AT y el porcentaje de omisión de GC en las bibliotecas tagmentadas utilizando diversas combinaciones de TsTn5059/Nextera y Mos-1.

La Fig. 28 muestra un diagrama de barras que muestra la diversidad en bibliotecas tagmentadas con TS-Tn5059/Nextera Mos1 preparadas usando diferentes concentraciones de transposomas.

Descripción detallada

Las composiciones de transposasa y los métodos de tagmentación proporcionados en el presente documento tienen propiedades sorprendentemente mejoradas que incluyen, por ejemplo, generar fragmentos de ADN etiquetados que son representativos cualitativa y cuantitativamente de los ácidos nucleicos diana en la muestra a partir de la cual se generan.

Los inventores de la presente solicitud han descubierto de manera sorprendente e inesperada que el uso de dos o más transposomas que tienen dos o más perfiles de tagmentación diferentes proporciona una tagmentación más uniforme de un ADN diana. Los inventores también han descubierto que el uso de dos o más transposomas es especialmente ventajoso cuando los perfiles de tagmentación de las transposasas tienen diferentes sesgos de inserción, tales como diferentes frecuencias de omisión de AT y GC.

En un aspecto, los métodos divulgados en el presente documento incluyen tagmentación secuencial que comprende: (a) proporcionar un primer transposoma, comprendiendo el primer transposoma que comprende un primer transposón una primera enzima transposasa que tiene un primer perfil de tagmentación; (b) combinar un ácido nucleico diana con la primera enzima transposasa en condiciones adecuadas para la tagmentación, generando de este modo un primer ácido nucleico tagmentado; (c) combinar el primer ácido nucleico tagmentado con un segundo transposoma en condiciones adecuadas para la tagmentación, comprendiendo el transposoma un segundo transposón y una segunda enzima transposasa que tiene un segundo perfil de tagmentación, generando de este modo un segundo ácido nucleico tagmentado.

En algunas realizaciones, el método comprende una etapa de lavado entre las etapas (b) y (c) para separar sustancialmente el ácido nucleico tagmentado del tampón de reacción usado en el paso (b). En algunas realizaciones, el paso de lavado comprende la unión del ácido nucleico tagmentado a un soporte sólido. En algunas realizaciones, el soporte sólido comprende perlas. En algunas realizaciones, el soporte sólido comprende una columna de centrifugación. En algunas realizaciones, la etapa (c) comprende agregar el segundo transposoma a una mezcla de reacción que comprende el primer transposoma. En algunas realizaciones, una o más de las primeras transposasas se mantuvieron unidas al primer ácido nucleico tagmentado durante la combinación del segundo transposoma con el primer ácido nucleico tagmentado.

En un aspecto, en el presente documento se describen métodos de preparación de una biblioteca de secuenciación. Los métodos incluyen proporcionar un primer transposoma, comprendiendo el primer transposoma un primer transposoma y una primera enzima transposasa que tiene un primer perfil de tagmentación, en el que el primer transposoma está inmovilizado sobre un primer soporte sólido. Se combina un ácido nucleico con la primera enzima transposasa en condiciones adecuadas para la tagmentación, generando de este modo un primer ácido nucleico tagmentado. El ácido nucleico tagmentado se combina con un segundo transposoma en condiciones adecuadas para la tagmentación, comprendiendo el segundo transposoma un segundo transposón y una segunda enzima transposasa que tiene un segundo perfil de tagmentación, generando de este modo un segundo ácido nucleico tagmentado y creando una biblioteca de secuenciación.

En un aspecto, en el presente documento se describen métodos de preparación de una biblioteca de secuenciación. Los métodos incluyen proporcionar un primer transposoma, comprendiendo el primer transposoma que comprende un primer transposón una primera enzima transposasa que tiene un primer perfil de tagmentación. Un ácido nucleico diana se combina con la primera enzima transposasa en condiciones adecuadas para la tagmentación, generando de este modo un primer ácido nucleico tagmentado. El primer ácido nucleico tagmentado se combina con un segundo transposoma en condiciones adecuadas para la tagmentación, comprendiendo el segundo transposoma un segundo transposón y una segunda enzima transposasa que tiene un segundo perfil de tagmentación, en el que el segundo transposoma se inmoviliza sobre un segundo soporte sólido, generando de este modo un segundo ácido nucleico tagmentado y creando una biblioteca de secuenciación.

En un aspecto, en el presente documento se describen métodos de preparación de una biblioteca de secuenciación. Los métodos incluyen proporcionar un primer transposoma, comprendiendo el primer transposoma que comprende un primer transposón una primera enzima transposasa que tiene un primer perfil de tagmentación. Se combina un ácido nucleico con la primera enzima transposasa en condiciones adecuadas para la tagmentación, generando de este modo un primer ácido nucleico tagmentado. El primer ácido nucleico tagmentado se combina con un segundo transposoma en condiciones adecuadas para la tagmentación, comprendiendo el transposoma un segundo transposón y una segunda enzima transposasa que tiene un segundo perfil de tagmentación, creando de este modo una biblioteca de secuenciación.

En un aspecto, en el presente documento se describen métodos de preparación de una biblioteca de secuenciación. Los métodos incluyen proporcionar un primer transposoma, comprendiendo el primer transposoma que comprende un primer transposón una primera enzima transposasa que tiene un primer perfil de tagmentación. Se combina un ácido nucleico con la primera enzima transposasa en condiciones adecuadas para la tagmentación, generando de este modo un primer ácido nucleico tagmentado. El primer ácido nucleico tagmentado se separa sustancialmente del tampón de reacción utilizado para la primera reacción de tagmentación. El primer ácido nucleico tagmentado se combina a continuación con un segundo transposoma en condiciones adecuadas para la tagmentación, comprendiendo el segundo transposoma un segundo transposón y una segunda enzima transposasa que tiene un segundo perfil de tagmentación, generando de este modo un segundo ácido nucleico tagmentado. El segundo ácido nucleico tagmentado, generando de este modo una biblioteca de secuenciación. En algunas realizaciones, el primer conjunto de ácidos nucleicos tagmentados se amplifica opcionalmente.

En otro aspecto, los métodos divulgados en el presente documento incluyen tagmentación, que comprende: (a) proporcionar un primer transposoma, comprendiendo el primer transposoma que comprende un primer transposón una primera enzima transposasa que tiene un primer perfil de tagmentación; (b) proporcionar un segundo transposoma, comprendiendo el segundo transposoma un segundo transposón y una segunda enzima transposasa que tiene un segundo perfil de tagmentación; (c) combinar un ácido nucleico diana con el primer transposoma y el segundo transposoma en condiciones adecuadas para la tagmentación, generando de este modo un ácido nucleico tagmentado. En algunas realizaciones, los transposomas primero y segundo se añaden simultáneamente.

En algunas realizaciones, el primer transposón del primer transposoma comprende un primer adaptador y el segundo transposón del segundo transposoma comprende un segundo adaptador. En algunas realizaciones, el primer y el segundo adaptador son diferentes. En algunas realizaciones, el primer y el segundo adaptador comprenden una secuencia seleccionada entre el grupo que consiste en códigos de barras, secuencias de unión a cebador, sitios de endonucleasa de restricción e índices moleculares únicos.

En algunas realizaciones, el primer, segundo, o ambos transposomas, se inmovilizan sobre un segundo soporte sólido. Algunos soportes sólidos ilustrativos incluyen, pero sin limitación, perlas, superficies de celda de flujo, columnas de centrifugación y matrices de columna. En algunas realizaciones, la primera superficie y la segunda superficie son diferentes. En algunas realizaciones, el primer y el segundo soporte sólido son perlas. En algunas realizaciones, los primeros transposomas se inmovilizan sobre un soporte sólido. En algunas realizaciones, los primeros transposomas inmovilizados sobre un soporte sólido se mantienen unidos al ácido nucleico diana tagmentado y los primeros ácidos nucleicos tagmentados se separan de la solución utilizando el soporte sólido (por ejemplo, perlas de estreptavidina, perlas magnéticas, etc.).

En algunas realizaciones de los aspectos anteriores, el primer ácido nucleico tagmentado se amplifica antes de ponerlo en contacto con el segundo transposoma. En algunas realizaciones de los aspectos anteriores, se amplifica el segundo ácido nucleico tagmentado. En algunas realizaciones, se llevan a cabo dos conjuntos de secuenciación. En el primer conjunto de secuenciación, se amplifica el primer ácido nucleico tagmentado. En el segundo conjunto de amplificación, se amplifica adicionalmente el segundo ácido nucleico tagmentado.

En algunas realizaciones, el primer perfil de tagmentación y el segundo perfil de tagmentación son diferentes. En algunas realizaciones, la primera transposasa y la segunda transposasa tienen un sesgo de inserción diferente. En algunas realizaciones, los perfiles de tagmentación primero y segundo tienen diferentes frecuencias de omisión de AT. En algunas realizaciones, los perfiles de tagmentación primero y segundo tienen diferentes frecuencias de omisión de GC. En algunas realizaciones, el primer perfil de tagmentación tiene una mayor frecuencia de omisión de GC en comparación con el segundo perfil de tagmentación. En algunas realizaciones, la primera transposasa tiene un mayor sesgo de inserción hacia una región rica en AT en comparación con la segunda transposasa. En algunas realizaciones, el segundo perfil de tagmentación tiene una mayor frecuencia de omisión de AT en comparación con el primer perfil de tagmentación. En algunas realizaciones, la segunda transposasa tiene un mayor sesgo de inserción hacia una región rica en GC en comparación con la primera transposasa.

En algunas realizaciones, el primer perfil de tagmentación tiene una mayor frecuencia de omisión de AT en comparación con el segundo perfil de tagmentación. En algunas realizaciones, la primera transposasa tiene un mayor sesgo de inserción hacia una región rica en GC en comparación con la segunda transposasa. En algunas realizaciones, el segundo perfil de tagmentación tiene una mayor frecuencia de omisión de GC en comparación con el primer perfil de tagmentación. En algunas realizaciones, la segunda transposasa tiene un mayor sesgo de inserción hacia una región rica en AT en comparación con la segunda transposasa.

En algunas realizaciones, el tampón de reacción utilizado para la primera reacción de tagmentación se diluye para permitir la reacción de tagmentación con el segundo transposoma. En algunas realizaciones, el tampón de reacción utilizado para la primera reacción de tagmentación se diluye al menos 1,5 veces, 2 veces, 2,5 veces, 3 veces, 4 veces, 5 veces, 6 veces, 7 veces, 8 veces, 9 veces, 10 veces, 12,5 veces, 15 veces, 20 veces, 25 veces, 30 veces, 40 veces, 50 veces, 60 veces, 70 veces, 80 veces, 90 veces, 100 veces, 125 veces, 200 veces, 250 veces, 300 veces o más. En algunas realizaciones, el primer ácido nucleico tagmentado se mantiene inmovilizado sobre un soporte sólido durante la dilución. En algunas realizaciones, el primer ácido nucleico tagmentado se mantiene unido a una o más primeras transposasas durante la dilución. En algunas realizaciones, el primer ácido nucleico tagmentado se mantiene unido a uno o más de los primeros transposomas y los primeros transposomas se inmovilizan sobre un soporte sólido, inmovilizando de este modo el primer ácido nucleico tagmentado.

En algunas realizaciones, los transposomas primero y segundo tienen un perfil de tagmentación diferente para un genoma particular.

En algunas realizaciones, la primera transposasa para la primera reacción de tagmentación es Mos-1 y la segunda transposasa para la segunda reacción de tagmentación es la transposasa Tn5 (por ejemplo, EZTn5™, NexteraV2, o TS-Tn5059).

En una realización, la primera transposasa para la primera reacción de tagmentación es la transposasa Tn5 (por ejemplo, EZTn5™, NexteraV2 o TS-Tn5059) y una segunda transposasa para la segunda reacción de tagmentación es la transposasa Mos1 para generar una biblioteca de ADN tagmentado. En un ejemplo, la segunda reacción de tagmentación utilizando Mos1 se realiza inmediatamente después de la primera reacción de tagmentación utilizando Tn5 (es decir, no se utiliza una etapa de limpieza para eliminar Tn5 del ADN antes de la segunda reacción de tagmentación).

En otra realización, los métodos de la invención utilizan una primera reacción de tagmentación utilizando transposasas Mos1, seguido de una etapa de limpieza de la muestra y una segunda reacción de tagmentación utilizando transposasas Tn5 (por ejemplo, EZTn5™, NexteraV2 o TS-Tn5059) para generar una biblioteca de ADN tagmentado. En un ejemplo, la etapa de limpieza es una etapa de limpieza de ADN realizada utilizando el kit DNA Clean & Concentrator™ (Zymo Research). En esta etapa de limpieza, se desnaturaliza Mos1 y se retira del ADN. En otro ejemplo, la etapa de limpieza de la muestra se realiza usando perlas Agencourt AMPure (Beckman Coulter, Inc.). En este ejemplo, la etapa de limpieza es una etapa de intercambio de tampón, en donde los transposomas de Mos1 se mantienen unidos al ADN.

En otra realización, los métodos de la invención utilizan una primera reacción de tagmentación utilizando transposasas Mu o HyperMu™, seguido de una etapa de limpieza de la muestra y una segunda reacción de tagmentación utilizando transposasas Tn5 (por ejemplo, EZTn5™, NexteraV2 o TS-Tn5059) para generar una biblioteca de ADN tagmentado. En un ejemplo, la etapa de limpieza es una etapa de limpieza de ADN realizada utilizando el kit DNA Clean & Concentrator™ (Zymo Research). En esta etapa de limpieza, se desnaturaliza Mu o HyperMu™ y se retira del ADN. En otro ejemplo, la etapa de limpieza de la muestra se realiza usando perlas Agencourt AMPure (Beckman Coulter, Inc.). En este ejemplo, la etapa de limpieza es una etapa de intercambio de tampón, en donde las transposasas Mu o HyperMu™ se mantienen unidas al a Dn . La figura 23 muestra un esquema ilustrativo de preparación de una biblioteca de secuencias mediante tagmentación secuencial utilizando transposomas HyperMu™ y Nextera. El ADN de entrada se somete en primer lugar a tagmentación utilizando el complejo “ Mu-Nextera” etiquetado. A continuación, se amplifica esta biblioteca mediante PCR, de tal forma que cada fragmento se representa múltiples veces en la reacción amplificada. La biblioteca amplificada se somete a una 2.a ronda de tagmentación con el kit básico de Nextera en un régimen de concentración en el que la enzima es el factor limitante. Esto garantiza que cada molécula individual se tagmenta mínimamente con el complejo de Nextera para preservar la máxima continuidad de la información. A continuación, se secuencia la biblioteca generada. Todos los fragmentos de Nextera que se han generado a partir del mismo amplicón comparten el mismo código de barras (o etiqueta terminal), que puede usarse en el ensamblaje final.

En algunas realizaciones, la cantidad de la primera y segunda transposasa puede ser igual. En algunas realizaciones, la cantidad de la primera y segunda transposasa puede ser diferente.

En una realización, los métodos se utilizan para análisis metagenómicos utilizando muestras microbianas.

Tagmentación secuencial para metagenómica y microbioma

La tagmentación secuencial en todas sus formas puede aplicarse a muestras microbianas para aplicaciones metagenómicas. En algunos ejemplos, el rendimiento de una sola transposasa está altamente afectado por su sesgo y el contexto de secuencia del ADN diana. En caso de que la muestra contenga múltiples especies con diferentes composiciones de secuencia de ADN, la tagmentación puede tener un mejor rendimiento para algunas que para otras. El ADN genómico de algunas especies puede producir fragmentos relativamente más grandes o mucho más pequeños, lo que sesga su representación en la celda de flujo. Esto provocará la pérdida de información metagenómica. En casos extremos, algunas especies pueden no tener representación en la celda de flujo.

El uso de la tagmentación secuencial puede ayudar a reducir el sesgo general de la tagmentación. Concretamente, pueden aplicarse diferentes proporciones de las dos enzimas para retocar la preparación de bibliotecas de diversas composiciones genómicas. Pueden aplicarse múltiples tagmentaciones secuenciales con diferentes proporciones de enzima a la misma muestra. Esto ayuda a capturar una mayor variedad de especies en una muestra de microbioma. Por ejemplo, la muestra puede dividirse en múltiples muestras más pequeñas y aplicar tagmentaciones secuenciales con diferentes proporciones de enzima en cada una. Las diferentes proporciones de enzimas pueden ayudar a capturar mejor datos de secuenciación de diferentes especies en la muestra de microbioma.

Además, puede establecerse un cribado rápido en función de la distribución del tamaño de los fragmentos. Una muestra de microbioma (de una fuente concreta, como el intestino) puede dividirse en muestras de menor tamaño; pueden aplicarse múltiples tagmentaciones secuenciales con diferentes proporciones de enzima a cada una y la distribución del tamaño de los fragmentos de cada una puede almacenarse como valor de referencia. La muestra de la misma fuente puede someterse al mismo proceso y los cambios importantes en las distribuciones de tamaño de los fragmentos pueden indicar un cambio importante en el microbioma. Esto puede usarse en una prueba rápida para comprobar si está cambiando la flora del microbioma de una fuente.

Como se usa en el presente documento, el término “tagmentación” se refiere a la modificación del ADN con un complejo de transposoma que comprende una enzima transposasa y una secuencia terminal de transposón, en el que la secuencia terminal de transposón comprende una secuencia adaptadora. La tagmentación da como resultado la fragmentación simultánea del ADN y el ligamiento de los adaptadores a los extremos 5' de ambas hebras de los fragmentos dúplex.

Después de una etapa de purificación para retirar la enzima transposasa, pueden añadirse secuencias adicionales a los extremos de los fragmentos adaptadores, por ejemplo, mediante PCR, ligamiento o cualquier otra metodología adecuada conocida por los expertos en la materia.

El método de la invención puede utilizar cualquier transposasa que pueda aceptar una secuencia terminal de transposasa y un fragmento de ácido nucleico, uniendo un extremo transferido pero no un extremo no transferido. Un “transposoma” está formado por al menos una enzima transposasa y un sitio de reconocimiento de transposasa. En algunos sistemas de este tipo, denominados “transposomas” , la transposasa puede formar un complejo funcional con un sitio de reconocimiento de transposón que es capaz de catalizar una reacción de trasposición. La transposasa o la integrasa puede unirse al sitio de reconocimiento de transposasa e insertar el sitio de reconocimiento de transposasa en un ácido nucleico diana en un proceso en ocasiones denominado “tagmentación” . En algunos eventos de inserción de este tipo, puede transferirse una hebra del sitio de reconocimiento de transposasa al ácido nucleico diana.

En los métodos de preparación de muestras estándar, cada cadena molde contiene un adaptador en cualquiera de los extremos del inserto y normalmente son necesarias varias etapas tanto para modificar el ADN o el ARN como para purificar los productos deseados de las reacciones de modificación. Estas etapas se realizan en solución antes de la adición de los fragmentos adaptados a una celda de flujo, donde se acoplan a la superficie mediante una reacción de extensión de cebador que copia el fragmento hibridado al extremo de un cebador unido covalentemente a la superficie. Estas cadenas molde “ semilla” dan lugar a continuación a grupos monoclonales de cadenas molde copiadas mediante varios ciclos de amplificación.

El número de etapas necesario para transformar el ADN en cadenas molde modificadas con adaptador en solución listas para la formación de grupos y la secuenciación puede minimizarse utilizando fragmentación y etiquetado mediado por transposasas.

En algunas realizaciones, la tecnología basada en transposones puede utilizarse para fragmentar el ADN, por ejemplo, como se ilustra en el flujo de trabajo de los kits de preparación de muestras de ADN de Nextera™ (Illumina, Inc.), en donde el ADN genómico puede fragmentarse mediante un transposoma modificado por ingeniería genética que fragmenta y etiqueta simultáneamente (“tagmentación” ) el ADN de entrada, creando de este modo una población de moléculas de ácido nucleico fragmentadas que comprenden secuencias adaptadoras únicas en los extremos de los fragmentos.

Algunas realizaciones pueden incluir el uso de una transposasa Tn5 hiperactiva y un sitio de reconocimiento de transposasa de tipo Tn5 (Gory Shin y Reznikoff, J. Biol. Chem., 273:7367 (1998)), o una transposasa MuA y un sitio de reconocimiento de transposasa Mu que comprende secuencias terminales R1 y R2 (Mizuuchi, K., Cell, 35: 785, 1983; Savilahti, H, y col., EMBO J., 14: 4893, 1995). Un sitio de reconocimiento de transposasa ilustrativo que forma un complejo con una transposasa Tn5 hiperactiva (por ejemplo, transposasa EZ-Tn5™, Epicentre Biotechnologies, Madison, Wis.).

Ejemplos adicionales de sistemas de trasposición que pueden utilizarse con determinadas realizaciones proporcionadas en el presente documento incluyen Tn552 de Staphylococcus aureus (Colegio y col., J. Bacteriol., 183: 2384-8, 2001; Kirby C y col., Mol. Microbiol., 43: 173-86, 2002), Ty1 (Devine y Boeke, Nucleic Acids Res., 22: 3765 72, 1994 y Publicación Internacional WO 95/23875), el transposón Tn7 (Craig, N L, Science. 271: 1512, 1996; Craig, N L, Revisado en: Curr Top Microbiol Immunol., 204:27-48, 1996), Tn/O e IS10 (Kleckner N, y col., Curr Top Microbiol Immunol., 204:49-82, 1996), transposasa Mariner (Lampe D J, y col., EMBO J., 15: 5470-9, 1996), Tc1 (Plasterk R H, Curr. Topics Microbiol. Immunol., 204: 125-43, 1996), elemento P (Gloor, G B, Methods Mol. Biol., 260: 97-114, 2004), Tn3 (Ichikawa y Ohtsubo, J Biol. Chem. 265:18829-32, 1990), secuencias de inserción bacterianas (Ohtsubo y Sekine, Curr. Top. Microbiol. Immunol. 204: 1-26, 1996), retrovirus (Brown, y col., Proc Natl Acad Sci USA, 86:2525-9, 1989), y retrotransposón de levadura (Boeke y Corces, Annu Rev Microbiol. 43:403-34, 1989). Algunos ejemplos adicionales incluyen IS5, Tn10, Tn903, IS911, y versiones modificadas por ingeniería genética de enzimas de la familia de las transposasas (Zhang y col., (2009) PLoS Genet. 5:e1000689. Epub 2009 Oct. 16; Wilson C. y col. (2007) J. Microbiol. Methods 71:332-5). Además, los métodos y composiciones proporcionados en el presente documento son útiles con transposasas de la especie Vibrio, incluida Vibrio harveyi, como se expone en más detalle en las divulgaciones de los documentos US 2014/0093916 y 2012/0301925. Brevemente, una “ reacción de trasposición” es una reacción en donde se insertan uno o más transposones en ácidos nucleico diana en sitios aleatorios o en sitios prácticamente aleatorios. Los componentes esenciales en una reacción de trasposición son una transposasa y oligonucleótidos de ADN que muestran las secuencias de nucleótidos de un transposón, incluida la secuencia de transposón transferida y su complemento (es decir, la secuencia terminal del transposón no transferido), así como otros componentes necesarios para formar una trasposición o un complejo de transposoma funcional. Los oligonucleótidos de ADN pueden comprender secuencias adicionales (por ejemplo, secuencias adaptadoras o de cebador), según se necesite o desee.

Los adaptadores que se añaden al extremo 5' y/o 3' de un ácido nucleico pueden comprender una secuencia universal. Una secuencia universal es una región de secuencia de nucleótidos que es común a, es decir, está compartida por, dos o más moléculas de ácido nucleico. Opcionalmente, las dos o más moléculas de ácido nucleico también tienen regiones de diferencias de secuencia. Por tanto, por ejemplo, los adaptadores 5' pueden comprender secuencias de ácido nucleico idénticas o universales y los adaptadores 3' pueden comprender secuencias idénticas o universales. Una secuencia universal que puede estar presente en diferentes miembros de una pluralidad de moléculas de ácido nucleico puede permitir la replicación o la amplificación de múltiples secuencias diferentes utilizando un solo cebador universal que es complementario a la secuencia universal.

Como se usa en el presente documento, la expresión “al menos una porción” y/o los equivalentes gramaticales de la misma pueden hacer referencia a cualquier fracción de una cantidad completa. Por ejemplo, “al menos una porción” puede hacer referencia a al menos aproximadamente un 1 %, 2 %, 3 %, 4 %, 5 %, 6 %, 7 %, 8 %, 9 %, 10 %, 15 %, 20 %, 25 %, 30 %, 35 %, 40 %, 45 %, 50 %, 55 %, 60 %, 65 %, 70 %, 75 %, 80 %, 85 %, 90 %, 95 %, 99 %, 99,9 % o 100 % de una cantidad completa.

Como se usa en el presente documento, el término “aproximadamente” significa /-10 %.

Soporte sólido

En algunas realizaciones, el soporte sólido o su superficie no forma un plano, tal como la superficie interna o externa de un tubo o un recipiente. En algunas realizaciones, el soporte sólido es una superficie de una celda de flujo. En algunas realizaciones, el soporte sólido comprende microesferas o perlas. Por “ microesferas” o “ perlas” o “ partículas” o equivalentes gramaticales se entiende en la presente memoria partículas discretas pequeñas. Las composiciones de perlas adecuadas incluyen, pero sin limitación, plástico, cerámica, vidrio, poliestireno, metilestireno, polímeros acrílicos, materiales paramagnéticos, sol te toria, grafito de carbono, dióxido de titanio, látex o dextranos reticulados, tales como sefarosa, celulosa, nailon, micelas reticuladas y Teflón, así como cualquier otro material indicado en el presente documento para soportes sólidos. La “ Microsphere Detection Guide” de Bangs Laboratories, Fishers Ind. es una guía útil. En determinadas realizaciones, las microesferas son microesferas o perlas magnéticas. En algunas realizaciones, las perlas pueden estar codificadas por colores. Por ejemplo, pueden utilizarse microesferas MicroPlex® de Luminex, Austin, TX.

Las perlas no tienen por qué ser esféricas; pueden utilizarse partículas irregulares. De forma alternativa o adicional, las perlas pueden ser porosas. Los tamaños de las perlas varían de nanómetros, es decir, 100 nm, a milímetros, es decir, 1 mm, prefiriéndose las perlas de aproximadamente 0,2 micrómetros a aproximadamente 200 micrómetros, prefiriéndose particularmente las de aproximadamente 0,5 a aproximadamente 5 micrómetros, aunque en algunas realizaciones pueden utilizarse perlas más pequeñas o más grandes. En algunas realizaciones, las perlas pueden tener un diámetro de aproximadamente 1, 1,5, 2, 2,5, 2,8, 3, 3,5, 4, 4,5, 5, 5,5, 6, 6,5, 7, 7,5, 8, 8,5, 9, 9,5, 10, 10,5, 15 o 20 mm.

Códigos de barras

En general, un código de barras puede incluir una o más secuencias de nucleótidos que pueden utilizarse para identificar uno o más ácidos nucleicos particulares. El código de barras puede ser una secuencia artificial o puede ser una secuencia de origen natural generada durante la trasposición, tal como secuencias de ADN genómico flanqueantes idénticas (códigos g) en el extremo de fragmentos de ADN anteriormente yuxtapuestos. En algunas realizaciones, un código de barras es una secuencia artificial que no es natural con respecto al ácido nucleico diana y se utiliza para identificar el ácido nucleico diana o determinar la información de contigüidad del ácido nucleico diana.

Un código de barras puede comprender al menos 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20 o más nucleótidos consecutivos. En algunas realizaciones, un código de barras comprende al menos aproximadamente 10, 20, 30, 40, 50, 60, 70, 80, 90, 100 o más nucleótidos consecutivos. En algunas realizaciones, al menos una porción de los códigos de barras en una población de ácidos nucleicos que comprenden códigos de barras es diferente. En algunas realizaciones, al menos aproximadamente un 10 %, 20 %, 30 %, 40 %, 50 %, 60 %, 70 %, 80 %, 90 %, 95 %, 99 % de los códigos de barras son diferentes. En más realizaciones de este tipo, todos los códigos de barras son diferentes. La diversidad de diferentes códigos de barras en una población de ácidos nucleicos que comprenden códigos de barras puede generarse de manera aleatoria o generarse de manera no aleatoria.

En algunas realizaciones, una secuencia de transposón comprende al menos un código de barras. En algunas realizaciones, tal como en los transposomas que comprenden dos secuencias de transposón no contiguas, la primera secuencia de transposón comprende un primer código de barras y la segunda secuencia de transposón comprende un segundo código de barras. En algunas realizaciones, una secuencia de transposón comprende un código de barras que comprende una primera secuencia de código de barras y una segunda secuencia de código de barras. En algunas de las realizaciones anteriores, la primera secuencia de código de barras puede identificarse o designarse para su emparejamiento con la segunda secuencia de código de barras. Por ejemplo, puede saberse que una primera secuencia de código de barras conocida se empareja con una segunda secuencia de código de barras conocida empleando una tabla de referencia que comprende una pluralidad de secuencias de códigos de barras primeras y segundas que se sabe que se emparejan entre sí.

En otro ejemplo, la primera secuencia de código de barras puede comprender la misma secuencia que la segunda secuencia de código de barras. En otro ejemplo, la primera secuencia de código de barras puede comprender el complemento inverso de la segunda secuencia de código de barras. En algunas realizaciones, la primera secuencia de código de barras y la segunda secuencia de código de barras son diferentes. Las secuencias de códigos de barras primera y segunda pueden comprender un código doble.

En algunas realizaciones de las composiciones y los métodos descritos en el presente documento, los códigos de barras se utilizan en la preparación de cadenas molde de ácido nucleico. Como se comprenderá, el vasto número de códigos de barras disponibles permite que cada molécula de cadena molde de ácido nucleico comprende una identificación única. La identificación única de cada molécula en una mezcla de cadenas molde de ácido nucleico puede usarse en varias aplicaciones. Por ejemplo, las moléculas identificadas de manera única pueden aplicarse para identificar moléculas de ácido nucleico individuales en muestras que tienen múltiples cromosomas, en genomas, en células, en tipos celulares, en patologías celulares y en especies, por ejemplo, en la secuenciación de haplotipos, en la discriminación de alelos precursores, en secuenciación de metagenómica y en secuenciación de muestras de un genoma.

Las secuencias de códigos de barras ilustrativas incluyen, pero sin limitación, TATAGCCT, ATAGAGGC, CCTATCCT, GGCTCTGA, AGGCGAAG, TAATCTTA, CAGGACGT y GTACTGAC.

Ácidos nucleicos diana

Un ácido nucleico diana puede incluir cualquier ácido nucleico de interés. Los ácidos nucleicos diana pueden incluir ADN, ARN, ácidos nucleicos peptídicos, ácidos nucleicos de morfolino, ácidos nucleicos bloqueados, ácidos nucleicos de glicol, ácidos nucleicos de treosa, muestras mixtas de ácidos nucleicos, ADN poliploide (es decir, ADN vegetal), mezclas de los mismos e híbridos de los mismos. En una realización preferida, el ADN genómico o las copias amplificadas del mismo se utilizan como el ácido nucleico diana. En otra realización preferida, se utiliza ADNc, ADN mitocondrial o ADN de cloroplastos.

Un ácido nucleico diana puede comprender cualquier secuencia nucleotídica. En algunas realizaciones, el ácido nucleico diana comprende secuencias homopoliméricas. Un ácido nucleico diana también puede incluir secuencias repetidas. Las secuencias repetidas pueden tener cualquiera de diversas longitudes, lo que incluye, por ejemplo, 2, 5, 10, 20, 30, 40, 50, 100, 250, 500 o 1000 nucleótidos o más. Las secuencias repetidas pueden estar repetidas, ya sea de manera contigua o no contigua, cualquiera de diversos números de veces, lo que incluye, por ejemplo, 2, 3, 4, 5, 6, 7, 8, 9, 10, 15 o 20 veces o más.

Algunas realizaciones descritas en el presente documento pueden utilizar un solo ácido nucleico diana. Otras realizaciones pueden utilizar una pluralidad de ácidos nucleicos diana. En dichas realizaciones, una pluralidad de ácidos nucleicos diana puede incluir una pluralidad de los mismos ácidos nucleicos diana, una pluralidad de ácidos nucleico diana diferentes, donde algunos ácidos nucleico diana son iguales, o una pluralidad de ácidos nucleicos diana, donde todos los ácidos nucleicos diana son diferentes. Las realizaciones que utilizan diversos ácidos nucleicos diana pueden llevarse a cabo en formatos multiplexados, de tal forma que los reactivos se suministran simultáneamente a los ácidos nucleicos diana, por ejemplo, en una o más cámaras o en una superficie de matriz. En algunas realizaciones, la pluralidad de ácidos nucleicos diana pueden incluir sustancialmente la totalidad del genoma de un organismo concreto. La pluralidad de ácidos nucleicos diana puede incluir al menos una porción del genoma de un organismo particular, por ejemplo, al menos aproximadamente un 1 %, 5 %, 10 %, 25 %, 50 %, 75 %, 80 %, 85 %, 90 %, 95 % o un 99 % del genoma. En realizaciones particulares, la porción puede tener un límite superior que es como máximo aproximadamente un 1 %, 5 %, 10 %, 25 %, 50 %, 75 %, 80 %, 85 %, 90 %, 95 % o un 99 % del genoma.

Los ácidos nucleicos diana pueden obtenerse de cualquier fuente. Por ejemplo, los ácidos nucleicos diana pueden prepararse a partir de moléculas de ácido nucleico obtenidas de un solo organismo o de poblaciones de moléculas de ácido nucleico obtenidas de fuentes naturales que incluyen uno o más organismos. Las fuentes de moléculas de ácido nucleico incluyen, pero sin limitación, orgánulos, células, tejidos, órganos, organismos, células individuales u orgánulos individuales. Las células que pueden usarse como fuentes de moléculas de ácido nucleico diana pueden ser procariotas (células bacterianas, por ejemplo, de los géneros Escherichia, Bacillus, Serratia, Salmonella, Staphylococcus, Streptococcus, Clostridium, Chlamydia, Neisseria, Treponema, Mycoplasma, Borrelia, Legionella, Pseudomonas, Mycobacterium, Helicobacter, Erwinia, Agrobacterium, Rhizobium y Streptomyces); arqueas, tales como crenarqueotas, nanoarqueotas o euriarqueotas; o eucariotas, tales como hongos (por ejemplo, levaduras), plantas, protozoos y otros parásitos, y animales (incluidos insectos (por ejemplo, Drosophila spp.), nematodos (por ejemplo, Caenorhabditis elegans) y mamíferos (por ejemplo, ratas, ratones, monos, primates no humanos y seres humanos). Los ácidos nucleicos diana y las cadenas molde de ácidos nucleicos pueden enriquecerse respecto de secuencias de interés específicas utilizando diversos métodos bien conocidos en la técnica. Algunos ejemplos de dichos métodos se proporcionan en la Publicación Internacional N.° WO/2012/108864. En algunas realizaciones, los ácidos nucleicos pueden enriquecerse adicionalmente durante los métodos de preparación de bibliotecas de cadenas molde. Por ejemplo, pueden enriquecerse determinadas secuencias de los ácidos nucleicos antes de la inserción de los transposomas, después de la inserción de los transposomas y/o después de la amplificación de los ácidos nucleicos.

Además, en algunas realizaciones, los ácidos nucleicos diana y/o las cadenas molde de ácido nucleico pueden estar altamente purificados, por ejemplo, los ácidos nucleicos pueden estar aproximadamente un 70 %, 80 %, 90 %, 95 %, 96 %, 97 %, 98 %, 99 % o un 100 % libres de contaminantes antes de su uso con los métodos proporcionados en el presente documento. En algunas realizaciones, es beneficioso utilizar métodos conocidos en la técnica que mantienen la calidad y el tamaño del ácido nucleico diana, por ejemplo, puede realizarse el aislamiento y/o la trasposición directa del ADN diana utilizando tapones de agarosa. La trasposición también puede realizarse directamente en células, con poblaciones de células, lisados y ADN no purificado.

En algunas realizaciones, el ácido nucleico diana puede ser de una única célula. En algunas realizaciones, el ácido nucleico diana puede proceder de una muestra de tejido fijada en formol y embebida en parafina (FFPE). En algunas realizaciones, el ácido nucleico diana puede ser un ácido nucleico reticulado. En algunas realizaciones, el ácido nucleico diana puede estar reticulado con un ácido nucleico. En algunas realizaciones, el ácido nucleico diana puede estar reticulado con proteínas. En algunas realizaciones, el ácido nucleico diana puede ser ácido nucleico extracelular. Los ácidos nucleicos extracelulares incluyen, pero sin limitación, ADN extracelular, ADN tumoral extracelular, ARN extracelular y ARN tumoral extracelular.

En algunas realizaciones, el ácido nucleico diana puede obtenerse de una muestra biológica o una muestra de paciente. La expresión “ muestra biológica” o “ muestra de paciente” , como se usa en el presente documento, incluye muestras, tales como tejidos y fluidos corporales. Los “fluidos corporales” pueden incluir, pero sin limitación, sangre, suero, plasma, saliva, líquido cefalorraquídeo, líquido pleural, lágrimas, líquido de conducto galactóforo, linfa, esputo, orina, líquido amniótico y semen. Una muestra puede incluir un fluido corporal que es “ acelular” . Un “fluido corporal acelular” incluye menos de aproximadamente un 1 % (m/m) de material celular total. El plasma y el suero son ejemplos de fluidos corporales acelulares. Una muestra puede incluir un espécimen de origen natural o sintético (es decir, una muestra celular que se convierte en acelular).

El término “ plasma” , como se usa en el presente documento, se refiere al fluido acelular que se encuentra en la sangre. El “plasma” puede obtenerse de sangre eliminando el material celular completo de la sangre mediante métodos conocidos en la técnica (por ejemplo, centrifugación, filtración y similares).

Métodos de uso

Las transposasas presentadas en el presente documento pueden utilizarse en un procedimiento de secuenciación, tal como una técnica de trasposición in vitro. En resumen, la trasposición in vitro puede iniciarse poniendo en contacto un complejo de transposoma y un ADN diana. Los procedimientos y sistemas de trasposición ilustrativos que pueden adaptarse fácilmente para su uso con las transposasas de la presente divulgación se describen, por ejemplo, en los documentos WO 10/048605; US 2012/0301925; US 2013/0143774. Por ejemplo, en algunas realizaciones, las enzimas transposasas presentadas en el presente documento pueden usarse en un método para generar una biblioteca de fragmentos de ADN etiquetados a partir de ADN diana que comprende un ADNbc de interés (por ejemplo, para su uso como cadenas molde de secuenciación de próxima generación o de amplificación), comprendiendo el método: incubar el ADN diana en una reacción de trasposición in vitro con al menos una transposasa y una composición de extremo de transposón con el que la transposasa forma un complejo de trasposición, comprendiendo la composición de extremo de transposón (i) una hebra transferida que muestra una secuencia de extremo de transposón transferido y, opcionalmente, una secuencia adicional 5' de la secuencia terminal del transposón transferido y (ii) una hebra no transferida que muestra una secuencia que es complementaria a la secuencia terminal del transposón transferido, en condiciones y durante un tiempo suficiente en donde se producen múltiples inserciones en el ADN diana, cada una de las cuales da como resultado la unión de una primera etiqueta que comprende o consiste en la hebra transferida al extremo 5' de un nucleótido en el ADN diana, fragmentando de este modo el ADN diana y generando una población de fragmentos de ADN hibridados etiquetados en 5', cada uno de los cuales tiene la primera etiqueta en el extremo 5'; y después uniendo los extremos 3' de los fragmentos de ADN etiquetados en 5' a la primera etiqueta o a una segunda etiqueta, generando de este modo una biblioteca de fragmentos de ADN etiquetados (por ejemplo, que comprenden fragmentos de ADNmc circular etiquetados o fragmentos de ADN etiquetados en 5' y 3' (o “fragmentos de ADN doblemente etiquetados” ).

Como se usa en el presente documento, el término “diversidad” se refiere al número de moléculas únicas en una biblioteca. En algunas realizaciones, la diversidad es una indicación de la diversidad (complejidad) de la biblioteca.

Como se usa en el presente documento, “tamaño del inserto” significa el tamaño medio de los fragmentos de la biblioteca. La moda y la media de los tamaños de los insertos se determinaron según los datos de secuenciación, después de determinar la longitud del inserto secuenciado. En algunas realizaciones, el tamaño de los fragmentos se determina utilizando un instrumento BioAnalyzer.

Como se usa en el presente documento, “omisión de GC” significa el porcentaje de regiones ricas en GC en el genoma que se omiten (están ausentes) en la biblioteca tagmentada.

Como se usa en el presente documento, “omisión de AT” significa el porcentaje de regiones ricas en AT en el genoma que se omiten (están ausentes) en la biblioteca tagmentada.

Como se usa en el presente documento, la expresión “ sesgo de inserción” se refiere a la preferencia de secuencia de una transposasa por los sitios de inserción. Por ejemplo, si la frecuencia de fondo de NT/C/G en una muestra de polinucleótido se distribuye a partes iguales (25 % de A, 25 % de T, 25 % de C, 25 % de G), cualquier sobrerrepresentación de un nucleótido con respecto a los otros tres en un sitio de unión a transposasa o sitio de escisión refleja un sesgo de inserción en dicho sitio. El sesgo de inserción puede medirse utilizando uno cualquiera de diversos métodos conocidos en la técnica. Por ejemplo, pueden secuenciarse los sitios de inserción y compararse la abundancia relativa de cualquier nucleótido particular en cada posición en un sitio de inserción.

A menos que se especifique otra cosa, los términos “un” o “una” significan “uno/una o más” a lo largo de la presente solicitud.

Ejemplos

Ejemplo 1

Tagmentación secuencial con Tn5 y Mos1

Tagmentación con Tn5 seguida de tagmentación con Mos1

En algunos experimentos, una primera reacción de tagmentación utilizando transposomas Tn5 (por ejemplo, EZTn5™, NexteraV2 o TS-Tn5059) y una segunda reacción de tagmentación utilizando transposomas Mos1 para generar una biblioteca de ADN tagmentado. En un ejemplo, la segunda reacción de tagmentación utilizando Mos1 se realiza inmediatamente después de la primera reacción de tagmentación utilizando Tn5 (es decir, no se utiliza una etapa de limpieza para eliminar Tn5 del ADN antes de la segunda reacción de tagmentación). La enzima Tn5 utilizada fue EZTn5, Tn5 del kit Nextera V2 o TS-Tn5059 mutante.

Para evaluar el efecto de la tagmentación secuencial usando transposomas Tn5 y Mos1 en el resultado de la biblioteca y las métricas de secuenciación, las bibliotecas de ADN tagmentado se construyeron utilizando ADN genómico de Bacillus cereus. Para cada biblioteca tagmentada secuencialmente, se realizó una primera reacción de tagmentación mezclando 20 ml de ADN genómico de B. cereus (50 ng), 25 ml de tampón de tagmentación estándar 2x (TD 2x; Trisacetato 20 mM, pH 7,6, MgCl210 mM y dimetilformamida (DMF) al 20 %) y diversas concentraciones de transposomas de EZ-Tn5™ (Epicentre) en un volumen total de reacción de 50 ml. El transposoma de EZ-Tn5™ se utilizó a concentraciones finales de 3, 6, 12, 25, 50 y 100 nM. Las reacciones se incubaron a 55 0C durante 5 minutos. Tras completarse la primera reacción de tagmentación, se realizó una segunda reacción de tagmentación utilizando transposomas Mos1. El transposoma de Mos1 se utilizó a concentraciones finales de 20 y 100 nM. Las reacciones que emplearon Mos1 también incluyeron la adición de NaCl a una concentración final de 200 mM. Las reacciones se incubaron a 30 0C durante 60 minutos.

Para cada biblioteca de control de Tn5, se realizó una reacción de tagmentación mezclando 20 ml de ADN genómico de B. cereus, 25 ml de tampón de tagmentación estándar 2x y 5 ml de transposomas EZ-Tn5™ (25 nM) o NexteraV2 (25 nM) en un volumen total de reacción de 50 ml. Las reacciones se incubaron a 55 0C durante 5 minutos.

Después de la reacción de tagmentación, las muestras se procesaron según el resto del protocolo de preparación de muestras estándar de Nextera™ (después de la reacción de tagmentación). Las bibliotecas se secuenciaron mediante secuenciación por síntesis (SBS) y se evaluaron mediante herramientas de análisis de secuenciación de próxima generación estándar. La distribución del tamaño de los fragmentos de cada biblioteca también se evaluó en un instrumento BioAnalyzer.

La figura 1 muestra un diagrama de barras 100 del número de moléculas únicas en las bibliotecas de ADN tagmentadas con EZ-Tn5™ y EZ-Tn5™ Mos1 preparadas utilizando diferentes concentraciones de transposomas. El número de moléculas únicas en una biblioteca es una indicación de la diversidad (complejidad) de la biblioteca.

Cada barra de la gráfica representa una biblioteca tagmentada. Las bibliotecas de control (es decir, bibliotecas que se prepararon utilizando condiciones de reacción estándar de transposomas de EZ-T n5™ o NexteraV225 nM) se indican mediante “ std” . Las bibliotecas que se prepararon utilizando diferentes concentraciones de EZ-Tn5™ se indican mediante “ EZT n5 - concentración de la enzima” . Por ejemplo, la tercera barra en el diagrama de barras 100 se marca como “ EZTn5 - 100 nM” e indica una biblioteca que se preparó utilizando EZ-Tn5™ a una concentración final de 100 nM. Las bibliotecas que se prepararon utilizando tagmentación secuencial con EZ-Tn5™ seguida de Mos1 se denominan siguiendo “ EZTn5 - concentración den la enzima - Mos1 - concentración de la enzima” . Por ejemplo, la novena barra en un diagrama de barras 100 se marca como “ EZTN5 - 100 nM - Mos1 - 20 nM” y designa una biblioteca que se preparó utilizando EZ-Tn5™ a una concentración final de 100 nM, seguido de tagmentación utilizando Mos1 a una concentración final de 20 nM. Todas las bibliotecas se prepararon utilizando la formulación de tampón estándar. Una línea 110 indica un grado estándar de diversidad obtenido en una biblioteca de ADN tagmentada con Tn5.

Los datos demuestran que las bibliotecas tagmentadas preparadas utilizando EZ-Tn5™ a 12 nM-50 nM y tagmentación secuencial con Mos1 a 20 nM tienen una mayor diversidad promedio en comparación con las bibliotecas de control y las bibliotecas preparadas utilizando solo EZ-Tn5™. Por ejemplo, la biblioteca “ EZTn5 - 25 nM - Mos1-20 nM” tiene un aumento de la diversidad de aproximadamente el doble en comparación con las bibliotecas de control o las bibliotecas preparadas utilizando únicamente EZ-Tn5™.

La figura 2 muestra un diagrama de barras 200 del tamaño del inserto en las bibliotecas tagmentadas de la figura 1. El valor de la mediana y el valor de la moda de cada biblioteca tagmentada se generaron a partir de los datos de SBS. Dado que los valores de la mediana y la moda se generaron a partir de los datos de SBS, solo se representan los insertos que se amplificaron en el proceso de amplificación de grupos y se secuenciaron. El valor “ BA” se generó a partir de un trazado de BioAnalyzer de la distribución de tamaños de fragmentos en cada muestra tagmentada. Dado que el valor “ BA” se generó a partir del trazado del instrumento BioAnalyzer, se representan todos los fragmentos generados en la reacción de tagmentación (es decir, los fragmentos más grandes que pueden no estar representados en los datos de SBS). Los datos demuestran que hay variabilidad en el tamaño del inserto en las bibliotecas preparadas utilizando diferentes concentraciones de transposomas. Los datos también demuestran que en “ EZTn5 - 25 nM -Mos1- 20 nM’, que es la biblioteca con el mayor grado de diversidad (figura 1), el tamaño del inserto es aproximadamente el mismo que el tamaño del inserto en la biblioteca “ EZTn5-25 nM” .

La figura 3 muestra un diagrama de barras 300 del porcentaje de omisión de AT y el porcentaje de omisión de GC en las bibliotecas tagmentadas de la figura 1. La omisión de AT puede definirse como el porcentaje de regiones ricas en AT en el genoma que no están presentes en la biblioteca tagmentada. La omisión de GC puede definirse como el porcentaje de regiones ricas en GC en el genoma que no están presentes en la biblioteca tagmentada. Una línea 310 indica un umbral estándar de omisión de AT obtenido en una reacción de tagmentación de Tn5 estándar. En una reacción de tagmentación de Tn5, no se observa normalmente la omisión de GC. Los datos muestran que hay variabilidad en el porcentaje de omisión de AT y GC preparado utilizando diferentes concentraciones de transposoma. Los datos también demuestran que en “ EZTn5 - 25 nM - Mos1- 20 nM” , que es la biblioteca con el mayor grado de diversidad (figura 1), el porcentaje de omisión de AT y GC es sustancialmente menor que el porcentaje de omisión en las bibliotecas de control, por ejemplo, “ EZTn5-std-bcereus” , “ NexteraV2-std-bcereus” y “ EZTn5-25 nM” .

Para evaluar el efecto de la composición del tampón de tagmentación en el producto de la biblioteca y las métricas de secuenciación, se prepararon bibliotecas de B. cereus tagmentadas preparadas utilizando formulaciones modificadas del tampón de tagmentación estándar. Las formulaciones de los tampones fueron las siguientes: tampón estándar (TD) (Tris-acetato 10 mM, pH 7,6, MgCl25 mM y DMF al 10 %); tampón de manganeso (Mn; Tris-acetato 10 mM, pH 7,6, MnCl25 mM y DMF al 10 %); tampón de cobalto (Co; Tris-acetato 10 mM, pH 7,6, CoCl25 mM y DMF al 10 %); y tampón de níquel (Ni; Tris-acetato 10 mM, pH 7,6, NiCl25 mM y DMF al 10 %).

La figura 4 muestra una gráfica 400 del número de moléculas únicas en las bibliotecas de ADN tagmentadas preparadas utilizando diferentes formulaciones de tampón de tagmentación. Las bibliotecas de control que se prepararon utilizando el tampón de tagmentación estándar y el volumen de transposomas (5 ml = transposoma 25 nM) se denominan “ EZTn5 - std - bcereus” y “ NexteraV2 - std - bcereus” . Las bibliotecas que se prepararon utilizando diferentes volúmenes (es decir, 10 ml o 15 ml; o 50 nM y 75 nM, respectivamente) de transposoma de NexteraV2 y la formulación de tampón de tagmentación estándar se denominan “ NexteraV2 - 10 ml” y “ NexteraV2 - 15 ml” . Las bibliotecas de NexteraV2 que se prepararon utilizando una formulación de tampón de tagmentación modificada (por ejemplo, Mn, Co o Ni) se denominan “ NexteraV2 - modificación” o “ NexteraV2 - modificación - ml” , donde “ ml” indica el volumen de transposoma utilizado en la reacción. Las bibliotecas que se prepararon utilizando tagmentación secuencial con NexteraV2 (25 nM) y Mos1 se denominan “ NexteraV2 - MBPmos 1 - 20 nM - Mn” , donde 20 nM es la concentración del transposoma de Mos1 y “ Mn” es la formulación del tampón de manganeso. La reacción de la biblioteca de tagmentación secuencial se repitió tres veces (n = 3) y las bibliotecas individuales se denominan a, b o c.

Los datos muestran que las bibliotecas tagmentadas con NexteraV2 preparadas utilizando un tampón de tagmentación que incluye CoCl2 tienen una mayor diversidad en comparación con las bibliotecas preparadas en tampones sin la adición de CoCl2 (es decir, el tampón de tagmentación estándar y tampones que incluyen MnCl2 o NiCl2). Los datos también demuestran que las bibliotecas preparadas utilizando tagmentación secuencial con NexteraV2 y Mos1 en tampón de Mn tienen una mayor diversidad en comparación con las bibliotecas tagmentadas preparadas solo con NexteraV2 en tampón de Mn.

La figura 5 muestra un diagrama de barras 500 del tamaño del inserto en las bibliotecas tagmentadas de la figura 4. Los datos muestran que el tamaño de los insertos en las bibliotecas tagmentadas con NexteraV2 preparadas utilizando tampones de tagmentación que incluyen CoCl2 o NiCl2 son relativamente mayores en comparación con las bibliotecas tagmentadas preparadas utilizando las formulaciones de tampón estándar o de Mn. Los datos también demuestran que en las bibliotecas tagmentadas secuencialmente con “ NexteraV2 - MBPMos 1 - 20 nM - Mn” , el tamaño del inserto es aproximadamente igual que en la biblioteca de control de NextaraV2 (“ NexteraV2 - std - bcereus” ) y la biblioteca de NexteraV2 preparada en tampón de Mn (“ NexteraV2 - Mn” ).

Haciendo ahora referencia a la figura 4 y la figura 5, los datos también demuestran que en las bibliotecas tagmentadas secuencialmente utilizando la formulación de tampón de Mn (NexteraV2 - MBPMos1 - 20 nM - Mn), aumenta la diversidad de la biblioteca (en relación con los valores de control), mientras que el tamaño del inserto en la biblioteca se mantiene aproximadamente igual (en relación con los valores de control).

La figura 6 muestra un diagrama de barras 600 del porcentaje de omisión de AT y el porcentaje de omisión de GC en las bibliotecas tagmentadas de la figura 4. Los datos demuestran que en las bibliotecas preparadas usando tampón de Mn y tagmentación secuencial con NexterV2 y Mos1 (es decir, “ EZTn5 - 25 nM - Mos1- 20 nM” ) hay una reducción sustancial en el porcentaje de omisión de AT y hay un ligero aumento en el porcentaje de omisión de GC, en comparación con las bibliotecas preparadas utilizando únicamente NexteraV2 y cualquiera de los dos tampones de tagmentación (es decir, “ NexteraV2 - std - bcereus” ) o tampón de Mn (“ NexteraV2 - Mn).

Haciendo ahora referencia a las figuras 4 a 6, los datos demuestran que en las bibliotecas tagmentadas secuencialmente preparadas utilizando la formulación de tampón de Mn (NexteraV2 - MBPMos1 - 20 nM - Mn), la diversidad de la biblioteca (figura 4) aumenta, mientras que el tamaño del inserto (figura 5) en la biblioteca se mantiene aproximadamente igual y el porcentaje de omisión de AT (figura 6) se reduce sustancialmente.

En otro ejemplo, se utilizaron los transposomas Tn5, TS-Tn5059 y Mos1 para generar bibliotecas de B. cereus tagmentadas secuencialmente. En este ejemplo, se realizó una primera reacción de tagmentación utilizando TS-TN5059 a concentraciones finales de 40 nM, 80 nM y 240 nM. Se realizó una segunda reacción de tagmentación usando Mos1 a concentraciones finales de 10 y 20 nM. Todas las bibliotecas se prepararon utilizando la formulación de tampón estándar. Las reacciones que emplearon Mos1 también incluyeron la adición de NaCl a una concentración final de 200 mM. Después de la reacción de tagmentación, se procesaron las muestras según el protocolo estándar de preparación de muestras de Nextera™. Las bibliotecas se evaluaron mediante SBS en un instrumento MiSeq (Illumina, Inc.). La distribución del tamaño de los fragmentos de cada biblioteca también se evaluó en un instrumento BioAnalyzer.

La figura 7 muestra un diagrama de barras 700 del número total de lecturas y la diversidad en bibliotecas tagmentadas con TS-Tn5059 Mos1 preparadas utilizando diferentes concentraciones de transposomas. El número total de lecturas es el número total de lecturas de la celda de flujo. La diversidad es el número de moléculas únicas en la biblioteca y se usa como una indicación de la complejidad de la biblioteca. Cada par de barras de la gráfica representa una biblioteca tagmentada. Las bibliotecas que se prepararon utilizando tagmentación secuencial con TS-Tn5059 y Mos1 se denominan siguiendo “TS-Tn5059 - concentración den la enzima - Mos1 - concentración de la enzima” . Se utilizaron EZTn5™ y NexteraV2 para preparar bibliotecas de control comparativas (por ejemplo, “ EZTn5 - std -bcereus” y “ NexteraV2 - std - bcereus” ). “ NexteraV2 - SSB - bcereus” indica una biblioteca que se preparó utilizando el volumen estándar (5 ml) de transposoma, pero incluyó 10 ml adicionales de diluyente de SSB. “ NexteraV2 - 15 ml - bcereus” indica una biblioteca que se preparó utilizando 15 ml (75 nM) de transposoma NexteraV2. Todas las bibliotecas se prepararon utilizando la formulación de tampón estándar.

Los datos demuestran que la diversidad en la biblioteca TS-Tn5059 - 240 nM - Mos1 - 20 nM es mayor en comparación con la diversidad en las bibliotecas de control EZTn5™ y NexteraV2.

La figura 8 muestra un diagrama de barras 800 del tamaño del inserto en las bibliotecas tagmentadas de la figura 7. Esta gráfica muestra el efecto de la concentración de Mos1 en los tamaños finales de los insertos. Una concentración de Mos1 en el intervalo de 10-20 nM no tiene un impacto importante en los tamaños de los insertos. La figura 9 muestra un diagrama de barras 900 del porcentaje de omisión de AT y el porcentaje de omisión de GC en las bibliotecas tagmentadas de la figura 7. Los datos demuestran que en general, las bibliotecas preparadas utilizando tagmentación secuencial hay una reducción sustancial en el porcentaje de omisión de AT y un ligero aumento en el porcentaje de omisión de GC en comparación con las bibliotecas de control de NexteraV2. Por ejemplo, el porcentaje de omisión de AT en TS-Tn5059 - 40 nM - Mos1 - 20 nM se reduce sustancialmente y el porcentaje de omisión de GC aumenta ligeramente en comparación con la biblioteca NexteraV2 -std -bcereus.

Ejemplo 2

Generación de la biblioteca de secuenciación con el complejo de transposoma de Mu

Para generar la biblioteca de secuenciación se utiliza HyperMu™ (Epicentre, Madison, WI), una transposasa Mu mutante. La transposasa HyperMu™ es una enzima hiperactiva que conserva las características de inserción altamente aleatoria de la transposasa MuA, pero que es al menos 50 veces más activa in vitro que la enzima disponible de otros proveedores. Tras la trasposición con Mu, los brazos del transposón (es decir, RI y RII) junto con cualquier secuencia unida, se transferirán a la cadena molde de ADN, fragmentando al mismo tiempo la cadena molde. La secuencia del transposón de HyperMu™ y las secuencias de cebador se muestran en las Fig. 15-16. La enzima T n5 utilizada fue EZT n5, T n5 del kit Nextera V2.

Evaluación de la actividad del transposoma de Mu

La capacidad de tagmentación del transposoma HyperMu™ se evalúa en un genoma de bacteriófago de ~50 kb. La reacción de tagmentación se llevó a cabo en tampón TA durante una hora a 37 0C a concentraciones crecientes de transposoma de HyperMu™. Los productos de fragmentación se analizaron mediante electroforesis en gel de agarosa y los resultados se muestran en la Fig. 17.

Los complejos de HyperMu™ se utilizaron para tagmentar el cromosoma de E. coli y se amplificaron los fragmentos tagmentados para introducir adaptadores de secuenciación. Se realizaron 25 ciclos de PCR utilizando los cebadores P5-MUTS y P7-MLJTS. Los productos de la PCR se analizaron mediante electroforesis en gel de agarosa y se muestran en la Fig. 18. Los productos de la PCR se observaron con diferentes cantidades de ADN de entrada.

Análisis de ADN tagmentado amplificado mediante PCR

Se utilizaron 3,2 ng de ADN para la secuenciación “ paired end” en GAIIX (2x35 pb). La muestra se secuenció en un solo carril en GA. El número total de lecturas fue de 30.071.951 y el número de lecturas únicas <2000 pb fue de 4.599.874. La estadística del experimento de secuenciación se muestra en la Fig. 19. El tamaño medio de los fragmentos secuenciados fue mucho mayor que Nextera y fue próximo a 800 pb, como se muestra en la Fig. 20.

La uniformidad del experimento de secuenciación fue mejor para HyperMu™ en comparación con Tn5. La uniformidad del experimento de secuenciación fue mejor para HyperMu™ con T n5 en comparación con solo HyperMu™ o T n5. La uniformidad del experimento de secuenciación fue comparable con TruSeq. Los resultados se muestran en la Fig. 21. El sesgo de GC observado para HyperMu™ es similar al de Tn5 y se muestra en la Fig. 22.

Los experimentos expuestos en las figuras 1 -5 se realizaron para caracterizar el efecto de la composición del tampón de tagmentación de Tn5 y las condiciones de reacción en el resultado de la biblioteca y las métricas de secuenciación. Concretamente, en los experimentos expuestos en las Fig. 1-3, se añadió Mos-1 a las reacciones de tagmentación con Tn5. La enzima Tn5 utilizada fue EZT n5, Tn5 del kit Nextera V2 o TS-T n5059 mutante.

En los experimentos expuestos en las Fig. 4 y 5, la reacción de tagmentación con Mos-1 se realizó en primer lugar y el ADN tagmentado se lavó para eliminar el tampón de tagmentación de la primera reacción. Posteriormente, el ADN tagmentado se tagmentó adicionalmente utilizando una enzima Tn5 (EZTn5, Tn5 del kit NexteraV2 o TS-Tn5059 mutante). Varios métodos de lavado probados incluyeron perlas Ampure y el kit Zymo Clean and Concentrator (Zymo).

Para evaluar el efecto de la composición del tampón de tagmentación y las condiciones de reacción en el resultado de la biblioteca y las métricas de secuenciación, se construyeron bibliotecas de ADN tagmentado con Tn5 utilizando ADN genómico de Bacillus cereus. Cada biblioteca tagmentada se preparó utilizando 25 ng de entrada de ADN genómico de B. cereus. El contenido genómico de B. cereus es de aproximadamente un 40 % de GC y aproximadamente un 60 % de AT.

Los tampones de tagmentación se prepararon como formulaciones 2x. Para cada biblioteca, se realizó una reacción de tagmentación mezclando 20 ml de ADN genómico de B. cereus (25 ng), 25 ml de tampón de tagmentación 2x y 5 ml de enzima (Ts-Tn5059 10x o Ts-Tn5 10x) en un volumen total de reacción de 50 ml. Las reacciones se incubaron a 55 0C durante 5 minutos. Después de la reacción de tagmentación, se procesaron las muestras según el protocolo estándar de preparación de muestras de Nextera™. Las bibliotecas se secuenciaron utilizando la química de SBS (secuenciación por síntesis) de Illumina en un dispositivo MiSeq. Los experimentos de secuenciación fueron 2x71 ciclos utilizando un kit MiSeq V2. La distribución del tamaño de los fragmentos en cada biblioteca se evaluó en un instrumento BioAnalyzer.

Ejemplo 3

Tagmentación secuencial con Tn5 y Mos1 en solución

Las transposasas Tn5 tienen actividad reducida en tampones que contienen NaCl >50 mM y las transposasas Mos1 tienen actividad reducida en los tampones que contienen NaCl <150 mM. Puede llevarse a cabo una tagmentación secuencial para optimizar la actividad de ambas enzimas.

Tagmentación con Tn5 seguida de tagmentación con Mos1

Se utiliza tagmentación con Nextera™ (Epicentre, Madison, WI) estándar utilizando condiciones y tampones especificados en los protocolos de preparación de bibliotecas de Nextera. Después de la tagmentación inicial con T n5, la temperatura de reacción se reduce a <30 0C. A continuación, se añade NaCl concentrado a la reacción a una concentración final de 150-300 mM. A continuación se añade el transposoma de Mos1 a la reacción de tagmentación y la reacción se incuba a 30 0C. Una vez se ha completado la tagmentación, se limpia la reacción usando perlas Ampure™ (Beckman Coulter, CA, EE. UU.) o cartuchos Zymo Clean & Concentrator™ (Zymo Research, Irvine, CA). El resto del protocolo para la adición del adaptador mediante PCR y la limpieza y selección de tamaños finales se especifica en el protocolo de preparación de bibliotecas de Nextera™.

Tagmentación con Mos1 seguida de limpieza para eliminar el tampón de alta salinidad, seguida de tagmentación con Tn5

Se utilizan tampones de Nextera™ (Epicentre, Madison, WI) estándar con la inclusión de NaCl 150-300 mM para obtener una actividad de Mos1 óptima. A continuación, se añade Mos1 a la reacción y se incuba a 30 0C. Después de la tagmentación, la reacción se limpia utilizando perlas Ampure™ (Beckman Coulter, CA, EE. UU) o cartuchos Zymo Clean & Concentrator™ (Zymo Research, Irvine, CA) o métodos de purificación de ADN similares. El material de ADN fragmentado y limpiado se utiliza a continuación como entrada de ADN para la tagmentación secundaria utilizando transposomas Tn5 o Tn5 mutantes. Después de la segunda tagmentación, se limpia la reacción usando perlas Ampure™ (Beckman Coulter, CA, EE. UU.) o cartuchos Zymo Clean & Concentrator™ (Zymo Research, Irvine, CA) o métodos similares. El resto del protocolo para la adición del adaptador mediante PCR y la limpieza y selección de tamaños finales se especifica en el protocolo de preparación de bibliotecas de Nextera™(Epicentre, Madison, WI).

Tagmentación con Mos1 seguida de una dilución para reducir el tampón de alta salinidad, seguida de tagmentación con Tn5

Se utilizan tampones de Nextera™ (Epicentre, Madison, WI) estándar con la inclusión de NaCl 150-300 mM para obtener una actividad de Mos1 óptima. A continuación, se añade Mos1 a la reacción y se incuba a 30 0C. Después de la tagmentación, la reacción se diluye con cada tampón de reacción para reducir la concentración de NaCl hasta <50 mM. A continuación, se añade Tn5 a la reacción de tagmentación y se incuba a <55 0C. Después de la segunda tagmentación, se limpia la reacción usando perlas Ampure™ (Beckman Coulter, CA, EE. UU.) o cartuchos Zymo Clean & Concentrator™ (Zymo Research, Irvine, CA) o métodos de purificación de ADN similares. El resto del protocolo para la adición del adaptador mediante PCR y la limpieza y selección de tamaños finales se especifica en el protocolo de preparación de bibliotecas de Nextera™(Epicentre, Madison, WI).

Claims

REIVINDICACIONES

i. Un método para preparar una biblioteca de secuenciación, que comprende:

(a) proporcionar un primer transposoma, comprendiendo el primer transposoma que comprende un primer transposón una primera enzima transposasa que tiene un primer perfil de tagmentación; (b) combinar un ácido nucleico diana con la primera enzima transposasa en condiciones adecuadas para la tagmentación, generando de este modo un primer ácido nucleico tagmentado;

(c) separar sustancialmente el primer ácido nucleico tagmentado del tampón de reacción usado en la etapa (b);

(d) combinar el primer ácido nucleico tagmentado con un segundo transposoma en condiciones adecuadas para la tagmentación, comprendiendo el segundo transposoma un segundo transposón y una segunda enzima transposasa que tiene un segundo perfil de tagmentación, generando de este modo un segundo ácido nucleico tagmentado;

(e) amplificar el segundo ácido nucleico tagmentado, generando de este modo una biblioteca de secuenciación.
2. El método de la reivindicación 1, que además comprende amplificar opcionalmente el primer ácido nucleico tagmentado.
3. El método de una cualquiera de las reivindicaciones 1-2, en donde el primer, segundo, o ambos transposomas, se inmovilizan sobre soportes sólidos, opcionalmente en donde los soportes sólidos son perlas.
4. El método de una cualquiera de las reivindicaciones 1-3, en donde el primer transposón comprende un primer adaptador o el segundo transposón comprende un segundo adaptador.
5. El método de una cualquiera de las reivindicaciones 1-3, en donde el primer transposón comprende un primer adaptador y el segundo transposón comprende un segundo adaptador, en donde el primer y el segundo adaptador son diferentes.
6. El método de una cualquiera de las reivindicaciones 1-5, en donde el primer y el segundo adaptador comprenden una secuencia seleccionada entre el grupo que consiste en códigos de barras, secuencias de unión a cebador, sitios de endonucleasa de restricción e índices moleculares únicos.
7. El método de una cualquiera de las reivindicaciones 1-6, en donde la primera o la segunda enzima transposasa se selecciona entre el grupo que consiste en Mos-1, HyperMu™, Tn5, Ts-Tn5, Ts-Tn5059, Hermes, Tn7.
8. El método de una cualquiera de las reivindicaciones 1-7, en donde el tampón de reacción usado en la etapa (b) se diluye para permitir la reacción de tagmentación con el segundo transposoma.
9. El método de una cualquiera de las reivindicaciones 1 -7, en donde el segundo transposoma se combina con una mezcla de reacción que comprende el primer transposoma y el primer ácido nucleico tagmentado.
10. El método de la reivindicación 9, en donde una o más de la primera transposasa se mantiene unida al primer ácido nucleico tagmentado durante la combinación del primer ácido nucleico tagmentado con un segundo transposoma.
11. Un método de tagmentación que comprende:

(a) proporcionar un primer transposoma, comprendiendo el primer transposoma que comprende un primer transposón una primera enzima transposasa que tiene un primer perfil de tagmentación; (b) proporcionar un segundo transposoma, comprendiendo el segundo transposoma un segundo transposón y una segunda enzima transposasa que tiene un segundo perfil de tagmentación; (c) combinar un ácido nucleico diana con el primer transposoma y el segundo transposoma en condiciones adecuadas para la tagmentación, generando de este modo un ácido nucleico tagmentado.
12. El método de la reivindicación 11, en donde el primer, segundo, o ambos transposomas, se inmovilizan sobre soportes sólidos, opcionalmente en donde los soportes sólidos son perlas.
13. El método de una cualquiera de las reivindicaciones 11-12, en donde el primer transposón comprende un primer adaptador y el segundo transposón comprende un segundo adaptador, en donde el primer y el segundo adaptador son diferentes.
14. El método de una cualquiera de las reivindicaciones 11-13, en donde el primer y el segundo adaptador comprenden una secuencia seleccionada entre el grupo que consiste en códigos de barras, secuencias de unión a cebador, sitios de endonucleasa de restricción e índices moleculares únicos.
15. El método de una cualquiera de las reivindicaciones 11-14, en donde la primera enzima transposasa se selecciona entre el grupo que consiste en Mos-1, HiperMu™, Tn5, Ts-Tn5, Ts-Tn5059, Hermes, Tn7 o la segunda enzima transposasa se selecciona entre el grupo que consiste en Mos-1, HyperMu™, Tn5, Ts-Tn5, Ts-Tn5059, Hermes, Tn7.