ES2998543T3

ES2998543T3 - Method for the generation of dna libraries for massive parallel sequencing

Info

Publication number: ES2998543T3
Application number: ES17718883T
Authority: ES
Inventors: Nicolò Manaresi; Genny Buson; Paola Tononi
Original assignee: Menarini Silicon Biosystems SpA
Current assignee: Menarini Silicon Biosystems SpA
Priority date: 2016-04-15
Filing date: 2017-04-14
Publication date: 2025-02-20
Anticipated expiration: 2037-04-14
Also published as: KR102354422B1; US20230250419A1; SG11201808675VA; ITUA20162640A1; JP6899844B2; EP3443115A1; CN109477245A; JP2019514360A; EP3443115B1; SG10202010198VA; CA3019714A1; KR20190019049A; PL3443115T3; WO2017178655A1; US20200299680A1; EP3443115C0

Abstract

Se describe un método para generar una biblioteca de secuenciación masiva paralela que comprende los pasos de: a) proporcionar una biblioteca de ADN WGA primaria (pWGAlib), que incluye fragmentos que comprenden un adaptador de secuencia universal de biblioteca WGA; b) volver a amplificar la biblioteca de ADN WGA primaria utilizando al menos un primer cebador (1PR) y al menos un segundo cebador (2PR); comprendiendo el al menos un primer cebador (1PR) de 5' a 3' al menos un primer adaptador de secuenciación (1PR5SA), al menos un primer código de barras de secuenciación (1PR5BC) y una primera sección 3' del cebador (1PR3S) que se hibrida con el adaptador de secuencia universal de biblioteca WGA o su complementario inverso; el al menos un segundo cebador (2PR) que comprende de 5' a 3' al menos un segundo adaptador de secuenciación (2PR5SA) diferente del al menos un primer adaptador de secuenciación (1PR5SA), y una segunda sección 3' del cebador (2PR3S) que se hibrida con el adaptador de secuencia universal de la biblioteca WGA o su complementario inverso. (Traducción automática con Google Translate, sin valor legal)

Description

DESCRIPCIÓN

Método y kit para la generación de bibliotecas de ADN para secuenciación masivamente paralela

Campo técnico de la invención

La presente invención se refiere a un método para secuenciación de genoma completo de paso bajo y perfilado de número de copias de genoma completo.

Antecedentes

Con células individuales es útil llevar a cabo una Amplificación del Genoma Completo (WGA) para obtener más ADN con el fin de simplificar y/o hacer posible llevar a cabo diferentes tipos de análisis genéticos, incluyendo secuenciación, detección de SNP, etc.

La WGA con una LM-PCR basada en un sitio de restricción determinista (como se describe, por ejemplo, en W0/2000/017390) se conoce de la técnica (en la presente denominada simplemente DRS-WGA). Se ha demostrado que DRS-WGA es una mejor solución para la amplificación de células individuales (Ref: Lee YS , et al:Comparison of whole genome amplification methods for further quantitative analysis with microarray-based comparative genomic hybridization.Taiwan J Obstet Gynecol. 2008, 47(1):32-41.) y también más resistente a la degradación del ADN debido a la fijación (ref. Stoecklein N.H. et al:SCOMP is Superior to Degenerated Oligonucleotide Primed-PCR for Global Amplification of Minute Amounts of DNA from Microdissected Archival Samples.American Journal of Pathology 2002, Vol. 161, núm. 1).

Se ha utilizado un kit comercial de DRS-WGA basado en LM-PCR(kit Ampli1MRWGA, Silicon Biosystems) en Hodgkinson C.L. et al.,Tumorigenicity and genetic profiling of circulating tumor cells in small-cell lung cancer,Nature Medicine 20, 897-903 (2014). En este trabajo, se realizó un análisis de número de copias mediante secuenciación de genoma completo de paso bajo en material de WGA unicelular. Sin embargo, para el flujo de trabajo estándar utilizado en este documento, la creación de bibliotecas Illumina requirió varios pasos, que incluyeron i) digestión de adaptadores de WGA, ii) fragmentación de ADN y pasos de flujo de trabajo Illumina estándar tal como iii) EndRepair, iv) Adición de cola de adenina v) ligación de adaptadores con código de barras, más los pasos habituales de vi) agrupamiento de muestras de bibliotecas NGS con código de barras y vii) secuenciación. Como se muestra en el artículo mencionado anteriormente (figura 5b), W BC presentó pocas llamadas de número de copia presumiblemente falsas positivas, aunque los CTC en general mostraron muchas más aberraciones.

Ampli1MRWGA es compatible con hibridación genómica comparativa en microarreglos (aCGH); de hecho, varios grupos (Moehlendick B, et al. (2013)A Robust Method to Analyze Copy Number Alterations of Less than 100 kb in Single Cells Using Oligonucleotide Array CGH.PLoS ONE 8(6): e67031; Czyz ZT, et al (2014)Reliable Single Cell Array CGH for Clinical Samples.PLoS ONE 9(1): e85907) demostraron que es adecuado para el análisis del número de copias de alta resolución. Sin embargo, la técnica aCGH es costosa y requiere mucha mano de obra, por lo que pueden ser deseables diferentes métodos, tal como la secuenciación de genoma completo de paso bajo (LPW GS) para la detección de alteraciones somáticas del número de copias (CNA).

Baslan et al(Optimizing sparse sequencing of single cells for highly multiplex copy number profiling,Genome Research, 25:1-11, 9 de abril de 2015), lograron el perfil de número de copias del genoma completo a partir de la amplificación del genoma completo por DOP-PCR, utilizando varios pasos enzimáticos, incluida la digestión de adaptador de WGA, la ligación de adaptadores Illumina, la amplificación por PCR.

Yan et al. Proc Natl Acad Sci EE .U U . 29 de diciembre de 2015; 112 (52): 15964-9, enseñan el uso de MALBAC WGA (Yikon Genomics Inc), para el diagnóstico genético preimplantacional simultáneo de anomalías cromosómicas y enfermedad monogénica.

US8206913B1 (Kamberov et al, Rubicon Genomics) enseña un enfoque donde se adopta una PCR de cebado de oligonucleótido degenerado especial (DOP-PCR). Esta referencia también contiene una descripción general de los diferentes métodos de WGA y el estado de la técnica. US8206913B1 está en la base del kit comercial PicoPlex.

Hou et al.,Comparison of variations detection between whole-genome amplification methods used in single-cell resequencing,GigaScience (2015) 4:37, reportan la comparación de rendimiento de varios métodos de WGA, que incluye MALBAC y amplificación por desplazamiento múltiple (MDA). LPW GS y W GS se utilizan en el documento. La preparación de la biblioteca se obtiene con flujos de trabajo.

Se ha demostrado que DRS-WGA es mejor que DOP-PCR para el análisis de perfiles de número de copias a partir de cantidades diminutas de material de FFP E microdiseccionado (Stoecklein et al.,SCOMP is superior to degenerated oligonucleotide primed-polymerase chain react ion for global amplification of minute amounts of DNAfrom microdissected archival tissue samples,Am J Pathol. 2002 Jul;161(1):43-51; Arneson et al.,Comparison of whole genome amplification methods for analysis of DNA extracted from microdissected early breast lesions in formalin-fixed paraffin-embedded tissue,ISRN Oncol. 2012;2012:710692. doi: 10.5402/2012/710692. Epub 14 de marzo de 2012), cuando se usa CGH (hibridación genómica comparativa) en microarreglos, CGH en metafase, así como para otro ensayo de análisis genético tal como pérdida de heterocigosidad.

W02014068519 (Fontana et al.) enseña un método para detectar mutaciones de productos de DRS-WGA en loci donde la mutación introduce, elimina o altera un sitio de restricción.

W02015083121A1 (Klein et al.) enseña un método para evaluar la integridad de genoma de una célula y/o la calidad de un producto de DRS-WGA mediante una PCR múltiple, como se detalla e informa adicionalmente en Polzer et al. EMBO Mol Med. 30 de octubre de 2014; 6 (11): 1371-86.

Aunque la DRS-WGA proporciona los mejores resultados en términos de amplificación uniforme y equilibrada, los protocolos actuales basados en aCGH o CGH en metafase son laboriosos y/o costosos. Se ha propuesto la secuenciación de todo el genoma de paso bajo como un método de alto rendimiento para analizar varias muestras con mayor procesividad y menor costo que aCGH. Sin embargo, los métodos conocidos para la generación de una biblioteca de secuenciación masivamente paralela para productos WGA (tal como DRS-WGA) aún requieren protocolos que incluyen varios pasos y reacciones enzimáticas.

Más allá de la aplicación al análisis de CTC citado anteriormente, también para otras aplicaciones de análisis de células individuales, tal como el diagnóstico prenatal en blastocistos, así como para células fetales circulantes recolectadas de sangre materna, sería deseable tener un método más simplificado, que combine la reproducibilidad y la calidad de DRS-WGA con la capacidad de analizar variantes de número de copias (CNV) de genoma completo. Además, sería deseable determinar un perfil de número de copias de genoma completo también a partir de una cantidad diminuta de células, F F P E o biopsias de tejido.

WO 2014/071361 divulga un método para preparar una biblioteca para la secuenciación que comprende agregar oligos adaptadores de tallo bucle al ADN genómico fragmentado. Luego, los bucles se escinden, lo que da como resultado fragmentos de genoma flanqueados por adaptadores bicatenarios. Luego, los fragmentos se amplifican con cebadores que comprenden un código de barras y se utilizan para la secuenciación de ADN en una plataforma de secuenciación Ion Torrent.

Este método tiene una serie de inconvenientes, los más importantes de los cuales son:

- el método implica una serie de pasos posteriores que implican varias reacciones y varias enzimas;

- el método no es aplicable como tal en el ADN derivado de una muestra unicelular.

Breve descripción de la invención

Un objeto de la presente invención es proporcionar un método para secuenciación de genoma completo de paso bajo que sea más simple y requiera menos pasos con respecto a los métodos de la técnica anterior. En particular, un objeto de la presente invención es proporcionar un método que incluya menos reacciones enzimáticas que las informadas generalmente en la literatura.

Otro objeto de la invención es proporcionar un método para generar un perfil de número de copias de todo el genoma usando el método para secuenciación de genoma completo de paso bajo de acuerdo con la invención.

Preferentemente, la biblioteca utilizada en el método de secuenciación de genoma completo de paso bajo debe ser compatible con una plataforma de secuenciación seleccionada, por ejemplo, plataforma Ion Torrent o plataforma Illumina.

La presente invención se refiere a un método para generar una biblioteca de secuenciación masivamente paralela para la secuenciación de genoma completo a partir de productos de amplificación de genoma completo como se define en las reivindicaciones adjuntas. La invención se refiere además a un método para generar un perfil de número de copias de todo el genoma usando el método para secuenciación de genoma completo de paso bajo de la invención.

También se proporcionan secuencias de cebadores y protocolos operativos.

Preferentemente, la reacción de generación de biblioteca comprende la introducción de un código de barras de secuenciación para multiplexar varias muestras en la misma corrida de NGS. Preferiblemente, la WGA es una DRS-WGA y la biblioteca se genera con una reacción de PCR de un solo tubo y un solo paso.

Breve descripción de los dibujos

La figura 1 muestra un producto de partida para que se utilice en una primera realización de la invención, que consiste en una biblioteca de ADN generada por DRS-WGA, de la cual se ilustra un fragmento individual de una manera puramente esquemática;

La figura 2 muestra un producto de partida para que se utilice en una segunda realización de la invención, que consiste en una biblioteca de ADN generada por MALBAC, de la cual se ilustra un fragmento individual de una manera puramente esquemática;

La figura 3 muestra de manera esquemática una realización del paso de reamplificación del método para generar una biblioteca de secuenciación masivamente paralela divulgada en la presente aplicada al fragmento de una biblioteca de ADN generada por DRS-WGA como se muestra en la figura 1 y dirigida a proporcionar una biblioteca de ADN compatible con una plataforma de secuenciación del tipo de la plataforma de secuenciación Ion Torrent o Illumina;

La figura 4 muestra de manera esquemática el flujo de trabajo del protocolo que incluye un paso de reacción de reamplificación aplicada al fragmento de un DRS-WGA como se muestra en la figura 1, y posteriormente una selección de biblioteca de fragmentos. Este método proporciona directamente una biblioteca de ADN compatible con la plataforma de secuenciación ILLUMINA;

La figura 5 muestra de manera esquemática la biblioteca de ADN monocatenario final obtenida de acuerdo con un método para generar una biblioteca de secuenciación masivamente paralela divulgada en la presente aplicada a un fragmento de DRS-WGA siguiendo los pasos mostrados en la figura 4; además, la figura 5 ilustra la biblioteca de ADNmc secuenciada final y los cebadores de secuenciación personalizados diseñados; a partir de unos cientos de células tumorales clasificadas digitalmente de FFP E con el sistema DEPArray (Bolognesi et al.) se genera una biblioteca DRS-WGA;

La figura 6 muestra los resultados de secuenciación de una secuenciación de genoma completo de paso bajo realizada a partir de unos cientos de células tumorales clasificadas digitalmente de FFP E con sistema DEPArray en una biblioteca de ADN preparada de acuerdo con el método divulgado y secuenciada por plataforma PGM; La figura 7 muestra los resultados de secuenciación de la secuenciación de todo el genoma de paso bajo realizada por el protocolo PGM en bibliotecas de ADN preparadas en dos células tumorales diferentes;

La figura 8 muestra los resultados de secuenciación de una secuenciación de genoma completo de paso bajo realizada mediante un protocolo 1 ILLUMINA en bibliotecas de ADN preparadas de acuerdo con el método divulgado y compara los resultados obtenidos de una célula de W BC normal y una célula anormal (tumoral); y La figura 9 muestra los resultados de secuenciación de una secuenciación de genoma completo de paso bajo realizada por un protocolo 2 ILLUMINA de acuerdo con un aspecto de la invención en bibliotecas de ADN preparadas de acuerdo con el método divulgado.

Descripción detallada

Definiciones

A menos que se defina lo contrario, todos los términos técnicos y científicos utilizados en la presente tienen el mismo significado como se entiende comúnmente por un experto en la técnica a la que pertenece esta invención. A menos que se mencione lo contrario, las técnicas descritas en la presente para su uso con la invención son metodologías estándar bien conocidas por personas expertas en la técnica.

Por el término "sitio de digestión (DS)" o "sitio de restricción (RS)" se entiende la secuencia de nucleótidos (típicamente 4-8 pares de bases (pb) de longitud) a lo largo de una molécula de ADN reconocida por la enzima de restricción en cuanto a dónde corta a lo largo de la cadena de polinucleótidos.

Por el término "sitio de escisión" se entiende el sitio en una cadena de polinucleótidos en cuanto a donde la enzima de restricción escinde nucleótidos mediante la hidrólisis del enlace fosfodiéster entre ellos.

Por el término "amplicón" se entiende una región de ADN producida por una amplificación por PCR.

Por el término "amplicón de DRS-WGA" o, en resumen, "amplicón de WGA" se entiende un fragmento de ADN amplificado durante DRS-WGA, que comprende una secuencia de ADN entre dos RS flanqueadas por los adaptadores ligados.

Por el término "ADN original" se entiende el ADN genómico (ADNg) antes de la amplificación con la DRS-WGA.

Por el término "adaptador" o "adaptador de WGA" o "cebador de PCR de WGA" o "adaptador de secuencia universal de biblioteca de WGA" se entiende el oligonucleótido adicional ligado a cada fragmento generado por la acción de la enzima de restricción, en el caso de DRS-WGA, o la secuencia de polinucleótidos conocida presente en la sección 5' de cada molécula de la biblioteca de ADN de WGA como resultado de la extensión y el proceso de PCR, en el caso de MALBAC.

Por el término "alteración de número de copias (CNA/' se entiende un cambio somático en los números de copias de una región genómica, definida en general con respecto al mismo genoma individual.

Por el término "variación de número de copias (CNV/' se entiende una variante de la línea germinal en números de copias de una región genómica, definida en general con respecto a un genoma de referencia. A lo largo de la descripción, CNA y CNV se pueden usar indistintamente, ya que la mayoría del razonamiento se puede aplicar a ambas situaciones. Se debe pretender que cada uno de esos términos se refiera a ambas situaciones, a menos que se especifique lo contrario.

Por el término "secuenciación masiva-paralela de próxima generación (NGS)" se entiende un método de secuenciación de ADN que comprende la creación de una biblioteca de moléculas de ADN separadas espacialmente y/o en el tiempo, secuenciadas clonalmente (con o sin amplificación clonal previa). Ejemplos incluyen la plataforma Illumina (Illumina Inc), la plataforma Ion Torrent (ThermoFisher Scientific Inc), la plataforma Pacific Biosciences, MinlON (Oxford Nanopore Technologies Ltd).

Por el término "secuencia diana" se entiende una región de interés en el ADN original.

Por el término "biblioteca de ADN de WGA primaria (pWGAlib/' se pretende una biblioteca de ADN obtenida a partir de una reacción de WGA.

Por el término "ciclos de amplificación basados en recocido y bucle múltiples (M ALBAC/' se entiende un método de amplificación de genoma completo cuasilineal (Zong et al., Genome-wide detection of single-nucleotide and copy-number variations of a single human cell, Science. 21 de diciembre de 2012; 338(6114):1622-6. doi: 10.1126/ science.1229164). Los cebadores de MALBAC tienen una secuencia aleatoria 3' de 8 nucleótidos, para hibridarse con el molde, y una secuencia común 5' de 27 nucleótidos (GTG AGT Gat GGT TGA GGT AGT GTG GAG). Después de la primera extensión, los semiamplicones se utilizan como moldes para otra extensión que produce un amplicón completo que tiene extremos 5' y 3' complementarios. Después de algunos ciclos de amplificación cuasi lineal, el amplicón completo se puede amplificar exponencialmente con ciclos de PCR posteriores.

Por el término "purificación de la biblioteca de ADN" se entiende un proceso por el cual el material de la biblioteca de ADN se separa de los componentes de reacción no deseados tales como enzimas, dNTP, sales y/u otras moléculas que no forman parte de la biblioteca de ADN deseada. Ejemplos de procesos de purificación de bibliotecas de ADN son la purificación con tecnología basada en perlas magnéticas tal como Agencourt AMPure XP o perlas de inmovilización reversible en fase sólida (SPR I) de Beckman Coulter o con purificación de columna de espín tal como columnas de espín Amicon de Merck Millipore.

Por el término "selección de tamaño de biblioteca de ADN" se entiende un proceso mediante el cual se altera la distribución de pares de bases de diferentes fragmentos que componen la biblioteca de ADN. En general, una porción de la biblioteca de ADN incluida en un determinado intervalo se conserva sustancialmente, mientras que los componentes de la biblioteca de ADN fuera de ese intervalo se descartan sustancialmente. Ejemplos de procesos de selección de tamaño de biblioteca de ADN son la escisión de geles electroforéticos (por ejemplo, ThermoFisher Scientific E-gel) o la doble purificación con un sistema de purificación basado en perlas magnéticas (por ejemplo, perlas Beckman Coulter SPRI).

Por el término "selección de biblioteca de ADN" se entiende un proceso por el cual se lleva a cabo la purificación de la biblioteca de ADN o la selección de tamaño de la biblioteca de ADN o ambas.

Por el término "reamplificación de NGS" se entiende una reacción de PCR en la que toda o una parte sustancial de la biblioteca de ADN de WGA primaria se amplifica adicionalmente. El término NGS se puede omitir por simplicidad en todo el texto, y se hará referencia simplemente a "reamplificación".

Por el término "adaptador de secuenciación (SA)" se entiende una o más moléculas que son instrumentales para secuenciar el inserto de ADN, cada molécula puede comprender ninguno, uno o más de los siguientes: una secuencia de polinucleótidos, un grupo funcional. En particular, se pretende una secuencia de polinucleótidos que se requiere que esté presente en una biblioteca de secuenciación masivamente paralela para que el secuenciador genere correctamente una secuencia de salida, pero que no lleve información, (como ejemplos no limitantes: una secuencia de polinucleótidos para hibridar un ADNmc a una celda de flujo, en caso de secuenciación Illumina, o a una esfera de iones, en caso de secuenciación Ion Torrent, o una secuencia de polinucleótidos requerida para iniciar una reacción de secuenciación por síntesis).

Por el término "código de barras de secuenciación" se entiende una secuencia de polinucleótidos que, cuando se secuencia dentro de una lectura de secuenciador, permite que esa lectura se asigne a una muestra específica asociada con ese código de barras.

Por el término "funcional para una plataforma de secuenciación seleccionada" se entiende una secuencia de polinucleótidos que tiene que ser empleada por la plataforma de secuenciación durante el proceso de secuenciación (por ejemplo, un código de barras o un adaptador de secuenciación).

Por el término "secuenciación de genoma completo de paso bajo" se entiende una secuenciación de genoma completo a una profundidad de secuenciación media inferior a 1.

Por el término "profundidad de secuenciación media" se entiende aquí, en una base por muestra, el total de la cantidad de bases secuenciadas, mapeadas al genoma de referencia dividido por el tamaño total de genoma de referencia. El número total de bases secuenciadas y mapeadas se puede aproximar al número de lecturas mapeadas por la longitud de lectura promedio.

Por el término "ADN bicatenario (ADNbc)'' se entiende, de acuerdo con las reglas de emparejamiento de bases (A con T y C con G), dos cadenas complementarias de polinucleótidos separadas unidas por hidrógeno mediante la unión de las bases nitrogenadas de las dos. ADN monocatenario (ADNmc): Las dos cadenas de ADN pueden formar dos moléculas de ADN monocatenarias, es decir, una molécula de ADN compuesta por dos moléculas de ADNmc acopladas con emparejamiento de bases de Watson-Crick.

Por el término "ADN monocatenario (ADNmc/' se entiende una cadena de polinucleótidos, por ejemplo, derivada de un ADN bicatenario o que se puede emparejar con un ADN monocatenario complementario, es decir, una molécula de ADN polinucleotídico que consiste en solo una cadena única contrariamente a las dos cadenas típicas de nucleótidos en forma helicoidal.

Por "igualar" se entiende el acto de ajustar la concentración de una o más muestras para hacerlas iguales. Por "normalizar" se entiende el acto de ajustar la concentración de una o más muestras para que correspondan a una proporción deseada entre ellas (igualando es el caso especial donde la proporción es 1). En la descripción, por simplicidad, los términos normalización y ecualización se usarán indistintamente, ya que obviamente son conceptualmente idénticos.

Por "perlas paramagnéticas" se entiende perlas magnéticas conjugadas con estreptavidina (por ejemplo, Dynabeads® MyOneMR Streptavidin Cl, ThermoFisher Scientific). La expresión "condiciones diseñadas" cuando se refiere a la incubación de las perlas paramagnéticas se refiere a las condiciones requeridas para el paso de activación, que consiste en lavar las perlas magnéticas conjugadas con estreptavidina dos veces con el siguiente amortiguador: Tris-HCl 10 mM (pH 7,5), ED T A 1 mM, NaCl 2 M.

Flujos de trabajo

La siguiente tabla resume algunos posibles flujos de trabajo:

Tabla 1

Leyenda: 0= paso opcional, SA=introducción de adaptadores de secuenciación, BC=introducción de códigos de barras, X= paso necesario, wf=flujo de trabajo

Material de entrada de proceso

Toda la presente descripción se refiere a una biblioteca de ADN de WGA primaria. Los mismos flujos de trabajo se pueden aplicar a la biblioteca de ADN de WGA primaria que se sometió adicionalmente a procesos adicionales, tales como, por ejemplo, síntesis de ADNbc o reamplificación de biblioteca con cebadores de WGA estándar (por ejemplo, como sea posible con el kitAmpli1MRReAmp/ds, Menarini Silicon Biosystems spa, Italia). Por simplicidad, nos referimos aquí solo a las bibliotecas primarias de ADN de WGA, sin tener en cuenta esos procesos adicionales. Se debe pretender que todo ese tipo de muestras de entrada se puedan usar como entrada de muestra adecuada, también para lo que se informa en la reivindicación.

Purificación inicial

Cuando están presentes cantidades no despreciables de cebadores de WGA primarios en el producto de salida de WGA primario, puede ser ventajoso tener una selección de biblioteca de ADN inicial que incluya una purificación de biblioteca de ADN. De hecho, dado que los cebadores incluyen, en el extremo 3', una secuencia correspondiente a la secuencia común encontrada en los cebadores WGA primarios, la presencia de cantidades no despreciables de cebadores WGA primarios residuales puede competir con los cebadores de reamplificación utilizados para obtener la biblioteca de secuenciación masivamente paralela, disminuyendo el rendimiento de moléculas de biblioteca de ADN que tienen, como se desee, los cebadores de reamplificación (o sus complementarios inversos) en ambos extremos.

Cuantificación para ecualización del número de lecturas en todas las muestras

Cuando las variaciones en la cantidad de biblioteca de ADN reamplificada son relativamente grandes entre las muestras a agrupar y secuenciar juntas, puede ser ventajoso cuantificar la cantidad de biblioteca de ADN de cada muestra, con el fin de dividir en alícuotas esas bibliotecas e igualar el número de lecturas secuenciadas para cada muestra.

Los apareamientos erróneos entre la longitud de lectura del secuenciador y el pico de tamaño de WGA puede dar como resultado una ecualización imprecisa.

Varios secuenciadores masivamente paralelos (que incluyen plataformas Ion Torrent e Illumina) emplean la secuenciación de fragmentos de ADN que tienen un pico de distribución de tamaño comprendido entre 50 y 800 pb, tal como, por ejemplo, aquellos que tienen un pico de distribución a 150 pb, 200 pb, 400 pb, 650 pb de acuerdo con las diferentes composiciones químicas utilizadas. Como la distribución de tamaño de pWGAlib puede tener un pico de fragmentos más grandes, tal como aproximadamente 1 kpb, y cantidades mucho más pequeñas de ADN a 150 pb, 200 pb, 400 pb, la cuantificación de las cantidades de la biblioteca de ADN reamplificado en el rango deseado puede ser imprecisa si se lleva a cabo en la biblioteca de ADN reamplificado a granel sin selección de tamaño previa del intervalo de fragmentos deseado. Como resultado, la cuantificación de ADN en masa y la ecualización de varias muestras en el agrupamiento pueden dar como resultado variaciones relativamente grandes del número real de lecturas por muestra, ya que el número de fragmentos dentro del rango de tamaño del secuenciador varía estocásticamente debido a la imprecisión en la distribución de fragmentos de ADN en la biblioteca (por lo tanto, incluso las cantidades totales perfectamente ecualizadas de la biblioteca de ADN dan como resultado variaciones significativas del número de fragmentos secuenciados).

Aumentar la cantidad de biblioteca de ADN dentro de longitud de lectura de secuenciador para mejorar ecualización [por selección de tamaño antes de reamplificación]

Cuando la distribución de tamaño de producto de WGA primario se debe alterar para aumentar la proporción de cantidad de biblioteca de ADN dentro del intervalo de longitud de lectura del secuenciador con respecto a la biblioteca de ADN total, puede ser ventajoso tener una selección de biblioteca de ADN inicial que comprenda una selección de tamaño de biblioteca de ADN.

[por reamplificación preferencial]

De manera alternativa, o además, puede ser ventajoso llevar a cabo la reacción de reamplificación en condiciones que favorezcan la amplificación preferencial de fragmentos de biblioteca de ADN en el intervalo deseado.

Reamplificación preferencial por elección de polimerasa o acortamiento del ciclo de extensión

Las condiciones de reacción que favorecen fragmentos más cortos pueden comprender la reacción de PCR de reamplificación con una polimerasa que amplifica preferentemente fragmentos más cortos, o ciclos de PCR iniciales mediante los cuales una fase de extensión más corta evita que los fragmentos largos se repliquen en toda su longitud, generando fragmentos de biblioteca incompletos. Los fragmentos de biblioteca incompletos carecen de la porción de extremo 3' complementaria inversa a la sección 3' de cebadores de reamplificación y, por lo tanto, excluyen el fragmento de pasos de replicación adicionales con los cebadores de reamplificación, interrumpiendo la amplificación exponencial del fragmento incompleto, consintiendo la generación de solo un número lineal (con ciclos) de fragmentos de amplificación incompletos originados por los fragmentos de biblioteca de ADN de WGA primarios más largos.

Ejemplo de flujos de trabajo de acuerdo con la tabla 1

Wf1) se puede aplicar a LPW GS de una biblioteca de WGA en IonTorrent PGM (por ejemplo, en un chip 314, procesando una muestra individual que no requiere códigos de barras de muestra). La reamplificación con dos cebadores permite la introducción de los dos adaptadores de secuenciación, sin códigos de barras.

Wf2) se pueden aplicar a LPW GS de múltiples muestras de WGA primarias en Ion Torrent PGM o Illumina MiSeq, cuando las muestras de entrada originales para la WGA primaria se derivan de tipos homogéneos de material no amplificado, por ejemplo, células individuales, que se sometieron al mismo tratamiento (por ejemplo, fresco o fijo), no apoptótico. Por lo tanto, no es necesaria cuantificación, ya que el rendimiento de WGA primario es aproximadamente el mismo en todos. Las bibliotecas adaptadas al secuenciador con código de barras se agrupan, luego se selecciona el tamaño para aislar los fragmentos con el tamaño apropiado dentro de la longitud de lectura del secuenciador, se purifican y se secuencian. Si la selección de tamaño se lleva a cabo mediante gel, se lleva a cabo una purificación posterior. Si la selección de tamaño se lleva a cabo, por ejemplo, con purificación de perlas SPRI de doble cara, la salida resultante ya está purificada y no son necesarios más pasos de purificación.

Wf3) se puede aplicar a LPW GS de múltiples muestras WGA primarias en Ion Torrent PGM o Illumina MiSeq donde las muestras de entrada originales para el WGA primario se derivan de tipos no homogéneos de material no amplificado. Por ejemplo, parte de células individuales, parte de agrupamientos de células, que se sometieron a diferentes tratamientos (por ejemplo, algunos frescos, algunos fijos), con diferente calidad de ADN original (algunos no apoptóticos, algunos apoptóticos, con índices de integridad del genoma heterogéneos; véase Polzer et al. EMBO Mol Med. 30 de octubre de 2014; 6 (11): 1371-86). Por lo tanto, la cuantificación es necesaria ya que el rendimiento de WGA primario puede diferir significativamente entre las muestras. Con respecto a Wf2, se lleva a cabo una cuantificación. Antes de la cuantificación, es ventajoso purificar con el fin de hacer que el paso de cuantificación sea más confiable ya que, por ejemplo, los cebadores residuales y los dNTP o dímeros de cebadores se eliminan y no afectan la cuantificación.

Las bibliotecas adaptadas al secuenciador con código de barras se agrupan, luego se selecciona el tamaño para aislar los fragmentos con el tamaño apropiado dentro de la longitud de lectura del secuenciador, se purifican y se secuencian. Si la selección de tamaño se lleva a cabo mediante gel, se lleva a cabo una purificación posterior. Si la selección de tamaño se lleva a cabo, por ejemplo, con purificación de perlas SPRI de doble cara, la salida resultante ya está purificada y no son necesarios más pasos de purificación.

Wf4) se puede aplicar a la preparación de una biblioteca de secuenciación masivamente paralela para la secuenciación de nanoporos de Oxford. Dado que el nanoporo puede acomodar longitudes de lectura más largas, la selección de tamaño puede ser innecesaria, y la secuenciación se puede llevar a cabo en sustancialmente todas las longitudes de fragmento en la biblioteca.

Wf5) se puede aplicar a la preparación de múltiples bibliotecas de secuenciación masivamente paralela para la secuenciación con nanoporos de Oxford. Con respecto a wf4, los cebadores de reamplificación incluyen además un código de barras de muestra para multiplexar más muestras en la misma corrida. Dado que el nanoporo puede acomodar longitudes de lectura más largas, puede ser innecesaria la selección del tamaño.

Wf6) se puede aplicar a la preparación de múltiples bibliotecas de secuenciación masivamente paralela para un secuenciador Oxford con nanoporos que no requiere la adición de adaptadores de propósito especial. Con respecto a wf5, los cebadores de reamplificación no incluyen un adaptador de secuenciación, sino solo un código de barras de muestra para multiplexar más muestras en la misma corrida. Dado que el nanoporo puede acomodar longitudes de lectura más largas, puede ser innecesaria la selección del tamaño.

Wf7) se puede aplicar a la preparación de múltiples bibliotecas masivamente paralelas para la secuenciación de bibliotecas de ADN de DRS-WGA obtenidas de muestras no homogéneas después de tratamientos heterogéneos y que tienen una calidad de ADN diferente en un sistema de longitud de lectura más corto, tal como IonProton utilizando la composición química de secuenciación de 200 pb. Dado que la cantidad de biblioteca de ADN de WGA primaria de alrededor de 200 pb es muy pequeña en comparación con el ADN total en la biblioteca de ADN de WGA primaria, puede ser ventajoso llevar a cabo una selección de tamaño eliminando todos o sustancialmente todos los fragmentos de pWGAlib fuera de la longitud de lectura de secuenciación, enriqueciendo los fragmentos de pWGAlib de alrededor de 200 pb.

La reamplificación se lleva a cabo entonces con cebadores de reamplificación que incluyen códigos de barras y adaptadores de secuenciación compatibles con el sistema IonProton. Por lo tanto, el producto de reamplificación se purifica y cuantifica para cada muestra, y se agrupan diferentes alícuotas de diferentes muestras para igualar el número de lecturas para cada código de barras de muestra, y luego se secuencian para llevar a cabo LPW GS.

Para aquellos expertos en la técnica es evidente que son posibles diferentes combinaciones de los pasos incluidos en los flujos de trabajo como se mencionó anteriormente sin desviarse del alcance de la invención, que depende de la reamplificación de la biblioteca de ADN de WGA primaria con cebadores especiales como se divulga en la presente.

Preparación de bibliotecas de secuenciación masivamente paralela a partir de un producto de WGA

En la presente divulgación, se proporciona un método que comprende los pasos de

a. proporcionar una biblioteca de ADN de WGA primaria (pWGAlib) que incluye fragmentos que comprenden una sección de secuencia de WGA 5' (5SS) conocida, una sección de secuencia de WGA (M SS) media y una sección de secuencia de WGA 3' (3SS) conocida complementaria inversa a la sección de secuencia de WGA 5' conocida, la sección de secuencia de WGA 5' (5SS) conocida que comprende un adaptador de secuencia universal de biblioteca de WGA y la sección de secuencia de WGA media (MSS) que comprende al menos una sección de inserción (IS) correspondiente a una secuencia de ADN del ADN no amplificado original antes de WGA, la secuencia de WGA media comprende opcionalmente, además, una sección intermedia 5' flanqueante (F5) y/o una sección intermedia 3' flanqueante (F3);

b. reamplificar la biblioteca de ADN de W GA primaria usando al menos un primer cebador (1PR) y al menos un segundo cebador (2PR); en donde

el por lo menos un primer cebador (1PR) comprende una primera sección 5' de cebador(1PR5S) y una primera sección 3' de cebador (1PR3S), la primera sección 5' de cebador (1PR5S) que comprende por lo menos un primer adaptador de secuenciación (1PR5SA) y por lo menos un primer código de barras de secuenciación (1PR5BC) en la posición 3' del por lo menos un primer adaptador de secuenciación (1PR5SA) y en la posición 5' de la primera sección de cebador 3' (1PR3S), y la primera sección de cebador 3'(1PR3S) que se hibrida con la sección de secuencia 5' conocida (5SS) o la sección de secuencia 3' (3SS) conocida; el por lo menos un segundo cebador (2PR) comprende una segunda sección 5' de cebador (2PR5S) y una segunda sección 3' de cebador (2PR3S), la segunda sección 5' de cebador (2PR5S) que comprende por lo menos un segundo adaptador de secuenciación (2PR5SA) diferente del por lo menos un primer adaptador de secuenciación (1PR5SA), y la segunda sección 3' de cebador (2PR3S) que se hibrida con la sección de secuencia 5' (5SS) conocida o la sección de secuencia 3' (3SS) conocida.

La sección de secuencia 5' (5SS) conocida consiste preferentemente en un adaptador de secuencia universal de biblioteca de WGA. Como un ejemplo, DRS-WGA (tal como el kit Menarini Silicon BiosystemsAmpli1MRWGA), así como MALBAC (Yikon Genomics), producen pWGAlib con una sección de secuencia 3' conocida complementaria inversa de la sección de secuencia 5' conocida como se solicita para la entrada del método divulgado en la presente.

Por lo tanto, el adaptador de secuencia universal de biblioteca de WGA es preferentemente un adaptador de secuencia universal de biblioteca de DRS-WGA (por ejemplo, SEQ ID NO: 282) o un adaptador de secuencia universal de biblioteca MALBAC (por ejemplo, SEQ ID NO: 283), más preferentemente un adaptador de secuencia universal de biblioteca DRS-Wg A.

Preferentemente, el segundo cebador (2PR) comprende además al menos un segundo código de barras de secuenciación (2PR5BC), en la posición 3' del por lo menos un segundo adaptador de secuenciación (2PR5SA) y en la posición 5' de la segunda sección 3' de cebador (2PR3S).

Debido a la presencia de los códigos de barras de secuenciación, se lleva a cabo un método para secuenciación de genoma completo de paso bajo de acuerdo con una realización de la invención, que comprende los pasos de:

c. proporcionar una pluralidad de bibliotecas de secuenciación masivamente paralela con códigos de barras y agrupar muestras obtenidas utilizando diferentes códigos de barras de secuenciación (BC);

d. secuenciar la biblioteca agrupada.

El paso de agrupar muestras utilizando diferentes códigos de barras de secuenciación (BC) comprende además los pasos de:

e. cuantificar el ADN en cada una de las bibliotecas de secuenciación masivamente paralela con código de barras; f. normalizar la cantidad de bibliotecas de secuenciación masivamente paralela con código de barras.

El paso de agrupar muestras utilizando diferentes códigos de barras de secuenciación (BC) comprende además el paso de seleccionar fragmentos de ADN comprendidos dentro de al menos un intervalo seleccionado de pares de bases. Este intervalo seleccionado de pares de bases se centra en diferentes valores en vista de la selección cadena abajo de la plataforma de secuenciación. Por ejemplo, para la plataforma de secuenciación Illumina, el intervalo de pares de bases se centra en 650 pb y preferentemente en 400 pb. Para otras plataformas de secuenciación, por ejemplo, Ion Torrent, el intervalo de pares de bases se centra en 400 pb y preferiblemente en 200 pb y más preferiblemente en 150 pb o en 100 pb o en 50 pb.

De acuerdo con una realización adicional de la invención, el método para secuenciación de genoma completo de paso bajo como se mencionó anteriormente comprende además el paso de seleccionar fragmentos de ADN que comprenden tanto el primer adaptador de secuenciación como los segundos adaptadores de secuenciación.

Preferentemente, el paso de seleccionar fragmentos de ADN que comprenden el primer adaptador de secuenciación y los segundos adaptadores de secuenciación se lleva a cabo poniendo en contacto la biblioteca de secuenciación masivamente paralela con al menos una fase sólida que consiste en/que comprende, por ejemplo, perlas paramagnéticas funcionalizadas. En una realización del método de la invención, las perlas paramagnéticas se funcionalizan con un revestimiento de estreptavidina.

En un método para la secuenciación de genoma completo de paso bajo de acuerdo con la invención, uno del por lo menos un primer cebador (1PR) y el por lo menos un segundo cebador (2PR) se biotinilan en el extremo 5', y se obtienen fragmentos seleccionados eluyendo de los fragmentos de ADNmc no biotinilados de las perlas.

Como se puede ver en la figura 4, en el caso anterior, la biblioteca de ADNbc de WGA reamplificada comprende: 1) fragmentos de ADNbc no biotinilados, fragmentos de ADNbc biotinilados en una cadena y fragmentos de ADNbc biotinilados en ambas cadenas. El método de la invención comprende los pasos adicionales de:

g. incubar la biblioteca de ADNbc de WGA reamplificada con las perlas paramagnéticas funcionalizadas en condiciones diseñadas que causan la unión covalente entre la biotina y la estreptavidina asignada en las perlas paramagnéticas funcionalizadas;

h. lavar los fragmentos de ADNbc no biotinilados no unidos;

i. eluir de las perlas paramagnéticas funcionalizadas los fragmentos de ADNmc retenidos.

También se divulga un kit de preparación de biblioteca de secuenciación masivamente paralelo que comprende al menos:

- un primer cebador (1PR) que comprende una primera sección 5' de cebador (1PR5S) y una primera sección3'de cebador (1PR3S), la primera sección 5' de cebador (1PR5S) que comprende al menos un primer adaptador de secuenciación (1PR5SA) y al menos un primer código de barras de secuenciación (1PR5BC) en la posición 3' del al menos un primer adaptador de secuenciación (1PR5SA) y en la posición 5' de la primera sección 3' de cebador (1PR3S), y la primera sección 3' de cebador (1PR3S) que se hibrida con una sección de secuencia 5' (5SS) conocida que comprende un adaptador de secuencia universal de biblioteca de WGA o una sección de secuencia 3' (3SS) conocida complementaria inversa a la sección de secuencia 5' conocida de fragmentos de una biblioteca de ADN de WGA primaria (pWGAlib), los fragmentos comprenden además una sección de secuencia media (MSS) 3' de la sección de secuencia 5' (5SS) conocida y 5' de la sección de secuencia 3' (3SS) conocida;

- un segundo cebador (2PR) que comprende una segunda sección 5' de cebador (2PR5S) y una segunda sección3'(2PR3S), la segunda sección 5' de cebador (2PR5S) que comprende al menos un segundo adaptador de secuenciación (2PR5SA) diferente del por lo menos un primer adaptador de secuenciación (1PR5SA), la segunda sección 3' que se hibrida con la sección de secuencia 5'(5SS) conocida o la sección de secuencia 3' (3SS) conocida de los fragmentos.

En particular, el kit de preparación de biblioteca de secuenciación masivamente paralela comprende:

a) el cebador SEQ ID NO:97 (Tabla 2) y uno o más cebadores seleccionados del grupo que consiste en SEQ ID NO:1 a SEQ ID NO: 96 (Tabla 2); o

b) el cebador de SEQ ID NO: 194 (Tabla 2) y uno o más cebadores seleccionados del grupo que consiste en SEQ ID NO: 98 a SEQ ID NO:193 (Tabla 2); o

c) al menos un cebador seleccionado del grupo que consiste en SEQ ID NO:195 a SEQ ID NO:202 (Tabla 4), y al menos un cebador seleccionado del grupo que consiste en SEQ ID NO: 203 a SEQ ID NO:214 (Tabla 4); o d) al menos un cebador seleccionado del grupo que consiste en SEQ ID NO:215 a SEQ ID NO:222 (Tabla 6), y al menos un cebador seleccionado del grupo que consiste en SEQ ID NO: 223 a SEQ ID NO:234 (Tabla 6); o e) al menos un cebador seleccionado del grupo que consiste en SEQ ID NO:235 a SEQ ID NO:242 (Tabla 7), y al menos un cebador seleccionado del grupo que consiste en SEQ ID NO: 243 a SEQ ID NO:254 (Tabla 7); o f) al menos un cebador seleccionado del grupo que consiste en SEQ ID NO:259 a SEQ ID NO:266 (Tabla 8), y al menos un cebador seleccionado del grupo que consiste en SEQ ID NO: 267 a SEQ ID NO:278 (Tabla 8).

El kit de preparación de biblioteca de secuenciación masivamente paralelo puede comprender:

- al menos un cebador seleccionado del grupo que consiste en SEQ ID NO:235 a SEQ ID NO:242 (Tabla 7), y al menos un cebador seleccionado del grupo que consiste en SEQ ID NO:243 a SEQ ID NO:254 (Tabla 7); un cebador de secuenciación personalizado de S<e>Q ID NO: 255; y un cebador de SEQ ID NO:256 o S<e>Q ID NO:258; o - al menos un cebador seleccionado del grupo que consiste en SEQ ID NO: 259 a SEQ ID NO:266 (Tabla 8), al menos un cebador seleccionado del grupo que consiste en SEQ ID NO:267 a SEQ ID NO:278 (Tabla 8); y cebadores de SEQ ID NO:279 y SEQ ID NO:280;

diseñado para llevar a cabo un proceso de secuenciación de lectura individual óptimo.

El kit anterior puede comprender además un cebador seleccionado de SEQ ID NO:257 (Tabla 7) y SEQ ID NO:281 (Tabla 8) diseñado para llevar a cabo un proceso de secuenciación de extremos emparejados óptimo en una plataforma de secuenciación seleccionada.

Preferentemente, el kit de preparación de biblioteca de secuenciación masivamente paralelo comprende además una ADN polimerasa termoestable.

La presente invención finalmente se refiere también a un método para perfilar el número de copias de genoma completo, que comprende los pasos de

a. secuenciar una biblioteca de ADN desarrollada usando el kit de preparación de biblioteca de secuenciación como se describió anteriormente,

b. analizar la densidad de lectura de secuenciación en diferentes regiones del genoma,

c. determinar un valor de número de copias para las regiones del genoma comparando el número de lecturas en esa región con respecto al número de lecturas esperadas en la misma para un genoma de referencia.

Secuenciación de genoma completo de paso bajo de CTC individuales

El perfilado de CNA por LPW GS es más tolerante a un índice de integridad del genoma más bajo, donde aCGH puede no dar resultados lo suficientemente limpios. De hecho, las sondas aCGH se diseñan para posiciones fijas en el genoma. Si esas posiciones no se amplifican estocásticamente debido a la reticulación del ADN, la sonda correspondiente no generará la cantidad adecuada de señal después de la hibridación, lo que dará como resultado un píxel ruidoso en la relación de señal entre el ADN de prueba y el ADN de referencia.

Por el contrario, usando LPW GS, los fragmentos se basan solo en la selección de tamaño. Si ciertos fragmentos no se amplifican estocásticamente debido a, por ejemplo, la reticulación del ADN o las roturas inducidas por la apoptosis, todavía puede haber fragmentos adicionales del mismo tamaño susceptibles de amplificación en regiones genómicas cercanas que caen en el mismo intervalo de paso bajo. Por consiguiente, la relación señalruido es más resistente al índice de integridad del genoma de la biblioteca, como se muestra claramente, por ejemplo, en las figuras 6 a 9.

Preparación de bibliotecas de secuenciación masivamente paralela a partir de DRS-WGA

La selección de tamaño implica un submuestreo del genoma dentro de las regiones compuestas por fragmentos DRS-WGA de sustancialmente la misma longitud (neta de inserción de adaptadores) que el tamaño del par de bases de la biblioteca de secuenciación.

Sin embargo, se ha encontrado sorprendentemente que este submuestreo no afecta la calidad del perfil de número de copia, incluso cuando se usan algoritmos estándar para la llamada a variantes de número de copia.

Ventajosamente, se selecciona el DRS-WGA (como kit AmpilMR WGA), que tiene un sitio de restricción determinista de TTAA. De esta manera, los fragmentos más cortos son más densos en regiones de bajo contenido de GC del genoma, y la densidad de fragmentos se correlaciona negativamente con un mayor contenido de GC.

Secuenciación de genoma completo de paso bajo de cantidades mínimas de células FFP E clasificadas digitalmente

A partir de unos cientos de células tumorales clasificadas digitalmente de FFP E con sistema DEPArray (Bolognesi et al.), generamos una biblioteca DRS-WGA. La biblioteca se utilizó para generar una biblioteca de secuenciación masivamente paralela para Ion/PGM de acuerdo con la invención, como se muestra en la figura 6. La biblioteca masivamente paralela se secuenció a <0,05 de profundidad media.

Ejemplo 1:

Protocolo para LPW GS en Ion Torrent PGM después de DRS-WGA

1) Amplificación de genoma completo de sitio de restricción determinista (DRS-WGA)

El ADN unicelular se amplificó utilizando el kitAmpli1MRWGA (Silicon Biosystems) de acuerdo con las instrucciones del fabricante.

El kitAmpli1MRWGA está diseñado para proporcionar amplificación de genoma completo a partir de ADN obtenido de una célula individual. Después de la lisis celular, el ADN se digiere con una enzima de restricción, preferentemente Msel, y una secuencia adaptadora universal se liga a fragmentos de ADN. La amplificación está mediada por un único cebador de PCR específico para todos los fragmentos generados, con un tamaño de intervalo de 200 a 1000 pb de longitud, que se distribuyen en todo el genoma.

2) Reamplificación de los productos WGA

Se diluyen cinco |j L de ADN amplificado con WGA mediante la adición de 5 |j L de agua libre de nucleasa y se purifican utilizando el sistema Agencourt AMPure XP (Beckman Coulter) para eliminar los oligonucleótidos no unidos y el exceso de nucleótidos, sales y enzimas.

La purificación de ADN basada en perlas se realizó de acuerdo con el siguiente protocolo: Se agregaron 18 j L de perlas (volumen de muestra 1,8X) a cada muestra. Las perlas y los productos de reacción se mezclaron mediante agitación excéntrica breve y luego se centrifugaron para recolectar las gotitas. Las reacciones mixtas luego se incubaron fuera del imán durante 15 min a TA, después de lo cual luego se transfirieron a un imán lateral DynaMag-96 (Life Technologies) y se dejaron reposar durante 5 min. El sobrenadante se descartó y las perlas se lavaron con 150 j L de EtOH al 80% recién hecho. Después de una segunda ronda de lavado con EtOH, se dejaron secar las perlas en el imán durante 5-10 min. Las perlas secas entonces se resuspendieron fuera del imán en 15<j>L de amortiguador LowTE y se incubaron durante 10 min, seguido de 5 min de incubación en el imán. Se transfirieron doce microlitros del eluato a otro tubo y posteriormente se cuantificaron mediante ensayo HS de ADNbc en el fluorómetro Qubit® 2.0 para preparar alícuotas de 10<j>L que contenían 25 ng de ADN purificado con WGA.

La reamplificación con código de barras se realizó en un volumen de 50<j>L utilizando el kit de PCRAmpli1MR(Menarini Silicon Biosystems). Cada reacción de PCR se compuso de la siguiente manera: 5 j L de amortiguador de reacción de PCRAmpli1MR(10X), 1 j L de 25 j M de un cebador de SEQ ID NO:1 a SEQ ID NO:96

[1] (5 '-CCATCTCATCCCTGCGTGTCTCCGACTCAG[BC-]AGTGGGATTCCTGCTGTCAGT-3')

donde [BC] = Secuencia de código de barras, 1 j L de 25 j M del cebador SEQ ID NO:97

[2] (5'-CCTCTCTATGGGCAGTCGGTGATAGTGGGATTCCTGCTGTCAGT-3')

1,75<j>L deAmpli1MRPCR dNTP (10 mM), 1,25<j>L de BSA, 0,5 deAmpli1MRpolimerasa PCR Taq, 37,5<j>L de aguaAmpli1MRy 25 ng del ADN purificado por WGA.

El termociclador Applied Biosystems® 2720 se estableció como sigue: 95°C durante 4 min, 1 ciclo de 95°C durante 30 seg, 60°C durante 30 seg, 72°C durante 2 min, 10 ciclos de 95°C durante 30 seg, 60°C durante 30 seg, 72°C durante 2 min (extendido por 20 seg/ciclo) y extensión final a 72°C durante 7 min.

La figura 3 muestra esquemáticamente el proceso de reamplificación.

Los productos de WGA reamplificados con código de barras se purificaron con perlas AMPure XP 1,8x (90 j l ) y se eluyeron en 35 j l de amortiguador de TE bajo de acuerdo con los pasos descritos anteriormente.

3) Selección de tamaño

Los productos de WGA reamplificados con código de barras, correspondientes a una biblioteca de fragmentos con adaptadores Ion Torrent proporcionados, se calificaron mediante el kit Agilent DNA 7500 en el 2100 Bioanalyzer® (Agilent) y se cuantificaron utilizando el kit de ensayo Qubit® dsDNA HS con el fin de obtener un ag<o l>pamiento final.

El ag<o l>pamiento equimolar se creó combinando la misma cantidad de 7 bibliotecas individuales con diferentes adaptadores A-LIB-BC-X, produciendo el grupo final con la concentración de 34 ng/jL en un volumen final de 42 |jL. La concentración del agrupamiento se confirmó mediante el método Qubit®.

El sistema E-Gel® SizeSelectMR en combinación con el gel de agarosa prefabricado Size Select 2% (Invitrogen) se ha utilizado para la selección del tamaño de los fragmentos de interés, de acuerdo con las instrucciones del fabricante.

Se cargaron veinte j L del grupo final en dos carriles de un gel E y usando un estándar de tamaño (ADN 50 pb, Ladder, Invitrogen), se seleccionó un intervalo de sección entre 300 y 400 pb del gel.

Después de seleccionar el tamaño, la limpieza se realizó con 1. 8x (90 j l ) perlas AMPure X P La biblioteca final se eluyó en 30 j l de amortiguador de TE bajo de acuerdo con los pasos descritos anteriormente y se evaluó utilizando un chip de alta sensibilidad 2100 Bioanalyzer (Agilent Technologies).

4) Secuenciación de Ion Torrent PGM

La preparación del molde se realizó de acuerdo con la guía de usuario Ion PGMMR Hi-Q OT2 kit-400 pb.

En resumen, los fragmentos de biblioteca se amplificaron clonalmente en partículas de esferas iónicas (ISP) a través de PCR en emulsión y luego se enriquecieron para ISP positivos para el molde. Las reacciones de PCR en emulsión de PGM se realizaron con el kit Ion PGMMR Hi-Q OT2 (Life Technologies) y las emulsiones y amplificaciones se generaron utilizando el Instrumento Ion OneTouch (Life Technologies). Después de la recuperación, el enriquecimiento se realizó uniendo selectivamente las ISP que contenían fragmentos de biblioteca amplificados a perlas magnéticas revestidas con estreptavidina, eliminando los ISP vacíos a través de pasos de lavado y desnaturalizando las cadenas de biblioteca para permitir la recolección de los ISP positivos para la plantilla.

Los pasos de enriquecimiento descritos se realizaron utilizando el sistema Life Technologies ES (Life Technologies).

El chip Ion 318v2MR se cargó siguiendo las instrucciones del protocolo "Simplified Ion PGMMR Chip loading with the Ion PGMMR weighted chip bucket" (MAN0007517).

Todas las muestras se procesaron por Ion Personal Genome Machine (PGM) (Life Technologies) utilizando el kit de secuenciación Ion PGMMR Hi-QMR (Life Technologies) y configurando el formato de corrida de flujo 520.

Finalmente, los fragmentos secuenciados se asignaron a muestras específicas con base en su código de barras único.

Tabla 2

Cebadores de reamplificación de NGS para la plataforma Ion Torrent (PGM/Proton)

a) SEQ ID NO list_first_primer_[PGM/DRS-WGA]

b) SEQ ID NO list_second_primer_[PGM/DRS-WGA]

c) SEQ ID NO list_first_primer_[PGM/MALBAC]

d) SEQ ID NO list_second_primer_[PGM/MALBAC]

Ejemplo 2:

Protocolo para LPW GS en Ion Torrent Proton después de DRS-WGA 1. Amplificación de genoma completo de sitio de restricción determinista (DRS-WGA)

El ADN unicelular se amplificó utilizando el kitAmpli1MRWGA (Menarini Silicon Biosystems) de acuerdo con las instrucciones del fabricante, como se detalla en el ejemplo anterior.

2. Síntesis de ADN bicatenario

Se convirtieron cinco pL de ADN amplificado con WGA en ADN bicatenario (ADNbc) utilizando el kitAmpli1MRReAmp/ds, de acuerdo con el protocolo de fabricación. Este proceso asegura la conversión de moléculas de ADN monocatenario (ADNmc) en moléculas de ADN bicatenario.

3. Purificación de productos de ADNbc

Se diluyeron seis pL de productos de síntesis de ADNbc agregando 44 pL de agua libre de nucleasa y se purificaron mediante perlas Agencourt AMPure XP (Beckman Coulter) para eliminar los oligonucleótidos no unidos y el exceso de nucleótidos, sales y enzimas. La purificación de ADN basada en perlas se realizó de acuerdo con el siguiente protocolo: 75 pL (relación: 1,5X de volumen de muestra) de perlas Agencourt AMPure XP a cada muestra de 50 pL y se mezclaron mediante agitación excéntrica. Las reacciones mixtas se incubaron luego fuera del imán durante 15 minutos a temperatura ambiente (RT), después de lo cual se colocaron en una placa magnética hasta que la solución se aclaró y se formó un sedimento (“ 5 minutos). Luego, el sobrenadante se retiró y se descartó sin alterar el sedimento (se pueden dejar aproximadamente 5 pL), las perlas se lavaron dos veces con 150 pL de EtOH al 70% recién hecho dejando el tubo en la placa magnética. Después de retirar cualquier solución de etanol residual de la parte inferior del tubo, el sedimento de perlas se secó brevemente al aire. Se agregaron 22 pL de Tris Ultrapuro 10 mM, pH 8,0 y amortiguador EDTA 0,1 mM (TE bajo) y la reacción mixta se incubó a temperatura ambiente durante minutos fuera de la placa magnética, seguido de 5 minutos de incubación en la placa magnética. Se transfirieron 20 pL del eluato a un nuevo tubo.

De lo contrario, se utilizó un paso alternativo 3 (descrito a continuación) para producir una distribución uniforme de fragmentos alrededor de un tamaño promedio.

Paso alternativo 3) Doble purificación de productos de ADNbc

SPRIselect es una composición química basada en SPRI que acelera y simplifica la selección del tamaño del ácido nucleico para la preparación de la biblioteca de fragmentos para la secuenciación de próxima generación. Este paso se podría realizar de forma alternativa al paso 3. Se diluyeron seis pL de productos de síntesis de ADNbc agregando 44 pL de agua libre de nucleasa y se purificaron mediante perlas SPRIselect (Beckman Coulter) para eliminar los oligonucleótidos no unidos y el exceso de nucleótidos, sales y enzimas y para producir una distribución uniforme de fragmentos alrededor de un tamaño promedio. La purificación de ADN basada en SPR I se realizó de acuerdo con el siguiente protocolo: 37,5 pL (relación: 0,75X de volumen de muestra) de perlas SPRIselect a cada muestra de 50 pL y se mezclaron mediante agitación excéntrica. Las reacciones mixtas se incubaron luego fuera del imán durante 15 minutos a RT, después de lo cual se colocaron en una placa magnética hasta que la solución se aclaró y se formó un sedimento (“ 5 minutos). Luego, el sobrenadante se recuperó y se transfirió a un nuevo tubo. La segunda ronda de purificación se realizó agregando 37,5 pL de perlas SPRIselect al sobrenadante y se mezclaron mediante agitación excéntrica. Las reacciones mixtas se incubaron luego fuera del imán durante 15 minutos a RT, después de lo cual se colocaron en una placa magnética hasta que la solución se aclaró y se formó un sedimento (“ 5 minutos). Luego, el sobrenadante se retiró y se descartó sin alterar el sedimento (se pueden dejar aproximadamente 5 pL), las perlas se lavaron dos veces con 150 pL de EtOH al 80% recién hecho dejando el tubo en la placa magnética. Después de retirar cualquier solución de etanol residual de la parte inferior del tubo, el sedimento de perlas se secó brevemente al aire. Se agregaron 22 pL de amortiguador TE bajo y la reacción mixta se incubó a temperatura ambiente durante 2 minutos fuera del imán, seguido de 5 minutos de incubación en la placa magnética. Se transfirieron 20 pL del eluato a un nuevo tubo.

4. Reamplificación con código de barras

La reamplificación con código de barras se realizó en un volumen de 50 pL utilizando el kit de PCRAmpli1MR(Menarini Silicon Biosystems). Cada reacción de PCR se compuso de la siguiente manera: 5 pL de amortiguador de reacción de PCRAmpli1MR(10X), 1 pL de 25 pM de un cebador de SEQ ID NO:1 a SEQ ID NO:96.

[1] (5'-CCATCTCATCCCTGCGTGTCTCCGACTCAG[BC]AGTGGGATTCCTGCTGTCAGT-3')

donde [BC] = Secuencia de código de barras, 1 pL de 25 pM del cebador de SEQ ID NO:97

[2] (5-CCTCTCTATGGGCAGTCGGTGATAGTGGGATTCCTGCTGTCAGT-3')

1,75 pl deAmpli1MRPCR dNTP (10 mM), 1,25 pL de BSA, 0,5 deAmpli1MRpolimerasa PCR Taq (inicio RÁPIDO), 37,5 pL de aguaAmpli1MRy 2 pL del ADN purificado ds. Estos son los mismos cebadores utilizados para Ion Torrent PGM, informados en la Tabla correspondiente de cebadores de reamplificación de NGS para la biblioteca Ion Torrent (DRS WGA para PGM/Proton) mostrada anteriormente.

El termociclador Applied Biosystems® 2720 se estableció como sigue: 95°C durante 4 min, 11 ciclos de 95°C durante 30 segundos, 60°C durante 30 segundos, 72°C durante 15 segundos, luego una extensión final a 72°C durante 30 segundos.

5. Purificación de productos de ADNbc reamplificados con código de barras

Los productos de ADNcd reamplificados con código de barras se purificaron con una relación de perlas AMPure XP 1,5X (75 |jl), de acuerdo con el paso 5 descrito anteriormente, y se eluyeron en 35 |jl de amortiguador de TE bajo. El eluato se transfirió a un nuevo tubo y posteriormente se cuantificó mediante ensayo HS de ADNcd en el fluorómetro Qubit® 2.0 para obtener un agrupamiento de muestras equimolares finales. El agrupamiento equimolar se creó combinando la misma cantidad de cada biblioteca con diferentes adaptadores A-LIB-BC-X, produciendo el agrupamiento final con la concentración de 34 ng/jL en un volumen final de 42 jL .

6. Selección de tamaño

El sistema E-Gel® SizeSelectMR en combinación con el gel de agarosa prefabricado Size Select 2% (Invitrogen) se utilizó para la selección del tamaño de los fragmentos de interés, de acuerdo con las instrucciones del fabricante. Se cargaron veinte j L del agrupamiento final en dos carriles de un gel E y usando un estándar de tamaño (ADN 50 pb, Ladder, Invitrogen), se seleccionó un intervalo de sección entre 300 y 400 pb del gel. Después de seleccionar el tamaño, la limpieza se realizó con perlas AMPure XP 8X (90 j l ) de acuerdo con el paso 3 descrito anteriormente. La biblioteca final se eluyó en 30 j l de amortiguador de TE bajo.

7. Secuenciación de Ion Torrent Proton

El agrupamiento equimolar, después de la etapa de purificación, se calificó mediante el kit de alta sensibilidad de ADN Agilent en el 2100 Bioanalyzer® (Agilent) y se cuantificó utilizando el kit de ensayo Qubit® dsDNA HS. Finalmente, el conjunto equimolar se diluyó a una concentración final de 100 jM .

La preparación del molde se realizó de acuerdo con la guía de usuario Ion MLMR Hi-QMR Chef. El sistema Ion ChefMR proporciona preparación automatizada de moldes de alto rendimiento y carga de chips para su uso con el secuenciador Ion ProtonMR. El secuenciador Ion ProtonMR realiza la secuenciación automatizada de alto rendimiento de las bibliotecas cargadas en el chip Ion MLMR utilizando el kit de secuenciación Ion ProtonMR Hi-QMR (Life Technologies). Finalmente, los fragmentos secuenciados se asignaron a muestras específicas con base en su código de barras único.

Ejemplo 3:

Protocolos para secuenciación de genoma completo de paso bajo en Illumina MiSeq

Protocolo 1

• Amplificación de genoma completo de sitio de restricción determinista (DRS-WGA):

El ADN unicelular se amplificó utilizando el kitAmpli1MRWGA (Silicon Biosystems) de acuerdo con las instrucciones del fabricante. Se diluyeron cinco j L de ADN amplificado con WGA mediante la adición de 5 j L de agua libre de nucleasa y se purificaron utilizando el sistema Agencourt AMPure XP (relación 1,8x). El ADN se eluyó en 12,5 j L y se cuantificó mediante ensayo HS de ADNcd en el fluorómetro Qubit® 2.0.

• Reamplificación con código de barras

La reamplificación con código de barras se realizó como se muestra esquemáticamente en la figura 4, en un volumen de 50 j L utilizando el kit de PCRAmpli1MR(Menarini Silicon Biosystems). Cada reacción de PCR se compuso de la siguiente manera: 5 j L de amortiguador de reacción de PCRAmpli1MR(10X), 1 j L de un cebador de SEQ ID NO:195 a SEQ ID NO:202 (25 jM ), 1 j L de un cebador de SEQ ID NO:203 a SEQ ID NO:214 cebador(25 jM ), 1,75 j L de dNTP de PCRAmpli1MR(10 mM), 1,25 j L de BSA, 0,5 de polimerasa PCR Taq, 25 ng del ADN purificado por WGA y aguaAmpli1MRpara alcanzar un volumen final de 50 jl .

El termociclador Applied Biosystems® 2720 se estableció como sigue: 95°C durante 4 minutos, 1 ciclo de 95°C durante 30 segundos, 60°C durante 30 segundos, 72°C durante 2 minutos, 10 ciclos de 95°C durante 30 segundos, 60°C durante 30 segundos, 72°C durante 2 minutos (extendido por 20 segundos/ciclo) y extensión final a 72°C durante 7 minutos.

Los productos de WGA reamplificados con código de barras (que contienen secuencias adaptadoras de secuenciación Illumina tomadas de la lista S E P IDS ILL PR1) se calificaron entonces mediante el kit Agilent DNA 7500 en el 2100 Bioanalyzer® y se cuantificaron mediante el fluorómetro Qubit® 2.0.

• Selección de tamaño

Luego, las bibliotecas se combinaron a una concentración equimolar y el grupo resultante, con una concentración de 28,6 ng/|jL y un volumen final de 100 |j L, se seleccionó por tamaño mediante doble purificación con perlas SPRI. En resumen, las perlas SPRI se diluyeron 1:2 con agua de grado PCR. Se agregaron 160 j L de perlas SPRI diluidas a los 100 j L de la combinación. Después de la incubación, se transfirieron 25 j L de sobrenadante a un nuevo vial y se agregaron 30 j L de perlas SPRI diluidas. El ADN se eluyó en 20 j L de TE bajo. El tamaño de fragmento se verificó mediante el chip de alta sensibilidad 2100 Bioanalyzer (Agilent Technologies) y la cuantificación de la biblioteca se realizó mediante qPCR utilizando el kit de cuantificación de la biblioteca Kapa.

• Secuenciación de MiSeq

7 nM del agrupamiento seleccionado por tamaño se desnaturalizó 5 minutos con NaOH (concentración final de NaOH igual a 0. IN). La muestra desnaturalizada luego se diluyó con HT1 para obtener una biblioteca desnaturalizada 20 jM en NaOH 1 mM. Se cargaron 570 j L de biblioteca desnaturalizada 20 pM y 30 j L de control PhiX desnaturalizado 20 jM en un MiSeq (Illumina).

Se generaron lecturas de extremo individual de 150 bases usando la composición química v3 del Illumina MiSeq. SEQ ID NO list_first_primer_[ILLUMINA/DRS-WGA] protocol1

La siguiente tabla ilustra la estructura de los cebadores compatibles con DRS-WGA para la plataforma Illumina (secuencias en la dirección 5 ' 3', 5' y 3' omitidas):

Tabla 3

La siguiente tabla informa las secuencias de cebadores finales:

Tabla 4

SEQ ID NO: list_first_primer_[Illumina_prot1_DRS_WGA]

SEQ ID NO: list_first_primer_[ILLUMINA/MALBAC] protocoll

La siguiente tabla ilustra la estructura de los cebadores compatibles con MALBAC-WGA para la plataforma Illumina (secuencias en la dirección 5' ^ 3', 5' y 3' omitidas):

Tabla 5

La siguiente tabla informa las secuencias de cebadores finales:

Tabla 6

SEQ ID NO list_first_primer_[Nlumina_prot1/MALBAC]

Limitaciones del protocolo 1

Las bibliotecas resultantes del protocolo Illumina 1 son pWGA lib de cadena doble con todas las parejas combinadas de adaptadores P5/P7 posibles

Dado que dentro de la celda de flujo la hibridación se produjo también por fragmentos con adaptadores de secuenciación homogéneos (P5/P5rc, P7rc/P7), la densidad de ago lpamientos y/o calidad de los agrupamientos podría resultar ligeramente menor en comparación con el caso del protocolo Illumina 2.

Protocolo 2

Se proporciona un segundo protocolo a modo de ejemplo. Este protocolo puede ser ventajoso para aumentar la calidad de los grupos en las celdas de flujo de Illumina, al seleccionar de pWGAlib solo fragmentos que abarcan ambos adaptadores de secuenciación (P5/P7), descartando fragmentos con adaptadores de secuenciación homogéneos (P5/P5rc, P7rc/P7).

Descripción de flujo de trabajo del protocolo 2 (Nlumina/DRS_WGA) como se ilustra esquemáticamente en la figura 4

Todos los productos de ADN amplificados con WGA están compuestos por moléculas de diferente longitud y con una etiqueta específica: la secuencia LIB en el extremo 5' la secuencia LIB complementaria en el extremo 3' de cada molécula de ADNmc individual (indicada en azul en la figura).

De acuerdo con este protocolo, ambas secuencias LIB de complemento inverso son las dianas para los cebadores Re-Amp de NGS (reamplificación).

Se han diseñado dos tipos de cebadores LPb_DI_D50X (intervalo entre cebador de SEQ ID NO:235 a SEQ ID NO:242) y cebador biotinilado LPb_DI_D70X (intervalo entre cebador de SEQ ID NO:243 a SEQ ID NO:254), respectivamente en verde-amarillo-azul y en rojo-rosa-azul en la figura.

Como se esperaba, ambos tipos de cebadores se pueden unir a la secuencia de LIB y a la secuencia de LIB complementaria, y de hecho surgen tres tipos de amplicones del proceso de Re-Amp de NGS, como se indica en la figura.

Este protocolo es proporcionado por LPb_DI_D70X (indicado en la figura como adaptador P7rc) que obtiene una etiqueta de biotina en el extremo 5'. Esta etiqueta específica se utiliza para seleccionar, mediante perlas de estreptavidina, el único fragmento sin etiqueta de biotina:

5'-P5-i5-LIB-inserto-LIBcomplementario-i7-P7-3'

como se ilustra en la figura.

Para obtener ADNmc de la formación deseada (omitiendo por simplicidad las secciones de cebadores de lectura, el ADNmc deseado es: 5'-P5-i5-nnnnn-i7-P7-3'), los cebadores deben ser como:

(1PR) 5'-P5-i5-LIB-3' y

(2PR) Biotina-5'-P7rc-i7rc-LIB-3' (La biotina se omitirá en lo que sigue por simplicidad de descripción, pero es evidente que estará presente en todos y solo los extremos 5' de los fragmentos que comienzan con P7rc).

A través de la reamplificación se obtiene:

inicio: (los fragmentos de ADNmc de WGA se forman todos como: 5'- LIB-nnn-LIBrc-3')

ciclo de extensión n=1):

1.5 5'-P5-i5-LIB-nnn-LIBrc-3',

1.7 5'-P7rc-i7rc-LIB-nnn-LIBrc-3'

2"n fragmentos [0% secuenciable]

ciclo n=2):

2.5.5 5'-P5-i5-LIB-nnn-LIBrc-i5rc-P5rc-3'

2.5.7 5'-P7rc-i7rc-LIB-nnn-LIBrc-i5rc-P5rc-3'

2.7.5 5'-P5-i5-LIB-nnn-LIBrc-i7-P7-3'

2.7.7 5'-P7rc-i7rc-LIB-nnn-LIBrc-i7-P7-3'

2"n=4 fragmentos[25% fragmentos secuenciables]

-ciclo=3):

2.5.5.5 5'-P5-i5-LIB-nnn-LIBrc-i5rc-P5rc-3' = 2.5.5

2.5.5.7 5'-P7rc-i7rc-LIB-nnn-LIBrc-i5rc-P5rc-3' = 2.5.7

2.5.7.5 5'-P5-i5-LIB-nnn-LIBrc-i7-P7-3' = 2.7.5

2.5.7.7 5'-P7rc-i7rc-LIB-nnn-LIBrc-i7-P7-3' = 2.7.7

2.7.5.5 5'-P5-i5-LIB-nnn-LIBrc-i5rc-P5rc-3' = 2.5.5

2.7.5.7 5'-P7rc-i7rc-LIB-nnn-LIBrc-i5rc-P5rc-3' = 2.5.7

2.7.7.5 5'-P5-i5-LIB-nnn-LIBrc-i7-P7-3' = 2.7.5

2.7.7.7 5'-P7rc-i7rc-LIB-nnn-LIBrc-i7-P7-3' = 2.7.7

2"n=8 fragmentos [25% fragmentos secuenciables] 0 fragmentos secuenciables = 2"n/4 = 2"n/2"2=2" (N-2)

Ciclo m)... 2" (m-2) secuenciable

Al final, se forman los siguientes cuatro tipos de fragmentos después de la amplificación exponencial.

2.5.5 5'-P5-i5-LIB-nnn-LIBrc-i5rc-P5rc-3' (se ^ lavará en la primera eliminación de líquido, en tanto que se mantienen todos los fragmentos biotinilados en las perlas paramagnéticas o, si no se lava, se acoplará solo a un sitio de unión en la celda de flujo, pero no genera un agolpamiento de secuenciación ya que no se produce amplificación de puente).

2.5.7 Biotina-5'-P7rc-i7rc-LIB-nnn-LIBrc-i5rc-P5rc-3' (^ se eliminará mediante perlas revestidas con estreptavidina)

2.7.5 5'-P5-i5-LIB-nnn-LIBrc-i7-P7-3' (^-secuenciable)

2.7.7 Biotina-5'-P7rc-i7rc-LIB-nnn-LIBrc-i7-P7-3' (^ se eliminará mediante perlas revestidas con estreptavidina).

Ejemplo 4:

1. Amplificación de genoma completo de sitio de restricción determinista (DRS-WGA)

2 Reamplificación de los productos de WGA

Se diluyen cinco |<j>L de ADN amplificado con WGA mediante la adición de 5 |<j>L de agua libre de nucleasa y se purifican utilizando el sistema Agencourt AMPure XP (Beckman Coulter) para eliminar oligonucleótidos no unidos y el exceso de nucleótidos, sales y enzimas.

La purificación de ADN basada en perlas se realizó de acuerdo con el siguiente protocolo: Se agregaron 18<j>L de perlas (volumen de muestra 1,8X) a cada muestra. Las perlas y los productos de reacción se mezclaron mediante agitación excéntrica breve y luego se centrifugaron para recolectar las gotitas. Las reacciones mixtas luego se incubaron fuera del imán durante 15 minutos a temperatura ambiente, después de lo cual luego se transfirieron a un imán lateral DynaMag-96 (Life Technologies) y se dejaron reposar durante 5 min. El sobrenadante se descartó y las perlas se lavaron con 150 j L de EtOH al 80% recién hecho. Después de una segunda ronda de lavado con EtOH, se dejaron secar las perlas en el imán durante 5-10 min. Las perlas secas entonces se resuspendieron fuera del imán en 15<j>L de amortiguador de TE bajo y se incubaron durante 10 min, seguido de 5 min de incubación en el imán. Se transfirieron doce microlitros del eluato a otro tubo y posteriormente se cuantificaron mediante ensayo HS de ADNbc en el fluorómetro Qubit® 2.0 para preparar alícuotas de 10<j>L que contenían 25 ng de ADN purificado con WGA.

La reamplificación con código de barras se realizó en un volumen de 50<j>L utilizando el kit de PCRAmpli1MR(Silicon Biosystems). Cada reacción de PCR se compuso de la siguiente manera:

5 j l de amortiguador de reacción de PCRAmpli1MR(10X), 1 j L de 25 j M de un cebador de SEQ ID NO:235 a SEQ ID NO:242

[3] 5'AATGATACGGCGACCACCGAGATCTACAC[i5]GCTCTCCGTAGTGGGATTCCTGCTGTCAGTTAA3') 1<j>L de 25<j>M de un cebador de SEQ ID NO:243 a SEQ ID NO:254

[4] (5'/Biosg/CAAGCAGAAGACGGCATACGAGAT[i7]GCTCACCGAAGTGGGATTCCTGCTGTCAGTTAA3') 1,75 j l deAmpli1MRPCR dNTP (10 mM), 1,25<j>L de BSA, 0,5 deAmpli1MRpolimerasa PCR Taq y 25 ng del ADN purificado por WGA y 37,5 j L de aguaAmpli1MR.

3) Selección de tamaño

Los productos de WGA reamplificados con código de barras, correspondientes a una biblioteca de fragmentos con adaptadores Illumina proporcionados, se calificaron mediante el kit Agilent DNA 7500 en el 2100 Bioanalyzer® (Agilent) y se cuantificaron utilizando el kit de ensayo Qubit® dsDNA HS con el fin de obtener un agrupamiento final.

El grupo equimolar se creó combinando la misma cantidad de bibliotecas individuales con diferentes adaptadores de índice dual LPb_DI, produciendo el agrupamiento final con la concentración de 35 ng/jL en un volumen final de 50 j L. La concentración del agrupamiento se confirmó mediante el método Qubit®.

Se ha seleccionado un intervalo de sección de fragmentos entre 200 pb y 1 Kb mediante doble purificación utilizando el sistema de perlas SPR I (Beckman Coulter) con una relación R :0,47X and L:0,85X, respectivamente. Con el fin de eliminar el fragmento de ADN grande, agregamos 82 |j L de SPR I diluido (42 |j L de perla SPR I 42 |jL de agua de grado PCR) y 34,2 j L de perla SPRI sin diluir al sobrenadante para eliminar los fragmentos de ADN pequeños.

La biblioteca final se eluyó en 50 j l de amortiguador de TE bajo y se evaluó utilizando un chip de alta sensibilidad 2100 Bioanalyzer (Agilent Technologies).

4) Selección heterogénea de la biblioteca monocatenaria de adaptador P5/P7

Se ha realizado una selección de fragmentos utilizando el sistema Dynabeads® MyOneMR Streptavidin Cl, con el fin de disociar solo el ADN no biotinilado que contiene el adaptador P5/P7 y esto se podría obtener utilizando calor 0 NaOH, respectivamente. Más adelante se describen dos métodos.

Se lavaron veinte<j>L de Dynabeads® MyOneMR Streptavidin Cl en un tubo de 1,5 ml dos veces con la solución B&W IX (Tris-HCl 10 mM (pH 7,5); EDTA 1 mM; NaCl 2M).

Se agregaron cincuenta j L de biblioteca de agrupamiento fraccionada a la perla Dynabeads® MyOneMR Streptavidin Cl y se incubó durante 15 min, pipeteando cada 5 min para mezclar a fondo. Lavar dos veces las Dynabeads® revestidas de ADN en 50 j L de 1 x SS C (NaCl 0,15 M, citrato de sodio 0,015 M) y resuspender las perlas con 50 j L de 1 x SSC .

Después de la incubación a 95 °C durante 5 minutos, el tubo se colocó en la placa magnética durante 1 min y los 50 j L de sobrenadante se transfirieron a un nuevo tubo y se incubaron en hielo durante 5 min.

En este punto, el sobrenadante contiene una biblioteca de cadenas de ADN no biotiniladas con adaptador P5/P7. Para asegurar que el lavado fuera más estricto, se repitió el procedimiento de selección de estreptavidina por segunda vez.

En su lugar de usar calor, las Dynabeads® revestidas con ADN lavadas se podrían hacer resuspendiendo con 20 j L de NaOH 0,15 M recién preparado.

Después de la incubación a temperatura ambiente durante 10 min, el tubo se colocó en un soporte magnético durante 1-2 minutos y se transfirió el sobrenadante a un nuevo tubo.

El sobrenadante contiene su cadena de ADN no biotinilada.

La biblioteca monocatenaria se neutralizó mediante la adición de 2,2 j L 10 x TE , pH 7,5 y 1,3 j L de ácido acético 1,25 M.

La concentración final de la biblioteca cuantificada por el kit de ensayo de ADN monocatenario Qubit® fue de 5 ng/jL correspondiente a 25 j M.

5) Secuenciación de MiSeq

4 nM del agrupamiento final se desnaturalizaron 5 minutos con NaOH (concentración final de NaOH igual a 0,1N). La muestra desnaturalizada luego se diluyó con HT1 para obtener una biblioteca desnaturalizada 20 pM en NaOH 1 mM. Se cargaron 570<j>L de biblioteca desnaturalizada 20 pM y 30<j>L de control PhiX desnaturalizado 20 pM en un MiSeq (Illumina).

Se generaron lecturas de extremo individual de 150 bases usando la composición química v3 del Illumina MiSeq intercambiando el cebador estándar de lectura 1 y el índice de cebador estándar 1 con respectivamente 600<j>L de SEQ ID NO: 255 cebador (cebador de lectura personalizado 1) y 600 j L de SEQ ID NO:256 o SEQ ID n O:258 cebador (índice de cebador personalizado 1a (i7) y 1b (i7))

SEQ ID NO list_first_primer_[ILLUMINA_DRS_WGA] protoco2

La siguiente tabla informa las secuencias de cebadores finales del protocolo Illumina 2:

Tabla 7

SEQ ID NO list_first_primer_[ILLUMINA/MALBAC] protocol2

La siguiente tabla informa las secuencias de cebadores finales compatibles con Illumina en caso de que el material de partida provenga de una biblioteca WGA-MALBAC:

Tabla 8

Ambas LIB complementarias inversas son las dianas para los cebadores Re-Amp de NGS (reamplificación) como se muestra en la figura 4. Además, se ha diseñado un cebador de secuenciación read1 personalizado (SEQ ID N0:255), con el fin de aumentar la complejidad de la biblioteca, porque las lecturas no comenzarán con el mismo nucleótido que podría afectar el rendimiento de secuenciación o evitar el uso de un pico de alta concentración para asegurar un conjunto más diverso de agrupamientos para cálculos de matriz, ajuste de fase y ajuste de prefase. El cebador de secuenciación read1 personalizado (SEQ ID NO:255) contiene la secuencia LIB y es complementario a la secuencia complementaria inversa LIB, como se ilustra en la figura 4.

Además, los productos de Re-Amp (reamplificación) de NGS no tienen la secuencia canónica utilizada por los sistemas Illumina para leer el índice 1, por esta razón es necesario utilizar el índice de cebador de secuenciación personalizado 1 (i7) (SEQ ID NO:256 o SEQ ID NO:258) para permitir la lectura correcta del índice i7. Cabe destacar que el índice de cebador de secuenciación personalizado 1 contiene la secuencia LIB complementaria inversa.

Todos los ejemplos descritos anteriormente que incluyen los procedimientos PGM/Proton y el flujo de trabajo del protocolo de Illumina 1/2, se podrían realizar utilizando el cebador compatible con MALBAC enumerado en las tablas anteriores (SEQ ID NO:98 a SEQ ID NO:194 y SEQ ID NO:215 a SEQ ID NO:234 y SEQ ID NO:259 a SEQ ID NO:281).

Análisis de datos

Las lecturas secuenciadas se alinearon con el genoma de referencia humano hgl9 utilizando el algoritmo BWA MEM (Li H. y Durbin R., 2010). Los duplicados de PCR, las alineaciones de QC secundarias/complementarias/que no pasan y las lecturas multimapeador se filtraron utilizando Picard MarkDuplicates (http://broadinstitute.github.io/picard/) y samtools (Li H. et al, 200 9). Los análisis de cobertura se realizaron usando BEDTools (Quinlan A. et al, 2010).

Se utilizó el algoritmo Control-FREEC (Boeva V. et al., 2011) para obtener llamadas de número de copias sin una muestra de control. Los recuentos de lecturas se corrigieron mediante el contenido de GC y la capacidad de asignación (opción uniqMatch) y el tamaño de la ventana se determinaron mediante software utilizando coefficientOfVariation = 0. 06. La ploidía se estableció en 2 y no se utilizó el ajuste de contaminación.

Las gráficas para los perfiles de CNV se obtuvieron utilizando una secuencia de comandos de pitón personalizado como se muestra en las figuras de 6 a 9.

Aunque la presente invención se ha descrito con referencia al método para WGAAmplilsolamente, la técnica descrita, como parece obvio para un experto en la técnica, se aplica claramentemutatis mutandistambién a cualquier otro tipo de WGA (por ejemplo, MALBAC) que comprende una biblioteca con regiones 5' y 3' autocomplementarias.

Claims

REIVINDICACIONES

1. Un método para secuenciación de genoma completo de paso bajo que comprende los pasos de:

- proporcionar una pluralidad de bibliotecas de secuenciación masivamente paralela con código de barras obtenidas mediante un método para generar una biblioteca de secuenciación masivamente paralela que comprende los pasos de:

- proporcionar una biblioteca de ADN de WGA primaria (pWGAlib) que incluye fragmentos que consisten en una sección de secuencia 5'(5SS) conocida, una sección de secuencia media (MSS) y una sección de secuencia 3' (3SS) conocida complementaria inversa a la sección de secuencia 5' conocida, la sección de secuencia 5' (5SS) conocida que consiste en un adaptador de secuencia universal de biblioteca DRS-WGA o un adaptador de secuencia universal de biblioteca MALBAC, y la sección de secuencia media (MSS) que consiste en al menos una sección de inserción (IS), correspondiente a una secuencia de ADN del ADN no amplificado original antes de WGA, y opcionalmente una sección intermedia 5' flanqueante (F5) y/o una sección intermedia 3' flanqueante (F3); - reamplificar la biblioteca de ADN de WGA primaria usando al menos un primer cebador (1PR) y al menos un segundo cebador (2PR); donde

el por lo menos un primer cebador (1PR) comprende una primera sección 5' de cebador (1PR5S) y una primera sección 3' de cebador (1PR3S), la primera sección 5' de cebador (1PR5S) que comprende por lo menos un primer adaptador de secuenciación (1PR5SA) y por lo menos un primer código de barras de secuenciación (1PR5BC) en la posición 3' del por lo menos un primer adaptador de secuenciación (1PR5SA) y en la posición 5' de la primera sección de cebador 3' (1PR3S), y la primera sección de cebador 3'(1PR3S) que se hibrida con la sección de secuencia 5' conocida (5SS) o la sección de secuencia 3' (3SS) conocida; el por lo menos un segundo cebador (2PR) comprende una segunda sección 5' de cebador (2PR5S) y una segunda sección 3' de cebador (2PR3S), la segunda sección 5' de cebador (2PR5S) que comprende por lo menos un segundo adaptador de secuenciación (2PR5SA) diferente del por lo menos un primer adaptador de secuenciación (1PR5SA), y la segunda sección 3' de cebador (2PR3S) que se hibrida con la sección de secuencia 5' (5SS) conocida o la sección de secuencia 3' (3SS) conocida

- agrupar muestras obtenidas utilizando diferentes códigos de barras de secuenciación (BC); y

- secuenciar la biblioteca agrupada.

2. El método de acuerdo con la reivindicación 1, donde el segundo cebador (2PR) comprende además al menos un segundo código de barras de secuenciación (2PR5BC), en la posición 3' del por lo menos un segundo adaptador de secuenciación (2PR5SA) y en la posición 5' de la segunda sección 3' de cebador (2PR3S).

3. El método de acuerdo con la reivindicación 1 o2,donde el adaptador de secuencia universal de la biblioteca DRS-WGA es la SEQ ID NO:282 y el adaptador de secuencia universal de la biblioteca MALBAC es la SEQ ID NO:283 (MALBAC).

4. El método para secuenciación de genoma completo de paso bajo de acuerdo con cualquiera de las reivindicaciones 1 a 3, donde el paso de agrupar muestras utilizando diferentes códigos de barras de secuenciación (BC) comprende además los pasos de:

- cuantificar el ADN en cada una de las bibliotecas de secuenciación masivamente paralela con código de barras; - normalizar la cantidad de bibliotecas de secuenciación masivamente paralela con código de barras.

5. El método para secuenciación de genoma completo de paso bajo de acuerdo con la reivindicación 4, donde el paso de agrupar muestras utilizando diferentes códigos de barras de secuenciación (BC) comprende además el paso de seleccionar fragmentos de ADN que tienen al menos un intervalo seleccionado de pares de bases, donde el intervalo de pares de bases se centra en 650 pb, o 400 pb, o 200 pb, o 150 pb, o 100 pb, o 50 pb.

6. El método para secuenciación de genoma completo de paso bajo de acuerdo con la reivindicación 5, que comprende además el paso de seleccionar fragmentos de ADN que comprenden el primer adaptador de secuenciación y los segundos adaptadores de secuenciación.

7. El método para secuenciación de genoma completo de paso bajo de acuerdo con la reivindicación 6, donde el paso de seleccionar fragmentos de ADN que comprenden el primer adaptador de secuenciación y los segundos adaptadores de secuenciación se lleva a cabo poniendo en contacto la biblioteca de secuenciación masivamente paralela con perlas paramagnéticas funcionalizadas con un revestimiento de estreptavidina, y donde uno del por lo menos un primer cebador (1PR) y el por lo menos un segundo cebador (2PR) se biotinilan en el extremo 5', y se obtienen fragmentos seleccionados eluyendo de los fragmentos de ADNmc no biotinilados de las perlas.

8. El método para secuenciación de genoma completo de paso bajo de acuerdo con la reivindicación 7, donde el por lo menos un segundo cebador está biotinilado en el extremo 5'.

9. El método para secuenciación de genoma completo de paso bajo de acuerdo con la reivindicación 7 o 8, que comprende además los pasos adicionales de:

- incubar la biblioteca de ADNbc de WGA reamplificada con las perlas paramagnéticas funcionalizadas en condiciones diseñadas, causando así la unión covalente entre la biotina y la estreptavidina asignada en las perlas paramagnéticas funcionalizadas;

- lavar los fragmentos de ADNbc no biotinilados no unidos;

- eluir de las perlas paramagnéticas funcionalizadas los fragmentos de ADNmc retenidos.

10. Un método para perfilar el número de copias de genoma completo, que comprende los pasos del método para secuenciación de genoma completo de paso bajo de acuerdo con cualquiera de las reivindicaciones anteriores,

- analizar la densidad de lectura de secuenciación en diferentes regiones del genoma,

- determinar un valor de número de copias para las regiones del genoma comparando el número de lecturas en esa región con respecto al número de lecturas esperadas en la misma para un genoma de referencia.

11. Un método para perfilar el número de copias de genoma completo de acuerdo con la reivindicación 10, donde la biblioteca de secuenciación masivamente paralela se prepara mediante el uso de:

a) el cebador de SEQ ID NO: 97 (Tabla 2) y uno o más cebadores seleccionados del grupo que consiste en SEQ ID NO:1 a SEQ ID NO: 96 (Tabla 2); o

b) el cebador de SEQ ID NO:194 (Tabla 2) y uno o más cebadores seleccionados del grupo que consiste en SEQ ID NO:98 a SEQ ID NO:193 (Tabla 2); o

c) al menos un cebador seleccionado del grupo que consiste en SEQ ID NO: 195 a SEQ ID NO:202 (Tabla 4), y al menos un cebador seleccionado del grupo que consiste en SEQ ID NO:203 a SEQ ID NO:214 (Tabla 4); o d) al menos un cebador seleccionado del grupo que consiste en SEQ ID NO:215 a SEQ ID NO:222 (Tabla 6), y al menos un cebador seleccionado del grupo que consiste en SEQ ID NO:223 a SEQ ID NO:234 (Tabla 6); o e) al menos un cebador seleccionado del grupo que consiste en SEQ ID NO:235 a SEQ ID NO:242 (Tabla 7), y al menos un cebador seleccionado del grupo que consiste en SEQ ID NO:243 a SEQ ID NO:254 (Tabla 7), o f) al menos un cebador seleccionado del grupo que consiste en SEQ ID NO:259 a SEQ ID NO:266 (Tabla 8), y al menos un cebador seleccionado del grupo que consiste en SEQ ID NO:267 a SEQ ID NO:278 (Tabla 8);

12. Un método para perfil de número de copias de genoma completo de acuerdo con la reivindicación 10, donde la biblioteca de secuenciación masivamente paralela se prepara mediante el uso de - al menos un cebador seleccionado del grupo que consiste en SEQ ID NO:235 a SEQ ID NO:242 (Tabla 7); al menos un cebador seleccionado del grupo que consiste en SEQ ID NO:243 a SEQ ID NO:254 (Tabla 7); un cebador de secuenciación personalizado de SEQ<i>D NO:255; y un cebador de SEQ ID NO:256 o SEQ ID NO:258; o

- al menos un cebador seleccionado del grupo que consiste en SEQ ID NO:259 a SEQ ID NO:266 (Tabla 8); al menos un cebador seleccionado del grupo que consiste en SEQ ID NO: 267 a SEQ ID NO: 278 (Tabla 8); y cebadores de SEQ ID NO:279 y SEQ ID NO:280;

13. Un método para perfilar el número de copias de genoma completo de acuerdo con la reivindicación 12, donde la biblioteca de secuenciación masivamente paralela se prepara mediante el uso adicional de un cebador seleccionado de SEQ ID NO:257 (Tabla 7) y SEQ ID NO:281 (Tabla 8) diseñado para llevar a cabo un proceso de secuenciación de extremos emparejados óptimo en una plataforma de secuenciación seleccionada.