ES2924548T3 - Análisis paralelo multiplexado con enriquecimiento de blancos para la evaluación tumoral - Google Patents

Análisis paralelo multiplexado con enriquecimiento de blancos para la evaluación tumoral Download PDF

Info

Publication number
ES2924548T3
ES2924548T3 ES18745511T ES18745511T ES2924548T3 ES 2924548 T3 ES2924548 T3 ES 2924548T3 ES 18745511 T ES18745511 T ES 18745511T ES 18745511 T ES18745511 T ES 18745511T ES 2924548 T3 ES2924548 T3 ES 2924548T3
Authority
ES
Spain
Prior art keywords
tacs
sequences
tumor
sample
interest
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
ES18745511T
Other languages
English (en)
Inventor
George Koumbaris
Marios Ioannides
Elena KYPRI
Acilleas Achilleos
Petros MINA
Alexia Eliades
Charalambos Loizides
Philippos Patsalis
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nipd Genetics Public Co Ltd
Original Assignee
Nipd Genetics Public Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nipd Genetics Public Co Ltd filed Critical Nipd Genetics Public Co Ltd
Application granted granted Critical
Publication of ES2924548T3 publication Critical patent/ES2924548T3/es
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6876Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
    • C12Q1/6883Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6876Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
    • C12Q1/6883Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material
    • C12Q1/6886Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material for cancer
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6806Preparing nucleic acids for analysis, e.g. for polymerase chain reaction [PCR] assay

Abstract

La invención proporciona métodos para la evaluación de biomarcadores tumorales en muestras biológicas usando análisis paralelo multiplexado enriquecido con diana. Los métodos de la invención utilizan secuencias de captura de objetivos (Target Capture Sequences, TACS) para enriquecer de este modo las secuencias objetivo de interés, seguido de una secuenciación paralela masiva y un análisis estadístico de la población enriquecida. Los métodos se pueden usar con muestras de ADN de un paciente, como una biopsia de tejido o una muestra de plasma (biopsia líquida), para detectar la presencia de biomarcadores tumorales, por ejemplo, con fines de diagnóstico, detección, selección de terapia y/o seguimiento del tratamiento. . También se proporcionan kits para llevar a cabo los métodos de la invención. (Traducción automática con Google Translate, sin valor legal)

Description

DESCRIPCIÓN
Análisis paralelo multiplexado con enriquecimiento de blancos para la evaluación tumoral
Campo de la invención
La invención se inscribe en el campo de la biología, de la medicina y de la química, más específicamente en el campo de la biología molecular e incluso más específicamente en el campo del diagnóstico molecular.
Antecedentes de la invención
La identificación de biomarcadores tumorales ha sido un avance importante en la detección, el diagnóstico y el tratamiento de una gran variedad de tipos de cáncer. En la técnica se conocen distintos métodos para la detección de biomarcadores tumorales; sin embargo, todavía se necesitan más métodos, en particular métodos que permitan la detección de biomarcadores tumorales de forma no invasiva, por ejemplo, a partir de una muestra de plasma (biopsia líquida). La identificación de mutaciones hereditarias (en la línea germinal) en pacientes con cáncer o individuos de alto riesgo que presuntamente padecen un síndrome de predisposición al cáncer es una herramienta clínica útil que permite la intervención médica temprana, la cirugía profiláctica y la monitorización atenta. Estas mutaciones en la línea germinal pueden identificarse a partir del tejido sano de un individuo (por ejemplo, a partir de un hisopado bucal o de linfocitos).
Se han implementado tecnologías de secuenciación de última generación (NGS) en el desarrollo de análisis prenatales no invasivos (NIPT). En 2008, dos grupos independientes demostraron que podía realizarse un NIPT para detectar la trisomía 21 mediante el uso de secuenciación masiva paralela shotgun (MPSS) de última generación (Chiu, R. W. et al. (2008) Proc. Natl. Acad. Sci. USA 105:20458-20463; Fan, H.C. et al. (2008) Proc. Natl. Acad. Sci. USA 105:16266-162710). Se han descrito ensayos clínicos a gran escala usando NGS para NIPT (Palomaki, G.E. et al. (2011) Genet. Med. 13:913-920; Ehrich, M. et al. (2011) Am. J. Obstet. Gynecol. 204:205e1-11; Chen, E.Z. et al. (2011) PLoS One 6:e21791; Sehnert, A.J. et al. (2011) Clin. Chem. 57:1042-1049; Palomaki, G.E. et al. (2012) Genet. Med. 14:296-305; Bianchi, D.W. et al. (2012) Obstet. Gynecol. 119:890-901; Zimmerman, B. et al. (2012) Prenat. Diag. 32:1233-1241; Nicolaides, K.H. et al. (2013) Prenat. Diagn. 33:575-579; Sparks, A.B. et al. (2012) Prenat. Diagn. 32:3-9).
Los primeros enfoques hacia los NIPT empleaban metodologías de secuenciación masiva paralela shotgun (MPSS) basada en tecnologías de NGS (véase, por ejemplo, la patente estadounidense n.° 7,888,017; la patente estadounidense n.° 8,008,018; la patente estadounidense n.° 8,195,415; la patente estadounidense n.° 8,296,076; la patente estadounidense n.° 8,682,594; la publicación de patente estadounidense n.° 20110201507; y la patente estadounidense n.° 20120270739). Estos enfoques se basan en secuenciación de genoma completo. Más recientemente, se han desarrollado enfoques de NIPT basados en NGS dirigida, en los que se secuencian únicamente secuencias específicas de interés. Por ejemplo, se ha descrito un enfoque de NIPT dirigido que emplea secuencias de captura de blancos (TACS) para la identificación de anomalías cromosómicas fetales a partir de una muestra de sangre materna (publicación de patente del PCT WO 2016/189388; publicación de patente estadounidense 2016/0340733; Koumbaris, G. et al. (2016) Clinical Chemistry, 62(6), pp. 848-855). Tales enfoques dirigidos requieren un volumen de secuenciación considerablemente menor que los enfoques de MPSS, dado que únicamente se secuencian loci específicos de la secuencia blanco de interés en lugar de regiones de todo el genoma.
Todavía se requieren metodologías para enfoques basados en NGS, en particular enfoques que puedan dirigirse a secuencias blanco específicas de interés, como, por ejemplo, biomarcadores tumorales, de modo de reducir considerablemente el volumen de secuenciación necesario en comparación con los enfoques de genoma completo y, al mismo tiempo, aumentar la profundidad de lecturas en la región de interés, lo que permitiría la detección de regiones con una baja relación señal-ruido. En particular, todavía se requieren metodologías que permitan detectar de forma confiable aberraciones genéticas presentes en cantidades diminutas, como, por ejemplo, para detectar de forma temprana el cáncer.
Resumen de la invención
Esta invención provee métodos superiores para enriquecer regiones genómicas blanco de interés para su análisis mediante secuenciación paralela múltiplex, donde las secuencias enriquecidas son secuencias biomarcadoras tumorales y la muestra de ADN usada en el método proviene de un sujeto que tiene o presuntamente tiene un tumor. Así, los métodos permiten la detección de biomarcadores tumorales en una variedad de muestras biológicas, incluidas muestras líquidas, como muestras de plasma (biopsia líquida), lo que ofrece una forma no invasiva de detección y monitorización de tumores. Los métodos de la invención utilizan una mezcla de secuencias de captura de blancos (TACS) diseñada de tal manera que las secuencias dentro de la mezcla tengan características que optimizan la eficiencia, la especificidad y la exactitud de la evaluación genética de biomarcadores tumorales. Los métodos de la invención pueden usarse, por ejemplo, para el diagnóstico del cáncer, la detección del cáncer, la selección del régimen de tratamiento contra el cáncer y/o la monitorización del tratamiento contra el cáncer.
Así, en un aspecto, la invención refiere a un método para detectar uno o más biomarcadores tumorales en una muestra de a Dn de un sujeto que tiene o que presuntamente tiene un tumor, donde el método comprende:
(a) preparar la biblioteca de secuenciación a partir de la muestra de ADN;
(b) hibridar la biblioteca de secuenciación a una mezcla de secuencias de captura de blancos (TACS) de hebra doble que se unen a una o más secuencias biomarcadoras tumorales de interés, donde: (i) cada secuencia miembro de la mezcla de TACS tiene entre 150 y 260 pares de bases de longitud, y cada secuencia miembro tiene un extremo 5' y un extremo 3'; (ii) preferentemente y opcionalmente, cada secuencia miembro se une a la secuencia biomarcadora tumoral de interés a una distancia de al menos 50 pares de bases, tanto en el extremo 5' como en el extremo 3', de regiones que presentan variaciones en el número de copias (CNV), duplicaciones segmentales o elementos de ADN repetitivo; (iii) el contenido de GC de la mezcla de TACS, que se determina calculando el contenido de GC de cada miembro de la mezcla de TACS, está entre el 19 % y el 80 %; (iv) la mezcla de TACS comprende múltiples familias de TACS, cada una dirigida a una secuencia biomarcadora tumoral de interés, donde cada familia de TACS comprende múltiples secuencias miembro, donde cada secuencia miembro se une a la misma secuencia biomarcadora tumoral de interés, pero tiene diferentes posiciones de inicio y/o fin con respecto a un sistema de coordenadas de referencia de la secuencia biomarcadora tumoral de interés, donde, opcionalmente, las posiciones de inicio y/o fin de las secuencias miembro dentro de una familia de TACS con respecto a un sistema de coordenadas de referencia del biomarcador tumoral están escalonadas por entre 5 y 10 pares de bases; (c) aislar aquellos miembros de la biblioteca de secuenciación que se unen a la mezcla de TACS para obtener una biblioteca enriquecida; (d) amplificar y secuenciar la biblioteca enriquecida; (e) alinear la biblioteca enriquecida a un genoma de referencia para obtener información sobre la profundidad de lecturas y recuentos alélicos; y (f) aplicar análisis estadísticos a las secuencias de la biblioteca enriquecida, opcionalmente usando solo fragmentos cuyo tamaño está dentro de un rango específico, para detectar el/los biomarcador(es) tumoral(es) en la muestra de ADN, donde la secuenciación de la biblioteca enriquecida proporciona una profundidad de lecturas de las secuencias genómicas de interés y profundidades de lecturas de loci de referencia y el análisis estadístico comprende aplicar un algoritmo que contrasta secuencialmente la profundidad de lecturas de los loci o de las secuencias genómicas de interés contra la profundidad de lecturas de los loci de referencia, donde el algoritmo comprende pasos para: (a) eliminar los loci secuenciados de forma inadecuada; (b) mitigar el sesgo inducido por el contenido de GC; y (c) determinar la condición genética; y/o donde la secuenciación de la biblioteca enriquecida provee el número y el tamaño de los fragmentos secuenciados correspondientes a coordenadas específicas de cada TACS y el análisis estadístico comprende aplicar un algoritmo que contrasta secuencialmente la proporción de tamaños de fragmentos de la secuencia genómica de interés contra la proporción de tamaños de fragmentos de los loci de referencia, donde el algoritmo comprende pasos para: (a) eliminar los valores atípicos de tamaños de fragmentos; (b) calcular la proporción de tamaños de fragmentos; y (c) determinar la condición genética.
En una realización, la mezcla de TACS comprende múltiples familias de TACS, donde cada miembro de una familia de TACS se une a la misma secuencia biomarcadora tumoral de interés, pero con diferentes posiciones de inicio y/o fin en la secuencia con respecto a un sistema de coordenadas de referencia (p. ej., la unión de los distintos miembros de la familia de TACS a la secuencia blanco está escalonada), de modo de enriquecer secuencias blanco de interés, seguido de una secuenciación paralela en masa y un análisis estadístico de la población enriquecida. Usar, dentro de la mezcla de TACS, familias de TACS que se unen a cada secuencia blanco de interés en lugar de usar una única TACS que se una a cada secuencia blanco de interés aumenta considerablemente el enriquecimiento de las secuencias blanco de interés, lo que se manifiesta como un aumento promedio superior al 50 % en la profundidad de lecturas obtenida con familias de TACS en comparación con TACS individuales. Aquí, las mutaciones detectadas o los biomarcadores detectados pueden deberse a una mutación somática o pueden ser hereditarios, es decir, ya estar presentes en la línea germinal.
Así, en una realización, la mezcla de TACS comprende múltiples familias de TACS dirigidas a diferentes secuencias biomarcadoras tumorales de interés, donde cada familia de TACS comprende múltiples secuencias miembro, donde cada secuencia miembro se une a la misma secuencia biomarcadora tumoral de interés, pero tiene diferentes posiciones de inicio y/o fin con respecto a un sistema de coordenadas de referencia de la secuencia genómica de interés.
En ciertas realizaciones, cada familia de TACS comprende al menos 3 secuencias miembro o al menos 5 secuencias miembro. En la presente, se describen otros números posibles de secuencias miembro en cada familia de TACS. En una realización, la mezcla de TACS comprende al menos 50 familias de TACS diferentes. En la presente, se describen otros números posibles de familias de TACS dentro de la mezcla de TACS. En ciertas realizaciones, las posiciones de inicio y/o fin de las secuencias miembro dentro de una familia de TACS con respecto a un sistema de coordenadas de referencia están escalonadas por entre 5 y 10 pares de bases.
En ciertas realizaciones, el contenido de GC de la mezcla de TACS se encuentra entre el 19 % y el 80 % o entre el 19 % y el 46 %. En la presente, se describen otros rangos de porcentaje de contenido de GC de la mezcla de TACS.
En una realización, la mezcla de TACS está fijada a un sustrato sólido. Por ejemplo, en una realización, las TACS están biotiniladas y fijadas a microesferas magnéticas recubiertas con estreptavidina.
En una realización, la amplificación de la biblioteca enriquecida se realiza en presencia de secuencias de bloqueo que inhiben la amplificación de secuencias no mutantes.
En una realización, los miembros de la biblioteca de secuenciación que se unen a la mezcla de TACS son parcialmente complementarios a la TACS.
En una realización, el análisis estadístico comprende un algoritmo de segmentación. Por ejemplo, la segmentación basada en la verosimilitud, la segmentación con ventanas pequeñas solapadas, la segmentación mediante pruebas paralelas de a pares y combinaciones de los anteriores. En una realización, el análisis estadístico comprende un algoritmo de clasificación basado en puntuaciones. En una realización, la secuenciación de la biblioteca enriquecida provee una profundidad de lecturas correspondiente a las secuencias genómicas de interés y profundidades de lecturas correspondientes a los loci de referencia, y el análisis estadístico comprende aplicar un algoritmo que contrasta secuencialmente la profundidad de lecturas de los loci de las secuencias genómicas de interés contra la profundidad de lecturas de los loci de referencia, donde el algoritmo comprende pasos para: (a) eliminar los loci secuenciados de forma inadecuada; (b) mitigar el sesgo inducido por el contenido de GC; y (c) determinar la condición genética. En una realización, el sesgo inducido por el contenido de GC se mitiga agrupando los loci con contenidos de GC equiparables. En una realización, la secuenciación de la biblioteca enriquecida provee el número y el tamaño de los fragmentos secuenciados correspondientes a coordenadas específicas de cada TACS, y el análisis estadístico comprende aplicar un algoritmo que contrasta secuencialmente la proporción de tamaños de fragmentos de la secuencia genómica de interés contra la proporción de tamaños de fragmentos de los loci de referencia, donde el algoritmo comprende pasos para: (a) eliminar los valores atípicos de tamaños de fragmentos; (b) calcular la proporción de tamaños de fragmentos; y (c) determinar la condición genética.
En una realización, la muestra de ADN comprende ADN libre tumoral (ADNlt). En varias realizaciones, la muestra de ADN se selecciona de entre un grupo que comprende una muestra de plasma, una muestra de orina, una muestra de esputo, una muestra de líquido cefalorraquídeo, una muestra de líquido peritoneal y una muestra de efusión pleural de un sujeto que tiene o presuntamente tiene un tumor. En una realización, la muestra de ADN proviene de una muestra de tejido de un sujeto que tiene o presuntamente tiene un tumor.
En una realización, la mezcla de TACS se une a múltiples secuencias biomarcadoras tumorales de interés seleccionadas de entre un grupo que comprende ABL, AKT, AKT1, ALK, APC, AR, ARAF, ATM, BAP1, BARD1, BCL, BMPR1A, BRAF, BRCA, BRCA1, BRCA2, BRIP1, CDH1, CDKN, CHEK2, CTNNB1, DDB2, DDR2, DICER1, EGFR, EPCAM, ErbB, ErcC, ESR1, FANCA, FANCB, FANCC, FANCD2, FANCE, FANCF, FANCG, FANCI, FANCL, FANCM, FBXW7, FGFR, FLT, FLT3, FOXA1, FOXL2, GATA3, GNA11, GNAQ, GNAS, GREM1, HOX, HOXB13, HRAS, IDH1, JAK, JAK2, KEAP1, KIT, KRAS, MAP2Ks, MAP3Ks, MET, MLH1, MPL, MRE11A, MSH2, MSH6, MTOR, MUTYH, NBN, NPM1, NRAS, NTRK1, PALB2, PDGFRs, Pl3KCs, PMS2, POLD1, POLE, POLH, PTEN, RAD50, RAD51C, RAD51D, RAF1, RB1, RET, RUNX1, SLX4, SMAD, SMAD4, SMARCA4, SPOP, STAT, STK11, TP53, VHL, XPA, XPC y combinaciones de las anteriores.
En otra realización, la mezcla de TACS se une a múltiples secuencias biomarcadoras tumorales de interés seleccionadas de entre un grupo que comprende AKT1, A l K, APC, AR, ARAF, ATM, BAP1, BARD1, BMPR1A, BRAF, BRCA1, BRCA2, BRIP1, CDH1, CDK4, CDKN2A (p14ARF), CDKN2A (p16INK4a), CHEK2, CTNNB1, DDB2, DDR2, DICER1, EGFR, EPCAM, ERBB2, ERBB3, ERBB4, ERCC1, ERCC2, ERCC3, ERCC4, ERCC5, ESR1, FANCA, FANCB, FANCC, FANCD2, FANCE, FANCF, FANCG, FANCI, FANCL, FANCM, FBXW7, FGFR1, FGFR2, FLT3, FOXA1, FOXL2, GATA3, GNA11, GNAQ, GNAS, GREM1, HOXB13, IDH1, IDH2, JAK2, KEAP1, KIT, KRAS, MAP2K1, MAP3K1, MEN1, MET, MLH1, MPL, MRE11A, MSH2, MSH6, MTOR, MUTYH, MYC, MYCN, NBN, NPM1, NRAS, NTRK1, PALB2, PDGFRA, PIK3CA, PIK3CB, PMS2, POLD1, POLE, POLH, PTEN, RAD50, RAD51C, RAD51D, RAF1, RB1, RET, ROS1, RUNX1, SDHA, SDHAF2, SDHB, SDHC, SDHD, SLX4, SMAD4, SMARCA4, SPOP, STAT, STK11, TMPRSS2, TP53, VHL, XPA, XPC y combinaciones de las anteriores.
En una realización, la mezcla de TACS se une a múltiples secuencias biomarcadoras tumorales de interés seleccionadas de entre un grupo que comprende EGFR_6240, KRAS_521, EGFR_6225, NRAS_578, NRAS_580, PIK3CA_763, EGFR_13553, EGFR_18430, BRAF_476, KIT_1314, NRAS_584, EGFR_12378 y combinaciones de las anteriores.
En otra realización, la mezcla de TACS se une a múltiples secuencias biomarcadoras tumorales de interés seleccionadas de entre un grupo que comprende COSM6240 (EGFR_6240), COSM521 (KRAS_521), COSM6225 (EGFR_6225), COSM578 (NRAS_578), COSM580 (NRAS_580), COSM763 (PIK3CA_763), COSM13553 (EGFR_13553), COSM18430 (EGFR_18430), COSM476 (BRAF_476), COSM1314 (KIT_1314), COSM584 (NRAS_584), COSM12378 (e Gf R_12378) y combinaciones de las anteriores, donde los identificadores corresponden a los números de identificación de los biomarcadores en la base de datos COSMIC.
En una realización, el método comprende, además, hacer un diagnóstico del sujeto sobre la base de la detección de al menos una secuencia biomarcadora tumoral. En otra realización, el método comprende, además, seleccionar un régimen de tratamiento para el sujeto sobre la base de la detección de al menos una secuencia biomarcadora tumoral. En otra realización, el método comprende, además, vigilar la eficacia de un régimen de tratamiento brindado al sujeto sobre la base de la detección de al menos una secuencia biomarcadora tumoral.
Breve descripción de las figuras
El expediente de la patente o solicitud de patente contiene al menos una figura a color. La Oficina proporcionará copias de esta patente o solicitud de patente con figuras a color a solicitud, sujeto al pago de la tarifa correspondiente.
La Figura 1 es un diagrama esquemático del análisis paralelo múltiplex de regiones genómicas blanco para análisis prenatales no invasivos mediante secuencias de captura de blancos (TACS).
La Figura 2 es una lista de regiones cromosómicas ejemplares para TACS de amplificación que se unan a, por ejemplo, los cromosomas 13, 18, 21 o X. En la Tabla 1, se muestra una lista más extensa.
La Figura 3 es un diagrama esquemático del enriquecimiento basado en TACS de una secuencia de interés (línea gorda) usando una única TACS (izquierda) o usando una familia de TACS (derecha).
Las Figuras 4A-4B son gráficos que muestran el enriquecimiento usando familias de TACS frente al enriquecimiento usando TACS individuales, lo que se manifiesta en un aumento en la profundidad de lecturas promedio. En la Figura 4A, se muestran loci enriquecidos usando una familia de TACS (puntos rojos) frente a loci enriquecidos usando una única TACS (puntos azules); en el eje x se muestran las diferentes secuencias blanco y en el eje y, el cambio relativo en la profundidad de lecturas. La Figura 4B es un gráfico de barras que muestra el aumento relativo promedio en la profundidad de lecturas (54,7 %) cuando se usa una familia de TACS (derecha) respecto del caso cuando se usa una única TACS (izquierda).
En la Figura 5, se muestran gráficos de barras que ilustran la detección de mutaciones genéticas conocidas, que son biomarcadores tumorales, en material de referencia certificado que tiene las mutaciones en cuestión. Se muestran dos réplicas del material de referencia. La línea ilustra la frecuencia del alelo menos frecuente (MAF) prevista para cada una de las cargas tumorales evaluadas. Las barras (eje x) ilustran la MAF detectada (eje y) correspondiente a las mutaciones genéticas indicadas en el material de referencia certificado.
En la Figura 6, se muestran gráficos de barras que ilustran la detección de biomarcadores tumorales en muestras de pacientes con cáncer. Se muestran los resultados de dos pacientes: uno que tiene la mutación PIK3CA E545K (barras superiores) y uno que tiene la mutación TP53 K139 (barras inferiores). Se representan tanto muestras de tejido tumoral (“Rep. de tejido 1” y “Rep. de tejido 2”) como muestras de plasma (“Plasma”). En el eje y, se muestra la frecuencia del alelo mutante (VAF) detectada en las muestras (como un porcentaje).
La Figura 7 es un gráfico de barras que muestra el patrón observado de SNV somáticas en cáncer de mama, de acuerdo con la base de datos COSMIC. En el eje x, se muestra una mutación de una sola base observada en cáncer en el contexto de sus secuencias vecinas. Por ejemplo, A[C>A]T describe una mutación de una citosina (C) a adenina (A) aguas arriba de la cual hay una adenina y aguas abajo de la cual hay una timina. En el eje y, se muestra la frecuencia con la que ocurre esta mutación en cáncer de mama.
La Figura 8 es un gráfico de barras que muestra los resultados de un estudio de simulaciones en las que se usaron datos de secuenciación simulados que incluían motivos mutantes. Los datos se sometieron a la detección de motivos de mutaciones. Las barras indican la frecuencia promedio estimada de los motivos de mutación de cáncer de mama calculados a partir de un conjunto de datos de 10000 simulaciones. Los resultados muestran que es posible detectar motivos de mutación con el algoritmo desarrollado.
La Figura 9 es un gráfico de puntos que muestra los resultados de una prueba de fragmentos para la detección de un número creciente de fragmentos pequeños en una muestra combinada. Una muestra anómala aneuploide con una fracción fetal estimada del 2,8 % se detectó correctamente mediante este método. Los puntos negros son muestras individuales. En el eje x, se muestra el índice de la muestra. En el eje y, se muestra la puntuación que arroja el método basado en los tamaños de los fragmentos. Una puntuación mayor que el umbral mostrado por la línea gris indica una desviación respecto del tamaño esperado de los fragmentos, lo que es indicativo de la presencia de una aneuploidía.
La Figura 10 es una lista de regiones cromosómicas ejemplares para TACS de amplificación que se unen a genes biomarcadores tumorales ejemplares, sin carácter taxativo.
En la Tabla 1, se muestran posiciones de TACS ejemplares y preferentes.
Cr. In ic io Fin G C G en Cr. In ic io Fin G C G en chr1 11169250 11169491 0 ,434 M TO R chr17 37880017 37880264 0,528 E R B B 2 chr1 11169262 11169509 0 ,419 M TO R chr17 37880031 37880255 0,524 E R B B 2 chr1 11169280 11169519 0 ,400 M TO R chr17 37880061 37880274 0,505 E R B B 2 chr1 11169299 11169548 0,392 M TO R chr17 37880069 37880274 0,500 E R B B 2 chr1 11174376 11174632 0,541 M TO R chr17 37880955 37881196 0,595 E R B B 2 chr1 11174392 11174632 0 ,535 M TO R chr17 37880969 37881216 0,589 E R B B 2 chr1 11174392 11174691 0 ,527 M TO R chr17 37880974 37881216 0,593 E R B B 2 chr1 11174468 11174698 0 ,515 M TO R chr17 37880983 37881227 0,592 E R B B 2 chr1 11184541 11184796 0 ,504 M TO R chr17 37881166 37881380 0,609 E R B B 2 chr1 11184563 11184812 0 ,504 M TO R chr17 37881201 37881450 0,584 E R B B 2 chr1 11184564 11184816 0,502 M TO R chr17 37881273 37881520 0,573 E R B B 2 chr1 11187992 11188236 0 ,535 M TO R chr17 37881304 37881521 0,573 E R B B 2 chr1 11188010 11188249 0,521 M TO R chr17 37881453 37881652 0,595 E R B B 2 chr1 11188018 11188257 0 ,513 M TO R chr17 37881465 37881668 0,598 E R B B 2 chr1 11188029 11188274 0,492 M TO R chr17 37881510 37881737 0,601 E R B B 2 chr1 17345194 17345459 0 ,316 S D H B chr17 37881598 37881798 0,632 E R B B 2 chr1 17349096 17349342 0 ,543 S D H B chr17 41196311 41196511 0 ,393 BRCA1 chr1 17350413 17350563 0 ,497 S D H B chr17 41197220 41197464 0 ,429 BRCA1 chr1 17350566 17350779 0 ,430 S D H B chr17 41197314 41197566 0 ,419 BRCA1 chr1 17354089 17354304 0 ,463 S D H B chr17 41197571 41197819 0 ,550 BRCA1 chr1 17355058 17355208 0 ,417 S D H B chr17 41199637 41199729 0 ,559 BRCA1 chr1 17359477 17359689 0 ,427 S D H B chr17 41201055 41201304 0 ,476 BRCA1 chr1 17371214 17371394 0 ,470 S D H B chr17 41202997 41203243 0 ,449 BRCA1 chr1 17380408 17380619 0 ,670 S D H B chr17 41209041 41209195 0 ,445 BRCA1 chr1 43814917 43815186 0 ,633 M P L ch r17 41215338 41215577 0 ,433 BRCA1 chr1 45795001 45795250 0,536 M U TY H chr17 41215806 41216045 0 ,375 BRCA1 chr1 45796024 45796223 0,530 M U TY H chr17 41219623 41219726 0 ,337 BRCA1 chr1 45796871 45797092 0,536 M U TY H chr17 41222828 41223088 0,402 BRCA1 chr1 45797060 45797289 0,648 M U TY H chr17 41222835 41223088 0 ,406 BRCA1 chr1 45797289 45797529 0,635 M U TY H chr17 41222885 41223141 0 ,444 BRCA1 chr1 45797602 45797802 0,577 M U TY H chr17 41223090 41223269 0 ,494 BRCA1 chr1 45797819 45798019 0,622 M U TY H chr17 41256181 41256358 0 ,315 BRCA1 chr1 45797986 45798270 0,593 M U TY H chr17 41256830 41257034 0 ,376 BRCA1 chr1 45798204 45798404 0,602 M U TY H chr17 41256884 41257140 0 ,339 BRCA1 chr1 45798364 45798564 0,547 M U TY H chr17 41258410 41258681 0 ,324 BRCA1 chr1 45798532 45798732 0,557 M U TY H chr17 41267598 41267807 0,371 BRCA1 chr1 45798672 45798872 0,567 M U TY H chr17 41267602 41267807 0 ,369 BRCA1 chr1 45798867 45799097 0,628 M U TY H chr17 41267603 41267794 0 ,354 BRCA1 chr1 45799150 45799357 0,582 M U TY H chr17 41267603 41267834 0,371 BRCA1 chr1 45800062 45800304 0,539 M U TY H chr17 41267630 41267779 0 ,353 BRCA1 chr1 115252133 115252352 0 ,445 N RAS chr17 41267645 41267836 0,391 BRCA1 chr1 115252133 115252354 0,441 N RAS chr17 41275961 41276197 0,312 BRCA1 chr1 115252138 115252350 0 ,446 N RAS chr17 46805588 46805837 0,672 H O X B 13 chr1 115252142 115252350 0 ,450 N RAS chr17 47696239 47696485 0 ,453 S P O P chr1 115256347 115256588 0 ,409 N RAS chr17 47696300 47696545 0 ,455 S P O P chr1 115256398 115256647 0 ,448 N RAS chr17 47696324 47696565 0,442 S P O P chr1 115256410 115256649 0 ,458 N RAS chr17 47696359 47696607 0,422 S P O P Cr. In ic io Fin G C G en Cr. In ic io Fin G C G en c h r l 115256442 115256691 0 ,440 N RAS chr17 47696424 47696669 0 ,415 S P O P c h r l 115256467 115256726 0,442 N RAS chr17 47696450 47696669 0 ,405 S P O P c h r l 115256470 115256715 0,451 N RAS chr17 47696450 47696689 0 ,413 S P O P c h r l 115258538 115258778 0 ,440 N RAS chr17 47696486 47696715 0 ,387 S P O P chr1 115258570 115258813 0 ,463 N RAS chr17 56769976 56770175 0 ,590 R A D 51C chr1 115258607 115258846 0,492 N RAS chr17 56772289 56772542 0,421 R A D 51C chr1 115258659 115258901 0 ,444 N RAS chr17 56773994 56774243 0 ,404 R A D 51C chr1 156268500 156268651 0 ,454 V H LL ch r17 56780486 56780723 0 ,345 R A D 51C chr1 156269007 156269221 0 ,493 V H LL ch r17 56787247 56787446 0 ,365 R A D 51C chr1 156846129 156846362 0,641 NTRK1 ch r17 56787285 56787460 0,341 R A D 51C chr1 156846129 156846377 0 ,643 NTRK1 ch r17 56798102 56798172 0,352 R A D 51C chr1 156846130 156846362 0 ,639 NTRK1 ch r17 56801331 56801553 0 ,390 R A D 51C chr1 156848889 156849132 0,611 NTRK1 ch r17 56809830 56810049 0,382 R A D 51C chr1 156848911 156849153 0 ,617 NTRK1 ch r17 56811478 56811716 0 ,385 R A D 51C chr1 156848921 156849168 0 ,613 NTRK1 ch r17 59756779 59756979 0 ,313 BRIP1 chr1 156848925 156849168 0,611 NTRK1 ch r17 59759726 59759955 0,252 BRIP1 chr1 161284168 161284376 0 ,598 S D H C chr17 59760615 59760854 0 ,308 BRIP1 chr1 161293229 161293429 0 ,343 S D H C chr17 59760809 59761044 0 ,335 BRIP1 chr1 161298181 161298414 0 ,436 S D H C chr17 59761001 59761201 0 ,353 BRIP1 chr1 161333007 161333261 0 ,447 S D H C chr17 59761265 59761494 0 ,413 BRIP1 chr1 161333275 161333550 0,391 S D H C chr17 59761395 59761636 0 ,343 BRIP1 chr1 161333589 161333868 0 ,439 S D H C chr17 59763229 59763449 0 ,357 BRIP1 chr1 161333890 161334157 0,392 S D H C chr17 59763460 59763660 0 ,338 BRIP1 chr1 161334206 161334492 0 ,394 S D H C chr17 59770816 59771046 0 ,307 BRIP1 chr1 162748235 162748450 0 ,440 D D R 2 ch r17 59793106 59793349 0 ,316 BRIP1 chr1 162748273 162748512 0,442 D D R 2 ch r17 59793137 59793367 0 ,338 BRIP1 chr1 162748316 162748557 0 ,450 D D R 2 ch r17 59820379 59820551 0 ,393 BRIP1 chr1 162748370 162748580 0 ,483 D D R 2 ch r17 59821796 59821945 0 ,373 BRIP1 ch r10 8111358 8111588 0 ,506 G A T A 3 ch r17 59853687 59853887 0 ,353 BRIP1 ch r10 8111468 8111707 0 ,529 G A T A 3 ch r17 59857537 59857737 0 ,333 BRIP1 ch r10 8115737 8115986 0,572 G A T A 3 ch r17 59858201 59858428 0 ,355 BRIP1 ch r10 8115741 8115988 0 ,569 G A T A 3 ch r17 59861553 59861773 0 ,326 BRIP1 ch r10 8115783 8115988 0,612 G A T A 3 ch r17 59870956 59871190 0 ,345 BRIP1 ch r10 8115789 8115988 0 ,620 G A T A 3 ch r17 59876405 59876605 0 ,388 BRIP1 ch r10 43595933 43596179 0 ,623 R E T ch r17 59876622 59876822 0 ,284 BRIP1 ch r10 43597765 43598054 0 ,614 R E T ch r17 59878569 59878769 0 ,413 BRIP1 ch r10 43600476 43600682 0 ,686 R E T ch r17 59878611 59878844 0 ,397 BRIP1 ch r10 43601846 43602088 0 ,638 R E T ch r17 59885818 59886038 0 ,439 BRIP1 ch r10 43604444 43604706 0 ,620 R E T ch r17 59886058 59886268 0 ,346 BRIP1 ch r10 43606653 43606911 0 ,595 R E T ch r17 59924485 59924714 0 ,348 BRIP1 ch r10 43607465 43607728 0 ,659 R E T ch r17 59926478 59926707 0 ,348 BRIP1 ch r10 43608226 43608455 0 ,596 R E T ch r17 59934381 59934581 0 ,383 BRIP1 ch r10 43608980 43609217 0 ,626 R E T ch r17 59937155 59937392 0 ,374 BRIP1 ch r10 43609917 43610183 0 ,625 R E T ch r17 59938714 59938914 0 ,333 BRIP1 ch r10 43611943 43612187 0,522 R E T ch r17 59940627 59940827 0 ,577 BRIP1 ch r10 43613689 43613933 0 ,555 R E T ch r17 59940844 59941054 0,592 BRIP1 ch r10 43614921 43615150 0 ,687 R E T ch r18 48556368 48556604 0,692 S M A D 4 ch r10 43615517 43615759 0 ,568 R E T ch r18 48556368 48556608 0 ,689 S M A D 4 ch r10 43617287 43617531 0 ,457 R E T ch r18 48556413 48556612 0 ,680 S M A D 4 ch r10 43619092 43619322 0 ,584 R E T ch r18 48556414 48556616 0 ,675 S M A D 4 ch r10 43620303 43620509 0,551 R E T ch r18 48573249 48573492 0 ,328 S M A D 4 ch r10 43623746 43624029 0 ,493 R E T ch r18 48573500 48573738 0 ,364 S M A D 4 Cr. In ic io Fin G C G en Cr. In ic io Fin G C G en ch r10 43624152 43624439 0 ,490 R E T ch r18 48575147 48575346 0 ,340 S M A D 4 ch r10 43624946 43625222 0 ,433 R E T ch r18 48575524 48575724 0 ,294 S M A D 4 ch r10 50686414 50686655 0 ,368 E R C C 6 ch r18 48581203 48581433 0 ,455 S M A D 4 ch r10 88635669 88635923 0 ,333 B M P R 1A ch r18 48581249 48581498 0 ,428 S M A D 4 ch r10 88649829 88650073 0 ,384 B M P R 1A ch r18 48584399 48584599 0 ,443 S M A D 4 ch r10 88659444 88659644 0 ,368 B M P R 1A ch r18 48584673 48584893 0 ,439 S M A D 4 ch r10 88677042 88677242 0 ,388 B M P R 1A ch r18 48586106 48586306 0 ,308 S M A D 4 ch r10 89622844 89623045 0 ,594 KLLN ch r18 48591791 48592035 0 ,408 S M A D 4 ch r10 89624131 89624370 0,492 PTE N chr18 48593378 48593608 0 ,407 S M A D 4 ch r10 89624178 89624422 0 ,465 PTE N chr18 48602902 48603166 0 ,430 S M A D 4 ch r10 89624198 89624444 0 ,445 PTE N chr18 48602922 48603132 0 ,445 S M A D 4 ch r10 89624214 89624463 0 ,436 PTE N chr18 48603000 48603249 0 ,424 S M A D 4 ch r10 89685273 89685522 0 ,304 PTE N chr18 48603132 48603332 0 ,289 S M A D 4 ch r10 89692746 89692946 0 ,398 PTE N chr18 48604566 48604815 0 ,488 S M A D 4 ch r10 89692746 89692977 0,392 PTE N chr18 48604617 48604861 0 ,490 S M A D 4 ch r10 89692746 89692999 0,402 PTE N chr18 48604640 48604881 0,492 S M A D 4 ch r10 89692763 89693015 0 ,403 PTE N chr18 48604711 48604957 0,421 S M A D 4 ch r10 89692787 89692999 0 ,413 PTE N chr18 48605303 48605503 0 ,294 S M A D 4 ch r10 89711788 89712024 0 ,380 PTE N chr18 48605551 48605798 0,351 S M A D 4 ch r10 89711798 89712045 0 ,367 PTE N chr18 48605981 48606181 0 ,318 S M A D 4 ch r10 89711867 89712069 0 ,399 PTE N chr18 48606203 48606477 0 ,349 S M A D 4 ch r10 89711880 89712129 0 ,348 PTE N chr18 48606469 48606712 0 ,357 S M A D 4 ch r10 89717531 89717770 0 ,404 PTE N chr18 48607311 48607586 0 ,326 S M A D 4 ch r10 89717558 89717802 0 ,408 PTE N chr18 48607638 48607926 0,412 S M A D 4 ch r10 89717558 89717831 0 ,394 PTE N chr18 48608009 48608208 0 ,375 S M A D 4 ch r10 89717571 89717820 0 ,400 PTE N chr18 48608225 48608485 0 ,368 S M A D 4 ch r10 89717602 89717831 0 ,413 PTE N chr18 48608754 48608904 0 ,450 S M A D 4 ch r10 89717603 89717769 0 ,455 PTE N chr18 48609535 48609685 0 ,470 S M A D 4 ch r10 89717627 89717872 0,362 PTE N chr18 48609670 48609869 0 ,355 S M A D 4 ch r10 89720757 89720967 0 ,336 PTE N chr18 48610653 48610803 0 ,358 S M A D 4 ch r10 89720757 89721005 0 ,329 PTE N chr18 48610833 48611078 0 ,488 S M A D 4 ch r10 89720767 89720968 0 ,337 PTE N chr18 48611097 48611339 0 ,490 S M A D 4 ch r10 89720775 89721018 0 ,324 PTE N chr18 48611405 48611605 0 ,353 S M A D 4 ch r10 89726371 89726571 0 ,289 PTE N chr19 1206543 1206797 0 ,643 STK11 ch r10 89726794 89727038 0 ,310 PTE N chr19 1206613 1206843 0 ,558 STK11 ch r10 89727021 89727240 0,282 PTE N chr19 1206770 1207017 0 ,560 STK11 ch r10 89727261 89727519 0 ,317 PTE N chr19 1206962 1207206 0 ,596 STK11 ch r10 89727756 89727916 0 ,404 PTE N chr19 1218302 1218502 0,532 STK11 ch r10 89727978 89728203 0 ,389 PTE N chr19 1219161 1219399 0 ,653 STK11 ch r10 89728310 89728512 0 ,389 PTE N chr19 1220251 1220492 0,632 STK11 ch r10 89729027 89729257 0,251 PTE N chr19 1220276 1220492 0 ,636 STK11 ch r10 89729816 89729967 0 ,336 PTE N chr19 1220475 1220701 0 ,705 STK11 ch r10 89730284 89730433 0 ,307 PTE N chr19 1220502 1220701 0 ,715 STK11 ch r10 89731453 89731610 0 ,329 PTE N chr19 1220681 1220938 0 ,647 STK11 chr11 22644366 22644570 0 ,273 F A N C F ch r19 1220681 1220941 0 ,648 STK11 chr11 22644511 22644731 0 ,344 F A N C F ch r19 1221151 1221351 0,582 STK11 chr11 22644738 22644938 0 ,318 F A N C F ch r19 1221821 1222071 0 ,685 STK11 chr11 22645645 22645808 0 ,348 F A N C F ch r19 1222984 1223224 0 ,643 STK11 chr11 22645808 22646060 0,352 F A N C F ch r19 1226453 1226708 0 ,715 STK11 chr11 22646058 22646268 0,322 F A N C F ch r19 1226464 1226754 0 ,704 STK11 chr11 22646388 22646588 0,532 F A N C F ch r19 1226465 1226707 0 ,716 STK11 chr11 22646657 22646927 0 ,598 F A N C F ch r19 1228261 1228461 0 ,547 STK11 Cr. In ic io Fin G C G en Cr. In ic io Fin G C G en chr11 22646959 22647229 0 ,657 F A N C F ch r19 3114798 3115046 0 ,683 G N A11 chr11 22647378 22647578 0 ,478 F A N C F ch r19 3114798 3115049 0 ,683 G N A11 chr11 47236728 47236949 0,635 D D B 2 ch r19 3114839 3115040 0 ,688 GNA11 chr11 47237804 47238058 0,537 D D B 2 ch r19 3114841 3115040 0 ,685 GNA11 chr11 47238291 47238491 0,483 D D B 2 ch r19 3118772 3118996 0,622 GNA11 chr11 47254333 47254547 0,470 D D B 2 ch r19 3118795 3119044 0 ,620 GNA11 chr11 47256241 47256494 0,547 D D B 2 ch r19 3118818 3119047 0 ,613 GNA11 chr11 47256782 47257010 0,594 D D B 2 ch r19 3118863 3119109 0 ,636 GNA11 chr11 47259397 47259552 0 ,468 D D B 2 ch r19 10600276 10600491 0 ,588 KEAP1 chr11 47259555 47259796 0,492 D D B 2 ch r19 10600284 10600528 0,592 KEAP1 chr11 47260567 47260808 0 ,483 D D B 2 ch r19 10600284 10600532 0 ,594 KEAP1 chr11 61197603 61197830 0 ,588 S D H A F 2 ch r19 10602242 10602441 0 ,645 KEAP1 chr11 61205114 61205296 0,481 S D H A F 2 ch r19 10602423 10602671 0,691 KEAP1 chr11 61205433 61205588 0 ,404 S D H A F 2 ch r19 10602539 10602747 0,632 KEAP1 chr11 61213390 61213639 0 ,488 S D H A F 2 ch r19 10602539 10602753 0 ,628 KEAP1 chr11 61213676 61213931 0 ,508 S D H A F 2 ch r19 10602653 10602854 0 ,609 KEAP1 chr11 61213967 61214232 0,462 S D H A F 2 ch r19 10610056 10610289 0 ,585 KEAP1 chr11 64570946 64571196 0 ,478 M EN1 ch r19 10610069 10610306 0 ,576 KEAP1 chr11 64571178 64571436 0 ,544 M EN1 ch r19 10610081 10610306 0 ,580 KEAP1 chr11 64571465 64571704 0 ,546 M EN1 ch r19 10610083 10610306 0 ,580 KEAP1 chr11 64571732 64571978 0 ,567 M EN1 ch r19 11094768 11095038 0 ,697 S M A R C A 4 chr11 64572483 64572713 0 ,619 M EN1 ch r19 11095950 11096150 0,592 S M A R C A 4 chr11 64573013 64573278 0,602 M EN1 ch r19 11096820 11097078 0 ,625 S M A R C A 4 chr11 64573641 64573871 0 ,593 M EN1 ch r19 11097475 11097685 0 ,645 S M A R C A 4 chr11 64574483 64574728 0,602 M EN1 ch r19 11098265 11098553 0 ,706 S M A R C A 4 chr11 64575094 64575345 0 ,544 M EN1 ch r19 11098298 11098538 0 ,726 S M A R C A 4 chr11 64575352 64575623 0 ,614 M EN1 ch r19 11098376 11098606 0,732 S M A R C A 4 chr11 64577138 64577410 0 ,634 M EN1 ch r19 11099901 11100111 0 ,607 S M A R C A 4 chr11 64577437 64577683 0 ,700 M EN1 ch r19 11101757 11101957 0,612 S M A R C A 4 chr11 64577902 64578171 0,681 M EN1 ch r19 11105466 11105666 0,522 S M A R C A 4 chr11 94150558 94150800 0,362 M R E 11 A ch r19 11106694 11106939 0 ,557 S M A R C A 4 chr11 94151042 94151242 0 ,373 M R E 11 A ch r19 11107143 11107352 0 ,476 S M A R C A 4 chr11 94151616 94151816 0 ,537 M R E 11 A ch r19 11113645 11113845 0,592 S M A R C A 4 chr11 94151903 94152103 0 ,343 M R E 11 A ch r19 11113855 11114055 0 ,493 S M A R C A 4 chr11 94152190 94152390 0 ,333 M R E 11 A ch r19 11118483 11118683 0 ,587 S M A R C A 4 chr11 94153182 94153395 0 ,308 M R E 11 A ch r19 11120977 11121177 0 ,557 S M A R C A 4 chr11 94168979 94169178 0 ,335 M R E 11 A ch r19 11123551 11123751 0,592 S M A R C A 4 chr11 94170337 94170576 0 ,300 M R E 11 A ch r19 11129571 11129781 0 ,555 S M A R C A 4 chr11 94178876 94179116 0 ,386 M R E 11 A ch r19 11130134 11130372 0 ,619 S M A R C A 4 chr11 94180384 94180615 0 ,500 M R E 11 A ch r19 11130167 11130367 0,612 S M A R C A 4 chr11 94189360 94189588 0 ,323 M R E 11 A ch r19 11130245 11130468 0 ,585 S M A R C A 4 chr11 94192639 94192838 0 ,370 M R E 11 A ch r19 11130248 11130473 0 ,584 S M A R C A 4 chr11 94193992 94194257 0,301 M R E 11 A ch r19 11132367 11132587 0,611 S M A R C A 4 chr11 94197223 94197451 0 ,349 M R E 11 A ch r19 11132607 11132807 0,622 S M A R C A 4 chr11 94200864 94201064 0 ,363 M R E 11 A ch r19 11134126 11134326 0 ,557 S M A R C A 4 chr11 94203635 94203874 0 ,404 M R E 11 A ch r19 11134905 11135105 0 ,617 S M A R C A 4 chr11 94204708 94204908 0 ,368 M R E 11 A ch r19 11135986 11136186 0,602 S M A R C A 4 chr11 94209357 94209557 0 ,348 M R E 11 A ch r19 11136874 11137104 0 ,610 S M A R C A 4 chr11 94211862 94212106 0 ,359 M R E 11 A ch r19 11138402 11138674 0,502 S M A R C A 4 chr11 94212728 94212928 0 ,378 M R E 11 A ch r19 11138598 11138818 0 ,597 S M A R C A 4 chr11 94219015 94219215 0 ,348 M R E 11 A ch r19 11141332 11141532 0 ,637 S M A R C A 4 chr11 94219225 94219425 0 ,264 M R E 11 A ch r19 11141549 11141749 0 ,627 S M A R C A 4 Cr. In ic io Fin G C G en Cr. In ic io Fin G C G en chr11 94223880 94224120 0 ,344 M R E 11 A ch r19 11143924 11144134 0,621 S M A R C A 4 chr11 94223898 94224142 0 ,327 M R E 11 A ch r19 11144041 11144262 0 ,617 S M A R C A 4 chr11 94225885 94226125 0 ,394 M R E 11 A ch r19 11144868 11145108 0 ,618 S M A R C A 4 chr11 108093593 108093813 0 ,615 A TM chr19 11145552 11145823 0 ,654 S M A R C A 4 chr11 108093873 108094073 0 ,617 A TM chr19 11151919 11152129 0 ,616 S M A R C A 4 chr11 108098331 108098581 0 ,335 A TM chr19 11151919 11152189 0 ,627 S M A R C A 4 chr11 108098372 108098572 0 ,333 A TM chr19 11152171 11152371 0,572 S M A R C A 4 chr11 108098382 108098631 0 ,316 A TM chr19 11168890 11169140 0 ,625 S M A R C A 4 chr11 108098397 108098626 0 ,309 A TM chr19 11169359 11169619 0 ,644 S M A R C A 4 chr11 108098399 108098628 0 ,304 A TM chr19 11170610 11170850 0 ,668 S M A R C A 4 chr11 108099818 108100062 0 ,327 A TM chr19 11172452 11172706 0 ,498 S M A R C A 4 chr11 108106395 108106596 0 ,356 A TM chr19 11172557 11172757 0 ,423 S M A R C A 4 chr11 108114723 108115004 0 ,333 A TM chr19 11172753 11172953 0 ,493 S M A R C A 4 chr11 108114777 108115004 0 ,329 A TM chr19 45854611 45854870 0,581 E R C C 2 chr11 108115492 108115736 0,351 A TM chr19 45854917 45855123 0 ,589 E R C C 2 chr11 108117690 108117930 0 ,324 A TM chr19 45855406 45855649 0 ,656 E R C C 2 chr11 108119692 108119907 0 ,343 A TM chr19 45855711 45855931 0,611 E R C C 2 chr11 108119737 108119952 0,361 A TM chr19 45855908 45856123 0,611 E R C C 2 chr11 108121367 108121602 0 ,377 A TM chr19 45855910 45856123 0,612 E R C C 2 chr11 108121609 108121764 0 ,359 A TM chr19 45855914 45856123 0 ,610 E R C C 2 chr11 108122506 108122706 0 ,363 A TM chr19 45855948 45856167 0 ,609 E R C C 2 chr11 108122716 108122936 0 ,317 A TM chr19 45855959 45856169 0 ,607 E R C C 2 chr11 108123498 108123718 0,321 A TM chr19 45856222 45856442 0,652 E R C C 2 chr11 108124529 108124729 0 ,393 A TM chr19 45857893 45858113 0 ,597 E R C C 2 chr11 108126954 108127154 0 ,363 A TM chr19 45860528 45860730 0 ,635 E R C C 2 chr11 108128041 108128241 0 ,294 A TM chr19 45860797 45861007 0 ,635 E R C C 2 chr11 108129523 108129756 0 ,316 A TM chr19 45864772 45864905 0 ,575 E R C C 2 chr11 108137908 108138102 0 ,374 A TM chr19 45866937 45867137 0 ,706 E R C C 2 chr11 108139112 108139322 0 ,374 A TM chr19 45867119 45867343 0 ,724 E R C C 2 chr11 108139329 108139529 0 ,338 A TM chr19 45867124 45867373 0 ,716 E R C C 2 chr11 108141794 108142040 0 ,324 A TM chr19 45867329 45867584 0 ,684 E R C C 2 chr11 108142019 108142263 0 ,359 A TM chr19 45867491 45867711 0 ,656 E R C C 2 chr11 108143141 108143341 0 ,323 A TM chr19 45867506 45867746 0 ,660 E R C C 2 chr11 108143328 108143577 0 ,336 A TM chr19 45867566 45867806 0 ,618 E R C C 2 chr11 108150264 108150498 0 ,328 A TM chr19 45868096 45868344 0 ,635 E R C C 2 chr11 108151721 108151951 0 ,364 A TM chr19 45868149 45868349 0 ,637 E R C C 2 chr11 108153427 108153675 0 ,285 A TM chr19 45868154 45868396 0 ,626 E R C C 2 chr11 108153471 108153632 0 ,284 A TM chr19 45868287 45868486 0 ,600 E R C C 2 chr11 108153471 108153677 0 ,275 A TM chr19 45871786 45871991 0 ,524 E R C C 2 chr11 108153505 108153680 0 ,267 A TM chr19 45872064 45872264 0,582 E R C C 2 chr11 108153510 108153680 0 ,269 A TM chr19 45872211 45872411 0,562 E R C C 2 chr11 108154843 108155094 0,282 A TM chr19 45873397 45873585 0,661 E R C C 2 chr11 108154858 108155070 0,291 A TM chr19 45873421 45873651 0 ,675 E R C C 2 chr11 108154954 108155155 0 ,396 A TM chr19 45873436 45873665 0 ,687 E R C C 2 chr11 108154962 108155211 0 ,388 A TM chr19 45873632 45873861 0 ,700 E R C C 2 chr11 108157899 108158161 0 ,354 A TM chr19 45873636 45873901 0 ,684 E R C C 2 chr11 108158376 108158580 0 ,337 A TM chr19 45873726 45873936 0 ,645 E R C C 2 chr11 108159642 108159842 0 ,343 A TM chr19 45916987 45917191 0,571 ERCC1 chr11 108160273 108160473 0 ,299 A TM chr19 45918047 45918240 0 ,619 ERCC1 chr11 108163344 108163589 0 ,378 A TM chr19 45918047 45918243 0 ,619 ERCC1 chr11 108164044 108164225 0 ,324 A TM chr19 45918048 45918243 0,622 ERCC1 chr11 108164078 108164281 0 ,314 A TM chr19 45918053 45918243 0 ,628 ERCC1 Cr. In ic io Fin G C G en Cr. In ic io Fin G C G en chr11 108165595 108165795 0 ,358 A TM chr19 45918060 45918235 0 ,625 ERCC1 chr11 108167798 108168039 0 ,269 A TM chr19 45922222 45922436 0 ,567 ERCC1 chr11 108167811 108168065 0 ,267 A TM chr19 45923506 45923678 0 ,607 ERCC1 chr11 108170423 108170622 0 ,380 A TM chr19 45924445 45924632 0 ,638 ERCC1 chr11 108172321 108172561 0 ,340 A TM chr19 45926611 45926815 0 ,615 ERCC1 chr11 108173513 108173723 0,351 A TM chr19 50902097 50902336 0 ,650 PO LD 1 chr11 108173723 108173923 0 ,313 A TM chr19 50902458 50902658 0,582 PO LD 1 chr11 108175366 108175566 0 ,398 A TM chr19 50904960 50905171 0 ,656 PO LD 1 chr11 108178629 108178814 0 ,360 A TM chr19 50905153 50905392 0,671 PO LD 1 chr11 108179595 108179834 0 ,375 A TM chr19 50905436 50905665 0 ,683 PO LD 1 chr11 108180801 108181050 0 ,320 A TM chr19 50905615 50905913 0 ,659 PO LD 1 chr11 108180821 108181050 0,322 A TM chr19 50905899 50906137 0 ,665 PO LD 1 chr11 108180821 108181066 0 ,313 A TM chr19 50906253 50906464 0 ,679 POLD1 chr11 108180871 108181071 0 ,333 A TM chr19 50906723 50906971 0,622 POLD1 chr11 108183026 108183226 0 ,333 A TM chr19 50906755 50906971 0 ,613 POLD1 chr11 108186520 108186768 0 ,357 A TM chr19 50909485 50909773 0 ,640 POLD1 chr11 108186672 108186911 0 ,404 A TM chr19 50910320 50910533 0,631 POLD1 chr11 108188080 108188262 0 ,399 A TM chr19 50910334 50910578 0 ,629 POLD1 chr11 108190668 108190878 0 ,313 A TM chr19 50910376 50910627 0,631 POLD1 chr11 108191937 108192186 0,392 A TM chr19 50912042 50912281 0 ,617 POLD1 chr11 108195999 108196199 0 ,413 A TM chr19 50912288 50912520 0 ,635 POLD1 chr11 108196116 108196316 0 ,388 A TM chr19 50912795 50913010 0 ,667 POLD1 chr11 108196772 108196944 0,422 A TM chr19 50916709 50916950 0 ,640 POLD1 chr11 108198304 108198504 0 ,398 A TM chr19 50916970 50917221 0 ,623 POLD1 chr11 108199732 108199932 0 ,373 A TM chr19 50917955 50918169 0 ,628 POLD1 chr11 108200863 108201105 0 ,374 A TM chr19 50917960 50918169 0 ,624 POLD1 chr11 108201993 108202237 0 ,318 A TM chr19 50918653 50918824 0 ,640 POLD1 chr11 108202461 108202678 0 ,330 A TM chr19 50919033 50919269 0,692 POLD1 chr11 108202483 108202676 0 ,309 A TM chr19 50919496 50919745 0 ,684 POLD1 chr11 108202496 108202676 0 ,298 A TM chr19 50919683 50919957 0,691 POLD1 chr11 108202530 108202730 0 ,308 A TM chr19 50919685 50919957 0 ,689 POLD1 chr11 108203403 108203613 0 ,336 A TM chr19 50919770 50920048 0 ,699 POLD1 chr11 108203427 108203679 0 ,344 A TM chr19 50919821 50920050 0,691 POLD1 chr11 108203480 108203724 0 ,339 A TM chr19 50921104 50921313 0 ,576 POLD1 chr11 108203524 108203768 0 ,339 A TM chr2 29443543 29443787 0 ,539 A L K chr11 108203540 108203784 0 ,347 A TM chr2 29443549 29443783 0 ,545 A L K chr11 108204436 108204676 0 ,407 A TM chr2 29443555 29443789 0 ,540 A L K chr11 108205641 108205841 0 ,368 A TM chr2 29443585 29443816 0 ,500 A L K chr11 108206452 108206651 0 ,400 A TM chr2 29445100 29445340 0,552 A L K chr11 108213868 108214068 0 ,393 A TM chr2 29445107 29445340 0 ,556 A L K chr11 108216481 108216700 0 ,355 A TM chr2 29445121 29445350 0 ,570 A L K chr11 108217894 108218094 0 ,328 A TM chr2 29445121 29445367 0,571 A L K chr11 108224395 108224595 0 ,403 A TM chr2 47600500 47600700 0 ,323 E P C A M chr11 108225445 108225655 0 ,346 A TM chr2 47600912 47601112 0 ,473 E P C A M chr11 108235722 108235932 0 ,365 A TM chr2 47601122 47601322 0 ,383 E P C A M chr11 108235932 108236132 0 ,383 A TM chr2 47602199 47602445 0 ,328 E P C A M chr11 108235986 108236232 0 ,433 A TM chr2 47604131 47604282 0,342 E P C A M chr11 108236004 108236249 0,431 A TM chr2 47605987 47606187 0 ,249 E P C A M chr11 108236050 108236290 0 ,415 A TM chr2 47606812 47606991 0,361 E P C A M chr11 108236051 108236251 0 ,438 A TM chr2 47612268 47612488 0 ,398 E P C A M chr11 108236071 108236273 0 ,438 A TM chr2 47613710 47613910 0 ,343 E P C A M chr11 108238313 108238513 0,373 A TM chr2 47630105 47630305 0,652 M S H 2 Cr. In ic io Fin G C G en Cr. In ic io Fin G C G en chr11 111957513 111957759 0,591 S D H D chr2 47630152 47630400 0 ,643 M S H 2 chr11 111959529 111959746 0 ,486 S D H D chr2 47630268 47630467 0 ,615 M S H 2 chr11 111965449 111965740 0 ,414 S D H D chr2 47630315 47630515 0 ,667 M S H 2 chr11 111965464 111965754 0 ,416 S D H D chr2 47630316 47630530 0 ,647 M S H 2 chr12 25378488 25378688 0 ,353 KR AS chr2 47630384 47630615 0 ,690 M S H 2 chr12 25378503 25378751 0,341 KR AS chr2 47630425 47630625 0 ,706 M S H 2 chr12 25378546 25378778 0,352 KR AS chr2 47635539 47635709 0 ,339 M S H 2 chr12 25378554 25378783 0 ,348 KR AS chr2 47637342 47637582 0 ,456 M S H 2 chr12 25380153 25380359 0,411 KR AS chr2 47637389 47637594 0,442 M S H 2 chr12 25380166 25380337 0 ,407 KR AS chr2 47639447 47639662 0 ,310 M S H 2 chr12 25380167 25380326 0 ,406 K R A S chr2 47641283 47641487 0,327 M S H 2 chr12 25380167 25380359 0 ,420 K R A S chr2 47643346 47643546 0,398 M S H 2 chr12 25398080 25398329 0 ,360 K R A S chr2 47656945 47657096 0,388 M S H 2 chr12 25398145 25398394 0 ,348 K R A S chr2 47672586 47672786 0,299 M S H 2 chr12 25398153 25398397 0,351 K R A S chr2 47690076 47690276 0,303 M S H 2 chr12 25398159 25398408 0 ,356 K R A S chr2 47693747 47693947 0,348 M S H 2 chr12 25398186 25398433 0 ,347 K R A S chr2 47698159 47698397 0,326 M S H 2 chr12 56478765 56478994 0,552 E R B B 3 chr2 47702121 47702341 0,394 M SH 2 chr12 56478781 56479029 0 ,558 E R B B 3 chr2 47702174 47702413 0,388 M SH 2 chr12 56478784 56479029 0,561 E R B B 3 chr2 47703453 47703653 0,428 M SH 2 chr12 56478807 56479047 0 ,560 E R B B 3 chr2 47703663 47703863 0,363 M SH 2 chr12 56481533 56481774 0,541 E R B B 3 chr2 47705399 47705630 0,397 M SH 2 chr12 56481559 56481798 0,521 E R B B 3 chr2 47707788 47708018 0,424 M SH 2 chr12 56481594 56481833 0 ,546 E R B B 3 chr2 47709903 47710113 0,327 M SH 2 chr12 56481628 56481942 0 ,530 E R B B 3 chr2 47710107 47710336 0,287 M SH 2 chr12 56481740 56481979 0 ,517 E R B B 3 chr2 48010393 48010592 0,725 M S H 6 chr12 56481773 56482020 0 ,476 E R B B 3 chr2 48010420 48010619 0,740 M S H 6 chr12 56481807 56482048 0 ,467 E R B B 3 chr2 48010573 48010824 0,690 M S H 6 chr12 56482218 56482457 0 ,513 E R B B 3 chr2 48010575 48010781 0,725 M S H 6 chr12 56482252 56482491 0 ,496 E R B B 3 chr2 48017953 48018200 0,419 M S H 6 chr12 56482278 56482521 0 ,504 E R B B 3 chr2 48018205 48018415 0,431 M S H 6 chr12 56482331 56482580 0 ,528 E R B B 3 chr2 48023040 48023272 0,455 M S H 6 chr12 56486559 56486791 0,502 E R B B 3 chr2 48023105 48023304 0,430 M S H 6 chr12 56486561 56486791 0,502 E R B B 3 chr2 48025749 48025949 0,428 M S H 6 chr12 56486566 56486813 0 ,508 E R B B 3 chr2 48025933 48026201 0,476 M S H 6 chr12 56486569 56486818 0 ,508 E R B B 3 chr2 48026177 48026376 0,460 M S H 6 chr12 56490766 56491006 0 ,523 E R B B 3 chr2 48026340 48026558 0,457 M S H 6 chr12 56490766 56491013 0 ,520 E R B B 3 chr2 48026511 48026711 0,458 M S H 6 chr12 56490773 56491013 0 ,519 E R B B 3 chr2 48026765 48026965 0,383 M S H 6 chr12 56490777 56491011 0 ,523 E R B B 3 chr2 48027019 48027219 0,438 M S H 6 chr12 56491580 56491801 0 ,554 E R B B 3 chr2 48027273 48027473 0,438 M S H 6 chr12 56491592 56491801 0 ,557 E R B B 3 chr2 48027527 48027727 0,398 M S H 6 chr12 56491596 56491799 0 ,559 E R B B 3 chr2 48027746 48028017 0,426 M S H 6 chr12 56491596 56491801 0 ,558 E R B B 3 chr2 48028124 48028364 0,415 M S H 6 chr12 58141882 58142151 0 ,396 C D K 4 chr2 48030536 48030736 0,433 M S H 6 chr12 58142160 58142391 0 ,474 C D K 4 chr2 48030729 48031008 0,371 M S H 6 chr12 58142983 58143287 0 ,570 C D K 4 chr2 48031952 48032152 0,443 M S H 6 chr12 58142985 58143287 0 ,568 C D K 4 chr2 48032026 48032237 0,420 M S H 6 chr12 58144413 58144686 0 ,478 C D K 4 chr2 48032772 48032971 0,315 M S H 6 chr12 58144452 58144687 0 ,479 C D K 4 chr2 48033358 48033554 0,365 M S H 6 chr12 58144692 58144932 0 ,490 C D K 4 chr2 48033416 48033655 0,367 M S H 6 chr12 58144696 58144939 0,492 C D K 4 chr2 48033581 48033782 0,401 M S H 6 Cr. In ic io Fin G C G en Cr. In ic io Fin G C G en chr12 58144957 58145214 0 ,523 C D K 4 chr2 48034024 48034264 0,307 M S H 6 chr12 58145023 58145294 0 ,515 C D K 4 chr2 58386432 58386632 0 ,333 FA N C L chr12 58145309 58145580 0 ,544 C D K 4 chr2 58386777 58386929 0 ,307 FA N C L chr12 58145326 58145580 0,541 C D K 4 chr2 58387189 58387389 0 ,338 FA N C L chr12 58145924 58146140 0 ,673 C D K 4 chr2 58388496 58388732 0 ,346 FA N C L chr12 133200375 133200607 0,541 P O LE chr2 58389905 58390169 0 ,328 FA N C L chr12 133200794 133201005 0 ,604 P O LE chr2 58390005 58390214 0 ,352 FA N C L chr12 133200978 133201217 0 ,608 P O LE chr2 58390571 58390773 0 ,379 FA N C L chr12 133201185 133201425 0 ,610 PO LE chr2 58392779 58392979 0 ,398 F A N C L chr12 133201428 133201670 0 ,654 PO LE chr2 58431158 58431358 0 ,363 F A N C L chr12 133202187 133202429 0,621 PO LE chr2 58448972 58449172 0 ,323 F A N C L chr12 133202217 133202436 0 ,605 PO LE chr2 58453736 58453936 0 ,308 F A N C L chr12 133202217 133202437 0 ,606 PO LE chr2 58456824 58457044 0 ,285 F A N C L chr12 133202218 133202437 0 ,605 PO LE chr2 58459138 58459342 0,351 F A N C L chr12 133202355 133202555 0,622 PO LE chr2 58468279 58468479 0,592 F A N C L chr12 133202648 133202868 0 ,606 PO LE chr2 128014784 128015047 0 ,394 E R C C 3 chr12 133208842 133209042 0 ,517 PO LE chr2 128015087 128015289 0,522 E R C C 3 chr12 133209059 133209259 0 ,577 PO LE chr2 128016793 128017023 0,541 E R C C 3 chr12 133209191 133209391 0 ,647 PO LE chr2 128018729 128018934 0 ,476 E R C C 3 chr12 133210529 133210806 0 ,590 PO LE chr2 128028846 128029046 0 ,493 E R C C 3 chr12 133212413 133212654 0 ,488 PO LE chr2 128030334 128030534 0 ,488 E R C C 3 chr12 133214538 133214738 0 ,557 PO LE chr2 128036695 128036895 0 ,413 E R C C 3 chr12 133215637 133215885 0,582 PO LE chr2 128037952 128038168 0 ,535 E R C C 3 chr12 133218204 133218451 0 ,597 PO LE chr2 128044271 128044501 0 ,580 E R C C 3 chr12 133218707 133218953 0 ,579 PO LE chr2 128044494 128044693 0 ,500 E R C C 3 chr12 133219069 133219298 0 ,574 PO LE chr2 128046183 128046383 0,502 E R C C 3 chr12 133219399 133219599 0 ,617 PO LE chr2 128046840 128047040 0 ,468 E R C C 3 chr12 133219778 133220012 0,591 PO LE chr2 128047177 128047377 0,522 E R C C 3 chr12 133219996 133220226 0 ,606 PO LE chr2 128047669 128047869 0 ,448 E R C C 3 chr12 133220308 133220545 0,571 PO LE chr2 128050206 128050419 0 ,514 E R C C 3 chr12 133225529 133225773 0,612 PO LE chr2 128051102 128051343 0 ,566 E R C C 3 chr12 133225887 133226117 0 ,645 PO LE chr2 128051633 128051852 0 ,655 E R C C 3 chr12 133226161 133226408 0 ,613 PO LE chr2 128051746 128051946 0 ,577 E R C C 3 chr12 133233672 133233909 0 ,550 PO LE chr2 209112977 209113230 0 ,394 IDH1 chr12 133233774 133234003 0 ,557 PO LE chr2 209113091 209113340 0 ,444 IDH1 chr12 133234350 133234550 0 ,458 PO LE chr2 212288833 212289075 0 ,366 E R B B 4 chr12 133235953 133236173 0 ,534 PO LE chr2 212288836 212289075 0 ,367 E R B B 4 chr12 133237539 133237827 0 ,543 PO LE chr2 212288849 212289089 0 ,378 E R B B 4 chr12 133237547 133237781 0 ,519 PO LE chr2 212288867 212289111 0 ,376 E R B B 4 chr12 133238036 133238236 0 ,468 PO LE chr2 212483732 212483976 0 ,327 E R B B 4 chr12 133240495 133240681 0 ,545 PO LE chr2 212483745 212483975 0 ,338 E R B B 4 chr12 133241011 133241211 0 ,587 PO LE chr2 212483745 212483989 0 ,343 E R B B 4 chr12 133241805 133242034 0 ,600 PO LE chr2 212483745 212483992 0 ,347 E R B B 4 chr12 133244016 133244246 0 ,563 PO LE chr2 212529983 212530215 0 ,468 E R B B 4 chr12 133244860 133245070 0 ,578 PO LE chr2 212529983 212530219 0 ,468 E R B B 4 chr12 133245148 133245397 0 ,616 PO LE chr2 212530006 212530255 0 ,444 E R B B 4 chr12 133245378 133245623 0 ,537 PO LE chr2 212530049 212530293 0 ,420 E R B B 4 chr12 133248734 133248981 0 ,556 PO LE chr2 212587102 212587341 0 ,379 E R B B 4 chr12 133249169 133249404 0 ,568 PO LE chr2 212587102 212587342 0 ,378 E R B B 4 chr12 133249662 133249902 0 ,539 PO LE chr2 212587104 212587343 0 ,379 E R B B 4 chr12 133250240 133250445 0 ,549 PO LE chr2 215591713 215591913 0 ,348 BARD1 chr12 133250282 133250482 0 ,517 PO LE chr2 215592049 215592249 0 ,313 BARD1 Cr. In ic io Fin G C G en Cr. In ic io Fin G C G en chr12 133251897 133252126 0 ,600 PO LE chr2 215592385 215592585 0 ,318 BARD1 chr12 133252231 133252480 0,512 PO LE chr2 215592721 215592921 0 ,284 BARD1 chr12 133252591 133252826 0 ,470 PO LE chr2 215593393 215593593 0 ,458 BARD1 chr12 133253058 133253290 0,502 PO LE chr2 215593464 215593712 0,482 BARD1 chr12 133253869 133254099 0 ,429 PO LE chr2 215595070 215595319 0 ,348 BARD1 chr12 133254080 133254312 0,502 PO LE chr2 215609774 215610018 0,331 BARD1 chr12 133256057 133256299 0 ,494 P O LE chr2 215610357 215610557 0 ,368 BARD1 chr12 133256546 133256806 0,441 P O LE chr2 215617201 215617402 0 ,322 BARD1 chr12 133256751 133257006 0 ,469 P O LE chr2 215617244 215617478 0 ,315 BARD1 chr12 133257134 133257364 0 ,429 P O LE chr2 215632137 215632347 0 ,398 BARD1 chr12 133257609 133257851 0 ,523 P O LE chr2 215632347 215632547 0 ,299 BARD1 ch r13 28592527 28592791 0 ,434 FLT3 chr2 215633841 215634041 0,348 BARD1 ch r13 32889625 32889857 0,631 B R C A 2 chr2 215645283 215645483 0,418 BARD1 ch r13 32889901 32890111 0 ,583 B R C A 2 chr2 215645568 215645768 0,398 BARD1 ch r13 32890514 32890741 0 ,346 B R C A 2 chr2 215645789 215646022 0,385 BARD1 ch r13 32893139 32893383 0 ,339 B R C A 2 chr2 215645997 215646196 0,405 BARD1 ch r13 32900135 32900368 0,252 B R C A 2 chr2 215646018 215646167 0,413 BARD1 ch r13 32900239 32900484 0 ,305 B R C A 2 chr2 215656994 215657164 0,421 BARD1 ch r13 32900514 32900762 0 ,373 B R C A 2 chr2 215661815 215662059 0,355 BARD1 ch r13 32903445 32903674 0 ,278 B R C A 2 chr2 215674040 215674299 0,662 BARD1 ch r13 32904938 32905182 0 ,343 B R C A 2 chr2 215674057 215674299 0,671 BARD1 ch r13 32905002 32905201 0 ,315 B R C A 2 chr2 215674060 215674299 0,675 BARD1 ch r13 32905048 32905165 0 ,339 B R C A 2 chr2 215674115 215674321 0,681 BARD1 ch r13 32905048 32905168 0 ,347 B R C A 2 ch r20 57484302 57484538 0,439 G N A S chr13 32905048 32905170 0,341 B R C A 2 chr21 36252718 36252963 0,427 RUNX1 ch r13 32905049 32905165 0,342 B R C A 2 chr21 36252753 36253001 0,454 RUNX1 ch r13 32906224 32906468 0,302 B R C A 2 chr21 36252796 36253037 0,471 RUNX1 ch r13 32906406 32906650 0 ,310 B R C A 2 chr21 36252819 36253063 0,469 RUNX1 ch r13 32906408 32906628 0 ,317 B R C A 2 chr22 29092793 29093014 0,383 C H E K 2 ch r13 32906426 32906673 0 ,306 B R C A 2 chr22 29095766 29095985 0,468 C H E K 2 ch r13 32906464 32906663 0 ,305 B R C A 2 chr22 29099378 29099614 0,354 C H E K 2 ch r13 32906520 32906768 0 ,317 B R C A 2 chr22 29105946 29106126 0,243 C H E K 2 ch r13 32906575 32906818 0,361 B R C A 2 chr22 29105988 29106140 0,288 C H E K 2 ch r13 32906606 32906846 0 ,378 B R C A 2 chr22 29107796 29107996 0,373 C H E K 2 ch r13 32906668 32906912 0 ,388 B R C A 2 chr22 29115374 29115613 0,292 C H E K 2 ch r13 32906748 32906987 0 ,388 B R C A 2 chr22 29120968 29121207 0,358 C H E K 2 ch r13 32906815 32907062 0 ,363 B R C A 2 chr22 29121185 29121429 0,376 C H E K 2 ch r13 32906856 32907103 0 ,367 B R C A 2 chr22 29130538 29130762 0,556 C H E K 2 ch r13 32906893 32907106 0 ,383 B R C A 2 chr22 29130552 29130805 0,508 C H E K 2 ch r13 32906938 32907183 0 ,378 B R C A 2 chr22 29137634 29137834 0,547 C H E K 2 ch r13 32907059 32907264 0 ,374 B R C A 2 chr3 10070202 10070402 0 ,383 FA N C D 2 ch r13 32907059 32907307 0 ,378 B R C A 2 chr3 10074431 10074641 0 ,303 FA N C D 2 ch r13 32907288 32907533 0 ,350 B R C A 2 chr3 10076444 10076673 0 ,430 FA N C D 2 ch r13 32910416 32910655 0 ,354 B R C A 2 chr3 10076732 10076932 0 ,323 FA N C D 2 ch r13 32910596 32910835 0 ,388 B R C A 2 chr3 10077981 10078130 0 ,313 FA N C D 2 ch r13 32910778 32911027 0 ,340 B R C A 2 chr3 10080961 10081110 0 ,367 FA N C D 2 ch r13 32910967 32911215 0 ,317 B R C A 2 chr3 10081391 10081592 0 ,510 FA N C D 2 ch r13 32910988 32911187 0 ,335 B R C A 2 chr3 10083255 10083471 0 ,433 FA N C D 2 ch r13 32911008 32911252 0,331 B R C A 2 chr3 10116194 10116415 0 ,405 FA N C D 2 ch r13 32911035 32911252 0,321 B R C A 2 chr3 10119764 10119916 0 ,523 FA N C D 2 ch r13 32911045 32911295 0,331 B R C A 2 chr3 10122693 10122903 0,422 FA N C D 2 ch r13 32911167 32911415 0,341 B R C A 2 chr3 10122903 10123103 0 ,378 FA N C D 2 Cr. In ic io Fin G C G en Cr. In ic io Fin G C G en ch r13 32911340 32911588 0 ,333 B R C A 2 chr3 10123144 10123344 0 ,358 FA N C D 2 ch r13 32911594 32911838 0,322 B R C A 2 chr3 10127494 10127703 0 ,433 FA N C D 2 ch r13 32911841 32912085 0 ,384 B R C A 2 chr3 10128659 10128873 0 ,414 FA N C D 2 ch r13 32912080 32912319 0,342 B R C A 2 chr3 10130055 10130255 0 ,448 FA N C D 2 ch r13 32912267 32912511 0 ,265 B R C A 2 ch r3 10130418 10130618 0 ,398 FA N C D 2 ch r13 32912502 32912746 0,331 B R C A 2 ch r3 10131860 10132052 0,461 FA N C D 2 ch r13 32912749 32912986 0 ,307 B R C A 2 ch r3 10133776 10133976 0 ,418 FA N C D 2 ch r13 32912979 32913218 0 ,404 B R C A 2 ch r3 10134833 10135033 0 ,448 FA N C D 2 ch r13 32913217 32913460 0 ,336 B R C A 2 ch r3 10135971 10136220 0 ,484 FA N C D 2 ch r13 32913444 32913691 0 ,323 B R C A 2 ch r3 10136796 10137016 0 ,425 FA N C D 2 ch r13 32913682 32913927 0,321 B R C A 2 ch r3 10137928 10138128 0 ,398 FA N C D 2 ch r13 32913944 32914192 0 ,329 B R C A 2 ch r3 10140403 10140603 0 ,448 FA N C D 2 ch r13 32914208 32914455 0 ,347 B R C A 2 ch r3 10140685 10140895 0,322 FA N C D 2 ch r13 32914462 32914709 0 ,343 B R C A 2 chr3 10183302 10183451 0 ,653 V H L ch r13 32914691 32914936 0 ,329 B R C A 2 chr3 10183681 10183874 0 ,706 V H L ch r13 32914776 32915021 0 ,333 B R C A 2 chr3 10188234 10188438 0 ,390 V H L ch r13 32914895 32915115 0 ,326 B R C A 2 chr3 10191445 10191700 0 ,484 V H L ch r13 32914896 32915115 0 ,327 B R C A 2 chr3 10191721 10191932 0,392 V H L ch r13 32914906 32915155 0 ,328 B R C A 2 chr3 10192245 10192450 0 ,350 V H L ch r13 32915087 32915334 0 ,355 B R C A 2 ch r3 12645599 12645838 0 ,504 RAF1 ch r13 32915144 32915384 0 ,357 B R C A 2 ch r3 12645599 12645843 0,502 RAF1 ch r13 32918540 32918787 0 ,258 B R C A 2 ch r3 12645599 12645844 0 ,500 RAF1 ch r13 32920834 32921033 0 ,295 B R C A 2 ch r3 12645603 12645844 0 ,504 RAF1 ch r13 32928970 32929189 0 ,345 B R C A 2 chr3 14186692 14186898 0 ,319 X P C chr13 32928972 32929201 0 ,357 B R C A 2 chr3 14186863 14187104 0,521 X P C chr13 32928992 32929236 0,351 B R C A 2 chr3 14187085 14187334 0,532 X P C chr13 32928996 32929196 0 ,358 B R C A 2 chr3 14187312 14187552 0 ,589 X P C chr13 32928996 32929208 0 ,357 B R C A 2 chr3 14187523 14187722 0 ,570 X P C chr13 32929176 32929423 0 ,339 B R C A 2 chr3 14188679 14188879 0,552 X P C chr13 32929177 32929426 0 ,344 B R C A 2 chr3 14189299 14189509 0 ,583 X P C chr13 32929220 32929467 0 ,323 B R C A 2 chr3 14189991 14190191 0 ,597 X P C chr13 32929274 32929479 0 ,335 B R C A 2 chr3 14190286 14190496 0 ,578 X P C chr13 32929297 32929498 0,322 B R C A 2 chr3 14193741 14194025 0 ,596 X P C chr13 32930589 32930789 0 ,448 B R C A 2 chr3 14197850 14198050 0 ,483 X P C chr13 32931650 32931879 0 ,257 B R C A 2 chr3 14199573 14199852 0 ,543 X P C chr13 32931817 32932017 0 ,318 B R C A 2 chr3 14199862 14200062 0,582 X P C chr13 32932034 32932234 0 ,313 B R C A 2 chr3 14200146 14200394 0,522 X P C chr13 32936641 32936885 0 ,384 B R C A 2 chr3 14206322 14206487 0 ,434 X P C chr13 32937319 32937563 0 ,384 B R C A 2 chr3 14206933 14207089 0,522 X P C chr13 32937529 32937773 0 ,376 B R C A 2 chr3 14208699 14208911 0 ,474 X P C chr13 32944444 32944688 0 ,359 B R C A 2 chr3 14209663 14209863 0 ,517 X P C chr13 32945080 32945249 0 ,359 B R C A 2 chr3 14211839 14212049 0 ,384 X P C chr13 32950820 32951019 0 ,440 B R C A 2 chr3 14214355 14214600 0 ,476 X P C chr13 32953333 32953533 0 ,348 B R C A 2 chr3 14220004 14220204 0,682 X P C chr13 32953442 32953686 0 ,363 B R C A 2 chr3 37034589 37034809 0 ,570 E P M 2A IP 1 ch r13 32953840 32954084 0 ,327 B R C A 2 chr3 37034790 37035063 0 ,544 E P M 2A IP 1 ch r13 32954054 32954299 0 ,346 B R C A 2 ch r3 37035069 37035306 0,622 M LH1 ch r13 32954054 32954300 0 ,344 B R C A 2 ch r3 37038000 37038200 0 ,368 M LH1 ch r13 32968741 32968971 0 ,359 B R C A 2 ch r3 37042434 37042645 0 ,354 M LH1 ch r13 32968820 32969069 0 ,384 B R C A 2 ch r3 37045773 37045973 0 ,418 M LH1 ch r13 32970989 32971236 0 ,379 B R C A 2 ch r3 37048411 37048645 0 ,353 M LH1 ch r13 32971106 32971335 0 ,348 B R C A 2 ch r3 37050230 37050436 0 ,377 M LH1 Cr. In ic io Fin G C G en Cr. In ic io Fin G C G en ch r13 32972257 32972489 0 ,373 B R C A 2 ch r3 37053207 37053427 0 ,335 M LH1 ch r13 32972463 32972703 0 ,390 B R C A 2 ch r3 37053528 37053730 0 ,340 M LH1 ch r13 32972600 32972845 0 ,378 B R C A 2 ch r3 37055893 37056093 0 ,373 M LH1 ch r13 32972664 32972864 0 ,418 B R C A 2 ch r3 37058865 37059114 0 ,424 M LH1 ch r13 32972671 32972922 0 ,397 B R C A 2 ch r3 37061804 37062039 0,542 M LH1 ch r13 32972708 32972954 0 ,389 B R C A 2 ch r3 37067171 37067392 0 ,500 M LH1 ch r13 32973392 32973641 0 ,336 B R C A 2 ch r3 37067236 37067492 0 ,514 M LH1 ch r13 32973613 32973807 0 ,267 B R C A 2 ch r3 37070194 37070394 0 ,408 M LH1 ch r13 48916668 48916868 0 ,318 RB1 ch r3 37070355 37070605 0,462 M LH1 ch r13 48919151 48919351 0 ,284 RB1 ch r3 37081625 37081777 0 ,438 M LH1 ch r13 48921945 48922145 0 ,308 RB1 ch r3 37083681 37083889 0 ,354 M LH1 ch r13 48923001 48923221 0 ,258 RB1 ch r3 37088877 37089113 0 ,468 M LH1 ch r13 48936897 48937117 0 ,330 RB1 ch r3 37088933 37089152 0 ,473 M LH1 ch r13 48939068 48939268 0 ,318 RB1 ch r3 37089899 37090099 0 ,468 M LH1 ch r13 48941560 48941760 0 ,318 RB1 ch r3 37090327 37090527 0 ,428 M LH1 ch r13 48947429 48947629 0 ,323 RB1 ch r3 37091892 37092087 0 ,480 M LH1 ch r13 48951017 48951237 0 ,348 RB1 ch r3 37091894 37092142 0 ,466 M LH1 ch r13 48954364 48954564 0 ,328 RB1 ch r3 41265974 41266223 0 ,464 C TN N B 1 ch r13 48955326 48955526 0 ,303 RB1 ch r3 41266013 41266252 0 ,488 C TN N B 1 ch r13 48955536 48955736 0 ,338 RB1 ch r3 41266021 41266268 0 ,476 C TN N B 1 ch r13 49027033 49027233 0 ,333 RB1 ch r3 41266036 41266265 0 ,474 C TN N B 1 ch r13 49030212 49030472 0 ,364 RB1 ch r3 52435062 52435320 0 ,583 BAP1 ch r13 49033792 49033992 0 ,428 RB1 ch r3 52435350 52435631 0 ,543 BAP1 ch r13 49037854 49038084 0 ,299 RB1 ch r3 52435934 52436211 0,561 BAP1 ch r13 49039190 49039390 0 ,378 RB1 ch r3 52436217 52436465 0 ,647 BAP1 ch r13 49039267 49039467 0 ,383 RB1 ch r3 52436552 52436790 0,552 BAP1 ch r13 49047356 49047616 0 ,287 RB1 ch r3 52436807 52437063 0,572 BAP1 ch r13 49050783 49050983 0 ,373 RB1 ch r3 52437127 52437370 0 ,574 BAP1 ch r13 49051484 49051724 0 ,299 RB1 ch r3 52437447 52437693 0 ,599 BAP1 ch r13 49054133 49054333 0 ,413 RB1 ch r3 52437754 52437978 0 ,556 BAP1 ch r13 49054700 49054910 0,251 RB1 ch r3 52438443 52438682 0 ,575 BAP1 ch r13 49055078 49055278 0 ,323 RB1 ch r3 52439130 52439357 0 ,583 BAP1 ch r13 49055456 49055656 0 ,343 RB1 ch r3 52439752 52440014 0 ,544 BAP1 ch r13 49055834 49056034 0 ,254 RB1 ch r3 52440273 52440505 0 ,618 BAP1 ch r13 103498123 103498440 0 ,629 E R C C 5 ch r3 52440695 52440946 0,552 BAP1 ch r13 103498155 103498432 0 ,640 E R C C 5 ch r3 52441181 52441475 0 ,576 BAP1 ch r13 103498190 103498390 0,642 E R C C 5 ch r3 52441983 52442230 0,532 BAP1 ch r13 103498192 103498440 0,631 E R C C 5 ch r3 52442460 52442693 0 ,500 BAP1 ch r13 103498192 103498453 0 ,626 E R C C 5 ch r3 52443505 52443740 0,602 BAP1 ch r13 103498470 103498701 0 ,608 E R C C 5 chr3 138374171 138374400 0 ,400 P IK 3C B ch r13 103498494 103498713 0 ,618 E R C C 5 chr3 138374183 138374428 0 ,386 P IK 3C B ch r13 103498494 103498717 0,621 E R C C 5 chr3 138374197 138374427 0 ,398 P IK 3C B ch r13 103498574 103498757 0,641 E R C C 5 chr3 138374204 138374443 0 ,408 P IK 3C B ch r13 103504312 103504529 0 ,349 E R C C 5 chr3 138409848 138410087 0 ,375 P IK 3C B ch r13 103504364 103504578 0,372 E R C C 5 chr3 138409848 138410097 0 ,380 P IK 3C B ch r13 103506028 103506230 0 ,409 E R C C 5 chr3 138409872 138410116 0 ,380 P IK 3C B ch r13 103506526 103506726 0 ,463 E R C C 5 chr3 138409872 138410118 0 ,385 P IK 3C B ch r13 103508374 103508544 0 ,275 E R C C 5 chr3 138417690 138417920 0 ,390 P IK 3C B ch r13 103510603 103510803 0 ,393 E R C C 5 chr3 138417690 138417924 0 ,383 P IK 3C B ch r13 103513836 103514056 0 ,407 E R C C 5 chr3 138417696 138417915 0,391 P IK 3C B ch r13 103514321 103514572 0 ,433 E R C C 5 chr3 138417697 138417916 0 ,395 P IK 3C B ch r13 103514574 103514792 0 ,534 E R C C 5 ch r3 138665132 138665361 0 ,600 FO X L2 Cr. In ic io Fin G C G en Cr. In ic io Fin G C G en ch r13 103514801 103515020 0,482 E R C C 5 ch r3 138665147 138665396 0 ,600 FO X L2 ch r13 103515021 103515221 0 ,428 E R C C 5 ch r3 138665151 138665396 0 ,602 FO X L2 ch r13 103515235 103515435 0 ,433 E R C C 5 ch r3 138665170 138665409 0 ,613 FO X L2 ch r13 103517984 103518184 0 ,478 E R C C 5 ch r3 178916725 178916970 0 ,362 P IK 3 C A ch r13 103518194 103518404 0,412 E R C C 5 ch r3 178916766 178917010 0,351 P IK 3 C A ch r13 103518516 103518726 0 ,370 E R C C 5 ch r3 178916782 178917028 0 ,356 P IK 3 C A ch r13 103519057 103519257 0 ,368 E R C C 5 ch r3 178916822 178917068 0 ,336 P IK 3 C A ch r13 103520541 103520748 0 ,370 E R C C 5 ch r3 178917417 178917566 0 ,320 P IK 3 C A ch r13 103524493 103524693 0 ,413 E R C C 5 ch r3 178917417 178917618 0 ,347 P IK 3 C A ch r13 103524585 103524802 0 ,445 E R C C 5 ch r3 178917420 178917590 0 ,345 P IK 3 C A ch r13 103525496 103525696 0 ,368 E R C C 5 ch r3 178917420 178917604 0,351 P IK 3 C A ch r13 103527656 103527856 0 ,408 E R C C 5 ch r3 178921331 178921578 0 ,367 P IK 3 C A ch r13 103527863 103528063 0 ,408 E R C C 5 ch r3 178921339 178921585 0 ,372 P IK 3 C A ch r13 103528070 103528300 0 ,437 E R C C 5 ch r3 178921347 178921596 0 ,368 P IK 3 C A ch r14 38060515 38060750 0 ,589 FO XA1 ch r3 178921364 178921608 0,351 P IK 3 C A ch r14 38060564 38060810 0,591 FO XA1 ch r3 178927888 178928114 0 ,339 P IK 3 C A ch r14 38060574 38060818 0,592 FO XA1 ch r3 178927898 178928114 0 ,346 P IK 3 C A ch r14 38060586 38060833 0,601 FO XA1 ch r3 178927910 178928144 0 ,323 P IK 3 C A ch r14 45605103 45605333 0 ,558 FA N C M chr3 178927974 178928182 0 ,354 P IK 3C A ch r14 45605305 45605553 0 ,610 FA N C M chr3 178935873 178936102 0 ,313 P IK 3C A ch r14 45605573 45605799 0,511 FA N C M chr3 178935930 178936133 0 ,353 P IK 3C A ch r14 45606233 45606433 0 ,398 FA N C M chr3 178935944 178936197 0 ,335 P IK 3C A ch r14 45618024 45618224 0 ,363 FA N C M chr3 178935995 178936197 0 ,365 P IK 3C A ch r14 45620541 45620741 0 ,333 FA N C M chr3 178936030 178936279 0 ,320 P IK 3C A ch r14 45623034 45623234 0 ,348 FA N C M chr3 178951914 178952159 0,382 P IK 3C A ch r14 45628297 45628497 0 ,408 FA N C M chr3 178951915 178952140 0 ,385 P IK 3C A ch r14 45633510 45633710 0 ,373 FA N C M chr3 178951921 178952140 0 ,386 P IK 3C A ch r14 45633720 45633920 0 ,383 FA N C M chr3 178951921 178952159 0,381 P IK 3C A ch r14 45636166 45636386 0 ,376 FA N C M chr3 178951948 178952109 0 ,389 P IK 3C A ch r14 45639788 45640013 0,341 FA N C M chr3 178952004 178952152 0 ,389 P IK 3C A ch r14 45642242 45642442 0 ,403 FA N C M chr3 178952010 178952109 0 ,390 P IK 3C A ch r14 45644281 45644486 0 ,340 FA N C M chr3 178952109 178952152 0 ,386 P IK 3C A ch r14 45644653 45644863 0 ,313 FA N C M chr4 55151865 55152127 0 ,513 P D G F R A chr14 45644862 45645099 0,382 FA N C M chr4 55593487 55593733 0 ,389 K IT ch r14 45645143 45645342 0 ,350 FA N C M chr4 55593505 55593749 0 ,400 K IT ch r14 45645413 45645613 0 ,378 FA N C M chr4 55593514 55593765 0 ,397 K IT ch r14 45645666 45645955 0,331 FA N C M chr4 55593530 55593778 0 ,390 K IT ch r14 45645983 45646183 0 ,303 FA N C M chr4 55594116 55594365 0 ,416 K IT ch r14 45650718 45650970 0,332 FA N C M chr4 55594125 55594365 0,411 K IT ch r14 45650772 45650971 0 ,320 FA N C M chr4 55594139 55594380 0,401 K IT ch r14 45652886 45653086 0 ,338 FA N C M chr4 55594139 55594385 0,401 K IT ch r14 45654389 45654589 0 ,303 FA N C M chr4 55599168 55599408 0 ,365 K IT ch r14 45656912 45657134 0 ,269 FA N C M chr4 55599173 55599417 0 ,367 K IT ch r14 45658004 45658204 0 ,333 FA N C M chr4 55599207 55599435 0 ,384 K IT ch r14 45658183 45658427 0,371 FA N C M chr4 55602645 55602892 0 ,423 K IT ch r14 45658417 45658644 0 ,368 FA N C M chr4 55602657 55602888 0,422 K IT ch r14 45665608 45665811 0 ,348 FA N C M chr4 55602657 55602892 0 ,424 K IT ch r14 45667934 45668145 0 ,358 FA N C M chr4 153244069 153244316 0 ,464 F B X W 7 chr14 45668983 45669204 0 ,320 FA N C M chr4 153244075 153244315 0 ,465 F B X W 7 chr14 45669474 45669678 0 ,346 FA N C M chr4 153244085 153244324 0 ,454 F B X W 7 chr14 95557315 95557515 0 ,313 D IC ER1 chr4 153244106 153244353 0 ,427 F B X W 7 chr14 95557526 95557726 0 ,463 D IC ER1 chr4 153245291 153245531 0 ,398 F B X W 7 Cr. In ic io Fin G C G en Cr. In ic io Fin G C G en ch r14 95559982 95560182 0,542 D IC ER1 ch r4 153245297 153245541 0 ,400 F B X W 7 chr14 95560204 95560434 0 ,494 D IC ER1 ch r4 153245312 153245560 0 ,406 F B X W 7 chr14 95560444 95560644 0 ,398 D IC ER1 ch r4 153245328 153245572 0 ,396 F B X W 7 chr14 95562161 95562361 0 ,368 D IC ER1 ch r4 153247109 153247353 0 ,433 F B X W 7 chr14 95562361 95562592 0 ,530 D IC ER1 ch r4 153247122 153247369 0 ,448 F B X W 7 chr14 95562601 95562801 0 ,438 D IC ER1 ch r4 153247150 153247399 0 ,456 F B X W 7 chr14 95562666 95562891 0 ,398 D IC ER1 ch r4 153249264 153249512 0 ,414 F B X W 7 chr14 95566129 95566335 0 ,406 D IC ER1 ch r4 153249285 153249525 0 ,419 F B X W 7 chr14 95569682 95569882 0 ,468 D IC ER1 ch r4 153249290 153249529 0 ,417 F B X W 7 chr14 95569994 95570194 0 ,403 D IC ER1 ch r4 153249303 153249551 0 ,414 F B X W 7 chr14 95570228 95570428 0 ,418 D IC ER1 ch r4 153250763 153251006 0 ,340 F B X W 7 chr14 95571340 95571540 0 ,488 D IC ER1 ch r4 153250791 153251017 0 ,348 F B X W 7 chr14 95571974 95572174 0 ,348 D IC ER1 ch r4 153250791 153251031 0 ,349 F B X W 7 chr14 95572314 95572514 0 ,428 D IC ER1 ch r4 153250808 153251047 0,342 F B X W 7 chr14 95572524 95572764 0 ,249 D IC ER1 ch r4 153251774 153252018 0 ,380 F B X W 7 chr14 95573959 95574159 0 ,338 D IC ER1 ch r4 153251789 153252028 0 ,388 F B X W 7 chr14 95574168 95574368 0 ,348 D IC ER1 ch r4 153251792 153252040 0,382 F B X W 7 chr14 95574657 95574857 0 ,443 D IC ER1 ch r4 153251832 153252071 0 ,379 F B X W 7 chr14 95577599 95577799 0 ,433 D IC ER1 ch r4 153258843 153259092 0 ,356 F B X W 7 chr14 95578391 95578591 0 ,358 D IC ER1 ch r4 153258850 153259097 0 ,355 F B X W 7 chr14 95579340 95579540 0 ,358 D IC ER1 ch r4 153258888 153259137 0 ,344 F B X W 7 chr14 95581926 95582126 0 ,433 D IC ER1 ch r4 153258953 153259199 0 ,368 F B X W 7 chr14 95582756 95582956 0 ,358 D IC ER1 ch r4 153268077 153268219 0 ,517 F B X W 7 chr14 95582966 95583166 0 ,348 D IC ER1 ch r4 153268078 153268219 0 ,514 F B X W 7 chr14 95583900 95584100 0 ,378 D IC ER1 ch r4 153268079 153268219 0 ,518 F B X W 7 chr14 95590532 95590732 0 ,358 D IC ER1 ch r5 56161075 56161306 0 ,328 M AP3K1 ch r14 95590767 95590967 0 ,393 D IC ER1 ch r5 56161096 56161325 0 ,330 M AP3K1 ch r14 95592822 95593064 0 ,305 D IC ER1 ch r5 56161113 56161321 0 ,349 M AP3K1 ch r14 95595734 95595934 0 ,358 D IC ER1 ch r5 56161178 56161386 0,321 M AP3K1 ch r14 95596337 95596537 0 ,343 D IC ER1 ch r5 56161545 56161787 0 ,346 M AP3K1 ch r14 95598778 95598978 0 ,383 D IC ER1 ch r5 56161548 56161797 0 ,348 M AP3K1 ch r14 95598988 95599188 0 ,308 D IC ER1 ch r5 56161563 56161807 0 ,355 M AP3K1 ch r14 95599591 95599801 0 ,436 D IC ER1 ch r5 56161577 56161806 0 ,365 M AP3K1 ch r14 95623722 95623973 0 ,750 D IC ER1 ch r5 56180437 56180676 0 ,363 M AP3K1 ch r14 105246388 105246637 0 ,596 AKT1 ch r5 56180457 56180659 0 ,389 M AP3K1 ch r14 105246483 105246730 0 ,617 AKT1 ch r5 56180502 56180707 0 ,369 M AP3K1 ch r14 105246501 105246707 0 ,633 AKT1 ch r5 56181614 56181861 0 ,335 M AP3K1 ch r14 105246501 105246745 0 ,633 AKT1 ch r5 56181627 56181876 0,332 M AP3K1 ch r15 32968921 32969121 0 ,303 G R EM 1 chr5 56181632 56181871 0 ,338 M AP3K1 ch r15 32976883 32977083 0 ,393 G R EM 1 chr5 56181648 56181887 0 ,346 M AP3K1 ch r15 32984845 32985055 0 ,469 G R EM 1 chr5 56183135 56183374 0 ,429 M AP3K1 ch r15 32988826 32989036 0 ,370 S C G 5 chr5 56183138 56183347 0 ,429 M AP3K1 ch r15 33000769 33000969 0,512 G R EM 1 chr5 56183138 56183361 0 ,429 M AP3K1 ch r15 33022952 33023162 0 ,654 G R EM 1 chr5 56183176 56183375 0 ,455 M AP3K1 ch r15 33022952 33023205 0 ,638 G R EM 1 chr5 112043137 112043364 0 ,649 A P C chr15 33023018 33023279 0 ,626 G R EM 1 chr5 112043137 112043365 0,651 A P C chr15 33023148 33023435 0,521 G R EM 1 chr5 112043186 112043431 0 ,663 A P C chr15 33023151 33023435 0 ,519 G R EM 1 chr5 112043190 112043431 0,661 A P C chr15 33023205 33023450 0 ,504 G R EM 1 chr5 112043201 112043471 0,672 A P C chr15 33023686 33023886 0 ,517 G R EM 1 chr5 112043206 112043428 0 ,668 A P C chr15 33024084 33024294 0 ,464 G R EM 1 chr5 112073451 112073699 0 ,639 A P C chr15 33024482 33024682 0 ,398 G R EM 1 chr5 112073948 112074148 0 ,488 A P C
Figure imgf000019_0001
Cr. In ic io Fin G C G en Cr. In ic io Fin G C G en ch r15 90631785 90632007 0 ,570 ID H 2 ch r5 131892606 131892857 0 ,718 R A D 50 ch r15 90631814 90632043 0 ,548 ID H 2 ch r5 131892983 131893197 0 ,474 R A D 50 ch r15 90631843 90632054 0 ,519 ID H 2 ch r5 131892984 131893223 0 ,463 R A D 50 ch r16 3631168 3631388 0 ,443 S L X 4 chr5 131893020 131893223 0 ,466 R A D 50 ch r16 3632424 3632665 0 ,645 S L X 4 chr5 131893049 131893292 0,492 R A D 50 ch r16 3632693 3632893 0 ,597 S L X 4 chr5 131894808 131895037 0,252 R A D 50 ch r16 3633083 3633283 0,582 S L X 4 chr5 131911382 131911618 0 ,376 R A D 50 ch r16 3633339 3633565 0 ,590 S L X 4 chr5 131915004 131915223 0,382 R A D 50 ch r16 3634696 3634896 0,502 S L X 4 chr5 131915567 131915717 0 ,364 R A D 50 ch r16 3639002 3639202 0 ,617 S L X 4 chr5 131923251 131923500 0,312 R A D 50 ch r16 3639197 3639423 0,652 S L X 4 chr5 131923517 131923757 0 ,328 R A D 50 ch r16 3639505 3639754 0,632 S L X 4 chr5 131924402 131924651 0 ,364 R A D 50 ch r16 3639692 3639932 0 ,639 S L X 4 chr5 131925323 131925552 0 ,343 R A D 50 ch r16 3639911 3640159 0 ,530 S L X 4 chr5 131926850 131927094 0 ,363 R A D 50 ch r16 3640185 3640409 0 ,498 S L X 4 chr5 131927570 131927750 0 ,354 R A D 50 ch r16 3640478 3640721 0 ,607 S L X 4 chr5 131930491 131930738 0 ,323 R A D 50 ch r16 3640760 3641047 0 ,660 S L X 4 chr5 131931278 131931508 0,442 R A D 50 ch r16 3641072 3641272 0 ,468 S L X 4 chr5 131939061 131939291 0 ,377 R A D 50 ch r16 3642628 3642858 0 ,597 S L X 4 chr5 131939553 131939789 0 ,350 R A D 50 ch r16 3644537 3644773 0 ,608 S L X 4 chr5 131940409 131940654 0 ,346 R A D 50 ch r16 3645495 3645705 0 ,673 S L X 4 chr5 131944351 131944557 0,261 R A D 50 ch r16 3646003 3646244 0 ,698 S L X 4 chr5 131944387 131944597 0,251 R A D 50 ch r16 3646031 3646244 0 ,720 S L X 4 chr5 131944873 131945090 0,271 R A D 50 ch r16 3646124 3646405 0 ,699 S L X 4 chr5 131951603 131951803 0 ,323 R A D 50 ch r16 3646149 3646391 0,712 S L X 4 chr5 131951820 131952020 0 ,294 R A D 50 ch r16 3646157 3646403 0 ,704 S L X 4 chr5 131953730 131953966 0 ,333 R A D 50 ch r16 3647312 3647583 0 ,610 S L X 4 chr5 131972864 131973090 0 ,454 R A D 50 ch r16 3647601 3647800 0 ,540 S L X 4 chr5 131973728 131973957 0 ,443 R A D 50 ch r16 3647864 3648074 0 ,578 S L X 4 chr5 131976168 131976417 0 ,520 R A D 50 ch r16 3650971 3651251 0 ,530 S L X 4 chr5 131977815 131978052 0 ,378 R A D 50 ch r16 3652058 3652258 0 ,557 S L X 4 chr5 131978075 131978308 0,372 R A D 50 ch r16 3656390 3656622 0 ,506 S L X 4 chr5 131978265 131978518 0 ,417 R A D 50 ch r16 3656642 3656842 0 ,443 S L X 4 chr5 131978882 131979101 0 ,486 R A D 50 ch r16 3658480 3658725 0 ,528 S L X 4 chr5 170837389 170837646 0 ,318 NPM1 ch r16 3658510 3658671 0,562 S L X 4 chr5 170837423 170837672 0 ,316 NPM1 ch r16 3658784 3659014 0 ,455 S LX 4 ch r6 35419950 35420204 0 ,710 FA N C E chr16 3659560 3659760 0 ,438 S LX 4 ch r6 35420484 35420712 0 ,677 FA N C E chr16 14013935 14014175 0,651 E R C C 4 chr6 35423523 35423753 0 ,610 FA N C E chr16 14013966 14014166 0,662 E R C C 4 chr6 35423747 35423980 0 ,568 FA N C E chr16 14013970 14014170 0,662 E R C C 4 chr6 35423937 35424160 0 ,500 FA N C E chr16 14013971 14014170 0 ,665 E R C C 4 chr6 35425325 35425579 0,541 FA N C E chr16 14015823 14016023 0 ,373 E R C C 4 chr6 35425576 35425862 0 ,516 FA N C E chr16 14016033 14016243 0 ,355 E R C C 4 chr6 35425990 35426190 0,602 FA N C E chr16 14020466 14020710 0,351 E R C C 4 chr6 35427014 35427214 0 ,443 FA N C E chr16 14021912 14022151 0 ,338 E R C C 4 chr6 35427343 35427543 0,552 FA N C E chr16 14024532 14024732 0 ,373 E R C C 4 chr6 35428293 35428492 0 ,560 FA N C E chr16 14025949 14026157 0 ,344 E R C C 4 chr6 35433986 35434203 0 ,550 FA N C E chr16 14027949 14028149 0 ,348 E R C C 4 chr6 35434173 35434385 0 ,493 FA N C E chr16 14028984 14029224 0 ,415 E R C C 4 chr6 43544117 43544321 0 ,459 PO LH chr16 14029445 14029685 0,452 E R C C 4 chr6 43550014 43550163 0 ,420 PO LH chr16 14031514 14031714 0 ,373 E R C C 4 chr6 43550754 43550953 0 ,415 PO LH chr16 14038575 14038734 0 ,494 E R C C 4 chr6 43554978 43555223 0 ,476 PO LH Cr. In ic io Fin G C G en Cr. In ic io Fin G C G en ch r16 14041470 14041670 0 ,468 E R C C 4 chr6 43565476 43565625 0 ,467 PO LH chr16 14041655 14041919 0 ,509 E R C C 4 chr6 43568621 43568821 0 ,448 PO LH chr16 14041900 14042126 0 ,498 E R C C 4 chr6 43571533 43571733 0 ,423 PO LH chr16 14042120 14042369 0 ,404 E R C C 4 chr6 43572382 43572582 0 ,433 PO LH chr16 14042584 14042854 0 ,424 E R C C 4 chr6 43572829 43573058 0 ,374 PO LH chr16 14042844 14043078 0 ,336 E R C C 4 chr6 43578220 43578420 0 ,507 PO LH chr16 14042902 14043146 0 ,347 E R C C 4 chr6 43581333 43581514 0 ,407 PO LH chr16 14043430 14043679 0 ,284 E R C C 4 chr6 43581613 43581843 0 ,433 PO LH chr16 14044214 14044436 0,332 E R C C 4 chr6 43581852 43582085 0 ,517 PO LH chr16 14045149 14045380 0 ,276 E R C C 4 chr6 43582072 43582231 0 ,475 PO LH chr16 14045389 14045634 0 ,427 E R C C 4 chr6 43587356 43587593 0,361 PO LH chr16 14045727 14045927 0 ,328 E R C C 4 chr6 43587578 43587778 0 ,393 PO LH chr16 14046154 14046384 0 ,303 E R C C 4 chr6 43587842 43588084 0 ,444 PO LH chr16 23614570 23614827 0 ,310 P A LB 2 chr6 152265305 152265551 0 ,555 ESR1 ch r16 23614836 23615076 0 ,407 P A LB 2 chr6 152265322 152265569 0 ,556 ESR1 ch r16 23619110 23619349 0 ,479 P A LB 2 chr6 152265335 152265582 0 ,548 ESR1 ch r16 23625213 23625413 0 ,398 P A LB 2 chr6 152265349 152265597 0 ,562 ESR1 ch r16 23632741 23632891 0,391 P A LB 2 chr6 152332663 152332910 0 ,444 ESR1 ch r16 23634215 23634415 0 ,393 P A LB 2 chr6 152332707 152332937 0 ,463 ESR1 ch r16 23635260 23635465 0 ,374 P A LB 2 chr6 152332732 152332961 0 ,483 ESR1 ch r16 23637513 23637713 0 ,458 P A LB 2 chr6 152415449 152415694 0 ,553 ESR1 ch r16 23640440 23640682 0 ,370 P A LB 2 chr6 152415449 152415729 0 ,555 ESR1 ch r16 23640927 23641175 0 ,470 P A LB 2 chr6 152415452 152415694 0 ,556 ESR1 ch r16 23641292 23641502 0,431 P A LB 2 chr6 152415469 152415763 0 ,542 ESR1 ch r16 23641570 23641813 0 ,385 P A LB 2 chr6 152419792 152420036 0 ,576 ESR1 ch r16 23646217 23646416 0 ,470 P A LB 2 chr6 152419822 152420047 0 ,575 ESR1 ch r16 23646250 23646449 0 ,460 P A LB 2 chr6 152419877 152420111 0,591 ESR1 ch r16 23646427 23646636 0 ,390 P A LB 2 chr7 6029374 6029583 0 ,367 PM S2 ch r16 23646623 23646823 0 ,403 P A LB 2 chr7 6035119 6035348 0 ,387 PM S2 ch r16 23646780 23647008 0 ,345 P A LB 2 chr7 6036912 6037112 0 ,378 PM S2 ch r16 23646984 23647228 0 ,400 P A LB 2 chr7 6038718 6039008 0 ,430 PM S2 ch r16 23647144 23647434 0 ,385 P A LB 2 chr7 55241468 55241710 0 ,564 E G F R chr16 23647358 23647558 0 ,483 P A LB 2 chr7 55241542 55241789 0 ,565 E G F R chr16 23647369 23647610 0 ,467 P A LB 2 chr7 55241576 55241746 0 ,526 E G F R chr16 23649127 23649357 0 ,355 P A LB 2 chr7 55241613 55241853 0,531 E G F R chr16 23649265 23649465 0 ,358 P A LB 2 chr7 55242269 55242500 0 ,509 E G F R chr16 23652430 23652650 0,692 P A LB 2 chr7 55242271 55242505 0 ,506 E G F R chr16 23652647 23652887 0 ,647 P A LB 2 chr7 55242272 55242520 0 ,506 E G F R chr16 68772169 68772389 0 ,679 C DH1 chr7 55242280 55242532 0 ,506 E G F R chr16 68835529 68835729 0 ,463 C DH1 chr7 55242319 55242558 0 ,496 E G F R chr16 68835564 68835767 0 ,485 C DH1 chr7 55242332 55242584 0 ,490 E G F R chr16 68842243 68842453 0 ,469 C DH1 chr7 55248852 55249080 0 ,585 E G F R chr16 68842518 68842718 0 ,423 C DH1 chr7 55248896 55249120 0,622 E G F R chr16 68844017 68844227 0,512 C DH1 chr7 55248933 55249182 0 ,600 E G F R chr16 68845519 68845719 0 ,483 C DH1 chr7 55248937 55249187 0 ,598 E G F R chr16 68845706 68845945 0 ,517 C DH1 chr7 55248961 55249208 0 ,597 E G F R chr16 68845947 68846147 0,502 C DH1 chr7 55259335 55259571 0 ,523 E G F R chr16 68846157 68846377 0 ,416 C DH1 chr7 55259337 55259586 0,532 E G F R chr16 68847216 68847450 0 ,477 C DH1 chr7 55259356 55259602 0 ,534 E G F R chr16 68849385 68849585 0 ,488 C DH1 chr7 55259368 55259570 0 ,537 E G F R chr16 68849423 68849649 0 ,529 C DH1 chr7 55259391 55259640 0 ,544 E G F R chr16 68853169 68853348 0,522 C DH1 chr7 116411722 116411963 0 ,417 M E T Cr. In ic io Fin G C G en Cr. In ic io Fin G C G en ch r16 68855861 68856061 0 ,453 C DH1 chr7 116411832 116412076 0 ,424 M E T ch r16 68856071 68856271 0 ,488 C DH1 chr7 116411854 116412102 0 ,410 M E T ch r16 68856802 68857067 0 ,560 C DH1 chr7 116411942 116412183 0 ,347 M E T ch r16 68857287 68857494 0,481 C DH1 chr7 140453006 140453257 0,381 B R A F ch r16 68862023 68862255 0,511 C DH1 chr7 140453042 140453283 0 ,364 B R A F ch r16 68863473 68863683 0 ,488 C DH1 chr7 140453060 140453259 0 ,385 B R A F ch r16 68867121 68867366 0 ,488 C DH1 chr7 140453085 140453319 0 ,336 B R A F ch r16 68867369 68867599 0 ,476 C DH1 chr7 140453086 140453335 0 ,340 B R A F ch r16 89804046 89804215 0 ,553 F A N C A chr7 140453105 140453353 0 ,329 B R A F ch r16 89804303 89804513 0,592 F A N C A chr7 140481224 140481471 0 ,355 B R A F ch r16 89804648 89804858 0 ,635 F A N C A chr7 140481234 140481475 0 ,360 B R A F ch r16 89804928 89805172 0 ,596 F A N C A chr7 140481251 140481496 0 ,358 B R A F ch r16 89805241 89805441 0 ,498 F A N C A chr7 140481263 140481507 0 ,363 B R A F ch r16 89805462 89805662 0,612 F A N C A chr8 90947700 90947947 0,319 NBN chr16 89805672 89805892 0 ,548 F A N C A chr8 90949123 90949343 0,326 NBN chr16 89806299 89806509 0,502 F A N C A chr8 90955446 90955690 0,351 NBN chr16 89807188 89807437 0 ,364 F A N C A chr8 90958290 90958510 0,321 NBN chr16 89809197 89809432 0,542 F A N C A chr8 90959971 90960119 0,329 NBN chr16 89811314 89811494 0 ,646 F A N C A chr8 90965407 90965703 0,347 NBN chr16 89812889 89813109 0 ,557 F A N C A chr8 90965709 90965960 0,333 NBN chr16 89813161 89813385 0,551 F A N C A chr8 90967522 90967722 0,388 NBN chr16 89814966 89815166 0 ,587 F A N C A chr8 90967762 90967962 0,299 NBN chr16 89816227 89816392 0 ,608 F A N C A chr8 90970951 90971177 0,414 NBN chr16 89818546 89818699 0 ,416 F A N C A chr8 90976592 90976816 0,324 NBN chr16 89825033 89825256 0 ,563 F A N C A chr8 90976592 90976817 0,323 NBN chr16 89825068 89825276 0 ,545 F A N C A chr8 90982598 90982805 0,385 NBN chr16 89828413 89828604 0 ,396 F A N C A chr8 90983304 90983514 0,308 NBN chr16 89831297 89831493 0 ,533 F A N C A chr8 90990344 90990544 0,318 NBN chr16 89833531 89833695 0 ,358 F A N C A chr8 90992886 90993086 0,323 NBN chr16 89836321 89836521 0 ,617 F A N C A chr8 90993103 90993303 0,284 NBN chr16 89836550 89836790 0 ,598 F A N C A chr8 90993522 90993742 0,321 NBN chr16 89836823 89837062 0 ,604 F A N C A chr8 90994780 90995004 0,347 NBN chr16 89836842 89837075 0 ,615 F A N C A chr8 90996593 90996859 0,678 NBN chr16 89836876 89837138 0 ,635 F A N C A chr9 5073651 5073873 0 ,354 JAK2 ch r16 89836882 89837082 0 ,627 F A N C A chr9 21968200 21968432 0 ,545 C D K N 2 A ch r16 89836894 89837156 0 ,627 F A N C A chr9 21970919 21971216 0,721 C D K N 2 A ch r16 89838040 89838261 0 ,514 F A N C A chr9 21970920 21971216 0,721 C D K N 2 A ch r16 89839593 89839838 0 ,573 F A N C A chr9 21973486 21973718 0 ,365 C D K N 2 A ch r16 89842062 89842262 0 ,498 F A N C A chr9 21974363 21974602 0 ,500 C D K N 2 A ch r16 89845140 89845350 0 ,483 F A N C A chr9 21994083 21994336 0 ,654 C D K N 2 A ch r16 89845256 89845456 0 ,527 F A N C A chr9 21994085 21994334 0 ,656 C D K N 2 A ch r16 89846317 89846557 0 ,498 F A N C A chr9 35073773 35074045 0,432 FA N C G chr16 89849141 89849341 0,502 F A N C A chr9 35074052 35074258 0 ,517 FA N C G chr16 89849323 89849591 0 ,554 F A N C A chr9 35074248 35074484 0 ,565 FA N C G chr16 89857774 89858016 0 ,560 F A N C A chr9 35074847 35075072 0 ,535 FA N C G chr16 89858250 89858450 0 ,567 F A N C A chr9 35075125 35075335 0 ,493 FA N C G chr16 89858752 89858951 0 ,555 F A N C A chr9 35075354 35075564 0,531 FA N C G chr16 89862215 89862425 0,512 F A N C A chr9 35075451 35075651 0,562 FA N C G chr16 89865452 89865652 0,532 F A N C A chr9 35075668 35075868 0 ,587 FA N C G chr16 89865648 89865886 0 ,498 F A N C A chr9 35075897 35076097 0 ,557 FA N C G chr16 89865874 89866074 0 ,408 F A N C A chr9 35076388 35076632 0 ,494 FA N C G chr16 89869678 89869909 0,461 F A N C A chr9 35076699 35076959 0 ,529 FA N C G Cr. In ic io Fin G C G en Cr. In ic io Fin G C G en ch r16 89871619 89871819 0,522 F A N C A chr9 35076908 35077108 0 ,537 FA N C G chr16 89874567 89874718 0 ,375 F A N C A chr9 35077204 35077404 0 ,517 FA N C G chr16 89877021 89877274 0,382 F A N C A chr9 35078145 35078385 0 ,593 FA N C G chr16 89877278 89877525 0 ,520 F A N C A chr9 35078512 35078712 0,522 FA N C G chr16 89880876 89881036 0,342 F A N C A chr9 35079068 35079268 0 ,587 FA N C G chr16 89882268 89882508 0 ,564 F A N C A chr9 35079437 35079667 0,671 FA N C G chr17 7572710 7572941 0 ,547 T P 53 ch r9 35079767 35079970 0 ,667 FA N C G chr17 7572841 7573094 0 ,524 T P 53 ch r9 35079828 35080069 0,702 FA N C G chr17 7573785 7574015 0,571 T P 53 ch r9 35079839 35080069 0 ,706 FA N C G chr17 7573785 7574050 0 ,583 T P 53 ch r9 35079923 35080159 0 ,667 FA N C G chr17 7573803 7574050 0 ,593 T P 53 chr9 80336120 80336372 0 ,478 G N A Q chr17 7573811 7574017 0 ,580 T P 53 chr9 80336121 80336372 0 ,476 G N A Q chr17 7576734 7576934 0 ,468 T P 53 chr9 80336223 80336472 0 ,500 G N A Q chr17 7576933 7577155 0,552 T P 53 chr9 80336253 80336500 0 ,484 G N A Q chr17 7576951 7577151 0 ,557 T P 53 chr9 80336259 80336500 0 ,483 G N A Q chr17 7576970 7577197 0 ,548 T P 53 chr9 80409367 80409598 0 ,353 G N A Q chr17 7576998 7577191 0,552 T P 53 chr9 80409379 80409628 0,352 G N A Q chr17 7576998 7577241 0 ,529 T P 53 ch r9 97863312 97863512 0,572 FA N C C chr17 7576998 7577242 0,531 T P 53 ch r9 97863840 97864111 0 ,548 FA N C C chr17 7577014 7577263 0,532 T P 53 ch r9 97869338 97869594 0 ,595 FA N C C chr17 7577304 7577572 0 ,565 T P 53 ch r9 97872619 97872829 0 ,308 FA N C C chr17 7577329 7577570 0 ,574 T P 53 ch r9 97872955 97873165 0 ,398 FA N C C chr17 7577329 7577576 0 ,569 T P 53 ch r9 97873179 97873409 0 ,494 FA N C C chr17 7577346 7577570 0 ,596 T P 53 ch r9 97873711 97873957 0 ,587 FA N C C chr17 7577346 7577576 0 ,589 T P 53 ch r9 97876827 97877027 0 ,517 FA N C C chr17 7577371 7577620 0 ,564 T P 53 ch r9 97879613 97879852 0 ,404 FA N C C chr17 7577398 7577598 0,572 T P 53 ch r9 97887262 97887462 0 ,403 FA N C C chr17 7578196 7578426 0 ,563 T P 53 ch r9 97888682 97888882 0 ,423 FA N C C chr17 7578263 7578502 0 ,629 T P 53 ch r9 97897551 97897761 0 ,417 FA N C C chr17 7578283 7578494 0 ,637 T P 53 ch r9 97897761 97897961 0 ,313 FA N C C chr17 7578298 7578566 0 ,617 T P 53 ch r9 97912208 97912455 0 ,456 FA N C C chr17 7578299 7578502 0,642 T P 53 ch r9 97933298 97933498 0 ,363 FA N C C chr17 7578363 7578562 0 ,615 T P 53 ch r9 97934219 97934419 0 ,333 FA N C C chr17 7578363 7578598 0 ,597 T P 53 ch r9 98002823 98003043 0,321 FA N C C chr17 7579266 7579515 0 ,624 T P 53 ch r9 98009694 98009940 0 ,328 FA N C C chr17 7579311 7579460 0 ,620 T P 53 ch r9 98011375 98011575 0 ,418 FA N C C chr17 7579326 7579526 0 ,627 T P 53 ch r9 98011585 98011785 0 ,433 FA N C C chr17 7579332 7579550 0 ,616 T P 53 ch r9 98079868 98080148 0 ,669 FA N C C chr17 7579817 7579987 0 ,556 TP 53 chr9 100437190 100437390 0 ,428 X P A ch r17 7590681 7590919 0 ,573 TP 53 chr9 100437359 100437558 0 ,475 X P A ch r17 33426833 33427064 0 ,474 R A D 51D ch r9 100437525 100437765 0 ,299 X P A ch r17 33427044 33427283 0 ,500 R A D 51D ch r9 100437793 100437993 0 ,383 X P A ch r17 33427269 33427513 0 ,437 R A D 51D ch r9 100444474 100444677 0 ,397 X P A ch r17 33427477 33427725 0 ,518 R A D 51D ch r9 100447108 100447308 0 ,348 X P A ch r17 33427706 33427935 0 ,504 R A D 51D ch r9 100449321 100449540 0 ,309 X P A ch r17 33427916 33428162 0 ,498 R A D 51D ch r9 100451744 100451944 0 ,323 X P A ch r17 33428100 33428345 0 ,577 R A D 51D ch r9 100455831 100456031 0 ,328 X P A ch r17 33430196 33430419 0 ,567 R A D 51D ch r9 100459275 100459499 0 ,720 X P A ch r17 33430401 33430620 0 ,573 R A D 51D ch r9 100459396 100459601 0 ,728 X P A ch r17 33433344 33433506 0 ,564 R A D 51D ch r9 100459482 100459691 0 ,724 X P A ch r17 33433897 33434133 0 ,489 R A D 51D ch r9 100459482 100459695 0 ,720 X P A ch r17 33434295 33434532 0 ,500 R A D 51D ch r9 100459482 100459721 0,721 X P A Cr. In ic io Fin G C G en Cr. In ic io Fin G C G en
ch r17 33445499 33445672 0 ,586 R A D 51D ch rX 14861796 14861980 0 ,416 FA N C B chr17 33446550 33446780 0,662 R A D 51D ch rX 14861961 14862165 0,322 FA N C B chr17 37868175 37868423 0 ,606 E R B B 2 ch rX 14862588 14862788 0 ,368 FA N C B chr17 37868177 37868424 0 ,605 E R B B 2 ch rX 14862805 14863005 0 ,294 FA N C B chr17 37868184 37868432 0 ,614 E R B B 2 ch rX 14862977 14863177 0 ,358 FA N C B chr17 37868192 37868432 0,622 E R B B 2 ch rX 14863227 14863447 0 ,403 FA N C B chr17 41226314 41226567 0 ,433 BRCA1 ch rX 14868691 14868896 0 ,306 FA N C B chr17 41228463 41228682 0 ,368 BRCA1 ch rX 14871130 14871330 0 ,313 FA N C B chr17 41231290 41231560 0,432 BRCA1 ch rX 14875743 14875993 0 ,307 FA N C B chr17 41234185 41234455 0 ,435 BRCA1 ch rX 14877225 14877425 0 ,313 FA N C B chr17 41234392 41234631 0 ,438 BRCA1 ch rX 14877435 14877635 0 ,274 FA N C B chr17 41242906 41243146 0 ,444 BRCA1 ch rX 14882681 14882881 0 ,393 FA N C B chr17 41243450 41243690 0,411 BRCA1 ch rX 14882885 14883085 0 ,328 FA N C B chr17 41243675 41243921 0 ,397 BRCA1 ch rX 14883089 14883289 0 ,383 FA N C B chr17 41243914 41244153 0 ,433 BRCA1 ch rX 14883275 14883501 0,291 FA N C B chr17 41244048 41244300 0 ,368 BRCA1 ch rX 14883493 14883735 0 ,350 FA N C B chr17 41244075 41244265 0 ,366 BRCA1 ch rX 14887070 14887270 0 ,323 FA N C B chr17 41244473 41244712 0,371 BRCA1 ch rX 14890941 14891170 0 ,578 FA N C B chr17 41244534 41244778 0 ,376 BR CA1 ch rX 47426013 47426262 0 ,636 A R A F ch r17 41244766 41245013 0 ,387 BR CA1 ch rX 47426015 47426263 0 ,635 A R A F ch r17 41245011 41245240 0 ,409 BR CA1 ch rX 47426016 47426262 0 ,640 A R A F ch r17 41245209 41245462 0 ,374 BR CA1 ch rX 47426063 47426266 0 ,627 A R A F ch r17 41245347 41245586 0 ,404 BRCA1 ch rX 66765925 66766173 0 ,635 A R chr17 41245598 41245827 0 ,370 BRCA1 ch rX 66765934 66766173 0 ,638 A R chr17 41245825 41246064 0 ,375 BRCA1 ch rX 66766002 66766226 0,671 A R chr17 41246061 41246310 0 ,376 BRCA1 ch rX 66766013 66766226 0,682 A R chr17 41246304 41246553 0 ,416 BRCA1 ch rX 66931238 66931486 0,522 A R chr17 41246534 41246786 0 ,423 BRCA1 ch rX 66931245 66931461 0 ,525 A R chr17 41246546 41246786 0 ,427 BRCA1 ch rX 66931245 66931492 0 ,524 A R chr17 41246595 41246842 0 ,419 BRCA1 ch rX 66931246 66931484 0 ,523 A R chr17 41246643 41246890 0 ,403 BRCA1 ch rX 66937264 66937498 0 ,536 A R chr17 41246709 41246956 0 ,379 BRCA1 ch rX 66937327 66937559 0,532 A R chr17 41246794 41247027 0 ,338 BRCA1 ch rX 66937327 66937576 0 ,524 A R chr17 41247801 41248006 0 ,403 BRCA1 ch rX 66943491 66943695 0 ,468 A R chr17 41249211 41249311 0 ,356 BRCA1 ch rX 66943494 66943696 0 ,473 A R chr17 41251673 41251893 0 ,380 BRCA1 ch rX 66943515 66943684 0 ,476 A R chr17 41251732 41251945 0 ,397 BRCA1 ch rX 66943534 66943689 0 ,474 A R
Descripción detallada
La invención refiere a un método para analizar secuencias biomarcadoras tumorales que involucra un enriquecimiento basado en hibridación de determinadas regiones blanco a lo largo del genoma humano en un panel de determinaciones, seguido por la cuantificación, combinada con un nuevo p ip e lin e bioinformático y matemático. En la Figura 1, se muestra un resumen esquemático del método.
El enriquecimiento por hibridación en solución se ha usado en el pasado para enriquecer regiones específicas de interés antes de la secuenciación (véase, por ejemplo, Meyer, M y Kirchner, M. (2010) Cold Spring Harb. Protoc.
2010(6):pdbprot5448; Liao, G.J. et al. (2012) PLoS One 7:e38154; Maricic, T. et al. (2010) PLoS One 5:e14004; Tewhey, R. et al. (2009) Genome Biol. 10:R116; Tsangaras, K. et al. (2014) PLoS One 9:e109101; publicación de patente del PCT WO 2016/189388; publicación de patente estadounidense 2016/0340733; Koumbaris, G. et al. (2016) Clinical Chemistry, 62(6), pp.848-855). Sin embargo, en los métodos de la invención, las secuencias blanco (denominadas secuencias de captura de blancos o TACS) usadas para enriquecer regiones específicas de interés se han optimizado para maximizar la eficiencia, la especificidad y la exactitud y, además, en ciertas realizaciones se usan en familias de TACS, que comprenden múltiples miembros que se unen a la misma secuencia biomarcadora tumoral, pero con diferentes posiciones de inicio y/o fin, de modo que el enriquecimiento de las secuencias biomarcadoras tumorales de interés mejora significativamente en comparación con el uso de una única TACS que se une a la secuencia genómica. Un ejemplo de una configuración de tales familias de TACS se ilustra esquemáticamente en la Figura 3, que muestra que las diferentes posiciones de inicio y/o fin de los miembros de la familia de TACS cuando se unen a la secuencia genómica de interés dan lugar a un patrón de unión escalonado de los miembros de la familia.
Usar, dentro de la mezcla de TACS, familias de TACS que se unen a cada secuencia blanco de interés en lugar de usar una única TACS que se una a cada secuencia blanco de interés aumenta considerablemente el enriquecimiento de las secuencias blanco de interés, lo que se manifiesta como un aumento promedio superior al 50 % en la profundidad de lecturas obtenida con familias de TACS en comparación con TACS individuales. En el Ejemplo 5, se compara el uso de una familia de TACS y de una única TACS y se describe la mejora significativa en la profundidad de lecturas observada.
Detección de biomarcadores tumorales
Los métodos y kits de la divulgación se usan para el análisis de biomarcadores tumorales en muestras biológicas. Como se describió en detalle en los Ejemplos 6-9, los métodos de la invención pueden usarse para la detección de grandes paneles de biomarcadores tumorales con cargas tumorales de apenas 0,1 % y pueden detectar biomarcadores tumorales tanto en tejido tumoral como en muestras de biopsia líquida de pacientes con tumores. Así, en un aspecto, la invención refiere a un método para detectar uno o más biomarcadores tumorales en una muestra de a Dn de un sujeto que tiene o que presuntamente tiene un tumor, donde el método comprende:
(a) preparar una biblioteca de secuenciación a partir de la muestra de ADN; (b) hibridar la biblioteca de secuenciación a una mezcla de secuencias de captura de blancos (TACS) de hebra doble que se unen a una o más secuencias biomarcadoras tumorales de interés, donde: (i) cada secuencia miembro de la mezcla de TACS tiene entre 150 y 260 pares de bases de longitud, y cada secuencia miembro tiene un extremo 5' y un extremo 3'; (ii) preferentemente y opcionalmente, cada secuencia miembro se une a la secuencia biomarcadora tumoral de interés a una distancia de al menos 50 pares de bases, tanto en el extremo 5' como en el extremo 3', de regiones que presentan variaciones en el número de copias (CNV), duplicaciones segmentales o elementos de ADN repetitivo; (iii) el contenido de GC de la mezcla de TACS, que se determina calculando el contenido de GC de cada miembro de la mezcla de TACS, está entre el 19 % y el 80 %; (iv) la mezcla de TACS comprende múltiples familias de TACS, cada una dirigida a una secuencia biomarcadora tumoral de interés, donde cada familia de TACS comprende múltiples secuencias miembro, donde cada secuencia miembro se une a la misma secuencia biomarcadora tumoral de interés, pero tiene diferentes posiciones de inicio y/o fin con respecto a un sistema de coordenadas de referencia de la secuencia biomarcadora tumoral de interés, donde, opcionalmente, las posiciones de inicio y/o fin de las secuencias miembro dentro de una familia de TACS con respecto a un sistema de coordenadas de referencia del biomarcador tumoral están escalonadas por entre 5 y 10 pares de bases; (c) aislar aquellos miembros de la biblioteca de secuenciación que se unen a la mezcla de TACS para obtener una biblioteca enriquecida; (d) amplificar y secuenciar la biblioteca enriquecida; (e) alinear la biblioteca enriquecida a un genoma de referencia para obtener información sobre la profundidad de lecturas y recuentos alélicos; y (f) aplicar análisis estadísticos a las secuencias de la biblioteca enriquecida, opcionalmente usando solo fragmentos cuyo tamaño está dentro de un rango específico, para detectar el/los biomarcador(es) tumoral(es) en la muestra de ADN, donde la secuenciación de la biblioteca enriquecida proporciona una profundidad de lecturas de las secuencias genómicas de interés y profundidades de lecturas de loci de referencia y el análisis estadístico comprende aplicar un algoritmo que contrasta secuencialmente la profundidad de lecturas de los loci o de las secuencias genómicas de interés contra la profundidad de lecturas de los loci de referencia, donde el algoritmo comprende pasos para: (a) eliminar los loci secuenciados de forma inadecuada; (b) mitigar el sesgo inducido por el contenido de GC; y (c) determinar la condición genética; y/o donde la secuenciación de la biblioteca enriquecida provee el número y el tamaño de los fragmentos secuenciados correspondientes a coordenadas específicas de cada TACS y el análisis estadístico comprende aplicar un algoritmo que contrasta secuencialmente la proporción de tamaños de fragmentos de la secuencia genómica de interés contra la proporción de tamaños de fragmentos de los loci de referencia, donde el algoritmo comprende pasos para: (a) eliminar los valores atípicos de tamaños de fragmentos; (b) calcular la proporción de tamaños de fragmentos; y (c) determinar la condición genética.
En una realización, la mezcla de TACS comprende múltiples familias de TACS, donde cada miembro de una familia de TACS se une a la misma secuencia biomarcadora tumoral de interés, pero con diferentes posiciones de inicio y/o fin en la secuencia con respecto a un sistema de coordenadas de referencia (p. ej., la unión de los distintos miembros de la familia de TACS a la secuencia blanco está escalonada), de modo de enriquecer secuencias blanco de interés, seguido de una secuenciación paralela en masa y un análisis estadístico de la población enriquecida. Normalmente, el sistema de coordenadas de referencia que se usa para el análisis del ADN genómico es el genoma humano de referencia versión hg19, que está disponible públicamente en la técnica, aunque pueden usarse otras versiones. Como alternativa, el sistema de coordenadas de referencia puede ser un genoma artificial basado en la versión hg19 que contenga únicamente las secuencias genómicas de interés. En la Figura 2, se muestran ejemplos sin carácter taxativo de posiciones de inicio/fin de TACS que se unen a los cromosomas 13, 18, 21, X o Y. En la Figura 10, se muestran ejemplos sin carácter taxativo de posiciones de inicio/fin de TACS que se unen a NRAS en el cromosoma 1, PI3KCA en el cromosoma 3, EGFR en el cromosoma 7 o KRAS en el cromosoma 12 (como ejemplos sin carácter taxativo de biomarcadores tumorales).
El método basado en el enriquecimiento por TACS de la divulgación puede usarse para la detección de una amplia variedad de anomalías genéticas. En una realización, la anomalía genética es una aneuploidía cromosómica (como una trisomía, una trisomía parcial o una monosomía). En otras realizaciones, la anomalía genómica es una anomalía estructural, incluidas, sin carácter taxativo, las variaciones en el número de copias, incluidas las microdeleciones y las microduplicaciones, las inserciones, las translocaciones, las inversiones y las mutaciones pequeñas, incluidas las mutaciones puntuales y los perfiles de mutaciones. En otra realización, la anomalía genética es un mosaicismo cromosómico.
En las subsecciones que siguen, se describen otros aspectos y características de los métodos de la divulgación.
Diseño de las secuencias de captura de blancos
En la presente, los términos “secuencias de captura de blancos” o “TACS” hacen referencia a secuencias de ADN cortas que son complementarias a la(s) región/ones de interés en una o más secuencias genómicas de interés (p. ej., uno o más cromosomas de interés) y que se usan como “señuelo” para capturar y enriquecer la región de interés a partir de una biblioteca amplia de secuencias, como una biblioteca de secuenciación de genoma completo preparada a partir de una muestra biológica. Además de las características de las familias de TACS descritas anteriormente (p. ej., la unión escalonada a la secuencia genómica de interés), se usa para el enriquecimiento una mezcla de TACS, donde las secuencias dentro de la mezcla se han optimizado en relación con: (i) la longitud de las secuencias; (ii) la distribución de las TACS a lo largo de la(s) región/ones de interés; y (iii) el contenido de GC de las TACS. Asimismo, se ha optimizado la cantidad de secuencias dentro de la mezcla de TACS (tamaño de la mezcla).
Se ha descubierto que las TACS con una longitud de 150 a 260 pares de bases son óptimas para maximizar la eficiencia de enriquecimiento. En varias otras realizaciones, cada secuencia dentro de la mezcla de TACS tiene entre 150 y 260 pares de bases o entre 200 y 260 pares de bases de longitud. En realizaciones preferentes, la longitud de las TACS de la mezcla es de 250 pares de bases o 260 pares de bases.
La distribución de las TACS a lo largo de cada región o cromosoma de interés se ha optimizado para evitar, si corresponde, las repeticiones con alto número de copias, las repeticiones con bajo número de copias y las variantes en el número de copias, y, a la vez, poder direccionar la captura a polimorfismos de nucleótidos individuales (SNP) informativos para permitir la detección de las aneuploidías, la detección de variaciones en el número de copias y la estimación de la fracción de interés. Así, cada secuencia dentro de la mezcla de TACS está diseñada de manera tal que el extremo 5' y el extremo 3' se encuentran, cada uno, a una distancia de al menos 50 pares de bases de regiones en el genoma de las que se sabe que contienen uno o más de los siguientes elementos: variaciones en el número de copias (CNV), duplicaciones segmentales y/o elementos de ADN repetitivo (como transposones o zonas de repeticiones en tándem). En varias otras realizaciones, cada secuencia dentro de la mezcla de TACS está diseñada de manera tal que el extremo 5' y el extremo 3' se encuentran, cada uno, a una distancia de al menos 50, 100, 150, 200, 250, 300, 400 o 500 pares de bases de regiones en el genoma de las que se sabe que contienen uno o más de los elementos anteriores.
El término "variaciones en el número de copias" (CNV) es un término de la técnica que hace referencia a una forma de variante estructural del genoma humano en la cual existen alteraciones en el ADN del genoma de ciertos individuos que resultan en una cantidad menor o mayor a la normal de una o más secciones del genoma. Las CNV corresponden a regiones relativamente extensas del genoma que pueden haberse borrado (por ejemplo, una sección que normalmente es A-B-C-D puede ser A-B-D) o duplicado (por ejemplo, una sección que normalmente es A-B-C-D puede ser A-B-C-C-D). Las CNV representan aproximadamente el 13 % del genoma humano y el tamaño de cada variación varía entre aproximadamente 1 kilobase a varias megabases.
El término "duplicaciones segmentales" (o "repeticiones con bajo número de copias") también es un término de la técnica que refiere a bloques de ADN cuya longitud varía entre 1 y 400 kilobases que ocurren en más de una posición del genoma y que, por lo general, tienen un alto grado de identidad a nivel de secuencia (mayor del 90 %). Las duplicaciones segmentales se analizan, por ejemplo, en Eichler E.E. (2001) Trends Genet. 17:661-669.
El término "elementos de ADN repetitivo" (o "ADN repetitivo/repetido") también es un término de la técnica que refiere a patrones de ADN que ocurren en múltiples copias a lo largo del genoma. El término "elemento de ADN repetitivo" abarca las repeticiones terminales, las repeticiones en tándem y las repeticiones intercaladas, incluidos los transposones. Los elementos de ADN repetitivo en el marco de las tecnologías de NGS se analizan en más detalle, por ejemplo, en Todd, J. et al. (2012) Nature Reviews Genet. 13:36-46.
Las TACS están diseñadas con características específicas de contenido de GC con el fin de minimizar el sesgo inducido por el contenido de GC en los datos y permitir el uso de un pipeline de análisis de datos personalizado e innovador. Se ha determinado que las TACS con un contenido de GC del 19 al 80 % logran un enriquecimiento
óptimo y son las que muestran mayor rendimiento con el ADN libre. Dentro de una mezcla de TACS, diferentes secuencias pueden tener diferentes contenidos de GC porcentuales, pero, para ser incluida en la mezcla, el contenido de GC porcentual de cada secuencia, obtenido calculando el contenido de GC de cada miembro de cada
familia de TACS, debe encontrarse en el rango del 19 al 80 %. Eso significa que cada miembro de cada familia de
TACS tiene un contenido de GC porcentual dentro del rango porcentual dado (p. ej., un contenido de GC entre el
19 y el 80 %).
En algunas instancias, la mezcla de TACS (es decir, cada miembro de cada familia de TACS) puede seleccionarse
de manera de definir otro rango de contenido de GC porcentual que se considere más adecuado para la evaluación
de anomalías genéticas específicas. Algunos ejemplos de rangos de contenido de GC porcentual son, sin carácter taxativo, entre 19 % y 80 %, o entre 19 % y 79 %, o entre 19 % y 78 %, o entre 19 % y 77 %, o entre 19 % y 76 %, o entre 19 % y 75 %, o entre 19 % y 74 %, o entre 19 % y 73 %, o entre 19 % y 72 %, o entre 19 % y 71 %, o entre 19 % y 70 %, o entre 19 % y 69 %, o entre 19 % y 68 %, o entre 19 % y 67 %, o entre 19 % y 66 %, o entre 19 %
y 65 %, o entre 19 % y 64 %, o entre 19 % y 63 %, o entre 19 % y 62 %, o entre 19 % y 61 %, o entre 19 % y 60 %, o entre 19 % y 59 %, o entre 19 % y 58 %, o entre 19 % y 57 %, o entre 19 % y 56 %, o entre 19 % y 55 %, o entre 19 % y 54 %, o entre 19 % y 53 %, o entre 19 % y 52 %, o entre 19 % y 51 %, o entre 19 % y 50 %, o entre 19 %
y 49 %, o entre 19 % y 48 %, o entre 19 % y 47 %, o entre 19 % y 46 %, o entre 19 % y 45 %, o entre 19 % y 44 %,
o entre 19 % y 43 %, o entre 19 % y 42 %, o entre 19 % y 41 %, o entre 19 % y 40 %.
Según se describen en mayor detalle más abajo a propósito de una realización del análisis de datos, luego de la amplificación y secuenciación de las secuencias enriquecidas, los loci de prueba y los loci de referencia pueden aparearse o agruparse en función de su contenido de Gc porcentual (p. ej., los loci de prueba con un contenido de
GC porcentual del 40 % se aparean con loci de referencia con un contenido de GC porcentual del 40 %). Se apreciará que el procedimiento de apareamiento en función del contenido de GC porcentual podría permitir una variación leve en el rango de contenido de GC porcentual admitido para un apareamiento. Como ejemplo no
taxativo y con referencia al ejemplo descrito anteriormente, un locus de prueba con un contenido de GC porcentual
del 40 % podría aparearse con loci de referencia con un rango de contenido de GC porcentual entre el 39 y el 41 %, abarcando el contenido de GC porcentual del locus de prueba dentro de un rango adecuado.
Para preparar una mezcla de TACS con los criterios optimizados mencionados arriba en relación con el tamaño, la ubicación en el genoma humano y el contenido de GC porcentual, pueden aplicarse métodos manuales o computarizados conocidos en la técnica para el análisis del genoma humano de referencia. En una realización, se implementa un método semiautomático en el que primeramente se designan manualmente regiones basadas en
la versión 19 del genoma humano de referencia (hg19), de manera de evitar, si corresponde, las regiones repetitivas mencionadas, y, posteriormente, las regiones designadas se curan en relación con el contenido de GC
con ayuda de software que calcula el contenido de GC de cada región en función de sus coordenadas en la
versión 19 del genoma humano de referencia (hg19). En otra realización, se emplea software hecho a medida para
análisis estadísticos el genoma humano de referencia e identificar regiones adecuadas para TACS que cumplan
ciertos criterios, incluidos, sin carácter taxativo, criterios referidos al contenido de GC porcentual, la proximidad a
regiones repetitivas y/o la proximidad a otras TACS.
La cantidad de TACS en la mezcla se ha examinado y ajustado cuidadosamente para lograr el mejor equilibrio
entre la robustez de los resultados y el costo/la capacidad de la determinación. La mezcla generalmente contiene
800 o más TACS, pero puede incluir más; por ejemplo, 1500 o más TACS, 2000 o más TACS, 2500 o más TACS,
3500 o más TACS, o 5000 o más TACS. Se ha detectado que un número óptimo de TACS en la mezcla es de
5000. La persona razonablemente versada en la técnica apreciará que, por lo general, puede usarse una pequeña variación en el tamaño de la mezcla sin afectar los resultados (p. ej., la eliminación o el agregado de una pequeña
cantidad de TACS). Así, las cantidades de TACS de la mezcla que se indican en la presente deben considerarse
como "aproximadas", admitiendo una pequeña variación (p. ej., del 1 al 5 %) en su tamaño. Así, por ejemplo, un
tamaño de mezcla de "1600 secuencias" hace referencia a "aproximadamente 1600 secuencias", de manera que
también abarca, por ejemplo, 1590 secuencias o 1610 secuencias.
En vista de lo anterior, en otro aspecto, la invención provee un método para preparar una mezcla de TACS para
usar en el método de la invención para detectar el riesgo de una anomalía cromosómica y/u otra anomalía genética,
donde el método para preparar la mezcla de TACS comprende: seleccionar regiones en uno o más cromosomas
de interés que cumplan los criterios definidos arriba (p. ej., que se encuentren a una distancia de al menos 50 pares
de bases a cada extremo de las secuencias repetitivas mencionadas y que tengan un contenido de GC entre el
19 % y el 80 %, que se obtiene calculando el contenido de GC de cada miembro de cada familia de TACS); preparar cebadores que amplifiquen las secuencias que hibridan con las regiones seleccionadas; y amplificar las secuencias, donde cada secuencia tiene entre 100 y 500 pares de bases de longitud.
Para usar en los métodos de la divulgación, la mezcla de TACS normalmente se fija a un sustrato sólido, como a microesferas magnéticas recubiertas con una sustancia que se une a la biotina, como la estreptavidina o la avidina,
a fin de fijar la mezcla de TACS a un sustrato sólido. Otros sistemas de unión adecuados para fijar la mezcla de
TACS a un sustrato sólido (como microesferas o una columna) son conocidos para la persona versada en la técnica y están fácilmente disponibles en la técnica. Cuando se usan microesferas magnéticas como sustrato sólido, las secuencias que se unen a las TACS unidas a las microesferas pueden separarse magnéticamente de las secuencias que no se unen a las TACS.
Familias de TACS
En una realización, la mezcla de TACS comprende múltiples familias de TACS dirigidas a diferentes secuencias biomarcadoras tumorales de interés. Cada familia de TACS comprende múltiples miembros que se unen a la misma secuencia biomarcadora tumoral de interés, pero tienen diferentes posiciones de inicio y/o fin con respecto a un sistema de coordenadas de referencia de la secuencia genómica de interés. Normalmente, el sistema de coordenadas de referencia que se usa para el análisis del ADN genómico es el genoma humano de referencia versión hg19, que está disponible públicamente en la técnica, aunque pueden usarse también otros sistemas de coordenadas. Como alternativa, el sistema de coordenadas de referencia puede ser un genoma artificial creado a partir de sistemas de coordenadas disponibles públicamente, como, por ejemplo, la versión hg19 del genoma humano, que contenga únicamente las secuencias genómicas de interés. En la Figura 2, se muestran ejemplos sin carácter taxativo de posiciones de inicio/fin de TACS que se unen a los cromosomas 13, 18, 21, X o Y.
Cada familia de TACS comprende al menos 2 miembros que se unen a la misma secuencia genómica de interés. En varias realizaciones, cada familia de TACS comprende al menos 2 secuencias miembro, o al menos 3 secuencias miembro, o al menos 4 secuencias miembro, o al menos 5 secuencias miembro, o al menos 6 secuencias miembro, o al menos 7 secuencias miembro, o al menos 8 secuencias miembro, o al menos 9 secuencias miembro o al menos 10 secuencias miembro. En varias realizaciones, cada familia de TACS comprende 2 secuencias miembro, o 3 secuencias miembro, o 4 secuencias miembro, o 5 secuencias miembro, o 6 secuencias miembro, o 7 secuencias miembro, u 8 secuencias miembro, o 9 secuencias miembro o 10 secuencias miembro. En varias realizaciones, las múltiples familias de TACS comprenden diferentes familias que tienen diferentes números de secuencias miembro. Por ejemplo, una familia de TACS puede comprender una familia de TACS que comprende 3 secuencias miembro, otra familia de TACS que comprende 4 secuencias miembro, otra familia de TACS que comprende 5 secuencias miembro, y así. En una realización, una familia de TACS comprende entre 3 y 5 secuencias miembro. En otra realización, la familia de TACS comprende 4 secuencias miembro.
La mezcla de TACS comprende múltiples familias de TACS. En una realización, una mezcla de TACS comprende al menos 2 familias de TACS. En varias realizaciones, una mezcla de TACS comprende al menos 3 familias de TACS diferentes, o al menos 5 familias de TACS diferentes, o al menos 10 familias de TACS diferentes, o al menos 50 familias de TACS diferentes, o al menos 100 familias de TACS diferentes, o al menos 500 familias de TACS diferentes, o al menos 1000 familias de TACS diferentes, o al menos 2000 familias de TACS diferentes, o al menos 4000 familias de TACS diferentes o al menos 5000 familias de TACS diferentes.
Cada miembro de una familia de TACS se une a la misma región genómica de interés, pero con diferentes posiciones de inicio y/o fin con respecto a un sistema de coordenadas de referencia de la secuencia genómica de interés, de modo que el patrón de unión de los miembros de la familia de TACS es escalonado (por ejemplo, véase la Figura 3). En distintas realizaciones, las posiciones de inicio y/o fin están escalonadas por 5-10 pares de bases. En una realización, las posiciones de inicio y/o fin están escalonadas por 5 pares de bases. En otra realización, las posiciones de inicio y/o fin están escalonadas por 10 pares de bases.
Obtención y preparación de las muestras
Los métodos de la invención pueden usarse con diversas muestras biológicas. Esencialmente cualquier muestra biológica que contiene ADN, y en particular ADN libre (ADNl), puede usarse como muestra en los métodos, permitiendo el análisis genético del ADN en ellas. Por ejemplo, una muestra de sangre periférica entera puede obtenerse de un sujeto y el plasma puede obtenerse de la muestra de sangre entera mediante métodos estándar. Luego, puede extraerse el ADN libre total de la muestra mediante técnicas estándar, que incluyen, sin carácter taxativo, el protocolo Qiasymphony (Qiagen) adecuado para aislar ADN libre, así como cualquier otro método de extracción manual o automático adecuado para aislar a Dn libre.
Para la detección de biomarcadores tumorales, la muestra es una muestra biológica obtenida de un paciente que tiene o presuntamente tiene un tumor. En una realización, la muestra de ADN comprende ADN libre tumoral (ADNlt). En una realización, la muestra oncológica es una muestra de tejido (p. ej., de una biopsia tumoral). En otra realización, la muestra es orina, líquido peritoneal, líquido cefalorraquídeo o líquido de un derrame pleural del paciente. En otra realización, la muestra oncológica es una muestra de plasma del paciente, preparada a partir de la sangre periférica del paciente. Así, la muestra puede ser una muestra de biopsia líquida obtenida de forma no invasiva de una muestra de sangre del paciente, lo que podría permitir la detección temprana del cáncer antes de que se desarrolle un tumor detectable o palpable, o puede ser de un tejido canceroso o presuntamente canceroso.
En otra realización, la muestra oncológica es un tejido sano del paciente, como la capa leucoplaquetaria, que se prepara a partir de la sangre periférica del paciente, o un hisopado bucal o tejido sano adyacente al tumor u otra fuente de células sanas. Las células sanas pueden servir como una fuente de ADN que permita la detección de mutaciones en la línea germinal y su comparación con el ADN tumoral.
Para la preparación de la muestra biológica, generalmente se lisan las células y se extrae el ADN mediante técnicas estándar conocidas en la técnica, de las cuales un ejemplo, sin carácter taxativo, es el protocolo Qiagen DNeasy Blood and Tissue. En otra realización, el ADN libre se aísla a partir de plasma usando técnicas estándar, de las cuales un ejemplo, sin carácter taxativo, es el protocolo Qiasymphony (Qiagen).
Luego de aislarse, el ADN libre de la muestra se usa para construir una biblioteca de secuenciación cuyo fin es hacer la muestra compatible con una tecnología de secuenciación ulterior (por ejemplo, la secuenciación de última generación). En general, esto involucra la ligación de adaptadores a los extremos de los fragmentos de ADN libre, seguida por una amplificación. Hay kits para la preparación de bibliotecas de secuenciación disponibles comercialmente. En el Ejemplo 1, se describe en detalle un protocolo ejemplar —sin carácter taxativo— para la preparación de una biblioteca de secuenciación. En otra realización, el ADN nuclear (del cual un ejemplo, sin carácter taxativo, es el ADN extraído de tejido o de la capa leucoplaquetaria) se fragmenta con técnicas estándar. Sin carácter taxativo, un ejemplo de técnica de fragmentación es la sonicación. Luego, el ADN nuclear fragmentado se somete a los mismos procedimientos descritos en este párrafo para obtener ADN libre.
Enriquecimiento mediante hibridación de TACS
Para enriquecer la(s) región/ones de interés del/de los cromosoma(s) de interés (p. ej., las secuencias biomarcadoras tumorales), se hace hibridar la mezcla de TACS con la biblioteca de secuenciación y, a continuación, se aíslan las secuencias de la biblioteca de secuenciación que hibrida con las TACS. Para facilitar el aislamiento de las secuencias deseadas enriquecidas, las TACS generalmente se modifican de tal manera que las secuencias que hibridan con las TACS se pueden separar de aquellas que no hibridan con las TACS. En general, esto se logra fijando las TACS a un sustrato sólido. Esto permite la separación física de las secuencias que hibridan con las TACS de aquellas que no hibridan con las TACs . Por ejemplo, cada secuencia dentro de la mezcla de TACS puede marcarse con biotina, y la mezcla puede fijarse a microesferas recubiertas con una sustancia que se una a la biotina, como estreptavidina o avidina. En una realización preferente, las TACS se marcan con biotina y se unen a microesferas magnéticas recubiertas con estreptavidina. Sin embargo, la persona razonablemente versada en la técnica apreciará que existen otros sistemas de unión por afinidad conocidos en la técnica y que pueden usarse en lugar del sistema de biotina-estreptavidina/avidina. Por ejemplo, puede usarse un sistema basado en anticuerpos en el que las TACS se marquen con un antígeno y, luego, se unan a microesferas recubiertas con el anticuerpo correspondiente. Además, las TACS pueden incorporar en un extremo una secuencia marca y pueden fijarse a un sustrato sólido mediante una secuencia complementaria en el sustrato sólido que hibride con la secuencia marca. Por otra parte, además de microesferas magnéticas, pueden usarse otros tipos de sustratos sólidos, como microesferas poliméricas y otros similares.
En ciertas realizaciones, los miembros de la biblioteca de secuenciación que se unen a la mezcla de TACS son perfectamente complementarios a las TACS. En otras realizaciones, los miembros de la biblioteca de secuenciación que se unen a la mezcla de TACS son parcialmente complementarios a las TACS. Por ejemplo, en ciertas circunstancias, puede ser deseable utilizar y analizar datos provenientes de fragmentos de ADN que son productos del proceso de enriquecimiento, pero que no necesariamente pertenecen a las regiones genómicas de interés (es decir, tales fragmentos de ADN podrían unirse a las TACS a causa de homologías parciales [complementariedad parcial] con las TACS y, al ser secuenciados, producirían muy baja cobertura a lo largo del genoma en coordenadas que no sean las de las TACS).
Luego del enriquecimiento de la(s) secuencia(s) de interés con las TACS y la formación de la biblioteca enriquecida, los miembros de la biblioteca enriquecida se eluyen del sustrato sólido y se amplifican y secuencian mediante métodos estándar conocidos en la técnica. En general, se emplea la tecnología estándar de secuenciación de última generación, aunque pueden emplearse también otras tecnologías de secuenciación que provean no solo información de secuencia, sino también recuentos muy exactos. Detectar anomalías genéticas —incluidas, sin carácter taxativo, las aneuploidías o las variaciones estructurales en el número de copias— exige un recuento muy exacto, y la NGS es un tipo de tecnología que provee tal recuento muy exacto. Así, para la detección de anomalías genéticas, incluidas, sin carácter taxativo, las aneuploidías o las variaciones estructurales en el número de copias, pueden usarse otros métodos de recuento exactos, como la PCR digital y los microarreglos, en lugar de la NGS. En el Ejemplo 3, se describen en detalle protocolos ejemplares —sin carácter taxativo— para la amplificación y secuenciación de la biblioteca enriquecida.
Análisis de los datos
La información obtenida de la secuenciación de la biblioteca enriquecida puede analizarse mediante un innovador pipeline de análisis biomatemático/bioestadístico. En el Ejemplo 4, se presentan detalles de un ejemplo de un análisis realizado con este pipeline, y este se describe en más detalle a continuación. En la presente, también se proveen otros enfoques de análisis de datos para diferentes fines. Por ejemplo, en los Ejemplos 6 a 9 y en la sección siguiente sobre oncología, se describen enfoques de análisis de datos para analizar muestras oncológicas.
El pipeline de análisis que se describe en el Ejemplo 4 explota las características de las TACS, en tanto que la alta eficiencia de la captura de blancos permite una detección eficiente de aneuploidías o variaciones estructurales en el número de copias, así como otros tipos de anomalías genéticas. En el análisis, los fragmentos de ADN secuenciados de la muestra se alinean primeramente al genoma humano de referencia. Se emplean métricas de control de calidad para inspeccionar las propiedades de la muestra alineada y decidir si la muestra es apta para clasificación. Estas métricas de calidad pueden incluir, sin carácter taxativo, el análisis de patrones de enriquecimiento de los loci de interés, como, por ejemplo, la profundidad de secuenciación general de la muestra, el volumen de secuenciación específico de la muestra, el rendimiento de las TACS, el nivel esperado de sesgo inducido por el contenido de GC y la cuantificación de la fracción de interés. Para determinar el riesgo de una anomalía cromosómica en el ADN de la muestra, se emplea un algoritmo innovador. Los pasos del algoritmo incluyen, sin carácter taxativo, eliminar los loci secuenciados de forma inadecuada; extraer información relativa a la profundidad de lecturas y el tamaño de fragmentos en coordenadas específicas de las TACS; mitigar el sesgo inducido por el contenido de GC; y determinar la ploidía.
La determinación de la ploidía puede lograrse mediante uno o más métodos estadísticos, algunos de los cuales son, sin carácter taxativo, una prueba t, una prueba de remuestreo (bootstrap), una prueba de permutación, una prueba binomial de proporciones, métodos basados en segmentación y/o combinaciones de las anteriores. La persona razonablemente versada en la técnica apreciará que la selección y aplicación de pruebas estadísticas para incluir en una determinación de la ploidía se basa en la cantidad de puntos de datos disponibles. Así, la idoneidad de cada prueba viene dada por distintos factores como —sin carácter taxativo— la cantidad de TACS utilizadas y la correspondiente aplicación para mitigar el sesgo inducido por el contenido de GC, si corresponde. Así, los métodos mencionados deben considerarse como ejemplos de los tipos de análisis estadísticos que pueden emplearse y no son los únicos métodos adecuados para la determinación de la ploidía. En general, el método estadístico resulta en una puntuación asociada a la muestra combinada y se detecta el riesgo de la anomalía cromosómica en cuestión en el ADN cuando la puntuación de la muestra combinada se encuentra por encima de un valor umbral de referencia.
En particular, un aspecto de los análisis estadísticos involucra cuantificar y mitigar el sesgo inducido por el contenido de GC. Además del desafío de detectar pequeños cambios de señal en el ADN en la muestra combinada y/u otros componentes de ADN de interés que forman parte de una muestra combinada (por ejemplo, sin carácter taxativo, la presencia de más o menos material genético de ciertas regiones cromosómicas), el propio proceso de secuenciación introduce ciertos sesgos que pueden oscurecer la detección de la señal. Uno de tales sesgos es la secuenciación/amplificación preferente de las regiones genéticas en función de su contenido de GC. Por ello, ciertos métodos de detección — incluidos, sin carácter taxativo, los métodos basados en la profundidad de lecturas— deben tener en cuenta tal sesgo al momento de analizar los datos de secuenciación. Así, se debe cuantificar el sesgo en los datos y, posteriormente, se deben aplicar métodos adecuados que contemplen dicho sesgo de manera tal que las dependencias del contexto genético no puedan afectar los métodos estadísticos que pudieran usarse para cuantificar el riesgo de anomalías genéticas.
Por ejemplo, un método para cuantificar el sesgo inducido por el contenido de GC es aplicar la técnica de suavizado local ponderado de diagramas de dispersión (LOESS) a los datos de secuenciación. Cada locus blanco puede definirse por su profundidad de lecturas obtenidas en la secuenciación y su contenido de GC. Una recta de ajuste óptimo por estas dos variables sobre una gran cantidad de loci provee una estimación de la profundidad de lecturas de secuenciación esperada dado el contenido de GC. Una vez que se completa este paso de cuantificación del sesgo inducido por el contenido de GC, el siguiente paso es usar esta información para considerar posibles sesgos en los datos. Un método es normalizar la profundidad de lecturas de todos los loci respecto de su profundidad de lecturas esperada (en función del contenido de GC de cada locus). En principio, eso desvincula los datos de profundidad de lecturas de su contexto genético y torna todos los datos comparables. Así, los datos recuperados de regiones con distintos contenidos de GC, como, por ejemplo —sin carácter taxativo—, distintos cromosomas, se pueden usar en pruebas estadísticas ulteriores para la detección de anomalías. Así, mediante el procedimiento LOESS, el sesgo inducido por el contenido de GC se desvincula de los datos antes de la aplicación de las pruebas estadísticas. En una realización, el análisis estadístico de las secuencias de la biblioteca enriquecida comprende mitigar el sesgo de GC con un procedimiento LOESS.
En una realización alternativa, el sesgo inducido por el contenido de GC se cuantifica y mitiga agrupando los loci con contenidos de GC similares (equiparables). Así, conceptualmente, este método para mitigar el sesgo inducido por el contenido de GC comprende los tres pasos siguientes:
1) identificar y calcular el contenido de GC en las TACS;
2) mitigar/considerar el sesgo inducido por el contenido de GC mediante diversos procedimientos de apareamiento/agrupación de las TACS; y
3) calcular el riesgo de que distintas anomalías genéticas estén presentes en el feto aplicando métodos estadísticos y matemáticos a los conjuntos de datos resultantes del paso 2.
En el caso de la prueba t, el conjunto de datos se divide en dos grupos: los lo c i de prueba y los lo c i de referencia. Por cada grupo, se crean subconjuntos de grupos en los que los loci se categorizan de acuerdo con su contenido de GC, como se ilustra en el ejemplo no taxativo de la Tabla 1, a continuación:
Tabla 1
Figure imgf000031_0001
La persona razonablemente versada en la técnica apreciará que la creación de subgrupos puede abarcar un rango de contenidos de GC adecuados y/o un subconjunto de lo c i definidos por un contenido de GC y/o un rango de contenido de GC dados. Así, el contenido de GC porcentual dado en el ejemplo no taxativo de la Tabla 1 debe considerarse “aproximado”, admitiendo una leve variación (p. ej., 1 o 2 %). Así, por ejemplo, un contenido de GC porcentual del “40 %” pretende hacer referencia a “aproximadamente el 40 %”, de tal manera que, por ejemplo, también podrían estar comprendidos los lo c i con contenidos de GC en el rango del 39 % al 41 % si se considera pertinente.
Así, cuando se hace referencia a un contenido de GC particular, se entiende que los subgrupos de lo c i de prueba y de referencia pueden comprender cualquier cantidad de lo c i relacionados con un contenido de GC porcentual y/o rango particulares.
Posteriormente, por cada subgrupo de contenido de GC, se calcula una profundidad de lecturas representativa. Para ello, se pueden usar distintos métodos, incluidos, sin carácter taxativo, la media, la mediana o la moda de caja conjunto. Así, se crean dos vectores de profundidades de lecturas representativas, donde uno corresponde a los lo c i de referencia y el otro a los lo c i de prueba (p. ej., Xm e Ym). En una realización, ambos vectores pueden contrastarse entre sí para identificar diferencias significativas en la profundidad de lecturas. En otra realización, la diferencia entre ambos vectores puede usarse para evaluar si hay discrepancias considerables entre los lo c i de referencia y los lo c i de prueba. Se le atribuye a la muestra la puntuación que arroja la prueba.
En el caso de los análisis estadísticos con un enfoque de remuestreo, el conjunto de datos se divide primero en dos grupos: los lo c i de prueba y los lo c i de referencia. Entonces, se calcula el contenido de GC de cada locus. Luego, se realiza el siguiente procedimiento:
Se selecciona un lo cu s al azar de entre los lo c i de referencia y se registran su profundidad de lecturas y su contenido de GC. Posteriormente, se selecciona un lo cu s al azar de entre los lo c i de prueba, con la única condición de que su contenido de GC sea similar al del lo c u s de referencia. Se registra su profundidad de lecturas. La persona razonablemente versada en la técnica apreciará que la similitud entre los contenidos de GC puede abarcar un rango de contenidos de GC adecuados. Así, la referencia a un contenido de GC porcentual específico puede considerarse “aproximada”, “próxima” o “dentro de un rango adecuado” (p. ej., 1 a 2 %) que incluya el contenido de GC porcentual específico investigado. De este modo, se crea un par de lo c i de referencia y de prueba con contenidos de GC similares. Se registra la diferencia del par de lo c i de referencia y de prueba, notada E1. Luego, los lo c i se regresan a sus grupos respectivos. Este proceso se repite hasta crear una muestra de remuestreo del mismo tamaño que la cantidad de TACS de prueba presentes. Entonces, se estima y se registra una profundidad de lecturas representativa de la muestra de remuestreo, notada E_mu. Para ello, se pueden usar distintos métodos, incluidos, sin carácter taxativo, la media, la moda o la mediana del vector, y/o múltiplos de dichos valores.
El proceso descrito anteriormente se repite tantas veces como sea necesario y se crea una distribución de E_mu. Luego, se atribuye a la muestra una puntuación que corresponde a un percentil de esta distribución.
En el caso de los análisis estadísticos con una prueba de permutación, el conjunto de datos se ordena primero en dos grupos: los lo c i de prueba y los lo c i de referencia. Por cada grupo, se crean subconjuntos de grupos en los que los lo c i se categorizan de acuerdo con la similitud en sus contenidos de GC (véanse las columnas 2 y 3 del ejemplo no taxativo de la Tabla 2, a continuación). También se registra la cantidad de lo c i presentes en cada subgrupo de prueba. Los lo c i del grupo de prueba se usan para estimar la profundidad de lecturas del grupo de prueba, notada Yobs. Para hacerlo, puede seleccionarse un número representativo de cada subgrupo de contenido de GC. Para obtener una estimación de la profundidad de lecturas se pueden usar distintos métodos, incluidos, sin carácter taxativo, la media, la mediana o la moda de los lo c i seleccionados.
Tabla 2
Figure imgf000032_0001
Luego, se crea una distribución de los valores Yobs de prueba usando indistintamente lo c i que provengan del grupo de prueba o del grupo de referencia, tal como se explica a continuación. Los lo c i de prueba y de referencia de cada subgrupo de contenido de GC (véase la última columna del ejemplo de la Tabla 2) se combinan para permitir calcular una nueva estimación de la profundidad de lecturas. De cada subgrupo combinado, se escoge una cantidad de lo c i al azar, cantidad acotada superiormente por la cantidad de lo c i de prueba usados en el cálculo original de Yobs (p. ej., en el caso de un contenido de GC del 40 % y en el contexto del ejemplo no taxativo de la Tabla 2, esta cantidad de lo c i puede estar en el rango [1,ny40]). La nueva estimación de la profundidad de lecturas se calcula a partir de todos los lo c i seleccionados. El procedimiento se repite tantas veces como sea necesario para construir una distribución de las medias observadas. Luego, se le atribuye a una muestra una puntuación que corresponde a la posición de Yobs en esta distribución, usando una transformación adecuada que tiene en cuenta los momentos de la distribución construida. Al igual que con los métodos descritos anteriormente, se apreciará que se admite una ligera variación en el contenido de GC porcentual (p. ej., 1 a 2 %) si se considera adecuado. Así, la referencia a un contenido de GC específico puede interpretarse como “aproximada”, de manera que, por ejemplo, al hacer referencia a un contenido de GC del 40 %, el método puede utilizar los lo c i que tengan un contenido de GC de “aproximadamente” el 40 % (p. ej., entre el 39 y el 41 %).
En el caso del análisis estadístico con una prueba binomial de proporciones, se emplean los tamaños de fragmentos alineados a coordenadas genómicas específicas de los TACS. Hay evidencia en la literatura de que ciertos tipos específicos de cáncer pueden estar caracterizados por y/o asociados con fragmentos en el plasma que tienen un tamaño menor al tamaño esperado de los fragmentos provenientes de tejidos sanos (Jiang et al., (2015), Proceedings of the National Academy of Sciences, 112(11), pp. E1317-E1325). La misma hipótesis vale en el caso de los fragmentos que se originan en la placenta o el feto. Específicamente, se ha demostrado que los fragmentos de material genético acelular provenientes de la placenta tienden a ser de menor tamaño que los de otros tipos de material genético acelular (Chan, K.C. (2004) Clin. Chem.50:88-92). Así, el estadístico de interés es si la proporción de fragmentos pequeños alineados a una región de prueba específica de una TACS se aparta significativamente de lo que se espera en comparación con la proporción respectiva de otras regiones de referencia específicas de TACS, lo que indicaría una anomalía genética fetal.
De este modo, los tamaños de fragmentos se dividen en dos grupos. Los tamaños relacionados con los lo c i de prueba se asignan a un grupo y los tamaños de fragmentos relacionados con los lo c i de referencia se asignan al otro grupo. Posteriormente, en cada grupo, los tamaños de fragmentos se distribuyen en dos subgrupos, donde los fragmentos pequeños se asignan a un subgrupo y todos los fragmentos restantes se asignan al otro subgrupo. El último paso es calcular la proporción de fragmentos pequeños en cada grupo y usar estas cantidades en una prueba binomial de proporciones. La puntuación de la prueba se atribuye a la muestra investigada.
El resultado final de una muestra puede asignarse combinado una o más puntuaciones derivadas de los diferentes métodos estadísticos, ejemplos no taxativos de lo cual se muestran en el Ejemplo 4.
En el caso de los análisis estadísticos basados en métodos de segmentación, se obtiene la profundidad de lecturas y la composición de la secuencia de regiones genómicas de tamaño fijo que no se solapan entre sí. En el conjunto de datos que se obtiene, el sesgo en la profundidad de lecturas inducido por el contenido de GC se puede mitigar, sin carácter taxativo, usando un método de ajuste polinómico para estimar la profundidad de lecturas estimada de las regiones en función de su contenido de Gc . Luego, se usa el valor esperado, que depende del contenido de GC, para normalizar las regiones mediante métodos adecuados conocidos para la persona versada en la técnica. Posteriormente, el conjunto de datos normalizado se procesa mediante una o más rutinas de clasificación basadas en la segmentación. Para ello, los algoritmos procesan puntos de datos consecutivos para detectar la presencia de variaciones en la profundidad de lecturas, que se manifiestan como “saltos” o “caídas” respecto de los puntos de datos circundantes. En función de la rutina de segmentación empleada, se les asigna a los puntos de datos una puntuación que se usa para asignar la pertenencia a segmentos con profundidades de lecturas de desempeño similar. Por ejemplo, los puntos de datos consecutivos con valores de puntuación dentro de un rango adecuado podrían clasificarse como un segmento, mientras que los puntos de datos consecutivos con valores de puntuación que superaran umbrales definidos podrían asignarse a otro segmento.
Usos oncológicos
En varias realizaciones, el método de enriquecimiento basado en TACS de la divulgación puede usarse para diversos fines en el campo de la oncología. Como se describe en detalle en los Ejemplos 6-9, el método permite la detección de biomarcadores tumorales (incluidas las mutaciones en la línea germinal relacionadas con el cáncer) en muestras biológicas. El método puede aplicarse al análisis de esencialmente cualquier biomarcador tumoral conocido. Hay un extenso catálogo de mutaciones asociadas con el cáncer conocidas en la técnica llamado COSMIC (sigla en inglés de Catálogo de mutaciones somáticas en cáncer). Este se describe, por ejemplo, en Forbes, S.A. et al. (2016) Curr. Protocol Hum. Genetic 91:10.11.1-10.11.37; Forbes, S.A. et al. (2017) Nucl. Acids Res.45:D777-D783; y Prior et al. (2012) Cancer Res. 72:2457-2467. La base de datos COSMIC está disponible públicamente en www.cancer.sanger.ac.uk. La base de datos incluye oncogenes que se han asociado con distintos tipos de cáncer, cualquiera de los cuales puede analizarse mediante el método de la divulgación. Además del catálogo COSMIC, se han descrito en la técnica otras compilaciones de biomarcadores tumorales, algunas de los cuales son, sin carácter taxativo, el Proyecto ENCODE, que describe las mutaciones en los sitios de regulación de los oncogenes (véase, p. ej., Shar, N.A. et al. (2016) Mol. Canc. 15:76) y ClinVar, una base de datos del Centro Nacional de Información Biotecnológica (NCBI) que recoge variaciones genómicas asociadas con la salud humana. La base de datos ClinVar está disponible públicamente en www.ncbi.nlm.nih.gov/clinvar.
Los métodos de la invención pueden usarse para analizar simultáneamente un amplio panel de biomarcadores tumorales en una única muestra biológica. Por ejemplo, en varias realizaciones, la mezcla de TACS usada en el método detecta al menos 5, al menos 10, al menos 15, al menos 20, al menos 25, al menos 30, al menos 35, al menos 40, al menos 45 o al menos 50 biomarcadores tumorales diferentes.
Para la detección de biomarcadores tumorales, se diseñan TACS sobre la base de los criterios de diseño que se describen en la presente, de las secuencias conocidas de los genes biomarcadores tumorales y de las mutaciones genéticas en ellos asociadas con el cáncer. En una realización, múltiples familias de TACS usadas en el método se unen a múltiples secuencias biomarcadoras tumorales de interés seleccionadas de entre el grupo que comprende ABL, AKT, AKT1, ALK, APC, AR, ARAF, ATM, BAP1, BARD1, BCL, BMPR1A, BRAF, BRCA, BRCA1, BRCA2, BRIP1, CDH1, CDKN, CHEK2, CTNNB1, DDB2, DDR2, DICER1, EGFR, EPCAM, ErbB, ErcC, ESR1, FANCA, FANCB, FANCC, FANCD2, FANCE, FANCF, FANCG, FANCI, FANCL, FANCM, FBXW7, FGFR, FLT, FLT3, FOXA1, FOXL2, GATA3, GNA11, GNAQ, GNAS, GREM1, HOX, HOXB13, HRAS, IDH1, JAK, JAK2, KEAP1, KIT, KRAS, MAP2Ks, MAP3Ks, MET, MLH1, MPL, MRE11A, MSH2, MSH6, MTOR, MUTYH, NBN, NPM1, NRAS, NTRK1, PALB2, PDGFRs, Pl3KCs, PMS2, POLD1, POLE, POLH, PTEN, RAD50, RAD51C, RAD51D, RAF1, RB1, RET, RUNX1, SLX4, SMAD, SMAD4, SMARCA4, SPOP, STAT, STK11, TP53, VHL, XPA, XPC y combinaciones de las anteriores.
En una realización, las múltiples familias de TACS empleadas en el método se unen a múltiples secuencias de interés biomarcadoras tumorales seleccionadas de entre el grupo que —sin carácter taxativo— consiste de EGFR_6240, KRAS_521, EGFR_6225, NRAS_578, NRAS_580, PIK3CA_763, EGFR_13553, EGFR_18430, BRAF_476, KIT_1314, NRAS_584, EGFR_12378 y combinaciones de las anteriores.
En la Figura 10, se muestran ejemplos representativos sin carácter taxativo de posiciones cromosómicas de inicio y fin de TACS de amplificación que se unen a genes biomarcadores tumorales representativos, pero sin carácter taxativo: NRAS en el cromosoma 1, PI3KCA en el cromosoma 3, EGFR en el cromosoma 7 y KRAS en el cromosoma 12. Otras posiciones cromosómicas de inicio y fin para las TACS de amplificación, tanto para estos oncogenes como para otros, pueden ser fácilmente identificadas por una persona razonablemente versada en la técnica sobre la base de las enseñanzas de la presente.
En una realización del método, luego de la secuenciación de la biblioteca, la preparación y el enriquecimiento de las secuencias de interés mediante la hibridación de las TACS, el paso posterior de amplificar la biblioteca enriquecida se realiza en presencia de secuencias de bloqueo que inhiben la amplificación de secuencias no mutantes. Así, se sesga la amplificación hacia las secuencias biomarcadoras tumorales mutantes.
La mezcla de TACS y las familias de TACS usadas en el método para detectar biomarcadores tumorales pueden incluir cualquiera de las características de diseño que se describen en la presente en relación con el diseño de las TACS. Por ejemplo, en varias realizaciones, cada familia de TACS comprende al menos 2, al menos 3, al menos 4 o al menos 5 secuencias miembro diferentes. En una realización, cada familia de TACS comprende entre 4 secuencias miembro diferentes. En varias realizaciones, las posiciones de inicio y/o fin de las secuencias miembro dentro de una familia de TACS con respecto a un sistema de coordenadas de referencia están escalonadas por al menos 5 pares de bases, o por al menos 10 pares de bases, o por entre 5 y 10 pares de bases. En varias realizaciones, la mezcla de TACS comprende al menos 5, o al menos 10 o al menos 50 o al menos 100 familias de TACS diferentes, o más.
En los Ejemplos 6 a 9, se describen en más detalle análisis estadísticos adecuados para usar con muestras oncológicas y para la detección de biomarcadores tumorales.
El método para la detección de biomarcadores tumorales puede usarse en diversas situaciones clínicas en el campo de la oncología. Por ejemplo, el método puede usarse para realizar un diagnóstico inicial de cáncer en un sujeto que presuntamente padece la enfermedad. Así, en una realización, el método comprende, además, hacer un diagnóstico del sujeto sobre la base de la detección de al menos una secuencia biomarcadora tumoral.
Además, el método puede usarse para seleccionar un régimen de tratamiento adecuado para un paciente a quien se le ha diagnosticado cáncer, donde el régimen de tratamiento está diseñado para ser efectivo contra un tumor que tiene los biomarcadores tumorales detectados en el tumor del paciente (lo que se conoce en la técnica como medicina personalizada). Así, en otra realización, el método comprende, además, seleccionar un régimen de tratamiento para el sujeto sobre la base de la detección de al menos una secuencia biomarcadora tumoral.
Más aún, el método puede usarse para vigilar la eficacia de un régimen de tratamiento, donde los cambios en la detección de biomarcadores tumorales se usan como un indicador de la eficacia del tratamiento. Así, en otra realización, el método comprende, además, vigilar la eficacia de un régimen de tratamiento brindado al sujeto sobre la base de la detección de al menos una secuencia biomarcadora tumoral.
Además, el método puede usarse para detectar una recidiva y una leucemia mínima residual (MRD), donde la detección de al menos un biomarcador tumoral se usa como indicador de las células tumorales remanentes en un paciente luego del tratamiento o de la reincidencia de un tumor. Así, en otra realización, el método también informa sobre la MRD y la recidiva de la enfermedad.
Además, el método puede usarse para detectar mutaciones en la línea germinal (hereditarias) en pacientes con cáncer o individuos que presuntamente padecen un síndrome de predisposición al cáncer, donde la detección de al menos una mutación en la línea germinal se usa como indicador de que el individuo padecen un síndrome de predisposición al cáncer. Así, en otra realización, el método comprende, además, diagnosticar a un paciente o un individuo con un síndrome de predisposición al cáncer, diagnóstico en el que el clínico puede basarse para determinar una intervención médica temprana, seleccionar el tratamiento y realizar un seguimiento atento.
Análisis basado en fragmentos
En otro aspecto, la invención refiere al análisis basado en fragmentos de muestras, que se describe en mayor detalle en el Ejemplo 9. Hay evidencia en la literatura de que ciertos tipos específicos de cáncer pueden estar caracterizados por y/o asociados con fragmentos en el plasma que tienen un tamaño menor al tamaño esperado de los fragmentos provenientes de tejidos sanos (Jiang et al, (2015), Proceedings of the National Academy of Sciences, 112(11), pp. E1317-E1325). La misma hipótesis vale en el caso de los fragmentos que se originan en la placenta o el feto. Específicamente, los fragmentos derivados de la placenta suelen ser de menor tamaño que los que se originan de tejidos/células maternos. Con base en ello, se desarrolló y evaluó una prueba basada en los tamaños de los fragmentos, demostrándose su capacidad de identificar muestras que tienen anomalías cromosómicas.
La detección basada en fragmentos puede usarse para detectar anomalías en muestras combinadas con baja relación señal-ruido (como en el caso de la detección del cáncer).
Así, en una realización, se utiliza una prueba basada en fragmentos para detectar la presencia de aberraciones en el número de copias somáticas en una muestra de un paciente que presuntamente tiene cáncer. Por ejemplo, puede usarse una prueba binomial de proporciones, como se describe en el Ejemplo 4 y en el Ejemplo 9, para la detección de un aumento en la presencia de material de ácidos nucleicos proveniente de tejido no sano (p. ej., tejido tumoral) sobre la base del tamaño de los fragmentos. En particular, bajo la hipótesis nula de que la distribución de tamaños de fragmentos provenientes de células saludables y cancerosas es la misma, se puede usar una prueba binomial de proporciones (como se describe en el Ejemplo 4 y en el Ejemplo 9) con corrección de continuidad para cuantificar cualquier evidencia en contrario.
EJEMPLOS
La presente invención se ilustra en mayor detalle mediante los siguientes ejemplos, pero no se debe interpretar que estos ejemplos limiten el alcance de la invención.
Ejemplo 1: Obtención de las muestras y preparación de las bibliotecas
En la Figura 1, se muestra de forma esquemática la metodología general para el enfoque de análisis paralelo multiplexado basado en TACS para la evaluación genética. En este ejemplo, se describen métodos para recolectar y procesar una muestra de plasma materno (que contiene ADN materno y fetal), seguido de la preparación de la biblioteca de secuenciación para su uso en la metodología de la Figura 1. La muestra de ADN y la preparación de las bibliotecas que se describen aquí pueden usarse de forma similar con muestra de ADN de tumores para la detección de biomarcadores tumorales (véanse los Ejemplos 6 a 9).
Obtención de las muestras
Se obtuvieron muestras de plasma anónimas de mujeres embarazadas luego de la 10.a semana de gestación. Los protocolos empleados para la obtención de muestras para nuestro estudio fueron aprobados por el Comité de Bioética Nacional de Chipre y se obtuvo el consentimiento informado de todas las participantes.
Extracción de las muestras
Se extrajo ADN acelular de 2 a 4 ml de plasma de cada individuo mediante un método de extracción manual o automático adecuado para aislar ADN acelular, como, por ejemplo —sin carácter taxativo—, el protocolo Qiasymphony adecuado para asilar ADN fetal libre (Qiagen) (Koumbaris, G. et al. (2016) Clinical Chemistry, 62(6), pp.848-855).
Preparación de las bibliotecas de secuenciación
El ADN extraído de las muestras de plasma materno se usó para la construcción de bibliotecas de secuenciación. Se usaron métodos estándar de preparación de las bibliotecas, con las siguientes modificaciones. Se preparó una biblioteca de extracción independiente como control negativo para evaluar toda contaminación introducida durante el experimento. Durante este paso, las salientes 5' y 3' se rellenaron agregando 12 unidades de polimerasa T4 (NEB) y se incorporaron fosfatos 5' usando 40 unidades de polinucleótido quinasa T4 (NEB) en una reacción de 100 pl con posterior incubación a 25 °C durante 15 minutos y, luego, 12 °C durante 15 minutos. Los productos de reacción se purificaron con el kit MinElute (Qiagen). Posteriormente, los adaptadores P5 y P7 (véase la sección sobre la preparación de los adaptadores) diluidos 1:10 se ligaron a ambas reacciones de relleno con 16 unidades de polimerasa Bst (NEB) en una reacción de 40 pl con posterior incubación a 65 °C durante 25 minutos y, luego, a 12 °C durante 20 minutos. Los productos se purificaron con el kit MinElute (Qiagen). La amplificación de las bibliotecas se realizó con una polimerasa Fusion (Herculase II Fusion DNA polymerase de Agilent Technologies o Pfusion High Fidelity Polymerase de NEB) en reacciones de 50 pl con las siguientes condiciones de termociclado: 95 °C durante 3 min; seguido por 10 ciclos de 95 °C durante 30 s, 60 °C durante 30 s y 72 °C durante 30 s; y, por último, 72 °C durante 3 min (Koumbaris, G. et al. (2016) Clinical Chemistry, 62(6), pp.848-855). Los productos finales de las bibliotecas se purificaron con el kit de purificación MinElute (Qiagen) y se midieron por espectrofotometría.
Preparación de los adaptadores
Se prepararon mezclas de hibridación de los adaptadores P5 y P7 por separado y se las incubó durante 10 s a 95 °C, seguido por una rampa de 95 °C a 12 °C a razón de 0,1° C/s. Las reacciones de P5 y P7 se combinaron para obtener una mezcla de adaptadores lista para usar (100 pM de cada adaptador). Las mezclas de hibridación se prepararon de la siguiente manera. La mezcla de reacción P5 contenía el adaptador P5_F (500 pM) a una concentración final de 200 pM y el adaptador P5+P7_R (500 pM) a una concentración final de 200 pM, con una solución amortiguadora de hibridación de oligonucleótidos en concentración 1 X. Por su parte, la mezcla de reacción P7 contenía el adaptador P7_F (500 pM) a una concentración final de 200 pM y el adaptador P5+P7_R (500 pM) a una concentración final de 200 pM, con una solución amortiguadora de hibridación de oligonucleótidos en concentración 1 X (Koumbaris, G. et al. (2016) Clinical Chemistry, 62(6), pp.848-855). Las secuencias fueron las siguientes, donde * representa un enlace fosforotioato (PTO) (Integrated dNa Technologies):
adaptador P5_F:
A*C*A*C*TCTTTCCCTACACGACGCTCTTCCG*A*T*C*T (ID DE SEC. N.°: XX)
adaptador P7_F:
G*T*G*A*CTGGAGTTCAGACGTGTGCTCTTCCG*A*T*C*T (ID DE SEC. N.°: YY)
adaptador P5+ P7_R:
A*g*a*T*CGGAA*G*A*G*C (ID DE SEC. N.°: ZZ).
Ejemplo 2: Diseño y preparación de secuencias de captura de blancos (TACS)
En este ejemplo, se describe la preparación de TACS personalizadas para la detección de anomalías cromosómicas totales o parciales en los cromosomas 13, 18, 21, X, Y o cualquier otro, así como otras anomalías genéticas, incluidas, sin carácter taxativo, síndromes asociados con microdeleciones o microduplicaciones, translocaciones, inversiones, inserciones y otras mutaciones puntuales o pequeñas. Los lo c i genómicos blanco usados para el diseño de las TACS se seleccionaron en función de su contenido de GC y su distancia a elementos repetitivos (distancia mínima de 50 bp). El tamaño de las TACS puede ser variable. En una realización del método, el tamaño de las TACS varía entre 100 y 500 bp y las TACS se generan mediante un método basado en la reacción en cadena de la polimerasa (PCR), que se describe a continuación. Las TACS se prepararon mediante una PCR símplex con polimerasa Taq estándar, cebadores diseñados para amplificar los lo c i blanco y ADN normal como molde. En la Figura 2, se muestran las regiones cromosómicas usadas para diseñar cebadores para amplificar lo c i adecuados en los cromosomas 13, 18, 21 y X, con el fin de preparar la mezcla de TACS para el análisis de los cromosomas 13, 18, 21 y X.
Todas las TACS personalizadas se generaron empleando las siguientes condiciones de termociclado: 95 °C durante 3 minutos; 40 ciclos de 95 °C durante 15 segundos, 60 °C durante 15 segundos, 72 °C durante 12 segundos; y 72 °C durante 12 segundos, seguido por la verificación mediante electroforesis en gel de agarosa y purificación mediante kits estándar de limpieza de productos de PCR, como el Qiaquick PCR Purification Kit (Qiagen), el NucleoSpin 96 PCR Clean-up Kit (Macherey-Nagel) o el kit Agencourt AMPure XP for PCR Purification (Beckman Coulter). La concentración se midió con un instrumento NanoDrop (Thermo Scientific).
Ejemplo 3: Hibridación de las TACS y amplificación
En este ejemplo, se describen los pasos que se ilustran esquemáticamente en la Figura 1: captura de blancos por hibridación con TACS, seguida de la cuantificación de las secuencias capturadas mediante secuenciación de última generación (NGS).
Biotinilación de las TACS
Las TACS se prepararon para su hibridación de acuerdo con un protocolo descrito anteriormente (Koumbaris, G. et al. (2016) Clinical Chemistry, 62(6), pp.848-855). Se comenzó por obtener extremos romos con el kit Quick Blunting Kit (NEB) y una incubación a temperatura ambiente durante 30 minutos. Posteriormente, los productos de la reacción se purificaron con el kit MinElute (Qiagen) y se ligaron a un adaptador de biotina mediante el kit Quick Ligation Kit (NEB) en una reacción de 40 pl a temperatura ambiente durante 15 minutos. Los productos de la reacción se purificaron con el kit MinElute (Qiagen) y se desnaturalizaron para obtener ADN de hebra simple antes de su inmovilización en microesferas magnéticas recubiertas con estreptavidina (Invitrogen).
Hibridación de TACS
Las bibliotecas amplificadas se mezclaron con oligonucleótidos de bloqueo (Koumbaris, G. et al. (2016) Clinical Chemistry, 62(6), pp.848-855) (200 pM), 5 pg de ADN Cot-1 (Cot-1 DNA, Invitrogen), 50 pg de ADN de esperma de salmón (Salmon Sperm DNA, Invitrogen), buffer de hibridación Agilent en concentración 2 X y agente bloqueador Agilent en concentración 10 X, y se calentaron a 95 °C durante 3 min para desnaturalizar las hebras de AdN. Luego de la desnaturalización, se realizó una incubación durante 30 minutos a 37 °C para bloquear los elementos repetitivos y las secuencias de los adaptadores. La mezcla resultante se agregó a las TACS biotiniladas. Todas las muestras se incubaron en un incubador giratorio durante 12 a 48 h a 66 °C. Luego de la incubación, las microesferas se lavaron como se describió anteriormente y el ADN se eluyó por calentamiento (Koumbaris, G. et al. (2016) Clinical Chemistry, 62(6), pp.848-855). Los productos eluidos se amplificaron con cebadores de adaptadores dirigidos hacia fuera. Los productos amplificados enriquecidos se combinaron de forma equimolar y se secuenciaron en una plataforma adecuada.
Si corresponde, la amplificación puede sesgarse a favor de secuencias específicas/deseadas. En una realización del método, esto se hace cuando la amplificación se realiza en presencia de secuencias que hibridan con la secuencia de interés no deseada y, de este modo, bloquean la acción de la enzima polimerasa durante el proceso. Así, la acción de la enzima de amplificación se dirige hacia la secuencia de interés durante el proceso.
Ejemplo 4: Análisis bioinformático de las muestras
En este ejemplo, se describen enfoques representativos de análisis estadístico para usar en la metodología que se ilustra en la Figura 1 ("P ip e lin e de análisis” en la Figura 1).
Alineación con el genoma humano
Por cada muestra, se aplicó la rutina bioinformática (p ip e lin e ) que se describe a continuación para alinear los fragmentos de ADN secuenciados de cada muestra con el genoma humano de referencia. Los fragmentos de lecturas apareadas dirigidas obtenidos de los resultados de la NGS se procesaron para eliminar las secuencias de adaptadores y las lecturas de baja calidad (puntuación Q < 25) con el software cutadapt (Martin, M. et al. (2011) EMB.netJournal 17.1). La calidad de las lecturas crudas y/o procesadas, junto con toda estadística descriptiva que ayudara a evaluar la calidad del resultado de la secuenciación de la muestra, se obtuvieron con el software FastQC (Babraham Institute (2015) FastQC) y/u otras herramientas de software propias. Las lecturas procesadas de al menos 25 bases de longitud se alinearon al genoma humano de referencia, versión hg19 (UCSC Genome Bioinformatics), con un algoritmo de alineación basado en la transformación de Burrows-Wheeler (Li, H. and Durbin, R. (2009) Bioinformatics 25:1754-1760), pero también pueden usarse otros algoritmos conocidos para la persona versada en la técnica. Si correspondía, las lecturas duplicadas se eliminaron luego de la alineación. En los casos en que correspondía, el resultado de la secuenciación obtenido de la misma muestra, pero procesado en distintas calles (la n e s ) de secuenciación, se combinó en un único archivo de salida. Los procedimientos de eliminación de lecturas duplicadas y combinación se realizaron con el paquete de herramientas de software Picard (Broad Institute (2015) Picard) y/o el paquete de herramientas de software Sambamba (Tarasov, Artem, et al. "Sambamba: fast processing of NGS alignment formats." Bioinformatics 31.12 (2015): 2032-2034). También puede realizarse un procedimiento de realineamiento usando herramientas conocidas para la persona versada en la técnica.
El análisis de software anterior resultó en una versión final alineada de una muestra secuenciada contra el genoma humano de referencia, y todos los pasos ulteriores se basaron en esta versión alineada. La información relativa a los polimorfismos de nucleótidos individuales (SNP) en los lo c i de interés se obtuvo con la herramienta bcftools del paquete de software samtools (Li, H. et al. (2009) Bioinformatics 25:2078-2079) y/u otro software conocido para la persona versada en la técnica. La profundidad de lecturas por base en los lo c i de interés —denominada, en lo sucesivo, archivo mpileup— se obtuvo con la opción mpileup del paquete de software SAMtools. La información relativa al tamaño de los fragmentos alineados —denominada, en lo sucesivo, archivo de tamaños de fragmentos— se obtuvo con la opción view del paquete de software SAMtools y/u otro software conocido para la persona versada en la técnica.
El archivo mpileup y el archivo de tamaños de fragmentos se procesaron con interfaces de programación de aplicación (API) personalizadas escritas en los lenguajes de programación Python y R (Python Software Foundation (2015) P y th o n ; The R Foundation (2015) The R P ro je c t fo r S ta tis tica l C o m p u tin g ). Las API se usaron para determinar la ploidía de los cromosomas de interés mediante una serie de pasos (denominados colectivamente, en lo sucesivo, “el algoritmo”) y también para recopilar otras estadísticas descriptivas previstas para usar como métricas de control de calidad, tales como —sin carácter taxativo— la cuantificación de la fracción fetal y/o la fracción de interés (denominadas colectivamente, en lo sucesivo, “métricas de control de calidad”). Las API también pueden usarse para la evaluación de anomalías genéticas a partir de datos generados al aplicar el método descrito en casos de embarazos múltiples, así como otras anomalías genéticas, como —sin carácter taxativo— las microdeleciones, las microduplicaciones, las variaciones en el número de copias, las translocaciones, las inversiones, las inserciones, las mutaciones puntuales y los perfiles de mutaciones.
Métricas de control de calidad
Se emplearon métricas de control de calidad para inspeccionar las propiedades de una muestra alineada y decidir si la muestra era apta para clasificación. Una de estas métricas fue, sin carácter taxativo,
(a) el enriquecimiento de una muestra. Los patrones de enriquecimiento son indicativos de si una muestra tiene un enriquecimiento adecuado entre los lo c i de interés en un experimento de secuenciación dado (denominado, en lo sucesivo, una "corrida"). Para evaluar esto, se consideran distintas métricas, que incluyen, sin carácter taxativo:
(i) la profundidad de lecturas específicas en la muestra en su conjunto;
(ii) el volumen de secuenciación específico de la muestra con relación a la cantidad total de lecturas mapeadas;
(iii) el rendimiento de TACS individuales en términos de la profundidad de lecturas alcanzada;
(iv) la curtosis y la asimetría estadística del enriquecimiento de TACS individuales;
(v) los momentos de curtosis y asimetría estadística que surgen de todas las TACS;
(vi) la distribución de tamaños de fragmentos;
(vii) el porcentaje de duplicación;
(viii) el porcentaje de lecturas apareadas;
(ix) el porcentaje de lecturas alineadas,
si corresponde.
Las comprobaciones anteriores también se tienen en consideración en relación con el enriquecimiento del sesgo inducido por el contenido de GC. Las muestras que no cumplen con uno o más de los criterios mencionados anteriormente se identifican para su inspección ulterior antes de la clasificación.
(b) La fracción fetal o fracción de interés de una muestra. Las muestras con una fracción fetal o fracción de interés estimada por debajo de un umbral específico no se clasifican. Además, si corresponde, la fracción de interés puede calcularse usando más de un método y la concordancia entre los resultados obtenidos mediante los distintos métodos de estimación puede usarse como control de calidad adicional antes de la clasificación.
El algoritmo
El algoritmo es una colección de rutinas de procesamiento de datos y modelos matemáticos y estadísticos organizados como una serie de pasos. Los pasos del algoritmo buscan determinar la ploidía individual de un cromosoma de interés en relación con todos los demás cromosomas de la muestra secuenciada y se usan para la detección de anomalías cromosómicas totales o parciales en los cromosomas 13, 18, 21, X, Y o cualquier otro, así como otras anomalías genéticas como, por ejemplo —sin carácter taxativo— , los síndromes de microdeleciones/microduplicaciones y otras mutaciones puntuales o pequeñas. Así, el algoritmo puede usarse, sin carácter taxativo, para la detección de anomalías cromosómicas totales o parciales en los cromosomas 13, 18, 21, X, Y o cualquier otro, así como otras anomalías genéticas, incluidas, sin carácter taxativo, microdeleciones, microduplicaciones, variaciones en el número de copias, translocaciones, inversiones, inserciones, mutaciones puntuales y otros perfiles de mutaciones. El algoritmo realiza, sin carácter taxativo, dos tipos de evaluaciones, una relativa a la información sobre la profundidad de lecturas en cada muestra y otra relativa a la distribución de tamaños de fragmentos en regiones específicas de las TACS. A cada tipo de evaluación pueden asociarse una o más pruebas estadísticas, ejemplos no taxativos de los cuales se proveen en los métodos estadísticos descritos en la presente.
En caso de pruebas asociadas con la profundidad de lecturas, el algoritmo compara secuencialmente la profundidad de lecturas de los loci de cada cromosoma de interés (denominado, en lo sucesivo, cromosoma de prueba) contra la profundidad de lecturas de todos los demás loci (denominados, en lo sucesivo, loci de referencia) para determinar su ploidía. Por cada muestra, los pasos fueron, sin carácter taxativo, los siguientes:
(a) Eliminar los loci secuenciados de forma inadecuada. Se obtuvo la profundidad de lecturas de cada locus. Los loci que no alcanzaron una cantidad mínima de lecturas se consideraron insuficientemente enriquecidos y se eliminaron antes de los pasos ulteriores.
(b) Mitigar el sesgo genético (sesgo inducido por el contenido de GC). El procedimiento de secuenciación puede introducir discrepancias en la profundidad de lecturas entre los loci de interés en función de su contenido de GC. Para considerar tal sesgo, se empleó un nuevo enfoque de apareamiento de secuencias que aumenta tanto la sensibilidad como la especificidad a la hora de detectar aneuploidías cromosómicas. Se identificó el contenido de GC de cada locus del cromosoma de prueba y se agruparon los loci genéticos similares para formar grupos genéticamente apareados. El procedimiento se repitió con los loci de referencia. Luego, los grupos genéticamente apareados del cromosoma de prueba se aparearon condicionalmente con sus grupos genéticamente apareados contrapartes en el/los cromosoma(s) de referencia. Los grupos pueden tener cualquier cantidad de miembros. Luego, los grupos condicionalmente apareados se usaron para determinar la ploidía de los cromosomas de prueba.
(c) Determinar las anomalías genéticas. La determinación de la condición en cuanto a la ploidía u otras anomalías genéticas de interés, incluidas, sin carácter taxativo, las microdeleciones, las microduplicaciones, las variaciones en el número de copias, las translocaciones, las inversiones, las inserciones, las mutaciones puntuales y otros perfiles de mutaciones, se logró usando un único método estadístico y/o un enfoque de puntuaciones ponderadas aplicado a los resultados de los siguientes métodos estadísticos, sin carácter taxativo:
Método estadístico 1: Las diferencias en las profundidades de lecturas entre los grupos condicionalmente apareados se evaluaron para determinar su significación estadística con la fórmula de la prueba t: donde t es el resultado de la prueba t, x es el promedio de las diferencias entre los grupos condicionalmente apareados, y es la profundidad de lecturas esperada y se fija en un valor que representa diferencias de profundidad de lecturas insignificantes entre ambos grupos, s es la desviación estándar de las diferencias entre los grupos condicionalmente apareados y n es la longitud del vector de las diferencias condicionalmente apareadas. La magnitud del estadístico t se usó para identificar la evidencia, si correspondía, contra la hipótesis nula de igualdad de ploidía entre los cromosomas de referencia y de prueba. Específicamente, t >= c1 (donde c1 es un umbral predefinido que pertenece al conjunto de todos los números positivos) indica evidencia en contra de la hipótesis nula de que no existen diferencias.
Método estadístico 2: Remuestreo bivariado no paramétrico. El método de remuestreo (b o o ts tra p ) depende de la relación entre las variables aleatorias X (profundidad de lecturas de los lo c i de referencia) e Y (profundidad de lecturas de los lo c i de prueba). Aquí, la profundidad de lecturas de los señuelos en el grupo de referencia (variable aleatoria denotada por X) fueron tratados como la covariable independiente. El primer paso del procedimiento iterativo involucró un muestreo al azar con remuestreo (b o o ts tra p p in g ) de las profundidades de lecturas de los lo c i en los cromosomas de referencia, es decir, (x1,g1), ..., (xn,gn), donde el parámetro g es conocido y representa el contenido de GC del señuelo escogido. Luego, por cada señuelo de referencia seleccionado aleatoriamente (xi,gi), se generó una profundidad de lecturas correspondiente para un lo c u s genéticamente apareado, a saber, (y1,g1), ..., (yn,gn). Así, se obtuvieron los datos bivariados (x1,y1), (x2,y2), ..., (xn,yn), condicionalmente apareados en función de su contenido de GC (parámetro gi). Las diferencias entre las profundidades de lecturas de los valores remuestreados genéticamente apareados xi e yi se usaron para calcular el estadístico de interés en cada iteración. En una realización, esta medida estadística puede ser, sin carácter taxativo la moda la media o la mediana de las diferencias registradas, y/o múltiplos de dichos valores. El procedimiento se repitió la cantidad de veces necesarias para construir la distribución del estadístico de interés a partir de estas diferencias. Se asignó a la muestra una puntuación que corresponde a un percentil específico de la distribución construida (p. ej., el 5.° percentil). Bajo la hipótesis nula, la ploidía es la misma entre los cromosomas de los grupos de referencia y de prueba. Así, las muestras en las que la puntuación de un cromosoma en particular era mayor a un umbral predefinido, notado c2, se clasificaron como muestras en las que era estadísticamente improbable que la ploidía fuera la misma que en la referencia. También pueden emplearse otras medidas estadísticas.
Método estadístico 3: Prueba de permutaciones estratificadas. El estadístico de interés es la profundidad de lecturas estimada del cromosoma de prueba, denotada por Yobs, que se calcula a partir de todos los loci de los grupos genéticamente apareados de los cromosomas de prueba de la siguiente manera:
Figure imgf000039_0001
donde y i j es la profundidad de lecturas del lo c u s i que forma parte del grupo genéticamente apareado j (es decir, los lo c i que pertenecen a un grupo específico en virtud de su contenido de GC), N j es la cantidad de lo c i de prueba que son parte del grupo genéticamente apareado j y T la cantidad de grupos genéticamente apareados.
A continuación, se construyó una distribución nula para evaluar Yobs. Para hacerlo, por cada grupo j, los lo c i de prueba y de referencia se combinaron (intercambiabilidad bajo la hipótesis nula) y cada grupo j se muestreó aleatoriamente hasta N j veces sin reposición (permutación estratificada). Esto creó un vector de valores, notado yi, del cual se calculó el valor promedio, notado y t . El procedimiento se repitió la cantidad de veces necesaria para construir la distribución nula. Por último, Yobs se studentizó respecto de la distribución nula con la siguiente fórmula:
Figure imgf000039_0002
donde Y y oy son el primer momento y la raíz cuadrada del segundo momento de todos los valores estadísticos y¡ permutados. En las muestras cuyos valores de ZY0bs eran mayores de un umbral predefinido, notado c3, era estadísticamente menos probable que la ploidía fuera la misma entre los grupos de referencia y de prueba.
En el caso de las pruebas asociadas con los tamaños de fragmentos, el algoritmo calcula la proporción de fragmentos pequeños en los lo c i de prueba y la compara con la correspondiente proporción en los lo c i de referencia, como se describe en el método estadístico 4, a continuación.
Método estadístico 4: Proporciones de tamaños de fragmentos. Por cada muestra, se extrae la cantidad y el tamaño de los fragmentos alineados al genoma humano de referencia en las coordenadas correspondientes a las TACS. Posteriormente, los datos se filtran para eliminar los tamaños de fragmentos que se consideran valores estadísticamente atípicos usando el método de detección de valores atípicos basado en la mediana. Específicamente, se definen como valores atípicos aquellos fragmentos cuyo tamaño es mayor o menor a los umbrales Fthr, dados por la siguiente ecuación:
Figure imgf000040_0001
donde F m e d ia n es la mediana del tamaño de todos los fragmentos de una muestra, X es una variable que puede asumir valores en el conjunto R e IQ R es el rango intercuartílico de los tamaños de fragmentos. Posteriormente, se realiza una prueba binomial de proporciones para buscar evidencia en contra de la hipótesis nula, H0, definida de la siguiente manera:
H0: La proporción de fragmentos pequeños en la región de prueba no difiere de la proporción de fragmentos pequeños en la región de referencia.
En varias realizaciones de la invención, los fragmentos pequeños se definen como aquellos fragmentos cuyo tamaño es menor o igual a un subconjunto de Z+ acotado superiormente por 160 bp. Si definimos como T el conjunto de todas las TACS, la región de prueba puede ser cualquier subconjunto propio S que defina la región investigada, y la región de referencia es el complemento relativo de S en T. Por ejemplo, en una realización de la invención, el conjunto S se define como el conjunto de todas las secuencias capturadas por TACS del cromosoma 21 y, por consiguiente, el conjunto de referencia se define como el conjunto de todos los fragmentos capturados por TACS en los cromosomas de referencia y/u otros lo c i de referencia.
La hipótesis alternativa, H1, se define de la siguiente manera:
H1: La proporción de fragmentos pequeños en la región de prueba difiere de la proporción de fragmentos pequeños en la región de referencia.
Así, teniendo en cuenta la corrección por continuidad, se calcula la siguiente puntuación (Brown et. al., Harrel):
Figure imgf000040_0002
donde
Figure imgf000040_0003
F es la cantidad de fragmentos pequeños en la región de prueba, Fre f es la cantidad de fragmentos pequeños en la región de referencia, N test es la cantidad total de fragmentos en la región de prueba y Nre f es la cantidad total de fragmentos en la región de referencia.
Por cada muestra, el algoritmo contrasta secuencialmente la proporción de tamaños de fragmentos de las regiones investigadas (por ejemplo, sin carácter taxativo, el cromosoma 21, el cromosoma 18, el cromosoma 13 u otras regiones de interés [sub]cromosómicas) contra las regiones de referencia, es decir, aquellas no investigadas en la prueba. Por cada muestra, se asigna una puntuación por cada prueba. Las puntuaciones superiores a un umbral, notado c4, proveen evidencia en contra de la hipótesis nula.
Método de puntuación ponderada 1: En una realización del método, se le asignó una puntuación ponderada a cada muestra s, calculada como la suma ponderada de todos los métodos estadísticos de acuerdo con la siguiente fórmula:
VS(R,F) = z1max{Rs, Fs] (1 — z^m in lR s^s ]
donde Rs es la puntuación corregida específica de la corrida obtenida de una contribución ponderada de cada método estadístico relacionado con la profundidad de lecturas de la muestra s, que se define como:
_ _ ( l íWíS is - R r )
KS <Jr
y Rr es la mediana específica de la corrida, calculada a partir del vector de todas las puntuaciones no ajustadas ponderadas relacionadas con la profundidad de lecturas obtenidas de una única corrida de secuenciación, y Or es un múltiplo del desvío estándar de las puntuaciones R calculado a partir de un conjunto de referencia de 100 muestras euploides. Los términos max{Rs,Fs} y min{Rs,Fs} denotan los valores máximo y mínimo del conjunto entre llaves, respectivamente.
Fs es la puntuación corregida específica de la corrida obtenida del método estadístico relacionado con los tamaños de fragmentos y se define como:
Figure imgf000041_0001
donde Wtest tiene la misma definición que antes, Rf es la mediana específica de la corrida, calculada a partir del vector de todas las puntuaciones estadísticas no ajustadas relacionadas con los fragmentos obtenidas de una única corrida de secuenciación, y Of es un múltiplo del desvío estándar de las puntuaciones F calculado a partir de un conjunto de referencia de 100 muestra euploides.
Una puntuación de clasificación única inferior a un valor predefinido indica que no hay evidencia en los datos observados de que una muestra tenga un riesgo significativo de aneuploidía.
Método de puntuación ponderada 2: En otra realización del método, la puntuación ponderada obtenida de los métodos estadísticos descritos anteriormente se usó para asignar a cada muestra una puntuación única de riesgo de anomalía genética de acuerdo con la siguiente fórmula:
Figure imgf000041_0002
donde R es el resultado de la puntuación ponderada, wj es el peso asignado al método j, tj es la puntuación observada resultante del método j, y Cj es el umbral del método j.
Una puntuación de clasificación única inferior a un valor predefinido indica que no hay evidencia en los datos observados de que una muestra tenga un riesgo significativo de aneuploidía.
Dado que se asumió que todas las profundidades de lecturas de los señuelos del grupo de referencia provenían de la misma población, y para tener un umbral universal, se emplearon ajustes específicos de cada corrida para aliviar los sesgos específicos de cada corrida.
El/los método(s) mencionado(s) también es/son adecuado(s) para la detección de otras anomalías genéticas, incluidas, sin carácter taxativo, las anomalías subcromosómicas. Un ejemplo no taxativo es la pérdida parcial contigua de material cromosómico que da lugar a una microdeleción, o la incorporación parcial contigua de material cromosómico que da lugar a una microduplicación. Un locus genético conocido sujeto a ambas anomalías es el 7q11.23. En una realización del método estadístico 1, se evaluaron muestras de plasma sintéticas con 5 %, 10 % y 20 % de material fetal para evaluar el aumento del riesgo de microdeleciones y/o microduplicaciones en el locus genético 7q11.23.
En el caso de las mutaciones puntuales, se realizan varias pruebas binomiales que consideran la estimación de la fracción fetal de la muestra, notada f, la profundidad de lecturas del alelo menor, notada r, y la profundidad de lecturas total de la base secuenciada, notada n. Dos ejemplos frecuentes, pero no taxativos, involucran la evaluación del riesgo cuando la anomalía genética es una mutación puntual recesiva o una mutación puntual dominante.
En el ejemplo no taxativo de una mutación puntual recesiva, la hipótesis nula evaluada es que tanto la madre como el feto son heterocigotas (es decir, la frecuencia del alelo menor es de 0,5), en tanto que la hipótesis alternativa es que el feto es homocigota (es decir, la frecuencia del alelo menor es de 0,5-f/2). Un valor p pequeño en la correspondiente prueba de cocientes de verosimilitudes ( lik e lih o o d ra tio ) indicaría evidencia contraria a la hipótesis nula. En el ejemplo no taxativo de una mutación puntual dominante, la hipótesis nula evaluada es que tanto la madre como el feto son homocigotas en la posición dada, en tanto que la hipótesis alternativa es que solo el feto es heterocigota en la posición dada. Un valor p pequeño en la correspondiente prueba de cocientes de verosimilitudes ( lik e lih o o d ra tio ) indicaría evidencia contraria a la hipótesis nula.
Además de los anteriores, se desarrollaron métodos de determinación del sexo, ejemplos no taxativos de los cuales se describen a continuación. En una realización de la invención, se asignó el sexo fetal a una muestra usando una prueba de Poisson dada por la siguiente fórmula:
Pr(ry
Figure imgf000042_0001
donde
Figure imgf000042_0002
y f es la fracción fetal estimada de la muestra, B es la cantidad de secuencias blanco en el cromosoma Y, p es la profundidad de lecturas de la muestra y k es la suma de las lecturas obtenidas de todos los blancos B. La hipótesis nula de la prueba de Poisson fue que la muestra era masculina. Un valor de Pr(ry) menor a un umbral cy se consideró como evidencia suficiente para rechazar la hipótesis nula, es decir, concluir que la muestra no era masculina. En los casos en los que uno o más de los términos para calcular Pr(ry) no estaban disponibles, el sexo de la muestra se clasificó como no disponible (NA).
En otra realización de la invención, el sexo fetal se asignó usando la profundidad de lecturas promedio de las secuencias blanco en el cromosoma Y. Si la profundidad de lecturas promedio de las secuencias blanco era superior a un umbral predefinido, donde tal umbral puede definirse en función de otras características específicas de la muestra, como la profundidad de lecturas y la fracción fetal estimada, el sexo fetal se clasificó como masculino. Si la profundidad de lecturas promedio era inferior a dicho umbral, la muestra se clasificó como femenina.
Estimación de la fracción fetal/de la fracción de interés
Se han desarrollado diversos métodos para estimar la fracción fetal que pueden aplicarse a embarazos simples y/o múltiples. Así, en función del tipo de embarazo, la fracción fetal estimada puede obtenerse de cualquiera de los métodos o como una estimación ponderada a partir de un subconjunto de los métodos desarrollados y/o de todos ellos. A continuación, se dan algunos ejemplos no taxativos.
En una realización, se desarrolló una técnica de aprendizaje computarizado basada en la inferencia bayesiana para calcular la distribución a p o s te r io r i de la fracción fetal de ADN empleando los recuentos alélicos en los lo c i heterocigotas del plasma materno de embarazos simples. Se utilizaron tres combinaciones informativas posibles de genotipos maternos/fetales dentro del modelo para identificar aquellos valores de fracción fetal de ADN con mayor respaldo de los datos observados.
Sea f la fracción fetal de ADN. Si la madre es heterocigota en un lo c u s dado, el genotipo fetal puede ser heterocigota u homocigota, lo que resulta en frecuencias esperadas del alelo menor de 0 ,5 y 0,5 -f/2 , respectivamente. Si la madre es homocigota y el feto es heterocigota, la frecuencia esperada del alelo menor será de f/2. Se empleó un método de Monte Carlo basado en una cadena de Markov (algoritmo de Metropolis-Hastings) (The R Foundation (2015) The R Project for Statistical Computing) con una distribución a p r io r i no informativa o informativa (es decir, que incorporara información adicional como la edad gestacional, el peso materno, etc.) para obtener una secuencia de muestras aleatorias de la distribución de probabilidad a p o s te r io r i de la fracción fetal de ADN basada en un modelo de mezclas finitas.
En otra realización, la fracción fetal estimada se calcula únicamente a partir del clúster de frecuencia del alelo menos frecuente (MAF) específico del feto, es decir, el clúster formado cuando la madre es homocigota y el feto es heterocigota en un lo c u s genómico dado. Se asume que el valor medio de la estimación de la fracción fetal sigue la distribución normal N (2 x ', o 'x), donde x se la media de la MAF específica del feto y o \ es el desvío estándar de la MAF específica del feto. Luego, la fracción fetal estimada se obtiene de los percentiles de la distribución calculada, N (2 x ', o 'x).
En los embarazos de gestación múltiple —ejemplos no taxativos de los cuales incluyen los embarazos de gemelos monocigóticos y de mellizos dicigóticos, los embarazos de trillizos y distintos casos de donantes de óvulos y/o esperma—, la fracción fetal puede estimarse empleando información obtenida a partir de lo c i genéticos cuyo valor de MAF sea menor que un umbral, notado M thresh , y derivada de posibles SNP específicos del feto. La persona razonablemente versada en la técnica apreciará que los SNP específicos del feto pueden originarse de cualquiera de los fetos, de cualquier combinación posible de los fetos o de todos los fetos de la gestación. Así, se ha desarrollado un algoritmo que estima la fracción fetal del feto con la menor contribución al contenido fetal total, teniendo en cuenta la contribución combinatoria de cada feto a los valores de MAF que definen los SNP específicos del feto, y también permite la contribución no homogénea de material fetal al contenido fetal total del material obtenido del plasma. Con este fin, el algoritmo emplea un enfoque de dos pasos.
En una realización del algoritmo, el embarazo múltiple considerado es un embarazo de mellizos dicigóticos. Como primer paso, la implementación algorítmica del modelo utiliza todos los SNP informativos y permite una contribución fetal no homogénea que puede explicarse con una diferencia relativa en las fracciones fetales estimadas respecto de un umbral definido, notado cf. Específicamente, si f1 y f2 representan las fracciones fetales de los fetos uno y dos, respectivamente, y f1 <= f2, la suposición es que f2 <= cf f1, donde cf es una constante real positiva mayor o igual a 1. Bajo esta hipótesis, los datos observados D, definidos como los recuentos de los alelos alternativo y de referencia en los lo c i de los SNP informativos, se suponen generados por una distribución combinada de tres binomiales (definidas por los parámetros f1/2, f2/2 y (f1+f2)/2), siendo la distribución a p o s te r io r i p(f1,f2|D) proporcional al modelo de observación, que puede expresarse como p(f1|f2,D) p(f2|D). La distribución a p o s te r io r i p(f1,f2|D) se muestra con un algoritmo de Metropolis-Hastings MCMC usando una distribución a p r io r i uniforme. El enfoque de cuantiles empíricos se aplica al arreglo de datos generado para inferir las fracciones fetales.
Como segundo paso, el algoritmo ejecuta un algoritmo de agrupamiento (c lu s te rin g ) basado en un modelo (modelo de mezcla gausiana finita ajustado mediante el algoritmo EM; paquete mclust en R) para identificar si existe un clúster independiente de sNp atípicos del que se crea que está centrado en torno de f1/2. La existencia de tal clúster con una media que invalide la hipótesis cf >= f2/f1 lleva a la estimación de f1 usando únicamente SNP que son parte del clúster identificado.
Los métodos descritos anteriormente son adecuados para la determinación de la fracción de cualquier componente de interés que sea parte de una muestra combinada. Así, no debe entenderse que los métodos son aplicables únicamente a la estimación de la fracción fetal, sino que estos pueden aplicarse a la estimación de cualquier componente de interés que sea parte de una muestra combinada, como se describe en el Ejemplo 6.
Ejemplo 5: Enriquecimiento de blancos usando familias de TACS
En este ejemplo, una familia de TACS, que contenía múltiples miembros que se unían todos a la misma secuencia blanco de interés, se usó para el enriquecimiento, en lugar de usar una única TACS que se uniera a una secuencia blanco de interés. Cada miembro de la familia de TACS se unía a la misma secuencia blanco de interés, pero tenía diferentes coordenadas de inicio/fin con respecto a un sistema de coordenadas de referencia de dicha secuencia blanco (p. ej., la versión hg19 del genoma humano de referencia). Así, cuando se alinea a la secuencia blanco, la familia de TACS exhibe un patrón de unión escalonado, como se muestra en la Figura 3. Normalmente, los miembros de la familia de TACs estaban escalonados aproximadamente entre 5 y 10 pares de bases.
Se preparó una familia de TACS que contenía cuatro miembros (es decir, cuatro secuencias que se unían a la misma secuencia blanco, pero con diferentes posiciones de inicio y/o fin, de modo que la unión de los miembros a la secuencia blanco era escalonada). También se preparó una hibridación de una TACS individual como control. Las TACS se fijaron a un sustrato sólido marcándolas con biotina y uniéndolas a microesferas magnéticas recubiertas con una sustancia que se une a la biotina (p. ej., estreptavidina o avidina), como se describió en el Ejemplo 3. Luego, la familia de TACS y la TACS individual se hibridaron a una biblioteca de secuencias, las secuencias unidas se eluyeron y amplificaron, y estos productos de amplificación enriquecidos se combinaron de forma equimolar y se secuenciaron en una plataforma de secuenciación adecuada, como se describió en el Ejemplo 3.
Las secuencias enriquecidas de la muestra con la familia de TACS y de la muestra con la TACS individual se analizaron para determinar la profundidad de lecturas. Los resultados se muestran en las Figuras 4A y 4B. Como se observa en la Figura 4A, las secuencias blanco de interés enriquecidas con la familia de cuatro TACS (puntos rojos) mostraron un cambio relativo en la profundidad de lecturas en comparación con las secuencias de control enriquecidas con una TACS individual (puntos azules). Para determinar el cambio relativo, se normalizó la profundidad de lecturas en cada lo c u s por la profundidad de lecturas promedio de una muestra, donde la profundidad de lecturas promedio se calculó a partir de todos los lo c i enriquecidos con una TACS individual. Como se muestra en la Figura 4B, se observó un aumento promedio general del 54,7 % en la profundidad de lecturas con la familia de cuatro TACS.
Este ejemplo demuestra que el uso de una familia de TACS en lugar de una TACS individual mejora significativamente el enriquecimiento de una secuencia blanco de interés, lo que resulta en un aumento significativo de la profundidad de lecturas de esa secuencia.
Ejemplo 6: Detección de biomarcadores tumorales en material de referencia
En este ejemplo, se usó la metodología de las TACS, que se muestra en la Figura 1, para la detección de biomarcadores tumorales en material de referencia certificado del que se sabe que contiene mutaciones genéticas particulares que son biomarcadores tumorales. Para la detección de las secuencias de interés biomarcadoras tumorales, se usaron familias de TACS, como se describió en el Ejemplo 5.
Una muestra de material de referencia certificado que contenía mutaciones genéticas conocidas asociadas con tumores se obtuvo comercialmente y se prepararon muestras para simular cargas tumorales del 0,1 %, 1,0 % y 5,0 %.
Se aplicó a las muestras la metodología de las TACS que se muestra en la Figura 1 usando familias de TACS que se unían a las siguientes mutaciones genéticas asociadas con tumores: EGFR_6240, KRAS_521, EGFR 6225, NRAS 578, NRAS 580, PIK3CA 763, EGFR 13553, EGFR 18430.
Luego de la amplificación y secuenciación de los productos enriquecidos mediante TACS, se realizó el siguiente análisis de datos. Los productos de secuenciación se procesaron para eliminar las secuencias adaptadoras y las lecturas de baja calidad. Las lecturas cuya longitud era de al menos 25 bases luego de eliminar los adaptadores se alinearon contra una de las siguientes referencias:
(a) la versión hg 19 del genoma humano de referencia; o
(b) un genoma artificial basado en la versión hg 19 que contenía únicamente las secuencias de interés.
Si correspondía, las lecturas duplicadas se eliminaron luego de la alineación. En los casos en los que correspondía, el resultado de la secuenciación obtenido de la misma muestra, pero procesado en distintas calles (lanes) de secuenciación, se combinó en un único archivo de salida. También puede realizarse un realineamiento local de los datos mediante herramientas conocidas en la técnica. El análisis de software anterior dio como resultado una versión final de una muestra secuenciada alineada contra el genoma de referencia (denominada aquí archivo BAM final), de la cual se puede extraer información sobre los polimorfismos de nucleótidos individuales (SNP), las variantes de nucleótidos individuales (SNV) y otras variaciones genéticas con respecto a una secuencia de referencia en los loci de interés, la profundidad de lecturas por base y el tamaño de los fragmentos alineados. Para obtener la información sobre SNP a partir del archivo BAM final, se pueden usar distintas herramientas conocidas para la persona versada en la técnica, incluida, sin carácter taxativo, bcftools, que es parte del paquete de software samtools. Esta información, que hace referencia a la secuencia y a la cantidad de veces que se detectó cada variante presente en una muestra secuenciada, se usó para
(a) inferir la presencia de una mutación genética; y
(b) estimar la carga tumoral usando el método de estimación de la fracción fetal/de la fracción de interés que se describe en el Ejemplo 4.
Además de la detección de la mutación genética, se asignó una confianza estadística a una mutación detectada mediante estadística binomial, usando la carga tumoral estimada de la muestra y la profundidad de lecturas de cada una de las variantes detectadas en una posición dada. Es posible emplear más de una prueba, a partir de las cuales uno puede calcular la probabilidad de obtener la información secuenciada; o bien obtener un intervalo de confianza del 95 %, que describe un rango de posibles profundidades de lecturas de la mutación genética; o evaluar si la proporción de lecturas que pueden asignarse a la mutación genética es consistente con la esperada dada la carga tumoral. Una prueba binomial de proporciones adecuada para ello se describe en el Ejemplo 4 (en el contexto de la clasificación de las anomalías cromosómicas).
Los resultados se muestran en la Figura 5. La línea ilustra la frecuencia del alelo menos frecuente (MAF) prevista para cada una de las cargas tumorales porcentuales (%). Las barras (eje x) ilustran la MAF detectada (eje y) correspondiente a las mutaciones genéticas indicadas en el material de referencia certificado. Se muestran dos réplicas técnicas del material de referencia.
Los datos demuestran que la metodología de las TACS detectó con éxito las mutaciones genéticas asociadas con tumores EGFR_6240, KRAS_521, EGFR_6225, NRAS_578, NRAS_580, PIK3CA_763, EGFR_13553 y EGFR_18430 en el caso de las cargas tumorales esperadas del 1,0 % y el 5,0 %. Las mutaciones EGFR_6240, NRAS_578, PIK3CA_763, EGFR_13553 y EFGR_18430 también se detectaron con éxito en el caso de la carga tumoral del 0,1 %.
Así, este ejemplo demuestra la detección exitosa de un amplio panel de biomarcadores tumorales diferentes usando la metodología de las TACS con cargas tumorales de apenas el 0,1 %.
Ejemplo 7: Detección de biomarcadores tumorales en muestras de pacientes
En este ejemplo, se usó la metodología de las TACS, que se muestra en la Figura 1, para la detección de biomarcadores tumorales en muestras de tejido tumoral y plasma sanguíneo de pacientes con cáncer no tratado, pero con diagnóstico confirmado. Para la detección de las secuencias de interés biomarcadoras tumorales, se usaron familias de TACS, como se describió en el Ejemplo 5.
Muestras apareadas de sangre periférica y tejido tumoral de pacientes con cáncer no tratado se usaron para una validación ulterior del desempeño de la metodología de las TACS para la detección de biomarcadores tumorales en un paciente que tenía la mutación PIK3CA E545K (Paciente 1) y en un paciente que tenía la mutación TP53 K139 (Paciente 2). Los resultados se muestran en la Figura 6.
Como se muestra en la Figura 6, la aplicación de la metodología de las TACS a una muestra de tejido obtenida del Paciente 1, que tenía la mutación PIK3CA E545K (barras superiores), arrojó una frecuencia del alelo mutante (VAF) porcentual (es decir, la proporción en la que la mutación genética está presente en lugar del alelo normal) del ~62 %. Plasma obtenido de la sangre periférica del Paciente 1 se procesó de acuerdo con el método que se describe en el Ejemplo 1 y arrojó una VAF del 6,05 %. Del mismo modo, la aplicación de la metodología de las TACS a muestras obtenidas del Paciente 2, que tenía la mutación TP53 K139 (barras inferiores), arrojó una VAF del ~60 % en el caso del tejido tumoral y una VAF del 4,88 % en el caso del plasma obtenido de una muestra de sangre periférica.
Entonces, este ejemplo confirma la detección exitosa de biomarcadores tumorales en muestras de pacientes con cáncer, tanto a partir de muestras de tejido tumoral como a partir de muestras de plasma, lo que demuestra que la metodología de las TACS es adecuada para biopsias de tejidos y para la detección de biomarcadores tumorales no invasiva a partir de una biopsia líquida.
Ejemplo 8: Detección de perfiles de mutaciones
Dada la capacidad de la metodología de las TACS que se ilustra en la Figura 1 de detectar diversas variaciones de nucleótidos individuales (SNV) somáticas, estas se pueden examinar en el contexto de los motivos, también conocidos como perfiles de mutaciones. La mayoría de las mutaciones somáticas en tumores pueden considerarse pasajeras y pueden no estar asociadas con la patogénesis si se examinan de forma individual. Sin embargo, examinar el perfil global de mutaciones detectadas puede ser útil para determinar y/o detectar un perfil de mutaciones asociadas con la patogénesis. Se han desarrollado diversos algoritmos para descomponer los motivos de mutación conocidos que operan en muchos tipos de cáncer. Como alternativa, pueden usarse para este fin otras métricas que utilizan características específicas, como el tipo de mutaciones detectadas en el contexto de sus bases vecinas. Los algoritmos desarrollados pueden inferir los escenarios más probables que explican los datos observados. La descomposición del número y los tipos de patrones/perfiles de mutaciones conocidos que más probablemente generaron el perfil de mutaciones observados se logró, sin carácter taxativo, usando al algoritmo de mínimos cuadrados no negativos de Lawson-Hanson.
En la Figura 7, se muestra el patrón observado de SNV somáticas en cáncer de mama usando datos descargados de la base de datos COSMIC. En el eje x, se muestra una mutación de una sola base observada en cáncer en el contexto de sus secuencias vecinas. Por ejemplo, A[C>A]T describe una mutación de una citosina (C) a adenina (A) aguas arriba de la cual hay una adenina y aguas abajo de la cual hay una timina. En el eje y, se muestra la frecuencia con la que ocurre esta mutación en cáncer de mama.
En la Figura 8, se muestran los resultados de un estudio de simulaciones en el que se generaron al azar perfiles de mutaciones muestreando en cada oportunidad un subconjunto de las SNV disponibles en la base de datos COSMIC, de modo de simular distintos individuos. Se aplicaron a los datos simulados los algoritmos de descomposición descritos anteriormente para detectar los probables motivos de mutaciones subyacentes. Las barras indican la frecuencia promedio estimada de los perfiles de mutaciones de mama calculados a partir de un conjunto de datos de 10000 simulaciones. El algoritmo desarrollado muestra evidencia de detección de los perfiles de mutaciones, lo que demuestra que es posible detectar perfiles o motivos de mutaciones con los algoritmos desarrollados.
Ejemplo 9: Pruebas basadas en los tamaños de los fragmentos
Hay evidencia en la literatura de que ciertos tipos específicos de cáncer pueden estar caracterizados por y/o asociados con fragmentos en el plasma que tienen un tamaño menor al tamaño esperado de los fragmentos provenientes de tejidos sanos (Jiang et al., (2015), Proceedings of the National Academy of Sciences, 112(11), pp. E1317-E1325). Así, se puede utilizar una prueba basada en los tamaños de fragmentos para detectar la presencia de variaciones en el número de copias (CNV) somáticas en individuos que presuntamente tienen cáncer.
Para tal fin, puede usarse una prueba binomial de proporciones, como se describe en el Ejemplo 4, para la detección de un aumento en la presencia de material de ácidos nucleicos proveniente de tejido no sano (p. ej., tejido tumoral) sobre la base del tamaño de los fragmentos. En particular, bajo la hipótesis nula de que la distribución de tamaños de fragmentos provenientes de células saludables y de células no saludables es la misma, se puede usar una prueba binomial de proporciones (como se describe en el Ejemplo 4) con corrección de continuidad para cuantificar cualquier evidencia en contrario.
La misma hipótesis vale en el caso de los fragmentos que se originan en la placenta o el feto. Específicamente, los fragmentos derivados de la placenta suelen ser de menor tamaño que los que se originan de tejidos/células maternos. Así, la evaluación de la prueba basada en los tamaños de los fragmentos se realizó usando muestras de plasma materno (es decir, muestras combinadas en las que el ADN libre es de origen materno y fetal). El tamaño de los fragmentos que se alinearon con regiones enriquecidas con TACS puede obtenerse a partir de los datos alineados. Posteriormente, la proporción de fragmentos por debajo de un umbral específico en una región de prueba se compara con la proporción respectiva de fragmentos de una región de referencia en busca de evidencia contraria a la hipótesis nula H0, donde
H0: La proporción de fragmentos pequeños en la región de prueba no difiere de la proporción de fragmentos pequeños en la región de referencia.
En la Figura 9, se muestran resultados obtenidos al aplicar el método de los tamaños de fragmentos a la muestra combinada que contenía ADN materno y fetal. Los puntos negros son muestras individuales. En el eje x, se muestra el índice de la muestra. En el eje y, se muestra la puntuación que arroja el método basado en los fragmentos. Una puntuación mayor que el umbral (ilustrado con la línea gris) señala una desviación respecto del tamaño esperado de los fragmentos, lo que es indicativo de la presencia de una aneuploidía. Los resultados demuestran que una muestra aneuploide con una fracción fetal estimada del 2,8 % pudo identificarse correctamente, lo que ilustra que la detección basada en fragmentos puede usarse para detectar anomalías en muestras combinadas con baja relación señal-ruido (como en el caso de la detección del cáncer).
Así, este ejemplo demuestra la capacidad del método de detección basado en fragmentos de detectar con éxito anomalías genéticas en muestras combinadas con bajas relaciones señal-ruido, lo que confirma que la prueba basada en fragmentos es adecuada para el análisis de muestras de cáncer para fines oncológicos o de muestras maternas para NIPT.
Dado que los fragmentos pequeños están asociados con fragmentos de tejidos no saludables (Jiang et al., (2015), Proceedings of the National Academy of Sciences, 112(11), pp. E1317-E1325), también pueden aprovecharse para la detección de mutaciones pequeñas, como mutaciones puntuales y perfiles de mutaciones. Por ejemplo, uno podría usar solo los fragmentos pequeños en la estimación de la frecuencia de alelos mutantes que se describió en los Ejemplos 6 a 9, lo que aumentaría la relación señal-ruido.
Ejemplo 10: Uso del método con biopsias de tejido
Cinco muestras FFPE de carcinoma de mama y 13 muestras de tejido (frescas/congeladas y FFPE) de adenocarcinoma de pulmón se procesaron con el método y se detectó con éxito la condición mutacional. Los datos se presentan a continuación:
Carcinoma de mama:
Figure imgf000046_0001
Adenocarcinoma de pulmón:

Claims (14)

REIVINDICACIONES
1. Un método para detectar uno o más biomarcadores tumorales en una muestra de ADN de un sujeto que tiene o que presuntamente tiene un tumor, donde el método comprende:
(a) preparar una biblioteca de secuenciación a partir de la muestra de ADN;
(b) hibridar la biblioteca de secuenciación con una mezcla de secuencias de captura de blancos (TACS) de hebra doble que se unen a una o más secuencias biomarcadoras tumorales de interés, donde:
(i) cada secuencia miembro de la mezcla de TACS tiene entre 150 y 260 pares de bases de longitud, y cada secuencia miembro tiene un extremo 5' y un extremo 3';
(ii) preferentemente y opcionalmente, cada secuencia miembro se une a la secuencia biomarcadora tumoral de interés a una distancia de al menos 50 pares de bases, tanto en el extremo 5' como en el extremo 3', de regiones que presentan variaciones en el número de copias (CNV), duplicaciones segmentales o elementos de ADN repetitivo;
(iii) el contenido de GC de la mezcla de TACS, que se determina calculando el contenido de GC de cada secuencia miembro de la mezcla de TACS; se encuentra entre el 19 % y el 80 %;
(iv) la mezcla de TACS comprende múltiples familias de TACS, cada una dirigida a una secuencia biomarcadora tumoral de interés, donde cada familia de TACS comprende múltiples secuencias miembro, donde cada secuencia miembro se une a la misma secuencia biomarcadora tumoral de interés, pero tiene diferentes posiciones de inicio y/o fin con respecto a un sistema de coordenadas de referencia de la secuencia biomarcadora tumoral de interés, donde, opcionalmente, las posiciones de inicio y/o fin de las secuencias miembro dentro de una familia de TACS con respecto a un sistema de coordenadas de referencia de la secuencia biomarcadora tumoral están escalonadas por entre 5 y 10 pares de bases;
(c) aislar aquellos miembros de la biblioteca de secuenciación que se unen a la mezcla de TACS para obtener una biblioteca enriquecida;
(d) amplificar y secuenciar la biblioteca enriquecida;
(e) alinear la biblioteca enriquecida con un genoma de referencia para obtener información sobre la profundidad de lecturas y recuentos alélicos; y
(f) aplicar análisis estadísticos a las secuencias de la biblioteca enriquecida, opcionalmente usando solo fragmentos cuyo tamaño está dentro de un rango específico, para detectar el/los biomarcador(es) tumoral(es) en la muestra de ADN,
donde la secuenciación de la biblioteca enriquecida proporciona una profundidad de lecturas de las secuencias genómicas de interés y profundidades de lecturas de loci de referencia, y el análisis estadístico comprende aplicar un algoritmo que contrasta secuencialmente la profundidad de lecturas de los loci o de las secuencias genómicas de interés contra la profundidad de lecturas de los loci de referencia, donde el algoritmo comprende pasos para:
(a) eliminar los loci secuenciados de forma inadecuada;
(b) mitigar el sesgo inducido por el contenido de GC; y
(c) determinar la condición genética;
y/o
donde la secuenciación de la biblioteca enriquecida provee el número y el tamaño de los fragmentos secuenciados correspondientes a coordenadas específicas de cada TACS y el análisis estadístico comprende aplicar un algoritmo que contrasta secuencialmente la proporción de tamaños de fragmentos de la secuencia genómica de interés contra la proporción de tamaños de fragmentos de los loci de referencia, donde el algoritmo comprende pasos para:
(a) eliminar los valores atípicos de tamaños de fragmentos;
(b) calcular la proporción de tamaños de fragmentos; y
(c) determinar la condición genética.
2. El método de la reivindicación 1, donde el sesgo inducido por el contenido de donde GC se mitiga agrupando los loci con contenidos de GC equiparables.
3. El método de las reivindicaciones 1 a 2, donde la mezcla de TACS comprende al menos 5 familias de TACS diferentes, donde, opcionalmente, cada familia de TACS comprende al menos 3 secuencias miembro.
4. El método de una cualquiera de las reivindicaciones 1 a 3, donde los miembros de la biblioteca de secuenciación que se unen a la mezcla de TACS son parcialmente complementarios a las TACS.
5. El método de una cualquiera de las reivindicaciones 1 a 4, donde la mezcla de TACS se fija a un sustrato sólido, donde, opcionalmente las TACS están biotiniladas y se unen a microesferas magnéticas recubiertas con estreptavidina.
6. El método de una cualquiera de las reivindicaciones 1 a 5, donde la muestra de ADN comprende ADN libre tumoral (ADNlt).
7. El método de una cualquiera una las reivindicaciones 1 a 6, donde la muestra de ADN se selecciona de entre un grupo que comprende una muestra de plasma, una muestra de orina, una muestra de esputo, una muestra de líquido cefalorraquídeo, una muestra de líquido peritoneal y una muestra de efusión pleural de un sujeto que tiene o presuntamente tiene un tumor.
8. El método de una cualquiera una las reivindicaciones 1 a 7, donde la muestra de ADN proviene de una muestra de tejido de un sujeto que tiene o presuntamente tiene un tumor.
9. El método de una cualquiera de las reivindicaciones 1 a 8, donde el análisis estadístico comprende un algoritmo de segmentación.
10. El método de una cualquiera de las reivindicaciones 1 a 9, donde el análisis estadístico comprende un sistema de clasificación basado en puntuaciones.
11. El método de una cualquiera de las reivindicaciones 1 a 10, donde la mezcla de TACS se une a múltiples secuencias biomarcadoras tumorales de interés seleccionadas de entre un grupo que comprende AKT1, ALK, APC, AR, ARAF, ATM, BAP1, BARD1, BMPR1A, BRAF, BRCA1, BRCA2, BRIP1, CDH1, CDK4, CDKN2A (pl4ARF), CDKN2A (p16INK4a), CHEK2, CTNNB1, DDB2, DDR2, DICER1, EGFR, EPCAM, ERBB2, ERBB3, ERBB4, ERCC1, ERCC2, ERCC3, ERCC4, ERCC5, ESR1, FANCA, FANCB, FANCC, FANCD2, FANCE, FANCF, FANCG, FANCI, FANCL, FANCM, FBXW7, FGFR1, FGFR2, FLT3, FOXA1, FOXL2, GATA3, GNA11, GNAQ, GNAS, GREM1, HOXB13, IDH1, IDH2, JAK2, KEAP1, KIT, KRAS, MAP2K1, MAP3K1, MEN1, MET, MLH1, MPL, MRE11A, MSH2, MSH6, MTOR, MUTYH, MYC, MYCN, NBN, NPM1, NRAS, NTRK1, PALB2, PDGFRA, PIK3CA, PIK3CB, PMS2, POLD1, POLE, POLH, PTEN, RAD50, RAD51C, RAD51D, RAF1, RB1, RET, ROS1, RUNX1, SDHA, SDHAF2, SDHB, SDHC, SDHD, SLX4, SMAD4, SMARCA4, SPOP, STAT, STK11, TMPRSS2, TP53, VHL, XPA, XPC, EGFR_6240, KRAS_521, EGFR_6225, NRAS_578, NRAS_580, PIK3CA_763, EGFR_13553, EGFR_18430, BRAF_476, KIT_1314, NRAS_584, EGFR_12378 y combinaciones de las anteriores.
12. El método de una cualquiera una de las reivindicaciones 1 a 11, que comprende, además, hacer un diagnóstico del sujeto sobre la base de la detección de al menos una secuencia biomarcadora tumoral.
13. El método de una cualquiera una las reivindicaciones 1 a 12, que comprende, además, seleccionar un régimen de tratamiento para el sujeto sobre la base de la detección de al menos una secuencia biomarcadora tumoral.
14. El método de una cualquiera de las reivindicaciones 1 a 13, que comprende, además, vigilar la eficacia de un régimen de tratamiento brindado al sujeto sobre la base de la detección de al menos una secuencia biomarcadora tumoral.
ES18745511T 2017-07-07 2018-07-06 Análisis paralelo multiplexado con enriquecimiento de blancos para la evaluación tumoral Active ES2924548T3 (es)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US201762529779P 2017-07-07 2017-07-07
PCT/EP2018/068441 WO2019008172A1 (en) 2017-07-07 2018-07-06 ENRICHED MULTIPLEXED PARALLEL ANALYSIS IN TARGET FOR TUMOR BIOMARKER EVALUATION

Publications (1)

Publication Number Publication Date
ES2924548T3 true ES2924548T3 (es) 2022-10-07

Family

ID=63012987

Family Applications (1)

Application Number Title Priority Date Filing Date
ES18745511T Active ES2924548T3 (es) 2017-07-07 2018-07-06 Análisis paralelo multiplexado con enriquecimiento de blancos para la evaluación tumoral

Country Status (10)

Country Link
US (1) US20220228219A1 (es)
EP (2) EP4095258A1 (es)
AU (1) AU2018298443A1 (es)
CA (1) CA3068122A1 (es)
DK (1) DK3649260T3 (es)
ES (1) ES2924548T3 (es)
PL (1) PL3649260T3 (es)
PT (1) PT3649260T (es)
WO (1) WO2019008172A1 (es)
ZA (1) ZA201908559B (es)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20180073689A (ko) 2015-11-02 2018-07-02 블루프린트 메디신즈 코포레이션 Ret의 저해제
EP3773589B1 (en) 2018-04-03 2023-11-01 Blueprint Medicines Corporation Ret inhibitor for use in treating cancer having a ret alteration
US20210308134A1 (en) 2018-08-10 2021-10-07 Blueprint Medicines Corporation Treatment of egfr-mutant cancer
BE1029144B1 (fr) 2021-02-25 2022-09-20 Oncodna Méthode de caracterisation d'une tumeur à l'aide d'un séquençage ciblé
CN117524304B (zh) * 2024-01-08 2024-03-29 北京求臻医学检验实验室有限公司 实体瘤微小病灶残留的检测panel、探针组及其应用

Family Cites Families (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP3002338B1 (en) 2006-02-02 2019-05-08 The Board of Trustees of The Leland Stanford Junior University Non-invasive fetal genetic screening by digital analysis
US20080194414A1 (en) * 2006-04-24 2008-08-14 Albert Thomas J Enrichment and sequence analysis of genomic regions
WO2008027548A2 (en) * 2006-09-01 2008-03-06 Dana-Farber Cancer Institute, Inc. Microarray-based global chromatin structure mapping
EP2334812B1 (en) 2008-09-20 2016-12-21 The Board of Trustees of The Leland Stanford Junior University Noninvasive diagnosis of fetal aneuploidy by sequencing
US20110039304A1 (en) * 2009-08-12 2011-02-17 President And Fellows Of Harvard College Methods to Generate Oligonucleotide Pools and Enrich Target Nucleic Acid Sequences
CA2780827A1 (en) * 2009-12-31 2011-07-07 Ventana Medical Systems, Inc. Methods for producing uniquely specific nucleic acid probes
US20120270739A1 (en) 2010-01-19 2012-10-25 Verinata Health, Inc. Method for sample analysis of aneuploidies in maternal samples
ES2534758T3 (es) 2010-01-19 2015-04-28 Verinata Health, Inc. Métodos de secuenciación en diagnósticos prenatales
US20130123120A1 (en) * 2010-05-18 2013-05-16 Natera, Inc. Highly Multiplex PCR Methods and Compositions
EP3225697A3 (en) * 2010-12-30 2017-11-22 Foundation Medicine, Inc. Optimization of multigene analysis of tumor samples
EP3760732A1 (en) * 2011-02-09 2021-01-06 Natera, Inc. Methods for non-invasive prenatal ploidy calling
GB2526736A (en) * 2013-02-21 2015-12-02 Toma Biosciences Inc Methods, compositions, and kits for nucleic acid analysis
US20150203907A1 (en) * 2014-01-17 2015-07-23 Florida State University Research Foundation Genome capture and sequencing to determine genome-wide copy number variation
GB201414451D0 (en) * 2014-08-14 2014-10-01 Oxford Gene Technology Operations Ltd Hybridisation column for nucleic acid enrichment
WO2016040446A1 (en) * 2014-09-10 2016-03-17 Good Start Genetics, Inc. Methods for selectively suppressing non-target sequences
AU2016269332B2 (en) 2015-05-22 2021-08-12 Medicover Public Co Ltd Multiplexed parallel analysis of targeted genomic regions for non-invasive prenatal testing

Also Published As

Publication number Publication date
US20220228219A1 (en) 2022-07-21
PL3649260T3 (pl) 2022-10-17
WO2019008172A1 (en) 2019-01-10
EP4095258A1 (en) 2022-11-30
ZA201908559B (en) 2022-07-27
EP3649260B1 (en) 2022-05-11
AU2018298443A1 (en) 2020-01-16
CA3068122A1 (en) 2019-01-10
DK3649260T3 (en) 2022-08-08
PT3649260T (pt) 2022-05-30
EP3649260A1 (en) 2020-05-13

Similar Documents

Publication Publication Date Title
ES2924548T3 (es) Análisis paralelo multiplexado con enriquecimiento de blancos para la evaluación tumoral
US20210123103A1 (en) Analysis of nucleic acid sequences
ES2828279T3 (es) Detección y tratamiento de enfermedades que muestran heterogeneidad celular de enfermedad y sistemas y métodos para comunicar los resultados de las pruebas
Wadapurkar et al. Computational analysis of next generation sequencing data and its applications in clinical oncology
Hardiman et al. Intra-tumor genetic heterogeneity in rectal cancer
ES2687847T3 (es) Análisis mutacional de ADN de plasma para la detección de cáncer
Dietz et al. Low input whole-exome sequencing to determine the representation of the tumor exome in circulating DNA of non-small cell lung cancer patients
TWI611186B (zh) 多重妊娠之分子檢驗
TWI732771B (zh) Dna混合物中組織之單倍型甲基化模式分析
BR112018015913B1 (pt) método, implementado utilizando um sistema de computador compreendendo um ou mais processadores e sistema de memória, para determinar uma variação no número de cópia de uma sequência de ácido nucleico de interesse, e, sistema para avaliar o número de cópia de uma sequência de ácido nucleico de interesse
Hagemann et al. Design of targeted, capture-based, next generation sequencing tests for precision cancer therapy
ES2790533T3 (es) Análisis paralelo múltiplex de regiones genómicas blanco para análisis prenatales no invasivos
TW201307570A (zh) 與癌症有關之基因或分子變異之檢測
Casey et al. Next generation sequencing and a new era of medicine
Bonfiglio et al. Performance comparison of two commercial human whole-exome capture systems on formalin-fixed paraffin-embedded lung adenocarcinoma samples
ES2920280T3 (es) Enriquecimiento de regiones genómicas blanco para análisis paralelo multiplexado
ES2925394T3 (es) Análisis paralelo multiplexado con enriquecimiento de blancos para la evaluación del riesgo de portar alteraciones genéticas
Fischer et al. Mutation analysis of nine chordoma specimens by targeted next-generation cancer panel sequencing
ES2924224T3 (es) Análisis paralelo multiplexado con enriquecimiento de blancos para la evaluación de muestras de ADN fetal
CN113748467A (zh) 基于等位基因频率的功能丧失计算模型
KR20200044123A (ko) 암 환자에서의 향상된 정밀도를 위한 포괄적 게놈 트랜스크립톰 종양-정상 유전자 패널 분석 (comprehensive genomic transcriptomic tumor-normal gene panel analysis for enhanced precision in patients with cancer)
ES2625079T3 (es) Composiciones y métodos por PCR altamente multiplexada
WO2022126938A1 (zh) 一种检测多核苷酸变异的方法
Javanmardi Genomic instability and genetic heterogeneity in neuroblastoma
Javanmardi Genomic instability and genetic heterogeneity in neuroblastoma tumours