ES2906023T3 - Nuevos marcadores para detectar inestabilidad microsatelital en cáncer y determinar la letalidad sintética con inhibición de la vía de reparación por escisión de bases de ADN - Google Patents

Nuevos marcadores para detectar inestabilidad microsatelital en cáncer y determinar la letalidad sintética con inhibición de la vía de reparación por escisión de bases de ADN Download PDF

Info

Publication number
ES2906023T3
ES2906023T3 ES13717473T ES13717473T ES2906023T3 ES 2906023 T3 ES2906023 T3 ES 2906023T3 ES 13717473 T ES13717473 T ES 13717473T ES 13717473 T ES13717473 T ES 13717473T ES 2906023 T3 ES2906023 T3 ES 2906023T3
Authority
ES
Spain
Prior art keywords
rtu
regions
nucleotides
homopolymeric
affected
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
ES13717473T
Other languages
English (en)
Inventor
Diether Lambrechts
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Vlaams Instituut voor Biotechnologie VIB
Life Sciences Research Partners vzw
Original Assignee
Vlaams Instituut voor Biotechnologie VIB
Life Sciences Research Partners vzw
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Vlaams Instituut voor Biotechnologie VIB, Life Sciences Research Partners vzw filed Critical Vlaams Instituut voor Biotechnologie VIB
Application granted granted Critical
Publication of ES2906023T3 publication Critical patent/ES2906023T3/es
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6876Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
    • C12Q1/6883Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material
    • C12Q1/6886Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material for cancer
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61PSPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
    • A61P35/00Antineoplastic agents
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61PSPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
    • A61P35/00Antineoplastic agents
    • A61P35/02Antineoplastic agents specific for leukemia
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61PSPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
    • A61P43/00Drugs for specific purposes, not provided for in groups A61P1/00-A61P41/00
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/106Pharmacogenomics, i.e. genetic variability in individual responses to drugs and drug metabolism
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/112Disease subtyping, staging or classification
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/136Screening for pharmacological compounds
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/154Methylation markers
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/156Polymorphic or mutational markers
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/158Expression markers

Landscapes

  • Health & Medical Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Organic Chemistry (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Engineering & Computer Science (AREA)
  • Analytical Chemistry (AREA)
  • Genetics & Genomics (AREA)
  • Wood Science & Technology (AREA)
  • Pathology (AREA)
  • Zoology (AREA)
  • Immunology (AREA)
  • General Health & Medical Sciences (AREA)
  • Oncology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Biophysics (AREA)
  • Microbiology (AREA)
  • Hospice & Palliative Care (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Biochemistry (AREA)
  • Molecular Biology (AREA)
  • Biotechnology (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • General Chemical & Material Sciences (AREA)
  • Medicinal Chemistry (AREA)
  • Public Health (AREA)
  • Nuclear Medicine, Radiotherapy & Molecular Imaging (AREA)
  • Pharmacology & Pharmacy (AREA)
  • Veterinary Medicine (AREA)
  • Animal Behavior & Ethology (AREA)
  • Hematology (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
  • Investigating Or Analysing Biological Materials (AREA)
  • Medicines That Contain Protein Lipid Enzymes And Other Medicines (AREA)

Abstract

Un procedimiento para diagnosticar el estado de MSI de un tumor, que comprende determinar la presencia de un indel en al menos dos regiones homopoliméricas en una muestra del ADN del tumor, en el que las, al menos dos, regiones homopoliméricas son - al menos dos regiones homopoliméricas presentes en las regiones 5' UTR o 3' UTR de los genes enumerados en la tabla 1, o - al menos tres regiones homopoliméricas seleccionadas de las presentes en los exones de los genes enumerados en la tabla 2 y/o presentes en las regiones 5' UTR o 3' UTR de los genes enumerados en la tabla 1, en el que dichas regiones homopoliméricas son regiones de microsatélites que son repeticiones mononucleotídicas de al menos 6 nucleótidos y que no exceden de 20 nucleótidos, y en el que la presencia de un indel en el 2% o más de las regiones homopoliméricas es indicativa de MSI.

Description

DESCRIPCIÓN
Nuevos marcadores para detectar inestabilidad microsatelital en cáncer y determinar la letalidad sintética con inhibición de la vía de reparación por escisión de bases de ADN
Campo de la invención
La presente solicitud se refiere al campo del cáncer, en particular a tumores deficientes en la reparación de errores de apareamiento (MMR). En el presente documento se presentan nuevos marcadores que tienen una alta sensibilidad para detectar si un tumor es deficiente en la reparación de errores de apareamiento o no. Los marcadores son, en particular, mutaciones en regiones de microsatélites. En consecuencia, se proporcionan procedimientos para diagnosticar la inestabilidad microsatelital de un tumor, que comprenden determinar la presencia de estos marcadores. Además, se proporcionan kits para detectar la presencia de estos marcadores (o subconjuntos de los mismos) en una muestra.
Es interesante señalar que las mutaciones afectan preferentemente a la vía de reparación de roturas de doble hebra (DSB) mediante recombinación homóloga (HR), y la reparación de DSB está funcionalmente alterada en los tumores deficientes en MMR. En el presente documento se muestra que estos tumores son sensibles a la inducción de roturas monocatenarias por inhibición farmacológica de la enzima poli ADP ribosa polimerasa (inhibición de PARP). En consecuencia, se proporcionan nuevas modalidades de tratamiento para tumores deficientes en MMR, basadas en la interacción letal sintética entre MMR y PARP.
Antecedentes
La forma de inestabilidad genómica asociada con la reparación defectuosa de errores de apareamiento del ADN en tumores se denomina inestabilidad microsatelital (MSI). La inestabilidad microsatelital (MSI) es un cambio clonal en el número de unidades de nucleótidos de ADN repetidas en microsatélites. Aparece generalmente en tumores con genes de reparación de errores de apareamiento (MMR) defectuosos: el fallo del sistema MMR de ADN para reparar los errores que se producen durante la replicación del ADN da como resultado una acumulación acelerada de mutaciones de un solo nucleótido y alteraciones en la longitud de secuencias de microsatélites repetitivas simples que se producen de forma ubicua a lo largo del genoma. La deficiencia en MMR representa una causa bien establecida del síndrome de Lynch, que es un trastorno hereditario autosómico dominante de susceptibilidad al cáncer que es responsable del 2% al 5% de los cánceres endometriales (EM) o colorrectales (CCR). El síndrome de Lynch está provocado por mutaciones o deleciones en los genes de la vía MMR (MLH1, MSH2, MSH3, MSH6 o PMS2) (Jiricny, 2006). Además, el silenciamiento epigenético de MLH1, a menudo denominado síndrome de Lynch "esporádico", contribuye a otro 15% de estos tumores (Kuismanen et al., 2002). Una mutación en la 3' UTR de MLH1 parece conferir una deficiencia en la reparación de errores de apareamiento en un subconjunto de pacientes con leucemia (Mao et al. 2008, J Biol Chem 283: 3211-3216). La deficiencia en MMR también se ha descrito en una minoría de cánceres de ovario, páncreas, gástricos, leucémicos y varios otros cánceres. La deficiencia en la maquinaria MMR da lugar a errores de replicación del ADN en el tejido tumoral, pero no en el tejido circundante normal. En particular, los errores somáticos se acumulan como mutaciones de inserción/deleción en repeticiones mononucleotídicas y dinucleotídicas, un fenómeno conocido como inestabilidad microsatelital (MSI) (Pinol et al., 2005).
Los tumores deficientes en MMR muestran un pronóstico y un resultado terapéutico diferente después de una quimioterapia estándar (de la Chapelle y Hampel, 2010), tal como 5-fluoracilo y los agentes alquilantes tales como la temozolomida. Los pacientes con CCR no tratados con tumores deficientes en MMR tienen un pronóstico moderadamente mejor, pero no parecen beneficiarse de la quimioterapia adyuvante basada en 5-fluorouracilo, que es la quimioterapia de primera elección para el CCR. En particular, en los tumores deficientes en MMR se toleran los errores de apareamiento inducidos por el 5-fluorouracilo, lo que da lugar a incapacidad para inducir la muerte celular (Hewish et al., 2010). Los tumores deficientes en MMR también son resistentes al cisplatino y al carboplatino, que son quimioterapias de uso frecuente en EM (Hewish et al., 2010). Además, los tumores deficientes en MMR pueden ser resistentes a las terapias dirigidas, incluidas las terapias anti-EGFR y anti-VEGF, porque adquieren mutaciones secundarias en genes que activan vías de señalización alternativas o posteriores. Por ejemplo, los tumores MMR pueden adquirir mutaciones en genes de reparación de rotura de doble hebra (por ejemplo, MRE11, ATR y RAD50), oncogenes o supresores de tumores conocidos (por ejemplo, PIK3CA o PTEN). Otra posibilidad es que el silenciamiento epigenético de MLH1 coincida con mutaciones particulares, tales como la mutación BRAF V600E (Ogino et al., 2012), que representa un predictor negativo establecido de respuesta a terapias dirigidas anti-EGFR en CCR avanzado (De Roock et al., 2010).
Los esfuerzos para individualizar el tratamiento de tumores deficientes en MMR se han centrado en identificar interacciones letales sintéticas con la vía MMR. En particular, los estudios revelaron que un aumento del daño oxidativo (por exposición a metotrexato o silenciamiento de PINK1 (Martin et al., 2011)) y la interferencia con la vía de reparación por escisión de bases (BER) (por inhibición de la ADN polimerasa y o p (Martin et al., 2010)) sensibilizan tumores deficientes en MMR. En particular, en los tumores MMR, el daño oxidativo induce lesiones en el ADN de 8-oxoguanina (8-oxoG), que no se reparan de forma suficiente ni por la vía BER ni por la vía MMR, lo que genera principalmente transversiones de dinucleótidos GC a TA a nivel del ADN, lo que da lugar a la muerte celular. Además, se ha planteado la hipótesis de que existe una frecuencia de mutaciones máxima que un tumor puede tolerar, por encima de la cual un aumento adicional de mutaciones sería perjudicial. Por lo tanto, se ha propuesto tratar adicionalmente los tumores MMRcon análogos de nucleósidos mutagénicos hasta que se obtenga un nivel crítico de mutaciones que dé como resultado una ablación del tumor similar a una catástrofe por error. Sin embargo, hasta la fecha, estos esfuerzos no se han traducido en opciones de tratamiento clínicamente eficaces. Alternativamente, las mutaciones secundarias que se producen como resultado de la deficiencia en MMR también pueden ser un objetivo (Dorard et al., 2011). No obstante, los estudios que caracterizan los espectros de mutación secundaria de tumores deficientes en MMR se han limitado a observaciones en uno o unos pocos loci informadores, o se han centrado exclusivamente en mutaciones en secuencias de punto caliente conocidas. Aunque fueron capaces de establecer que las mutaciones afectan con mayor frecuencia a las repeticiones mononocleotídicas y dinucleotídicas, el espectro de mutaciones somáticas que se produce en estos tumores sigue estando caracterizado deficientemente.
Dado que la presencia de deficiencia en MMR principalmente en tumores colorrectales y endometriales representa una forma familiar de cáncer, y dado que los tumores presentan espectros de mutación característicos de deficiencia en MMR, se utilizan generalmente pruebas diagnósticas que evalúan la deficiencia en MMR.
Con mucho, el procedimiento más común para detectar MSI es medir la longitud de un amplicón de reacción en cadena de la polimerasa que contiene el microsatélite completo. Esto requiere ADN, un par de cebadores de los cuales uno a menudo está marcado de forma fluorescente en los extremos, un secuenciador y un programa informático adecuado. Alternativamente, si el amplicón está secuenciado, se puede contar sencillamente el número de unidades de repetición. La MSI también puede diagnosticarse indirectamente mediante la detección de la pérdida de tinción por inmunohistoquímica (IHC) de uno de los genes de reparación de errores de apareamiento, dado que esto también apunta a una anomalía en la reparación de errores de apareamiento. Los procedimientos inmunohistoquímicos y genéticos se caracterizan por un número considerable de falsos negativos y, por este motivo, las evaluaciones combinadas a nivel inmunohistoquímico y genético se realizan en un entorno de diagnóstico de rutina.
Existen al menos 500.000 microsatélites en el genoma humano y, dado que una MMR defectuosa no afecta a todos los microsatélites de un tumor determinado, es importante estudiar más de un microsatélite y estudiar los microsatélites que se ven afectados por inestabilidad con frecuencia. Como los marcadores de microsatélites se eligieron originariamente de forma bastante aleatoria por los investigadores, basándose en sus propios experimentos, se celebró una conferencia en Bethesda, MD, para discutir los problemas y hacer sugerencias para promover la coherencia entre estudios. Esta dio como resultado una recomendación para un panel marcador "estándar de oro", conocido como el panel Bethesda 9. Este panel consta de tres repeticiones dinucleotídicas (D2S123, D5S346, D17S250) y dos repeticiones mononucleotídicas (BAT26, BAT25) y sigue siendo la prueba estándar para MSI. Se propuso considerar un tumor positivo en MSI si el 40% o más de los marcadores analizados eran inestables (también denominados de MSI alto o MSI-H). Si se utiliza el panel de cinco marcadores, esto significa que se denomina MSI cuando al menos dos de los mismos son positivos; no obstante, a menudo cuatro o los cinco son positivos en tumores con MSI. Los tumores que dan negativo en los cinco marcadores se denominan estables en microsatélites (MSS). Para los tumores que dieron positivo en 1 marcador tumoral (o en < 30% de los marcadores tumorales), se propuso el término MSI-L9. Una repetición T-20 en la 3' UTR del gen MTX1 se notificó como un marcador MSI adicional para el cáncer colorrectal (Morandi et al. 2011, Int J Colorectal Dis 27: 647-656).
Aunque el panel Bethesda todavía se considera el criterio a seguir, se sabe que tiene una sensibilidad bastante baja (también dependiendo de qué gen MMR esté mutado). Por ejemplo, para pacientes con mutaciones MLH1, la sensibilidad es del 80%, pero para pacientes con mutaciones MSH6, es de solo el 55%10. Esto se puede mejorar añadiendo marcadores10 adicionales, pero aún así, los pacientes con MSI-H real pueden presentarse como MSI-L o MSS. Esto no deja de ser significativo, ya que el estado de MSI es importante en el pronóstico (generalmente es mejor para los pacientes con MSI-H11), el tratamiento (los tumores MSI-H no responden a la terapia adyuvante basada en fluorouracilo (FU), ya que se necesita un sistema MMR intacto para inducir la apoptosis de células con ADN modificado por FU11-13) y el diagnóstico de varios cánceres (por ejemplo, los del síndrome de Lynch), y los pacientes con cáncer colorrectal (CCR) recién diagnosticado se criban de forma rutinaria para determinar el estado de MSI. Los inhibidores de PARP (poli (ADP-ribosa) polimerasa) en el contexto de MSI y mutaciones de genes de reparación de ADN se abordan por Gaymes et al. 2010 (Blood 116:513) y Vilar et al. 2011 (Cancer Res 71: 2632-2642; de forma específicamente relacionada con la deficiencia en MRE11 en cáncer colorrectal). Se ha divulgado una clase específica de inhibidores de PARP para el tratamiento de síndrome mielodisplásico y leucemia mieloide aguda (documento WO2012/166151).
Otra desventaja significativa es que el panel Bethesda solo se recomienda para el cáncer de colon, aunque se conocen otros cánceres que muestran MSI9. Parece que esto se debe al hecho de que se identificó de forma bastante aleatoria que los cinco marcadores estaban mutados en cáncer de colon inestable en microsatélites, pero no se conoce ningún mecanismo biológico. En el contexto del síndrome de Lynch y MSI, se redactaron directrices Bethesda revisadas, tal como se aborda por Umar et al. 2004 (J Nat Cancer Inst 96: 261-268).
Otra desventaja es de naturaleza técnica. El panel de marcadores Bethesda contiene repeticiones bastante largas (por ejemplo, el marcador BAT26 contiene una repetición A de 26 nucleótidos), y los productos de PCR típicos utilizados para determinar el estado de MSI se encuentran muy por encima de 100 pb. Para secuenciar con precisión estos fragmentos y determinar la longitud exacta de la repetición, normalmente se utilizan procedimientos de secuenciación basados en Sanger junto con electroforesis en gel multicapilar. Sin embargo, cada vez más laboratorios utilizan la secuenciación denominada de "próxima generación", que emplea técnicas de secuenciación masivamente paralelas. Si bien son más económicas, estas tecnologías utilizan lecturas más cortas y no pueden utilizarse para detectar inestabilidad microsatelital en el panel de marcadores Bethesda. Como consecuencia, los laboratorios deben mantener dos secuenciadores: uno para el cribado del panel de marcadores Bethesda y otro para otros experimentos. Sería mucho más conveniente si no se requiriera un secuenciador especial para determinar el estado de MSI y esta determinación pudiera realizarse en equipos de uso común. El documento US6664064 se refiere a un procedimiento para el análisis de la curva de fusión de productos de PCR repetitivos.
Por lo tanto, sería ventajoso encontrar marcadores de inestabilidad microsatelital que fueran más sensibles que el panel Bethesda que se utiliza actualmente y que conservaran al mismo tiempo la especificidad para MSI. De forma ideal, estos marcadores se encuentran utilizando procedimientos de detección no sesgados (es decir, que observen la totalidad del genoma en lugar de verificar regiones específicas que se supone que están alteradas en el contexto de la enfermedad). Una ventaja adicional sería la identificación de marcadores que fueran indicativos de MSI como tales. Es decir, que fueran un marcador general de inestabilidad microsatelital, y no solo de inestabilidad microsatelital en el cáncer de colon (como es el caso del panel Bethesda). De hecho, esto evitaría la necesidad de encontrar nuevos marcadores para cada cáncer en el que pueda haber presencia de MSI. Una ventaja adicional sería la identificación de marcadores cuyo estado se pudiera determinar independientemente de la tecnología. Más particularmente, marcadores que pudieran identificarse utilizando tecnologías de secuenciación de próxima generación (en lugar de identificarse únicamente mediante secuenciación de Sanger). De esta forma, los laboratorios no necesitan aferrarse a un aparato que solo utilizan para verificar los marcadores del panel Bethesda. Además, también existe una gran necesidad de optimizar aún más las terapias específicas de MMR, por ejemplo para predecir de forma más racional su respuesta a las terapias dirigidas. Además, existe la necesidad de encontrar formas de superar la resistencia a las terapias de uso común, por ejemplo mediante la identificación de terapias a las que los tumores deficientes en MMR sean sensibles, incluso aunque sean resistentes al tratamiento estándar.
Sumario
Es un objeto de la invención proporcionar mejores marcadores para determinar el estado de MSI de un cáncer particular. Para asegurar que la detección no fuera sesgada, informamos en el presente documento, por primera vez, de la secuenciación de próxima generación de tumores deficientes en la reparación de errores de apareamiento. Los marcadores se eligen de forma que no estén en microsatélites largos, de modo que su detección no dependa de la metodología de secuenciación de Sanger. Además, para ampliar la aplicabilidad de marcadores, se evaluaron marcadores en diferentes tipos de tumores de modo que representaran marcadores de inestabilidad microsatelital en varios cánceres, y no marcadores específicos del tipo de cáncer. Finalmente, se seleccionaron marcadores que se encontraran de forma recurrente en los tumores. Es interesante señalar que muchas de las mutaciones (de punto caliente) recurrentes agrupadas en genes afectan a la vía de reparación de roturas de doble hebra de ADN, y podría demostrarse que esta vía también se ve afectada funcionalmente. Como resultado, se pudo demostrar que los tumores positivos a estos marcadores son sensibles a la inhibición con inhibidores de enzimas de reparación por escisión de bases de ADN, tales como los inhibidores de PARP: esto da como resultado una interacción letal sintética.
Tal como se ampliará en la sección Ejemplos, la secuenciación de próxima generación permitió la identificación de un nuevo panel de marcadores que puede utilizarse para detectar deficiencia en MMR y que estaba de acuerdo con estas condiciones.
Los marcadores identificados se pueden dividir en dos clases: indeles presentes en regiones de microsatélites de regiones codificantes (es decir, exones) e indeles presentes en regiones no codificantes (más particularmente regiones 5' y 3' UTR) de genes específicos.
En consecuencia, en el presente documento se proporcionan procedimientos para diagnosticar el estado de MSI de un tumor, que comprenden determinar la presencia de un indel en al menos dos regiones homopoliméricas en una muestra del ADN del tumor, en los que las, al menos dos, regiones homopoliméricas son
- al menos dos regiones homopoliméricas presentes en las regiones 5' UTR o 3' UTR de los genes enumerados en la tabla 1, o
- al menos tres regiones homopoliméricas seleccionadas de las presentes en los exones de los genes enumerados en la tabla 2 y/o presentes en las regiones 5' UTR o 3' UTR de los genes enumerados en la tabla 1,
en los que dichas regiones homopoliméricas son regiones de microsatélites que son repeticiones mononucleotídicas de al menos 6 nucleótidos y que no exceden de 20 nucleótidos, y en los que la presencia de un indel en el 2% o más de las regiones homopoliméricas es indicativa de MSI.
Según otras formas de realización particulares más, las regiones de microsatélites son idénticas a las regiones de microsatélites identificadas en la tabla 1 o 2 (es decir, las, al menos dos, regiones de microsatélites se seleccionan de la lista de regiones de microsatélites enumeradas en la tabla 1 o 2).
Según formas de realización específicas, las regiones de microsatélites presentes en las UTR pueden seleccionarse de la tabla 4 en lugar de de la tabla 1. Según otras formas de realización específicas, estas regiones de microsatélites se pueden seleccionar de la tabla 6 en lugar de de la tabla 1.
Según formas de realización específicas alternativas pero no exclusivas, las regiones de microsatélites presentes en los exones de genes se pueden seleccionar de la tabla 5 en lugar de de la tabla 2. Según otras formas de realización específicas, las regiones se pueden seleccionar de la tabla 7 en lugar de de la tabla 2.
Según formas de realización muy particulares, las regiones de microsatélites pueden seleccionarse de los genes enumerados en la tabla 8.
Según formas de realización particulares, el cáncer o el tumor para el que se diagnostica el estado de MSI se selecciona del grupo de: cáncer colorrectal, cáncer endometrial, cáncer de ovario, cáncer gástrico, leucemia y un tumor del síndrome de Lynch.
Como los indeles presentes en microsatélites de regiones no codificantes (tales como las regiones 5' y 3' UTR) están sujetos a menos presión de selección que los indeles presentes en regiones codificantes (dado que estos últimos causan mutaciones de desplazamiento de marco que dan como resultado una traducción completamente diferente de la original), pudo demostrarse que los indeles presentes en microsatélites de regiones no codificantes son marcadores más fiables de MSI en todos los tipos de cáncer. De hecho, más del 50% de los marcadores no codificantes identificados en el presente documento obtienen resultados positivos cuando se someten a ensayo en tumores deficientes en MMR con MSI comprobada. Para los marcadores exónicos, todavía más de 1/3 obtuvo resultados positivos cuando se sometieron a ensayo en estos tumores. Esto explica por qué se prevé utilizar al menos tres marcadores cuando al menos parte de los marcadores se encuentren en regiones exónicas.
También se prevé particularmente utilizar combinaciones de marcadores presentes en regiones exónicas y marcadores presentes en regiones no codificantes. Por ejemplo, según formas de realización particulares, las, al menos dos, regiones de microsatélites en las que se determina la presencia de un indel son al menos dos regiones de microsatélites seleccionadas de las presentes en las regiones 5' UTR o 3' UTR de los genes enumerados en la tabla 1 y en al menos dos regiones de microsatélites seleccionadas de las presentes en los exones de los genes enumerados en la tabla 2.
Según formas de realización específicas, se prevé utilizar más marcadores que al menos dos o tres. El uso de más marcadores normalmente producirá un diagnóstico más preciso (aunque este beneficio deberá compensarse con un aumento de los costes. Además, una vez que se supera un determinado umbral de marcadores, el valor relativo de añadir otro marcador es limitado, ya que no necesariamente añade información). Por lo tanto, según formas de realización particulares, se utilizan al menos cuatro, cinco, seis, siete u ocho marcadores (es decir, indeles presentes en regiones de microsatélites seleccionadas de entre las presentes en los exones de los genes enumerados en la tabla 2 y/o las presentes en las regiones 5' UTR o 3' UTR de los genes enumerados en la tabla 1). Según otras formas de realización particulares, la presencia de al menos 8, 9, 10, 11 o 12 indeles en regiones de microsatélites seleccionadas de entre las presentes en los exones de los genes enumerados en la tabla 2 y/o las presentes en las regiones 5' UTR o 3' UTR de los genes enumerados en la tabla 1 se utilizan para determinar el estado de MSI. Según incluso otras formas de realización particulares, se utilizan todavía más marcadores, por ejemplo al menos 15, al menos 20, al menos 25, al menos 30, al menos 35, al menos 40 marcadores o al menos 50 marcadores.
Según formas de realización específicas, al menos un marcador utilizado es un marcador exónico presente en un gen no asociado previamente con cáncer, o en un gen que no se sabía previamente que estuviera afectado en tumores deficientes en MMR. Por lo tanto, se prevé que el microsatélite o los microsatélites seleccionados de entre los presentes en los exones de los genes enumerados en la tabla 2 comprendan al menos un microsatélite presente en un gen seleccionado de la lista de: SETD1B, RBMXL1, CCDC150, OR7E24, C15orf40, KIAA2018, LTN1, SLC22A9, CDH26, DDX27, EXOSC9, FAM111B, KIAA0182, KIAA1919, MIS18BP1, PRRT2, TMEM60, AQP7, ARV1, CCDC168, ELAVL3, F8, FETUB, HPS1, NBEAL1, P4HTM, PIGB, RBM43, RG9MTD1, SRPR, y TMEM97. Según formas de realización aún más específicas, al menos un microsatélite está presente en un gen seleccionado de la lista de: SETD1B, TMEM60, d Dx 27, eX o SC9, FAM111B y KIAA1919. Según formas de realización alternativas, SEC31A, CNOT2, RNF145, RNPC3, SLC35F5, TMBIM4, CD3G, DOCK3, MYO10 y PRRG1 también pueden utilizarse en estas listas.
Según formas de realización específicas alternativas, al menos un marcador utilizado es un indel presente en un homopolímero de entre 10 y 15 bases de repetición situado en una región 5' o 3' UTR.
Un panel de marcadores particularmente previsto son los microsatélites presentes en los genes que se muestran en la tabla 3. Por lo tanto, según estas formas de realización, se proporcionan procedimientos en los que se determina la presencia de un indel en al menos dos regiones de microsatélites en una muestra del ADN tumoral, en los que las, al menos dos, regiones de microsatélites son regiones de microsatélites de los 56 genes que se muestran en la tabla 3.
Según formas de realización particulares, el estado de MSI se puede caracterizar además de la forma siguiente: si el 17% o más de las regiones de microsatélites estudiadas contienen un indel, el tumor es MSI-H, si entre el 2% y el 17% de las regiones de microsatélites contiene un indel, el tumor es MSI-L, y si menos del 2% de las regiones de microsatélites contienen un indel, el tumor es estable en microsatélites (MSS). A modo de ejemplo, para un panel de 56 marcadores, si 0 o 1 marcadores son positivos, el tumor se clasifica como MSS, para 2 a 9 marcadores positivos, el tumor es MSI-L, y para 10 o más marcadores positivos, el tumor se clasifica como MSI-H. Alternativamente, el intervalo del panel Bethesda se puede extrapolar (0 de 10 marcadores positivos es MSS, 1 o 2 de cada 10 marcadores positivos es MSI-L, 3 o más marcadores positivos es MSI-H; que corresponde a límites de entre el 1 y el 9% de marcadores positivos para la distinción entre MSS y MSI-L y de más del 20% de marcadores positivos para la clasificación como MSI-H).
Según un aspecto específico, los marcadores de indeles de microsatélites proporcionados en el presente documento pueden detectarse independientemente de la tecnología utilizada. Sin embargo, se prevé particularmente que la determinación de la presencia de un indel no se realice mediante un procedimiento basado en la secuenciación de Sanger. Esto se debe a que el proceso de detección de la inestabilidad microsatelital utilizando el panel de marcadores Bethesda se realiza normalmente mediante la secuenciación de Sanger, un protocolo que resulta bastante engorroso. Según formas de realización adicionales, se prevé particularmente determinar la presencia de un indel por medio de procedimientos de extensión de un único par de bases (tales como Sequenom MassArray), tecnologías de hibridación de ADN (por ejemplo, Taqman), análisis de la curva de fusión (incluido HRM) o una tecnología similar.
Según otro aspecto, se proporciona el uso de un panel de biomarcadores tal como se describe en las reivindicaciones 18 a 24 para determinar la MSI en una muestra tumoral. Según formas de realización particulares, el panel de biomarcadores comprende al menos la mitad de las regiones de microsatélites enumeradas en la tabla 3. Según otras formas de realización particulares más, el panel de biomarcadores está representado por las 56 regiones de microsatélites enumeradas en la tabla 3.
En particular, se prevé que este panel de biomarcadores pueda utilizarse para detectar el estado de MSI en un cáncer. En consecuencia, el uso de este panel de biomarcadores se proporciona en el diagnóstico de inestabilidad microsatelital en cáncer.
En consecuencia, los paneles de biomarcadores descritos en el presente documento se proporcionan para su uso como diagnóstico. Incluso más particularmente, los paneles de biomarcadores tal como se describen en el presente documento se proporcionan para su uso en el diagnóstico de inestabilidad microsatelital en cáncer.
Tal como se muestra en la sección Ejemplos, los marcadores de indeles proporcionados en el presente documento están enriquecidos en genes implicados en las vías de reparación de roturas de doble hebra de ADN y afectan a su funcionalidad. Como consecuencia, las células en las que están presentes estos marcadores son sensibles a letalidad sintética por inhibición de la reparación por escisión de bases de ADN. Esto ofrece nuevas oportunidades terapéuticas, ya que los tumores positivos en MSI a menudo son resistentes a las quimioterapias estándar utilizadas.
En consecuencia, en un aspecto adicional, se proporcionan procedimientos de cribado de la sensibilidad de las células cancerosas al tratamiento con un inhibidor de una enzima de reparación por escisión de bases de ADN, que comprende determinar el estado de MSI en las células cancerosas. Según formas de realización particulares, el inhibidor de una enzima de reparación por escisión de bases de ADN es un inhibidor de PARP. Según formas de realización específicas, las células cancerosas son de un cáncer seleccionado de la lista de: cáncer colorrectal, cáncer endometrial, cáncer de ovario, cáncer gástrico, leucemia y un tumor del síndrome de Lynch. Aunque estos procedimientos pueden realizarse en principio in vivo, ex vivo e in vitro, se prevé particularmente que se realicen in vitro.
Según formas de realización particulares, la presencia de MSI es indicativa de la sensibilidad de las células cancerosas al tratamiento con un inhibidor de una enzima de reparación por escisión de bases de ADN; es decir, las células cancerosas morirán, dejarán de crecer o proliferarán menos cuando se traten con dicho inhibidor.
Según formas de realización específicas, las células cancerosas son células obtenidas de un sujeto, y el cribado de la sensibilidad al tratamiento con un inhibidor de una enzima de reparación por escisión de bases de ADN se utiliza para guiar el tratamiento del sujeto. Según formas de realización alternativas, el cribado de sensibilidad se usa para estratificar o clasificar al sujeto para un ensayo clínico.
Según formas de realización particulares, la presencia de MSI se establece mediante un procedimiento descrito en el presente documento. Según formas de realización particulares adicionales, la presencia de MSI se establece utilizando un panel de biomarcadores tal como se describe en las reivindicaciones 18 a 24.
Por lo tanto, no solo se proporcionan procedimientos para detectar la sensibilidad de las células cancerosas, sino también procedimientos para diagnosticar la sensibilidad de un sujeto con cáncer al tratamiento con un inhibidor de una enzima de reparación por escisión de bases de ADN, que comprende las etapas siguientes:
- determinar el estado de MSI en una muestra de células cancerosas obtenidas del sujeto;
- correlacionar el estado de MSI con la sensibilidad al tratamiento con un inhibidor de una enzima de reparación por escisión de bases de ADN, siendo la presencia de MSI indicativa de sensibilidad al tratamiento.
Opcionalmente, estos procedimientos contienen una etapa adicional de obtención de una muestra de células cancerosas del sujeto (antes de la etapa de determinación). La determinación del estado de MSI generalmente se realiza en las células de la muestra obtenida. En particular, se prevé que la determinación del estado de MSI en una muestra de células cancerosas se realice in vitro.
Según formas de realización particulares, el inhibidor de una enzima de reparación por escisión de bases de ADN es un inhibidor de PARP. Según formas de realización específicas, las células cancerosas son de un cáncer seleccionado de la lista de: cáncer colorrectal, cáncer endometrial, cáncer de ovario, cáncer gástrico, leucemia y un tumor del síndrome de Lynch (o cualquier otro tumor del espectro del síndrome de Lynch). Según formas de realización particulares, la presencia de MSI se establece mediante un procedimiento descrito en el presente documento.
Según formas de realización particulares adicionales, la presencia de MSI se establece utilizando un panel de biomarcadores tal como se describe en las reivindicaciones 18 a 24 en el presente documento.
También se prevé que los procedimientos según este aspecto pueden contener una etapa adicional de tratamiento del sujeto con un inhibidor de una enzima de reparación por escisión de bases del ADN (si el sujeto es sensible a dicho tratamiento, según se ha determinado mediante el estado de MSI).
Por lo tanto, también se proporcionan procedimientos para tratar un cáncer con MSI en un sujeto que lo necesite, que comprenden:
- establecer la presencia de MSI en el cáncer;
- administrar un inhibidor de una enzima de reparación por escisión de bases de ADN al sujeto.
Se prevé que el cáncer se trate mediante la administración del inhibidor al sujeto. Los procedimientos pueden presentar opcionalmente una etapa adicional de obtención de una muestra de células cancerosas del sujeto (antes de la etapa de determinación de MSI y de establecer la presencia de MSI).
Según formas de realización particulares, el inhibidor de una enzima de reparación por escisión de bases de ADN es un inhibidor de PARP. Según formas de realización específicas, las células cancerosas son de un cáncer seleccionado de la lista de: cáncer colorrectal, cáncer endometrial, cáncer de ovario, cáncer gástrico, leucemia y un tumor del síndrome de Lynch. Según formas de realización particulares, la presencia de MSI se establece mediante un procedimiento descrito en el presente documento.
Según formas de realización particulares adicionales, la presencia de MSI se establece utilizando un panel de biomarcadores tal como se describe en las reivindicaciones 18 a 24 en el presente documento.
Breve descripción de las figuras
Figura 1. Sustituciones somáticas e indeles en el hipermutador deficiente en MSH6.
(a) Frecuencias de mutación promedio (número de mutaciones por base, mpb) en el tumor deficiente en MMR y en dos tumores competentes en MMR. (b) Frecuencia de mutación estratificada por indeles y sustituciones. (c-d) La fracción de indeles (c) y sustituciones (d) observada en microsatélites, homopolímeros (longitud superior a 5 pb), homopolímeros cortos (longitud de 3 a 5 pb) y "regiones no en repetición" en comparación con su fracción esperada en estas regiones. (e-f) Frecuencias de indeles (e) y sustituciones (f) en el tumor deficiente en MMR estratificadas en regiones exónicas, intergénicas e intrónicas.
Figura 2. Sustitución somática y patrones de indeles en el hipermutador deficiente en MSH6.
(a) Patrones de sustitución somática en secuencias de genoma completo de melanoma, cáncer de pulmón de células pequeñas, cáncer de pulmón de células no pequeñas, tumor endometrial deficiente en MMR, dos tumores endometriales competentes en MMR y ADN de línea germinal correspondiente (glóbulos blancos periféricos) del paciente con tumor endometrial. (b-c) Estratificación de la frecuencia de sustitución somática en tumores deficientes en MMR (b) y competentes en MMR (c) por dinucleótido, estando el primer nucleótido mutado. Las frecuencias de sustitución normalizadas reflejan el número de dinucleótidos afectados dividido por el número de esos dinucleótidos en el genoma completo, expresado como porcentaje de las frecuencias de sustitución totales. (d) Modelado de regresión lineal multivariante de características del genoma que predicen frecuencias de sustituciones en el tumor deficiente en MMR. Se muestran mapas de calor de los datos de características del genoma ordenados según el número de sustituciones que visualizan las correlaciones entre las frecuencias de sustitución y las características del genoma. Los valores T resultantes del modelo lineal se muestran para cada característica del genoma en los gráficos de barras a la derecha de los mapas de calor e indican la importancia (el sombreado en gris es igual a P > 0,01) y la dirección de la correlación. Para acomodar las diferentes escalas de cada característica en un solo mapa de calor, los datos de características del genoma se muestran distribuidos por percentiles, indicando el blanco y el rojo, respectivamente, los centiles bajo y alto. Las transiciones G:C>A:T en sitios CpG se agruparon en ventanas de 10 Mb ya que los números eran insuficientes para el modelado por ventana de 1 Mb. (e) Frecuencia de sustituciones, transiciones (excluidas G:C>A:T en CG) y transversiones en el hipermutador por ventana de 1 Mb, frente al tiempo de replicación de esa ventana agrupada por decil. Las frecuencias se muestran en relación con las ventanas que se replican más temprano. Las barras de error indican el error estándar de la media (P < 0,01 para sustituciones y transiciones en tiempos de replicación superiores a 0,2). (f) Frecuencia de sustituciones, transiciones (excluidas G:C>A:T en CG) y transversiones dentro y fuera de las islas CpG, con respecto a su frecuencia en el genoma completo en el hipermutador. (g) Modelado de regresión lineal multivariante de características del genoma que predicen la frecuencia de indeles en el tumor deficiente en MMR. El mapa de calor y el gráfico de barras son tal como se describen para el panel (d). (h) Fracción de homopolímeros afectados por un indel estratificada por nucleótido en el tumor deficiente en MMR en comparación con la fracción en el genoma completo de homopolímeros con ese contenido de nucleótidos. (i) Fracción de todos los indeles que insertan o eliminan el número de bases indicado. (j-k) La distancia entre una sustitución somática y el indel (j) o sustitución (k) somáticos más cercanos en el hipermutador, y la distancia esperada basada en 200 modelos aleatorios.
Figura 3. Patrones de mutación somática de 10 exomas deficientes en MMR.
(a) Frecuencias de mutación promedio en los exones codificantes de 10 tumores deficientes en MMR y 4 tumores competentes en MMR. (b) Frecuencia de mutación promedio en los exones codificantes de 10 tumores deficientes en MMR frente a 4 tumores competentes en MMR estratificada para indeles y sustituciones. (c-d) Estratificación de frecuencias de sustitución por dinucleótido (estando el primer nucleótido mutado) en exones deficientes en MMR (c) y un conjunto de sustituciones de novo de la línea germinal publicadas (d). Las frecuencias de sustitución normalizadas representadas en la gráfica reflejan el número de dinucleótidos afectados dividido por el número de esos dinucleótidos en el genoma completo y expresado como porcentaje del total de frecuencias de sustitución somática. (e) La fracción de indeles observada en microsatélites, homopolímeros, homopolímeros cortos y en regiones no en repetición en tumores deficientes en MLH1 y MSH2 en comparación con la fracción del genoma completo de estas regiones.
Figura 4. Mutaciones de punto caliente en el exoma, 5' y 3' UTR de tumores deficientes en MMR.
(a) Fracción de homopolímeros en función de su longitud en regiones codificantes, 5' y 3' UTR. (b) Fracción de homopolímeros afectados por un indel en función de la longitud del homopolímero para regiones codificantes, 5' y 3' UTR. (c) Frecuencias medias de indeles somáticos en las regiones codificantes, 5' y 3' UTR de tumores deficientes en MMR. (d) Fracción de homopolímeros afectados de forma recurrente por un indel en función de la longitud del homopolímero para las regiones codificantes, 5' y 3' UTR.
Figura 5. El panel de mutación de punto caliente Bethesda y 56 marcadores para evaluar la MSI. El panel Bethesda ampliado y un panel de 56 mutaciones de punto caliente en exones, 5' y 3' UTR identificadas por secuenciación del exoma se analizaron en una serie independiente de 114 tumores endometriales primarios no seleccionados. Los resultados se codificaron por colores según estado de inestabilidad microsatelital alta (MSI-H), inestabilidad microsatelital baja (MSI-L) o estable en microsatélites (MSS) basándose en el panel Bethesda ampliado.
Figura 6. Mutaciones somáticas que afectan a la vía de reparación de DSB de ADN por HR. Diagrama de la vía de reparación de DSB por HR (adaptado del diagrama de la vía de recombinación homóloga IPA). Los genes marcados en naranja (con fondo gris) portan mutaciones somáticas en nuestro propio conjunto de tumores deficientes en MMR o en tumores MSI-H del conjunto de datos TCGA disponible públicamente.
Figura 7. Las células deficientes en MMR son sensibles a la inhibición de PARP.
(a) Imágenes confocales representativas de células tumorales primarias deficientes en MMR y competentes en MMR expuestas a olaparib 0 o 10 pM teñidas por el marcador de reparación de ADN RAD51 (verde) y contrateñidas con DAPI (azul). Las flechas (amarillas) indican células positivas a RAD51 que contienen más de 5 focos nucleares verdes. (b) Cuantificación de células que contienen > 5 focos de RAD51. Se muestran los promedios para cultivos de 8 células deficientes en MMR diferentes y 4 células competentes en MMR diferentes a las 24 horas después del tratamiento con olaparib (10 pM) o control de vehículo. (c-d) Proliferación celular promedio de 8 células deficientes en MMR (c) y 4 células competentes en MMR (d) con concentraciones crecientes de olaparib (1 pM, 3 pM, 10 pM). La proliferación celular en tiempo real se midió utilizando el sistema xCELLigence RTCA DP (Roche Applied Science) hasta 48 horas después del tratamiento. Los valores se normalizan con respecto al control tratado de forma simulada (olaparib 0 pM). Las barras de error representan el error estándar de medias. Un asterisco indica una diferencia estadísticamente significativa entre las células tratadas frente a las tratadas de forma simulada en el punto temporal indicado (P < 0,05). (e) Tasas de proliferación celular para cada uno de los cultivos celulares (las células deficientes en MMR se muestran en azul (8 inferiores en el gráfico) y las células competentes en MMR se muestran en rojo (cuatro superiores en el gráfico)). En resumen, las células deficientes en MMR se caracterizaron por una disminución de la proliferación dependiente de la dosis, mientras que las células competentes en MMR no respondieron a olaparib (P = 2,0E-7 mediante medición repetida; véase también la figura 7c).
Descripción detallada
Definiciones
La presente invención se describirá con respecto a formas de realización particulares y con referencia a determinados dibujos, pero la invención no se limita a las mismas, sino únicamente a las reivindicaciones. Cualquier signo de referencia en las reivindicaciones no se interpretará como una limitación del alcance. Los dibujos descritos son solo esquemáticos y no limitantes. En los dibujos, el tamaño de algunos de los elementos puede estar exagerado y no estar dibujado a escala con fines ilustrativos. Cuando se utiliza en la presente descripción y las reivindicaciones el término "que comprende", no excluye otros elementos o etapas. Si se utiliza un artículo indefinido o definido cuando se hace referencia a un sustantivo singular, por ejemplo "un" o "una", "el" o "la", este incluye un plural de ese sustantivo a menos que se indique específicamente lo contrario.
Además, los términos primero, segundo, tercero y similares en la descripción y en las reivindicaciones se utilizan para distinguir entre elementos similares y no necesariamente para describir un orden secuencial o cronológico. Debe entenderse que los términos así utilizados son intercambiables en circunstancias apropiadas y que las formas de realización de la invención descritas en el presente documento pueden funcionar en otras secuencias diferentes a las descritas o ilustradas en el presente documento.
Los siguientes términos o definiciones se proporcionan únicamente para ayudar en la comprensión de la invención. A menos que se definan específicamente en el presente documento, todos los términos utilizados en el presente documento tienen el mismo significado que tendrían para un experto en la técnica de la presente invención. Los facultativos se dirigen particularmente a Sambrook et al., Molecular Cloning: A Laboratory Manual, 2a ed., Cold Spring Harbor Press, Plainsview, Nueva York (1989); y Ausubel et al., Current Protocols in Molecular Biology (Suplemento 47), John Wiley & Sons, Nueva York (1999), para obtener definiciones y términos de la técnica. Las definiciones proporcionadas en el presente documento no deben interpretarse de forma que tengan un alcance inferior al comprendido por un experto en la técnica.
El término "microsatélite" o "regiones de microsatélites", tal como se utiliza en el presente documento, se refiere a repeticiones mono-, di-, tri-, tetra-, penta- o hexanucleotídicas en una secuencia de nucleótidos, que consta de al menos dos unidades repetidas y que presenta una longitud mínima de 6 bases. Una subclase particular de microsatélites incluye los homopolímeros.
"Homopolímero", tal como se utiliza en el presente documento, se refiere a una región de microsatélites que es una repetición de mononucleótidos de al menos 6 bases; en otras palabras, un tramo de al menos 6 residuos consecutivos A, C, T o G si se considera al nivel del ADN. Más particularmente, al determinar los microsatélites, se considera el ADN genómico de un sujeto (o el ADN genómico de un cáncer presente en el sujeto).
El término "estado de MSI", tal como se utiliza en la solicitud, se refiere a la presencia de inestabilidad microsatelital (MSI), un cambio clonal o somático en el número de unidades de nucleótidos de ADN repetidas en microsatélites. El estado de MSI puede ser uno de tres clases discretas: MSI-H, también conocido como MSI alta, MSI positiva o MSI, MSI-L, también conocido como MSI baja, o estabilidad en microsatélites (MSS), también conocido como ausencia de MSI. Por lo general, para ser clasificado como MSI-H, al menos el 20% de los marcadores utilizados para clasificar el estado de MSI deben tener una puntuación positiva, mientras que para la clasificación de MSS, menos del 2,5% tiene una puntuación positiva. Si un número intermedio de marcadores tiene una puntuación positiva, el tumor se clasifica como MSI-L. Téngase en cuenta que, como estos límites iniciales se derivan del panel de marcadores Bethesda ampliado (que consta de solo 10 marcadores), dado que normalmente se evaluarán menos de 100 marcadores y el número de marcadores positivos es un número entero, los porcentajes son aproximados. La diferencia entre MSS y MSI-L se encontrará típicamente entre el 1 y el 9% de los marcadores que obtienen una puntuación positiva (cuando se evalúan 10 marcadores, esto significa que 1 marcador positivo da como resultado una clasificación MSI-L), mientras que la diferencia entre MSI-L y MSI-H se encontrará generalmente entre el 15 y el 25% de marcadores positivos (es decir, por encima de ese umbral, un tumor es MSI-H, por debajo del mismo es MSI-L). Alternativamente, en lugar de realizar la distinción en tres clases, solo se evalúa la diferencia entre presencia y ausencia de inestabilidad microsatelital, en cuyo caso el estado es presencia de MSI o ausencia de MSI (= MSS). Teniendo en cuenta la correlación entre la ausencia de un sistema intacto de reparación de errores de apareamiento (MMR) y la presencia de MSI, diagnosticar la presencia de MSI (o diagnosticar el estado de MSI) puede interpretarse como un diagnóstico de deficiencia en MMR. Sin embargo, téngase en cuenta que la MMR puede ser funcional o deficiente, no existe una clase intermedia. Por lo tanto, MSI-L también corresponde a deficiencia en MMR; esta situación equivale a evaluar solo la presencia o ausencia de MSI.
"Diagnosticar el estado de MSI de un tumor" o "diagnosticar el estado de MSI de un tumor presente en un sujeto" o "diagnosticar el estado de MSI de un sujeto" o "determinar el estado de MSI de un tumor (o sujeto)" se consideran sinónimos en el presente documento. Determinar (o diagnosticar) el estado de MSI normalmente implica extraer la conclusión de MSI basándose en la detección de la presencia de uno o más indeles en las regiones de microsatélites en investigación, o la conclusión de la ausencia de inestabilidad microsatelital basada en no detectar indeles en las regiones de microsatélites en investigación. En consecuencia, "determinar la presencia de un indel" en una región de microsatélites significa evaluar o detectar la presencia o la ausencia de un indel en dicha región de microsatélites. Asimismo, determinar la presencia de un indel en al menos dos regiones de microsatélites significa evaluar o detectar la presencia o ausencia de un indel en cada una de dichas, al menos dos, regiones de microsatélites. La presencia de al menos un indel es indicativa de MSI (tal como se explica en la solicitud, el número exacto de marcadores positivos necesarios para establecer MSI dependerá del número de marcadores utilizados).
Un "indel", tal como se utiliza en el presente documento, se refiere a una clase de mutación que incluye tanto inserciones como deleciones y la combinación de las mismas. Un indel en una región de microsatélites da como resultado una ganancia o una pérdida neta de nucleótidos. La presencia de un indel se puede establecer mediante comparación con el ADN en el que no está presente (por ejemplo, mediante comparación del ADN de una muestra tumoral con el ADN de la línea germinal del sujeto que tiene el tumor) o, especialmente en el caso de microsatélites u homopolímeros monomórficos, mediante comparación con la longitud conocida del microsatélite, en particular contando el número de unidades repetidas. Según formas de realización específicas, los indeles particularmente contemplados tienen una longitud de entre 1 y 5 nucleótidos (es decir, la longitud del microsatélite u homopolímero es de 1 a 5 nucleótidos más larga o más corta que la longitud normal conocida del microsatélite u homopolímero). Según otras formas de realización específicas, los indeles tienen una longitud de 1 a 4 nucleótidos, 1 a 3 nucleótidos o 1 o 2 nucleótidos. Téngase en cuenta que, como los indeles pueden ser una combinación de una inserción y una deleción, la secuencia de ácido nucleico alterada puede ser mayor que la diferencia de longitud (por ejemplo, una deleción de 5 nucleótidos combinada con una inserción de 3 nucleótidos conduce a una longitud alterada de 2, pero la secuencia del microsatélite también puede haber cambiado). Sin embargo, más típicamente, un indel será una inserción o una deleción, típicamente de 1 o 2 nucleótidos.
Un "microsatélite monomórfico" es aquel en el que todos los individuos, en particular todos los individuos de una población determinada, comparten el mismo número de unidades de repetición. Este se diferencia de un "microsatélite polimórfico", que se utiliza para referirse a microsatélites en los que más del 1% de una población determinada muestra heterocigosidad por el número de unidades de repetición. A modo de ejemplo, el marcador BAT26 está compuesto por 26 adeninas en más del 99% de los europeos étnicos, mientras que los alelos con diferentes números de adeninas en esta ubicación (por ejemplo, 15, 20, 22, 23) se observan hasta en el 25% de africanos étnicos, incluidos los afroamericanos17. Por lo tanto, BAT26 es un microsatélite monomórfico en los europeos y un microsatélite polimórfico en los africanos16.
Una "muestra de ADN tumoral" se refiere a cualquier muestra que pueda usarse como base para la secuenciación en la que esté presente ADN de un cáncer. El término "cáncer", tal como se utiliza en el presente documento, se refiere a diferentes enfermedades que implican el crecimiento celular no regulado, también denominado neoplasia maligna. El término "tumor" se utiliza como sinónimo en la solicitud. Se prevé que este término abarque todos los tipos de tumores sólidos (carcinoma, sarcoma, blastoma), pero también abarca explícitamente tipos de cáncer no sólidos tales como leucemia, linfoma o mieloma. Por lo tanto, una "muestra de ADN tumoral" también puede ser una muestra de sangre de una persona con leucemia. Normalmente, una muestra de ADN tumoral se ha aislado en un punto de un sujeto, particularmente un sujeto con cáncer. Opcionalmente, se ha sometido a una o más formas de pretratamiento (por ejemplo, lisis, fraccionamiento, separación, purificación) con el fin de secuenciar el ADN, aunque también se prevé que el ADN se secuencie de una muestra no tratada. Tal como se utiliza en el presente documento, el sustantivo "sujeto" se refiere a un vertebrado individual, más particularmente a un mamífero individual, de la forma más particular a un ser humano individual. Un "sujeto", tal como se utiliza en el presente documento es típicamente un ser humano, pero también puede ser un mamífero, particularmente animales domésticos tales como gatos, perros, conejos, cobayas, hurones, ratas, ratones y similares, o animales de granja tales como caballos, vacas, cerdos, cabras, ovejas, llamas y similares. Un sujeto también puede ser un vertebrado no mamífero, tal como un pez, un reptil, un anfibio o un ave; en esencia, cualquier animal que pueda desarrollar cáncer cumple con la definición.
El término "cáncer colorrectal", tal como se utiliza en el presente documento, incluye neoplasias malignas de colon (C18 en ICD-10), neoplasias malignas de la unión rectosigmoidea (C19 en ICD-10), neoplasias malignas del recto (C20 en ICD-10) y neoplasias malignas del ano y del canal anal (C21 en ICD-10).
El término "síndrome de Lynch", tal como se utiliza en el presente documento, se refiere a una afección genética autosómica dominante que tiene un alto riesgo de desarrollar cáncer de colon o colorrectal, así como otros cánceres que incluyen cáncer endometrial, de ovario, de estómago, de intestino delgado, del aparato hepatobiliar, del aparato urinario superior, del cerebro y de piel. El mayor riesgo de estos cánceres se debe a mutaciones heredadas que alteran la reparación de errores de apareamiento del ADN. El nombre antiguo de la afección es HNPCC.
Un "inhibidor de una enzima de reparación por escisión de bases de ADN", tal como se utiliza en el presente documento se refiere a una sustancia que puede interferir con la función de reparación por escisión de bases del producto génico, ya sea a nivel del ADN (inhibiendo la formación del producto génico relevante, es decir, previniendo la transcripción o interfiriendo con la misma), a nivel de ARN (neutralizando o desestabilizando el ARNm para prevenir la traducción o interferir con la misma) o a nivel de proteína (neutralizando o inhibiendo la proteína involucrada en BER). Se prevé particularmente que el inhibidor sea un inhibidor de PARP, ya que dichos inhibidores están bien caracterizados. Se prevén más particularmente los inhibidores de PARP-1 y/o de PARP-2, ya que estas enzimas son las PARP más activamente implicadas en BER. Sin embargo, los inhibidores de otras PARP también pueden ser útiles. A este respecto, publicaciones recientes sugieren que el inhibidor de PARP iniparib, cuyo uso está explícitamente previsto, inhibe otras PARP distintas de PARP-1 y 2, en particular PARP-5 y 6 (Ji J, Lee Mp , Kadota M, et al. Pharmacodynamic and pathway analysis of three presumed inhibitors of poly (ADP-ribose) polymerase: a Bt -888, AZD 2281 y BSI201. Actas de la 102a Reunión Anual de la Asociación Estadounidense para la Investigación del Cáncer; 2-6 de abril de 2011; Orlando, Fla. AACR. 2011. Resumen N° 4527; Maegley KA, Bingham P, Tatlock JH et al. All PARP inhibitors are not equal: an in vitro mechanistic comparison of PF-01367338 to iniparib. J Clin Oncol. 2011; 29 (supl; resumen e13576); Nagourney RA, Kenyon KR, Francisco FR, et al. Functional analysis of PARP inhibitors AZD 2281 and BSI-201 in human tumor primary cultures: a comparison of activity and examination of synergy with cytotoxic drugs. J Clin Oncol. 2011; 29 (supl; resumen e13599)).
Los ejemplos de inhibidores de PARP incluyen, pero sin limitación: iniparib, olaparib, rucaparib, veliparib, CEP 9722, MK 4827 , BMN-673 y 3-aminobenzamida.
Descripción
Los errores de replicación del ADN que se producen en células deficientes en la reparación de errores de apareamiento (MMR) persisten como mutaciones de errores de apareamiento y predisponen a una serie de tumores. A este respecto, se secuenciaron los primeros genomas de tumores deficientes en MMR, lo que permitió la evaluación no sesgada de errores de replicación del ADN. Se observó que las tasas de mutación aumentaron drásticamente con respecto a tumores competentes en MMR. Las mutaciones de inserción o deleción (indel) se produjeron con mayor frecuencia y se limitaron en gran medida a tramos homopoliméricos, mientras que las sustituciones de un solo par de bases consistieron principalmente en transiciones A:T>G:C y G:C>A:T y se ubicaron con mayor frecuencia cerca de indeles. Como las tasas de sustituciones fueron más altas en los indeles somáticos cercanos, esto sugiere que las mutaciones de indel actúan como sitios mutagénicos durante la replicación del ADN. Debido a la selección clonal negativa, las tasas de mutación somática fueron inferiores en el exoma que en el resto del genoma, mientras que debido a la selección positiva, se produjeron algunas mutaciones exónicas en varios tumores deficientes en MMR. Estas mutaciones recurrentes afectaron específicamente a los genes expresados en el tejido correspondiente normal, lo que sugiere que representan impulsores de la progresión tumoral deficiente en MMR.
Curiosamente, los indeles se ubicaron principalmente en homopolímeros, en particular en homopolímeros de mayor longitud. Estas observaciones también tienen una implicación clínica inmediata. El panel Bethesda ampliado, utilizado actualmente para la clasificación diagnóstica de tumores MSI914-15 tiene una sensibilidad limitada, es decir, el 80%, el 84% y el 55% para tumores deficientes en MLH1, MSH2 y MSH616, presumiblemente porque este panel consta de 8 microsatélites y solo 2 marcadores de homopolímeros, respectivamente, con una longitud de 25 y 26 nucleótidos. Al aplicar nuestro panel de 56 indeles recurrentes a 114 tumores endometriales, pudimos demostrar que hasta el 43% de los tumores presentaban un grado variable de MSI. Este fue significativamente más alto de lo que se informó anteriormente, muy probablemente porque estos indeles no se seleccionaron aleatoriamente, sino que se identificaron a través de una evaluación no sesgada de mutaciones que afectan de forma recurrente al exoma y las 5' y 3' UTR. También observamos que los indeles recurrentes en los tumores endometriales se ubicaron en tumores MMR de otros tipos de cáncer. Dado que los indeles en las 3' UTR solo están determinados por la longitud del homopolímero afectado, mientras que en el exoma deben seleccionarse positivamente en genes expresados por el tejido de origen, la mayor parte de los indeles compartidos entre varios tipos de cáncer se ubicaron en las 5' y 3' UTR. Por lo tanto, las mutaciones recurrentes en las 5' y 3' UTR u otras secuencias no codificantes parecen ser particularmente adecuadas para detectar MSI en varios tipos de cáncer. Es interesante señalar que un panel selectivo de las mutaciones más recurrentes fue muy sensible en la detección de la inestabilidad microsatelital (MSI) en varios tipos de cáncer. En 114 tumores endometriales primarios, se observó un espectro continuo de MSI en casi la mitad de los tumores, lo que sugiere que la MSI ocurre con más frecuencia de lo previsto.
Como se detallará en la sección Ejemplos, particularmente en el ejemplo 5, existen homopolímeros particulares en las regiones 5' UTR y 3' UTR que se ven afectados más frecuentemente por indeles en tumores deficientes en MMR. En la tabla 1 se proporciona una lista de los genes mutados de forma recurrente más frecuentes.
Tabla 1. Indeles recurrentes más comunes en las regiones 5' y 3' UTR para 16 muestras tumorales deficientes en MMR (presentes en al menos 4 de 16 muestras tumorales). Las dos últimas columnas indican la frecuencia con la que el homopolímero se ve afectado por una inserción o una deleción, respectivamente.
Figure imgf000012_0001
(continuación)
Figure imgf000013_0001
(continuación)
Figure imgf000014_0001
(continuación)
Figure imgf000015_0001
(continuación)
Figure imgf000016_0001
(continuación)
Figure imgf000017_0001
(continuación)
Figure imgf000018_0001
(continuación)
Figure imgf000019_0001
(continuación)
Figure imgf000020_0001
(continuación)
Figure imgf000021_0001
(continuación)
Figure imgf000022_0001
(continuación)
Figure imgf000023_0001
(continuación)
Figure imgf000024_0001
(continuación)
Figure imgf000025_0001
(continuación)
Figure imgf000026_0001
(continuación)
Figure imgf000027_0001
(continuación)
Figure imgf000028_0001
(continuación)
Figure imgf000029_0001
(continuación)
Figure imgf000030_0001
(continuación)
Figure imgf000031_0001
(continuación)
Figure imgf000032_0001
(continuación)
Figure imgf000033_0001
(continuación)
Figure imgf000034_0001
(continuación)
Figure imgf000035_0001
(continuación)
Figure imgf000036_0001
(continuación)
Figure imgf000037_0001
(continuación)
Figure imgf000038_0001
(continuación)
Figure imgf000039_0001
(continuación)
Figure imgf000040_0001
(continuación)
Figure imgf000041_0001
(continuación)
Figure imgf000042_0001
(continuación)
Figure imgf000043_0001
(continuación)
Figure imgf000044_0001
(continuación)
Figure imgf000045_0001
Debe señalarse que algunos de los genes enumerados en la tabla 1 tienen más de un indel recurrente en las regiones UTR (por ejemplo, CALN1, EIF4G3, KDM5A), lo que aumenta la probabilidad de que estas regiones genómicas no se vieran afectadas aleatoriamente, sino que se sometieran a una selección positiva.
Es importante señalar que también los homopolímeros de las regiones exónicas se ven afectados con mayor frecuencia por indeles en los tumores deficientes en MMR. Tal como se explica en, por ejemplo, el ejemplo 4, esto no se basa en la longitud de la secuencia, sino que es debido a la selección clonal positiva. Por lo tanto, aunque por lo general presentan mutaciones recurrentes con menos frecuencia, estas mutaciones podrían ser impulsoras de la progresión del tumor. En la tabla 2 se proporciona una lista de los 31 genes afectados con mayor frecuencia por indeles en sus regiones exónicas.
Figure imgf000046_0001
Figure imgf000047_0001
Figure imgf000048_0001
Figure imgf000049_0001
Figure imgf000050_0001
Figure imgf000051_0001
Tal como se detalla en la sección Ejemplos, más del 50% de los marcadores tomados de la tabla 1 tienen una puntuación positiva en un conjunto aleatorio de tumores deficientes en MMR, mientras que este también es el caso de más de un tercio de los marcadores exónicos enumerados en la tabla 2. Esto permite clasificar correctamente el tumor deficiente en MMR como positivo a MSI con alta precisión y certeza.
En consecuencia, se proporcionan procedimientos para diagnosticar el estado de MSI de un tumor, que comprenden determinar la presencia de un indel en al menos dos regiones homopoliméricas en una muestra del ADN del tumor, en el que las, al menos dos, regiones homopoliméricas son
- al menos dos regiones homopoliméricas presentes en las regiones 5' UTR o 3' UTR de los genes enumerados en la tabla 1 , o
- al menos tres regiones homopoliméricas seleccionadas de las presentes en los exones de los genes enumerados en la tabla 2 y/o presentes en las regiones 5' UTR o 3' UTR de los genes enumerados en la tabla 1, en los que dichas regiones homopoliméricas son regiones de microsatélites que son repeticiones mononucleotídicas de al menos 6 nucleótidos y que no exceden de 20 nucleótidos, y en los que la presencia de al menos un indel en el 2 % o más de las regiones homopoliméricas es indicativa de MSI.
En particular, las regiones de microsatélites son regiones homopoliméricas. Son más particularmente idénticas a las regiones homopoliméricas enumeradas en la tabla 1 o 2.
En particular, se prevé utilizar varios marcadores, ya que esto aumenta el poder de clasificación de MSI y aumenta la sensibilidad. En particular, se utiliza una mezcla de marcadores UTR de la tabla 1 y marcadores exónicos de la tabla 2. Varios marcadores pueden ser al menos 2 de cada lista, pero el número total de marcadores en particular es de al menos 5, al menos 8 , al menos 10, al menos 12, al menos 15, al menos 20.
Alternativamente, en lugar de la tabla 1, los marcadores se pueden elegir de la tabla 4, o de la tabla 6 o la tabla 8. En lugar de la tabla 2, los marcadores se pueden seleccionar de la tabla 5, o de la tabla 7 o la tabla 8.
Según formas de realización específicas, al menos un marcador utilizado es un marcador exónico presente en un gen no asociado previamente con cáncer, o en un gen que no se sabía previamente que estuviera afectado en tumores deficientes en MMR. Por lo tanto, se prevé que el microsatélite o los microsatélites seleccionados entre los presentes en los exones de los genes enumerados en la tabla 2 comprendan al menos un microsatélite presente en un gen seleccionado de la lista de: SETD1B, RBMXL1, CCDC150, OR7E24, C15orf40, KIAA2018, LTN1, SLC22A9, CDH26, DDX27, EXOSC9, FAM111B, KIAA0182, KIAA1919, MIS18BP1, PRRT2, TMEM60, AQP7, ARV1, CCDC168, ELAVL3, F8, FETUB, HPS1, NBEAL1, P4HTM, PIGB, RBM43, RG9MTD1, SRPR, y TMEM97. Según formas de realización aún más específicas, al menos un microsatélite está presente en un gen seleccionado de la lista de: SETD1B, TMEM60, DDX27, EXOSC9, FAM111B y KIAA1919. Según formas de realización alternativas, SEC31A, CNOT2, RNF145, RNPC3, SLC35F5, TMBIM4, CD3G, DOCK3, MYO10 y PRRG1 también se puede utilizar en estas listas.
Según formas de realización específicas alternativas, al menos un marcador utilizado es un indel presente en un homopolímero de entre 10 y 15 bases de repetición situadas en una región 5' o 3' UTR. Los ejemplos particulares de dichos homopolímeros incluyen, pero sin limitación, homopolímeros en las regiones 3' UTR de la lista de genes siguiente: WIPF2, NARG2, AHCYL1, C17orf63, CD5L, CEP170, COL5A2, CSNK1G3, DIDO1, EIF4G3, GSK3B, KCNMB4, MAPK1IP1L, NPR3, PI15, PRTG, RASGRP1, SH3KBP1, SHROOM3, SLC5A3, UBE2Z, ZBTB33, ZNF275, AGPAT3, APH1B, BCL11A, BMPR1B, CALN1, CASK, CBFB, CBX5, CCDC85C, CNOT7, CYP1B1, DRAM2, EDA2R, EDEM3, EGR1, EIF4G3, FAM20B, FCHSD2, FLT1, FMO2, G3BP2, HELZ, HRNR, IER3IP1, KCNG1, KCNK1, KLF3, LHX9, LRRC8 D, LYRM1, MED13, MYO5B, NCEH1, PPP1R12A, PPP1R3D, RAB11FIP1, RAB6 C, SAMD12, SEMA6 A, SLAIN2, SMAD4, TMED7, TMEM57, TMEM65, TNPO1, TOR1AIP2, TRAK2, TRIP11, UST, VEGFA, ZBTB7A, ZKSCAN1, ZNF12, y ZNF169.
Se diseñó un panel de biomarcadores que consistía en una selección de 56 marcadores tomados de la tabla 1 y 2 (véase la sección Ejemplos). Según formas de realización particulares, estos marcadores se utilizan para diagnosticar el estado de MSI. Estos 56 marcadores se enumeran en la tabla 3.
Figure imgf000053_0001
Figure imgf000054_0001
Los marcadores de este panel que están especialmente previstos para su uso (ya que son particularmente sensibles a la aparición recurrente de indeles) incluyen uno o más de la lista de MYL1, DIDO1, UBE2Z, RYR3, TMEM65, BTBD7, KDM5A, ABAT, PPM1A, UBA6 y ZNF185. También se prevén adicionalmente ARL10, GRIA2 y TMC7, particularmente cuando se evalúa el estado de MSI de tumores colorrectales. Estos son tanto sensibles como específicos (es decir, detectan pequeños casos de MSI falsos positivos).
Según formas de realización muy específicas, el panel de 56 marcadores se puede complementar con microsatélites de MSH6 (indel exónico) y/o SULF2 (deleción en 3' UTR).
Según formas de realización alternativas, no se evalúan indeles en MSH6 , ya que este es un gen de deficiencia en MMR conocido. Aunque MSH3 también se conoce como un gen de deficiencia en MMR, la deficiencia de este gen generalmente no se asocia con MSI27. Sin embargo, según formas de realización particulares, no se utilizan indeles en MSH3 como marcador.
Tal como se detalla en la sección Ejemplos, se puede aplicar una etapa de filtrado adicional a los marcadores de la tabla 1 , excluyendo marcadores presentes como variantes en la línea germinal de nuestra base de datos genómica patentada. Téngase en cuenta que todas estas son variantes raras, ya que no están presentes en dbSNP o en la base de datos 1000 Genomes. Esta lista de marcadores se muestra en la tabla 4 (recurrencia mínima en 4 de 16 muestras tumorales).
Tabla 4. Indeles recurrentes más comunes en las regiones 5' y 3' UTR para 16 muestras tumorales deficientes en MMR, después de una etapa de filtrado adicional.
Figure imgf000055_0001
(continuación)
Figure imgf000056_0001
(continuación)
Figure imgf000057_0001
(continuación)
Figure imgf000058_0001
(continuación)
Figure imgf000059_0001
(continuación)
Figure imgf000060_0001
(continuación)
Figure imgf000061_0001
(continuación)
Figure imgf000062_0001
(continuación)
Figure imgf000063_0001
(continuación)
Figure imgf000064_0001
(continuación)
Figure imgf000065_0001
(continuación)
Figure imgf000066_0001
(continuación)
Figure imgf000067_0001
(continuación)
Figure imgf000068_0001
(continuación)
Figure imgf000069_0001
(continuación)
Figure imgf000070_0001
(continuación)
Figure imgf000071_0001
(continuación)
Figure imgf000072_0001
(continuación)
Figure imgf000073_0001
(continuación)
Figure imgf000074_0001
(continuación)
Figure imgf000075_0001
(continuación)
Figure imgf000076_0001
(continuación)
Figure imgf000077_0001
(continuación)
Figure imgf000078_0001
(continuación)
Figure imgf000079_0001
(continuación)
Figure imgf000080_0001
(continuación)
Figure imgf000081_0001
(continuación)
Figure imgf000082_0001
(continuación)
Figure imgf000083_0001
Figure imgf000083_0002
(continuación)
Figure imgf000084_0001
(continuación)
Figure imgf000085_0001
(continuación)
Figure imgf000086_0001
(continuación)
Figure imgf000087_0001
(continuación)
Figure imgf000088_0001
(continuación)
Figure imgf000089_0001
Se ha aplicado el mismo filtrado adicional a los marcadores de la tabla 2; los resultados se enumeran en la tabla 5. Tabla 5. Indeles recurrentes más comunes en regiones exónicas para 16 muestras de tumores deficientes en MMR, después de una etapa de filtrado adicional.
Figure imgf000089_0002
(continuación)
Figure imgf000090_0001
(continuación)
Figure imgf000091_0001
(continuación)
Figure imgf000092_0002
Según formas de realización particulares, los genes en los que está presente más de un indel recurrente en las regiones UTR son particularmente adecuados como marcador. En estas formas de realización, al menos uno de los genes se selecciona de la lista de ARHGEF11, CBLN2, DIO2, MBNL1 (todos los marcadores 5’UTR), ACVR1C, ANKIB1, ATXN1, BCL11A, BCL11B, BCL7A, BOD1L, BTBD7, C11orf58, C14orf101, CACNB4, CALN1, CANX, CASK, CBFB, CBL, CBX5, CCND1, CCND2, CLCN5, CRTC1, CSNK1E, CYP1B1, DCUN1D5, DDHD1, DLGAP2, DSTYK, DTNA, DUT, DYRK2, EBF1, EFNA5, EIF4G3, ELAVL3, EPS15, ERBB2IP, ERBB4, EVI5, FAM116A, FAM126B, FAM20B, FAM46A, FBN2, FBXO27, FGF9, FGFR1OP2, FOXN2, FOXN3, FOXP1, GABRB2, GDAP2, GNAI2, GSK3B, HAS2, HDAC4, HELZ, HIPK2, HNRNPA3, HNRNPK, HUWE1, IGFBP5, INSR, KDM5A, KIAA0825, KIAA1324, KIF1B, KLHL4, LARP4B, LIN7C, LMO4, LPHN3, LYRM7, MAP1B, MAPK1IP1L, MDM2, MED1, MED13, MED28, MESDC1, MEX3A, MGAT4A, MKLN1, MLL2, NARG2, NCEH1, NPNT, NPR3, NR2F2, NUFIP2, OPA3, OTUD4, OXR1, PALM2, PAPD5, PDGFA, PIGM, PLAGL2, PPP2R3A, PRPF40A, PRTG, RAB11FIP2, RAB8 B, RBM12B, RBMS3, RC3H1, RORA, RPRD2, RUNDC3B, SAMD12, SAR1A, SATB2, SDC4, SENP1, SENP5, SH3KBP1, SH3RF1, SIPA1L3, SLAIN2, SLC7A11, SMAD3, SMAD4, SMAD5, SORL1, SOST, SOX4, SPCS3, SRRM4, ST7L, SYNJ2BP, TACC1, TFAP2B, TLCD2, TMEM57, TMTC3, TNRC6 B, TNRC6 C, TRIM66 , TRPS1, UBN2, USP43, VEZF1, WDR82, XKR6 , XYLT1, ZBTB7A, ZNF238, ZNF737, ZNF740 (todos los marcadores 3’UTR), CPLX4, DDX3X, GABRG2, PIK3R1, PTP4A2, SATB1, SEMA6 A, y STK11 (afectados en 5’ y 3’ UTR).
No obstante, téngase en cuenta que los genes en los que solo un homopolímero se ve afectado de forma recurrente en las regiones UTR pueden ser igualmente buenos como marcadores, por ejemplo porque solo hay una región homopolimérica en la UTR, o porque hay una clara preferencia por la aparición de indeles en un homopolímero con respecto al otro. Este último se observa, por ejemplo, en UTR de genes tales como CACNB4, EIF4G3, FAM20B, LPHN3 o PRTG, en los que más de un homopolímero se ve afectado de forma recurrente, pero un homopolímero se ve afectado con más frecuencia que el o los otros, aunque la longitud del homopolímero y la composición son comparables.
También los genes con regiones exónicas que se ven afectados de forma recurrente por más de un indel están particularmente previstos como marcadores. Por lo tanto, según formas de realización específicas, CASP5, MIAT, TROVE2 y TSIX se prevén particularmente como marcadores exónicos; más particularmente se prevén CASP5 y TSIX.
Otra lista particular de marcadores UTR previstos son los que se identificaron en los primeros 11 tumores deficientes en MMR sólidos. Esta lista se proporciona en la tabla 6 , los indeles recurrentes comunes se definen como los que se producen en al menos 3 de las 11 muestras.
Tabla 6. Indeles recurrentes más comunes en las regiones 5' y 3' UTR
para 11 muestras tumorales deficientes en MMR.
Figure imgf000092_0001
(continuación)
N° de muestras Base de Longitud del afectadas Gen Cromosoma Posición inicial homopolímero homopolímero afectada afectado 8 GABRG2 cr5 161494990 A 12 5'
UTR
8 MBNL1 cr3 152017897 T 11 5'
UTR
7 ARHGEF9 crX 62974288 T 12 5'
UTR
7 CCT6B cr17 33288433 A 11 5'
UTR
7 GRIA2 cr4 158142151 A 9 5'
UTR
7 TRPS1 cr8 116681041 A 14 5'
UTR
7 ZNF781 cr19 38161161 T 11 5'
UTR
6 AMD1 cr6 111196178 A 11 5'
UTR
6 ASPH cr8 62602295 A 11 5'
UTR
6 EPHB6 cr7 142560576 A 13 5'
UTR
6 LMOD3 cr3 69171664 T 13 5'
UTR
6 OMD cr9 95179844 T 11 5'
UTR
6 SEMA6A cr5 115910134 A 11 5'
UTR
6 TMEM177 cr2 120437061 A 11 5'
UTR
5 BMP5 cr6 55739711 A 14 5'
UTR
5 CBLN2 cr18 70211389 A 14 5'
UTR
5 CEPT1 cr1 111690319 A 9 5'
UTR
5 LRRC70 cr5 61874619 A 18 5'
UTR
5 MCF2 crX 138724841 A 15 5'
UTR
5 MEIS1 cr2 66662690 T 13 5'
UTR
5 NDE1 cr16 15737427 T 11 5'
UTR
5 OIT3 cr10 74653468 A 10 5'
UTR
5 RCC2 cr1 17766108 T 10 5'
UTR
5 RUFY3 cr4 71588131 T 14 5'
UTR (continuación)
N° de muestras Posición Base de Longitud del Gen Cromosoma afectadas inicial homopolímero homopolímero afectada afectado 5 ZXDA crX 57936946 A 9 5'
UTR
4 BDNF cr11 27741184 A 10 5'
UTR
4 EBF1 cr5 158526596 T 11 5'
UTR
4 EIF4E cr4 99851375 T 11 5'
UTR
4 ESCO1 cr18 19164371 A 11 5'
UTR
4 GEN1 cr2 17935494 T 11 5'
UTR
4 HEMGN cr9 100700505 A 11 5'
UTR
4 HRH2 cr5 175110094 A 21 5'
UTR
4 L3MBTL3 cr6 130339785 A 10 5'
UTR
4 LMO7 cr13 76195056 A 9 5'
UTR
4 LOC642587 cr1 209602342 T 13 5'
UTR
4 LRRC4C cr11 40314470 A 10 5'
UTR
4 NR3C1 cr5 142814523 T 12 5'
UTR
4 PTP4A2 cr1 32384716 A 11 5'
UTR
4 RAPGEF2 cr4 160189200 T 11 5'
UTR
4 RGS4 cr1 163038838 T 10 5'
UTR
4 SATB1 cr3 18465613 A 13 5'
UTR
4 SETBP1 cr18 42260910 G 8 5'
UTR
4 ST7L cr1 113162029 C 10 5'
UTR
4 TCF4 cr18 53255634 A 12 5'
UTR
4 TCF7L2 cr10 114710208 T 14 5'
UTR
4 TSHZ1 cr18 72922942 T 10 5'
UTR
4 USP53 cr4 120135275 A 18 5'
UTR
4 ZNF107 cr7 64152284 A 8 5'
UTR (continuación)
N° de muestras Base de Longitud del afectadas Gen Cromosoma Posición inicial homopolímero homopolímero afectada afectado 3 AAK1 cr2 69870217 T 24 5'
UTR
3 ABCC10 cr6 43399532 T 10 5'
UTR
3 C10orf140 cr10 21806928 G 10 5'
UTR
3 C1QL3 cr10 16563613 T 10 5'
UTR
3 CCDC126 cr7 23650854 T 10 5'
UTR
3 CCDC99 cr5 169015403 A 8 5'
UTR
3 CNTNAP2 cr7 145813627 T 11 5'
UTR
3 CPLX4 cr18 56985739 A 10 5'
UTR
3 DDX3X crX 41192964 A 10 5'
UTR
3 DIO2 cr14 80678323 T 14 5'
UTR
3 DIO2 cr14 80678077 T 25 5'
UTR
3 EBP crX 48382099 T 18 5'
UTR
3 EMP1 cr12 13364426 A 10 5'
UTR
3 FAM65B cr6 24877343 A 8 5'
UTR
3 FLRT2 cr14 86087801 T 10 5'
UTR
3 GSDMC cr8 130798567 A 14 5'
UTR
3 HOXD3 cr2 177028841 A 10 5'
UTR
3 HYLS1 cr11 125753769 A 10 5'
UTR
3 JAKMIP2 cr5 147162132 T 10 5'
UTR
3 LPAR4 crX 78003392 A 31 5'
UTR
3 LPHN1 cr19 14316982 A 15 5'
UTR
3 MARCKS cr6 114178627 T 9 5'
UTR
3 MRGPRF cr11 68780847 C 8 5'
UTR
3 NCAM1 cr1 1 112832276 G 10 5'
UTR (continuación)
N° de muestras Base de Longitud del afectadas Gen Cromosoma Posición inicial homopolímero homopolímero afectada afectado 3 NR2F2 cr15 96874920 T 11 5'
UTR
3 P2RY14 cr3 150937331 T 8 5'
UTR
3 PBX1 cr1 164528904 T 10 5'
UTR
3 PKN2 cr1 89150150 T 13 5'
UTR
3 PPP2R5C cr14 102276205 T 11 5'
UTR
3 PTPRB cr12 71031210 A 10 5'
UTR
3 RFWD2 cr1 176176257 T 9 5'
UTR
3 SCN2B cr11 118047234 A 9 5'
UTR
3 SLC38A5 crX 48327811 T 12 5'
UTR
3 TBC1D5 cr3 17781827 A 14 5'
UTR
3 TMEM31 crX 102965989 T 10 5'
UTR
3 TOX cr8 60031707 A 14 5'
UTR
3 TRIP6 cr7 100464995 A 10 5'
UTR
3 XRRA1 cr11 74656098 T 10 5'
UTR
3 ZXDB crX 57618380 T 9 5'
UTR
11 WIPF2 cr17 38436904 T 13 3'
UTR
10 NARG2 cr15 60712503 T 13 3'
UTR
9 AHCYL1 cr1 110566210 A 14 3'
UTR
9 C17orf63 cr17 27083744 T 12 3'
UTR
9 CD5L cr1 157801230 A 13 3'
UTR
9 CEP170 cr1 243288181 T 11 3'
UTR
9 COL5A2 cr2 189898205 T 13 3'
UTR
9 CSNK1G3 cr5 122950254 T 13 3'
UTR
9 DIDO1 cr20 61536691 A 11 3'
UTR (continuación)
N° de muestras Posición Base de Longitud del Gen Cromosoma afectadas inicial homopolímero homopolímero afectada afectado 9 EIF4G3 cr1 21133496 T 13 3'
UTR
9 GSK3B cr3 119542766 A 11 3'
UTR
9 KCNMB4 cr12 70824838 A 14 3'
UTR
9 MAPK1IP1L crl4 55535728 T 13 3'
UTR
9 NPR3 cr5 32787131 A 11 3'
UTR
9 PI15 cr8 75766071 T 10 3'
UTR
9 PRTG cr15 55903921 A 11 3'
UTR
9 RASGRP1 cr15 38781450 T 13 3'
UTR
9 SH3KBP1 crX 19552231 T 13 3'
UTR
9 SHROOM3 cr4 77701305 A 12 3'
UTR
9 SLC5A3 cr21 35470291 T 11 3'
UTR
9 UBE2Z cr17 47005701 A 11 3'
UTR
9 ZBTB33 crX 119390643 T 14 3'
UTR
9 ZNF275 crX 152617043 A 12 3'
UTR
8 AGPAT3 cr21 45405278 A 15 3'
UTR
8 APH1B cr15 63600287 T 12 3'
UTR
8 BCL11A cr2 60685409 T 12 3'
UTR
8 BMPR1B cr4 96076113 T 13 3'
UTR
8 CALN1 cr7 71245682 A 12 3'
UTR
8 CASK crX 41379131 A 13 3'
UTR
8 CBFB cr16 67133068 T 11 3'
UTR
8 CBX5 cr12 54628041 T 13 3'
UTR
8 CCDC85C cr14 99978765 A 12 3'
UTR
8 CNOT7 cr8 17088039 T 11 3'
UTR (continuación)
N° de muestras ición Base de Longitud del Gen Cromosoma Pos
afectadas inicial homopolímero homopolímero afectada afectado 8 CYP1B1 cr2 38297055 T 12 3'
UTR
8 DRAM2 cr1 111660181 A 11 3'
UTR
8 EDA2R crX 65815929 T 12 3'
UTR
8 EDEM3 cr1 184660755 A 14 3'
UTR
8 EGR1 cr5 137804274 A 12 3'
UTR
8 EIF4G3 cr1 21133286 A 13 3'
UTR
8 FAM20B cr1 179044906 A 12 3'
UTR
8 FCHSD2 cr11 72549649 A 10 3'
UTR
8 FLT1 cr13 28877146 A 12 3'
UTR
8 FMO2 cr1 171178335 A 11 3'
UTR
8 G3BP2 cr4 76568663 A 12 3'
UTR
8 HELZ cr17 65070976 A 14 3'
UTR
8 HRNR cr1 152184856 T 11 3'
UTR
8 IER3IP1 cr18 44682385 A 11 3'
UTR
8 KCNG1 cr20 49620212 T 14 3'
UTR
8 KCNK1 cr1 233807667 A 11 3'
UTR
8 KLF3 cr4 38699104 T 14 3'
UTR
8 LHX9 cr1 197898395 T 12 3'
UTR
8 LRRC8 D cr1 90401405 T 11 3'
UTR
8 LYRM1 cr16 20935842 T 11 3'
UTR
8 MED13 cr17 60023567 A 10 3'
UTR
8 MYO5B cr18 47351784 A 12 3'
UTR
8 NCEH1 cr3 172348807 A 12 3'
UTR
8 PPP1R12A cr12 80169697 T 13 3'
UTR (continuación)
N° de muestras Posición Base de Longitud del Gen Cromosoma afectadas inicial homopolímero homopolímero afectada afectado 8 PPP1R3D cr20 58512721 T 13 3'
UTR
8 RAB11FIP1 cr8 37718707 A 13 3'
UTR
8 RAB6 C cr2 130739712 T 13 3'
UTR
8 SAMD12 cr8 119209320 A 11 3'
UTR
8 SEMA6 A cr5 115779928 A 13 3'
UTR
8 SLAIN2 cr4 48428163 T 11 3'
UTR
8 SMAD4 cr18 48609831 T 11 3'
UTR
8 TMED7 cr5 114950622 A 14 3'
UTR
8 TMEM57 cr1 25826052 T 12 3'
UTR
8 TMEM65 cr8 125325217 A 11 3'
UTR
8 TNPO1 cr5 72204773 A 13 3'
UTR
8 TOR1AIP2 cr1 179814857 A 12 3'
UTR
8 TRAK2 cr2 202242603 A 12 3'
UTR
8 TRIP11 cr14 92435633 A 12 3'
UTR
8 UST cr6 149398012 T 13 3'
UTR
8 VEGFA cr6 43754176 A 12 3'
UTR
8 ZBTB7A cr19 4046571 T 11 3'
UTR
8 ZKSCAN1 cr7 99633041 T 12 3'
UTR
8 ZNF12 cr7 6730082 T 12 3'
UTR
8 ZNF169 cr9 97063725 A 11 3'
UTR
7 ABAT cr16 8876792 T 11 3'
UTR
7 AEN cr15 89174888 T 12 3'
UTR
7 AIDA cr1 222841524 T 10 3'
UTR
7 ALG9 cr11 111655441 A 11 3'
UTR (continuación)
N° de muestras osición Base de Longitud del Gen Cromosoma P
afectadas inicial homopolímero homopolímero afectada afectado 7 ANK2 cr4 114303782 T 11 3'
UTR
7 ANKS1B cr12 99138457 T 12 3'
UTR
7 ARFIP1 cr4 153832102 T 11 3'
UTR
7 ARHGAP18 cr6 129898731 A 11 3'
UTR
7 ARID1A cr1 27107950 A 12 3'
UTR
7 ASPN cr9 95218905 A 12 3'
UTR
7 ATP11A cr13 113540850 T 12 3'
UTR
7 BCL11B cr14 99637947 T 12 3'
UTR
7 BTBD7 cr14 93708030 A 10 3'
UTR
7 Cllorf87 cr1 1 109296012 A 12 3'
UTR
7 C14orf101 crl4 57114799 A 13 3'
UTR
7 C15orf2 cr15 24927891 A 10 3'
UTR
7 C15orf29 cr15 34434105 T 12 3'
UTR
7 C5orf33 cr5 36194227 A 11 3'
UTR
7 C5orf51 cr5 41921535 T 13 3'
UTR
7 CAMK2A cr5 149600684 T 11 3'
UTR
7 CANX cr5 179158477 A 12 3'
UTR
7 CBLN4 cr20 54572755 A 12 3'
UTR
7 CD1E cr1 158327025 T 13 3'
UTR
7 CD47 cr3 107762288 A 11 3'
UTR
7 CDC23 cr5 137524388 A 11 3'
UTR
7 CDKN2AIPNL cr5 133738313 A 11 3'
UTR
7 CEP44 cr4 175238738 T 13 3'
UTR
7 CMIP cr16 81744987 A 10 3'
UTR (continuación)
N° de muestras Base de Longitud del afectadas Gen Cromosoma Posición inicial homopolímero homopolímero afectada afectado 7 CMTM6 cr3 32523862 A 12 3'
UTR
7 CNR1 cr6 88853530 A 11 3'
UTR
7 CPNE3 cr8 87571865 T 11 3'
UTR
7 CREB3L2 cr7 137561927 A 11 3'
UTR
7 CRTAP cr3 33187520 A 12 3'
UTR
7 CSDA cr12 10851811 T 14 3'
UTR
7 DLGAP2 cr8 1652939 A 11 3'
UTR
7 DLGAP4 cr20 35156539 T 11 3'
UTR
7 EBF1 cr5 158123905 T 13 3'
UTR
7 ENAM cr4 71511776 T 15 3'
UTR
7 EPS15 cr1 51821385 A 13 3'
UTR
7 EPT1 cr2 26617514 T 11 3'
UTR
7 ERBB2IP cr5 65375200 T 15 3'
UTR
7 FAM104A cr17 71204073 A 13 3'
UTR
7 FAM126B cr2 201844251 A 11 3'
UTR
7 FAM126B cr2 201838933 A 13 3'
UTR
7 FGF9 crl3 22278024 T 13 3'
UTR
7 FGFBP3 cr10 93666830 A 11 3'
UTR
7 FLRT2 cr14 86090074 A 12 3'
UTR
7 FLRT3 cr20 14305760 T 12 3'
UTR
7 FLT1 cr13 28875309 A 14 3'
UTR
7 FYN cr6 111982555 T 12 3'
UTR
7 GABPB1 cr15 50570604 A 13 3'
UTR
7 GABRG2 cr5 161581834 A 11 3'
UTR (continuación)
N° de muestras Base de Longitud del afectadas Gen Cromosoma Posición inicial homopolímero homopolímero afectada afectado 7 GBP1 cr1 89518865 T 13 3'
UTR
7 GLUD1 cr10 88810337 A 15 3'
UTR
7 HCRTR2 cr6 55147361 T 12 3'
UTR
7 HIPK2 cr7 139249947 A 14 3'
UTR
7 INSR cr19 7116555 A 12 3'
UTR
7 KIAA2018 cr3 113371321 A 11 3'
UTR
7 KLHL4 crX 86922591 A 13 3'
UTR
7 KRT8 cr12 53291007 A 11 3'
UTR
7 LARP4B cr10 856116 A 13 3'
UTR
7 LRAT cr4 155673737 A 10 3'
UTR
7 MAT2A cr2 85772061 T 12 3'
UTR
7 MED28 cr4 17626082 T 11 3'
UTR
7 METTL9 cr16 21667438 A 12 3'
UTR
7 MEX3A cr1 156043944 T 11 3'
UTR
7 MITF cr3 70014804 A 11 3'
UTR
7 MLL3 cr7 151832596 T 11 3'
UTR
7 MSR1 cr8 15997800 A 11 3'
UTR
7 NEK5 cr13 52639268 A 13 3'
UTR
7 NFIX cr19 13208001 T 13 3'
UTR
7 NRXN3 cr14 80328831 A 11 3'
UTR
7 OXR1 cr8 107763507 T 13 3'
UTR
7 PEX13 cr2 61276332 T 15 3'
UTR
7 PGK1 crX 77381770 T 13 3'
UTR
7 PHACTR2 cr6 144151003 T 10 3'
UTR (continuación)
N° de muestras Base de Longitud del afectadas Gen Cromosoma Posición inicial homopolímero homopolímero afectada afectado 7 PLEKHA2 cr8 38830288 T 13 3'
UTR
7 POFUT1 cr20 30826323 A 11 3'
UTR
7 PPP2R3A cr3 135865826 T 11 3'
UTR
7 PRKD3 cr2 37479023 A 11 3'
UTR
7 PRKD3 cr2 37478759 T 12 3'
UTR
7 PSEN1 cr14 73688298 T 13 3'
UTR
7 PTEN cr10 89725293 T 11 3'
UTR
7 RAB6 A cr11 73387527 A 12 3'
UTR
7 RBM25 cr14 73587904 T 14 3'
UTR
7 RBM45 cr2 178994205 T 11 3'
UTR
7 RBMS1 cr2 161128989 T 13 3'
UTR
7 RCC2 cr1 17735285 A 14 3'
UTR
7 RELL1 cr4 37613352 A 12 3'
UTR
7 RORA cr15 60788653 A 12 3'
UTR
7 RSPO2 cr8 108912568 A 11 3'
UTR
7 SEC61G cr7 54819993 A 11 3'
UTR
7 SEPT7 cr7 35944036 T 11 3'
UTR
7 SLC35D1 cr1 67465371 A 13 3'
UTR
7 SMAD3 cr15 67486032 T 13 3'
UTR
7 SNAPC1 cr14 62262575 T 12 3'
UTR
7 SNRNP40 cr1 31732677 A 11 3'
UTR
7 SNX31 cr8 101585895 T 11 3'
UTR
7 SPIN1 cr9 91090830 A 12 3'
UTR
7 STX11 cr6 144511720 T 12 3'
UTR (continuación)
N° de muestras ición Base de Longitud del Gen Cromosoma Pos
afectadas inicial homopolímero homopolímero afectada afectado 7 SUCNR1 cr3 151599651 A 14 3'
UTR
7 SUMO2 cr17 73164055 T 12 3'
UTR
7 TACC1 cr8 38705639 A 11 3'
UTR
7 TAF4B cr18 23971326 A 13 3'
UTR
7 TBC1D24 cr16 2553486 A 13 3'
UTR
7 TMC1 cr9 75451136 T 15 3'
UTR
7 TMTC3 cr12 88591979 T 13 3'
UTR
7 TOB2 cr22 41832049 A 12 3'
UTR
7 TRA2A cr7 23544783 A 11 3'
UTR
7 TRIM66 cr1 1 8637072 T 13 3'
UTR
7 TRIM66 cr1 1 8635430 A 9 3'
UTR
7 TTBK2 cr15 43037302 A 12 3'
UTR
7 UBA6 cr4 68481877 T 12 3'
UTR
7 UBE2W cr8 74703502 A 14 3'
UTR
7 USP44 cr12 95911789 A 11 3'
UTR
7 USP9X crX 41093298 T 15 3'
UTR
7 VGLL4 cr3 11599949 T 13 3'
UTR
7 VPS26A cr10 70931260 T 11 3'
UTR
7 WHSC1L1 cr8 38175279 A 11 3'
UTR
7 WSB1 crl7 25640280 T 15 3'
UTR
7 WWP1 cr8 87479625 A 13 3'
UTR
7 ZBTB3 cr1 1 62519422 A 12 3'
UTR
7 ZDHHC9 crX 128939304 T 13 3'
UTR
7 ZNF185 crX 152140995 C 10 3'
UTR (continuación)
N° de muestras Posición Base de Longitud del Gen Cromosoma afectadas inicial homopolímero homopolímero afectada afectado 7 ZNF217 cr20 52185289 A 13 3'
UTR
7 ZNF238 cr1 244220229 T 10 3'
UTR
7 ZNF264 cr19 57730525 A 14 3'
UTR
7 ZNF281 cr1 200375822 T 12 3'
UTR
7 ZNF549 cr19 58050715 T 14 3'
UTR
7 ZNF740 cr12 53582896 T 11 3'
UTR
6 ACTR2 cr2 65498035 A 12 3'
UTR
6 ACVR1C cr2 158387581 T 14 3'
UTR
6 AES cr19 3053066 T 13 3'
UTR
6 AJAP1 cr1 4843660 T 11 3'
UTR
6 ALDH8A1 cr6 135238907 T 10 3'
UTR
6 ANKRD28 cr3 15709862 T 13 3'
UTR
6 ANP32B cr9 100777784 A 14 3'
UTR
6 APPBP2 cr17 58524281 A 12 3'
UTR
6 ARAP2 cr4 36068192 A 12 3'
UTR
6 ARHGAP17 cr16 24930800 A 14 3'
UTR
6 ARHGAP5 cr14 32627034 T 11 3'
UTR
6 ARID4A cr14 58840119 T 10 3'
UTR
6 ARL4C cr2 235403511 A 11 3'
UTR
6 ARL5B cr10 18964315 T 11 3'
UTR
6 ATRX crX 76763679 A 13 3'
UTR
6 ATXN7 cr3 63987679 A 15 3'
UTR
6 BCL7A cr12 122498799 A 12 3'
UTR
6 BMPR1B cr4 96077805 A 12 3'
UTR (continuación)
N° de muestras Base de Longitud del afectadas Gen Cromosoma Posición inicial homopolímero homopolímero afectada afectado 6 BRAP cr12 112080129 T 12 3'
UTR
6 C14orf104 cr14 50092077 A 13 3'
UTR
6 C3orf62 cr3 49308391 A 11 3'
UTR
6 C3orf72 cr3 138671354 T 13 3'
UTR
6 C4orf49 cr4 140187661 T 11 3'
UTR
6 C5orf42 cr5 37107311 T 11 3'
UTR
6 C6orf145 cr6 3723315 A 11 3'
UTR
6 CACNB4 cr2 152694131 T 11 3'
UTR
6 CADPS cr3 62384481 T 10 3'
UTR
6 CALN1 cr7 71249416 T 10 3'
UTR
6 CAMKK2 cr12 121676365 A 11 3'
UTR
6 CANX cr5 179155907 T 12 3'
UTR
6 CCDC89 cr11 85395559 T 10 3'
UTR
6 CCDC93 cr2 118675891 A 11 3'
UTR
6 CCND2 cr12 4411082 T 11 3'
UTR
6 CCND2 cr12 4410638 T 16 3'
UTR
6 CD36 cr7 80306123 T 12 3'
UTR
6 CDC73 cr1 193220974 T 12 3'
UTR
6 CDK2 cr12 56366445 A 11 3'
UTR
6 CDK4 cr12 58142004 A 14 3'
UTR
6 CHMP2B cr3 87303064 A 14 3'
UTR
6 CISD1 cr10 60048285 T 11 3'
UTR
6 COIL cr17 55016354 A 14 3'
UTR
6 COPS7A cr12 6840953 A 11 3'
UTR (continuación)
N° de muestras ición Base de Longitud del Gen Cromosoma Pos
afectadas inicial homopolímero homopolímero afectada afectado 6 COX18 cr4 73923142 A 12 3'
UTR
6 CSMD2 cr1 33979967 T 12 3'
UTR
6 CSNK1E cr22 38686864 A 11 3'
UTR
6 CSNK1E cr22 38686807 T 12 3'
UTR
6 DCBLD2 cr3 98516119 A 13 3'
UTR
6 DCP2 cr5 112351058 T 11 3'
UTR
6 DENND5B cr12 31535650 T 12 3'
UTR
6 DIEXF cr1 210026704 T 15 3'
UTR
6 DNAJA2 cr16 46989766 T 10 3'
UTR
6 DSC3 cr18 28573880 A 12 3'
UTR
6 DTNA cr18 32446839 T 12 3'
UTR
6 DUSP9 crX 152916312 T 12 3'
UTR
6 DUT cr15 48634319 A 15 3'
UTR
6 EDA2R crX 65815870 A 13 3'
UTR
6 EFNA5 cr5 106714693 A 12 3'
UTR
6 EHD4 cr15 42191704 A 12 3'
UTR
6 ELTD1 cr1 79356149 T 11 3'
UTR
6 EMCN cr4 101318099 T 12 3'
UTR
6 EPB41L1 cr20 34818694 T 14 3'
UTR
6 EPHA4 cr2 222290623 T 11 3'
UTR
6 ERBB4 cr2 212247967 A 18 3'
UTR
6 ERGIC2 cr12 29493722 T 11 3'
UTR
6 ESRP1 cr8 95719492 A 11 3'
UTR
6 FAM103A1 cr15 83659295 T 14 3'
UTR (continuación)
N° de muestras ición Base de Longitud del Gen Cromosoma Pos
afectadas inicial homopolímero homopolímero afectada afectado 6 FAM116A cr3 57611367 A 11 3'
UTR
6 FAM120A cr9 96327976 A 13 3'
UTR
6 FAM46A cr6 82458103 A 13 3'
UTR
6 FAM46C cr1 118167727 T 12 3'
UTR
6 FAM60A cr12 31435608 T 11 3'
UTR
6 FAM60A cr12 31435556 A 10 3'
UTR
6 FBLN7 cr2 112945284 T 11 3'
UTR
6 FGF9 cr13 22277774 T 10 3'
UTR
6 FOXL2 cr3 138663653 T 13 3'
UTR
6 FOXN3 cr14 89622979 T 13 3'
UTR
6 GLI3 cr7 42001569 A 11 3'
UTR
6 GNRHR cr4 68604166 A 12 3'
UTR
6 GOLGA7B cr10 99627458 T 14 3'
UTR
6 GPAM cr10 113910871 T 12 3'
UTR
6 GRIN2A cr16 9849712 A 11 3'
UTR
6 H3F3C cr12 31944217 T 12 3'
UTR
6 HAS2 cr8 122625936 A 12 3'
UTR
6 HIP1 cr7 75166838 A 11 3'
UTR
6 HMGCS1 cr5 43290194 A 16 3'
UTR
6 HN1L cr16 1751589 T 11 3'
UTR
6 HNRNPA3 cr2 178088002 T 10 3'
UTR
6 HNRNPK cr9 86583189 T 12 3'
UTR
6 HS3ST1 cr4 11400430 T 13 3'
UTR
6 HSPC159 cr2 64687147 T 16 3'
UTR (continuación)
N° de muestras ición Base de Longitud del Gen Cromosoma Pos
afectadas inicial homopolímero homopolímero afectada afectado 6 HUS1B cr6 656079 A 10 3'
UTR
6 IGF2BP1 cr17 47129195 T 12 3'
UTR
6 IL33 cr9 6256984 T 12 3'
UTR
6 IQGAP1 cr15 91044621 A 14 3'
UTR
6 IRF2BP2 cr1 234742204 A 13 3'
UTR
6 KCNJ2 cr17 68175917 A 10 3'
UTR
6 KCTD9 cr8 25286171 A 12 3'
UTR
6 KDM5A cr12 389523 T 11 3'
UTR
6 KHDRBS1 cr1 32508883 A 11 3'
UTR
6 KIAA1671 cr22 25592399 T 12 3'
UTR
6 KIF3A cr5 132029672 A 14 3'
UTR
6 KLF9 cr9 73002115 T 11 3'
UTR
6 LACE1 cr6 108844116 T 11 3'
UTR
6 LANCL1 cr2 211297865 T 9 3'
UTR
6 LDB3 cr10 88495759 T 11 3'
UTR
6 LHFPL4 cr3 9543422 A 13 3'
UTR
6 LPHN3 cr4 62936763 T 12 3'
UTR
6 LRCH1 cr13 47325657 A 10 3'
UTR
6 LRIG2 cr1 113667282 T 11 3'
UTR
6 LRRC4 cr7 127668232 T 9 3'
UTR
6 LRRN3 cr7 110764988 A 13 3'
UTR
6 LSM14A cr19 34718607 T 12 3'
UTR
6 LYPLA1 cr8 54959960 T 12 3'
UTR
6 MAGEB3 crX 30255422 A 11 3'
UTR (continuación)
N° de muestras ición Base de Longitud del Gen Cromosoma Pos
afectadas inicial homopolímero homopolímero afectada afectado 6 MAK16 cr8 33357516 T 11 3'
UTR
6 MAP3K5 cr6 136878751 T 14 3'
UTR
6 MDM2 cr12 69236873 T 13 3'
UTR
6 MED1 cr17 37561712 T 13 3'
UTR
6 MESDC1 cr15 81296262 T 9 3'
UTR
6 MESDC1 cr15 81296129 T 12 3'
UTR
6 METTL21B cr12 58175145 T 15 3'
UTR
6 MKLN1 cr7 131175980 A 10 3'
UTR
6 MLL5 cr7 104754047 T 14 3'
UTR
6 MRE11A cr11 94151547 T 13 3'
UTR
6 MTF2 cr1 93602675 A 14 3'
UTR
6 MTMR9 cr8 11185354 A 10 3'
UTR
6 NAA35 cr9 88637203 A 10 3'
UTR
6 NAALAD2 cr11 89925062 T 10 3'
UTR
6 NAF1 cr4 164049985 A 11 3'
UTR
6 NANP cr20 25595951 A 13 3'
UTR
6 NANP cr20 25595618 A 11 3'
UTR
6 NEDD1 cr12 97346987 A 13 3'
UTR
6 NHLH1 cr1 160341680 A 11 3'
UTR
6 NPAS3 cr14 34271068 A 12 3'
UTR
6 NUS1 cr6 118029805 T 11 3'
UTR
6 OXSR1 cr3 38296209 T 12 3'
UTR
6 PAPD5 cr16 50264031 A 13 3'
UTR
6 PCDH9 cr13 66878392 A 26 3'
UTR (continuación)
N° de muestras Base de Longitud del afectadas Gen Cromosoma Posición inicial homopolímero homopolímero afectada afectado 6 PCGF3 cr4 761102 T 11 3'
UTR
6 PCGF5 cr10 93043932 T 11 3'
UTR
6 PEG3 crl9 57323786 T 13 3'
UTR
6 PHF6 crX 133561520 T 10 3'
UTR
6 PLCH1 cr3 155197737 A 12 3'
UTR
6 PM20D2 cr6 89874860 T 11 3'
UTR
6 PMEPA1 cr20 56226891 T 11 3'
UTR
6 POGZ cr1 151377008 A 13 3'
UTR
6 POLR2D cr2 128604217 A 15 3'
UTR
6 POMT2 cr14 77741349 T 11 3'
UTR
6 POU2F2 cr19 42595246 T 17 3'
UTR
6 POU2F2 cr19 42594356 T 13 3'
UTR
6 PPM1A cr14 60761433 T 10 3'
UTR
6 PPP2R3A cr3 135865709 A 14 3'
UTR
6 PRCC cr1 156770552 T 12 3'
UTR
6 PROK2 cr3 71821522 A 14 3'
UTR
6 PRPF40A cr2 153512044 T 15 3'
UTR
6 PTP4A1 cr6 64290633 T 15 3'
UTR
6 PURB cr7 44920830 A 9 3'
UTR
6 RAP2A cr13 98118463 A 14 3'
UTR
6 RASSF3 cr12 65088985 T 11 3'
UTR
6 RBM12B cr8 94745437 A 11 3'
UTR
6 RBM24 cr6 17292448 A 11 3'
UTR
6 RBM33 cr7 155569742 T 13 3'
UTR (continuación)
N° de muestras ición Base de Longitud del Gen Cromosoma Pos
afectadas inicial homopolímero homopolímero afectada afectado 6 RGS16 cr1 182569291 T 26 3'
UTR
6 RIMKLB cr12 8926680 T 11 3'
UTR
6 RPIA cr2 89049874 A 12 3'
UTR
6 RSPO2 cr8 108911856 A 10 3'
UTR
6 RUNDC3B cr7 87460421 T 12 3'
UTR
6 RUNX1T1 cr8 92972022 T 12 3'
UTR
6 RYR3 cr15 34157541 A 10 3'
UTR
6 SAMD5 cr6 147887423 T 12 3'
UTR
6 SATB2 cr2 200136194 T 12 3'
UTR
6 SCD5 cr4 83552278 A 11 3'
UTR
6 SCML4 cr6 108025850 T 13 3'
UTR
6 SEC24A cr5 134063499 A 14 3'
UTR
6 SEMA4D cr9 91992883 A 13 3'
UTR
6 SEMA6 A cr5 115781801 T 10 3'
UTR
6 SENP1 cr12 48436768 T 11 3'
UTR
6 SETX cr9 135139195 T 11 3'
UTR
6 SFXN2 cr10 104498056 T 14 3'
UTR
6 SGK196 cr8 42978200 T 13 3'
UTR
6 SH3BP5 cr3 15297082 T 13 3'
UTR
6 SH3RF1 cr4 170017405 A 14 3'
UTR
6 SH3RF1 cr4 170016066 A 11 3'
UTR
6 SLAIN2 cr4 48426783 A 11 3'
UTR
6 SLC16A7 cr12 60173983 A 11 3'
UTR
6 SLC2A3 cr12 8072022 T 13 3'
UTR (continuación)
N° de muestras Posición Base de Longitud del Gen Cromosoma afectadas inicial homopolímero homopolímero afectada afectado 6 SLC30A7 cr1 101446221 T 11 3'
UTR
6 SLITRK3 cr3 164905648 A 11 3'
UTR
6 SNX27 cr1 151666826 T 11 3'
UTR
6 SOCS4 cr14 55512747 T 10 3'
UTR
6 SOX4 cr6 21597192 A 11 3'
UTR
6 SOX6 cr11 15988219 A 11 3'
UTR
6 SPTB cr14 65213610 A 13 3'
UTR
6 SRC cr20 36033633 T 13 3'
UTR
6 ST7L cr1 113067470 A 10 3'
UTR
6 STARD7 cr2 96851899 A 14 3'
UTR
6 STXBP5 cr6 147708451 A 10 3'
UTR
6 SULF2 cr20 46286320 A 10 3'
UTR
6 SYK cr9 93658485 A 12 3'
UTR
6 TAF4B cr18 23971176 A 14 3'
UTR
6 TBC1D22B cr6 37299299 T 12 3'
UTR
6 TFAP2C cr20 55213320 T 11 3'
UTR
6 TGIF2 cr20 35220571 A 14 3'
UTR
6 THAP1 cr8 42692467 A 12 3'
UTR
6 TIGD6 cr5 149373143 T 13 3'
UTR
6 TMC7 cr16 19073947 A 10 3'
UTR
6 TMEM106B cr7 12273303 A 13 3'
UTR
6 TMEM14B cr6 10756863 A 11 3'
UTR
6 TMEM33 cr4 41959614 T 14 3'
UTR
6 TMEM57 cr1 25825931 T 13 3'
UTR (continuación)
N° de muestras Base de Longitud del afectadas Gen Cromosoma Posición inicial homopolímero homopolímero afectada afectado 6 TNFAIP3 cr6 138204003 A 12 3'
UTR
6 TNRC6 B cr22 40723852 T 12 3'
UTR
6 TNRC6 B cr22 40722031 A 10 3'
UTR
6 TNRC6 B cr22 40719790 A 14 3'
UTR
6 TSGA10 cr2 99614595 A 13 3'
UTR
6 TTL cr2 113289264 A 11 3'
UTR
6 TTLL5 cr14 76420881 T 11 3'
UTR
6 UBE2M cr19 59067290 A 13 3'
UTR
6 UBXN7 cr3 196080741 T 11 3'
UTR
6 UFM1 cr13 38935214 T 11 3'
UTR
6 USP14 cr18 212029 A 9 3'
UTR
6 VCP cr9 35056078 T 12 3'
UTR
6 VEZF1 cr17 56049540 T 11 3'
UTR
6 WDR82 cr3 52289627 A 11 3'
UTR
6 XPO4 cr13 21356029 A 10 3'
UTR
6 ZBTB43 cr9 129596297 A 11 3'
UTR
6 ZBTB44 cr11 130102910 A 11 3'
UTR
6 ZCCHC5 crX 77911813 A 12 3'
UTR
6 ZFHX3 cr16 72820314 T 15 3'
UTR
6 ZIC5 cr13 100616014 A 11 3'
UTR
6 ZNF136 cr19 12299608 A 13 3'
UTR
6 ZNF2 cr2 95848209 T 11 3'
UTR
6 ZNF347 cr19 53643153 T 12 3'
UTR
6 ZNF407 cr18 72516095 T 11 3'
UTR (continuación)
N° de muestras Base de Longitud del afectadas Gen Cromosoma Posición inicial homopolímero homopolímero afectada afectado 6 ZNF563 cr19 12428823 T 15 3'
UTR
6 ZNF621 cr3 40575421 A 11 3'
UTR
6 ZNF704 cr8 81550824 A 12 3'
UTR
6 ZNF716 cr7 57529811 A 10 3'
UTR
6 ZNF737 cr19 20722094 A 14 3'
UTR
5 A1CF cr10 52566432 T 12 3'
UTR
5 ABHD2 cr15 89739843 T 10 3'
UTR
5 ABI1 cr10 27037487 A 11 3'
UTR
5 ADAP2 cr17 29285905 A 14 3'
UTR
5 ADCY9 cr16 4013843 A 11 3'
UTR
5 ADRBK2 cr22 26121915 A 11 3'
UTR
5 AKIRIN1 cr1 39471672 A 10 3'
UTR
5 ANAPC16 cr10 73993363 T 10 3'
UTR
5 ARID1B cr6 157530262 A 14 3'
UTR
5 ARL1 cr12 101787092 T 11 3'
UTR
5 ARL10 cr5 175800426 T 10 3'
UTR
5 ASB7 cr15 101191402 T 13 3'
UTR
5 ASB7 cr15 101189293 T 10 3'
UTR
5 ATF2 cr2 175939223 A 12 3'
UTR
5 ATP7A crX 77302385 A 11 3'
UTR
5 ATXN1 cr6 16300902 T 11 3'
UTR
5 BACE1 cr1 1 117159733 T 11 3'
UTR
5 BEND2 crX 18183097 A 15 3'
UTR
5 BOD1L cr4 13570453 A 11 3'
UTR (continuación)
N° de muestras Base de Longitud del afectadas Gen Cromosoma Posición inicial homopolímero homopolímero afectada afectado 5 Clorf9 cr1 172580460 T 9 3'
UTR
5 C2orf3 cr2 75890030 A 16 3'
UTR
5 C3orf58 cr3 143709141 T 11 3'
UTR
5 C5orf43 cr5 60453908 A 9 3'
UTR
5 C6orf47 cr6 31626580 A 14 3'
UTR
5 CACNB4 cr2 152695481 T 11 3'
UTR
5 CACNB4 cr2 152695178 T 12 3'
UTR
5 CALML4 cr15 68483096 A 12 3'
UTR
5 CAMTA1 cr1 7827963 A 10 3'
UTR
5 CASK crX 41377809 A 11 3'
UTR
5 CCDC43 cr17 42754916 T 13 3'
UTR
5 CCND1 cr1 1 69466273 A 10 3'
UTR
5 CCND2 cr1 2 4409520 T 10 3'
UTR
5 CD300LB cr17 72518440 A 11 3'
UTR
5 CDC25A cr3 48199852 T 12 3'
UTR
5 CDK19 cr6 110932988 A 12 3'
UTR
5 CELF2 cr10 11373567 A 11 3'
UTR
5 CELSR1 cr22 46756848 A 11 3'
UTR
5 CFL1 cr11 65622295 T 12 3'
UTR
5 CHM crX 85118100 T 13 3'
UTR
5 CLEC3A cr16 78065330 T 12 3'
UTR
5 CLN8 cr8 1729701 T 14 3'
UTR
5 COPS7B cr2 232673378 T 13 3'
UTR
5 COQ7 cr16 19089610 T 13 3'
UTR (continuación)
N° de muestras ición Base de Longitud del Gen Cromosoma Pos
afectadas inicial homopolímero homopolímero afectada afectado 5 CPEB3 cr10 93809826 A 11 3'
UTR
5 CREB3L2 cr7 137563914 A 10 3'
UTR
5 CREB3L2 cr7 137559830 T 14 3'
UTR
5 CRTC1 cr19 18890267 T 14 3'
UTR
5 CTNND2 cr5 10972888 T 14 3'
UTR
5 DAG1 cr3 49571620 T 11 3'
UTR
5 DCUN1D5 cr1 1 102930486 G 7 3'
UTR
5 DDHD1 cr14 53513439 A 12 3'
UTR
5 DIXDC1 cr11 111892703 A 18 3'
UTR
5 DLG3 crX 69722274 T 13 3'
UTR
5 DLGAP2 cr8 1653883 T 11 3'
UTR
5 DNAJC27 cr2 25167221 T 14 3'
UTR
5 DNMT3B cr20 31395997 T 11 3'
UTR
5 DPP8 cr15 65738042 A 11 3'
UTR
5 DSEL cr18 65174583 A 26 3'
UTR
5 DUSP10 cr1 221875661 A 11 3'
UTR
5 DUSP10 cr1 221874929 A 16 3'
UTR
5 EGR1 cr5 137804475 T 15 3'
UTR
5 EGR3 cr8 22545637 T 11 3'
UTR
5 EIF2S1 cr14 67851084 T 13 3'
UTR
5 EIF5A2 cr3 170607962 A 11 3'
UTR
5 ENTPD1 cr10 97628618 A 10 3'
UTR
5 ENTPD4 cr8 23289680 A 11 3'
UTR
5 EP300 cr22 41575537 A 15 3'
UTR (continuación)
N° de muestras Posición Base de Longitud del oma afec Gen Cromostadas inicial homopolímero homopolímero afectada afectado 5 EPM2AIP1 cr3 37030780 T 11 3'
UTR
5 ERBB2IP cr5 65376306 A 11 3'
UTR
5 EVI5 cr1 92977467 T 11 3'
UTR
5 EXOSC2 cr9 133579920 A 11 3'
UTR
5 EYA1 cr8 72110673 A 12 3'
UTR
5 FAM118A cr22 45736689 T 11 3'
UTR
5 FAM122A cr9 71396662 T 11 3'
UTR
5 FAM168B cr2 131805979 G 9 3'
UTR
5 FAM169A cr5 74075446 T 12 3'
UTR
5 FAM178A cr10 102724795 T 14 3'
UTR
5 FAM91A1 cr8 124826583 T 12 3'
UTR
5 FBRSL1 cr12 133160562 A 9 3'
UTR
5 FBXO21 cr12 117582872 T 15 3'
UTR
5 FGF12 cr3 191861010 A 16 3'
UTR
5 FOXC1 cr6 1612419 A 12 3'
UTR
5 FOXN2 cr2 48604358 T 10 3'
UTR
5 FOXO3 cr6 109005013 A 11 3'
UTR
5 FOXP1 cr3 71007140 T 11 3'
UTR
5 FRMD4A cr10 13686797 A 12 3'
UTR
5 FRYL cr4 48500088 T 15 3'
UTR
5 FXR1 cr3 180694863 T 14 3'
UTR
5 GABRB2 cr5 160717254 T 12 3'
UTR
5 GAL cr11 68458592 T 12 3'
UTR
5 GALNT7 cr4 174244278 A 13 3'
UTR (continuación)
N° de muestras Posición Base de Longitud del Gen Cromosoma afectadas inicial homopolímero homopolímero afectada afectado 5 GBP6 cr1 89851722 A 13 3'
UTR
5 GDA cr9 74866560 T 12 3'
UTR
5 GLS cr2 191828629 T 12 3'
UTR
5 GNAI2 cr3 50296405 C 9 3'
UTR
5 GNB1 cr1 1717242 T 12 3'
UTR
5 GPC3 crX 132670054 A 13 3'
UTR
5 GPR137B cr1 236372038 T 10 3'
UTR
5 GPR4 cr19 46093443 A 11 3'
UTR
5 GRSF1 cr4 71686216 A 11 3'
UTR
5 GSR cr8 30536666 A 19 3'
UTR
5 GTF3C1 cr16 27471985 T 11 3'
UTR
5 H3F3B cr17 73774199 T 13 3'
UTR
5 HAS2 cr8 122625490 T 10 3'
UTR
5 HDAC4 cr2 239974109 A 9 3'
UTR
5 HELZ cr17 65073603 A 11 3'
UTR
5 HERPUD2 cr7 35672678 T 14 3'
UTR
5 HEXA cr15 72636197 T 10 3'
UTR
5 HIATL1 cr9 97221877 T 11 3'
UTR
5 HIPK1 cr1 114519857 T 14 3'
UTR
5 HIPK2 cr7 139257355 T 11 3'
UTR
5 HIPK2 cr7 139250450 T 11 3'
UTR
5 HNRNPUL1 cr19 41812943 A 12 3'
UTR
5 HS3ST5 cr6 114378233 T 12 3'
UTR
5 HYOU1 cr1 1 118915072 A 16 3'
UTR (continuación)
N° de muestras Base de Longitud del afectadas Gen Cromosoma Posición inicial homopolímero homopolímero afectada afectado 5 IFNGR1 cr6 137518966 A 14 3'
UTR
5 IGF1 cr12 102790566 T 13 3'
UTR
5 ILF3 cr19 10796313 T 10 3'
UTR
5 IPCEF1 cr6 154476149 A 12 3'
UTR
5 KCTD6 cr3 58487415 T 11 3'
UTR
5 KCTD7 cr7 66105589 T 11 3'
UTR
5 KDM5A cr12 393804 T 11 3'
UTR
5 KHNYN cr14 24908391 T 11 3'
UTR
5 KHSRP cr19 6413217 A 13 3'
UTR
5 KIAA0825 cr5 93489194 T 8 3'
UTR
5 KIAA1267 cr17 44107956 A 14 3'
UTR
5 KIF5C cr2 149879665 T 10 3'
UTR
5 KLHDC5 cr12 27954136 T 13 3'
UTR
5 KLHL24 cr3 183400567 T 10 3'
UTR
5 KLHL28 cr14 45398006 T 11 3'
UTR
5 LDHAL6 A cr11 18500557 T 12 3'
UTR
5 LENG8 cr19 54972801 T 9 3'
UTR
5 LILRB3 cr19 54720558 T 11 3'
UTR
5 LMO4 cr1 87813143 A 11 3'
UTR
5 LONRF2 cr2 100898347 T 12 3'
UTR
5 LRP6 cr12 12272288 A 12 3'
UTR
5 MAGI1 cr3 65340577 T 11 3'
UTR
5 MAK cr6 10764372 T 9 3'
UTR
5 MAL cr2 95719330 A 10 3'
UTR (continuación)
N° de muestras Posición Base de Longitud del Gen Cromosoma afectadas inicial homopolímero homopolímero afectada afectado 5 MAL2 cr8 120256100 A 8 3'
UTR
5 MAP1B cr5 71504719 T 11 3'
UTR
5 MAP3K13 cr3 185200599 A 11 3'
UTR
5 MAPK1 cr22 22114660 T 12 3'
UTR
5 MAPK1IP1L cr14 55532698 A 11 3'
UTR
5 MED1 cr17 37562164 T 11 3'
UTR
5 MED13 cr17 60022040 A 11 3'
UTR
5 MEIS2 cr15 37183446 T 10 3'
UTR
5 MGAT4A cr2 99235842 A 11 3'
UTR
5 MID1IP1 crX 38664817 T 13 3'
UTR
5 MLL2 cr12 49413580 A 12 3'
UTR
5 MS4A7 cr1 1 60161438 A 12 3'
UTR
5 MTDH cr8 98740104 A 10 3'
UTR
5 NAP1L4 cr11 2966276 A 15 3'
UTR
5 NEGR1 cr1 71869847 T 11 3'
UTR
5 NFIB cr9 14082667 T 12 3'
UTR
5 NIPAL3 cr1 24799398 A 12 3'
UTR
5 NPNT cr4 106892254 T 13 3'
UTR
5 NR2F2 cr15 96881909 T 10 3'
UTR
5 NR2F2 cr15 96881216 T 10 3'
UTR
5 NRXN1 cr2 50146697 A 11 3'
UTR
5 NTM cr11 132205623 T 14 3'
UTR
5 NTRK2 cr9 87487518 T 11 3'
UTR
5 NUCKS1 cr1 205683626 A 10 3'
UTR (continuación)
N° de muestras Base de Longitud del afectadas Gen Cromosoma Posición inicial homopolímero homopolímero afectada afectado 5 ORAI3 cr16 30965549 T 15 3'
UTR
5 OTUD1 cr10 23730496 T 10 3'
UTR
5 PALM2 cr9 112708967 A 25 3'
UTR
5 PAPSS2 cr10 89507276 A 11 3'
UTR
5 PDP2 cr16 66920308 T 10 3'
UTR
5 PHF17 cr4 129783593 T 13 3'
UTR
5 PID1 cr2 229889188 A 9 3'
UTR
5 PIGM cr1 159998798 T 11 3'
UTR
5 PIGN cr18 59712451 A 11 3'
UTR
5 PIK3R1 cr5 67594399 A 12 3'
UTR
5 PLAA cr9 26904508 T 10 3'
UTR
5 PLAGL2 cr20 30781644 A 11 3'
UTR
5 PLXNA4 cr7 131809795 A 13 3'
UTR
5 PNPLA3 cr22 44342941 A 13 3'
UTR
5 POLR3B cr12 106903452 A 9 3'
UTR
5 PRKCQ cr10 6469109 T 13 3'
UTR
5 PRKDC cr8 48685753 A 11 3'
UTR
5 PRKX crX 3525721 T 9 3'
UTR
5 PRPF4 cr9 116054493 A 14 3'
UTR
5 PRR23A cr3 138723892 A 9 3'
UTR
5 PRR3 cr6 30531427 T 16 3'
UTR
5 PSMD11 cr17 30807996 A 11 3'
UTR
5 PTAFR cr1 28475836 T 27 3'
UTR
5 PTPN11 cr12 112944240 T 12 3'
UTR (continuación)
N° de muestras Posición Base de Longitud del Gen Cromosoma afectadas inicial homopolímero homopolímero afectada afectado 5 RAB11FIP2 cr10 119766958 A 12 3'
UTR
5 RAD51L1 cr14 68964202 T 12 3'
UTR
5 RB1CC1 cr8 53536112 A 11 3'
UTR
5 RBM25 cr14 73586613 T 12 3'
UTR
5 RBMS3 cr3 30046424 A 11 3'
UTR
5 RC3H1 cr1 173901043 T 11 3'
UTR
5 RDH10 cr8 74236678 T 10 3'
UTR
5 RECK cr9 36123172 T 11 3'
UTR
5 REPS2 crX 17169995 T 13 3'
UTR
5 RHOQ cr2 46809063 T 12 3'
UTR
5 RNF10 cr12 121014987 T 11 3'
UTR
5 RNF149 cr2 101893233 A 10 3'
UTR
5 RNF2 cr1 185070964 T 22 3'
UTR
5 RNLS cr10 90034667 A 11 3'
UTR
5 RRM2B cr8 103216874 A 9 3'
UTR
5 RS1 crX 18659977 A 13 3'
UTR
5 RXRA cr9 137331937 A 12 3'
UTR
5 RYBP cr3 72424549 T 9 3'
UTR
5 SAMD10 cr20 62605493 T 12 3'
UTR
5 SAR1A cr10 71911798 A 12 3'
UTR
5 SASS6 cr1 100549698 A 16 3'
UTR
5 SCAF11 cr12 46314390 A 13 3'
UTR
5 SEC31A cr4 83740163 T 11 3'
UTR
5 SENP1 cr12 48437910 T 11 3'
UTR (continuación)
N° de muestras ición Base de Longitud del Gen Cromosoma Pos
afectadas inicial homopolímero homopolímero afectada afectado 5 SENP5 cr3 196658083 A 10 3'
UTR
5 SERBP1 cr1 67878789 T 11 3'
UTR
5 SFPQ cr1 35649754 A 13 3'
UTR
5 SGCD cr5 156190730 A 12 3'
UTR
5 SGK223 cr8 8175297 T 12 3'
UTR
5 SLC12A2 cr5 127523981 T 24 3'
UTR
5 SLC16A6 cr17 66265042 A 11 3'
UTR
5 SLC30A5 cr5 68399959 T 11 3'
UTR
5 SLC35B4 cr7 133977008 T 10 3'
UTR
5 SLC44A5 cr1 75668544 A 11 3'
UTR
5 SLC7A11 cr4 139092374 A 11 3'
UTR
5 SLC9A2 cr2 103326258 T 10 3'
UTR
5 SLMAP cr3 57913669 T 13 3'
UTR
5 SMAD4 cr18 48609102 T 12 3'
UTR
5 SMAD4 cr18 48606335 T 14 3'
UTR
5 SMARCC2 cr12 56556167 A 14 3'
UTR
5 SMEK1 cr14 91924528 A 11 3'
UTR
5 SMG1 cr16 18819070 T 11 3'
UTR
5 SMU1 cr9 33047210 A 14 3'
UTR
5 SMU1 cr9 33046890 A 15 3'
UTR
5 SNAPC1 cr14 62262433 A 11 3'
UTR
5 SORCS1 cr10 108333635 A 11 3'
UTR
5 SOX4 cr6 21596500 A 12 3'
UTR
5 SPOCK1 cr5 136313113 A 11 3'
UTR (continuación)
N° de muestras Posición Base de Longitud del Gen Cromosoma afectadas inicial homopolímero homopolímero afectada afectado 5 SSBP3 cr1 54692319 T 12 3'
UTR
5 STX1B cr16 31000674 G 8 3'
UTR
5 TARDBP cr1 11084333 T 11 3'
UTR
5 TBC1D1 cr4 38140081 A 10 3'
UTR
5 TBC1D5 cr3 17201870 T 11 3'
UTR
5 TBL1XR1 cr3 176741889 A 13 3'
UTR
5 TBP cr6 170881389 T 13 3'
UTR
5 TCERG1 cr5 145890609 T 12 3'
UTR
5 TFAP2A cr6 10397893 A 11 3'
UTR
5 TLE3 cr15 70340967 A 11 3'
UTR
5 TMEM108 cr3 133116233 A 14 3'
UTR
5 TMEM161B cr5 87491917 T 10 3'
UTR
5 TMEM178 cr2 39944921 T 13 3'
UTR
5 TMEM209 cr7 129805893 A 12 3'
UTR
5 TMEM26 cr10 63166725 A 12 3'
UTR
5 TMEM47 crX 34646666 T 12 3'
UTR
5 TMTC3 cr12 88590177 T 12 3'
UTR
5 TNFAIP1 cr17 26672324 A 10 3'
UTR
5 TNRC6 B cr22 40731027 T 10 3'
UTR
5 TNRC6 B cr22 40720294 T 15 3'
UTR
5 TNRC6 C cr17 76101834 T 9 3'
UTR
5 TOB1 cr17 48940256 A 11 3'
UTR
5 TOMM20 cr1 235275027 T 12 3'
UTR
5 TPH1 cr11 18042321 A 11 3'
UTR (continuación)
N° de muestras Base de Longitud del afectadas Gen Cromosoma Posición inicial homopolímero homopolímero afectada afectado 5 TRPS1 cr8 116424407 A 12 3'
UTR
5 TRPS1 cr8 116423510 A 12 3'
UTR
5 TSPAN14 cr10 82279557 T 14 3'
UTR
5 TSR2 crX 54471045 T 10 3'
UTR
5 UACA cr15 70946988 A 12 3'
UTR
5 UGT2B28 cr4 70160632 A 11 3'
UTR
5 USP28 cr1 1 113669136 A 11 3'
UTR
5 WASL cr7 123323428 A 12 3'
UTR
5 WDFY1 cr2 224742022 T 12 3'
UTR
5 WIF1 cr12 65444595 T 13 3'
UTR
5 XYLT1 cr16 17199775 A 11 3'
UTR
5 ZNF238 cr1 244219573 A 9 3'
UTR
5 ZNF430 cr19 21241252 A 14 3'
UTR
5 ZNF521 cr18 22642386 T 13 3'
UTR
5 ZNF536 cr19 31048941 A 11 3'
UTR
5 ZNF652 cr17 47369576 T 11 3'
UTR
5 ZNF737 cr19 20723566 A 11 3'
UTR
5 ZNF80 cr3 113954690 A 12 3'
UTR
4 ACLY cr17 40023617 A 13 3'
UTR
4 ACOX1 cr17 73941869 A 10 3'
UTR
4 ADSS cr1 244571936 T 10 3'
UTR
4 AFTPH cr2 64819249 A 20 3'
UTR
4 AICDA cr12 8755425 T 16 3'
UTR
4 AK4 cr1 65692499 T 11 3'
UTR (continuación)
N° de muestras Posición Base de Longitud del Gen Cromosoma afectadas inicial homopolímero homopolímero afectada afectado 4 ANKIB1 cr7 92028647 A 15 3'
UTR
4 ANKRD40 cr17 48770711 A 10 3'
UTR
4 ANXA11 cr10 81915055 T 9 3'
UTR
4 AP1AR cr4 113190822 A 11 3'
UTR
4 APOL1 cr22 36662141 T 12 3'
UTR
4 ARF5 cr7 127231635 T 10 3'
UTR
4 ARHGAP28 cr18 6914974 A 10 3'
UTR
4 ARID1B cr6 157529243 T 10 3'
UTR
4 ARPP19 cr15 52841555 A 10 3'
UTR
4 ATP2B1 cr12 89984601 T 12 3'
UTR
4 ATP9A cr20 50214427 A 10 3'
UTR
4 ATXN1 cr6 16301824 A 13 3'
UTR
4 ATXN7 cr3 63985894 T 11 3'
UTR
4 B3GNT7 cr2 232264806 T 26 3'
UTR
4 BAG1 cr9 33253979 T 12 3'
UTR
4 BBX cr3 107529758 T 12 3'
UTR
4 BCL11A cr2 60685736 T 13 3'
UTR
4 BCL7A cr12 122499827 T 14 3'
UTR
4 BCL7A cr12 122498867 A 11 3'
UTR
4 BCLAF1 cr6 136581674 T 11 3'
UTR
4 BIN1 cr2 127805622 T 10 3'
UTR
4 BMPR2 cr2 203426176 T 8 3'
UTR
4 BNIP3L cr8 26268445 A 10 3'
UTR
4 BTBD11 cr12 108052115 T 12 3'
UTR (continuación)
N° de muestras osición Base de Longitud del Gen Cromosoma P
afectadas inicial homopolímero homopolímero afectada afectado 4 BTBD7 cr14 93708432 A 12 3'
UTR
4 C12orf12 cr12 91346439 A 11 3'
UTR
4 C12orf5 cr12 4463524 T 10 3'
UTR
4 C14orf37 cr14 58471378 T 11 3'
UTR
4 C16orf53 cr16 29833642 A 13 3'
UTR
4 C17orf96 cr17 36829265 T 8 3'
UTR
4 C20orf12 cr20 18364708 T 12 3'
UTR
4 C2orf29 cr2 101886538 T 12 3'
UTR
4 C2orf67 cr2 210886727 T 14 3'
UTR
4 C6orf47 cr6 31626545 T 14 3'
UTR
4 C7orf46 cr7 23741876 T 11 3'
UTR
4 C9orf123 cr9 7797700 T 12 3'
UTR
4 CAMLG cr5 134086670 A 13 3'
UTR
4 CBFA2T2 cr20 32236969 T 11 3'
UTR
4 CBFB cr16 67133969 T 9 3'
UTR
4 CBL cr1 1 119175340 T 14 3'
UTR
4 CBLN1 cr16 49312880 A 10 3'
UTR
4 CCDC102B cr18 66722368 A 9 3'
UTR
4 CCND2 cr12 4411110 T 12 3'
UTR
4 CCNE2 cr8 95892992 A 11 3'
UTR
4 CDH1 cr16 68867611 T 12 3'
UTR
4 CELF2 cr10 11375889 A 10 3'
UTR
4 CEP68 cr2 65312945 A 12 3'
UTR
4 CGGBP1 cr3 88104472 T 10 3'
UTR (continuación)
N° de muestras ición Base de Longitud del Gen Cromosoma Pos
afectadas inicial homopolímero homopolímero afectada afectado 4 CHD7 cr8 61778758 T 11 3'
UTR
4 CIT cr12 120123939 T 11 3'
UTR
4 CLCN5 crX 49862213 A 12 3'
UTR
4 CLIC5 cr6 45869504 T 10 3'
UTR
4 CLSPN cr1 36201819 A 17 3'
UTR
4 CNTN3 cr3 74312679 T 11 3'
UTR
4 COL19A1 cr6 70918737 T 12 3'
UTR
4 COPG cr3 128996444 T 19 3'
UTR
4 CORO2B cr15 69020046 T 10 3'
UTR
4 CPLX4 cr18 56963029 A 10 3'
UTR
4 CPSF2 cr14 92630061 T 9 3'
UTR
4 CTDSPL cr3 38025453 A 11 3'
UTR
4 CTNNB1 cr3 41281477 T 25 3'
UTR
4 CUL5 cr11 107975795 T 13 3'
UTR
4 CYB5B cr16 69499981 T 9 3'
UTR
4 DACH1 cr13 72014288 T 11 3'
UTR
4 DCAF10 cr9 37865073 T 12 3'
UTR
4 DCAF16 cr4 17804263 A 15 3'
UTR
4 DCP1A cr3 53321360 T 27 3'
UTR
4 DCUN1D1 cr3 182662347 A 12 3'
UTR
4 DCUN1D5 cr1 1 102928449 A 11 3'
UTR
4 DDAH1 cr1 85786201 A 12 3'
UTR
4 DDN cr12 49389156 A 11 3'
UTR
4 DDX5 cr17 62495664 A 10 3'
UTR (continuación)
N° de muestras ición Base de Longitud del Gen Cromosoma Pos
afectadas inicial homopolímero homopolímero afectada afectado 4 DDX52 cr17 35974148 A 10 3'
UTR
4 DDX6 cr11 118622141 A 10 3'
UTR
4 DLGAP4 cr20 35156622 T 10 3'
UTR
4 DNAJB7 cr22 41256660 T 14 3'
UTR
4 DNAJB9 cr7 108213938 T 12 3'
UTR
4 DNAJC15 cr13 43681779 T 9 3'
UTR
4 DOPEY2 cr21 37666277 A 14 3'
UTR
4 DUSP4 cr8 29193728 T 10 3'
UTR
4 DYRK2 cr12 68055576 T 10 3'
UTR
4 DYRK2 cr12 68054141 A 11 3'
UTR
4 EBF1 cr5 158125829 A 12 3'
UTR
4 EDEM1 cr3 5260540 T 10 3'
UTR
4 EFNA5 cr5 106716350 A 11 3'
UTR
4 EFNA5 cr5 106716281 A 12 3'
UTR
4 EFNB1 crX 68061978 A 12 3'
UTR
4 EGFR cr7 55273591 A 13 3'
UTR
4 EIF2B2 cr14 75476004 A 10 3'
UTR
4 EIF4B cr12 53434572 T 12 3'
UTR
4 EIF4EBP2 cr10 72188037 A 11 3'
UTR
4 ELAVL3 cr19 11563289 T 12 3'
UTR
4 ENC1 cr5 73923281 A 13 3'
UTR
4 EPB41L5 cr2 120932994 T 14 3'
UTR
4 EPM2AIP1 cr3 37032033 A 10 3'
UTR
4 EPS15 cr1 51822219 A 12 3'
UTR (continuación)
N° de muestras Posición Base de Longitud del oma afec Gen Cromostadas inicial homopolímero homopolímero afectada afectado 4 ERCC6 cr10 50666628 A 13 3'
UTR
4 EVI5 cr1 92975050 T 14 3'
UTR
4 EXTL2 cr1 101338118 A 10 3'
UTR
4 FADS1 cr11 61569354 T 16 3'
UTR
4 FAF2 cr5 175935960 T 10 3'
UTR
4 FAM105A cr5 14611814 T 10 3'
UTR
4 FAM120C crX 54098998 A 12 3'
UTR
4 FAM13B cr5 137274915 A 11 3'
UTR
4 FAM164A cr8 79631105 T 10 3'
UTR
4 FAM189A1 cr15 29414906 G 8 3'
UTR
4 FAM46A cr6 82457992 T 10 3'
UTR
4 FAM76A cr1 28087457 T 17 3'
UTR
4 FAM8A1 cr6 17609273 T 11 3'
UTR
4 FANCD2 cr3 10143061 T 25 3'
UTR
4 FBXO21 cr12 117582899 T 11 3'
UTR
4 FBXO27 cr19 39514872 T 12 3'
UTR
4 FBXO36 cr2 230876985 A 11 3'
UTR
4 FCGR3A cr1 161512430 T 9 3'
UTR
4 FGD5 cr3 14976010 T 9 3'
UTR
4 FGF12 cr3 191859718 T 11 3'
UTR
4 FGFBP3 cr10 93667293 A 15 3'
UTR
4 FGFR1OP2 cr12 27118594 A 11 3'
UTR
4 FICD cr12 108913292 A 11 3'
UTR
4 FKBP2 cr1 1 64011554 A 10 3'
UTR (continuación)
N° de muestras Base de Longitud del afectadas Gen Cromosoma Posición inicial homopolímero homopolímero afectada afectado 4 FKBP5 cr6 35554624 T 12 3'
UTR
4 FOXN2 cr2 48603079 T 10 3'
UTR
4 FOXO3 cr6 109004889 A 16 3'
UTR
4 FPGT cr1 74672686 T 9 3'
UTR
4 G3BP1 cr5 151184779 T 11 3'
UTR
4 GABRA4 cr4 46923150 T 11 3'
UTR
4 GABRB1 cr4 47428211 A 10 3'
UTR
4 GABRB2 cr5 160719907 A 9 3'
UTR
4 GADL1 cr3 30769514 T 11 3'
UTR
4 GAL3ST4 cr7 99757342 A 13 3'
UTR
4 GALNT1 cr18 33290437 A 9 3'
UTR
4 GDAP2 cr1 118420019 T 11 3'
UTR
4 GDAP2 cr1 118411744 T 10 3'
UTR
4 GJC1 cr17 42876925 A 14 3'
UTR
4 GNAI2 cr3 50296330 A 12 3'
UTR
4 GPR12 cr13 27330332 T 10 3'
UTR
4 GRAMD2 cr15 72452633 A 10 3'
UTR
4 GRIA4 cr11 105783203 A 11 3'
UTR
4 GRIK2 cr6 102517011 T 11 3'
UTR
4 GRIN2A cr16 9851215 T 15 3'
UTR
4 GRIN3A cr9 104331901 A 9 3'
UTR
4 GXYLT1 cr12 42477780 A 10 3'
UTR
4 HBEGF cr5 139713520 T 11 3'
UTR
4 HBS1L cr6 135357535 A 10 3'
UTR (continuación)
N° de muestras ición Base de Longitud del Gen Cromosoma Pos
afectadas inicial homopolímero homopolímero afectada afectado 4 HCCS crX 11140989 T 11 3'
UTR
4 HIF3A cr19 46843765 T 12 3'
UTR
4 HLCS cr21 38123320 A 11 3'
UTR
4 HNRNPA3 cr2 178088125 A 12 3'
UTR
4 HNRNPH2 crX 100668932 T 13 3'
UTR
4 HNRNPR cr1 23636874 T 11 3'
UTR
4 HNRNPU cr1 245014280 T 11 3'
UTR
4 HOOK3 cr8 42876247 A 29 3'
UTR
4 HSDL1 cr16 84155968 T 13 3'
UTR
4 HSPA9 cr5 137891047 A 13 3'
UTR
4 HTR2A cr13 47408902 T 11 3'
UTR
4 IGDCC4 cr15 65674432 A 12 3'
UTR
4 IGF1 cr12 102790988 A 11 3'
UTR
4 IKZF2 cr2 213869993 A 11 3'
UTR
4 IPO9 cr1 201847055 A 12 3'
UTR
4 IRGQ cr19 44094353 A 11 3'
UTR
4 KBTBD7 cr13 41766026 A 9 3'
UTR
4 KCNH3 cr12 49952059 A 12 3'
UTR
4 KCNK2 cr1 215408898 T 10 3'
UTR
4 KDELR2 cr7 6501817 A 10 3'
UTR
4 KDM5A cr12 393489 T 12 3'
UTR
4 KDM5A cr12 393295 T 11 3'
UTR
4 KDSR cr18 60998042 T 15 3'
UTR
4 KHSRP cr19 6413651 T 10 3'
UTR (continuación)
N° de muestras ición Base de Longitud del Gen Cromosoma Pos
afectadas inicial homopolímero homopolímero afectada afectado 4 KIAA0494 cr1 47142711 T 9 3'
UTR
4 KIAA1267 cr17 44107738 A 9 3'
UTR
4 KIAA1324 cr1 109749368 T 11 3'
UTR
4 KIAA1324 cr1 109748644 T 11 3'
UTR
4 KIAA1586 cr6 56919727 T 12 3'
UTR
4 KIAA1737 cr14 77582032 T 14 3'
UTR
4 KIAA2026 cr9 5919249 T 11 3'
UTR
4 KIF1B cr1 10438932 T 10 3'
UTR
4 LATS2 cr13 21548562 T 13 3'
UTR
4 LATS2 cr13 21547830 A 9 3'
UTR
4 LBR cr1 225590887 A 10 3'
UTR
4 LCOR cr10 98715988 T 9 3'
UTR
4 LCORL cr4 17882781 T 11 3'
UTR
4 LHFP cr13 39917691 A 12 3'
UTR
4 LIN7C cr11 27517703 A 14 3'
UTR
4 LLGL1 cr17 18147555 T 14 3'
UTR
4 LMNB2 cr19 2428236 A 10 3'
UTR
4 LMO4 cr1 87811174 A 11 3'
UTR
4 LRRC27 cr10 134193076 T 9 3'
UTR
4 LTN1 cr21 30301899 T 10 3'
UTR
4 MAGEB18 crX 26158459 T 10 3'
UTR
4 MAP3K7 cr6 91225524 A 9 3'
UTR
4 MAP6 cr11 75316787 A 11 3'
UTR
4 MAP6 cr11 75315642 T 10 3'
UTR (continuación)
N° de muestras ición Base de Longitud del Gen Cromosoma Pos
afectadas inicial homopolímero homopolímero afectada afectado 4 1/mrt cr4 164446860 T 9 3'
UTR
4 MAX cr14 65543065 A 10 3'
UTR
4 MCTS1 crX 119754487 A 14 3'
UTR
4 MDM2 cr12 69233886 T 11 3'
UTR
4 MED19 cr1 1 57471199 T 13 3'
UTR
4 METAP2 cr12 95908545 A 11 3'
UTR
4 MIER3 cr5 56216451 A 10 3'
UTR
4 MKL1 cr22 40806781 C 9 3'
UTR
4 MKLN1 cr7 131181200 T 10 3'
UTR
4 MKX cr10 27962805 A 10 3'
UTR
4 MMAA cr4 146578529 T 9 3'
UTR
4 MNT cr17 2287533 T 13 3'
UTR
4 MOBKL1A cr4 71853812 T 13 3'
UTR
4 MORC1 cr3 108677146 A 10 3'
UTR
4 MOSPD1 crX 134022551 A 9 3'
UTR
4 MSI1 cr12 120779455 A 14 3'
UTR
4 MTF1 cr1 38278949 A 11 3'
UTR
4 NCEH1 cr3 172349171 T 12 3'
UTR
4 NCOA3 cr20 46282984 T 11 3'
UTR
4 NCOA5 cr20 44689693 A 10 3'
UTR
4 NFIB cr9 14082769 A 14 3'
UTR
4 NKAIN2 cr6 125146684 T 9 3'
UTR
4 NMNAT1 cr1 10044969 T 8 3'
UTR
4 NPC2 cr14 74946724 A 10 3'
UTR (continuación)
N° de muestras ición Base de Longitud del Gen Cromosoma Pos
afectadas inicial homopolímero homopolímero afectada afectado 4 NPNT cr4 106890724 T 10 3'
UTR
4 NPR3 cr5 32786465 T 11 3'
UTR
4 NR2F2 cr15 96882212 G 8 3'
UTR
4 NUFIP2 cr17 27584536 T 12 3'
UTR
4 OGFOD1 cr16 56510333 T 12 3'
UTR
4 ONECUT2 cr18 55144549 A 11 3'
UTR
4 OSBP cr1 1 59341900 T 12 3'
UTR
4 OSBP2 cr22 31302451 T 10 3'
UTR
4 OTUB2 cr14 94512841 A 11 3'
UTR
4 PABPC5 crX 90691818 T 9 3'
UTR
4 PAPOLA crl4 97033430 A 10 3'
UTR
4 PAPSS2 cr10 89506162 A 11 3'
UTR
4 PAQR7 cr1 26188503 A 31 3'
UTR
4 PCDHB3 cr5 140482943 T 10 3'
UTR
4 PCM1 cr8 17886665 A 26 3'
UTR
4 PCSK2 cr20 17463028 T 11 3'
UTR
4 PDE4D cr5 58266735 A 15 3'
UTR
4 PDPK1 cr16 2653089 T 11 3'
UTR
4 PELI2 cr14 56764821 T 11 3'
UTR
4 PGR cr11 100902321 T 15 3'
UTR
4 PHKB cr16 47734578 A 10 3'
UTR
4 PHLDA1 cr12 76421757 T 12 3'
UTR
4 PIGM cr1 159997525 A 10 3'
UTR
4 PIM1 cr6 37143155 T 11 3'
UTR (continuación)
N° de muestras Posición Base de Longitud del a adas Gen Cromosoma o h opfect inicial homopolímer om olímero afectada afectado 4 PIM2 crX 48770831 A 20 3'
UTR
4 PKD2 cr4 88998190 A 11 3'
UTR
4 PKP4 cr2 159537312 T 10 3'
UTR
4 PLCB1 cr20 8863118 A 10 3'
UTR
4 PLEKHA6 cr1 204190022 A 13 3'
UTR
4 PNPT1 cr2 55861395 T 16 3'
UTR
4 POLH cr6 43586698 G 10 3'
UTR
4 POP1 cr8 99172000 A 12 3'
UTR
4 PPARGC1B cr5 149227267 A 14 3'
UTR
4 PPIC cr5 122359467 A 12 3'
UTR
4 PPP1R10 cr6 30568234 A 11 3'
UTR
4 PRDM1 cr6 106557171 T 10 3'
UTR
4 PRPF40A cr2 153509691 A 11 3'
UTR
4 PSMD5 cr9 123578376 A 10 3'
UTR
4 PTCD3 cr2 86366926 A 11 3'
UTR
4 PTPN18 cr2 131131908 T 14 3'
UTR
4 PTPRJ cr11 48189153 T 13 3'
UTR
4 RAB11FIP2 cr10 119766677 A 16 3'
UTR
4 RAB11FIP2 cr10 119765266 T 11 3'
UTR
4 RAB22A cr20 56941068 T 10 3'
UTR
4 RAB39B crX 154488466 T 11 3'
UTR
4 RAB8 B cr15 63559206 T 12 3'
UTR
4 RALYL cr8 85833388 T 10 3'
UTR
4 RANBP10 cr16 67757024 T 10 3'
UTR (continuación)
N° de muestras Base de Longitud del afectadas Gen Cromosoma Posición inicial homopolímero homopolímero afectada afectado 4 RAP2B cr3 152883481 T 10 3'
UTR
4 RAP2B cr3 152883395 T 12 3'
UTR
4 RAPH1 cr2 204300244 A 12 3'
UTR
4 RBM12B cr8 94744118 T 11 3'
UTR
4 RBM15B cr3 51431679 T 11 3'
UTR
4 RBMS3 cr3 30045473 T 10 3'
UTR
4 RBMXL1 cr1 89446107 T 14 3'
UTR
4 RCOR3 cr1 211487676 T 10 3'
UTR
4 RDX cr11 110102325 A 10 3'
UTR
4 RGS18 cr1 192154126 T 8 3'
UTR
4 RGS6 cr14 73030606 A 11 3'
UTR
4 RNF41 cr12 56599353 G 10 3'
UTR
4 RP1 cr8 55543160 T 14 3'
UTR
4 RPL27A cr11 8711061 A 13 3'
UTR
4 RPP14 cr3 58304719 A 14 3'
UTR
4 RPRD2 cr1 150447772 T 10 3'
UTR
4 RPRD2 cr1 150446032 A 23 3'
UTR
4 RPS6KA2 cr6 166824706 T 13 3'
UTR
4 RPS6KB1 cr17 58024908 A 10 3'
UTR
4 RRAGD cr6 90077647 T 12 3'
UTR
4 RRM2 cr2 10269544 T 10 3'
UTR
4 RRP15 cr1 218506526 A 10 3'
UTR
4 RTF1 cr15 41775015 T 10 3'
UTR
4 RUFY3 cr4 71655520 A 12 3'
UTR (continuación)
N° de muestras Posición Base de Longitud del Gen Cromosoma afectadas inicial homopolímero homopolímero afectada afectado 4 RUNDC3B cr7 87459581 A 13 3'
UTR
4 SAR1A cr10 71910315 A 10 3'
UTR
4 SATB2 cr2 200135086 T 10 3'
UTR
4 SCAI cr9 127706579 T 16 3'
UTR
4 SCUBE3 cr6 35216591 A 10 3'
UTR
4 SDC4 cr20 43955023 A 24 3'
UTR
4 SDC4 cr20 43954848 A 9 3'
UTR
4 SELT cr3 150345688 T 10 3'
UTR
4 SENP5 cr3 196660478 T 11 3'
UTR
4 SERPINE1 cr7 100781987 G 8 3'
UTR
4 SFXN1 cr5 174954918 T 22 3'
UTR
4 SGK3 cr8 67772690 A 11 3'
UTR
4 SHANK2 cr11 70317369 A 12 3'
UTR
4 SHCBP1 cr16 46614658 T 14 3'
UTR
4 SHOX2 cr3 157814199 A 11 3'
UTR
4 SIX1 cr14 61111921 A 11 3'
UTR
4 SLC17A5 cr6 74303467 A 10 3'
UTR
4 SLC25A20 cr3 48894565 A 12 3'
UTR
4 SLC2A12 cr6 134312045 T 11 3'
UTR
4 SLC2A2 cr3 170715683 T 10 3'
UTR
4 SLC35F1 cr6 118636596 T 24 3'
UTR
4 SLC36A4 cr11 92881233 T 12 3'
UTR
4 SLC6A17 cr1 110743671 A 10 3'
UTR
4 SLC6A4 cr17 28523382 T 12 3'
UTR (continuación)
N° de muestras Base de Longitud del afectadas Gen Cromosoma Posición inicial homopolímero homopolímero afectada afectado 4 SLC6 A6 cr3 14530419 T 12 3'
UTR
4 SLC6 A6 cr3 14526824 T 11 3'
UTR
4 SMAD5 cr5 135517921 A 14 3'
UTR
4 SMAD5 cr5 135515014 A 10 3'
UTR
4 SMAD7 cr18 46447623 A 10 3'
UTR
4 SMEK1 cr14 91924425 A 10 3'
UTR
4 SMS crX 22012649 T 10 3'
UTR
4 SORL1 cr1 1 121500400 A 14 3'
UTR
4 SOST cr17 41831941 T 10 3'
UTR
4 SOST cr17 41831361 T 11 3'
UTR
4 SOX1 cr13 112724861 A 10 3'
UTR
4 SOX11 cr2 5834918 A 11 3'
UTR
4 SPIRE1 cr18 12449300 T 11 3'
UTR
4 SPRED1 cr15 38648129 A 9 3'
UTR
4 SPTLC2 cr14 77975645 A 11 3'
UTR
4 SRCIN1 cr17 36687785 T 12 3'
UTR
4 SRGAP1 cr12 64537560 A 14 3'
UTR
4 SRGAP2 cr1 206636489 T 12 3'
UTR
4 SS18 cr18 23596687 A 11 3'
UTR
4 ST3GAL5 cr2 86067101 A 9 3'
UTR
4 STEAP3 cr2 120023163 T 12 3'
UTR
4 STK11 cr19 1228058 T 11 3'
UTR
4 STX12 cr1 28150575 T 10 3'
UTR
4 STX3 cr11 59569295 A 11 3'
UTR (continuación)
N° de muestras Posición Base de Longitud del Gen Cromosoma afectadas inicial homopolímero homopolímero afectada afectado 4 STX6 cr1 180945093 A 9 3'
UTR
4 SUZ12 cr17 30326763 T 12 3'
UTR
4 SYNJ2BP cr14 70834868 A 10 3'
UTR
4 SYT11 cr1 155851834 T 12 3'
UTR
4 TAF8 cr6 42045495 T 11 3'
UTR
4 TCF20 cr22 42556646 A 12 3'
UTR
4 TCF4 cr18 52894479 A 13 3'
UTR
4 TCF4 cr18 52891868 A 11 3'
UTR
4 TCP11L1 cr11 33094799 T 11 3'
UTR
4 TFAP2B cr6 50814900 A 10 3'
UTR
4 TMEM119 cr12 108984472 A 11 3'
UTR
4 TMEM14C cr6 10731011 A 9 3'
UTR
4 TMEM14E cr3 152058228 T 10 3'
UTR
4 TMEM201 cr1 9674449 T 10 3'
UTR
4 TMEM213 cr7 138490613 T 13 3'
UTR
4 TMEM64 cr8 91637753 A 12 3'
UTR
4 TMOD3 cr15 52201130 T 10 3'
UTR
4 TNFAIP8 cr5 118729618 A 10 3'
UTR
4 TNIP3 cr4 122052756 T 22 3'
UTR
4 TNRC6 B cr22 40724536 T 10 3'
UTR
4 TOPORS cr9 32541245 A 10 3'
UTR
4 TOR1AIP1 cr1 179888400 A 12 3'
UTR
4 TP53INP1 cr8 95941646 A 13 3'
UTR
4 TRIM56 cr7 100733606 A 9 3'
UTR (continuación)
N° de muestras Base de Longitud del afectadas Gen Cromosoma Posición inicial homopolímero homopolímero afectada afectado 4 TRIM66 cr1 1 8636480 T 13 3'
UTR
4 TRIP10 cr19 6751495 A 12 3'
UTR
4 TRPM1 cr15 31293995 A 11 3'
UTR
4 TRRAP cr7 98610830 T 11 3'
UTR
4 TSC22D2 cr3 150177375 T 13 3'
UTR
4 TTC30B cr2 178415366 T 10 3'
UTR
4 TTC39C cr18 21715264 T 11 3'
UTR
4 UBASH3B cr1 1 122681008 T 13 3'
UTR
4 UBE2G1 cr17 4173433 A 10 3'
UTR
4 UBLCP1 cr5 158712401 A 11 3'
UTR
4 UBN2 cr7 138992059 T 9 3'
UTR
4 UBN2 cr7 138989574 T 10 3'
UTR
4 UGT8 cr4 115598050 T 11 3'
UTR
4 UGT8 cr4 115598017 A 12 3'
UTR
4 USP43 cr17 9632427 T 13 3'
UTR
4 UTP15 cr5 72876582 T 12 3'
UTR
4 VAX1 cr10 118893337 A 10 3'
UTR
4 WDR17 cr4 177100754 T 11 3'
UTR
4 WDTC1 cr1 27633121 C 9 3'
UTR
4 WNK3 crX 54224160 A 16 3'
UTR
4 WSB1 cr17 25640066 A 15 3'
UTR
4 WSB2 cr12 118470668 T 10 3'
UTR
4 XKR6 cr8 10755309 T 10 3'
UTR
4 XKR7 cr20 30585884 G 10 3'
UTR (continuación)
N° de muestras Posición Base de Longitud del Gen Cromosoma afectadas inicial homopolímero homopolímero afectada afectado 4 XYLT1 cr16 17199280 T 8 3'
UTR
4 ZADH2 cr18 72910475 T 13 3'
UTR
4 ZBTB34 cr9 129646763 T 11 3'
UTR
4 ZBTB38 cr3 141164925 A 14 3'
UTR
4 ZBTB41 cr1 197124441 A 11 3'
UTR
4 ZBTB7A cr19 4046340 T 11 3'
UTR
4 ZC3HAV1L cr7 138711008 A 11 3'
UTR
4 ZCCHC2 cr18 60244188 A 10 3'
UTR
4 ZDBF2 cr2 207177005 T 8 3'
UTR
4 ZDHHC13 cr11 19197719 A 10 3'
UTR
4 ZDHHC7 cr16 85009055 A 12 3'
UTR
4 ZFP36L2 cr2 43450053 C 8 3'
UTR
4 ZFP36L2 cr2 43449809 A 9 3'
UTR
4 ZNF154 cr19 58212530 A 12 3'
UTR
4 ZNF238 cr1 244219033 T 11 3'
UTR
4 ZNF24 cr18 32917176 T 12 3'
UTR
4 ZNF287 cr17 16454419 T 9 3'
UTR
4 ZNF322A cr6 26636980 T 11 3'
UTR
4 ZNF395 cr8 28205776 T 27 3'
UTR
4 ZNF451 cr6 57033558 A 8 3'
UTR
4 ZNF498 cr7 99229241 T 11 3'
UTR
4 ZNF518B cr4 10442494 A 9 3'
UTR
4 ZNF527 cr19 37880936 T 12 3'
UTR
4 ZNF572 cr8 125990551 T 11 3'
UTR (continuación)
N° de muestras Posición Base de Longitud del Gen Cromosoma afectadas inicial homopolímero homopolímero afectada afectado 4 ZNF578 cr19 53018984 T 12 3'
UTR
4 ZNF585A cr19 37641928 T 11 3'
UTR
4 ZNF594 cr17 5084035 A 10 3'
UTR
4 ZNF658 cr9 40771887 T 12 3'
UTR
4 ZNF740 cr12 53584463 T 14 3'
UTR
3 AASDHPPT cr1 1 105967764 A 11 3'
UTR
3 ABI2 cr2 204292194 T 10 3'
UTR
3 ACOX1 cr17 73941980 T 9 3'
UTR
3 ACTBL2 cr5 56777006 T 10 3'
UTR
3 ACVR1C cr2 158390343 A 10 3'
UTR
3 ACVR2A cr2 148687300 A 10 3'
UTR
3 ADAMTS18 cr16 77316279 T 11 3'
UTR
3 ADAMTSL5 cr19 1505368 A 13 3'
UTR
3 ADRA1D cr20 4201344 T 10 3'
UTR
3 AFF1 cr4 88057269 T 11 3'
UTR
3 AFF2 crX 148080911 A 8 3'
UTR
3 AFF2 crX 148080284 T 10 3'
UTR
3 AGMAT cr1 15899314 T 18 3'
UTR
3 AGPAT5 cr8 6617153 A 11 3'
UTR
3 AGR2 cr7 16832295 T 11 3'
UTR
3 AHCTF1 cr1 247002534 A 7 3'
UTR
3 AK5 cr1 78025528 T 13 3'
UTR
3 AKAP11 cr13 42896913 T 9 3'
UTR
3 AKAP5 cr14 64940497 A 9 3'
UTR (continuación)
N° de muestras Posición Base de Longitud del oma afec Gen Cromostadas inicial homopolímero homopolímero afectada afectado 3 AKAP8 cr19 15465362 A 11 3'
UTR
3 AKAP8 cr19 15465302 A 9 3'
UTR
3 AKIRIN2 cr6 88384713 A 11 3'
UTR
3 AKT2 cr19 40736623 T 14 3'
UTR
3 ALS2CR8 cr2 203849779 A 14 3'
UTR
3 ANKH cr5 14711208 A 8 3'
UTR
3 ANKH cr5 14705393 A 13 3'
UTR
3 ANKRD12 cr18 9282855 A 10 3'
UTR
3 ANKRD13B cr17 27941253 T 19 3'
UTR
3 ANKRD13C cr1 70727638 A 12 3'
UTR
3 ANKS1B cr12 99138573 T 13 3'
UTR
3 ARCN1 cr11 118473732 T 8 3'
UTR
3 ARHGAP12 cr10 32096465 A 9 3'
UTR
3 ARHGAP42 cr11 100859972 T 10 3'
UTR
3 ARID1B cr6 157530011 A 10 3'
UTR
3 ARID5B cr10 63855130 A 10 3'
UTR
3 ARIH1 cr15 72877867 A 12 3'
UTR
3 ARL2BP cr16 57287376 T 12 3'
UTR
3 ARL8 A cr1 202102526 C 8 3'
UTR
3 ARMC8 cr3 137964255 T 9 3'
UTR
3 ARPP21 cr3 35726292 T 9 3'
UTR
3 ASB8 cr12 48541711 A 10 3'
UTR
3 ASPHD2 cr22 26840193 T 13 3'
UTR
3 ASPRV1 cr2 70187727 C 8 3'
UTR (continuación)
N° de muestras Posición Base de Longitud del Gen Cromosoma afectadas inicial homopolímero homopolímero afectada afectado 3 ATP11C crX 138809822 A 10 3'
UTR
3 ATP1B2 cr17 7560698 A 10 3'
UTR
3 ATP2A2 cr12 110786506 A 9 3'
UTR
3 ATP6V0D1 cr16 67472221 G 9 3'
UTR
3 ATP6V1G1 cr9 117360666 T 10 3'
UTR
3 ATRX crX 76762662 A 10 3'
UTR
3 AUTS2 cr7 70257601 T 15 3'
UTR
3 AXIN1 cr16 337827 G 9 3'
UTR
3 BAG1 cr9 33254142 T 20 3'
UTR
3 BCL11A cr2 60685168 T 10 3'
UTR
3 BCL11B cr14 99638830 A 9 3'
UTR
3 BCL11B cr14 99637754 T 10 3'
UTR
3 BEND4 cr4 42114856 A 10 3'
UTR
3 BFAR cr116 14762692 A 16 3'
UTR
3 BLOC1S2 cr10 102035182 A 10 3'
UTR
3 BMP7 cr20 55744815 T 10 3'
UTR
3 BMPR2 cr2 203426266 T 8 3'
UTR
3 BOD1L cr4 13571144 A 10 3'
UTR
3 BRAF cr7 140434294 A 9 3'
UTR
3 C11orf41 cr11 33690228 T 8 3'
UTR
3 C11orf58 cr11 16777810 T 24 3'
UTR
3 C12orf5 cr12 4463524 T 10 3'
UTR
3 C12orf66 cr12 64587315 A 10 3'
UTR
3 C12orf76 cr12 110479725 A 11 3'
UTR (continuación)
N° de muestras Base de Longitud del afectadas Gen Cromosoma Posición inicial homopolímero homopolímero afectada afectado 3 C14orf101 cr14 57116192 A 10 3'
UTR
3 C14orf126 cr14 31917025 A 10 3'
UTR
3 C14orf28 cr14 45376124 A 12 3'
UTR
3 C16orf45 cr16 15680717 C 9 3'
UTR
3 C16orf52 cr16 22092814 A 15 3'
UTR
3 C18orf25 cr18 43846502 A 9 3'
UTR
3 C18orf25 cr18 43844098 A 9 3'
UTR
3 C2orf18 cr2 27001810 T 13 3'
UTR
3 C2orf29 cr2 101886150 T 10 3'
UTR
3 C3orf63 cr3 56657045 A 9 3'
UTR
3 C3orf70 cr3 184795851 A 10 3'
UTR
3 C5orf41 cr5 172563230 A 11 3'
UTR
3 C6orf106 cr6 34558017 T 7 3'
UTR
3 C6orf62 cr6 24705738 A 10 3'
UTR
3 C7orf68 cr7 128097963 A 10 3'
UTR
3 C7orf69 cr7 47859241 A 11 3'
UTR
3 C8orf48 cr8 13425580 T 9 3'
UTR
3 C8orf85 cr8 117955238 A 22 3'
UTR
3 C9orf167 cr9 140176659 T 10 3'
UTR
3 C9orf66 cr9 214453 T 9 3'
UTR
3 CA12 cr15 63616886 T 19 3'
UTR
3 CABLES2 cr20 60965113 A 10 3'
UTR
3 CABP4 cr11 67226510 T 14 3'
UTR
3 CAMKK2 cr12 121678327 T 13 3'
UTR (continuación)
N° de muestras Base de Longitud del afectadas Gen Cromosoma Posición inicial homopolímero homopolímero afectada afectado 3 CAPRIN1 cr11 34121880 T 8 3'
UTR
3 CASP2 cr7 143003342 T 25 3'
UTR
3 CBFB cr16 67133322 T 14 3'
UTR
3 CBL cr11 119172610 A 10 3'
UTR
3 CBX5 cr12 54630019 T 10 3'
UTR
3 CBY1 cr22 39069285 T 9 3'
UTR
3 CCDC67 cr11 93170909 C 9 3'
UTR
3 CCDC8 cr19 46914112 T 12 3'
UTR
3 CCNL2 cr1 1327869 T 9 3'
UTR
3 CD59 cr11 33728097 A 21 3'
UTR
3 CD96 cr3 111368930 A 9 3'
UTR
3 CDH13 cr16 83828683 A 11 3'
UTR
3 CDH2 cr18 25531057 T 10 3'
UTR
3 CDH2 cr18 25531044 T 10 3'
UTR
3 CDH3 cr16 68732679 T 11 3'
UTR
3 CDKN1C cr11 2904845 T 10 3'
UTR
3 CELF1 cr11 47490243 A 9 3'
UTR
3 CELSR2 cr1 109816863 C 8 3'
UTR
3 CEP164 cr11 117283967 T 11 3'
UTR
3 CHD1 cr5 98191372 T 13 3'
UTR
3 CHP cr15 41572703 T 27 3'
UTR
3 CIB2 cr15 78397503 T 10 3'
UTR
3 CKAP4 cr12 106632374 A 10 3'
UTR
3 CLCN5 crX 49858223 A 9 3'
UTR (continuación)
N° de muestras Base de Longitud del afectadas Gen Cromosoma Posición inicial homopolímero homopolímero afectada afectado 3 CLDN14 cr21 37833059 T 10 3'
UTR
3 CLIC5 cr6 45868268 A 11 3'
UTR
3 CLMN cr14 95650666 A 8 3'
UTR
3 CMTM8 cr3 32411483 A 9 3'
UTR
3 CNNM1 cr10 101153279 A 9 3'
UTR
3 CNNM3 cr2 97499281 A 12 3'
UTR
3 CNST cr1 246830426 A 10 3'
UTR
3 COL8A2 cr1 36561052 A 10 3'
UTR
3 COQ10B cr2 198339541 T 17 3'
UTR
3 COQ2 cr4 84185003 A 8 3'
UTR
3 COX16 cr14 70793015 A 14 3'
UTR
3 CPD cr17 28792026 A 9 3'
UTR
3 CPEB2 cr4 15070967 A 9 3'
UTR
3 CPSF2 cr14 92629266 T 9 3'
UTR
3 CR1 cr1 207813472 T 9 3'
UTR
3 CREB1 cr2 208464929 G 8 3'
UTR
3 CREBBP cr16 3776240 G 10 3'
UTR
3 CRLF3 cr17 29111121 T 9 3'
UTR
3 CRTC1 cr19 18890340 A 9 3'
UTR
3 CSMD3 cr8 113236641 T 9 3'
UTR
3 CSNK1A1 cr5 148875717 T 9 3'
UTR
3 CSNK1G1 cr15 64461432 T 12 3'
UTR
3 CSNK1G1 cr15 64461259 A 9 3'
UTR
3 CTIF cr18 46388423 T 10 3'
UTR (continuación)
N° de muestras ición Base de Longitud del Gen Cromosoma Pos
afectadas inicial homopolímero homopolímero afectada afectado 3 CTNNA2 cr2 80875614 T 7 3'
UTR
3 CX3CR1 cr3 39305465 A 8 3'
UTR
3 CYP17A1 cr10 104590293 A 11 3'
UTR
3 CYP1B1 cr2 38296985 T 10 3'
UTR
3 DBT cr1 100653256 T 17 3'
UTR
3 DCAF7 cr17 61668717 A 9 3'
UTR
3 DCUN1D3 cr16 20870892 A 10 3'
UTR
3 DDHD1 cr14 53513329 T 10 3'
UTR
3 DDHD2 cr8 38119445 T 7 3'
UTR
3 DDX18 cr2 118589332 A 9 3'
UTR
3 DDX3X crX 41207099 T 10 3'
UTR
3 DDX6 cr11 118620973 A 10 3'
UTR
3 DFFA cr1 10521379 A 10 3'
UTR
3 DFFB cr1 3801133 T 11 3'
UTR
3 DGKG cr3 185866704 T 10 3'
UTR
3 DHTKD1 cr10 12163218 A 19 3'
UTR
3 DLG3 crX 69723685 C 8 3'
UTR
3 DLG3 crX 69723447 T 13 3'
UTR
3 DNAJC17 cr15 41060070 A 14 3'
UTR
3 DNAL1 cr14 74166011 T 15 3'
UTR
3 DNM3 cr1 172380678 A 15 3'
UTR
3 DPF3 cr14 73137761 A 8 3'
UTR
3 DPP4 cr2 162849045 T 9 3'
UTR
3 DPY19L4 cr8 95802923 T 10 3'
UTR (continuación)
N° de muestras ición Base de Longitud del Gen Cromosoma Pos
afectadas inicial homopolímero homopolímero afectada afectado 3 DPYSL2 cr8 26515559 T 10 3'
UTR
3 DSTYK cr1 205115701 T 16 3'
UTR
3 DSTYK cr1 205112278 T 14 3'
UTR
3 DUT cr15 48634591 A 10 3'
UTR
3 DYNC1LI2 cr16 66757487 T 16 3'
UTR
3 DYNC1LI2 cr16 66755235 T 11 3'
UTR
3 E2F2 cr1 23834007 A 15 3'
UTR
3 EAPP cr14 34985335 A 10 3'
UTR
3 ECE1 cr1 21546032 A 10 3'
UTR
3 EFR3B cr2 25378726 T 13 3'
UTR
3 EIF2A cr3 150302798 A 10 3'
UTR
3 ELAVL1 cr19 8023995 T 11 3'
UTR
3 ELOVL6 cr4 110971043 T 11 3'
UTR
3 ENGASE cr17 77083686 G 10 3'
UTR
3 EPHA3 cr3 89529769 A 11 3'
UTR
3 EPHA7 cr6 93951343 A 9 3'
UTR
3 EPHB1 cr3 134978889 A 10 3'
UTR
3 ERBB4 cr2 212243952 T 11 3'
UTR
3 ERGIC2 cr12 29493585 T 12 3'
UTR
3 ERLIN2 cr8 37614867 T 10 3'
UTR
3 ESRRB cr14 76967818 G 8 3'
UTR
3 ETNK1 cr12 22839785 T 28 3'
UTR
3 FADS1 cr1 1 61567668 T 14 3'
UTR
3 FAM101B cr17 292360 T 10 3'
UTR (continuación)
N° de muestras Posición Base de Longitud del Gen Cromosoma afectadas inicial homopolímero homopolímero afectada afectado 3 FAM105B cr5 14695377 T 9 3'
UTR
3 FAM117B cr2 203633341 T 10 3'
UTR
3 FAM126B cr2 201845397 G 7 3'
UTR
3 FAM160B1 cr10 116621715 A 9 3'
UTR
3 FAM19A4 cr3 68781684 A 10 3'
UTR
3 FAM20B cr1 179044326 A 13 3'
UTR
3 FBLIM1 cr1 16112130 A 10 3'
UTR
3 FBN2 cr5 127594650 A 8 3'
UTR
3 FBN2 cr5 127594063 A 10 3'
UTR
3 FBXO27 cr19 39515468 T 11 3'
UTR
3 FBXW2 cr9 123524089 A 12 3'
UTR
3 FECH cr18 55215482 A 15 3'
UTR
3 FERMT1 cr20 6055696 T 15 3'
UTR
3 FGD1 crX 54471920 A 13 3'
UTR
3 FGD4 cr12 32798227 T 12 3'
UTR
3 FGD6 cr12 95470673 A 10 3'
UTR
3 FGFR1OP2 cr12 27118562 T 10 3'
UTR
3 FLCN cr17 17116100 A 10 3'
UTR
3 FLCN cr17 17115789 A 26 3'
UTR
3 FMNL3 cr12 50038887 A 25 3'
UTR
3 FMNL3 cr12 50033467 A 10 3'
UTR
3 FNDC3B cr3 172117183 A 10 3'
UTR
3 FOXJ2 cr12 8208083 A 13 3'
UTR
3 FOXK1 cr7 4809074 T 13 3'
UTR (continuación)
N° de muestras ición Base de Longitud del Gen Cromosoma Pos
afectadas inicial homopolímero homopolímero afectada afectado 3 FOXO1 cr13 41132503 A 9 3'
UTR
3 FOXP1 cr3 71007462 T 10 3'
UTR
3 FOXP1 cr3 71005883 T 41 3'
UTR
3 FTSJD1 cr16 71317151 A 10 3'
UTR
3 FUT8 cr14 66209673 T 13 3'
UTR
3 FZD7 cr2 202902385 A 11 3'
UTR
3 GAPVD1 cr9 128127210 T 10 3'
UTR
3 GATAD2B cr1 153781275 A 20 3'
UTR
3 GCNT1 cr9 79119829 T 11 3'
UTR
3 GDAP2 cr1 118408218 A 10 3'
UTR
3 GFPT1 cr2 69549530 A 9 3'
UTR
3 GIPC2 cr1 78601920 T 9 3'
UTR
3 GIT1 cr17 27901146 A 12 3'
UTR
3 GLCCI1 cr7 8127832 T 11 3'
UTR
3 GLT25D2 cr1 183905658 A 10 3'
UTR
3 GNA13 cr17 63005677 A 10 3'
UTR
3 GNPNAT1 cr14 53242966 A 11 3'
UTR
3 GOLGA2 cr9 131018793 T 14 3'
UTR
3 GOLPH3L cr1 150619971 A 15 3'
UTR
3 GPM6 A cr4 176555451 T 10 3'
UTR
3 GPR155 cr2 175299037 T 13 3'
UTR
3 GPR180 cr13 95279582 A 8 3'
UTR
3 GPR37L1 cr1 202098133 T 21 3'
UTR
3 GPRC5A cr12 13065679 T 13 3'
UTR (continuación)
N° de muestras ición Base de Longitud del Gen Cromosoma Pos
afectadas inicial homopolímero homopolímero afectada afectado 3 GPX8 cr5 54460112 T 10 3'
UTR
3 GRAMD3 cr5 125829168 T 10 3'
UTR
3 GRB2 cr17 73314260 T 10 3'
UTR
3 GRID1 cr10 87359476 T 11 3'
UTR
3 GSK3B cr3 119544323 A 9 3'
UTR
3 GTF2A2 cr15 59930716 T 7 3'
UTR
3 GTF2H5 cr6 158615020 A 21 3'
UTR
3 GTF2H5 cr6 158614314 A 10 3'
UTR
3 H2AFX cr11 118964586 A 10 3'
UTR
3 H2AFY cr5 134670602 T 10 3'
UTR
3 HAPLN1 cr5 82937251 A 10 3'
UTR
3 HCN1 cr5 45260992 T 9 3'
UTR
3 HELZ cr17 65067696 T 8 3'
UTR
3 HEPHL1 cr11 93846820 T 9 3'
UTR
3 HEY2 cr6 126081692 T 10 3'
UTR
3 HIAT1 cr1 100548278 A 11 3'
UTR
3 HIPK1 cr1 114518139 T 9 3'
UTR
3 HMGN2 cr1 26801737 T 15 3'
UTR
3 HNRNPA3 cr2 178087793 A 11 3'
UTR
3 HNRNPK cr9 86584095 C 9 3'
UTR
3 HNRNPK cr9 86583800 A 10 3'
UTR
3 HOMEZ cr14 23744114 A 14 3'
UTR
3 HOOK1 cr1 60338642 A 8 3'
UTR
3 HOXB3 cr17 46627000 A 9 3'
UTR (continuación)
N° de muestras Base de Longitud del afectadas Gen Cromosoma Posición inicial homopolímero homopolímero afectada afectado 3 HOXC9 cr12 54396883 A 12 3'
UTR
3 HP1BP3 cr1 21070971 A 10 3'
UTR
3 HRH1 cr3 11303522 A 11 3'
UTR
3 HS2ST1 cr1 87575244 T 10 3'
UTR
3 HS3ST5 cr6 114376959 A 10 3'
UTR
3 HUNK cr21 33373431 A 9 3'
UTR
3 HUWE1 crX 53559710 T 11 3'
UTR
3 HUWE1 crX 53559518 A 12 3'
UTR
3 IFI6 cr1 27992800 A 23 3'
UTR
3 IFT81 cr12 110656332 T 9 3'
UTR
3 IGF2BP3 cr7 23350733 T 12 3'
UTR
3 IGF2BP3 cr7 23350408 T 10 3'
UTR
3 IGFBP5 cr2 217537045 T 14 3'
UTR
3 IKZF2 cr2 213865040 A 8 3'
UTR
3 IL7R cr5 35876844 A 10 3'
UTR
3 IMPG2 cr3 100945663 A 9 3'
UTR
3 INSC cr11 15267955 T 10 3'
UTR
3 INSR cr19 7112347 A 9 3'
UTR
3 INTS6 cr13 51937816 T 10 3'
UTR
3 IRS1 cr2 227600758 T 11 3'
UTR
3 IRS1 cr2 227596558 A 10 3'
UTR
3 ISL1 cr5 50690278 A 11 3'
UTR
3 ITGA4 cr2 182400811 T 8 3'
UTR
3 ITPRIPL1 cr2 96994050 A 10 3'
UTR (continuación)
N° de muestras Base de Longitud del afectadas Gen Cromosoma Posición inicial homopolímero homopolímero afectada afectado 3 JAKMIP1 cr4 6055625 A 11 3'
UTR
3 JAM3 cr11 134020535 T 12 3'
UTR
3 JARID2 cr6 15520768 T 9 3'
UTR
3 KCTD1 cr18 24035448 T 12 3'
UTR
3 KIAA0182 cr16 85706942 A 10 3'
UTR
3 KIAA1456 cr8 12883488 A 9 3'
UTR
3 KIAA1671 cr22 25588892 T 9 3'
UTR
3 KIF1B cr1 10437995 A 13 3'
UTR
3 KLF12 cr13 74261703 T 11 3'
UTR
3 KLHL20 cr1 173754885 A 12 3'
UTR
3 KNDC1 cr10 135039706 T 8 3'
UTR
3 KPNA6 cr1 32639763 C 9 3'
UTR
3 KPNB1 cr17 45760525 T 12 3'
UTR
3 LARP4B cr10 856761 A 9 3'
UTR
3 LCA5 cr6 80194766 A 9 3'
UTR
3 LEF1 cr4 108969352 A 9 3'
UTR
3 LHFP cr13 39917881 T 8 3'
UTR
3 LIAS cr4 39478848 A 11 3'
UTR
3 LIMS1 cr2 109300693 A 10 3'
UTR
3 LIN7C cr11 27517538 A 10 3'
UTR
3 LMAN1 cr18 56995800 T 10 3'
UTR
3 LMAN1 cr18 56995128 A 10 3'
UTR
3 LMO4 cr1 87812341 A 10 3'
UTR
3 LMO4 cr1 87811634 A 9 3'
UTR (continuación)
N° de muestras Base de Longitud del afectadas Gen Cromosoma Posición inicial homopolímero homopolímero afectada afectado 3 LMTK2 cr7 97837420 A 11 3'
UTR
3 LPL cr8 19823634 A 11 3'
UTR
3 LRCH2 crX 114346112 T 10 3'
UTR
3 LRIF1 cr1 111489900 A 13 3'
UTR
3 LRP12 cr8 105502451 T 10 3'
UTR
3 LRRC14 cr8 145747418 T 9 3'
UTR
3 LSM1 cr8 38021012 A 10 3'
UTR
3 LUZP2 cr1 1 25102964 A 12 3'
UTR
3 LYN cr8 56923131 A 15 3'
UTR
3 LYRM7 cr5 130537006 A 12 3'
UTR
3 MAFB cr20 39314997 G 8 3'
UTR
3 MAFG cr17 79879435 T 12 3'
UTR
3 MAGI3 cr1 114227223 A 10 3'
UTR
3 MAP1B cr5 71505347 A 11 3'
UTR
3 MAP1B cr5 71502852 A 10 3'
UTR
3 MAP4 cr3 48016254 A 13 3'
UTR
3 MARK1 cr1 220837099 T 10 3'
UTR
3 MCM10 cr10 13252313 A 16 3'
UTR
3 MED1 cr17 37560884 A 9 3'
UTR
3 MEF2C cr5 88017643 A 7 3'
UTR
3 MEF2D cr1 156436092 A 9 3'
UTR
3 METTL8 cr2 172174950 T 8 3'
UTR
3 MFN2 cr1 12073251 A 11 3'
UTR
3 MGAT4A cr2 99236361 T 10 3'
UTR (continuación)
N° de muestras ición Base de Longitud del Gen Cromosoma Pos
afectadas inicial homopolímero homopolímero afectada afectado 3 MIER3 cr5 56216276 A 9 3'
UTR
3 MKLN1 cr7 131176677 A 9 3'
UTR
3 MKRN3 cr15 23812682 T 8 3'
UTR
3 MLEC cr12 121138251 T 11 3'
UTR
3 MMP2 cr16 55539895 T 10 3'
UTR
3 MOBKL1A cr4 71851985 T 9 3'
UTR
3 MPP7 cr10 28341712 T 9 3'
UTR
3 MRPL2 cr6 43021910 A 10 3'
UTR
3 MRPL44 cr2 224831951 T 11 3'
UTR
3 MRPS10 cr6 42175651 A 9 3'
UTR
3 MTAP cr9 21862262 A 9 3'
UTR
3 MTHFR cr1 11846483 T 10 3'
UTR
3 MTMR3 cr22 30422037 T 14 3'
UTR
3 MTMR6 cr13 25821349 A 10 3'
UTR
3 MXD1 cr2 70166270 T 6 3'
UTR
3 MYBL1 cr8 67476407 A 10 3'
UTR
3 MYCL1 cr1 40361307 A 10 3'
UTR
3 MYCN cr2 16086264 T 10 3'
UTR
3 MYEF2 cr15 48434757 A 6 3'
UTR
3 MYLK cr3 123332875 T 16 3'
UTR
3 NAA38 cr7 117832209 A 9 3'
UTR
3 NAP1L1 cr12 76440268 A 11 3'
UTR
3 NAPEPLD cr7 102742595 A 10 3'
UTR
3 NAPG cr18 10551001 T 11 3'
UTR (continuación)
N° de muestras Base de Longitud del afectadas Gen Cromosoma Posición inicial homopolímero homopolímero afectada afectado 3 NARG2 cr15 60715037 A 14 3'
UTR
3 NCCRP1 cr19 39691952 T 16 3'
UTR
3 NCS1 cr9 132996076 T 12 3'
UTR
3 NDFIP1 cr5 141533930 T 10 3'
UTR
3 NEBL cr10 21073429 A 9 3'
UTR
3 NEBL cr10 21072104 T 9 3'
UTR
3 NEURL1B cr5 172118507 A 7 3'
UTR
3 NFAM1 cr22 42776800 A 11 3'
UTR
3 NFAT5 cr16 69731363 A 10 3'
UTR
3 NFIB cr9 14087579 T 9 3'
UTR
3 NIPAL1 cr4 48038330 T 7 3'
UTR
3 NIPAL3 cr1 24798068 A 20 3'
UTR
3 NKAIN4 cr20 61872616 T 12 3'
UTR
3 NLGN4X crX 5808268 T 11 3'
UTR
3 NPLOC4 cr17 79525610 A 9 3'
UTR
3 NR3C1 cr5 142657694 T 9 3'
UTR
3 NSL1 cr1 212911280 A 9 3'
UTR
3 NT5C1B cr2 18744332 T 14 3'
UTR
3 NUCKS1 cr1 205687213 A 19 3'
UTR
3 NUFIP2 cr17 27585085 T 12 3'
UTR
3 ODZ4 cr11 78367062 T 9 3'
UTR
3 OGFOD1 crl6 56510316 A 11 3'
UTR
3 OLFM3 cr1 102269548 T 11 3'
UTR
3 OMA1 cr1 58946539 T 10 3'
UTR (continuación)
N° de muestras ición Base de Longitud del Gen Cromosoma Pos
afectadas inicial homopolímero homopolímero afectada afectado 3 ONECUT2 cr18 55153928 T 7 3'
UTR
3 OPA3 cr19 46052745 T 12 3'
UTR
3 OSBPL3 cr7 24837354 A 10 3'
UTR
3 OTUD4 cr4 146058513 T 8 3'
UTR
3 OTUD4 cr4 146057615 G 13 3'
UTR
3 OTUD7B cr1 149914740 A 10 3'
UTR
3 OXR1 cr8 107764239 A 10 3'
UTR
3 OXR1 cr8 107764095 A 10 3'
UTR
3 PAICS cr4 57327144 A 10 3'
UTR
3 PAK1IP1 cr6 10709747 T 12 3'
UTR
3 PALM2 cr9 112706843 A 11 3'
UTR
3 PAPD5 cr16 50264179 T 10 3'
UTR
3 PAPD5 cr16 50263692 T 10 3'
UTR
3 PAPD5 cr16 50263454 A 8 3'
UTR
3 PBRM1 cr3 52579628 A 10 3'
UTR
3 PCDH7 cr4 31146675 T 12 3'
UTR
3 PCDH7 cr4 31144759 A 9 3'
UTR
3 PCLO cr7 82451412 T 12 3'
UTR
3 PCLO cr7 82383474 T 9 3'
UTR
3 PCNP cr3 101312474 A 10 3'
UTR
3 PCNP cr3 101312179 T 10 3'
UTR
3 PCYOX1L cr5 148748459 T 8 3'
UTR
3 PDCL cr9 125581889 A 10 3'
UTR
3 PDCL cr9 125581558 A 13 3'
UTR (continuación)
N° de muestras ición Base de Longitud del Gen Cromosoma Pos
afectadas inicial homopolímero homopolímero afectada afectado 3 PDGFA cr7 537622 A 11 3'
UTR
3 PDGFA cr7 536908 T 11 3'
UTR
3 PEX6 cr6 42931666 C 7 3'
UTR
3 PFN1 cr17 4848972 A 10 3'
UTR
3 PGPEP1 cr19 18477965 A 20 3'
UTR
3 PHTF2 cr7 77586547 T 11 3'
UTR
3 PIGM cr1 159998080 T 11 3'
UTR
3 PIGW cr17 34894609 T 11 3'
UTR
3 PIK3R1 cr5 67595054 A 10 3'
UTR
3 PIP5K1A cr1 151220867 T 11 3'
UTR
3 PKN2 cr1 89301773 T 11 3'
UTR
3 PLA2G12A cr4 110633665 T 10 3'
UTR
3 PLCL1 cr2 199013907 T 9 3'
UTR
3 PLCXD3 cr5 41307606 A 9 3'
UTR
3 PLK2 cr5 57749858 A 9 3'
UTR
3 PLXDC2 cr10 20569078 A 10 3'
UTR
3 POLH cr6 43584323 A 14 3'
UTR
3 POU2F2 cr19 42595122 T 14 3'
UTR
3 PPAP2B cr1 56962088 T 10 3'
UTR
3 PPAT cr4 57261372 A 12 3'
UTR
3 PPM1E cr17 57060351 A 10 3'
UTR
3 PPP1R3A cr7 113517422 A 9 3'
UTR
3 PPP3CA cr4 101946069 T 10 3'
UTR
3 PPPDE1 cr1 244869241 A 12 3'
UTR (continuación)
N° de muestras Posición Base de Longitud del Gen Cromosoma afectadas inicial homopolímero homopolímero afectada afectado 3 PRELP cr1 203457654 A 10 3'
UTR
3 PRKCB cr16 24226979 A 9 3'
UTR
3 PRKCE cr2 46414854 A 12 3'
UTR
3 PRKD3 cr2 37477691 A 9 3'
UTR
3 PRPF40A cr2 153512705 T 9 3'
UTR
3 PRRC2B cr9 134374365 T 9 3'
UTR
3 PRRG1 crX 37313537 T 10 3'
UTR
3 PTCD3 cr2 86365336 T 9 3'
UTR
3 PTCH1 cr9 98208010 A 10 3'
UTR
3 PTGS2 cr1 186642025 T 9 3'
UTR
3 PTP4A1 cr6 64292097 T 10 3'
UTR
3 PTP4A2 cr1 32374021 A 10 3'
UTR
3 PTPN22 cr1 114357118 T 10 3'
UTR
3 PTPRF cr1 44088117 T 11 3'
UTR
3 PUM1 cr1 31405680 T 10 3'
UTR
3 QKI cr6 163985925 T 8 3'
UTR
3 QRICH1 cr3 49067797 A 11 3'
UTR
3 RAB18 cr10 27827928 A 8 3'
UTR
3 RAB36 cr22 23505793 C 10 3'
UTR
3 RAB3GAP2 cr1 220324482 A 9 3'
UTR
3 RAB3IP cr12 70214638 A 17 3'
UTR
3 RAB3IP cr12 70211224 A 11 3'
UTR
3 RAB7L1 cr1 205738564 T 10 3'
UTR
3 RAB8 A cr19 16244263 T 13 3'
UTR (continuación)
N° de muestras ición Base de Longitud del Gen Cromosoma Pos
afectadas inicial homopolímero homopolímero afectada afectado 3 RAB8 B cr15 63557574 T 13 3'
UTR
3 RAD23B cr9 110092642 T 10 3'
UTR
3 RAP2B cr3 152881852 T 12 3'
UTR
3 RASGRP4 cr19 38900377 A 11 3'
UTR
3 RBL1 cr20 35632028 A 13 3'
UTR
3 RBM12B cr8 94745547 A 10 3'
UTR
3 RBM12B cr8 94745279 A 10 3'
UTR
3 RBM38 cr20 55983973 G 8 3'
UTR
3 RC3H1 cr1 173905652 A 25 3'
UTR
3 RCC2 cr1 17734207 A 10 3'
UTR
3 RCN1 cr1 1 32126284 T 10 3'
UTR
3 RFT1 cr3 53125729 C 8 3'
UTR
3 RGS20 cr8 54871209 A 11 3'
UTR
3 RHOB cr2 20648933 T 12 3'
UTR
3 RHOBTB3 cr5 95129188 A 12 3'
UTR
3 RIF1 cr2 152331769 T 10 3'
UTR
3 RIMBP2 cr12 130882589 A 11 3'
UTR
3 RIMS1 cr6 73111857 A 12 3'
UTR
3 RIMS2 cr8 105264755 A 14 3'
UTR
3 RNF152 cr18 59482618 A 10 3'
UTR
3 RNF2 cr1 185069838 T 9 3'
UTR
3 RNGTT cr6 89320667 T 10 3'
UTR
3 RORA cr15 60785852 T 11 3'
UTR
3 RPE65 cr1 68895273 T 10 3'
UTR (continuación)
N° de muestras Base de Longitud del afectadas Gen Cromosoma Posición inicial homopolímero homopolímero afectada afectado 3 RPRD2 cr1 150445907 T 10 3'
UTR
3 RRP15 cr1 218506210 A 17 3'
UTR
3 RSBN1 cr1 114307995 A 8 3'
UTR
3 RSBN1L cr7 77408705 A 9 3'
UTR
3 RSL1D1 cr16 11930997 T 11 3'
UTR
3 S100A4 cr1 153516162 A 10 3'
UTR
3 SALL3 cr18 76757543 A 10 3'
UTR
3 SAMD4A cr14 55257700 A 10 3'
UTR
3 SARM1 cr17 26726913 T 12 3'
UTR
3 SASH1 cr6 148872287 T 10 3'
UTR
3 SASH1 cr6 148870950 T 12 3'
UTR
3 SATB1 cr3 18390227 T 12 3'
UTR
3 SBK1 cr16 28334644 A 13 3'
UTR
3 SCAI cr9 127707832 A 13 3'
UTR
3 SCAMP1 cr5 77772627 A 10 3'
UTR
3 SCN1A cr2 166846936 T 10 3'
UTR
3 SCO1 cr17 10583834 T 8 3'
UTR
3 SDR16C5 cr8 57212734 T 12 3'
UTR
3 SEH1L cr18 12986726 T 14 3'
UTR
3 SENP6 cr6 76425956 A 10 3'
UTR
3 SEPT11 cr4 77957803 T 10 3'
UTR
3 SETD1B cr12 122269303 T 9 3'
UTR
3 SFXN1 cr5 174954579 T 10 3'
UTR
3 SGK494 cr17 26937070 A 16 3'
UTR (continuación)
N° de muestras ición Base de Longitud del Gen Cromosoma Pos
afectadas inicial homopolímero homopolímero afectada afectado 3 SGOL2 cr2 201448283 T 10 3'
UTR
3 SH2B3 cr12 111887735 T 14 3'
UTR
3 SH3KBP1 crX 19553810 T 12 3'
UTR
3 SHANK2 cr11 70315627 T 14 3'
UTR
3 SHISA2 cr13 26619921 A 11 3'
UTR
3 SHOC2 cr10 112773341 T 10 3'
UTR
3 SIK1 cr21 44835578 A 10 3'
UTR
3 SIPA1L3 cr19 38698868 T 10 3'
UTR
3 SIPA1L3 cr19 38698671 T 17 3'
UTR
3 SIX4 cr14 61178202 A 10 3'
UTR
3 SKI cr1 2240043 T 10 3'
UTR
3 SLC12A6 cr15 34523172 A 10 3'
UTR
3 SLC14A1 cr18 43332169 A 8 3'
UTR
3 SLC15A2 cr3 121660272 T 11 3'
UTR
3 SLC16A1 cr1 113455427 A 13 3'
UTR
3 SLC16A10 cr6 111544547 T 9 3'
UTR
3 SLC16A4 cr1 110906247 A 19 3'
UTR
3 SLC17A6 cr11 22400904 A 10 3'
UTR
3 SLC22A5 cr5 131730903 T 17 3'
UTR
3 SLC25A36 cr3 140696772 A 11 3'
UTR
3 SLC31A1 cr9 116026594 A 14 3'
UTR
3 SLC35E1 cr19 16663158 T 11 3'
UTR
3 SLC35E3 cr12 69158739 A 12 3'
UTR
3 SLC38A1 cr12 46579255 T 9 3'
UTR (continuación)
N° de muestras Base de Longitud del afectadas Gen Cromosoma Posición inicial homopolímero homopolímero afectada afectado 3 SLC38A1 cr12 46576941 A 10 3'
UTR
3 SLC39A9 cr14 69928356 T 10 3'
UTR
3 SLC4A10 cr2 162840706 T 10 3'
UTR
3 SLC6A15 cr12 85253350 T 10 3'
UTR
3 SLC6 A6 cr3 14530588 A 10 3'
UTR
3 SLC7A11 cr4 139090880 A 10 3'
UTR
3 SLC7A14 cr3 170182342 T 10 3'
UTR
3 SLC7A6 cr16 68335452 T 10 3'
UTR
3 SLC9A6 crX 135128103 T 11 3'
UTR
3 SMAD3 cr15 67485102 A 9 3'
UTR
3 SMAD4 cr18 48605007 T 10 3'
UTR
3 SMPDL3A cr6 123130673 T 11 3'
UTR
3 SMURF2 cr17 62541185 T 13 3'
UTR
3 SNAP23 cr15 42824292 T 14 3'
UTR
3 SNAPC3 cr9 15461137 A 13 3'
UTR
3 SNX30 cr9 115632450 T 10 3'
UTR
3 SOCS3 cr17 76353185 C 9 3'
UTR
3 SOX1 cr13 112725171 C 9 3'
UTR
3 SOX1 cr13 112724720 T 10 3'
UTR
3 SOX11 cr2 5834751 T 9 3'
UTR
3 SPATS2 cr12 49921053 T 10 3'
UTR
3 SPATS2L cr2 201343614 T 12 3'
UTR
3 SPCS3 cr4 177250844 T 10 3'
UTR
3 SPTBN1 cr2 54898095 T 10 3'
UTR (continuación)
N° de muestras Base de Longitud del afectadas Gen Cromosoma Posición inicial homopolímero homopolímero afectada afectado 3 SRRM2 cr16 2821013 T 10 3'
UTR
3 SRRM4 cr12 119599690 A 10 3'
UTR
3 SRRM4 cr12 119596858 T 9 3'
UTR
3 SSBP3 cr1 54692340 T 15 3'
UTR
3 SSR3 cr3 156259169 T 10 3'
UTR
3 ST7L cr1 113066620 A 11 3'
UTR
3 STC2 cr5 172744019 T 12 3'
UTR
3 STK17B cr2 197000501 A 23 3'
UTR
3 STK4 cr20 43708275 A 10 3'
UTR
3 STRN3 cr14 31364300 A 11 3'
UTR
3 SUSD5 cr3 33193040 T 10 3'
UTR
3 SYNJ2 cr6 158519568 A 14 3'
UTR
3 SYNRG cr17 35879008 A 10 3'
UTR
3 SYT13 cr1 1 45264120 A 9 3'
UTR
3 TACC1 cr8 38706479 T 15 3'
UTR
3 TAF12 cr1 28929961 A 11 3'
UTR
3 TBC1D8B crX 106118337 A 13 3'
UTR
3 TBL1X crX 9684635 A 9 3'
UTR
3 TBX18 cr6 85445736 A 11 3'
UTR
3 TFAP2B cr6 50814917 T 9 3'
UTR
3 TFCP2L1 cr2 121975868 T 11 3'
UTR
3 TGOLN2 cr2 85549225 T 9 3'
UTR
3 THAP2 cr12 72073229 T 10 3'
UTR
3 THSD7A cr7 11411520 T 10 3'
UTR (continuación)
N° de muestras Posición Base de Longitud del Gen Cromosoma afectadas inicial homopolímero homopolímero afectada afectado 3 TIA1 cr2 70439448 T 11 3'
UTR
3 TIAL1 cr10 121335156 T 9 3'
UTR
3 TIGD5 cr8 144682449 T 9 3'
UTR
3 TLCD2 cr17 1609267 T 12 3'
UTR
3 TLCD2 cr17 1608003 T 11 3'
UTR
3 TLL1 cr4 167022770 T 8 3'
UTR
3 TLL2 cr10 98124863 A 11 3'
UTR
3 TMBIM4 cr12 66531178 T 16 3'
UTR
3 TMEM169 cr2 216966376 T 10 3'
UTR
3 TMEM192 cr4 165997961 T 10 3'
UTR
3 TMEM194B cr2 191372383 A 10 3'
UTR
3 TMEM86 A cr11 18725436 T 9 3'
UTR
3 TMSL3 cr4 91759710 A 10 3'
UTR
3 TMTC1 cr12 29656466 A 8 3'
UTR
3 TNFRSF11B cr8 119936330 T 12 3'
UTR
3 TNFRSF9 cr1 7980708 A 15 3'
UTR
3 TNRC18 cr7 5346838 T 9 3'
UTR
3 TNRC6 C cr17 76104332 C 9 3'
UTR
3 TNRC6 C cr17 76101194 T 16 3'
UTR
3 TOMM20 cr1 235274461 A 8 3'
UTR
3 TOX4 cr14 21965677 T 12 3'
UTR
3 TPM3 cr1 154134840 A 21 3'
UTR
3 TPM4 cr19 16212343 T 9 3'
UTR
3 TRAK2 cr2 202244537 T 11 3'
UTR (continuación)
N° de muestras Base de Longitud del afectadas Gen Cromosoma Posición inicial homopolímero homopolímero afectada afectado 3 TRIM33 cr1 114940229 T 13 3'
UTR
3 TRIM68 cr11 4620726 A 9 3'
UTR
3 TRIM9 cr14 51442832 T 10 3'
UTR
3 TRIOBP cr22 38171794 A 9 3'
UTR
3 TRPC1 cr3 142525356 T 9 3'
UTR
3 TRPS1 cr8 116424772 T 10 3'
UTR
3 TSGA14 cr7 130038411 A 9 3'
UTR
3 TSHZ1 cr18 73001306 A 10 3'
UTR
3 TSHZ3 cr19 31766335 T 13 3'
UTR
3 TSPAN31 cr12 58141530 T 13 3'
UTR
3 TTC14 cr3 180327407 T 8 3'
UTR
3 TTLL2 cr6 167755564 T 9 3'
UTR
3 TXLNA cr1 32663414 T 11 3'
UTR
3 TXNDC9 cr2 99936109 A 9 3'
UTR
3 U2AF1 cr21 44513110 T 11 3'
UTR
3 UBAP2L cr1 154242977 T 8 3'
UTR
3 UBE2G2 cr21 46191155 A 12 3'
UTR
3 UBE2O cr17 74385876 T 9 3'
UTR
3 UBE2W cr8 74704584 T 10 3'
UTR
3 UBE3C cr7 157060934 T 10 3'
UTR
3 UGDH cr4 39500884 A 10 3'
UTR
3 UGT2B7 cr4 69978554 A 13 3'
UTR
3 UNC5D cr8 35649346 T 11 3'
UTR
3 UQCRB cr8 97242317 T 10 3'
UTR (continuación)
N° de muestras Base de Longitud del afectadas Gen Cromosoma Posición inicial homopolímero homopolímero afectada afectado 3 UQCRC1 cr3 48636506 G 9 3'
UTR
3 UQCRHL cr1 16133663 T 15 3'
UTR
3 USP11 crX 47107350 A 16 3'
UTR
3 USP13 cr3 179501981 A 11 3'
UTR
3 USP14 crl8 213518 A 12 3'
UTR
3 USP43 crl7 9632696 T 12 3'
UTR
3 USP46 cr4 53461199 T 10 3'
UTR
3 USP53 cr4 120216195 T 10 3'
UTR
3 USP7 crl6 8986976 T 9 3'
UTR
3 USP8 crl5 50791892 A 11 3'
UTR
3 VCPIP1 cr8 67545984 A 13 3'
UTR
3 VEZF1 crl7 56051105 T 14 3'
UTR
3 VGLL3 cr3 86995866 A 11 3'
UTR
3 VGLL3 cr3 86990599 T 11 3'
UTR
3 VPS33A cr12 122716608 A 11 3'
UTR
3 VTI1A cr10 114578212 T 9 3'
UTR
3 VTI1A cr10 114575744 T 10 3'
UTR
3 WDR1 cr4 10076371 A 9 3'
UTR
3 WDR3 cr1 118502087 T 11 3'
UTR
3 WHSC1 cr4 1945453 A 9 3'
UTR
3 WNK3 crX 54222891 A 14 3'
UTR
3 WWC3 crX 10111121 T 10 3'
UTR
3 XKR6 cr8 10755102 T 11 3'
UTR
3 XPO4 crl3 21353626 A 9 3'
UTR (continuación)
N° de muestras Posición Base de Longitud del Gen Cromosoma afectadas inicial homopolímero homopolímero afectada afectado 3 YTHDC1 cr4 69179759 A 10 3'
UTR
3 YY1 crl4 100744470 A 12 3'
UTR
3 ZC3H13 crl3 46537561 T 13 3'
UTR
3 ZC3HAV1 cr7 138745419 A 20 3'
UTR
3 ZC3HAV1L cr7 138710878 A 11 3'
UTR
3 ZC3HAV1L cr7 138710715 A 10 3'
UTR
3 ZFAND3 cr6 38122149 G 8 3'
UTR
3 ZFAND5 cr9 74968284 A 10 3'
UTR
3 ZFHX3 crl6 72820483 A 17 3'
UTR
3 ZFHX3 crl6 72816794 T 10 3'
UTR
3 ZHX3 cr20 39808271 T 16 3'
UTR
3 ZNF264 crl9 57731930 T 9 3'
UTR
3 ZNF362 cr1 33764950 T 12 3'
UTR
3 ZNF440 crl9 11944944 T 11 3'
UTR
3 ZNF503 cr10 77157784 T 11 3'
UTR
3 ZNF528 crl9 52920874 T 12 3'
UTR
3 ZNF557 crl9 7086241 A 13 3'
UTR
3 ZNF618 cr9 116812463 A 9 3'
UTR
3 ZNF629 crl6 30792783 T 10 3'
UTR
3 ZNF681 crl9 23925293 A 13 3'
UTR
3 ZNF770 crl5 35272976 A 9 3'
UTR
3 ZSCAN30 crl8 32831761 T 12 3'
UTR
3 ZSWIM2 cr2 187692280 T 9 3'
UTR
3 ZSWIM4 crl9 13942940 T 11 3'
UTR (continuación)
Figure imgf000172_0001
Asimismo, otra lista particular de marcadores exónicos previstos son los que se identificaron en los primeros 11 tumores sólidos deficientes en MMR. Esta lista se proporciona en la tabla 7, los indeles recurrentes comunes se definen como los que aparecen en al menos 3 de 11 muestras.
Figure imgf000173_0001
Figure imgf000174_0001
Figure imgf000175_0001
Figure imgf000176_0001
En la tabla 8 se enumera una lista adicional prevista particular de la que se pueden seleccionar marcadores. Según formas de realización específicas, las, al menos dos, regiones de microsatélites UTR o al menos tres regiones de microsatélites (tal como se han descrito anteriormente) son regiones seleccionadas de las enumeradas en la tabla 8. Sin embargo, según formas de realización alternativas muy específicas, los marcadores se seleccionan de la tabla 1 y/o 2 y no contienen un marcador enumerado en la tabla 8. Los marcadores ilustrativos en este caso incluyen, pero sin limitación, LLRC8 D, SAMD12, SEPT7, CASK, FAM20B, HELZ, KCNK1, LHX9, LYRM1, TMEM26, TRIP11, ZBTB7A, ZKSCAN1, ZNF217, WIPF2, COL5A2, ZBTB33, AGPAT3, BMPR1B, CNOT7, EDEM3, G3BP2, HRNR, KLF3, TNPO1, TRAK2, ZNF169, BDNF, OIT3, CNOT2, LTN1, MBD4, SLC22A9, ATR, CDH26, KIAA2018, RNF145, TGFBR2, y TMBIM4.
Tabla 8. Indeles recurrentes en regiones 5' y 3' UTR y en exones para muestras tumorales deficientes en MMR.
Gen Cromosoma Posición inicial Base de homopolímero Longitud del
afectada homopolímero afectado Región ARHGEF11 cr1 157014811 A 12 5'UTR LRMP cr12 25205380 A 11 5' UTR GABRG2 cr5 161494990 A 12 5' UTR MBNL1 cr3 152017897 T 11 5' UTR ARHGEF9 crX 62974288 T 12 5' UTR CCT6B cr17 33288433 A 11 5' UTR EPHB6 cr7 142560576 A 13 5' UTR GRIA2 cr4 158142151 A 9 5' UTR LMOD3 cr3 69171664 T 13 5' UTR NDE1 cr16 15737427 T 11 5' UTR OMD cr9 95179844 T 11 5' UTR TMEM177 cr2 120437061 A 11 5' UTR TRPS1 cr8 116681041 A 14 5' UTR ZNF781 cr19 38161161 T 11 5' UTR ZXDA crX 57936946 A 9 5' UTR AMD1 cr6 111196178 A 11 5' UTR ASPH cr8 62602295 A 11 5' UTR BMP5 cr6 55739711 A 14 5' UTR CBLN2 cr18 70211389 A 14 5' UTR CEPT1 cr1 111690319 A 9 5' UTR EBF1 cr5 158526596 T 11 5' UTR ESCO1 cr18 19164371 A 11 5' UTR KDM2B cr12 122018157 G 10 5' UTR LRRC70 cr5 61874619 A 18 5' UTR MCF2 crX 138724841 A 15 5' UTR MEIS1 cr2 66662690 T 13 5' UTR MEIS2 cr15 37391752 T 12 5' UTR SEMA6A cr5 115910134 A 11 5' UTR SETBP1 cr18 42260910 G 8 5' UTR ST7L cr1 113162029 C 10 5' UTR MAPK1IP1L cr14 55535728 T 13 3' UTR NARG2 cr15 60712503 T 13 3' UTR PI15 cr8 75766071 T 10 3' UTR AHCYL1 cr1 110566210 A 14 3' UTR APH1B cr15 63600287 T 12 3' UTR (continuación)
Gen Cromosoma Posición inicial Base de homopolímero Longitud del
afectada homopolímero afectado Región C 17orf63 cr17 27083744 T 12 3' UTR CALN1 cr7 71245682 A 12 3' UTR CCND2 cr12 4410638 T 16 3' UTR CD5L cr1 157801230 A 13 3' UTR CEP170 cr1 243288181 T 11 3' UTR CREB3L2 cr7 137561927 A 11 3'UTR CSNK1G3 cr5 122950254 T 13 3' UTR DIDO1 cr20 61536691 A 11 3' UTR DRAM2 cr1 111660181 A 11 3' UTR EIF4G3 cr1 21133496 T 13 3' UTR FAM38B cr18 10670849 T 14 3' UTR GSK3B cr3 119542766 A 11 3' UTR KCNMB4 cr12 70824838 A 14 3' UTR KDM5A cr12 389523 T 11 3' UTR MYO5B cr18 47351784 A 12 3' UTR NEK5 cr13 52639268 A 13 3' UTR NPR3 cr5 32787131 A 11 3' UTR PPP1R12A cr12 80169697 T 13 3' UTR PRTG cr15 55903921 A 11 3' UTR RAB11FIP1 cr8 37718707 A 13 3' UTR RASGRP1 cr15 38781450 T 13 3' UTR SH3KBP1 crX 19552231 T 13 3' UTR SHROOM3 cr4 77701305 A 12 3' UTR SLC5A3 cr21 35470291 T 11 3' UTR UBE2Z cr17 47005701 A 11 3' UTR UST cr6 149398012 T 13 3' UTR ZNF275 crX 152617043 A 12 3' UTR EIF4G3 cr1 21133286 A 13 3' UTR FCHSD2 cr11 72549649 A 10 3' UTR FMO2 cr1 171178335 A 11 3' UTR RYR3 cr15 34157541 A 10 3' UTR TMEM65 cr8 125325217 A 11 3' UTR WHSC1L1 cr8 38175279 A 11 3' UTR ABAT cr16 8876793 T 11 3' UTR ARFIP1 cr4 153832103 T 11 3' UTR BTBD7 cr14 93708030 A 10 3' UTR C15orf2 cr15 24927891 A 10 3' UTR CALN1 cr7 71249416 T 10 3' UTR CCDC89 cr11 85395559 T 10 3' UTR CCND1 cr1 1 69466273 A 10 3' UTR ENTPD4 cr8 23289680 A 11 3' UTR FCHSD2 cr11 72548510 A 14 3' UTR (continuación)
Gen Cromosoma Posición inicial Base de homopolímero Longitud del
afectada homopolímero afectado Región FGFBP3 cr10 93666830 A 11 3' UTR LANCL1 cr2 211297865 T 9 3' UTR PPM1A cr14 60761433 T 10 3' UTR PURB cr7 44920830 A 9 3' UTR ST7L cr1 113067470 A 10 3' UTR SULF2 cr20 46286320 A 10 3' UTR TMC7 cr16 19073947 A 10 3' UTR TSR2 crX 54471045 T 10 3' UTR UBA6 cr4 68481877 T 12 3' UTR USP14 cr18 212029 A 9 3' UTR ZNF185 crX 152140995 C 10 3' UTR ZNF287 cr17 16454419 T 9 3' UTR AKIRIN1 cr1 39471673 A 10 3' UTR ARL10 cr5 175800427 T 10 3' UTR BMPR2 cr2 203426176 T 8 3' UTR C 17orf96 cr17 36829265 T 8 3' UTR CCND2 cr12 4409520 T 10 3' UTR EDEM1 cr3 5260540 T 10 3' UTR FOXN2 cr2 48604358 T 10 3' UTR FOXN2 cr2 48603079 T 10 3' UTR HDAC4 cr2 239974109 A 9 3' UTR HUS1B cr6 656079 A 10 3' UTR KDM5A cr12 393804 T 11 3' UTR KIF5C cr2 149879665 T 10 3' UTR LRCH1 cr13 47325657 A 10 3' UTR MKLN1 cr7 131175980 A 10 3' UTR PCDHB3 cr5 140482943 T 10 3' UTR RYBP cr3 72424549 T 9 3' UTR SH3KBP1 crX 19553810 T 12 3' UTR SLC35F1 cr6 118638703 A 8 3' UTR MSH6 cr2 48030639 C 8 Exón SETD1B cr12 122242657 C 8 Exón CASP5 cr11 104879686 T 10 Exón RBMXL1 cr1 89449508 T 11 Exón SEC31A cr4 83785564 T 9 Exón CCDC150 cr2 197531518 A 11 Exón PHF2 cr9 96422611 A 8 Exón RPL22 cr1 6257784 T 8 Exón TMEM60 cr7 77423459 T 9 Exón AIM2 cr1 159032486 T 10 Exón ASTE1 cr3 130733046 T 11 Exón CASP5 cr11 104878040 T 10 Exón (continuación)
Gen Cromosoma Posición inicial Base de homopolímero Longitud del
afectada homopolímero afectado Región CTCF cr16 67645338 A 7 Exón DDX27 cr20 47858503 A 8 Exón EXOSC9 cr4 122723893 T 8 Exón FAM111B cr11 58892376 A 10 Exón GRIK2 cr6 102503431 A 8 Exón KIAA0182 cr16 85682289 C 8 Exón KIAA1919 cr6 111587360 T 9 Exón MLL3 cr7 151874147 T 9 Exón MYL1 cr2 211179765 T 11 Exón OR7E24 cr19 9361740 T 11 Exón P4HTM cr3 49043192 C 7 Exón PRKDC cr8 48866909 T 10 Exón PRRT2 cr16 29825015 C 9 Exón RNPC3 cr1 104076466 A 12 Exón SMC6 cr2 17898125 T 9 Exón TAF1B cr2 9989570 A 11 Exón TMEM97 cr17 26653806 A 10 Exón TTK cr6 80751896 A 9 Exón UVRAG cr11 75694430 A 10 Exón
Según formas de realización particulares, la longitud de los homopolímeros utilizados como marcadores no excederá de 20 nucleótidos o no excederá de 15 nucleótidos (por ejemplo, para permitir una detección más eficaz de la presencia de un indel). Por lo tanto, según formas de realización particulares, los marcadores se seleccionan de, por ejemplo, cualquiera de las tablas 1 a 8 , pero solo de los marcadores que tienen menos de 20 nucleótidos o menos de 15 nucleótidos. Esta longitud más corta es particularmente ventajosa en comparación con los marcadores de la técnica anterior (por ejemplo, el marcador BAT25 y BAT26).
Particularmente, en algunas formas de realización, la longitud de los homopolímeros utilizados como marcadores no excede de 15 nucleótidos, 14 nucleótidos, 13 nucleótidos, 12 nucleótidos o incluso 11 nucleótidos. Por otra parte, según formas de realización particulares, los homopolímeros contemplados tienen al menos 6 nucleótidos, al menos 7 nucleótidos, al menos 8 nucleótidos, al menos 9 nucleótidos o incluso al menos 10 nucleótidos de longitud. Según formas de realización específicas particulares, se prevé que la longitud de marcador de al menos un marcador (y hasta todos los marcadores utilizados) se encuentre entre 7 y 15 nucleótidos, entre 8 y 15 nucleótidos, entre 8 y 14 nucleótidos, entre 8 y 13 nucleótidos, entre 9 y 13 nucleótidos, entre 10 y 13 nucleótidos, entre 8 y 12 nucleótidos, entre 9 y 12 nucleótidos, entre 8 y 11 nucleótidos o entre 9 y 11 nucleótidos.
Es importante señalar que los marcadores descritos anteriormente se pueden utilizar para determinar el estado de MSI independientemente del tipo de cáncer. Por lo tanto, en principio, se puede realizar un diagnóstico del estado de MSI con los marcadores proporcionados en el presente documento para cada tipo de cáncer. No obstante, dado que la MSI está presente con mayor frecuencia en cánceres con una deficiencia en genes de reparación de errores de apareamiento, se prevé particularmente diagnosticar el estado de MSI en una muestra tumoral de tumores en los que la deficiencia en MMR tiene lugar con más frecuencia que en otros tipos. En consecuencia, la muestra de cáncer es normalmente una muestra seleccionada de un cáncer que sea cáncer colorrectal, cáncer endometrial, cáncer de ovario, cáncer gástrico, leucemia y un tumor del espectro del síndrome de Lynch.
Diagnosticar el estado de MSI generalmente implica extraer la conclusión de detectar la presencia de MSI o no (esto es equivalente a detectar la ausencia de MSI). Normalmente, la detección de la presencia de MSI se basará en la detección de uno o más indeles en las regiones de microsatélites en investigación. Cuantos más genes marcadores presentados en las tablas 1-3 del presente documento tengan una indel en una región de microsatélites, mayor será la probabilidad de que el tumor se caracterice por inestabilidad microsatelital.
Generalmente, la MSI se puede clasificar como MSI-H, MSI-L y MSS. Según formas de realización particulares, si el 20% (o el 25%) o más de las regiones de microsatélites utilizadas para diagnosticar el estado de MSI contienen un indel, el tumor es MSI-H, si entre el 2,5% y el 20% (25%) de las regiones de microsatélites contiene un indel, el tumor es MSI-L, y si menos del 2,5% de las regiones de microsatélites contiene un indel, el tumor es estable en microsatélites. Según formas de realización alternativas, la MSI puede clasificarse como MSI-H si el 17% o más de las regiones de microsatélites utilizadas para diagnosticar el estado de MSI contienen un indel; si entre el 2% (o el 2,5%) y el 17% de las regiones de microsatélites contienen un indel, el tumor es MSI-L, y si menos del 2% (o el 2,5%) de las regiones de microsatélites contiene un indel, el tumor es estable en microsatélites. La última clasificación es particularmente preferida cuando se utiliza un número elevado (por ejemplo, 25 o más) de marcadores. Se utilizan porcentajes en lugar de números absolutos, ya que un experto en la técnica puede variar el número de marcadores. Como pauta general, los porcentajes deben corresponder más o menos a los porcentajes aplicados en el reconocido panel Bethesda. Por ejemplo, si se utilizan 8 marcadores, el tumor será MSS solo si ninguno de los marcadores de microsatélites contiene un indel; será MSI-H si 2 o más marcadores son positivos, mientras que será MSI-L si solo un marcador contiene un indel. Dado que es evidente a partir de este ejemplo que un marcador positivo más o menos puede afectar al diagnóstico si se usa un número limitado de marcadores, se prevé particularmente el uso de más marcadores. Esto es particularmente útil para clasificar de forma fiable los tumores como MSI-L. Por ejemplo, con la clasificación del 2-17%, si se usa el panel de marcadores preferido de 56 marcadores, un tumor es MSS si 0 o 1 marcadores tienen una puntuación positiva, MSI-L si de 2 a 9 marcadores tienen una puntuación positiva y MSI-H si 10 o más marcadores tienen una puntuación positiva.
El trabajo publicado también sugiere que los tumores MMR tienen una respuesta distinta a los tratamientos estándar y las terapias dirigidas emergentes. Las investigaciones preclínicas sugieren, por ejemplo, que los tumores deficientes en MMR muestran resistencia a las terapias con 5-fluorouracilo, anti-EGFR y VEGF2526. Se desconoce el motivo preciso de esta heterogeneidad, pero la presencia o la ausencia de mutaciones secundarias (recurrentes) como consecuencia de la deficiencia en MMR podría determinar el resultado del tratamiento. Por ejemplo, observamos una mutación recurrente en KRAS, que actúa como un predictor de respuesta negativa establecido de terapias anti-EGFR. Es interesante señalar que la mayor parte de las mutaciones recurrentes en tumores endometriales también afectan específicamente a genes expresados en el endometrio normal y se expresaron de forma diferencial en tumores MMR- con respecto a MMR+, lo que sugiere una selección clonal positiva de estas mutaciones. La identificación de mutaciones recurrentes también revela varias dianas terapéuticas novedosas para el tratamiento de tumores deficientes en MMR.
Por lo tanto, según algunas formas de realización particulares, los procedimientos de diagnóstico del estado de MSI de un tumor, tal como se presentan en el presente documento, pueden comprender además una etapa de elección del régimen de tratamiento en función del estado de MSI (es decir, en función de si se encontró que el tumor es MSI-H, MSI-L o MSS).
Todos los procedimientos actuales se basan en la detección de indeles en regiones de microsatélites del genoma. Se describirán brevemente las metodologías de uso frecuente para el análisis de muestras de ácido nucleico para detectar indeles. No obstante, puede utilizarse en la invención cualquier procedimiento conocido en la técnica para detectar la presencia de indeles.
a. Hibridación específica de alelos
Esta técnica, también conocida de forma común como hibridación de oligonucleótidos específicos de alelos (ASO) (por ejemplo, Stoneking et al., Am. J. Hum. Genet. 48: 70-382, 1991; Saiki et al., Nature 324,163-166,1986; documento EP 235.726 y documento WO 89/11548), se basa en la distinción entre dos moléculas de ADN que difieren en una base mediante hibridación de una sonda de oligonucleótidos que es específica para una de las variantes con un producto amplificado obtenido al amplificar la muestra de ácido nucleico. Este procedimiento normalmente emplea oligonucleótidos cortos, por ejemplo de 15-20 bases de longitud. Las sondas están diseñadas para hibridarse diferencialmente con una variante frente a otra. Los principios y las pautas para diseñar dicha sonda están disponibles en la técnica, por ejemplo en las referencias citadas en el presente documento. Las condiciones de hibridación deben ser lo suficientemente rigurosas como para que haya una diferencia significativa en la intensidad de hibridación entre alelos y producir una respuesta esencialmente binaria, por lo que una sonda se hibrida con solo uno de los alelos. Algunas sondas están diseñadas para hibridarse con un segmento de ADN diana de forma que el sitio polimórfico se alinee con una posición central (por ejemplo, en un oligonucleótido de 15 bases en la posición 7; en un oligonucleótido de 16 bases en la posición 8 o 9) de la sonda, pero este diseño no es necesario.
La cantidad y/o la presencia de un alelo se determina mediante la medición de la cantidad de oligonucleótido específico de alelo que se hibrida con la muestra. Normalmente, el oligonucleótido se marca con una marca, tal como una marca fluorescente. Por ejemplo, se aplica un oligonucleótido específico de alelo a oligonucleótidos inmovilizados que representan secuencias con diferente longitud de microsatélites. Después de condiciones rigurosas de hibridación y lavado, se mide la intensidad de la fluorescencia para cada oligonucleótido microsatélite.
Los formatos de ensayo adecuados para detectar híbridos formados entre sondas y secuencias de ácido nucleico diana en una muestra son conocidos en la técnica e incluyen el formato de diana inmovilizada (dot-blot (transferencia puntual)) y los formatos de ensayo de sonda inmovilizada (dot-blot inverso o line-blot (transferencia lineal)). Algunos formatos de ensayo de dot blot y dot blot inverso se describen en las patentes de Estados Unidos N25.310.893, 5.451.512, 5.468.613 y 5.604.099.
En un formato dot-blot, el ADN diana amplificado se inmoviliza sobre un soporte sólido, tal como una membrana de nailon. El complejo membrana-diana se incuba con la sonda marcada en condiciones de hibridación adecuadas, la sonda no hibridada se elimina mediante lavado en condiciones rigurosas adecuadas y se inspecciona la membrana para determinar la presencia de sonda unida.
En el formato dot-blot inverso (o line-blot), las sondas se inmovilizan sobre un soporte sólido, tal como una membrana de nailon o una placa de microvaloración. El ADN diana se marca, normalmente durante la amplificación, mediante la incorporación de cebadores marcados. Se pueden marcar uno o los dos cebadores. El complejo de membrana-sonda se incuba con el ADN diana amplificado marcado en condiciones de hibridación adecuadas, el ADN diana no hibridado se elimina mediante lavado en condiciones rigurosas adecuadas y la membrana se inspecciona para determinar la presencia de ADN diana unido. En el ejemplo se describe un ensayo de detección line-blot inverso.
b. Cebadores específicos de alelos
Los indeles también se pueden detectar utilizando procedimientos de amplificación específica de alelos o de extensión de cebadores. Estas reacciones generalmente implican el uso de cebadores que están diseñados para dirigirse específicamente a un polimorfismo por medio de un error de apareamiento en el extremo 3' de un cebador. La presencia de un error de apareamiento afecta a la capacidad de una polimerasa de extender un cebador cuando la polimerasa carece de actividad correctora de errores. Por ejemplo, para detectar una secuencia de alelos usando un procedimiento basado en amplificación específica de alelos o en extensión, se diseña un cebador complementario al alelo normal de un microsatélite (es decir, sin indeles) de forma que el nucleótido del extremo terminal 3' se hibride con la secuencia que contiene el número correcto de repeticiones. La presencia del alelo particular puede determinarse por la capacidad del cebador para iniciar la extensión. Si el extremo terminal 3' presenta un error de apareamiento, se impide la extensión.
En algunas formas de realización, el cebador se utiliza junto con un segundo cebador en una reacción de amplificación. El segundo cebador se hibrida en un sitio no relacionado con el microsatélite. La amplificación se produce a partir de los dos cebadores, dando lugar a un producto detectable que significa que la forma alélica particular está presente. Los procedimientos basados en amplificación específica de alelos o en extensión se describen en, por ejemplo, el documento WO 93/22456, las patentes de Estados Unidos N° 5.137.806, 5.595.890, 5.639.611 y la patente de Estados Unidos N° 4.851.331.
Utilizando genotipado basada en amplificación específica de alelos, la identificación de los alelos requiere solo la detección de la presencia o la ausencia de secuencias diana amplificadas. Los procedimientos para la detección de secuencias diana amplificadas son bien conocidos en la técnica. Por ejemplo, electroforesis en gel y los ensayos de hibridación de sonda descritos se utilizan a menudo para detectar la presencia de ácidos nucleicos.
En un procedimiento alternativo sin sonda, el ácido nucleico amplificado se detecta supervisando el aumento en la cantidad total de ADN bicatenario en la mezcla de reacción, y se describe, por ejemplo, en la patente de Estados Unidos N° 5.994.056; y las publicaciones de patente europeas N° 487.218 y 512.334. La detección de ADN bicatenario diana se basa en el aumento de la fluorescencia de varios tintes de unión a ADN, por ejemplo, SYBR Green, que se muestra cuando se unen a ADN bicatenario.
Como apreciará un experto en la técnica, los procedimientos de amplificación específica de alelos se pueden realizar en reacciones que emplean múltiples cebadores específicos de alelos para dirigirse a alelos particulares. Los cebadores para dichas aplicaciones multiplex generalmente se marcan con marcas distinguibles o se seleccionan de forma que los productos de amplificación producidos a partir de los alelos sean distinguibles por tamaño. Así, por ejemplo, ambos alelos pueden identificarse en una sola muestra utilizando una única amplificación mediante análisis en gel del producto de amplificación.
Como en el caso de las sondas específicas de alelo, un cebador oligonucleotídico específico de alelo puede ser exactamente complementario a uno de los alelos polimórficos en la región de hibridación o puede tener algunos errores de apareamiento en posiciones distintas del extremo terminal 3' del oligonucleótido, que dan lugar a errores de apareamiento en sitios no polimórficos en ambas secuencias de alelos.
c. Sondas detectables
i) Sondas de ensayo de 5'-nucleasa
El genotipado también se puede realizar utilizando un "TaqMan®" o "ensayo de 5'-nucleasa", tal como se describe en las patentes de Estados Unidos N° 5.210.015, 5.487.972 y 5.804.375; y Holland et al., 1988, Proc. Natl. Acad. Sci. USA 88 : 7276-7280. En el ensayo TaqMan®, se añaden durante la reacción de amplificación sondas de detección marcadas que se hibridan dentro de la región amplificada. Las sondas se modifican para evitar que actúen como cebadores para la síntesis de ADN. La amplificación se realiza usando una ADN polimerasa que tiene actividad de exonucleasa 5' a 3'. Durante cada etapa de síntesis de la amplificación, cualquier sonda que se hibrida con el ácido nucleico diana cadena abajo del cebador en extensión se degrada por la actividad de exonucleasa 5' a 3' de la ADN polimerasa. Por lo tanto, la síntesis de una nueva hebra diana también da como resultado la degradación de una sonda, y la acumulación de producto de degradación proporciona una medida de la síntesis de secuencias diana.
La sonda de hibridación puede ser una sonda específica de alelo que discrimina entre los alelos con y sin indeles. Alternativamente, el procedimiento se puede realizar usando un cebador específico de alelo y una sonda marcada que se une al producto amplificado.
Se puede utilizar cualquier procedimiento adecuado para detectar el producto de degradación en un ensayo de 5' nucleasa. A menudo, la sonda de detección se marca con dos tintes fluorescentes, uno de los cuales es capaz de extinguir la fluorescencia del otro tinte. Los tintes se unen a la sonda, normalmente uno unido al extremo 5' y el otro a un sitio interno, de modo que la extinción se produce cuando la sonda se encuentra en un estado no hibridado y de tal modo que la escisión de la sonda por la actividad de exonucleasa 5' a 3' de la ADN polimerasa se produce entre los dos tintes. La amplificación da como resultado la escisión de la sonda entre los tintes con una eliminación concomitante de la extinción y un aumento en la fluorescencia observable del tinte inicialmente extinguido. La acumulación de producto de degradación se supervisa mediante la medición del aumento de la fluorescencia de la reacción. Las patentes de Estados Unidos N° 5.491.063 y 5.571.673 describen ambas procedimientos alternativos para detectar la degradación de la sonda que se produce concomitantemente con la amplificación.
ii) Sondas de estructura secundaria
Las sondas detectables tras un cambio estructural secundario también son adecuadas para la detección de un polimorfismo, incluidos indeles. Las sondas de estructura secundaria o de estructura de tallo-bucle ejemplificadas incluyen balizas moleculares o cebador/sondas Scorpion®. Las sondas de baliza molecular son sondas de ácido oligonucleico monocatenario que pueden formar una estructura de horquilla en la que normalmente se colocan un fluoróforo y un extintor en los extremos opuestos del oligonucleótido. En cualquier extremo de la sonda, las secuencias complementarias cortas permiten la formación de un tallo intramolecular, lo que permite que el fluoróforo y el extintor se dispongan en una proximidad estrecha. La porción de bucle de la baliza molecular es complementaria a un ácido nucleico diana de interés. La unión de esta sonda a su ácido nucleico diana de interés forma un híbrido que fuerza la separación del tallo. Esto provoca un cambio de conformación que aleja el fluoróforo y el extintor y da lugar a una señal fluorescente más intensa. Las sondas de baliza molecular son, sin embargo, muy sensibles a una pequeña variación de secuencia en la diana de la sonda (Tyagi S. y Kramer F. R., Nature Biotechnology, vol. 14, páginas 303-308 (1996); Tyagi et al., Nature Biotechnology, vol. 16 , páginas 49-53 (1998); Piatek et al., Nature Biotechnology, vol. 16, páginas 359-363 (1998); Marras S. et al., Genetic Analysis: Biomolecular Engineering, vol.
14, páginas 151-156 (1999); Tpp I. et al, BioTechniques, Vol 28, páginas 732-738 (2000)). Un cebador/sonda Scorpion® comprende una sonda de estructura de tallo-bucle unida covalentemente a un cebador.
d. Secuenciación de ADN y extensiones de una única base
Los indeles también se pueden detectar mediante secuenciación directa. Los procedimientos incluyen, por ejemplo, procedimientos basados en secuenciación didesoxi y otros procedimientos tales como la secuencia de Maxam y Gilbert (véase, por ejemplo, Sambrook et al., anteriormente).
Otros procedimientos de detección incluyen Pyrosequencing™ (pirosecuenciación) de productos de longitud de oligonucleótido. Estos procedimientos emplean a menudo técnicas de amplificación tales como la PCR. Por ejemplo, en la pirosecuenciación, un cebador de secuenciación se hibrida con una plantilla de ADN monocatenaria, amplificada por PCR; y se incuba con las enzimas, ADN polimerasa, ATP sulfurilasa, luciferasa y apirasa, y los sustratos, adenosina 5' fosfosulfato (APS) y luciferina. Se añade a la reacción el primero de cuatro desoxinucleótido trifosfatos (dNTP). La ADN polimerasa cataliza la incorporación del desoxinucleótido trifosfato en la hebra de ADN, si es complementario a la base presente en la hebra de plantilla. Cada evento de incorporación viene acompañado de la liberación de pirofosfato (PPi) en una cantidad equimolar a la cantidad de nucleótido incorporado. La ATP sulfurilasa convierte cuantitativamente PPi en ATP en presencia de adenosina 5' fosfosulfato. Este ATP impulsa la conversión mediada por luciferasa de luciferina en oxiluciferina, lo que genera luz visible en cantidades que son proporcionales a la cantidad de ATP. La luz producida en la reacción catalizada por luciferasa se detecta mediante una cámara de dispositivo de carga acoplada (CCD) y se ve como un pico en un pyrogram™ (pirograma). Cada señal de luz es proporcional al número de nucleótidos incorporados. La apirasa, una enzima que degrada los nucleótidos, degrada continuamente los dNTP no incorporados y el exceso de ATP. Cuando se completa la degradación, se añade otro dNTP.
Otro procedimiento similar para caracterizar indeles no requiere el uso de una PCR completa, sino que normalmente utiliza solo la extensión de un cebador mediante una única molécula de ácido didesoxirribonucleico (ddNTP) marcada con fluorescencia que es complementaria al nucleótido que se va a investigar. El nucleótido presente en el sitio polimórfico se puede identificar mediante la detección de un cebador que se ha extendido por una base y está marcado de forma fluorescente (por ejemplo, Kobayashi et al., Mol. Cell. Probes, 9: 175-182, 1995).
e. Electroforesis
Los productos de amplificación generados utilizando la reacción en cadena de la polimerasa se pueden analizar mediante el uso de electroforesis en gel de gradiente desnaturalizante. Se pueden identificar diferentes alelos basándose en las diferentes propiedades de fusión dependientes de la secuencia y la migración electroforética del ADN en solución (véase, por ejemplo, Erlich, ed., PCR Technology, Principles and Applications for DNA Amplification, W. H. Freeman and Co, Nueva York, 1992, Capítulo 7).
La distinción de polimorfismos de microsatélites se puede realizar mediante electroforesis capilar. La electroforesis capilar permite convenientemente la identificación del número de repeticiones en un alelo microsatélite particular. La aplicación de la electroforesis capilar al análisis de polimorfismos de ADN es bien conocida por los expertos en la técnica (véase, por ejemplo, Szantai, et al., J Chromatogr A. (2005) 1079 (1-2): 41-9; Bjorheim y Ekstrom, Electrophoresis (2005) 26 (13 ): 2520-30 y Mitchelson, Mol Biotechnol. (2003) 24 (1): 41-68).
f. Análisis de polimorfismo de conformación monocatenaria
Los alelos de secuencias diana pueden diferenciarse utilizando el análisis de polimorfismo de conformación monocatenaria, que identifica diferencias de bases mediante la alteración en la migración electroforética de productos de PCR monocatenarios, tal como se describe, por ejemplo, por Orita et al., Proc. Nat. Acad. Sci. 86, 2766-2770 (1989). Los productos de PCR amplificados pueden generarse tal como se ha descrito anteriormente, y calentarse o desnaturalizarse de otro modo, para formar productos de amplificación monocatenarios. Los ácidos nucleicos monocatenarios pueden replegarse o formar estructuras secundarias que dependen parcialmente de la secuencia de bases. Las diferentes movilidades electroforéticas de los productos de amplificación monocatenarios pueden estar relacionadas con la diferencia de secuencia de bases entre alelos de genes diana.
g. Análisis de la curva de fusión
El análisis de la curva de fusión es una evaluación de las características de disociación del ADN bicatenario durante el calentamiento. A medida que aumenta la temperatura, la doble hebra comienza a disociarse, lo que produce un aumento en la intensidad de la absorbancia, el efecto hipercrómico. La temperatura a la que se desnaturaliza el 50% del ADN se conoce como punto de fusión (que no debe confundirse con el término punto de fusión utilizado en física). La energía requerida para romper el enlace de hidrógeno base-base entre dos hebras de ADN depende de su longitud, contenido de GC y su complementariedad. Debido al hecho de que los emparejamientos de bases G-C tienen 3 enlaces de hidrógeno entre los mismos, mientras que los pares de bases A-T tienen solo 2, el ADN con un contenido de G-C más alto tendrá una temperatura de fusión más alta que el ADN con un contenido de A-T más alto. Al calentar una mezcla de reacción que contiene secuencias de ADN bicatenario y medir la disociación frente a la temperatura, se puede determinar la presencia y la identidad de polimorfismos de un solo nucleótido (SNP).
Originariamente, la disociación de hebras se observó mediante mediciones de absorbancia UV, pero las técnicas basadas en mediciones de fluorescencia son ahora el enfoque más común. La disociación dependiente de la temperatura entre dos hebras de ADN se puede medir utilizando un fluoróforo intercalador de ADN, tal como SYBR green, EvaGreen o sondas de ADN marcadas con fluoróforo.
Una técnica alternativa es el análisis de fusión de alta resolución (HRM). Están disponibles comercialmente muchos tintes e instrumentos de alta resolución para realizar análisis de curvas de fusión o HRM; incluidas la mayor parte de las máquinas qPCR.
Los procedimientos de detección de indeles a menudo emplean oligonucleótidos marcados. Los oligonucleótidos se pueden marcar incorporando un marcador detectable por medios espectroscópicos, fotoquímicos, bioquímicos, inmunoquímicos o químicos. Los marcadores útiles incluyen tintes fluorescentes, marcadores radiactivos, por ejemplo 32P, reactivos densos en electrones, enzimas, tales como peroxidasa o fosfatasa alcalina, biotina o haptenos y proteínas para las que se encuentran disponibles antisueros o anticuerpos monoclonales. Las técnicas de marcado son bien conocidas en la técnica (véase, por ejemplo, Sambrook et al., anteriormente).
Los marcadores de indeles de microsatélites proporcionados en el presente documento se pueden detectar utilizando cualquiera de estas tecnologías u otras; el panel de marcadores es independiente de la tecnología utilizada. Sin embargo, está particularmente previsto que la determinación de la presencia de un indel no se realice mediante un procedimiento basado en la secuenciación de Sanger. Esto se debe a que el proceso de detección de la inestabilidad microsatelital mediante el panel de marcadores Bethesda se realiza normalmente mediante la secuenciación de Sanger, un protocolo que resulta bastante engorroso. Según formas de realización adicionales, se prevé particularmente determinar la presencia de un indel a través de procedimientos de extensión de un solo par de bases (tales como Sequenom MassArray), tecnologías de hibridación de ADN (por ejemplo, Taqman), análisis de curva de fusión o una tecnología similar.
Según otro aspecto, el panel de biomarcadores tal como se describe en el presente documento se proporciona para su uso como diagnóstico. En particular, se prevé que este panel de biomarcadores se pueda utilizar para detectar el estado de la MSI en un cáncer o para determinar la MSI en una muestra tumoral. En consecuencia, el uso de este panel de biomarcadores se proporciona en el diagnóstico de inestabilidad microsatelital (o del estado de MSI) en el cáncer.
Aunque también se prevé explícitamente el uso de menos marcadores, los paneles de biomarcadores particularmente adecuados para determinar la MSI en una muestra tumoral son paneles de biomarcadores que comprenden al menos ocho marcadores (regiones de microsatélites). Dicho panel de biomarcadores comprende al menos ocho regiones de microsatélites seleccionadas de las presentes en las regiones 5' UTR o 3' UTR de los genes enumerados en la tabla 1 y las presentes en los exones de los genes enumerados en la tabla 2. Los, al menos ocho, marcadores pueden ser al menos 10 marcadores, al menos 12 marcadores, al menos 16 marcadores, al menos 20 marcadores, al menos 25 marcadores o incluso más. Según formas de realización muy particulares, el panel de biomarcadores comprende al menos la mitad de las regiones de microsatélites enumeradas en la tabla 3. Según otras formas de realización particulares más, el panel de biomarcadores está representado por las 56 regiones de microsatélites enumeradas en la tabla 3.
Según formas de realización particulares, los marcadores se seleccionan de aquellos que son más recurrentes, es decir, marcadores que aparecen en al menos un tercio o al menos la mitad de los tumores deficientes en MMR. En consecuencia, los marcadores se seleccionan de los marcadores que aparecen al menos 5 veces de 16 (por ejemplo, en las tablas 1 y 2, o en las tablas 4 y 5), 6 veces de 16, 7 veces de 16 o al menos 8 veces de 16 tumores.
0 aparecen al menos 4 veces de 11 (por ejemplo, en la tabla 6 y 7), al menos 5 veces de 11, al menos 6 veces de 11 tumores.
Según otras formas de realización más, se proporciona un kit para determinar MSI en una muestra tumoral, que comprende las herramientas para genotipar el panel de biomarcadores (es decir, las, al menos ocho, regiones de microsatélites seleccionadas de las presentes en las regiones 5' UTR o 3' UTR de los genes enumerados en la tabla 1 y las presentes en los exones de los genes enumerados en la tabla 2). Más particularmente, el kit se adaptará al panel o paneles de biomarcadores particularmente previstos. Según formas de realización específicas, el kit también puede contener las herramientas para genotipar el panel de marcadores Bethesda, o el panel de marcadores Bethesda ampliado. Dichos kits son especialmente adecuados para realizar una comparación lado a lado de los marcadores con el panel Bethesda. También se prevé que un kit solo tome un subconjunto del panel de marcadores Bethesda (por ejemplo, de 1 a 5 marcadores en lugar de los 10). En tal caso, se prevé explícitamente que se incluyan los marcadores BAT25 y BAT26, ya que generalmente se consideran los más fiables. No hace falta decir que esto también significa que los procedimientos de diagnóstico de MSI descritos en el presente documento también pueden contener además una etapa de determinación del estado de uno o más marcadores del panel de marcadores Bethesda ampliado (además del uso de los marcadores descritos en el presente documento).
Tal como se muestra en la sección Ejemplos (particularmente en los ejemplos 8 y 9), los marcadores de indeles proporcionados en el presente documento están enriquecidos en genes implicados en las vías de reparación de roturas de doble hebra de ADN y afectan a su funcionalidad. Como consecuencia, las células en las que están presentes estos marcadores son sensibles a letalidad sintética mediante la inhibición de la reparación por escisión de bases de ADN. Esto ofrece nuevas oportunidades terapéuticas, ya que los tumores positivos a MSI a menudo son resistentes a las quimioterapias estándar utilizadas.
En consecuencia, en un aspecto adicional, se proporcionan procedimientos de cribado de la sensibilidad de células cancerosas al tratamiento con un inhibidor de una enzima de reparación por escisión de bases de ADN, que comprende determinar el estado de MSI en las células cancerosas. Según formas de realización particulares, el inhibidor de una enzima de reparación por escisión de bases de ADN es un inhibidor de PARP. Según formas de realización específicas, las células cancerosas son de un cáncer seleccionado de la lista de: cáncer colorrectal, cáncer endometrial, cáncer de ovario, cáncer gástrico, leucemia y un tumor del síndrome de Lynch. Según otras formas de realización específicas, las células cancerosas son de un cáncer resistente a una terapia estándar. Se prevé particularmente que dicha terapia estándar se seleccione de entre 5-FU (5-fluorouracilo, efudex), carboplatino, cisplatino o terapia dirigida (particularmente terapia dirigida dirigida contra EGFR (por ejemplo, gefitinib, erlotinib, cetuximab, panitumumab) o contra Braf. Aunque estos procedimientos pueden realizarse en principio in vivo, ex vivo e in vitro, se prevé particularmente que se realicen in vitro.
Según formas de realización particulares, la presencia de MSI es indicativa de la sensibilidad de las células cancerosas al tratamiento con un inhibidor de una enzima de reparación por escisión de bases de ADN; es decir, las células cancerosas morirán, dejarán de crecer o proliferarán menos cuando se traten con dicho inhibidor.
Según formas de realización específicas, las células cancerosas son células obtenidas de un sujeto, y el cribado de la sensibilidad al tratamiento con un inhibidor de una enzima de reparación por escisión de bases de ADN se utiliza para guiar el tratamiento del sujeto. Según formas de realización alternativas, el cribado de sensibilidad se usa para estratificar o clasificar al sujeto para un ensayo clínico.
Según formas de realización particulares, la presencia de MSI se establece mediante un procedimiento descrito en el presente documento, es decir, un procedimiento que comprende determinar la presencia de un indel en al menos dos regiones de microsatélites en una muestra del ADN tumoral, en el que las, al menos dos, regiones de microsatélites son
- al menos dos regiones de microsatélites presentes en las regiones 5' UTR o 3' UTR de los genes enumerados en la tabla 1 , o
- al menos tres regiones de microsatélites seleccionadas de las presentes en los exones de los genes enumerados en la tabla 2 y/o presentes en las regiones 5' UTR o 3' UTR de los genes enumerados en la tabla 1, en el que la presencia de al menos un indel es indicativa de MSI.
Según otras formas de realización particulares, la presencia de MSI se establece usando un panel de biomarcadores tal como se describe en el presente documento, es decir, un panel de biomarcadores que comprende al menos ocho regiones de microsatélites seleccionadas de las presentes en las regiones 5' UTR o 3' UTR de los genes enumerados en la tabla 1 y los presentes en los exones de los genes enumerados en la tabla 2. Según otras formas de realización específicas más, el panel de biomarcadores comprende al menos ocho regiones de microsatélites seleccionadas de las enumeradas en la tabla 3.
Según formas de realización muy específicas, los procedimientos también pueden comprender una etapa de secuenciación de genes implicados en la vía de recombinación homóloga.
Por lo tanto, no solo se proporcionan procedimientos de cribado de la sensibilidad de las células cancerosas, sino también procedimientos para diagnosticar la sensibilidad de un sujeto con cáncer al tratamiento con un inhibidor de una enzima de reparación por escisión de bases de ADN, que comprenden las etapas siguientes:
- determinar el estado de MSI en una muestra de células cancerosas obtenidas del sujeto;
- correlacionar el estado de MSI con la sensibilidad al tratamiento con un inhibidor de una enzima de reparación por escisión de bases de ADN, en los que la presencia de MSI es indicativa de sensibilidad al tratamiento.
Opcionalmente, estos procedimientos contienen una etapa adicional de obtención de una muestra de células cancerosas del sujeto (antes de la etapa de determinación). La determinación del estado de MSI generalmente se realiza en las células de la muestra obtenida. En particular, se prevé que la determinación del estado de MSI en una muestra de células cancerosas se realice in vitro.
Según formas de realización particulares, el inhibidor de una enzima de reparación por escisión de bases de ADN es un inhibidor de PARP. Según formas de realización específicas, las células cancerosas provienen de un cáncer seleccionado de la lista de: cáncer colorrectal, cáncer endometrial, cáncer de ovario, cáncer gástrico, leucemia y un tumor del síndrome de Lynch (o cualquier otro tumor del espectro del síndrome de Lynch). Según formas de realización particulares, la presencia de MSI se establece mediante un procedimiento descrito en el presente documento, es decir, un procedimiento que comprende determinar la presencia de un indel en al menos dos regiones de microsatélites en una muestra del ADN tumoral, en el que las, al menos dos, regiones de microsatélites son
- al menos dos regiones de microsatélites presentes en las regiones 5' UTR o 3' UTR de los genes enumerados en la tabla 1 , o
- al menos tres regiones de microsatélites seleccionadas de las presentes en los exones de los genes enumerados en la tabla 2 y/o presentes en las regiones 5' UTR o 3' UTR de los genes enumerados en la tabla 1, en el que la presencia de al menos un indel es indicativa de MSI.
Según otras formas de realización particulares, la presencia de MSI se establece usando un panel de biomarcadores tal como se describe en el presente documento, es decir, un panel de biomarcadores que comprende al menos ocho regiones de microsatélites seleccionadas de las presentes en las regiones 5' UTR o 3' UTR de los genes enumerados en la tabla 1 y las presentes en los exones de los genes enumerados en la tabla 2.
También se prevé que los procedimientos según este aspecto pueden contener una etapa adicional de tratamiento al sujeto con un inhibidor de una enzima de reparación por escisión de bases de ADN (si el sujeto es sensible a dicho tratamiento, según se determina mediante el estado de MSI).
Por lo tanto, también se proporcionan procedimientos para tratar un cáncer con MSI (o, de forma equivalente, deficiencia en MMR) en un sujeto que lo necesita, que comprenden:
- establecer la presencia de MSI en el cáncer;
- administrar un inhibidor de una enzima de reparación por escisión de bases de ADN al sujeto.
Para procedimientos relacionados con el diagnóstico de la sensibilidad de un sujeto con cáncer al tratamiento con un inhibidor de una enzima de reparación por escisión de bases de ADN, o al tratamiento de un sujeto que tiene cáncer con MSI, se prevé particularmente que este cáncer sea resistente a al menos una terapia estándar, particularmente una terapia estándar seleccionada de entre 5-FU (5-fluorouracilo, efudex), carboplatino, cisplatino o terapia dirigida (particularmente terapia dirigida, dirigida contra EGFR (por ejemplo, gefitinib, erlotinib, cetuximab, panitumumab) o contra Braf.
Se prevé que el cáncer se trate administrando el inhibidor al sujeto. Los procedimientos pueden tener opcionalmente una etapa adicional de obtención de una muestra de células cancerosas del sujeto (antes de la etapa de determinación de MSI y de establecer la presencia de MSI).
Según formas de realización particulares, el inhibidor de una enzima de reparación por escisión de bases de ADN es un inhibidor de PARP. Según formas de realización específicas, las células cancerosas son de un cáncer seleccionado de la lista de: cáncer colorrectal, cáncer endometrial, cáncer de ovario, cáncer gástrico, leucemia y un tumor del síndrome de Lynch. Según formas de realización particulares, la presencia de MSI se establece mediante un procedimiento descrito en el presente documento, es decir, un procedimiento que comprende determinar la presencia de un indel en al menos dos regiones de microsatélites en una muestra del ADN tumoral, en el que las, al menos dos, regiones de microsatélites son
- al menos dos regiones de microsatélites presentes en las regiones 5' UTR o 3' UTR de los genes enumerados en la tabla 1, o
- al menos tres regiones de microsatélites seleccionadas de las presentes en los exones de los genes enumerados en la tabla 2 y/o presentes en las regiones 5' UTR o 3' UTR de los genes enumerados en la tabla 1,
en el que la presencia de al menos un indel es indicativa de MSI.
Según otras formas de realización particulares, la presencia de MSI se establece usando un panel de biomarcadores tal como se describe en el presente documento, es decir, un panel de biomarcadores que comprende al menos ocho regiones de microsatélites seleccionadas de las presentes en las regiones 5' UTR o 3' UTR de los genes enumerados en la tabla 1 y las presentes en los exones de los genes enumerados en la tabla 2.
Debe entenderse que aunque se han abordado en el presente documento formas de realización particulares, configuraciones específicas así como materiales y/o moléculas para células y procedimientos según la presente invención, se pueden realizar varios cambios o modificaciones en la forma y detalle sin apartarse del alcance y el espíritu de la presente invención. Los ejemplos siguientes se proporcionan para ilustrar mejor las formas de realización particulares y no deben considerarse limitantes de la solicitud. La solicitud está limitada solo por las reivindicaciones.
Ejemplos
Ejemplo 1. Secuenciación del genoma completo de un tumor endometrial con deficiencia en MMR
Para seleccionar tumores deficientes en MMR para la secuenciación del genoma completo, se utilizaron pruebas diagnósticas estándar, incluidas inmunohistoquímica de proteínas MMR (MLH1, MSH2 y MSH6), evaluación de la inestabilidad microsatelital (MSI) utilizando el panel Bethesda ampliado (Pinol et al., 2005) y perfilado de metilación del promotor MLH1. Los resultados de inmunohistoquímica e hipermetilación del promotor MLH1 se muestran como las 3 líneas superiores en la tabla 9. El estado de inestabilidad microsatelital (MSI) se analizó en 10 loci diferentes que contenían secuencias de repetición mononucleotídicas o dinucleotídicas (respectivamente 2 y 8 marcadores), utilizando el panel recomendado por las directrices internacionales para la evaluación de la MSI, es decir, el panel Bethesda revisado (Boland et al., 1998; Dietmaier et al., 1997). Las amplificaciones por PCR se realizaron en dos pentaplexos: Multiplex A (BAT25, BAT26, D5S346, D17S250, D2S123) y multiplex B (BAT40, D17S787, D18S58, D18S69, TGFp-RII). Los cebadores directos se marcaron con 6-FAM, HEX, VIC o TET. Los amplicones de ADN tumoral y normal del mismo paciente se analizaron en un analizador genitico ABI 3130 (Applied Biosystems). El tumor 1 fue fuertemente positivo a 7 de los 8 marcadores exitosos, mientras que los otros dos tumores fueron negativos. Esto confirma que el tumor 1 es deficiente en MMR. Los resultados se resumen en la tabla 10. En la tabla 11 se incluye mas información sobre las muestras tumorales.
Se seleccionaron un tumor EM deficiente en MMR, que presentaba un estado MSI positivo y ausencia de expresión de MSH6 (tabla 9), y dos tumores EM competentes en MMR. Usando tecnología Complete Genomics® (CG), obtuvimos datos de secuenciación de alta cobertura del tumor y muestras normales correspondientes (en promedio 95,2x y 77,1x, respectivamente), que posteriormente se analizaron utilizando una anotación y un conducto de filtrado previamente desarrollados (Reumers et al., 2011). El tumor deficiente en MMR mostró un fenotipo hipermutador claro, que contenía mutaciones somáticas significativamente más novedosas que los otros tumores utilizando el procedimiento calldiff de CGAtools™ verificado (http://cgatools.sourceforge.net) (tabla 12, mutaciones somáticas usando calldiff). Este algoritmo está diseñado para encontrar diferencias entre dos genomas del mismo individuo, tales como un par tumor-normal.
A continuación, aplicamos un umbral de puntuación de calidad basado en la validación independiente de mutaciones seleccionadas aleatoriamente, lo que dio como resultado una precisión general de la llamada de mutación estimada en el 94,6%. Esto confirmó que la carga de mutación del tumor deficiente en MMR era 20,3 veces superior (figura 1a y tabla 12). La inspección detallada de variantes somáticas en la muestra de hipermutador reveló una inserción de desplazamiento de marco somática en el exón 5 de MSH6 (F1088fs; Nota S2) que era coherente con la ausencia de expresión de MSH6. No se encontraron mutaciones en las ADN polimerasas, tales como POLE. De hecho, de las 34 ADN polimerasas conocidas, solo REV3L se mutó somática en el hipermutador. Sin embargo, dado que REV3L está involucrada en la síntesis de ADN de translesión, es poco probable que una mutación en REV3L cause nuestro fenotipo hipermutador. Además, el análisis del número de copias se realizó utilizando el algoritmo ASCAT (Van Loo et al., 2010). ASCAT está diseñado específicamente para detectar aberraciones en el número de copias en muestras tumorales. Determina con precisión el número de copias específicas de alelos en tumores sólidos estimando y ajustando la ploidía tumoral general y la fracción tumoral eficaz en la muestra. A diferencia de los tumores competentes en MMR, el hipermutador es un tumor cromosómico estable (datos no mostrados).
Tabla 9. Pruebas diagnósticas estándar para evaluar la deficiencia en MMR. Todos los tumores se secuenciaron utilizando o bien tecnología de secuenciación del genoma completo Complete Genomics (CG) o bien enriquecimiento del exoma Truseq combinado con tecnología de secuenciación de Illumina. Para cada tumor, se muestran la inestabilidad microsatelital (MSI) utilizando el panel Bethesda ampliado, la inmunohistoquímica estándar de las proteínas MMR (MLH1, MSH2 y MSH6) y el estado de metilación del promotor MLH1. Los asteriscos (*) indican la presencia de una tinción nuclear positiva débil en una minoría de las células tumorales.
Tumor Tecnología de
iación Tipo de tumor IHC IHC IHC Hipermetilación de secuenc MLH1 MSH2 MSH6 MSI MLH1 MMR- 1 Genoma completo CG Endometrial -(*) -MMR+ 1 Genoma completo CG Endometrial - MMR+ 2 Genoma completo CG Endometrial - -MMR- 2 Exoma de Illumina Endometrial -(*) - MMR-3 Exoma de Illumina Endometrial - MMR- 4 Exoma de Illumina Endometrial - - - -MMR-5 Exoma de Illumina Endometrial - - -MMR- 6 Exoma de Illumina Endometrial - -MMR-7 Exoma de Illumina Endometrial - - - - MMR- 8 Exoma de Illumina Endometrial - - - -MMR- 9 Exoma de Illumina Colorrectal - N/A MMR- 10 Exoma de Illumina Colorrectal - N/A MMR-11 Exoma de Illumina Colorrectal - N/A MMR+ 3 Exoma de Illumina Endometrial - -MMR+ 4 Exoma de Illumina Endometrial - -MMR+ 5 Exoma de Illumina Endometrial - -MMR+ 6 Exoma de Illumina Endometrial -
Figure imgf000189_0001
Tabla 11. Muestras tumorales e información clínica. La tabla enumera información detallada para las tres muestras tumorales seleccionadas. Todos los tumores eran tumores primarios, no tratados previamente con quimioterapia, de pacientes sin antecedentes familiares de cánceres hereditarios.
Tumor Tumor Tipo Histopatología Grado Estadio Tumor 1 MMR- 1 Endometrio Carcinoma endometrioide 3 IIIc Tumor 2 MMR+ 1 Endometrio Carcinoma endometrioide 3 I Tumor 3 MMR+ 2 Endometrio Carcinoma seroso 3 Ia
Figure imgf000191_0001
Ejemplo 2. Patrones de mutación somática en el hipermutador deficiente en MSH6
Los estudios en organismos modelo y líneas celulares revelaron que las mutaciones somáticas que se producen debido a la deficiencia de MMR involucran principalmente inserciones/deleciones (indeles) que afectan a las secuencias de microsatélites (repeticiones dinucleotídicas a hexanucleotídicas con una longitud mínima de 6 bases y al menos dos unidades de repetición) y homopolímeros (repeticiones mononucleotídicas con una longitud mínima de 6 bases) (Ellegren, 2004). Para probar esta hipótesis, estratificamos el genoma en cuatro clases diferentes utilizando las definiciones siguientes:
- Regiones de microsatélites: repeticiones di-, tri-, tetra-, penta- o hexanucleotídicas que constan de al menos dos unidades repetidas y con una longitud mínima de 6 bases.
- Regiones homopoliméricas: repeticiones mononucleotídicas con una longitud mínima de 6 bases.
- Regiones homopoliméricas cortas: repeticiones mononucleotídicas de 3, 4 o 5 bases de longitud.
- Regiones de no repetición: el resto del genoma, es decir, cada base que no forma parte de una secuencia de repetición simple.
Las regiones genómicas que siguen estas definiciones se determinaron escaneando los archivos de secuencia (en formato FASTA) utilizando la herramienta "grepseq" (http://code.google.com/p/grepseq/). A nivel del genoma completo, la composición general de repetición fue la siguiente: microsatélites (7,9%), homopolímeros (1,9%), homopolímeros cortas (19,8%) y regiones no en repetición (70,4%).
En nuestro hipermutador, observamos que las mutaciones somáticas se ubican con mayor frecuencia en homopolímeros de lo esperado en función de su aparición en el genoma completo (no se muestra). Observamos que las mutaciones somáticas se acumulan con mayor frecuencia en homopolímeros (47,7%) en comparación con su aparición en el genoma completo (1,9%). El 35,5%, el 10,7% y el 6,2% de las mutaciones somáticas se ubicaron en regiones de no repetición, homopolímeros cortos y microsatélites, respectivamente. En comparación con la aparición de estas regiones en el genoma completo (es decir, el 70,4%, el 19,8% y el 7,9% para regiones de no repetición, homopolímeros cortos y microsatélites, respectivamente), las mutaciones somáticas se vieron afectadas con menos frecuencia de lo esperado en estas regiones.
Además, observamos que los indeles eran de hecho más frecuentes que las sustituciones de pares de bases individuales (57,4% de indeles frente a 42,6% de sustituciones; figura 1b), pero afectaban predominantemente a los homopolímeros (81,3%) y no a los microsatélites (figura 1c). Las sustituciones no afectaron preferentemente a los homopolímeros o los microsatélites (figura 1d). Las mutaciones se produjeron con tanta frecuencia en los intrones como en el resto del genoma, pero claramente menos en los exones (excluyendo las regiones no traducidas (UTR) 5' y 3'). Para indeles, esta disminución fue más pronunciada que para sustituciones (74,7% frente a 14,3%; figuras 1e,f). La corrección por el número de homopolímeros o la longitud de homopolímeros en las regiones exónicas, intergénicas e intrónicas confirmó que esta reducción no podía atribuirse a menos homopolímeros o a homopolímeros más cortos. La mayor parte de los indeles exónicos dieron como resultado mutaciones de desplazamiento de marco heterocigóticas (160 indeles de desplazamiento de marco frente a 3 indeles sin desplazamiento de marco), lo que sugiere que son mutaciones de pérdida de función que experimentan una selección clonal negativa.
Sustituciones somáticas en el hipermutador deficiente en MSH6
Los estudios que evaluaron las sustituciones somáticas en un melanoma inducido por luz ultravioleta (Pleasance et al., 2010a) y un adenocarcinoma de pulmón inducido por humo de tabaco (Pleasance et al., 2010b) revelaron que, respectivamente, tienen lugar con frecuencia transiciones G:C>A:T y transversiones G:C>T:A en estos tumores. Al evaluar las sustituciones somáticas en nuestro hipermutador, se observó un patrón claramente distinto, en el que el 71,5% de todas las sustituciones representaron transiciones A:T>G:C y G:C>A:T en comparación con solo el 50,1% en los tumores competentes en MMR (figura 2a). Sorprendentemente, en el hipermutador, las transiciones G:C>A:T ocurrieron con mayor frecuencia en el contexto de un dinucleótido CG (en el que C experimenta la sustitución y G representa el nucleótido siguiente), mientras que las transiciones A:T>G:C ocurrieron independientemente del contexto de dinucleótidos y con mayor frecuencia que en los tumores competentes en MMR (figuras 2b-c).
A continuación, para identificar aquellas características que proporcionan un mejor ajuste al patrón de mutación del hipermutador, usamos regresión lineal para correlacionar los diversos tipos de sustituciones con 9 características genómicas previamente implicadas en la explicación de la variabilidad genética en la población humana (Hodgkinson y Eyre-Walker, 2011) (figura 2d; las 9 características son la distancia al telómero, el tiempo de replicación, las repeticiones simples, la composición de GC, el contenido de CpG, la isla CpG, el contenido de génico, la hipersensibilidad a la DNasa y los sitios de unión de la lámina nuclear). Aunque no pudimos observar una correlación con el contenido de genes, la hipersensibilidad a la DNasa o los dominios asociados a la lámina (no se muestra), la distancia al telómero, el tiempo de replicación, el contenido de repetición simple, la composición de GC (% de GC), la frecuencia de CpG y la fracción de islas CpG representaron predictores significativos e independientes. En general, observamos un mejor modelo predictivo para las transiciones que para las transversiones (R2= 0,22 frente a 0,07, respectivamente; figura 2d), mientras que a nivel individual se observaron las siguientes correlaciones relevantes. En primer lugar, se encontró una correlación positiva entre el tiempo de replicación y las transiciones, pero no las transversiones (figura 2e), lo que indica que la menor fidelidad de replicación del ADN en la fase S tardía aumenta las mutaciones de transición pero no las transversiones, lo que sugiere que el aumento observado anteriormente en transversiones de fase S tardías (Koren et al., 2012) puede atribuirse a una menor actividad de MMR en ese momento, ya que la falta de una maquinaria de MMR constituye la principal diferencia entre los conjuntos de datos actuales y los previamente investigados. En segundo lugar, para repeticiones simples, se observó un aumento del 42% en sustituciones en las bases que flanquean inmediatamente a los homopolímeros. Esto fue cierto tanto para las transiciones como para las transversiones, y muy probablemente se relacione con el estancamiento de la ADN polimerasa dentro de secuencias repetitivas de ADN que da lugar a una replicación propensa a errores (Hodgkinson y Eyre-Walker, 2011). En tercer lugar, el % de GC se correlacionó inversamente con las frecuencias de transición y transversión. Esto se ha descrito previamente en numerosos organismos, y aunque aún no ha surgido un modelo dominante para explicar esta correlación, nuestros datos indican que la actividad diferencial de MMR no contribuye a este efecto. En cuarto lugar, las transiciones G:C>A:T en los sitios CpG dependen en gran medida del contenido de CpG, pero están inversamente correlacionadas con la fracción de islas CpG (figuras 2d). Debido a que la mayor parte de los CpG en el genoma, excepto los de las islas CpG, están metilados, esto indica un vínculo con la metilación de la citosina similar a las mutaciones impulsadas por desaminación, por lo que las transiciones CG>TG se producen a través del proceso espontáneo, independiente de la replicación, de la desaminación de la citosina. Como la MMR se considera canónicamente asociada a la replicación, el aumento mucho mayor en las transiciones CG>TG observado en los tumores deficientes en MMR en comparación con los tumores competentes en MMR (3042 frente a 452 mutaciones) demuestra que la MMR no canónica, independiente de la replicación, que se ha descrito recientemente a nivel molecular (Hombauer et al., 2011; Liu et al., 2008; Pena-Diaz et al., 2012), es importante para la integridad del genoma. Finalmente, las frecuencias de las islas CpG se relacionaron inversamente con las frecuencias generales de mutación. De hecho, las bases que se encontraban fuera de las islas CpG tenían casi dos veces más probabilidades de sufrir mutaciones que las que estaban dentro de las islas CpG (figura 2f). Es poco probable que la selección negativa explique esta disminución, ya que las sustituciones exónicas no disminuyen en la misma medida. La metilación del ADN ofrece una explicación alternativa a través del estancamiento de la polimerasa que puede inducir (Song et al., 2012), aunque otra posibilidad es a través de la reparación por desaminación, que puede estar catalizada por polimerasas propensas a errores.
En general, la mayor parte de las características genómicas que se correlacionan con la frecuencia de mutación en la población general también se correlacionan con sustituciones somáticas en el tumor deficiente en MMR, lo que sugiere que una parte considerable de la diversidad genética humana surge debido a errores de apareamiento que escapan a MMR. En apoyo de esta noción, observamos frecuencias de mutación muy similares en el ADN somático y de línea germinal del hipermutador, en las bases de datos 1000 Genomes Project y dbSNP de ratón (respectivamente el 71,5%, el 68,3%, el 66,9% y el 67,1% de todas las sustituciones representaron transiciones). En particular, la frecuencia de sustitución somática por unidad cromosómica (100 kb) en el hipermutador está fuertemente correlacionada con el número de líneas germinales correspondientes (R2= 0,90 y 1000 Genomes Project SNP (R2= 0,90) en la misma unidad, pero no con la frecuencia de sustitución somática en los genomas de adenocarcinoma de pulmón o melanoma (R2= 0,53 y 0,37).
Indeles somáticos en el hipermutador deficiente en MSH6
A continuación, evaluamos el patrón de indeles somático en el hipermutador. Como era de esperar, dado que la mayor parte de indeles se ubicaron en homopolímeros, se observó una fuerte correlación entre las repeticiones simples y la frecuencia de indeles (figura 2g). Casi todos los indeles afectaron a los homopolímeros A o T (94,0%; figura 2h), pero aunque el 92,2% de los homopolímeros consisten en bases A o T, los homopolímeros C o G parecen igualmente propensos a acumular indeles. Además, hasta el 96,4% de los indeles consistían en desplazamientos de marco de 1 o 2 pb (figura 2i), lo que confirma que MSH6 está involucrado principalmente en la reparación de indeles de 1 o 2 pb. Las deleciones fueron ligeramente menos frecuentes que las inserciones (47,7% frente a 52,3%; P < 10E-6). Al calcular para cada sustitución somática la distancia al indel somático más cercano, observamos que las sustituciones se ubicaron, respectivamente, 3,8 y 3,4 veces más frecuentemente dentro de una distancia < 5 o < 10 pb de lo esperado basándose en una distribución aleatoria de sustituciones e indeles (figura 2j). De forma similar, aunque no hubo evidencia de kataegis (tormentas somáticas) (Nik-Zainal et al., 2012), las sustituciones somáticas se agruparon 7,6 veces más frecuentemente que lo predicho por el modelado aleatorio (figura 2k). Se observó el mismo agrupamiento de sustituciones en los tumores competentes en MMR (no se muestra), aunque con una frecuencia general más baja, lo que sugiere que la aparición de estos agrupamientos está suprimida por MMR. Sorprendentemente, estas observaciones son similares a los genomas eucariotas, en los que el número de sustituciones se eleva cerca de otras sustituciones e indeles (McDonald et al., 2011; Tian et al., 2008).
Ejemplo 3. Secuenciación del exoma de tumores deficientes y competentes en la reparación de errores de apareamiento y sus muestras normales correspondientes
Seleccionamos 10 tumores EM y CCR deficientes en MMR adicionales caracterizados por la ausencia de MLH1, MSH2 o MSH6, así como 4 tumores competentes en MMR (tabla 9, tabla 13). Por lo tanto, en total, se recolectaron 14 pares tumor-normal para la secuenciación del exoma, incluidos 11 tumores endometriales (EM) y sus muestras de línea germinal correspondiente y 3 tumores colorrectales (CCR) y sus pares de línea germinal correspondiente. Todos los tumores eran primarios, no tratados previamente con quimioterapia. El ADN del tumor se obtuvo a partir de tejido tumoral recién congelado, mientras que el ADN de la línea germinal correspondiente para estas muestras se extrajo de glóbulos blancos periféricos. La información clínica detallada para todas estas muestras se enumera en la tabla 13. Además, se incluyeron en el análisis 5 líneas celulares de tumores endometriales primarios que son deficientes en MMR, de modo que se alcanzara un total de 16 muestras de tumores deficientes en MMR.
Tabla 13. Información clínica para muestras tumorales adicionales
Tumor Tipo Histopatología Grado Estadio 1 MMR- 2 Endometrio Carcinoma endometrioide 3 IIIa
2 MMR- 3 Endometrio Carcinoma endometrioide 2 Ib
3 MMR- 4 Endometrio Carcinoma endometrioide 3 II
4 MMR- 5 Endometrio Carcinoma endometrioide 2 Ia
5 MMR- 6 Endometrio Carcinoma seroso 3 Ib
6 MMR- 7 Endometrio Célula endometrioide/ clara 3 I a
7 MMR- 8 Endometrio Célula serosa/clara 3 Ib
8 MMR- 9 Colon Adenocarcinoma 3 IIa
9 MMR- 10 Colon Adenocarcinoma 2 IIIc
10 MMR- 11 Colon Adenocarcinoma 2 11 a
11 MMR+ 3 Endometrio Carcinoma endometrioide 1 IIIc
12 MMR+ 4 Endometrio Carcinoma seroso 3 IIIa
13 MMR+ 5 Endometrio Carcinoma mucinoso 2 IIIa
14 MMR+ 6 Endometrio Carcinoma endometrioide 1 Ia
3.1 Pruebas diagnósticas estándar
Las tablas 14 y 15 siguientes describen los resultados de pruebas diagnósticas estándar en la determinación de MSI (inmunohistoquímica de genes MMR MLH1, MSH2 y MSH6; estado de hipermetilación de las regiones promotoras de MLH1; inestabilidad microsatelital utilizando el panel Bethesda ampliado de 8 marcadores de repetición de dinucleótidos y 2 de mononucleótidos) realizados en los tumores endometriales y colon secuenciados. En los experimentos de inmunohistoquímica, un asterisco (*) indica una tinción nuclear positiva débil en una minoría de las células tumorales. La clasificación del estado de deficiencia en MMR se realizó mediante inmunohistoquímica de las principales proteínas MMR (MLH1, MSH2 y MSH6). Cuando cualquiera de estas proteínas estaba ausente en el núcleo de las células tumorales, el tumor se clasificó como deficiente en MMR (MMR-), de lo contrario, como competente en MMR (MMR+).
Tabla 14. Pruebas diagnósticas estándar para evaluar la deficiencia en MMR
Tumor IHC MLH1 IHC MSH2 IHC MSH6 MSI (Bethesda) Hipermetilación de MLH1 MMR- 2 -(*) -
MMR- 3 -
MMR- 4 - - - -MMR- 5 - - -MMR- 6 - -MMR- 7 - - - -
MMR- 8 - - - -MMR- 9 - N/A
MMR- 10 - N/A
MMR- 11 - N/A
(continuación)
Tumor IHC MLH1 IHC MSH2 IHC MSH6 MSI (Bethesda) Hipermetilación de MLH1 MMR+ 3 - -MMR+ 4 - -MMR+ 5 - -MMR+ 6 - -
Para la prueba de inestabilidad microsatelital, a continuación se enumeran los resultados detallados de todos los marcadores incluidos en el panel Bethesda ampliado.
Tabla 15. Datos sobre el panel Bethesda ampliado
Tumor MTD 25 MTD 26 D5S346 D17S250 D2S123 TGFB MTD 40 D18S58 D17S787 D18S69 MMR- 2 N/A N/A N/A - N/A - MMR- 3 - - - - -MMR- 4 - - - - - - N/A - - -MMR- 5 - N/A - - -MMR- 6 - - - - MMR- 7 - - - - - - - - - -MMR- 8 - - - - - - - - - -MMR- 9 - N/A MMR- 10 - - N/A MMR- 11 - - N/A MMR+ 3 - - - - - - - - - -MMR+ 4 - - - - - - - - - -MMR+ 5 - - - - - - - - - -MMR+ 6 - - - - - - - - - -
Sorprendentemente, los tumores MMR- 4, 7 y 8 fueron negativos a MLH1, MSH2 o MSH6 según lo evaluado por inmunohistoquímica, pero no se identificaron como tumores positivos a MSI utilizando el panel Bethesda. Esta observación muy probablemente ilustra que el panel Bethesda actual para el diagnóstico de MSI no reconoce varios tumores positivos a MSI. Sin embargo, utilizando nuestro panel mejorado de 56 marcadores (tabla 3 y ejemplo 7), pudimos confirmar que estos tumores deficientes en MMR eran positivos a MSI.
3.2 Secuenciación, mapeo y llamada de variantes para exomas secuenciados con la tecnología HiSeq2000 de Illumina
La secuenciación del exoma del ADN del tumor y de la línea germinal correspondiente mediante una tecnología de secuenciación independiente (Illumina®) revelaron que cada tumor deficiente en MMR contenía en promedio 1.497 eventos somáticos frente a 39 para los tumores competentes en MMR (aumento de 38,9 veces; figura 3a). En los tumores deficientes en MMR, una gran mayoría de estos (78,4%) representaron sustituciones (figura 3b), la mayor parte de las cuales fueron transiciones A:T>G:C y G:C>A:T (81,5%). Las mutaciones restantes representaron indeles somáticos, que estaban muy enriquecidos en homopolímeros (55,9%).
En resumen, los exomas se capturaron utilizando el kit de enriquecimiento de exomas TruSeq de Illumina (8 rxns), después del enriquecimiento, las bibliotecas enriquecidas se sometieron a secuenciación por Illumina (HiSeq 2000). La secuenciación de extremos emparejados (2x75 pb) se realizó con kits TruSeq SBS. Se usó BWA para alinear las lecturas sin procesar de cada carril de secuenciación (en formato fastq) con el genoma de referencia humano (NCBI37/hg19) usando parámetros predeterminados. Las lecturas alineadas se procesaron y se clasificaron con SAMtools (v.0.1.13) y los duplicados de PCR se eliminaron con Picard MarkDuplicates (http://picard.sourceforge.net, v1.32). La recalibración de bases, el realineamiento local alrededor de indeles y la llamada de variantes de un solo nucleótido se realizaron utilizando el kit GenomeAnalysisToolKit (GATK v1.0.4487). Adicionalmente, también filtramos todas las variantes comunes de las listas de mutaciones somáticas. Esto se realizó utilizando varias pistas de datos, que se aplicaron a las listas de variantes utilizando el comando intersectBed de BEDTools (Quinlan y Hall, 2010). Las sustituciones somáticas y los indeles se validaron mediante genotipado por Sequenom MassARRAY. Los datos generales de mutación después del filtrado de calidad y la validación se proporcionan en la tabla 16.
Figure imgf000196_0001
Los efectos dependientes del contexto revelaron un fuerte efecto CG para las transiciones G:C>A:T (figura 3c). Curiosamente, las sustituciones de novo de la línea germinal identificadas por secuenciación del exoma mostraron efectos dependientes del contexto similares, lo que confirma la noción de que las mutaciones subyacentes a la variación genética humana y la enfermedad surgen a menudo debido a errores de apareamiento que escapan a la MMR (figura 3d). Además, aunque el número de eventos somáticos fue ligeramente superior en tumores CCR que en tumores EM (en promedio, 2278 frente a 1161 eventos), no observamos diferencias claras en el patrón de mutación entre ambos tipos de cáncer (no se muestra).
Asimismo, la estratificación de los patrones de mutación según la deficiencia de MLH1 o MSH2 no reveló diferencias obvias. En particular, aunque observamos que los indeles eran ligeramente más comunes en los microsatélites (12,0% y 11,2% frente al 5,4% en el exoma del hipermutador), los homopolímeros seguían siendo los más afectados (figura 3e), lo que confirma que los indeles en tumores deficientes en MLH1 o en MSH2 afectan preferentemente a los homopolímeros, en lugar de a los microsatélites.
Ejemplo 4. Selección clonal positiva y mutaciones recurrentes en tumores deficientes en MMR
4.1 Análisis de homopolímeros afectados de forma recurrente (mutaciones de punto caliente)
Mientras que la frecuencia de mutación observada en los exomas de tumores deficientes en MMR reveló evidencia de selección negativa, algunas mutaciones también pueden ser objeto de selección positiva. Es más probable que estas mutaciones aparezcan como mutaciones de punto caliente (recurrentes). Por lo tanto, evaluamos cuántos homopolímeros se vieron afectados de forma recurrente en tumores deficientes en MMR. Por lo tanto, los 10 exomas deficientes en MMR, junto con el exoma extraído del genoma completo del hipermutador, se analizaron para detectar la aparición de sustituciones e indeles recurrentes. Se generaron dos conjuntos de mutaciones recurrentes: datos para sustituciones o indeles recurrentes en al menos 3, o al menos 4 de 11 tumores.
Se detectaron mutaciones de punto caliente en 11 tumores deficientes en MMR. Se generaron listas de variantes para mutaciones recurrentes en tres (cuatro) o más muestras. En primer lugar intentamos excluir el hecho de que estas mutaciones de punto caliente representan errores de secuenciación. Existe la posibilidad de que las mutaciones de punto caliente sean falsos positivos, ya que pueden generarse mediante llamadas de variantes sistemáticas de falsos positivos en los tumores o mediante llamadas sistemáticas de falsos negativos en las muestras normales. Por lo tanto, realizamos una etapa de filtrado adicional. En particular, recopilamos todas las variantes identificadas en cada uno de los 11 exomas normales endometriales y 3 exomas normales colorrectales. Cada mutación de punto caliente que también estaba presente como una variante de la línea germinal en al menos uno de estos exomas se consideró un error sistemático y se eliminó del conjunto de datos. Esto dio como resultado una gran reducción de las sustituciones recurrentes, mientras que el efecto sobre los indeles recurrentes fue muy limitado (tabla 17).
Tabla 17. Filtrado de falsos positivos a partir de mutaciones de punto caliente
Figure imgf000197_0001
Las 5 sustituciones de punto caliente en 3 o más tumores se sometieron a validación por Sequenom. De estas sustituciones, solo se confirmó una. Además, intentamos validar todos los indeles recurrentes en cuatro o más muestras. De estos 44 indeles recurrentes, 26 indeles pudieron genotiparse con éxito y todos se confirmaron mediante el genotipado de Sequenom (tasa de validación del 100%). Dada la alta tasa de validación de indeles somáticos recurrentes y no recurrentes, no buscamos más validaciones para los indeles restantes (n = 18), pero consideramos todos los indeles recurrentes como verdaderos indeles positivos.
Dado que en los tumores deficientes en MMR los indeles se limitaron principalmente a homopolímeros, limitamos nuestros análisis a indeles que afectan de forma recurrente a regiones homopoliméricas. Realizamos un cribado de los 30.111 homopolímeros exónicos capturados con TruSeq de Illumina en cada uno de los 11 tumores deficientes en MMR. La tabla 18 enumera el número de homopolímeros que se vieron afectados de forma recurrente en tumores deficientes en MMR.
Tabla 18. Lista de homopolímeros con indeles en regiones exónicas en 11 tumores deficientes en MMR
Número de tumores afectados Número de homopolímeros afectados
1 1.238
2 173
3 38
4 26
5 8
6 5
7 3
8 1
9 1
En total, 1.493 homopolímeros se vieron afectados al menos una vez, 255 se vieron afectados al menos dos veces, 82 se vieron afectados tres veces y 44 se vieron afectados de forma recurrente en al menos 4 de 11 tumores. Estos 82 homopolímeros afectados se consideraron mutaciones de punto caliente. 4 de 82 mutaciones de punto caliente se ubicaron en genes del censo de cáncer conocidos (RPL22, MSH6, MLL3 y BRAF). 41 de 82 mutaciones de punto caliente se ubicaron en genes previamente implicados en tumores deficientes en MMR u otros tipos de cáncer. La lista de estas mutaciones se proporciona en la tabla 7. El análisis se amplió analizando adicionalmente 5 líneas de células tumorales primarias. Esto dio lugar a un total de 149 homopolímeros exónicos afectados de forma recurrente en al menos 4 de 16 tumores deficientes en MMR. Los detalles de estas mutaciones de punto caliente se pueden encontrar en la tabla 2. Cuando se aplicó una etapa de filtrado adicional, excluyendo no solo las variantes comunes presentes en la base de datos 1000 Genomes y la base de datos dbSNP, sino también las variantes en nuestra base de datos patentada de más de 100 individuos, se obtuvieron 103 homopolímeros exónicos afectados de forma recurrente, que se enumeran en la tabla 5.
De los 44 homopolímeros afectados en al menos 4 de los 11 tumores, 21, 18, 1 y 4 consistían en tramos A, T, G o C, respectivamente. Para los 82 homopolímeros afectados en al menos 3 de los 11 tumores, respectivamente 34, 31, 7 y 10 consistieron en tramos A, T, G o C (no se muestra). La longitud de los homopolímeros afectados de forma recurrente varió de 7 nucleótidos a 25 nucleótidos. Sin embargo, se puede observar un fuerte sesgo hacia homopolímeros con una longitud de 7-11 nucleótidos afectados en al menos 3 de 11 veces (no se muestra).
4.2 Frecuencia prevista frente a observada de indeles recurrentes
Para evaluar si los indeles recurrentes aparecen como consecuencia de la selección positiva o aparecen aleatoriamente como resultado de una mayor frecuencia de indeles en los tumores deficientes en MMR, calculamos el número esperado de indeles recurrentes basándonos en la frecuencia de indeles observada en el genoma completo en el hipermutador. Dado que el deslizamiento de la polimerasa durante la replicación es más probable que ocurra en homopolímeros largos, se espera que las mutaciones de indeles afecten más fácilmente a los homopolímeros de mayor longitud. Por lo tanto, calculamos la frecuencia esperada (fe,genoma) para cada longitud de homopolímero de entre 6 y 11 bases, ya que estos representan la mayor parte de los homopolímeros exónicos (99,7%, figura 4a).
Tabla 19. Distribución de homopolímeros en función de la longitud del homopolímero
Figure imgf000198_0001
Tal como se ha mencionado, la frecuencia observada en el hipermutador (fe,genoma) se utilizó para calcular el número esperado de homopolímeros afectados en el exoma (multiplicando el número esperado de indeles por homopolímero por el número de homopolímeros de esta longitud en el exoma). Después calculamos el número de homopolímeros de una longitud determinada que se ven afectados en los 11 tumores deficientes en MMR. Este número se promedia con respecto a los 11 exomas deficientes en MMR y se denomina frecuencia observada (fo,exoma) de un homopolímero de una longitud determinada que se ve afectado. Después se calculan las veces del enriquecimiento con respecto al número esperado de indeles en homopolímeros de esta longitud como la relación de las frecuencias observadas y esperadas. Hubo un enriquecimiento débil en el número de indeles que aparecen en homopolímeros de longitud 8-11 en estos exomas (véase la tabla 20).
Tabla 20
Longitud del Número esperado de Número total de Frecuencia observada Veces de homopolímero homopolímeros afectados homopolímeros en el exoma (fo,exoma) enriquecimiento en el exoma (exoma)
6 28,5 24.008 1,19E-03 1,0
7 33,6 4.787 7,02E-03 1,5
8 25,8 938 2,75E-02 1,8
9 10,8 205 5,24E-02 2,1
10 6,5 60 1,08E-01 3,8
11 4,1 24 1,72E-01 4,7
Suponiendo que cada homopolímero de la misma longitud tiene una probabilidad igualmente alta de verse afectado, la probabilidad de que los homopolímeros se vean afectados en dos o tres tumores independientes se puede calcular como el producto de la probabilidad de que un homopolímero se vea afectado en un tumor (es decir, la frecuencia observada en el genoma completo fgenoma).
Como tal, la frecuencia esperada de que un homopolímero se vea afectado en tres tumores se calculó de la forma siguiente:
fe,recurrente en 3 = (fe,genoma)3
y para que un indel se vea afectado en cuatro tumores:
fe,recurrente en 4 = (fe,genoma)4
Para calcular el número esperado de indeles recurrentes en tres, respectivamente cuatro, tumores, multiplicamos las frecuencias esperadas por el número de homopolímeros en el exoma, y por el número de formas en que podemos extraer 3, resp. 4, muestras de 11 muestras (es decir, el número de combinaciones C(3,11) y C(4,11)). Por lo tanto, el número de indeles recurrentes esperados en 11 tumores se calcula de la forma siguiente:
Nrecurrente en 3 = C(3,11) * Nhomopolímeros * fe,recurrente en 3
Nrecurrente en 4 = C(4,11) * Nhomopolímeros * fe,recurrente en 4
Para indeles recurrentes en tres tumores, los datos son los siguientes:
Tabla 21. Indeles esperados y observados en homopolímeros recurrentes en 3 de 11 tumores
Longitud del Número observado de indeles Número esperado de
homopolímero recurrentes indeles recurrentes Veces de aumento
6 0 6,51 E-03 N/A
7 9 7,84E-02 114,80
8 25 5,76E-01 43,38
9 18 5,54E-01 32,47
10 16 2,27E-01 70,56
11 11 1,93E-01 57,12
Aunque ya observamos un enriquecimiento de indeles recurrente en tres muestras, el enriquecimiento de indeles recurrente en cuatro o más muestras es mucho más fuerte:
Tabla 22. Indeles esperados y observados en homopolímeros recurrentes en 4 de 11 tumores
Longitud del Número observado de indeles Número esperado de
homopolímero recurrentes indeles recurrentes Veces de aumento
6 0 1,54E-05 N/A
7 1 7,26E-04 1377,52
8 11 1,79E-02 615,67
9 9 2,82E-02 319,62
10 10 1,29E-02 776,36
11 11 1,41 E-02 782,52
En resumen, aunque la mayor parte de los homopolímeros presentes en el exoma constan de 6 nucleótidos, la mayor parte de los homopolímeros afectados de forma recurrente presentaron una longitud de 8-11 nucleótidos. Por lo tanto, evaluamos la posibilidad de que estos homopolímeros se vieran afectados de forma recurrente debido a su mayor longitud. Calculamos la probabilidad en el genoma completo de que un homopolímero de una longitud específica se viera afectado por un indel en el hipermutador y encontramos que el número de mutaciones observadas en el exoma era mayor de lo esperado para cada longitud de homopolímero. También calculamos la probabilidad en el genoma completo de observar indeles recurrentes en homopolímeros de una longitud específica y encontramos que el número observado de mutaciones recurrentes exónicas en > 2 o > 3 tumores era mucho mayor de lo esperado para cada longitud de homopolímero, lo que indica que los homopolímeros exónicos no se vieron afectados de forma recurrente debido al aumento de la longitud. Esto indica que estos indeles en estos homopolímeros se seleccionan positivamente en estos cánceres.
Conclusión
En total, 1.238 de 30.111 homopolímeros se vieron afectados una vez, mientras que 173 homopolímeros se vieron afectados dos veces. Además, 82 homopolímeros se vieron afectados por el mismo indel en al menos 3 tumores. De ellos, 27 y 8 homopolímeros estaban presentes en 4 o 5 tumores, y 5 estaban presentes en 6 tumores (tabla 7 y tabla 23). Por el contrario, solo se identificó una única sustitución (G13D en KRAS) en más de un tumor deficiente en m Mr .
Tabla 23. Genes afectados por indeles en al menos 3 de los 11 exomas deficientes en MMR
Número de muestras
afectadas Genes afectados*
9 SETD1B
8 CASP5
7 RPL22, RBMXL1
6 SEC31A, OR7E24, MSH6, CCDC150, MYL1, ASTE1
5 SLC22A9, CNOT2, C15orf40, LTN1, KIAA2018, RGS12, RNF145, PHF2
4 WDTC1, RNPC3, FAM111B, NDUFC2, CASP5, TMBIM4, MIS18BP1, PRRT2, CTCF,
KIAA0182, TAF1B, SMC6, SLC35F5, ACVR2A, COBLL1, DDX27, CDH26, TGFBR2,
MBD4, ATR, EXOSC9, TTK, GRIK2, KIAA1919, MAP3K4, TMEM60
3 ARV1, KCNMA1, HPS1, ADD3, UVRAG, CD3G, SRPR, WNK1, CHD4, SENP1,
MYO1A. GLI1, CCDC168, PIGB, TMEM97, COIL, RNF43, ELAVL3, RBM43, NBEAL1, NRIP1, P4HTM, DOCK3, RG9MTD1, ZBTB20, FETUB, CLOCK, MYO10, MSH3,
SPINK5, IGF2R, BRAF, MLL3, PRKDC, UBR5, AQP7, PRRG1, F8
Ejemplo 5. Los indeles recurrentes en las 3' y 5' UTR afectan a los homopolímeros largos
Dado que las 5' y 3' UTR son críticas para determinar la expresión génica, también evaluamos mutaciones en estas regiones. En particular, utilizando datos del exoma de tumores deficientes en MMR, pudimos evaluar de forma fiable hasta el 83,9% y el 91,9% de estas regiones.
5.1 Indeles recurrentes en regiones reguladoras
Para evaluar si cualquiera de las regiones 5' UTR y 3' UTR se vieron afectadas por mutaciones recurrentes, se cribaron 5.367 y 59.259 homopolímeros ubicados en las 5' UTR y 3' UTR capturadas en el exoma de 10 tumores deficientes en MMR, respectivamente. Estos homopolímeros también se cribaron en las 5' UTR y las 3' UTR de la muestra de hipermutador con el genoma completo secuenciado, de modo que el número total de tumores en los que pudimos cribar las 5' y 3' UTR fue de 11 tumores deficientes en MMR. Eliminamos cada mutación de punto caliente que también estaba presente como una variante de la línea germinal en al menos una de 11 muestras deficientes en MMR.
Los indeles recurrentes en homopolímeros fueron mucho más frecuentes en regiones 5' y 3' UTR de lo esperado a partir de las observaciones en el exoma: en las regiones 3' UTR observamos 1.142 indeles recurrentes en al menos 4 de 11 tumores y 1.812 en al menos 3 de 11 tumores, mientras que en las 5' UTR observamos 50 indeles recurrentes en al menos 4 de 11 tumores y 89 en al menos 3 de 11 tumores. Estos indeles recurrentes se muestran en la tabla 6. Cuando se tomaron en cuenta las 5 muestras adicionales deficientes en MMR, se obtuvieron como resultado 2.648 indeles recurrentes en 4 de 16 tumores para las regiones 3' UTR y 155 indeles recurrentes en 4 de 16 tumores para las regiones 5' UTR. Esta lista de indeles recurrentes frecuentes en homopolímeros en regiones UTR (presentes en al menos 4 de los 16 tumores deficientes en MMR) se muestra en la tabla 1. En este caso también, una etapa de filtrado adicional, que excluye no solo las variantes comunes presentes en la base de datos 1000 Genomes y la base de datos dbSNP, sino también variantes presentes en nuestra base de datos patentada de más de 100 individuos, redujeron el número de homopolímeros afectados de forma recurrente en las regiones UTR a 1.314 indeles recurrentes en 4 de 16 tumores para las regiones 3' UTR y 88 indeles recurrentes en 4 de cada de 16 tumores para las regiones 5' UTR, que se enumeran en la tabla 4.
Por el contrario, las sustituciones recurrentes fueron muy raras: se encontraron 3 sustituciones recurrentes en al menos 4 de 11 tumores y 18 en al menos 3 de 11 tumores, mientras que en las regiones 5' UTR se observó 1 sustitución recurrente en tres muestras, y no se encontraron sustituciones en 4 o más muestras.
5.1.1. Longitud del homopolímero y recurrencia de la mutación somática en regiones exónicas, 5' UTR y 3' UTR
Para evaluar si los indeles recurrentes en las regiones 5' y 3' UTR también son resultado de la selección clonal positiva o simplemente aparecen debido al contenido de homopolímeros, evaluamos la distribución de longitud de los homopolímeros en función de su ubicación en los exones, 5' UTR y 3' UTR. Observamos que hay muchos más homopolímeros en las 3' UTR y mucho menos homopolímeros en las 5' UTR. Los homopolímeros en la 3' UTR también fueron más largos que en el exoma. Por ejemplo, el exoma contiene 29.733 (98,7%) homopolímeros de longitud < 9 nucleótidos, mientras que las 5' Ut R y las 3' UTR contienen 4.857 (90,5%) y 49.769 (84,0%) homopolímeros de longitud < 9 nucleótidos, respectivamente. A pesar del mayor número de homopolímeros de longitud corta (6 o 7) en la 3' UTR que en el exoma (no se muestra), el número de homopolímeros afectados en la 3' UTR y el exoma fue más o menos igual (no se muestra). En la 3' UTR se ubicaron muchos indeles en los homopolímeros largos, es decir, homopolímeros con una longitud de 9, 10, 11, >= 12 pares de bases.
Al evaluar los indeles recurrentes en las 5' y 3' UTR y el exoma, observamos que también el número de indeles recurrentes fue mucho mayor en la 3' UTR que en la 5' UTR o el exoma. Los indeles recurrentes en las 3' UTR afectaron principalmente a los homopolímeros con una longitud > 9 pares de bases. Sorprendentemente, a pesar del mayor número de homopolímeros de longitud 7 u 8 en la 3' UTR que en el exoma y a pesar del mayor número de indeles en homopolímeros de longitud 7 u 8 en la 3' UTR que en el exoma, hubo más indeles recurrentes que afectaban a homopolímeros de longitud 7 u 8 en el exoma que en la 3' UTR. Los indeles recurrentes en la 3' UTR afectaron principalmente a los homopolímeros de longitud 11 y >= 12.
Para verificar que el aumento de la fracción de homopolímeros afectados de forma recurrente con una longitud < 9 en el exoma no se debe a diferencias generales en las distribuciones de longitud de los homopolímeros en las diferentes regiones, corregimos la frecuencia de indeles (es decir, la fracción de homopolímeros afectados) en homopolímeros de longitud < 9 por la aparición general de estos homopolímeros en las diferentes regiones. La fracción corregida se calculó de la forma siguiente:
Fracción
Fracción corregida =
Figure imgf000201_0001
Esta frecuencia de mutación corregida se calculó después para las tres regiones diferentes (exoma, 5' UTR y 3' UTR). Después de esta corrección, se observó aún el enriquecimiento para homopolímeros recurrentes más cortos en el exoma (39,2% con longitud < 9) en comparación con las 5' (19,5%) y 3' UTR (2,2%). Estos datos indican claramente que la longitud del homopolímero determina críticamente qué homopolímeros se ven afectados de forma recurrente en las regiones 5' y 3' UTR, mientras que en el exoma, la longitud de homopolímeros y el efecto de la mutación sobre la ventaja del crecimiento clonal determinan qué homopolímeros se ven afectados de forma recurrente. La tabla 24 muestra una descripción general de los datos descritos en los párrafos anteriores.
Tabla 24. Distribución de homopolímeros en función de su longitud
Exoma 5' UTR 3' UTR
Número de homopolímeros afectados de forma recurrente 82 89 1812
Número de homopolímeros afectados de forma recurrente con longitud < 9 34 3 71
Porcentaje de homopolímeros afectados de forma recurrente con longitud < 9 41,5% 3,4% 3,9%
Número de homopolímeros con longitud < 9 29.733 4.857 49.769
Porcentaje de homopolímeros afectados de forma recurrente con longitud < 9
corregido por el número de homopolímeros con longitud < 9 39,2% 19,5% 2,2%
Por lo tanto, en resumen, en las 5' y 3' UTR, los homopolímeros son más largos que en las regiones codificantes (figura 4a); además, los homopolímeros más largos en las UTR tienen una mayor propensión a acumular indeles (figura 4b). En conjunto, esto da lugar a una frecuencia de indeles más alta en las 5' y 3' UTR que en las regiones codificantes (aumento de 3,8 y 10,7 veces, respectivamente; figura 4c). Sin embargo, en las UTR, las mutaciones de punto caliente se reducen en los homopolímeros largos. Por ejemplo, solo estaban presentes 3 (de 89; 3,4%) y 71 (de 1.812; 3,9%) mutaciones de punto caliente en homopolímeros afectados de las 5' y 3' UTR < 9 pb de longitud (tabla 24), mientras que en regiones codificantes había presencia de hasta 34 (de 82; 41,5%) de dichas mutaciones de punto caliente (figura 4d). En general, esto sugiere que la longitud del homopolímero determina críticamente qué homopolímeros se ven afectados frecuentemente en las regiones 5' y 3' UTR, mientras que en las regiones codificantes, el impacto de la mutación sobre la ventaja del crecimiento clonal codetermina qué homopolímero se ve afectado con mayor frecuencia.
Ejemplo 6. Perfiles de expresión génica de genes mutados de forma recurrente
Dado que hemos planteado la hipótesis de que las mutaciones recurrentes están relacionadas con la selección positiva debido a la ventaja de crecimiento para el tumor, los genes afectados por estas mutaciones recurrentes deberían al menos expresarse en tejido endometrial normal. También se espera que al menos un subconjunto de estos genes se pueda encontrar en otros tumores deficientes en la reparación de errores de apareamiento, y que las mutaciones de punto caliente cambiarán la expresión del gen afectado. Por lo tanto, analizamos los perfiles de expresión de genes afectados por mutaciones recurrentes tanto en el contexto de la expresión específica del endometrio como en el contexto de genes expresados diferencialmente en tumores colorrectales deficientes en MMR.
6.1 Expresión génica en endometrio normal
Los datos de expresión de genes en tejido endometrial normal se descargaron del Atlas de expresión génica23 (http://www.ebi.ac.uk/gxa/) utilizando la consulta "todos los genes sobreexpresados/subexpresados/expresados no diferencialmente en Homo sapiens, endometrio". Esta consulta dio como resultado 14.664 genes, de los cuales 9.021 se sobreexpresaron en el endometrio normal, 463 se subexpresaron y 5.180 mostraron expresión no diferencial. Dado que la sobreexpresión y la subexpresión se calcularon con respecto a los perfiles de expresión génica general en diferentes tipos de tejido, es difícil evaluar si los genes subexpresados están efectivamente ausentes (no expresados) o simplemente expresados a un nivel inferior. Sin embargo, para los genes sobreexpresados significativamente en el tejido endometrial, podemos argumentar con seguridad que al menos desempeñan un papel dentro del endometrio normal. Por lo tanto, en este análisis nos hemos limitado a los genes sobreexpresados en el endometrio normal.
Las mutaciones de diferentes conjuntos de datos se compararon con los datos de expresión derivados: todos los genes mutados en tumores competentes en MMR (genes MMR+), todos los genes mutados en tumores deficientes en MMR (genes MMR-), todos los genes afectados de forma recurrente en tumores deficientes en MMR (definidos como 3 de 11 muestras, genes recurrentes), y finalmente todos los indeles recurrentes en regiones exónicas (exónicos recurrentes). Este análisis indicó que las mutaciones recurrentes (de punto caliente) estaban sobrerrepresentadas en genes que estaban sobreexpresados en tejido endometrial normal. Los datos completos para estos análisis se muestran en la tabla 25.
Tabla 25. Expresión génica en endometrio normal
Conjunto de Genes Genes Genes Exónicos datos deficientes en competentes recurrentes recurrentes MMR en MMR
Genes afectados N/A 7.084 380 994 82 Genes en el conjunto de datos 14.664 5.303 243 750 65 Sobreexpresados 9.021 (61,5%) 3.411 (64,3%) 142 (58,4%) 476 (63,5%) 57 (87,7%) Subexpresados 463 (3,2%) 208 (3,9%) 5 (2,1%) 30 (4,0%) 2 (3,1%) Expresados no diferencialmente 5.180 (35,3%) 1.684 (31,8%) 96 (39,5%) 244 (32,5%) 6 (9,2%)
Análisis de genes específicos de cánceres colorrectales inestables en microsatélites
Los genes expresados diferencialmente entre cánceres colorrectales inestables en microsatélites (MSI-H) y estables en microsatélites (MSS) se derivaron de un estudio de Banerjea et al.22. En este estudio, se analizaron 133 tumores colorrectales, de los cuales 29 (22%) tumores se identificaron como MSI-H. Los datos de expresión génica se derivaron de chips Affymetrix HG-U133A. El conjunto de datos derivado contiene 4.874 genes expresados diferencialmente entre cánceres estables e inestables en microsatélites (P < 0,05, tasa de descubrimiento falso de Benjamini y Hochberg).
Las mutaciones de diferentes conjuntos de datos se compararon con los datos de expresión derivados: todos los genes mutados en tumores competentes en MMR (genes MMR+), todos los genes mutados en tumores deficientes en MMR (genes MMR-), todos los genes afectados de forma recurrente en tumores deficientes en MMR (definidos como 3 de 11 muestras, genes recurrentes), y finalmente todos los indeles recurrentes en regiones exónicas (exónicos recurrentes). Este análisis reveló que las mutaciones de punto caliente se enriquecieron entre el conjunto de genes expresados diferencialmente en tumores inestables en microsatélites.
Tabla 26. Análisis de genes específicos para cánceres colorrectales con MSI
Conjunto de datos (n = 4.874 genes) Genes Genes Genes Exónicos deficientes en competentes en recurrentes recurrentes MMR MMR
Genes en el conjunto de datos 7.084 380 994 82 Expresados diferencialmentes en MSI-H 1.524 (21,5%) 63 (16,6%) 211 (21,2%) 28 (34,1%)
Resumen
Utilizando datos de expresión disponibles públicamente del Atlas de expresión génica (Kapushesky et al., 2010), evaluamos si los genes afectados por la misma mutación en al menos 3 tumores deficientes en MMR (en lo sucesivo, mutaciones de punto caliente) se expresaron en tejido EM normal. De todos los genes mutados en tumores competentes en MMR y deficientes en MMR, el 58% y el 64% se expresaron en tejido EM en comparación con el 88% de los genes afectados por mutaciones de punto caliente (tabla 25). Se obtuvieron datos similares para tejido de mucosa normal (no se muestran). Además, al evaluar las diferencias de expresión entre tumores deficientes en MMR y tumores competentes en MMR (Banerjea et al., 2004), observamos que el 20% de los genes afectados por mutaciones no de punto caliente frente al 32% de los genes afectados por mutaciones de punto caliente se expresaron de forma diferencial. Por lo tanto, las mutaciones de punto caliente afectan preferentemente a genes que se expresan en tejido normal y alteran su expresión, lo que indica que son el resultado de una selección clonal positiva en el tumor.
Ejemplo 7. Las mutaciones recurrentes detectan de forma fiable MSI en varios tipos de tumores
El panel Bethesda ampliado, que consiste en 8 marcadores de microsatélites y 2 marcadores de homopolímeros, se utiliza actualmente para evaluar el diagnóstico de MSI como un marcador de deficiencia de MMR915. Dado que estos marcadores no se seleccionaron en función de la frecuencia relativa con la que afectan a los tumores MMR, este panel a veces no detecta los tumores MMR24. Por lo tanto, evaluamos si las mutaciones recurrentes podrían mejorar la detección de MSI.
7.1 onstrucción de un panel de diagnóstico
Hay dos criterios por los que creemos que es posible mejorar el panel de diagnóstico que se utiliza actualmente para detectar inestabilidad microsatelital. En primer lugar, determinamos mutaciones recurrentes en tumores deficientes en MMR de una forma no sesgada: mediante la realización de experimentos de secuenciación del genoma completo y del exoma y simplemente observando qué posiciones se vieron afectadas de forma recurrente. La detección de forma no sesgada sugiere que las mutaciones de punto caliente más frecuentes serán las más sensibles para detectar MSI. En segundo lugar, la mayor parte de los indeles recurrentes que identificamos estaban ubicados en la 3' UTR. Los indeles recurrentes en las 5' y 3' UTR no se someten a una selección positiva estricta, pero están determinados principalmente por la longitud del homopolímero afectado, y es poco probable que se produzcan enriquecimientos específicos de tejido. Estos dos criterios aseguran que i) hemos elegido marcadores que, sin un conocimiento a priori de su función, se ven afectados de forma recurrente en múltiples muestras tumorales y ii) tienen una serie de marcadores que probablemente sean independientes del tipo de cáncer. Para el último, los indeles seleccionados de las 5' y 3' UTR pueden ser más útiles.
Para obtener la mayor sensibilidad, solo usamos mutaciones que aparecen en 4 o más muestras. Para los indeles recurrentes de 5' y 3' UTR, se dio prioridad a los indeles que afectaban a 5 o más muestras. Los 44 indeles exónicos recurrentes, 1.142 indeles de 3' UTR recurrentes y 50 indeles de 5' UTR recurrentes resultantes se utilizaron para diseñar un panel basado en Sequenom para detectar deficiencia en MMR. Dado que los indeles recurrentes se ubicaron en regiones homopoliméricas, el diseño de cebadores de una PCR multiplex de Sequenom fue complejo. Después de amplios experimentos de optimización, se generaron con éxito seis ensayos que genotipaban 56 mutaciones de punto caliente. De las 56 mutaciones de punto caliente, 11 se localizaron en exones, 40 en 3' UTR y 5 en 5' UTR, respectivamente. Nos referimos a este panel como el panel de 56 marcadores. Los detalles completos de estas 56 mutaciones se pueden encontrar en la tabla 3.
7.2 Evaluación diagnóstica de MSI en tumores endometriales
A continuación, el panel de 56 marcadores se aplicó a una serie adicional de 114 tumores endometriales resecados quirúrgicamente no seleccionados, que consistían en 7 carcinomas endometriales de células claras, 69 endometrioides, 18 endometrioides serosos mixtos, 10 serosos y 10 no clasificados. Todos los tumores eran tumores endometriales primarios no tratados previamente con quimioterapia. Se dispuso de tejido recién congelado para cada uno de estos tumores. La tasa de éxito de genotipado de los marcadores seleccionados fue alta (en promedio el 98,7%). El número de marcadores positivos para una muestra varió entre 0 y 33, con un promedio general de 6,5 marcadores positivos por muestra. De forma análoga al panel Bethesda, definimos tres categorías de inestabilidad microsatelital: estable en microsatélites (MSS, 0 de 10 marcadores en Bethesda, 0 o 1 de 56 marcadores en el panel de 56 marcadores), baja inestabilidad microsatelital (MSI-L, 1-2 de 10 marcadores en el panel Bethesda, entre 2 y 9 marcadores en un panel de 56 marcadores) y alta inestabilidad microsatelital (MSI-H, 3 o más de 10 marcadores en Bethesda, 10 o más de 56 en un panel de 56 marcadores). Según estas categorías para el panel de 56 marcadores, 65 tumores (57,0%) se definen como MSS. 33 tumores (29,0%) y 16 tumores (14,0%) se definen como MSI-H y MSI-L respectivamente. De estos 33 tumores MSI-H, Bethesda identificó 29 tumores como MSI-H (> 2 marcadores positivos), 3 tumores como MSI-L y un tumor como MSS. A la inversa, Bethesda no identificó ningún tumor MSI-H que no fuera identificado por nuestro panel de mutaciones de punto caliente (tal como se muestra en la figura 5). Este resultado muestra que el panel de 56 marcadores tuvo un mejor rendimiento que el panel Bethesda para esta serie de tumores endometriales. Los datos de los tumores colorrectales son comparables (no se muestran).
7.3 Firmas de mutaciones en otros tipos de tumores
También aplicamos nuestro panel de 56 marcadores a otros tipos de tumores (tumores de ovario y leucemia). Se seleccionaron 4 muestras MSI-H, incluyendo 1 de tumor de ovario y 3 muestras de líneas celulares de leucemia (DND41, CCRF-CEM y SUPT1). Para evaluar si nuestras observaciones en tumores endometriales/colorrectales deficientes en MMR eran extrapolables a otros tipos de tumores, se secuenciaron el tumor de ovario MSI-H, dos tumores de ovario que se detectaron como MSS y sus muestras normales correspondientes, así como tres líneas celulares de leucemia MSI-H y una línea celular de leucemia MSS (RPMI-8402).
Los 3 pares de tumores de ovario normales fueron tumores primarios, no tratados previamente con quimioterapia, recolectados durante la cirugía. Se secuenció el exoma del tumor de ovario deficiente en MMR (MMR- Ovárico 1), junto con su ADN normal correspondiente, utilizando la captura TruSeq de Illumina. El mismo conducto de análisis que se describió anteriormente se utilizó para el análisis de estos datos del exoma. Los datos del exoma de dos tumores ováricos MMR+ (MMR+ Ovárico 1 y 2), junto con sus muestras normales correspondientes, se extrajeron de los datos existentes del genoma completo. En particular, ambos pares tumor-normal competentes en MMR ya estaban disponibles de otro proyecto y se secuenciaron utilizando Complete Genomics. Los datos de la secuencia del genoma completo se han depositado en el Archivo Europeo de Genomas y Fenomas con el número de acceso EGAS00001000158. Para estos genomas se utilizaron los mismos análisis que se describen en los Ejemplos anteriores del presente documento.
Además, se secuenció el exoma de 4 líneas celulares de leucemia utilizando captura de Nimblegen. Los exomas se capturaron utilizando Nimblegen SeqCap EZ Human Exome Library v2.0. Se construyeron bibliotecas de ADN de preenriquecimiento según el protocolo estándar de la Guía de preparación de muestras de ADN de extremos emparejados de Illumina. El enriquecimiento del exoma se realizó según las instrucciones del fabricante. Se realizó una ronda (72 horas) de hibridaciones basadas en cebo biotinilado, seguida de unión de perlas magnéticas de estreptavidina, una etapa de lavado y una etapa de elución. Se realizó un enriquecimiento por PCR de 18 ciclos después de la elución y las bibliotecas enriquecidas se sometieron a secuenciación de Illumina (HiSeq 2000). La secuenciación de extremos emparejados (2 x 51 pb) se realizó con kits TruSeq SBS. Se utilizó un carril para un exoma. La información clínica detallada de todas las muestras se incluye en la tabla 27. La tabla 28 enumera todas las mutaciones encontradas en los genes MMR en todas las muestras de ovario y leucemia.
Tabla 27. Información clínica para tumores de ovario y de leucemia
Tumor Tipo Histopatología Grado Estadio MMR- Ovárico 1 Ovario Serosa 3 IIIc MMR+ Ovárico 1 Ovario Célula clara 3 IIc MMR+ Ovárico 2 Ovario Célula clara 3 IIIc DND41 (MMR- Leucemia 1) Sangre; Línea celular Leucemia linfoblástica aguda / / CCRF-CEM (MMR- Leucemia 2) Sangre; Línea celular Leucemia linfoblástica aguda / / SUPT1 (MMR- Leucemia 3) Sangre; Línea celular Leucemia linfoblástica aguda / / RPMI8402 (MMR+ Leucemia 1) Sangre; Línea celular Leucemia linfoblástica aguda / /
Tabla 28. Estado de mutación de genes MMR en tumores de ovario y de leucemia
Tumor Estado de mutación de genes MMR
MMR- Ovárico 1 MSH6: T1085fs
MMR+ Ovárico 1 /
MMR+ Ovárico 2 /
DND41 (MMR- Leucemia 1) MSH6: T1085fs; MSH3: K381fs
CCRF-CEM (MMR- Leucemia 2) MLH1: R100X
SUPT1 (MMR- Leucemia 3) MLH1: T495fs; MSH3: K381fs
RPMI-8402 (MMR+ Leucemia 1) /
En el tumor de ovario deficiente en MMR (MMR- Ovárico 1), se detectaron 2.045 nuevas sustituciones somáticas y 280 nuevos indeles somáticos. Debido a que la tasa de validación en los otros tumores deficientes en MMR era muy alta en tumores en los que se había secuenciado tanto el genoma completo como el exoma (véase anteriormente), no se realizó una validación adicional para este tumor. En los dos tumores de ovario competentes en MMR se detectaron respectivamente 32 y 42 sustituciones somáticas nuevas y 12 y 18 indeles somáticos nuevos. Debido a la baja tasa de validación en tumores competentes en MMR en general, todas las mutaciones somáticas en los dos tumores de ovario competentes en MMR se validaron utilizando Sequenom MassARRAY. Se confirmaron respectivamente 16 y 20 sustituciones como sustituciones verdaderas en los dos tumores de ovario competentes en MMR. No se confirmó ningún indel en ninguno de los tumores. Para estas mutaciones somáticas, observamos los mismos patrones que los observados en los tumores EM/CCR (datos no mostrados).
Los exomas de cuatro líneas celulares de leucemia se secuenciaron usando tecnología Illumina HiSeq, tal como se ha descrito anteriormente. Dado que no había muestras de ADN normal correspondiente disponibles para estas líneas celulares, no pudimos distinguir entre mutaciones somáticas o de línea germinal. Sin embargo, utilizando el conducto de filtrado de variantes comunes descrito anteriormente, pudimos eliminar las variantes que aparecen con más frecuencia. Tal como se observó anteriormente en tumores deficientes en MMR, los indeles se ubicaron principalmente en los homopolímeros de las muestras de leucemia deficientes en MMR. Por otra parte, la muestra competente en MMR no mostró este patrón (no se muestra).
Para las sustituciones, los patrones en muestras deficientes MMR y competentes en MMR fueron muy similares (no se muestra). En particular, estos patrones revelaron que la mayor parte de las sustituciones no estaban ubicadas en regiones de repetición. Al igual que en los tumores endometriales/colorrectales deficientes en MMR, las sustituciones en muestras deficientes en MMR se componían principalmente de transiciones (73,0% frente a 27,0% de transversiones, respectivamente).
Resumen
Seleccionamos 56 de las mutaciones de punto caliente más frecuentes identificadas por secuenciación del exoma: 45 se encontraban en las UTR, que son menos propensas a la selección clonal y, por lo tanto, podrían detectar MSI en tumores de diferentes tipos de tejidos, y 11 se encontraban en regiones codificantes. El genotipado de 114 tumores EM resecados quirúrgicamente para estas 56 mutaciones reveló que 33 (29,0%) tumores fueron positivos para > 10 marcadores (MSI-alta o MSI-H) y 16 (14,0%) tumores para 2 a 9 marcadores (MSI-baja o MSI-L). Los 65 tumores restantes (57,0%) fueron positivos para < 2 marcadores y eran tumores estables en microsatélites (MSS) (figura 5). De 33 tumores MSI-H, Bethesda identificó solo 29 tumores como MSI-H (> 2 marcadores positivos). Los 4 tumores discordantes contenían una mutación de desplazamiento de marco en MSH6 o eran deficientes para MSH6 en histopatología, lo que confirma que eran MSI-H. A la inversa, Bethesda no identificó ningún tumor MSI-H que no fuera identificado por nuestro panel de mutaciones de punto caliente.
Finalmente, evaluamos si las mutaciones de punto caliente también estaban presentes en tumores de ovario y en leucemia. En primer lugar, utilizando nuestro panel de 56 marcadores, seleccionamos 1 tumor de ovario y 3 líneas celulares de leucemia (DND41, CCRF-CEM y SUPT1) que fueron positivas para 20, 25, 23 y 21 marcadores respectivamente, así como 2 tumores de ovario y una línea celular de leucemia (RPMI8402) sin marcadores positivos. La secuenciación del exoma de los tumores de ovario y sus muestras normales correspondientes confirmó que el tumor de ovario MSI-H contenía sustancialmente más eventos somáticos que los 2 tumores de MSS correspondientes, incluida una deleción de desplazamiento de marco en MSH6. Aunque no pudimos distinguir entre mutaciones somáticas o de línea germinal en las líneas celulares de leucemia, ya que no se disponía de ADN de línea germinal correspondiente, las sustituciones y los indeles también fueron más frecuentes en las líneas celulares MSI-H (Nota S9). Se observaron dos mutaciones con pérdida de función en MLH1 y una deleción por desplazamiento de marco en MSH6, lo que confirma que las líneas celulares MSI-H eran deficientes en MMR. Al evaluar si las mutaciones recurrentes identificadas en tumores endometriales también estaban presentes en los genomas de ovario y leucemia, notamos que de 384 mutaciones recurrentes en tumores endometriales MMR-, 60, 25, 8 y 1 estaban presentes respectivamente en 1, 2, 3 o 4 tumores MMR- (no se muestra). Se observó un enriquecimiento más pronunciado al limitar las mutaciones recurrentes a las que estaban presentes en al menos 3 tumores endometriales. Finalmente, dado que los indeles recurrentes en el exoma se seleccionan positivamente por el tejido tumoral mientras que los indeles recurrentes en las 5' y 3' UTR dependen en gran medida de la longitud del homopolímero, los indeles presentes en las UTR podrían representar mejores marcadores de MSI.
Ejemplo 8. Los patrones de mutación de tumores deficientes en MMR afectan a la reparación de roturas de doble hebra de ADN
Para explorar la relevancia biológica de las mutaciones de punto caliente en tumores deficientes en MMR, realizamos análisis de vías con dos herramientas diferentes, a saber, IPA® y GenomeMuSiC. Estas dos herramientas utilizan cuatro bases de datos de vías diferentes, es decir, las bases de datos IPA, KEGG, BioCarta y Reactome. El uso de múltiples herramientas y bases de datos nos permitió obtener una impresión detallada de las vías afectadas.
8.1. Análisis de vías utilizando IPA® y GenomeMuSiC
El análisis de vías de ingenio (IPA)®, http://www.ingenuity.com/) permite la identificación de las vías biológicas más relevantes para los genes de interés. El análisis de vías de todos los genes con indeles somáticos (3.022 indeles en 2.231 genes, excluyendo los indeles presentes en los genes MMR, porque estábamos interesados en mutaciones secundarias resultantes de la deficiencia de MMR) usando IPA® reveló que 24 vías están significativamente enriquecidas (P < 0,05) (no se muestra). El "Papel de BRCA1 en la respuesta al daño al ADN" y la "Reparación de rotura de doble hebra (DSB) de ADN por recombinación homóloga (HR)" se clasificaron en la posición 1 y 3 respectivamente. Si se restringe la lista de genes de interés a los genes que portan las mutaciones de punto caliente solamente (1.382 indeles en 452 genes), se revelaron 13 vías significativamente enriquecidas tal como se muestra en la tabla 29. Las vías de "Papel de BRCA1 en la respuesta al daño al ADN" y de "Regulación del punto de control de ADN G2/M" se clasificaron en la posición 1 y 2, respectivamente.
Tabla 29. Análisis de la vía de los genes portadores de mutaciones de punto caliente
Clasificación Vía Valor P
1 Papel de BRCA1 en respuesta al daño al ADN 1,96E-03
2 Ciclo celular: regulación del punto de control de daño al ADN G2/M 3,08E-03
3 Señalización de P53 5,04E-03
4 Señalización de GADD45 9,00E-03
5 Biosíntesis de D-mio-inositol-trifosfato 9,00E-03
6 Señalización de proteína quinasa A 1,33E-02
7 Señalización de PTEN 2,00E-02 (continuación)
Clasificación Vía Valor P 8 Biosíntesis del cofactor de tio-molibdeno 2,45E-02 9 Salvamento y modificación del lipoato 2,45E-02 10 Reparación de rotura de doble hebra de ADN por recombinación homóloga 3,89E-02 11 Señalización hereditaria de cáncer de mama 4,21 E-02 12 Mecanismos moleculares de cáncer 4,42E-02 13 Biosíntesis e incorporación de lipoato II 4,83E-02
En resumen, IPA® reveló que el "Papel de BRCA1 en la respuesta al daño al ADN" era la principal vía enriquecida utilizando dos conjuntos diferentes de genes de interés, es decir, todos los genes que portan indeles somáticos y todos los genes con mutaciones de punto caliente. La "Regulación del punto de control del ADN G2/M" y la "Reparación de rotura de doble hebra (DSB) de ADN por recombinación homóloga (HR)" también fueron muy significativas.
Se realizó un análisis similar utilizando GenomeMuSiC (http://gmt.genome.wustl.edu/genome-music/0.3/index.html). utilizando todos los indeles somáticos (excluyendo todos los indeles de genes MMR) como entrada. Los análisis de vías de todos los indeles somáticos (3.022 indeles en 2.231 genes; se excluyeron los indeles presentes en genes MMR) en tumores deficientes en MMR usando GenomeMuSiC revelaron 51 vías mutadas significativamente (FDR < 0,05). Las vías de "Reparación de ADN", "Reparación por escisión de bases" y "Punto de control de daño al ADN G2/M" se clasificaron en las posiciones más altas, lo que confirma los resultados del análisis IPA®.
8.2 Análisis de la vía de indeles en los límites exón/intrón
Además, como se sabe que los genes también son inactivados por indeles que afectan a homopolímeros ubicados en los límites exón/intrón, ampliamos nuestra llamada de mutación a indeles que aparecen en las secuencias de 25 pares de bases cadena arriba y abajo de cada exón. Se realizó la misma llamada de mutación y el mismo conducto de filtrado que se describieron anteriormente. Detectamos 1.700 indeles adicionales en los límites exón/intrón, incluida una deleción en el homopolímero del intrón 7 de ATM, una deleción en el homopolímero del intrón 4 de MRE11 y una inserción en el homopolímero del intrón 5 de FANCD2. Estos tres indeles afectan a 7, 5 y 1 muestras respectivamente. Junto con los 3.022 indeles en las regiones exónicas, el análisis GenomeMuSiC de las 4.722 mutaciones reveló 54 vías mutadas significativamente (FDR < 0,05). La inclusión de indeles en los límites exón/intrón produjo una señal aún más fuerte para la reparación de DSB de ADN como la principal vía enriquecida.
Considerando todos los análisis, hay 11 genes involucrados en la vía de reparación de DSB por HR. La tabla 30 siguiente enumera estos genes y los tumores deficientes en MMR que portan mutaciones en estos genes.
Tabla 30. Genes implicados en la vía de reparación de DSB por HR
Gen Tumor deficiente en MMR afectado
ATM MMR- 2, MMR- 3, MMR- 6, MMR- 8, MMR- 9, MMR- 10, MMR- 11
ATR MMR- 2, MMR- 8, MMR- 10, MMR- 9
BLM MMR- 2, MMR- 6
BRCA1 MMR- 4, MMR- 5
CHEK1 MMR- 1, MMR- 9
FANCD2 MMR- 10
FANCE MMR- 2
FANCM MMR- 2, MMR- 11
MRE11 MMR- 1, MMR- 3, MMR- 8, MMR- 10, MMR- 11
RAD50 MMR- 9
RAD54 MMR- 5, MMR- 11
Resumen
Dado que los indeles presentes en tumores deficientes en MMR pueden estar sometidos a selección clonal positiva o negativa, evaluamos si las vías específicas están enriquecidas para estas mutaciones. En promedio, cada tumor deficiente en MMR contenía 309 indeles, 30 de los cuales eran mutaciones de punto caliente. Los análisis de vías de todos los genes afectados por un indel somático (excepto los genes MMR porque los indeles en estos genes están provocando deficiencia en MMR) usando IPA® revelaron que el "Papel de BRCA1 en la respuesta al daño al ADN" y la "Reparación de rotura de doble hebra (DSB) de ADN por recombinación homóloga (HR)" eran las principales vías enriquecidas (P = 6,5E-03 y P = 1, 1E-02, respectivamente). El análisis IPA® de todas las mutaciones de punto caliente reveló que además del "Papel de BRCA1 en la respuesta al daño al ADN" (P = 2,0E-03), la vía de "Regulación del punto de control de daño al ADN G2/M" también se enriqueció (P = 3,1E-03). Los genes que mutaron con más frecuencia en estas vías incluyeron, entre varios otros, ATR, BLM, BRCA1, CHEK1 y FANCM (4, 2, 2, 2 y 2 mutaciones, respectivamente; tabla 30). Los análisis de vías de todos los indeles en tumores deficientes en MMR utilizando GenomeMuSiC, que calcula las vías que están mutadas específicamente basándose en las bases de datos KEGG, BioCarta o Reactome, mientras corrige por la tasa de mutación de fondo, revelaron que, respectivamente, las vías de "Reparación de ADN", "Reparación por escisión de bases" y "Puntos de control de daño al ADN G2/M" se clasificaron en las posiciones más altas (P = 6,3E-05, P = 3,1E-04 y P = 9,8E-04, respectivamente). Además, dado que los genes de reparación de DSB también pueden verse afectados por indeles con pérdida de función en homopolímeros ubicados en los límites exón/intrón (Ham et al., 2006), ampliamos nuestra llamada de mutación a indeles que aparecen en las secuencias de 25 pb cadena arriba y abajo de cada exón. El análisis GenomeMuSiC de todas las mutaciones (1.700 indeles de límite exón/intrón y 3.022 indeles exónicos) arrojó una señal aún más fuerte para la reparación de DSB de ADN como la vía enriquecida principal (por ejemplo, P = 6,8E-07 para la vía "ATR/BRCA" en BioCarta y P = 3,0E-05 para la vía de "Punto de control de daño al Ad N G2/M" en Reactome). En general, cada tumor deficiente en MMR contenía una media de 3,0 ± 0,5 indeles en la vía de reparación de DSB por HR (figura 6).
En un intento de replicar estos hallazgos, analizamos los datos del exoma de 27 tumores CCR MSI-H secuenciados en el contexto de la red The Cancer Genome Atlas (TCGA, 2012). Aunque estos tumores se secuenciaron con una profundidad de cobertura promedio de solo 20x, que es bastante baja para detectar indeles de forma fiable en homopolímeros (Reumers et al., 2011), seleccionamos cada uno de los 1.426 indeles con desplazamiento de marco (en 1.284 genes, sin incluir los genes MMR) que se notificaron para estos tumores, pero además también seleccionaron 19 indeles identificados por TCGA basándonos en una evaluación separada de 29 homopolímeros seleccionados mediante un enfoque de genes candidatos. Sorprendentemente, el análisis de IPA de los 1.303 genes afectados con indeles confirmó que el "Papel de BRCA1 en la respuesta al daño al ADN" fue nuevamente la vía enriquecida principal (P = 0,0148). Los genes mutados en esta vía incluyeron, entre varios otros, RAD50, ATR, BLM y CHEK1 (7, 5, 2 y 1 mutaciones, respectivamente; figura 6).
8.3 Inactivación de la vía de reparación de DSB por HR en células deficientes en MMR
Para investigar si la vía de reparación de DSB por HR está funcionalmente inactivada en tumores deficientes en MMR, evaluamos la actividad de reparación de DSB en 8 cultivos de tumores primarios y líneas celulares cancerosas deficientes en MMR y 4 competentes en MMR. El estado de MMR de estas células se analizó utilizando el panel de 56 marcadores y se confirmó mediante el panel Bethesda.
Se establecieron nueve cultivos primarios de células tumorales endometriales y ovario de pacientes sometidas a cirugía en la División de Oncología Ginecológica, Hospitales Universitarios de Gasthuisberg, Lovaina (Bélgica). Solo después de dar su consentimiento informado, los pacientes se incluyeron en el estudio. Se utilizó el siguiente protocolo para generar cultivos de tumores primarios. En primer lugar, se dispusieron muestras de tumores en medio RPMI estéril suplementado con penicilina/estreptomicina (1000 U/ml) y fungizona (0,5 pg/ml) (todos de Life Technologies) para su transporte desde la sala de cirugía al laboratorio de cultivo celular. Posteriormente, el tejido tumoral se lavó con PBS suplementado con penicilina/estreptomicina y fungizona, y el tejido se trituró con cuchillas estériles. El tejido tumoral se digirió con colagenasas tipo IV (1 mg/ml; Roche) en medio RPMI (Life Technologies) suplementado con penicilina/estreptomicina y fungizona. También se añadió DNasa I (0,1 mg/ml; Roche) al medio de digestión. La digestión se realizó con agitación durante 3 h a 37 °C. A continuación, se preparó una suspensión de células individuales mediante filtración a través de un filtro de 70 pm y se lisaron los glóbulos rojos usando una solución de cloruro de amonio (Stem Cell Technologies). Finalmente, las células individuales se plaqueron en un matraz de cultivo de 25 cm2 y el medio se cambió al día siguiente. Después de 1-3 semanas, cuando las células alcanzaron una confluencia del 60-70%, se eliminaron los fibroblastos usando CD90 antihumano de ratón (Clon AS02; Dianova) y selección negativa con Mouse Pan IgG Dynabeads (Life Technologies). Posteriormente, los cultivos celulares se sometieron a pases a una confluencia del 70-90% y los cultivos celulares se almacenaron en un banco de células en diferentes pases. La tabla 31 enumera los diversos cultivos de tumores primarios que se generaron según este protocolo.
Tabla 31. Cultivos de células de tumores primarios
Cultivo celular Tipo Histopatología Grado Estado de MMR 1 EMC- 1 Endometrio Carcinoma endometrioide 2 Deficiente
2 EMC- 2 Endometrio Carcinoma endometrioide 3 Deficiente
3 EMC- 3 Endometrio Carcinoma endometrioide/seroso 3 Deficiente
4 EMC- 4 Endometrio Carcinoma endometrioide 1 - 3 Deficiente
5 EMC- 5 Endometrio Carcinoma endometrioide 3 Deficiente
6 OVC- 1 Ovario Carcinoma seroso 3 Deficiente
7 OVC- 2 Ovario Carcinoma seroso 3 Deficiente
8 EMC+ 1 Endometrio Carcinoma endometrioide 2 Competente 9 OVC+ 1 Ovario Carcinoma seroso 3 Competente
Los cultivos de células de tumores primarios se cultivaron en medio RPMI 1640 (Gibco) suplementado con suero bovino fetal al 20%, L-glutamina 2 mM, 100 U/ml de penicilina, 100 pg/ml de estreptomicina, 1 pg/ml de fungizona y 10 pg/ml de gentamicina hasta 20 pases. Todos los cultivos celulares se realizaron en una atmósfera humidificada que contenía CO2 al 5% a 37 °C. También se supervisaron de forma rutinaria para detectar contaminación por micoplasma y no se detectó crecimiento de micoplasma.
Se obtuvieron células HEC-1-A, MDA-MB-231 y MCF7, en todos los casos de las Colecciones de Cultivos Tipo Estadounidenses (ATCC, Manassas, VA, Estados Unidos). Se cultivaron células HEC-1-A en medio 5A de McCoy (Gibco-BRL, Life Technologies), células MdA-MB-231 y MCF7 en medio de Eagle modificado por Dulbecco (DMEM, Gibco-BRL), todos complementados con suero bovino fetal al 10% (FBS, Gibco-BRL), L-glutamina 2 mM, 100 U/ml de penicilina y 100 pg/ml de estreptomicina (todos de Life Technologies). Todas las células humanas se mantuvieron en una atmósfera humidificada que contenía CO2 al 5% a 37 °C. Las líneas celulares se enumeran en la tabla 32.
Tabla 32
Línea celular Tipo Subtipo Estado BRCA Mutaciones en genes MMR Estado de MMR Mutación sin sentido en PMS2,
1 HEC-1-A Endometrio Endometrioide WT BRCA1/2 Mutación del sitio de empalme Deficiente en MSH6
2 MDA-MB-231 Mama TNBC WT BRCA1/2 - Competente 3 MCF7 Mama ER+ PR+ WT BRCA1/2 - Competente
Resumen
Habiendo establecido que los tumores deficientes en MMR están enriquecidos en mutaciones de pérdida de función que afectan a la vía de reparación de DSB por HR, investigamos si esta vía también está funcionalmente inactivada. Esto es relevante ya que estas mutaciones representan indeles heterocigóticos, cuyos efectos de pérdida de función pueden compensarse por medio del alelo no afectado. Dado que durante la replicación del ADN, las roturas de una sola hebra (SSB) se convierten en DSB, lo que activa la reparación de DSB por HR, expusimos 8 tumores deficientes en MMR y 4 tumores competentes en MMR (9 cultivos de tumores primarios y 3 líneas de células cancerosas) al inhibidor de PARP olaparib, que inhibe la reparación de SSB, y posteriormente se cuantificó el número relativo de células con focos positivos para yH2AX y RAD51 como una medida del daño al ADN y HR activa, respectivamente. Dado que ninguno de los tumores se sometió a secuenciación del exoma, lo que representa un conjunto independiente de tumores deficientes en MMR, el estado de MMR se determinó utilizando nuestro panel de 56 marcadores y se confirmó utilizando el panel Bethesda. Aunque no observamos ninguna diferencia en la formación de focos RAD51 entre cultivos tumorales deficientes MMR y competentes en MMR en ausencia de olaparib (10 ± 2% de células frente al 13 ± 2% mostraron formación de focos de RAD51, P = 0,74; figura 7a,b), la exposición a olaparib 10 pM desencadenó significativamente menos formación de focos de RAD51 en células deficientes en m Mr que en células competentes en MMR (19 ± 3% frente al 37 ± 4%; P = 0,02; figura 7a,b). Por el contrario, al investigar el grado de daño al ADN no reparado por inmunofluorescencia H2AX, el olaparib aumentó drásticamente el número de focos de yH2AX en todas las células independientemente de su estado de MMR (no se muestra), lo que indica que la extensión del daño al ADN fue similar entre ambos cultivos. Dado que en las células deficientes en BRCA1 o BRCA2, la formación de focos de RAD51 está completamente ausente tras la inhibición de PARP (Farmer et al., 2005), estos datos sugieren que en las células deficientes en MMR, la vía de reparación de DSB por HR solo se inactiva parcialmente.
Ejemplo 9. El inhibidor de PARP olaparib sensibiliza tumores deficientes en MMR
Dado que los tumores deficientes en MMR se caracterizan por una actividad reducida de la vía de reparación de DSB por HR, planteamos la hipótesis de que estos tumores, similares a los tumores deficientes en BRCA1 (Farmer et al., 2005), pueden ser dirigidos selectivamente por inhibición de PARP. Los 8 cultivos deficientes en MMR y los 4 cultivos competentes en MMR se expusieron todos de forma dependiente de la dosis (1, 3 y 10 pM) a olaparib y se evaluaron los efectos sobre la proliferación. Los cultivos individuales deficientes en MMR, incluidos cada uno de los 6 cultivos de tumores primarios deficientes en MMR, mostraron una disminución de la proliferación dependiente de la dosis tras la exposición a olaparib, mientras que ninguna de las células competentes en MMR se caracterizó por una respuesta similar. En promedio, 1, 3 y 10 pM de olaparib redujeron la proliferación de células deficientes en MMR en el 15%, 20% y 42% respectivamente (P = 0,02, P < 0,001 y P < 0,001, respectivamente frente a células no tratadas; figura 7c), mientras que no se observó ningún efecto en los tumores competentes en MMR a las 48 horas (P = NS para todas las concentraciones de olaparib; figura 7d). En general, la proliferación también difirió significativamente entre tumores deficientes y competentes en MMR (P < 0,001 mediante medición repetida). Dado que las células deficientes en BRCA1 y BRCA2 expuestas a, respectivamente, 3 pM y 10 pM de olaparib, se caracterizan por una disminución del 78% y del 91% en la viabilidad (Farmer et al., 2005; Patel et al., 2012), estos datos "ex vivo" confirman que las células deficientes en MMR, de forma coherente con su inactivación parcial de la la vía de reparación de DSB por HR, se sensibilizan por inhibición de PARP.
Proliferación celular con el sistema xCELLigence
Se utilizó el sistema analizador de células en tiempo real (RTCA) xCELLigence (Roche Applied Science, Mannheim, Alemania) para supervisar de forma dinámica las tasas de proliferación celular. El sistema mide la impedancia eléctrica a través de microelectrodos en la parte inferior de las placas E de cultivo de tejidos. La medición de la impedancia proporciona información cuantitativa sobre el número de células, su viabilidad, su morfología y su adhesión. Se sembraron 5.000 células/pocillo en la placa E 16 (Roche) en 200 pl de medio. Las células se trataron con olaparib 24 h después de la siembra hasta la concentración final deseada (1, 3, 10 pM de olaparib). El porcentaje final de DMSO en todos los pocillos fue del 0,1%. Cada condición de tratamiento se midió por triplicado. Los valores del índice de células dinámicas se supervisaron en intervalos de 5 minutos durante 48 h después de los tratamientos. Los valores del índice de células se normalizaron con respecto al control tratado con vehículo para cada célula. La figura siguiente muestra las tasas de proliferación celular para cada uno de los cultivos celulares (las células deficientes en MMR se muestran en azul y las células competentes en MMR se muestran en rojo). En resumen, las células deficientes en MMR se caracterizaron por una disminución de la proliferación dependiente de la dosis, mientras que las células competentes en MMR no respondieron a olaparib (P = 2,0E-7 mediante medición repetida; figuras 7c y e).
Discusión
A este respecto, secuenciamos el primer genoma completo de un tumor deficiente en MMR. Observamos que la mayor parte de las sustituciones somáticas consistían en transiciones de nucleótidos y que los nucleótidos adyacentes tenían un importante efecto dependiente del contexto sobre la determinación de qué nucleótidos estaban afectados. Sorprendentemente, estos patrones de sustitución también se observaron en el ADN de línea germinal y otros organismos eucariotas, y en estos genomas se correlacionaron con características importantes del genoma de forma similar (Hodgkinson y Eyre-Walker, 2011). En particular, observamos un mayor número de sustituciones en las secuencias de CpG metiladas, lo que involucra a la maquinaria de MMR en la reparación de la desaminación de citosina metilada y demuestra que la MMR no canónica es fundamental para mantener la integridad genómica.
Además, la desaminación es uno de los procesos más importantes que subyacen a las mutaciones asociadas a enfermedades humanas y la evolución. Desde esa perspectiva, es interesante notar que observamos una firma muy similar en 10 exomas adicionales de tumores deficientes en MMR, en sustituciones de novo de la línea germinal y en bases de datos SNP humanas y de ratón. En general, estas observaciones indican que, de forma similar a las poblaciones bacterianas (Saint-Ruf y Matic, 2006), la reparación incompleta de errores de apareamiento en seres humanos contribuye a la selección natural a través de la adaptación genética.
Aproximadamente la mitad de las mutaciones en el hipermutador representaban indeles. Es importante señalar que, aunque en indeles de secuenciación de alto rendimiento la detección se carga con tasas muy altas de falsos positivos, validamos el 92,7% de los indeles utilizando tecnologías ortogonales. La mayor parte de los indeles afectan específicamente a tramos de homopolímeros. Esto es relevante porque el panel Bethesda ampliado, que se utiliza actualmente para la clasificación diagnóstica de MSI, tiene únicamente una sensibilidad limitada (80%, 84% y 55% para tumores deficientes en MLH1, MSH2 y MSH6 (de la Chapelle y Hampel, 2010)), presumiblemente porque consiste en 8 marcadores de microsatélites y solo 2 de homopolímeros. Nuestro panel de 56 marcadores de mutaciones de punto caliente identificadas por secuenciación del exoma fue más sensible para detectar MSI, especialmente en tumores EM, que se sabe que son más frecuentemente deficientes en MSH6 que en MLH1 o MSH2. Además, dado que 45 de 56 marcadores se ubicaron en las UTR, que tienen menos probabilidades de impulsar la selección clonal, pudimos detectar MSI-H en cánceres que afectan a diferentes tejidos. Finalmente, dado que la mayor parte de los 56 marcadores se ubicaron en homopolímeros de < 10 pb de longitud, estos marcadores son compatibles con varias tecnologías de genotipado de bajo a alto rendimiento, tales como la extensión de un solo par de bases (Sequenom MassArray), tecnologías de hibridación específica de alelos (TaqMan) y análisis de curvas de fusión (incluido HRM). Los marcadores más sensibles en Bethesda (BAT25 y BAT26) son claramente menos compatibles, ya que detectan indeles en homopolímeros de 25 y 26 pb.
Curiosamente, observamos que varios indeles en el exoma, todos los cuales representaban mutaciones de pérdida de función, se producían como mutaciones de punto caliente. En promedio, cada tumor contenía 30 mutaciones de punto caliente, lo que es significativamente alto en comparación con los intentos previos de secuenciación del cáncer de tumores competentes en MMR (Nik-Zainal et al., 2012; Rausch et al., 2012). Los análisis de vías revelaron además que la vía de reparación de DSB por HR estaba enriquecida en mutaciones; en promedio 3 mutaciones afectaron a esta vía en cada tumor. Anteriormente se había informado de mutaciones en genes de reparación de DSB, tales como MRE11A o RAD50, pero estos estudios se centraron en mutaciones específicas en genes individuales más que en vías, y por este motivo solo pudieron establecer que una fracción de los tumores deficientes en MMR está mutada en uno de estos genes (Miquel et al., 2007). Además, aunque está bien establecido que las células deficientes en BRCA1 y BRCA2, así como las células deficientes en genes relacionados con la anemia de Fanconi u otros genes relacionados con HR, son selectivamente hipersensibles a los inhibidores de PARP (Murai et al., 2012), los datos que demuestran la selectividad de líneas celulares deficientes en MMR a la inhibición de PARP no han sido concluyentes. El estudio más prometedor, hasta la fecha, observó una correlación débil pero significativa entre los niveles de expresión de MRE11 y la citotoxicidad al inhibidor de PARP ABT-888, pero el posterior silenciamiento de MRE11 en una línea celular MSS solo modificó modestamente la proliferación a altas concentraciones del inhibidor (Vilar et al., 2011). Por el contrario, nuestro descubrimiento libre de hipótesis de que la reparación de DSB por HR es la vía principal afectada por mutaciones de pérdida de función en tumores EM y CCR deficientes en MMR, tanto en nuestro propio conjunto de datos como en el conjunto de datos públicos de TCGA, sugiere que las mutaciones en varios genes en la vía cooperan para inactivar la reparación de DSB por HR en tumores deficientes en MMR. El hallazgo de que cada cultivo de tumor primario deficiente en MMR, también aquellos sin mutaciones MRE11, mostraba un efecto de respuesta a la dosis tras la exposición con olaparib, confirma funcionalmente el efecto acumulado de estas mutaciones heterocigóticas.
Se han desarrollado varios inhibidores de PARP, tales como olaparib (AZD2281), veliparib (ABT-888) y niraparib (MK-4827). Los estudios iniciales con estos inhibidores revelaron un beneficio clínico significativo en pacientes con cáncer de mama o de ovario portadoras de mutaciones BRCA1 y BRCA2, sin causar toxicidad excesiva (Tutt et al., 2010). A pesar de estos resultados alentadores, los inhibidores de PARP aún no se han aprobado (Maxwell y Domchek, 2012). Uno de los principales obstáculos es la falta de una prueba diagnóstica aprobada por la FDA que sea rentable. Las pruebas diagnósticas para analizar las mutaciones BRCA1 y BRCA2 no están aprobadas por la FDA y los costes asociados son excesivamente altos. Como resultado, las compañías farmacéuticas han dudado en iniciar estudios clínicos de fase 3 con inhibidores de PARP (Maxwell y Domchek, 2012). Nuestras observaciones de que los tumores deficientes en MMR son sensibles a la inhibición de PARP son muy interesantes a este respecto. En primer lugar, nuestro estudio identifica un segundo subgrupo de tumores que podrían ser sensibles a la inhibición de PARP. Aunque se puede percibir que los tumores MSI representan solo una pequeña proporción de los tumores CCR y EM, la población absoluta de pacientes con tumores MSI que podría beneficiarse es tan grande, si no mayor, que la de las mutaciones BRCA1 o BRCA2 o incluso otros agentes dirigidos. En segundo lugar, las pruebas diagnósticas complementarias para los tumores MSI ya están disponibles, ya sea utilizando procedimientos tradicionales, como el panel Bethesda, o mediante el perfilado de mutaciones de punto caliente frecuentes. Por lo tanto, la traducción de nuestras observaciones al entorno clínico podría ser más rápida que para los portadores de mutaciones BRCA1 o BRCA2, y podría acelerarse aún más a través de nuestro panel de marcadores más sensible y automatizable/escalable. En tercer lugar, existe una gran necesidad clínica de opciones de tratamiento dirigidas en los tumores MSI. En particular, aunque los tumores de CCR en estadio II o III con MSI se caracterizan por un pronóstico moderadamente mejorado, los tumores de MSI en el entorno avanzado se asocian con más metástasis peritoneales y una peor supervivencia general independientemente del régimen de quimioterapia (Smith et al., 2013).
Además, mientras que la resistencia clínica a la inhibición de PARP se ha atribuido a mutaciones secundarias que restauran las proteínas BRCA1 o 2 de longitud completa, restableciendo así su función en las células tumorales (Barber et al., 2012), es menos probable que se produzca este mecanismo para cada uno de los genes de reparación de DSB afectados por mutaciones somáticas. Esto sugiere que es menos probable que los tumores deficientes en MMR desarrollen resistencia contra los inhibidores de PARP, lo que los vuelve terapéuticamente más valiosos a largo plazo.
Materiales y procedimientos
Detección de deficiencia de reparación de errores de apareamiento: para evaluar la expresión de MLH1, MSH2 y MSH6 en muestras tumorales y de línea germinal correspondiente, se realizó una inmunohistoquímica utilizando los anticuerpos monoclonales siguientes: clon ES05 para MLH1 (DAKO), clon G219-1129 para MSH2 (BD Pharmagen) y clon EP49 para MSH6 (Epitomics). El estado de hipermetilación de las regiones promotoras de MLH1 se determinó utilizando el kit SALSA m S-MLPA KIT (MRC-Holland). El estado de MSI se detectó mediante el panel Bethesda ampliado. Selección y preparación de la muestra: seleccionamos 14 pares tumor-normal endometriales, 3 colorrectales y 3 de ovario para la secuenciación. El ADN tumoral se obtuvo a partir de tejido tumoral recién congelado. Todas las muestras representaron tumores primarios no tratados previamente con quimioterapia. El ADN normal correspondiente para estas 20 muestras se extrajo de glóbulos blancos periféricos. Se obtuvo un consentimiento informado de todos los pacientes. Además, se secuenciaron 4 líneas celulares comerciales de leucemia linfoblástica aguda de células T (DND41, CCr F-CEM, SUPT1 y RPMI-8402, obtenidas de DSMZ, http://www.dsmz.de/). El ADN se extrajo utilizando el kit Qiagen DNAeasy para todas las muestras.
Secuenciación del genoma completo: se seleccionaron 5 pares tumor-normal, incluidos 3 pares EM y 2 pares de ovario para la secuenciación del genoma completo. La secuenciación de extremos emparejados se realizó utilizando el servicio Complete Genomics®, que incluye análisis de datos primarios (análisis de imágenes, llamadas de bases, alineamiento y llamadas de variantes). Se utilizó el procedimiento calldiff de CGAtools (http://cgatools.sourceforge.net) para seleccionar mutaciones somáticas. Para cada mutación somática, CGAtools comunica una puntuación somática, lo que refleja la confianza de la mutación somática llamada. Las puntuaciones más altas indican una mayor confianza. Utilizando los datos de validación generados por Sequenom MassARRAY, determinamos el punto de corte óptimo para seleccionar mutaciones somáticas verdaderas y eliminar errores de secuenciación de falsos positivos. Se aplicaron puntos de corte de puntuación somática a todas las listas de mutaciones somáticas y para análisis posteriores solo se utilizaron las mutaciones con una puntuación superior a estos umbrales.
Secuenciación del exoma de tumores deficientes en MMR: se capturaron exomas de 15 pares tumor-normal endometriales, colorrectal y ovario utilizando el kit de enriquecimiento de exomas TruSeq (Illumina). La secuenciación de extremos emparejados se realizó con los kits TruSeq SBS en e1HiSeq2000 (2 x 75 pb para muestras de ovario y EM, 2 x 100 pb para muestras de CCR). Se capturaron exomas de 4 genomas de leucemia utilizando la biblioteca de exomas humanos Nimblegen SeqCap EZ v2.0. La secuenciación de Pairedend (2 x 50 pb) se realizó con los kits TruSeq SBS en el HiSeq2000. Para todos los exomas, se usó BWA para alinear las lecturas sin procesar de cada carril de secuenciación con el genoma de referencia humano usando parámetros predeterminados. Las lecturas alineadas se procesaron y clasificaron con SAMtools (v.0.1.13) y los duplicados de PCR se eliminaron con Picard MarkDuplicates. La recalibración de bases, el realineamiento local alrededor de indeles y la llamada de variantes de un solo nucleótido se realizaron utilizando el kit GenomeAnalysisToolKit (McKenna et al., 2010) (GATK v1.0.4487). Las sustituciones se llamaron usando el genotipador unificado GATK, mientras que los indeles se detectaron usando Dindel (Albers et al., 2011) (v1.01). El filtrado de calidad inicial en las sustituciones se realizó en función de la puntuación de calidad proporcionada por el llamador de variantes GATK. Las mutaciones se retuvieron solo si la puntuación de calidad era superior a Q30 en el tumor y la muestra normal correspondiente.
Anotación de datos del genoma completo y del exoma completo: los datos de la secuencia del genoma completo se anotaron utilizando ANNOVAR y la pista de anotación UCSC RefGene hg 18 (Wang et al., 2010). Las regiones de repetición se determinaron usando "grepseq" (http://code.google.com/p/grepseq/). Los microsatélites se definieron como repeticiones di-, tri-, tetra-, penta- y hexanucleotídicas que consisten en al menos dos unidades de repetición y con una longitud mínima de 6 bases, homopolímeros como repeticiones mononucleotídicas con una longitud mínima de 6 bases, homopolímeros cortos como repeticiones mononucleotídicas de 3, 4 o 5 bases de largo. La anotación de las regiones de repetición se realizó mediante el comando intersectBed de BEDtools.
Disponibilidad de datos del exoma y del genoma completo: los archivos de variantes sin filtrar de todos los datos del exoma y del genoma completo se han depositado en el Archivo Europeo de Genotipos y Fenotipos (http://www.ebi.ac.uk/ega) con acceso restringido, con número de acceso EGAS00001000182 y EGAS00001000158.
Cultivos de tumores primarios e inmunofluorescencia: se establecieron nueve cultivos de células tumorales primarias de endometrio y ovario a partir de tumores de las pacientes sometidas a cirugía. Se cultivaron cultivos de células tumorales primarias en medio RPMI1640 (GIBCO) suplementado con FBS al 20%, L-glutamina 2 mM, penicilina 100 U/ml, estreptomicina 100 pg/ml, fungizona 1 pg/ml y gentamicina 10 pg/ml hasta 20 pases. Se sembraron 25.000 células/pocillo en portaobjetos de 8 pocillos (Nunc) en 400 pl de medio y se cultivaron durante 24 h. Después de la exposición a olaparib 0 o 10 pM, los portaobjetos se enjuagaron en PBS, se fijaron en paraformaldehído a 37 °C, se permeabilizaron con Triton X-100 al 0,1% y se bloquearon con BSA. Las células se tiñeron con anticuerpo monoclonal anti-fosfo-Histona H2A.X de ratón (Millipore clon JBW301, 1:100) o anticuerpo policlonal anti-Rad51 (H-92) de conejo (Santa Cruz H-92, 1:1000) y se lavaron en Triton X-100 al 0,1% en PBS. Se utilizó Alexa Fluor 488 (Invitrogen) y los portaobjetos se montaron en el reactivo Prolong Gold Antifade que contenía DAPI (Molecular Probes). El porcentaje de focos de células positivas (> 5 focos por núcleo) se determinó en un microscopio confocal invertido Zeiss LSM 510 utilizando un objetivo de inmersión en aceite Plan-Neofluar 40x/1,3. Para cada experimento, se analizaron al menos 100 núcleos.
Proliferación celular: se utilizó el analizador de células en tiempo real (RTCA) xCELLigence System (Roche) para controlar dinámicamente las tasas de proliferación celular. Se sembraron 5.000 células/pocillo en la placa E 16 (Roche) en 200 pl de medio. Se disolvió olaparib (AZD-2281, JS Research Chemicals Trading) en DMSO. 24 h después de la siembra, las células se trataron con olaparib (olaparib 1, 3, 10 pM). Cada condición se midió por triplicado y todos los experimentos se realizaron por duplicado en diferentes puntos temporales. Los valores del índice de células dinámicas se supervisaron durante 48 h después del tratamiento.
Materiales
El anticuerpo monoclonal anti-fosfo-Histona H2A.X (Ser139) de ratón (clon JBW301) era de Millipore Corporation, Billerica, MA, Estados Unidos. El anticuerpo policlonal anti-Rad51 de conejo (H-92) era de Santa Cruz Biotechnology, Santa Cruz, CA, Estados Unidos. El olaparib (AZD-2281, lote 3-8/10) se adquirió de JS Research Chemicals Trading, Schleswig Holstein, Alemania y se preparó como solución madre en DMSO y se almacenaron 10 partes alícuotas a -20 °C hasta su uso. El olaparib se diluyó adicionalmente 1:50 en los medios respectivos antes de diluirlo 1:20 en el pocillo de la placa.
Inmunotinción de yH2AX
El grado de daño al ADN no reparado tras el tratamiento con olaparib se midió con inmunofluorescencia yH2AX. Cuando hay una rotura de doble hebra en el ADN, H2AX se fosforila en serina 139 y se denomina yH2AX. Para la inmunotinción de yH2AX, se sembraron 25.000 células/pocillo en portaobjetos de Lab-tek Permanox Chamber de 8 pocillos (Nunc) en 400 pl de medio y se incubaron durante 24 h a 37 °C, 5% de CO2. Posteriormente, después de 24 h de incubación, las células se expusieron a olaparib 0 o 10 pM, los portaobjetos se enjuagaron en solución salina tamponada con fosfato (PBS) y se fijaron en paraformaldehído al 4% durante 10 minutos a 37 °C, se permeabilizaron con Triton X-100 al 0,1% durante 5 minutos y se bloquearon con albúmina de suero bovino (BSA) al 5% durante 10 minutos, ambos a temperatura ambiente. Las células se tiñeron con una dilución 1:100 de anticuerpo monoclonal anti-fosfo-Histona H2A.X (Ser139) de ratón (clon JBW301, Millipore). El anticuerpo primario se visualizó con IgG de cabra anti-ratón Alexa Fluor-488 (Alexa) y se montó en el reactivo Prolong Gold Antifade con DAPI (Molecular Probes). El tratamiento con olaparib 10 pM aumentó el número de focos de yH2AX 4-6 veces en comparación con el valor inicial en todas las células independientemente de su estado de MMR, lo que indica que la medida del daño al ADN de DSB fue similar entre ambos cultivos.
Inmunotinción de Rad51
La proteína RAD51 desempeña un papel importante en la vía de reparación de DSB por HR y la formación de focos positivos a RAD51 se utiliza como marcador de la reparación de DSB por HR en curso. Para realizar la inmunotinción RAD51, se sembraron 25.000 células/pocillo en portaobjetos Lab-tek Permanox Chamber de 8 pocillos (Nunc) en 400 pl de medio y se incubaron durante 24 h a 37 °C, 5% de CO2 hasta el tratamiento con olaparib. Después de 24 h de incubación tras la exposición a olaparib 0 o 10 pM, las células se lavaron con PBS a temperatura ambiente y se fijaron en paraformaldehído al 3% con Triton X-100 al 0,1% en PBS durante 20 minutos a 37 °C. Los portaobjetos se incubaron con una dilución 1:1000 de anticuerpo policlonal anti-Rad51 de conejo (H-92) (Santa Cruz) durante 16 horas a 4 °C, después se lavaron cuatro veces durante 15 minutos con Triton X-100 al 0,1% en PBS. El anticuerpo primario se visualizó con IgG de cabra anti-ratón Alexa Fluor-488 (Alexa) y se montó en el reactivo Prolong Gold Antifade con DAPI (Molecular Probes).
Microscopía confocal
Los focos de yH2AX y RAD51 se visualizaron con microscopio confocal invertido Zeiss LSM 510 utilizando un objetivo de inmersión en aceite Plan-Neofluar 40x/1.3 y longitudes de onda de excitación de 488 y 750 nm (láser de dos fotones coherente Chameleon). Mediante proyección máxima de enfoque, se adquirieron imágenes de secciones ópticas separadas 1,20 pm y con un espesor de sección de 0,5 pm. Las imágenes se procesaron utilizando el programa informático LSM510. Los núcleos con > 5 focos se puntuaron como positivos y se contaron al menos 100 núcleos por cultivo y por condición.
Referencias
1. Stratton, M. R., Campbell, P. J. y Futreal, P. A. The cancer genome. Nature 458, 719-724 (2009).
2. Futreal, P. A. et al. A census of human cancer genes. Nat Rev Cancer 4, 177-183 (2004).
3. Loeb, L. A., Loeb, K. R. y Anderson, J. P. Multiple mutations and cancer. Proc Natl Acad Sci U S A 100, 776-781 (2003).
4. Loeb, L. A., Springgate, C. F. y Battula, N. Errors in DNA replication as a basis of malignant changes. Cancer Res 34, 2311-2321 (1974).
5. Loeb, L. A. Human cancers express mutator phenotypes: origin, consequences and targeting. Nat Rev Cancer 11, 450-457 (2011).
6. Poulogiannis, G., Frayling, I. M. y Arends, M. J. DNA mismatch repair deficiency in sporadic colorectal cáncer and Lynch syndrome. Histopathology 56 , 167-179 (2010).
7. Beckman, R. A. y Loeb, L. A. Negative clonal selection in tumor evolution. Genetics 171,2123-2131 (2005).
8. Jones, S. et al. Frequent mutations of chromatin remodeling gene ARID1A in ovarian clear cell carcinoma. Science 330, 228-231 (2010).
9. Boland CR, Thibodeau SN, Hamilton SR, et al: A National Cancer Institute Workshop on Microsatellite Instability for cancer detection and familial predisposition: Development of international criteria for the determination of microsatellite instability in colorectal cancer. Cancer Res 58:5248-5257, 1998.
10. Palomaki GE, McClain MR, Melillo S, et al: EGAPP supplementary evidence review: DNA testing strategies aimed at reducing morbidity and mortality from Lynch syndrome. Genetics in Medicine 11:42-65, 2009.
11. Popat S, Hubner R, Houlston RS: Systematic review of microsatellite instability and colorectal cancer prognosis. J Clinl Oncol 23:609-617, 2005.
12. Ribic CM, Sargent DJ, Moore MJ, et al: Tumor microsatellite-instability status as a predictor of benefit from Fluorouracil-based adjuvant chemotherapy for colon cancer. N Engl J Med 349:247-257, 2003.
13. Des Guetz G, Schischmanoff O, Nocalas P, et al: Does microsatellite instability predict the efficacy of adjuvant chemotherapy in colorectal cancer? A systematic review with meta-analysis. Euro J Cancer 45:1890-1896, 2009.
14. Dietmaier, W. et al. Diagnostic microsatellite instability: definition and correlation with mismatch repair protein expression. Cancer Res 57, 4749-4756 (1997).
15. Umar, A. et al. Revised Bethesda Guidelines for hereditary nonpolyposis colorectal cancer (Lynch syndrome) and microsatellite instability. J Natl Cancer Inst 96, 261-268 (2004).
16. de la Chapelle, A. y Hampel, H. Clinical relevance of microsatellite instability in colorectal cancer. J Clin Oncol 28, 3380-3387 (2010).
17. Pyatt R, Chadwick RB, Johnson CK, et al: Polymorphic variation at the BAT-25 and BAT-26 loci in individuals of African origin: Implications for microsatellite instability testing. Am J Pathol 155:349-353, 1999.
18. Lindor, N. M. et al. Immunohistochemistry versus microsatellite instability testing in phenotyping colorectal tumors. J Clin Oncol 20, 1043-1048 (2002).
19. Simpkins, S. B. et al. MLH1 promoter methylation and gene silencing is the primary cause of microsatellite instability in sporadic endometrial cancers. Hum Mol Genet 8, 661-666 (1999).
20. Herman, J. G. et al. Incidence and functional consequences of hMLH1 promoter hypermethylation in colorectal carcinoma. Proc Natl Acad Sci U S A 95, 6870-6875 (1998).
21. Quinlan, A. R. y Hall, I. M. BEDTools: a flexible suite of utilities for comparing genomic features. Bioinformatics 26, 841-842 (2010).
22. Banerjea, A. et al. Colorectal cancers with microsatellite instability display mRNA expression signatures characteristic of increased immunogenicity. Mol Cancer 3, 21 (2004).
23. Kapushesky, M. et al. Gene expression atlas at the European bioinformatics institute. Nucleic Acids Res 38, D690-698 (2010).
24. Pinol, V. et al. Accuracy of revised Bethesda guidelines, microsatellite instability, and immunohistochemistry for the identification of patients with hereditary nonpolyposis colorectal cancer. JAMA 293, 1986-1994 (2005).
25. Hewish, M., Lord, C. J., Martin, S. A., Cunningham, D. y Ashworth, A. Mismatch repair deficient colorectal cancer in the era of personalized treatment. Nat Rev Clin Oncol 7, 197-208 (2010).
26. Heijink, D. M. et al. Perspectives for tailored chemoprevention and treatment of colorectal cancer in Lynch syndrome. Crit Rev Oncol Hematol (2010).
27. Plaschke, J. et al. Aberrant protein expression and frequent allelic loss of MSH3 in colorectal cancer with lowlevel microsatellite instability. Int J Colorectal Dis 27:911 -919 (2012).

Claims (34)

REIVINDICACIONES
1. Un procedimiento para diagnosticar el estado de MSI de un tumor, que comprende determinar la presencia de un indel en al menos dos regiones homopoliméricas en una muestra del ADN del tumor, en el que las, al menos dos, regiones homopoliméricas son
- al menos dos regiones homopoliméricas presentes en las regiones 5' UTR o 3' UTR de los genes enumerados en la tabla 1, o
- al menos tres regiones homopoliméricas seleccionadas de las presentes en los exones de los genes enumerados en la tabla 2 y/o presentes en las regiones 5' UTR o 3' UTR de los genes enumerados en la tabla 1,
en el que dichas regiones homopoliméricas son regiones de microsatélites que son repeticiones mononucleotídicas de al menos 6 nucleótidos y que no exceden de 20 nucleótidos, y en el que la presencia de un indel en el 2% o más de las regiones homopoliméricas es indicativa de MSI.
2. El procedimiento según la reivindicación 1, en el que una de las regiones homopoliméricas se selecciona de las regiones homopoliméricas de los genes MYL1, DIDO1, UBE2Z, RYR3, TMEM65, BTBD7, KDM5A, ABAT, PPM1A, UBA6, ZNF185, ARL10, GRIA2 y TMC7 enumerados en la tabla 3.
3. El procedimiento según la reivindicación 1, en el que una de las regiones homopoliméricas se selecciona de las regiones homopoliméricas de los genes MYL1, DIDO1, UBE2Z, RYR3, TMEM65, BTBD7, KDM5A, ABAT, PPM1A, UBA6 y ZNF185 enumerados en la tabla 3.
4. El procedimiento según la reivindicación 2 o 3, en el que se selecciona una región homopolimérica adicional de la región homopolimérica del gen MSH6 enumerado en la tabla 2 o la región homopolimérica del gen SULF2 enumerado en la tabla 1.
5. El procedimiento según la reivindicación 1, en el que al menos una región homopolimérica presente en la región 3' UTR se selecciona de las regiones homopoliméricas presentes en los genes WIPF2, NARG2, AHCYL1, C17orf63, CD5L, CEP170, COL5A2, CSNK1G3, DIDO1, EIF4G3, GSK3B, KCNMB4, MAPK1IP1L, NPR3, PI15, PRTG, RASGRP1, SH3KBP1, SHROOM3, SLC5A3, UBE2Z, ZBTB33, ZNF275, AGPAT3, APH1B, BCL11A, BMPR1B, CALN1, CASK, CBFB, CBX5, CCDC85C, CNOT7, CYP1B1, DRAM2, EDA2R, EDEM3, EGR1, EIF4G3, FAM20B, FCHSD2, FLT1, FMO2, G3BP2, HELZ, HRNR, IER3IP1, KCNG1, KCNK1, KLF3, LHX9, LRRC8D, LYRM1, MED13, MYO5B, NCEH1, PPP1R12A, PPP1R3D, RAB11FIP1, RAB6C, SAMD12, SEMA6A, SLAIN2, SMAD4, TMED7, TMEM57, TMEM65, TNPO1, TOR1AIP2, TRAK2, TRIP11, UST, VEGFA, ZBTB7A, ZKSCAN1, ZNF12, y ZNF169 enumerados en la tabla 1 o la tabla 6; y/o en el que al menos una región homopolimérica presente en la región exónica se selecciona de las regiones homopoliméricas presentes en los genes SETD1B, RBMXL1, CCDC150, OR7E24, C15orf40, KIAA2018, LTN1, SLC22A9, CDH26, DDX27, EXOSC9, FAM111B, KIAA0182, KIAA1919, MIS18BP1, PRRT2, TMEM60, AQP7, ARV1, CCDC168, ELAVL3, F8, FETUB, HPS1, NBEAL1, P4HTM, PIGB, RBM43, RG9MTD1, SRPR, TMEM97, SEC31A, RNF145, RNPC3, SLC35F5, TMBIM4, CD3G, DOCK3, MYO10 enumerados en la tabla 2 o la tabla 7.
6. El procedimiento según una cualquiera de las reivindicaciones 1 o 5, en el que las, al menos dos, regiones homopoliméricas son al menos dos regiones homopoliméricas seleccionadas de las presentes en las regiones 5' UTR o 3' UTR de los genes enumerados en la tabla 1 y al menos dos regiones homopoliméricas seleccionados de las presentes en los exones de los genes enumerados en la tabla 2.
7. El procedimiento según una cualquiera de las reivindicaciones 1 a 6, en el que las, al menos dos, regiones homopoliméricas se seleccionan de las 56 regiones homopoliméricas que se muestran en la tabla 3.
8. El procedimiento según una cualquiera de las reivindicaciones 1 o 7, en el que las, al menos dos, regiones homopoliméricas son al menos ocho regiones homopoliméricas.
9. El procedimiento según una cualquiera de las reivindicaciones 1 a 8, en el que la MSI se caracteriza además de la forma siguiente: si el 17% o más de las regiones homopoliméricas contienen un indel, el tumor tiene una MSI alta, si entre el 2% y el 17% de las regiones homopoliméricas contienen un indel, el tumor tiene una MSI baja y, si menos del 2% de las regiones homopoliméricas contienen un indel, el tumor es estable en microsatélites.
10. El procedimiento según una cualquiera de las reivindicaciones 1 a 8, en el que la MSI se caracteriza además de la forma siguiente: si el 20% o más de las regiones homopoliméricas contienen un indel, el tumor tiene una MSI alta, si entre el 2,5% y el 20% de las regiones homopoliméricas contienen un indel, el tumor tiene una MSI baja y, si menos del 2,5% de las regiones homopoliméricas contienen un indel, el tumor es estable en microsatélites.
11. El procedimiento según una cualquiera de las reivindicaciones 1 a 10, en el que la longitud de los homopolímeros no excede de 15 nucleótidos, no excede de 14 nucleótidos, no excede de 13 nucleótidos, no excede de 12 nucleótidos o no excede de 11 nucleótidos.
12. El procedimiento según una cualquiera de las reivindicaciones 1 a 9, en el que los homopolímeros tienen una longitud de al menos 6 nucleótidos, de al menos 7 nucleótidos, de al menos 8 nucleótidos, de al menos 9 nucleótidos o de al menos 10 nucleótidos.
13. El procedimiento según una cualquiera de las reivindicaciones 1 a 10, en el que los homopolímeros tienen una longitud de 7 a 12 nucleótidos, de 7 a 11 nucleótidos o de 8 a 11 nucleótidos.
14. El procedimiento según cualquiera de las reivindicaciones 1 a 10, en el que la longitud de al menos uno de los homopolímeros se encuentra entre 7 y 15 nucleótidos, se encuentra entre 8 y 15 nucleótidos, se encuentra entre 8 y 14 nucleótidos, se encuentra entre 8 y 13 nucleótidos, se encuentra entre 9 y 13 nucleótidos, se encuentra entre 10 y 13 nucleótidos, se encuentra entre 8 y 12 nucleótidos, se encuentra entre 9 y 12 nucleótidos, se encuentra entre 8 y 11 nucleótidos, se encuentra entre 9 y 11 nucleótidos o se encuentra entre 10 y 15 nucleótidos.
15. El procedimiento según una cualquiera de las reivindicaciones 1 a 14, que comprende además una etapa de determinación del estado de uno o más marcadores del panel de marcadores Bethesda ampliado.
16. El procedimiento según una cualquiera de las reivindicaciones 1 a 15, en el que la determinación de la presencia de un indel se realiza mediante tecnologías de extensión de un único par de bases, tecnologías de hibridación de ADN o análisis de la curva de fusión.
17. El procedimiento según una cualquiera de las reivindicaciones 1 a 16, en el que el tumor se selecciona de entre cáncer colorrectal, cáncer endometrial, cáncer de ovario, cáncer gástrico, leucemia y un tumor del síndrome de Lynch.
18. Uso de un panel de al menos dos regiones homopoliméricas presentes en las regiones 5' UTR o 3' UTR de los genes enumerados en la tabla 1 o de al menos tres regiones homopoliméricas seleccionadas de las presentes en los exones de los genes enumerados en la tabla 2 y/o presentes en las regiones 5' UTR o 3' UTR de los genes enumerados en la tabla 1 en un procedimiento para diagnosticar el estado de MSI de un tumor según cualquiera de las reivindicaciones 1 a 17, en el que dichas regiones homopoliméricas son regiones de microsatélites que son repeticiones mononucleotídicas de al menos 6 nucleótidos y que no exceden de 20 nucleótidos.
19. Uso del panel de regiones homopoliméricas según la reivindicación 18, en el que las, al menos ocho, regiones homopoliméricas son al menos ocho regiones seleccionadas de los genes enumerados en la tabla 3.
20. Uso del panel de regiones homopoliméricas según la reivindicación 18 o 19, en el que el panel comprende adicionalmente un homopolímero en una región no codificante de al menos un gen seleccionado de ATM, ATR, BLM, BRCA1, CHEK1, FANCD2, FANCE, FANCM, MRE11, RAD50 y RAD54.
21. Uso de un panel de regiones homopoliméricas de al menos tres regiones homopoliméricas seleccionadas de las regiones homopoliméricas presentes en los genes MYL1, DIDO1, UBE2Z, RYR3, TMEM65, BTBD7, KDM5A, ABAT, PPM1A, UBA6 y ZNF185 enumerados en la tabla 3 en un procedimiento de determinar la MSI en un tumor según cualquiera de las reivindicaciones 1 a 17, en el que la presencia de al menos un indel es indicativa de MSI.
22. Uso del panel de regiones homopoliméricas según la reivindicación 21, en el que el panel comprende adicionalmente una o más regiones homopoliméricas seleccionadas de las regiones homopoliméricas presentes en los genes ARL10, GRIA2 y TMC7 enumerados en la tabla 3.
23. Uso del panel de regiones homopoliméricas según las reivindicaciones 21 o 22, en el que el panel comprende adicionalmente la región homopolimérica del gen MSH6 enumerado en la tabla 2 o la región homopolimérica del gen SULF2 enumerado en la tabla 1.
24. Uso del panel de regiones homopoliméricas según una cualquiera de las reivindicaciones 18 a 23, en el que los homopolímeros tienen una longitud de 7 a 12 nucleótidos, de 7 a 11 nucleótidos o de 8 a 11 nucleótidos.
25. Un procedimiento de cribado de la sensibilidad de las células cancerosas al tratamiento con un inhibidor de una enzima de reparación por escisión de bases de ADN, que comprende determinar el estado de MSI en dichas células según un procedimiento de una cualquiera de las reivindicaciones 1 a 17.
26. El procedimiento según la reivindicación 25, en el que el inhibidor de una enzima de reparación por escisión de bases de ADN es un inhibidor de PARP.
27. El procedimiento según la reivindicación 26, en el que el inhibidor de PARP se selecciona de entre olaparib, veliparib, niraparib, iniparib, rucaparib, CEP9722, MK4827, BMN-673 y 3-aminobenzamida.
28. El procedimiento de una cualquiera de las reivindicaciones 25 a 27, en el que las células cancerosas son de un cáncer seleccionado de entre cáncer colorrectal, cáncer endometrial, cáncer de ovario, cáncer gástrico, leucemia y un tumor del síndrome de Lynch.
29. Uso de un kit en un procedimiento para diagnosticar el estado de MSI de un tumor según una cualquiera de las reivindicaciones 1 a 17, en el que el kit comprende oligonucleótidos específicos de alelo que discriminan entre los alelos de las regiones homopoliméricas seleccionadas con y sin indeles.
30. El uso de un kit según la reivindicación 29, en el que las regiones homopoliméricas seleccionadas tienen una longitud de 7 a 12 nucleótidos, de 7 a 11 nucleótidos o de 8 a 11 nucleótidos.
31. El uso de un kit según la reivindicación 29 o 30, en el que las regiones homopoliméricas se seleccionan de las regiones homopoliméricas de los genes MYL1, DIDO1, UBE2Z, RYR3, TMEM65, BTBD7, KDM5A, ABAT, PPM1A, UBA6 y ZNF185 enumerados en la tabla 3.
32. El uso de un kit según la reivindicación 31, en el que se selecciona una región homopolimérica adicional de las regiones homopoliméricas de los genes ARL10, GRIA2 y TMC7 enumerados en la tabla 3.
33. El uso de un kit según la reivindicación 31 o 32, en el que se selecciona una región homopolimérica adicional de las regiones homopoliméricas del gen MSH6 enumerado en la tabla 2 y la región homopolimérica del gen SULF2 enumerado en la tabla 1.
34. El uso de un kit según una cualquiera de las reivindicaciones 29 a 33 que comprende además oligonucleótidos específicos de alelo que discriminan entre un alelo con y sin indeles, en el que el alelo se selecciona de los marcadores del panel de marcadores Bethesda ampliado.
ES13717473T 2012-04-10 2013-04-10 Nuevos marcadores para detectar inestabilidad microsatelital en cáncer y determinar la letalidad sintética con inhibición de la vía de reparación por escisión de bases de ADN Active ES2906023T3 (es)

Applications Claiming Priority (4)

Application Number Priority Date Filing Date Title
US201261622383P 2012-04-10 2012-04-10
US201261638955P 2012-04-26 2012-04-26
EP13161395 2013-03-27
PCT/EP2013/057516 WO2013153130A1 (en) 2012-04-10 2013-04-10 Novel markers for detecting microsatellite instability in cancer and determining synthetic lethality with inhibition of the dna base excision repair pathway

Publications (1)

Publication Number Publication Date
ES2906023T3 true ES2906023T3 (es) 2022-04-12

Family

ID=47915624

Family Applications (1)

Application Number Title Priority Date Filing Date
ES13717473T Active ES2906023T3 (es) 2012-04-10 2013-04-10 Nuevos marcadores para detectar inestabilidad microsatelital en cáncer y determinar la letalidad sintética con inhibición de la vía de reparación por escisión de bases de ADN

Country Status (10)

Country Link
EP (2) EP2836606B1 (es)
JP (1) JP6578205B2 (es)
KR (1) KR20150005597A (es)
CN (2) CN104379765A (es)
AU (1) AU2013246909B2 (es)
BR (1) BR112014025185B1 (es)
CA (1) CA2869729C (es)
ES (1) ES2906023T3 (es)
RU (1) RU2014145017A (es)
WO (1) WO2013153130A1 (es)

Families Citing this family (39)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10294529B2 (en) 2012-04-10 2019-05-21 Life Sciences Research Partners Vzw Microsatellite instability markers in detection of cancer
US10633707B2 (en) 2012-04-10 2020-04-28 Vib Vzw Markers for detecting microsatellite instability in cancer and determining synthetic lethality with inhibition of the DNA base excision repair pathway
CN107208152B (zh) * 2015-03-06 2021-03-23 深圳华大基因股份有限公司 检测突变簇的方法和装置
KR102648647B1 (ko) * 2015-09-22 2024-03-18 비오까르띠 엔브이 짧은 호모폴리머릭 반복서열의 개선된 검출법
WO2017112738A1 (en) * 2015-12-22 2017-06-29 Myriad Genetics, Inc. Methods for measuring microsatellite instability
BR112018076528A2 (pt) * 2016-06-21 2019-04-02 The Wistar Institute Of Anatomy And Biology composições e métodos para diagnosticar cânceres de pulmão usando perfis de expressão gênica
GB201614474D0 (en) 2016-08-24 2016-10-05 Univ Of Newcastle Upon Tyne The Methods of identifying microsatellite instability
GB201621969D0 (en) * 2016-12-22 2017-02-08 Genome Res Ltd Hotspots for chromosomal rearrangement in breast and ovarian cancers
CN106755501B (zh) * 2017-01-25 2020-11-17 广州燃石医学检验所有限公司 一种基于二代测序的同时检测微卫星位点稳定性和基因组变化的方法
US11447830B2 (en) 2017-03-03 2022-09-20 Board Of Regents, The University Of Texas System Gene signatures to predict drug response in cancer
ES2978017T3 (es) * 2017-07-12 2024-09-04 Inst Curie Método para detectar una mutación en una secuencia de microsatélites
CN107267505B (zh) * 2017-07-21 2020-10-30 首都医科大学 微卫星标记及其在结直肠癌的预后判定和/或化疗敏感性预测中的应用
UA126931C2 (uk) * 2017-10-16 2023-02-22 Ф. Хоффманн-Ля Рош Аг МОЛЕКУЛИ НУКЛЕЇНОВИХ КИСЛОТ ДЛЯ ЗМЕНШЕННЯ РІВНЯ мРНК PAPD5 І PAPD7 ДЛЯ ЛІКУВАННЯ ІНФЕКЦІЙНОГО ГЕПАТИТУ B
KR102402002B1 (ko) * 2017-11-16 2022-05-25 일루미나, 인코포레이티드 미세부수체 불안정성을 결정하기 위한 시스템 및 방법
CA3087887A1 (en) 2018-01-23 2019-08-01 Biocartis Nv Methods for the analysis of dissociation melt curve data
ES2785149T3 (es) 2018-01-23 2020-10-06 Biocartis Nv Panel de biomarcadores y métodos para detectar la inestabilidad de los microsatélites en cánceres
EP3743532A1 (en) * 2018-01-23 2020-12-02 Biocartis NV Biomarker panel and methods for detecting microsatellite instability in cancers
WO2019185683A1 (en) * 2018-03-28 2019-10-03 INSERM (Institut National de la Santé et de la Recherche Médicale) Methods and pharmaceutical compositions for treating cancer
CN108753834B (zh) * 2018-05-28 2021-11-23 上海海洋大学 ddx27基因缺失斑马鱼突变体的制备方法
WO2019236448A1 (en) * 2018-06-04 2019-12-12 The Broad Institute, Inc. Therapeutic treatment of microsatellite unstable cancers
US20210371855A1 (en) * 2018-06-15 2021-12-02 Ideaya Biosciences, Inc. Methods of inhibiting proliferative cells
CN108676888B (zh) * 2018-07-12 2022-01-28 吉林大学 一种肺部恶性肿瘤易感性预测试剂盒及系统
CN108676890B (zh) * 2018-07-12 2022-01-28 吉林大学 一种女性乳腺恶性肿瘤易感性预测试剂盒及系统
CN108676889B (zh) * 2018-07-12 2022-02-01 吉林大学 一种胃腺癌易感性预测试剂盒及系统
CN108841960B (zh) * 2018-07-12 2022-02-01 吉林大学 一种结肠腺癌易感性预测试剂盒及系统
CN108866190B (zh) * 2018-07-12 2022-01-28 吉林大学 一种卵巢恶性肿瘤易感性预测试剂盒及系统
KR20210052511A (ko) * 2018-08-31 2021-05-10 가던트 헬쓰, 인크. 무세포 dna에서의 미세부수체 불안정성 검출
JP7514224B2 (ja) * 2018-09-14 2024-07-10 レクセント バイオ, インコーポレイテッド マイクロサテライト不安定性を評価するための方法およびシステム
WO2020081607A1 (en) * 2018-10-15 2020-04-23 Tempus Labs, Inc. Microsatellite instability determination system and related methods
EP3924519A1 (en) 2019-02-14 2021-12-22 Vib Vzw Retrotransposon biomarkers
CN110184358A (zh) * 2019-06-25 2019-08-30 台州市立医院 甲状腺癌早期诊断用的oit3基因及其应用
EP3863019A1 (en) 2020-02-07 2021-08-11 Sophia Genetics S.A. Methods for detecting and characterizing microsatellite instability with high throughput sequencing
CN114182011B (zh) * 2020-09-14 2023-09-15 中山大学附属第六医院 检测微卫星bat25位点稳定性的引物对、试剂盒及方法
CN112522405B (zh) * 2020-12-10 2023-03-21 首都医科大学 Magi3在预测结直肠癌患者预后或化疗敏感性中的应用
CN112626216B (zh) * 2020-12-31 2022-11-01 复旦大学附属中山医院 一种检测肿瘤微卫星不稳定性状态的组合物及其应用
CN112708679B (zh) * 2021-01-27 2023-01-24 厦门艾德生物医药科技股份有限公司 检测人群微卫星不稳定性的生物标志物组及其应用
WO2023285521A1 (en) 2021-07-15 2023-01-19 Vib Vzw Biomarkers predicting response of breast cancer to immunotherapy
CN113736790B (zh) * 2021-10-14 2023-05-02 四川农业大学 一种敲除鸭hnRNPA3基因的sgRNA、细胞系及其构建方法和应用
CN114854861A (zh) * 2022-05-20 2022-08-05 北京大学第一医院 基因组合制备人肿瘤同源重组缺陷、肿瘤突变负荷和微卫星不稳定性分级检测产品的用途

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE60113945T2 (de) * 2000-11-15 2006-06-29 Roche Diagnostics Gmbh Verfahren zur Analyse von Wiederkehrenden PCR-Podukten, das auf der Analyse von DNS-Schmelzkurven basiert
WO2012166151A1 (en) * 2011-06-03 2012-12-06 Biomarin Pharmaceutical Inc. Use of dihydropyridophthalazinone inhibitors of poly (adp-ribose) polymerase (parp) in the treatment of myelodysplastic syndrome (mds) and acute myeloid leukaemia (aml)
CN102230004B (zh) * 2011-06-08 2012-12-26 北京阅微基因技术有限公司 肿瘤细胞微卫星不稳定状态的复合扩增体系及检测试剂盒

Also Published As

Publication number Publication date
CN114058704A (zh) 2022-02-18
KR20150005597A (ko) 2015-01-14
BR112014025185A2 (pt) 2021-06-01
BR112014025185B1 (pt) 2022-06-28
WO2013153130A1 (en) 2013-10-17
JP2015516144A (ja) 2015-06-08
JP6578205B2 (ja) 2019-09-18
AU2013246909A1 (en) 2014-10-30
EP2836606A1 (en) 2015-02-18
CN104379765A (zh) 2015-02-25
EP2836606B1 (en) 2021-12-29
EP3998347A1 (en) 2022-05-18
CA2869729A1 (en) 2013-10-17
RU2014145017A (ru) 2016-05-27
AU2013246909B2 (en) 2018-10-11
CA2869729C (en) 2021-12-28

Similar Documents

Publication Publication Date Title
ES2906023T3 (es) Nuevos marcadores para detectar inestabilidad microsatelital en cáncer y determinar la letalidad sintética con inhibición de la vía de reparación por escisión de bases de ADN
US10633707B2 (en) Markers for detecting microsatellite instability in cancer and determining synthetic lethality with inhibition of the DNA base excision repair pathway
AU2020223754B2 (en) Methods and materials for assessing loss of heterozygosity
US20220010385A1 (en) Methods for detecting inactivation of the homologous recombination pathway (brca1/2) in human tumors
Nowak et al. Detection of mismatch repair deficiency and microsatellite instability in colorectal adenocarcinoma by targeted next-generation sequencing
Patch et al. Whole–genome characterization of chemoresistant ovarian cancer
US10294529B2 (en) Microsatellite instability markers in detection of cancer
Mehrotra et al. Genetic landscape of gallbladder cancer: global overview
Kweekel et al. Explorative study to identify novel candidate genes related to oxaliplatin efficacy and toxicity using a DNA repair array
Albitar et al. Positive selection and high sensitivity test for MYD88 mutations using locked nucleic acid
Kovalchuk Cancer and genomic instability
Gindin et al. Analytical principles of cancer next generation sequencing
Kadiyska et al. Frequency and application of the hot spot BRAF gene mutation (p. V600E) in the diagnostic strategy for Hereditary Nonpolyposis Colorectal Cancer
Dong et al. Detection of MSH2 Gene Methylation in Extramammary Paget’s Disease by Methylation‐Sensitive High‐Resolution Melting Analysis
Díaz Navarro Development of a tool for the identification of somatic mutations and analysis of non-coding mutations in cancer
FARAHANI The utility of Targeted exome sequencing in molecular diagnosis of Lynch Syndrome
Aghasipour et al. Familial Hereditary Prostate Cancer: Genetic, Screening, and Treatment Strategies
Campbell Studies on DNA Replication Repair and Cancer: Insights from Biallelic Mismatch Repair Deficiency Syndrome
Tayeb A Study of Genomic Instability in Chronic Lymphocytic Leukaemia (CLL)
Shinawi Genetic and epigenetic changes in CNS cancers
Sheridan Molecular genetics and cancer risks in Lynch syndrome
Kinsella DNA Mismatch Repair: Its Role in Human Carcinogenesis and as a Predictive and/or Prognostic Biomarker for Cancer Therapy
Hosseinabadi Genomics of lung cancer: tumor evolution, heterogeneity and drug resistance
Kassem Molecular markers and bladder cancer in relation to diagnosis and prognosis