ES2859645T3 - Detección de neoplasia - Google Patents

Detección de neoplasia Download PDF

Info

Publication number
ES2859645T3
ES2859645T3 ES19150809T ES19150809T ES2859645T3 ES 2859645 T3 ES2859645 T3 ES 2859645T3 ES 19150809 T ES19150809 T ES 19150809T ES 19150809 T ES19150809 T ES 19150809T ES 2859645 T3 ES2859645 T3 ES 2859645T3
Authority
ES
Spain
Prior art keywords
methylation
marker
dna
sample
cancer
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
ES19150809T
Other languages
English (en)
Inventor
David A Ahlquist
John B Kisiel
William R Taylor
Tracy C Yab
Douglas W Mahoney
Graham P Lidgard
Hatim T Allawi
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Mayo Foundation for Medical Education and Research
Exact Sciences Development Co LLC
Original Assignee
Mayo Foundation for Medical Education and Research
Exact Sciences Development Co LLC
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Mayo Foundation for Medical Education and Research, Exact Sciences Development Co LLC filed Critical Mayo Foundation for Medical Education and Research
Application granted granted Critical
Publication of ES2859645T3 publication Critical patent/ES2859645T3/es
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6876Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
    • C12Q1/6883Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material
    • C12Q1/6886Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material for cancer
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/112Disease subtyping, staging or classification
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/154Methylation markers

Landscapes

  • Chemical & Material Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Organic Chemistry (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Engineering & Computer Science (AREA)
  • Immunology (AREA)
  • Pathology (AREA)
  • Analytical Chemistry (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Genetics & Genomics (AREA)
  • Hospice & Palliative Care (AREA)
  • Biochemistry (AREA)
  • Microbiology (AREA)
  • Molecular Biology (AREA)
  • Biophysics (AREA)
  • Physics & Mathematics (AREA)
  • Oncology (AREA)
  • Biotechnology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
  • Nitrogen And Oxygen Or Sulfur-Condensed Heterocyclic Ring Systems (AREA)
  • Magnetic Resonance Imaging Apparatus (AREA)

Abstract

Procedimiento de detección de una neoplasia en una muestra obtenida de un sujeto, comprendiendo el procedimiento: 1) analizar un estado de metilación de un marcador en una muestra obtenida de un sujeto; y 2) identificar que el sujeto tiene una neoplasia cuando el estado de metilación del marcador es diferente al estado de metilación del marcador analizado en un sujeto que no tiene una neoplasia, en el que una región cromosómica que tiene una anotación de CD1D comprende el marcador, en el que el marcador comprende una base en una región diferencialmente metilada (DMR) 27, y en el que la neoplasia es una neoplasia de páncreas.

Description

DESCRIPCIÓN
Detección de neoplasia
Campo de la invención
En el presente documento se proporciona tecnología relacionada con la detección de neoplasia y, en particular, pero no exclusivamente, procedimientos, composiciones y usos relacionados para detectar neoplasias premalignas y malignas tales como cáncer de páncreas y colorrectal.
Antecedentes
En su conjunto, los cánceres gastrointestinales representan más mortalidad por cáncer que cualquier otro sistema de órganos. Si bien los cánceres colorrectales se detectan actualmente, la mortalidad anual en Estados Unidos por cánceres gastrointestinales superiores supera los 90.000 en comparación con aproximadamente 50.000 para el cáncer colorrectal. De manera llamativa, 43.000 hombres y mujeres se diagnostican cada año con cáncer de páncreas (PanC, por sus siglas en inglés), que causará casi 37.000 muertes al año (Jemal y col. (2010) "Cancer statistics" CA Cancer J Clin 60: 277-300). Como resultado, el PanC es la cuarta causa principal de muerte por cáncer (id). Los pacientes que presentan síntomas normalmente ya tienen enfermedad en estadio avanzado y solo el 15 % cumple los criterios para cirugía potencialmente curativa (Ghaneh y col. (2007) "Biology and management of pancreatic cancer" Gut 56: 1134-52). A pesar de la cirugía, el 85 % morirá de enfermedad recurrente (Sohn y col. (2000) "Resected adenocarcinoma of the pancreas-616 patients: results, outcomes, and prognostic indicators" J Gastrointest Surg 4: 567-79). La mortalidad por PanC supera el 95 % y la tasa de supervivencia a 5 años es inferior al 25 % para los pacientes sometidos a cirugía curativa (Cleary y col. (2004) "Prognostic factors in resected pancreatic adenocarcinoma: analysis of actual 5-year survivors" J Am Coll Surg 198: 722-31; Yeo y col. (1995) "Pancreaticoduodenectomy for cancer of the head of the pancreas. 201 patients" Ann Surg 221: 721-33).
Entre los pacientes con predisposición sindrómica a PanC o antecedentes familiares importantes, las estrategias de detección agresivas e invasivas que utilizan tomografía computarizada o ecoendoscópica han demostrado un rendimiento del 10% para la neoplasia (Canto y col. (2006) "Screening for early pancreatic neoplasia in high-risk individuals: a prospective controlled study" Clin Gastroenterol Hepatol 4: 766-81). Esta estrategia de detección no es práctica para la población general en la que la mayoría de PanC surgen sin una predisposición conocida (Klein y col. (2001) "Familial pancreatic cancer" Cancer J 7: 266-73).
La letalidad casi uniforme del PanC ha generado un gran interés en comprender la biología de los tumores pancreáticos. Se han identificado lesiones precursoras, incluyendo neoplasia intraepitelial pancreática (PanIN (por sus siglas en inglés), grados I-III) y neoplasia mucinosa papilar intraductal (IPMn , por sus siglas en inglés) (Fernández-del Castillo y col. (2010) "Intraductal papillary mucinous neoplasms of the pancreas" Gastroenterology 139: 708-13, 713.e1-2; Haugk (2010) "Pancreatic intraepithelial neoplasia - can we detect early pancreatic cancer?" Histopathology 57: 503-14). El estudio tanto de precursores como de lesiones malignas ha identificado una serie de características moleculares a niveles genéticos, epigenéticos y proteómicos que podrían aprovecharse para terapia o usarse como biomarcadores para la detección temprana y el cribado (Kaiser (2008) "Cancer genetics. A detailed genetic portrait of the deadliest human cancers" Science 321: 1280-1; Omura y col. (2009) "Epigenetics and epigenetic alterations in pancreatic cancer" Int J Clin Exp Pathol 2: 310-26; Tonack y col. (2009) "Pancreatic cancer: proteomic approaches to a challenging disease" Pancreatology 9: 567-76). Estudios recientes de mapeo de tumores y lesiones metastásicas han demostrado que puede haber un período de latencia significativo entre el desarrollo de PanC maligno y el desarrollo de la enfermedad metastásica, sugiriendo una amplia ventana de oportunidad para la detección y el tratamiento curativo de las lesiones presintomáticas en las primeras etapas (Yachida y col. (2010) "Distant metastasis occurs late during the genetic evolution of pancreatic cancer" Nature 467: 1114-7).
El PanC libera (por ejemplo, exfolia) células y ADN en el efluente local y finalmente en las heces. Por ejemplo, el ADN que contiene un gen KRAS mutante se puede identificar (por ejemplo, secuenciar) a partir del jugo pancreático de pacientes con cáncer de páncreas, PanIN e IPMN (Yamaguchi y col. (2005) "Pancreatic juice cytology in IPMN of the pancreas" Pancreatology 5: 416-21). Anteriormente, se han utilizado ensayos altamente sensibles para detectar ADN mutante en heces emparejadas de pacientes con cáncer de páncreas cuyos tumores extirpados se sabía que contenían las mismas secuencias (Zou y col. (2009) "T2036 PanDetection of Gastrointestinal Neoplasms By Stool DNA Testing: Establishment of Feasibility" Gastroenterology 136: A-625). Una limitación de los marcadores de mutación se relaciona con el difícil procedimiento de su detección en ensayos convencionales; normalmente, cada sitio de mutaciones en múltiples genes debe analizarse por separado para lograr una alta sensibilidad.
El ADN metilado se ha estudiado como una posible clase de biomarcadores en los tejidos de la mayoría de los tipos de tumores. En muchos casos, las ADN metiltransferasas añaden un grupo metilo al ADN en los sitios de islas de citosina-fosfato-guanina (CpG, por sus siglas en inglés) como un control epigenético de la expresión génica. En un mecanismo biológicamente atractivo, se cree que los eventos de metilación adquiridos en las regiones promotoras de genes supresores de tumores silencian la expresión, contribuyendo así a la oncogénesis. La metilación del ADN puede ser una herramienta de diagnóstico más estable química y biológicamente que la expresión de ARN o proteínas (Laird (2010) "Principles and challenges of genome-wide DNA methylation analysis" Nat Rev Genet 11: 191-203). Asimismo, en otros cánceres como el cáncer de colon esporádico, los marcadores de metilación ofrecen una especificidad excelente y son más informativos y sensibles que las mutaciones del ADN individuales (Zou y col. (2007) "Highly methylated genes in colorectal neoplasia: implications for screening" Cancer Epidemiol Biomarkers Prev 16: 2686-96).
El análisis de islas de CpG ha arrojado importantes hallazgos cuando se aplica a modelos animales y líneas celulares humanas. Por ejemplo, Zhang y sus colegas encontraron que los amplicones de diferentes partes de la misma isla de CpG pueden tener diferentes niveles de metilación (Zhang y col. (2009) "DNA methylation analysis of chromosome 21 gene promoters at single base pair and single allele resolution" PLoS Genet 5: e1000438). Además, los niveles de metilación se distribuyeron bimodalmente entre secuencias altamente metiladas y no metiladas, apoyando aún más el patrón binario similar a un cambio de la actividad de la ADN metiltransferasa > Zhang y col. (2009) "DNA methylation analysis of chromosome 21 gene promoters at single base pair and single allele resolution" PLoS Genet 5: e1000438). El análisis de tejidos murinos in vivo y de líneas celulares in vitro demostró que solo aproximadamente un 0,3 % de los promotores de alta densidad de CpG (HCP (por sus siglas en inglés), definidos como que tiene > 7 % de secuencia CpG dentro de una región de 300 pares de bases) estaban metilados, mientras que las áreas de baja densidad de CpG (LCP (por sus siglas en inglés), definidas por tener < 5 % de secuencia de CpG dentro de una región de 300 pares de bases) tendían a estar metiladas con frecuencia en un patrón dinámico específico de tejido (Meissner y col. (2008) "Genome-scale DNA methylation maps of pluripotent and differentiated cells" Nature 454: 766-70). Los HCP incluyen promotores de genes de mantenimiento ubicuos y genes de desarrollo altamente regulados. Entre los sitios de HCP metilados en > 50 % había varios marcadores establecidos tales como Wnt 2, NDRG2, SFRP2 y BMP3 (Meissner y col. (2008) "Genome-scale DNA methylation maps of pluripotent and differentiated cells" Nature 454: 766-70).
Para el cáncer de páncreas, PanIN y lesiones de IPMN, la metilación del marcador se ha estudiado a nivel de tejido (Omura y col. (2008) "Genome-wide profiling of methylated promoters in pancreatic adenocarcinoma" Cancer Biol Ther 7: 1146-56; Sato y col. (2008) "CpG island methylation profile of pancreatic intraepithelial neoplasia" Mod Pathol 21: 238-44; Hong y col. (2008) "Multiple genes are hypermethylated in intraductal papillary mucinous neoplasms of the pancreas" Mod Pathol 21: 1499-507). Por ejemplo, los marcadores MDFI, z Nf415, CNTNAP2 y ELOVL4 estaban altamente metilados en el 96 %, 86 %, 82 % y 68 % de los cánceres estudiados mientras, de manera comparativa, solo el 9 %, 6 %, 3 % y 7 % de los páncreas de control (no cancerosos), respectivamente, estaban altamente metilados en estos mismos cuatro loci (Omura y col. (2008) "Genomewide profiling of methylated promoters in pancreatic adenocarcinoma" Cancer Biol Ther 7: 1146-56). Se encontró que la medición del estado de metilación tanto de MDFI como de CNTNAP2 proporcionaba un indicador para el cáncer de páncreas que tenía tanto una alta sensibilidad (> 90 %) como una alta especificidad (> 85 %) (Omura y col. (2008) "Genome-wide profiling of methylated promoters in pancreatic adenocarcinoma" Cancer Biol Ther 7: 1146-56).
Asimismo, Sato y sus colegas encontraron ocho genes expresados diferencialmente en líneas celulares de cáncer de páncreas antes y después del tratamiento con un inhibidor de metiltransferasa (Sato y col. (2003) "Discovery of novel targets for aberrant methylation in pancreatic carcinoma using high-throughput microarrays" Cancer Res 63: 3735-42). Estos marcadores se evaluaron posteriormente mediante PCR específica de metilación (MSP, por sus siglas en inglés) de ADN de lesiones de Pan-IN. Los resultados mostraron que SARP-2 (proteína 1 secretada relacionada con Frizzled, SFRP1, por sus siglas en inglés) tenía una sensibilidad del 83 % y podía discriminar entre Pan-IN 2 y Pan-IN 3 de grado superior (Sato y col. (2008) "CpG island methylation profile of pancreatic intraepithelial neoplasia" Mod Pathol 21: 238-44). La discriminación de un cáncer precursor de alto grado o en estadio temprano a partir de una lesión de grado inferior es importante cuando se considera la morbilidad de la pancreoduodenectomía o la pancreatectomía distal, las principales terapias quirúrgicas para PanC. Al estudiar tanto los precursores de IPMN de conducto principal y de rama lateral, Hong y sus colegas también mostraron una alta sensibilidad y especificidad para SFRP1, especialmente en combinación con UCHL1 (Hong y col. (2008) "Multiple genes are hypermethylated in intraductal papillary mucinous neoplasms of the pancreas" Mod Pathol 21: 1499-507). El inhibidor 2 de la vía del factor tisular (TFPI2, por sus siglas en inglés) tiene un papel supresor de tumores bien establecido en neoplasias malignas GU y GI, incluyendo cánceres de próstata, cuello uterino, colorrectal, gástrico, esófago y páncreas (Ma y col. (2011) "MicroRNA-616 induces androgen-independent growth of prostate cancer cells by suppressing expression of tissue factor pathway inhibitor TFPI-2" Cancer Res 71: 583-92; Lim y col. (2010) "Cervical dysplasia: assessing methylation status (Methylight) of CCNA1, DAPK1, HS3ST2, PAX1 and TFPI2 to improve diagnostic accuracy" Gynecol Oncol 119: 225-31; Hibi y col. (2010) "Methylation of TFPI2 gene is frequently detected in advanced welldifferentiated colorectal cancer" Anticancer Res 30: 1205-7; Glockner y col. (2009) "Methylation of TFPI2 in stool DNA: a potential novel biomarker for the detection of colorectal cancer" Cancer Res 69: 4691-9; Hibi y col. (2010) "Methylation of the TFPI2 gene is frequently detected in advanced gastric carcinoma" Anticancer Res 30: 4131-3; Tsunoda y col. (2009) "Methylation of CLd N6, FBN2, RBP1, RBP4, TFPI2, and TMEFF2 in esophageal squamous cell carcinoma" Oncol Rep 21: 1067-73; Tang y col. (2010) "Prognostic significance of tissue factor pathway inhibitor-2 in pancreatic carcinoma and its effect on tumor invasion and metastasis" Med Oncol 27: 867-75; Brune y col. (2008) "Genetic and epigenetic alterations of familial pancreatic cancers" Cancer Epidemiol Biomarkers Prev 17: 3536-4). También se ha demostrado que este marcador se libera en la luz GI y tiene una sensibilidad del 73 % cuando se analiza a partir del jugo pancreático de sujetos con cáncer y normales (Matsubayashi y col. (2006) "DNA methylation alterations in the pancreatic juice of patients with suspected pancreatic disease" Cancer Res 66: 1208­ El TFPI2 se encontraba entre un gran número de posibles marcadores de mutación y mutilación estudiados en muestras de tejido y heces como candidatos a neoplasia colorrectal. En un análisis de conjunto de pruebas de capacitación de heces de archivo de casi 700 sujetos, se demostró que un perfil de metilación de marcadores múltiples, incluyendo TFPI2, BMP3, NDRG4 y vimentina, tenía una sensibilidad del 85 % en CCR y del 64 % en adenomas colorrectales avanzados, ambos con una especificidad del 90% (Ahlquist D y col. (2010) "Next Generation Stool DNA Testing for Detection of Colorectal Neoplasia - Early Marker Evaluation", presentada en Colorectal Cancer: Biology to Therapy, American Association for Cancer Research).
Investigaciones anteriores han analizado el rendimiento de los marcadores de metilación del cáncer colorrectal en la detección de PanC. En particular, un estudio de casos y controles comparó el ADN de los casos de tumores de PanC con el ADN del epitelio colónico utilizando MSP dirigida a los marcadores previamente informados en PanC (por ejemplo, MDFI, s Fr P2, UCHL1, CNTNAP2 y TFPI2) y marcadores de neoplasia de colon discriminantes adicionales (por ejemplo, BMP3, EYA4, vimentina y NDRG4). Un modelo de regresión de marcadores múltiples mostró que EYA4, UCHL1 y MDFI fueron altamente discriminantes, con un área bajo la curva de rendimiento diagnóstico de 0,85. Como marcador individual, se encontró que BMP3 tenía un área bajo la curva de rendimiento diagnóstico de 0,90. Estos cuatro marcadores y KRAS mutante se analizaron posteriormente en un conjunto más grande de muestras de heces de sujetos con PanC en una comparación ciega con heces emparejadas de individuos con una colonoscopia normal. Individualmente, BMP3 y KRAS fueron muy específicos pero poco sensibles; en combinación, la sensibilidad mejoró al 65 % mientras que se mantuvo el 88 % de especificidad (Kisiel, y col. (2011) "Stool DNA screening for colorectal cancer: opportunities to improve value with next generation tests" J Clin Gastroenterol 45: 301-8. Estos resultados sugirieron que las diferencias de metilación en UCHL1, EYA4 y MDFI a nivel del páncreas se ocultaron por la metilación colónica de fondo en la comparación basada en heces. Como tal, la detección de cáncer necesita un marcador o perfil de marcadores para el PanC que sea ampliamente informativo y exhiba una alta especificidad para el PanC a nivel de tejido cuando se interroga en muestras tomadas de un sujeto (por ejemplo, una muestra de heces).
Sumario
Por consiguiente, en el presente documento se proporciona tecnología para marcadores de detección de cáncer de páncreas y otros marcadores de detección de cáncer gastrointestinal que proporcionan una relación señal/ruido alta y un nivel de fondo bajo cuando se detectan a partir de muestras tomadas de un sujeto (por ejemplo, muestra de heces). Los marcadores se identificaron en un estudio de casos y controles mediante la comparación del estado de metilación de los marcadores de ADN de los tumores de sujetos con PanC en estadio I y estadio II con el estado de metilación de los mismos marcadores de ADN de los sujetos de control (por ejemplo, tejido normal tal como colon normal y/o páncreas no neoplásico) (véanse los ejemplos 1 y 11).
Se identificaron marcadores y/o perfiles de marcadores (por ejemplo, una región cromosómica que tiene una anotación seleccionada de ABCB1, ADCY1, BHLHE23 (LOC63930), c13orf18, CACNA1C, chr12 133, CLEC11A, ELMO1, EOMES, CLEC 11, SHH, GJC1, IHIF1, IKZF1, KCNK12, KCNN2, PCBP3, PRKCB, RSPO3, SCARF2, SLC38A3, ST8SIA1, TWIST1, VWC2, WT1 y ZNF71) en un estudio de casos y controles mediante la comparación del estado de metilación de marcadores de ADN (por ejemplo, de tumores de sujetos con PanC en estadio I y II con el estado de metilación de los mismos marcadores de ADN de sujetos de control (por ejemplo, tejido normal tal como colon normal y/o páncreas no neoplásico) (véanse los ejemplos 2 y 8).
Se identificaron marcadores y/o perfiles de marcadores (por ejemplo, una región cromosómica que tiene una anotación seleccionada de n Dr g 4, SFRP1, BMP3, HPP1 y/o a Pc ) en estudios de casos y controles mediante la comparación del estado de metilación de marcadores de ADN de tejido esofágico de sujetos con esófago de Barrett con el estado de metilación de los mismos marcadores de ADN de sujetos de control (véanse los ejemplos 4 y 10). Se identificaron marcadores y/o perfiles de marcadores (por ejemplo, una región cromosómica que tiene una anotación seleccionada de ADCY1, PRKCB, KCNK12, C13ORF18, IKZF1, TWIST1, ELMO, 55957, CD1D, CLEC11A, KCNN2, BMP3 y/o NDRG4) en estudios de casos y controles mediante la comparación del estado de metilación de marcadores de ADN de una muestra de jugo pancreático de sujetos con cáncer de páncreas con el estado de metilación de los mismos marcadores de ADN de sujetos de control (véanse los ejemplos 5 y 6).
Se identificó un marcador (por ejemplo, una región cromosómica que tiene una anotación CD1D) en un estudio de casos y controles mediante la comparación del estado de metilación de un marcador de ADN (por ejemplo, CD1D) de una muestra de heces de sujetos con cáncer de páncreas con el estado de metilación del mismo marcador de ADN de sujetos de control que no tenían cáncer de páncreas (véase el ejemplo 7).
Se identificó un marcador (por ejemplo, miR-1290) en un estudio de casos y controles mediante la comparación de la cantidad cuantificada de un marcador de ADN (por ejemplo, miR-1290) de una muestra de heces de sujetos con cáncer de páncreas con la cantidad cuantificada del mismo marcador de ADN de sujetos de control que no tenían cáncer de páncreas (véase el ejemplo 9).
El análisis estadístico adicional de los resultados demostró que la tecnología descrita en el presente documento basada en estos marcadores predice de forma específica y sensible un sitio de tumor.
Como se describe en el presente documento, la tecnología proporciona una serie de marcadores de ADN metilados y subconjuntos de los mismos (por ejemplo, conjuntos de 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12 o más marcadores) con alta discriminación para neoplasias GI en general y/o en sitios de tumores individuales. Los experimentos aplicaron un filtro de selección a los marcadores candidatos para identificar los marcadores que proporcionan una alta relación señal/ruido y un nivel de fondo bajo para proporcionar una alta especificidad, por ejemplo, cuando se analizan medios de cultivo distantes (por ejemplo, heces, sangre, orina, tejido metastásico, etc.) para fines de detección o diagnóstico de cáncer. Además, se realizaron experimentos para demostrar que los marcadores de ADN metilados identificados predicen el sitio del tumor. Como tal, la tecnología proporciona marcadores específicos, combinaciones de marcadores y algoritmos para predecir el sitio del tumor.
En algunas realizaciones, la tecnología está relacionada con la evaluación de la presencia y el estado de metilación de uno o más de los marcadores identificados en el presente documento en una muestra biológica. Estos marcadores comprenden una o más regiones metiladas diferencialmente (DMR, por sus siglas en inglés) como se estudia en el presente documento, por ejemplo, como se proporciona en la tabla 1 y/o en la tabla 10. El estado de metilación se evalúa en realizaciones de la tecnología. Como tal, la tecnología proporcionada en el presente documento no está restringida en el procedimiento mediante el cual se mide el estado de metilación de un gen. Por ejemplo, en algunas realizaciones, el estado de metilación se mide mediante un procedimiento de exploración del genoma. Por ejemplo, un procedimiento implica la exploración genómica de puntos de referencia de restricción (Kawai y col. (1994) Mol. Cell. Biol. 14: 7421-7427) y otro ejemplo implica PCR cebada arbitrariamente sensible a metilación (Gonzalgo y col. (1997) Cancer Res. 57: 594-599). En algunas realizaciones, los cambios en los patrones de metilación en sitios CpG específicos se controlan mediante la digestión de ADN genómico con enzimas de restricción sensibles a la metilación seguida de análisis Southern de las regiones de interés (procedimiento de digestión Southern). En algunas realizaciones, el análisis de cambios en los patrones de metilación implica un procedimiento basado en PCR que implica la digestión del ADN genómico con enzimas de restricción sensibles a la metilación antes de la amplificación por PCR (Singer-Sam y col. (1990) Nucl. Acids Res. 18: 687). Además, se ha informado de otras técnicas que utilizan el tratamiento de ADN con bisulfito como punto de partida para el análisis de metilación. Estas incluyen p Cr específica de metilación (MSP) (Herman y col. (1992) Proc. Natl. Acad. Sci. USA 93: 9821-9826) y digestión con enzimas de restricción de productos de PCR amplificados a partir de ADN convertido con bisulfito (Sadri y Hornsby (1996) Nucl. Acids Res. 24: 5058-5059; y Xiong y Laird (1997) Nucl. Acids Res. 25: 2532­ 2534). Se han desarrollado técnicas de PCR para la detección de mutaciones génicas (Kuppuswamy y col. (1991) Proc. Natl. Acad. Sci. USA 88: 1143-1147) y la cuantificación de la expresión específica alélica (Szabo y Mann (1995) Genes Dev. 9: 3097-3108; y Singer-Sam y col. (1992) PCR Methods Appl. 1: 160-163). Dichas técnicas utilizan cebadores internos, que se hibridan a un molde generado por PCR y terminan inmediatamente en 5' del nucleótido único que se va a analizar. En algunas realizaciones se utilizan procedimientos que utilizan un "ensayo cuantitativo de Ms-SNuPE" como se describe en la patente de EE.UU. n.° 7.037.650.
Tras evaluar un estado de metilación, el estado de metilación a menudo se expresa como la fracción o porcentaje de cadenas individuales de ADN que está metilado en un sitio en particular (por ejemplo, en un solo nucleótido, en una región o locus en particular, en una secuencia de interés más larga, por ejemplo, hasta una subsecuencia de un ADN de ~ 100 pb, 200 pb, 500 pb, 1000 pb o más) en relación con la población total de ADN en la muestra que comprende ese sitio en particular. Tradicionalmente, la cantidad de ácido nucleico no metilado se determina mediante PCR utilizando calibradores. A continuación, una cantidad conocida de ADN se trata con bisulfito y la secuencia específica de metilación resultante se determina utilizando una PCR en tiempo real u otra amplificación exponencial, por ejemplo, un ensayo QuARTS (por ejemplo, como se proporciona en la patente de EE.UU. n.° 8.361.720; y en las publicaciones de solicitud de patente de EE.Uu . n.° 2012/0122088 y 2012/0122106, incorporadas en el presente documento por referencia).
Por ejemplo, en algunas realizaciones, los procedimientos comprenden generar una curva estándar para la diana no metilada utilizando patrones externos. La curva estándar se construye a partir de al menos dos puntos y relaciona el valor de Ct en tiempo real para el ADN no metilado con patrones cuantitativos conocidos. A continuación, se construye una segunda curva estándar para la diana metilada a partir de al menos dos puntos y patrones externos. Esta segunda curva estándar relaciona el Ct para el ADN metilado con patrones cuantitativos conocidos. A continuación, los valores de Ct de la muestra de ensayo se determinan para las poblaciones metiladas y no metiladas y se calculan los equivalentes genómicos de ADN a partir de las curvas estándar producidas por las dos primeras etapas. El porcentaje de metilación en el sitio de interés se calcula a partir de la cantidad de ADN metilado en relación con la cantidad total de ADN en la población, por ejemplo, (número de ADN metilados)/(número de ADN metilados número de ADN no metilados) x 100.
También se proporcionan en el presente documento composiciones y kits para practicar los procedimientos. Por ejemplo, en algunas realizaciones, los reactivos (por ejemplo, cebadores, sondas) específicos para uno o más marcadores se proporcionan solos o en conjuntos (por ejemplo, conjuntos de pares de cebadores para amplificar una pluralidad de marcadores). También se pueden proporcionar reactivos adicionales para realizar un ensayo de detección (por ejemplo, enzimas, tampones, controles positivos y negativos para la realización de QuARTS, PCR, secuenciación, ensayos con bisulfito u otros ensayos). En algunas realizaciones, se proporcionan los kits que contienen uno o más reactivos necesarios, suficientes o útiles para realizar un procedimiento. También se proporcionan mezclas de reacciones que contienen los reactivos. Además, se proporcionan conjuntos de reactivos de mezcla maestra que contienen una pluralidad de reactivos que se pueden añadir entre sí y/o a una muestra de ensayo para completar una mezcla de reacción.
En algunas realizaciones, la tecnología descrita en el presente documento está asociada con una máquina programare diseñada para realizar una secuencia de operaciones aritméticas o lógicas según lo proporcionado por los procedimientos descritos en el presente documento. Por ejemplo, algunas realizaciones de la tecnología están asociadas con (por ejemplo, implementadas en) un programa informático de ordenador y/o equipo de ordenador. En un aspecto, la tecnología se refiere a un ordenador que comprende una forma de memoria, un elemento para realizar operaciones aritméticas y lógicas, y un elemento de procesamiento (por ejemplo, un microprocesador) para ejecutar una serie de instrucciones (por ejemplo, un procedimiento como se proporciona en el presente documento) para leer, manipular y almacenar datos. En algunas realizaciones, un microprocesador es parte de un sistema para determinar un estado de metilación (por ejemplo, de una o más DMR, por ejemplo, DMR 1-107 como se indica en la tabla 1, por ejemplo, DMR 1-449 en la tabla 10); comparar estados de metilación (por ejemplo, de una o más DMR, por ejemplo, DMR 1-107 como se indica en la tabla 1, por ejemplo, DMR 1-449 en la tabla 10); generar curvas estándar; determinar un valor de Ct; calcular una fracción, frecuencia o porcentaje de metilación (por ejemplo, de una o más DMR, por ejemplo, DMR 1-107 como se indica en la tabla 1, por ejemplo, DMR 1-449 en la tabla 10); identificar una isla de CpG; determinar una especificidad y/o sensibilidad de un ensayo o marcador; calcular una curva ROC y un ABC asociada; análisis de secuencia; todo como se describe en el presente documento o se conoce en la materia.
En algunas realizaciones, un microprocesador o un ordenador usa datos del estado de metilación en un algoritmo para predecir un sitio de un cáncer.
En algunas realizaciones, un componente del programa informático o equipo recibe los resultados de múltiples ensayos y determina un resultado de valor único para informar a un usuario que indica un riesgo de padecer cáncer basado en los resultados de los múltiples ensayos (por ejemplo, determinar el estado de metilación de múltiples DMR, por ejemplo, como se indica en la tabla 1, por ejemplo, como se indica en la tabla 10). Las realizaciones relacionadas calculan un factor de riesgo basado en una combinación matemática (por ejemplo, una combinación ponderada, una combinación lineal) de los resultados de múltiples ensayos, por ejemplo, determinando los estados de metilación de múltiples marcadores (tales como múltiples DMR, por ejemplo, como se indica en la tabla 1, por ejemplo, como se indica en la tabla 10). En algunas realizaciones, el estado de metilación de una DMR define una dimensión y puede tener valores en un espacio multidimensional y la coordenada definida por los estados de metilación de múltiples DMR es un resultado, por ejemplo, para informar a un usuario, por ejemplo, relacionado con un riesgo de padecer cáncer.
Algunas realizaciones comprenden un medio de almacenamiento y componentes de memoria. Los componentes de memoria (por ejemplo, memoria volátil y/o no volátil) encuentran uso en el almacenamiento de instrucciones (por ejemplo, una realización de un procedimiento como se proporciona en el presente documento) y/o datos (por ejemplo, una pieza de trabajo tal como mediciones de metilación, secuencias y descripciones estadísticas asociadas con las mismas). Algunas realizaciones se refieren a sistemas que también comprenden una o más CPU, una tarjeta gráfica y una interfaz de usuario (por ejemplo, que comprende un dispositivo de salida tal como una pantalla y un dispositivo de entrada tal como un teclado).
Las máquinas programables asociadas con la tecnología comprenden tecnologías convencionales existentes y tecnologías en desarrollo o aún por desarrollar (por ejemplo, un ordenador cuántico, un ordenador químico, un ordenador de ADN, un ordenador óptico, un ordenador basado en espintrónica, etc.).
En algunas realizaciones, la tecnología comprende un cableado (por ejemplo, cable metálico, fibra óptica) o medio de transmisión inalámbrica para transmitir datos. Por ejemplo, algunas realizaciones se refieren a la transmisión de datos a través de una red (por ejemplo, una red de área local (LAN, por sus siglas en inglés), una red de área amplia (WAN, por sus siglas en inglés), una red según las necesidades,, Internet, etc.). En algunas realizaciones, las máquinas programables están presentes en dicha red como semejantes y, en algunas realizaciones, las máquinas programables tienen una relación cliente/servidor.
En algunas realizaciones, los datos se almacenan en un medio de almacenamiento legible por ordenador, tal como un disco duro, memoria instantánea, medios ópticos, un disquete, etc.
En algunas realizaciones, la tecnología proporcionada en el presente documento está asociada con una pluralidad de dispositivos programables que operan en conjunto para realizar un procedimiento como se describe en el presente documento. Por ejemplo, en algunas realizaciones, una pluralidad de ordenadores (por ejemplo, conectados por una red) pueden trabajar en paralelo para recoger y procesar datos, por ejemplo, en una implementación de informática en grupo o informática en cuadrícula o alguna otra arquitectura informática distribuida que se basa en ordenadores completos (con CPU integradas, almacenamiento, fuentes de alimentación, interfaces de red, etc.) conectados a una red (privada, público, o Internet) mediante una interfaz de red convencional, tal como Ethernet, fibra óptica o mediante una tecnología de red inalámbrica.
Por ejemplo, algunas realizaciones proporcionan una computadora que incluye un medio legible por ordenador. La realización incluye una memoria de acceso aleatorio (RAM, por sus siglas en inglés) acoplada a un procesador. El procesador ejecuta las instrucciones del programa ejecutable por ordenador almacenadas en la memoria. Dichos procesadores pueden incluir un microprocesador, un ASIC, una máquina de estado u otro procesador, y puede ser cualquiera de varios procesadores informáticos, tales como procesadores de Intel Corporation of Santa Clara, California y Motorola Corporation of Schaumburg, Illinois. Dichos procesadores incluyen, o pueden estar en comunicación con, medios, por ejemplo, medios legibles por ordenador, que almacenan instrucciones que, cuando se ejecutan por el procesador, hacen que el procesador realice las etapas descritas en el presente documento.
Las realizaciones de los medios legibles por ordenador incluyen, pero sin limitación, un dispositivo de almacenamiento o transmisión electrónica, óptico, magnético u otro capaz de proporcionar un procesador con instrucciones legibles por ordenador. Otros ejemplos de medios adecuados incluyen, pero sin limitación, un disquete, CD-ROM, DVD, disco magnético, chip de memoria, ROM, RAM, un ASIC, un procesador configurado, todos los medios ópticos, toda cinta magnética u otros medios magnéticos, o cualquier otro medio desde el cual un procesador informático pueda leer instrucciones. Además, varias otras formas de medios legibles por ordenador pueden transmitir o llevar instrucciones a un ordenador, incluyendo un enrutador, una red privada o pública, u otro dispositivo o canal de transmisión, tanto alámbricos como inalámbricos. Las instrucciones pueden comprender código de cualquier lenguaje de programación informática adecuado, incluyendo, por ejemplo, C, C++, C#, Visual Basic, Java, Python, Perl, y JavaScript.
En algunas realizaciones, los ordenadores están conectados a una red. Los ordenadores también pueden incluir varios dispositivos externos o internos, tales como un ratón, un CD-ROM, DVD, un teclado, una pantalla u otros dispositivos de entrada o salida. Ejemplos de ordenadores son ordenadores personales, asistentes digitales, asistentes digitales personales, teléfonos celulares, teléfonos móviles, teléfonos inteligentes, localizadores, tabletas digitales, ordenadores portátiles, dispositivos de Internet y otros dispositivos basados en procesadores. En general, los ordenadores relacionados con aspectos de la tecnología proporcionada en el presente documento pueden ser cualquier tipo de plataforma basada en procesador que opere en cualquier sistema operativo, tal como Microsoft Windows, Linux, UNIX, Mac OS X, etc., capaz de soportar uno o más programas que comprenden la tecnología proporcionada en el presente documento. Algunas realizaciones comprenden un ordenador personal que ejecuta otros programas de aplicación (por ejemplo, aplicaciones). Las aplicaciones pueden estar contenidas en la memoria y pueden incluir, por ejemplo, una aplicación de procesamiento de textos, una aplicación de hoja de cálculo, una aplicación de correo electrónico, una aplicación de mensajería instantánea, una aplicación de presentación, una aplicación de navegador de Internet, una aplicación de calendario/organizador y cualquier otra aplicación capaz de ser ejecutada por un dispositivo del cliente.
Todos esos componentes, ordenadores y sistemas descritos en el presente documento como asociados con la tecnología pueden ser lógicos o virtuales.
Por consiguiente, en el presente documento se proporciona tecnología relacionada con un procedimiento de detección de una neoplasia en una muestra obtenida de un sujeto, comprendiendo el procedimiento analizar un estado de metilación de un marcador en una muestra obtenida de un sujeto; e identificar que el sujeto tiene una neoplasia cuando el estado de metilación del marcador es diferente al estado de metilación del marcador ensayado en un sujeto que no tiene una neoplasia, en el que el marcador comprende una base en una región metilada diferencialmente (DMR) seleccionada de un grupo que consiste en DMR 1-107 como se proporciona en la tabla 1 y/o DMR 1-449 en la tabla 10. En algunas realizaciones, el procedimiento comprende además localizar el sitio de la neoplasia dentro del sujeto, en el que el estado de metilación del marcador indica el sitio de la neoplasia dentro del sujeto. La tecnología está relacionada con la identificación y discriminación de cánceres gastrointestinales, por ejemplo, en algunas realizaciones, la neoplasia es una neoplasia gastrointestinal. En algunas realizaciones, la neoplasia está presente en el área gastrointestinal superior del paciente y, en algunas realizaciones, la neoplasia está presente en el área gastrointestinal inferior del paciente. En realizaciones particulares, la neoplasia es una neoplasia de páncreas, una neoplasia colorrectal, una neoplasia de las vías biliares o un adenoma. La tecnología también abarca la determinación del estado o estadio de un cáncer, por ejemplo, en algunas realizaciones, la neoplasia es precancerosa. Algunas realizaciones proporcionan procedimientos que comprenden analizar una pluralidad de marcadores, por ejemplo, que comprenden analizar de 2 a 11 marcadores.
La tecnología no está limitada en el estado de metilación evaluado. En algunas realizaciones, evaluar el estado de metilación del marcador en la muestra comprende determinar el estado de metilación de una base. En algunas realizaciones, analizar el estado de metilación del marcador en la muestra comprende determinar el grado de metilación en una pluralidad de bases. Además, en algunas realizaciones, el estado de metilación del marcador comprende una metilación aumentada del marcador con respecto a un estado de metilación normal del marcador. En algunas realizaciones, el estado de metilación del marcador comprende una metilación disminuida del marcador con respecto a un estado de metilación normal del marcador. En algunas realizaciones, el estado de metilación del marcador comprende un patrón diferente de metilación del marcador en relación con un estado de metilación normal del marcador.
Asimismo, en algunas realizaciones, el marcador es una región de 100 bases o menos, el marcador es una región de 500 bases o menos, el marcador es una región de 1000 bases o menos, el marcador es una región de 5000 bases o menos, o, en algunas realizaciones, el marcador es una base. En algunas realizaciones, el marcador está en un promotor de alta densidad de CpG.
La tecnología no está limitada por el tipo de muestra. Por ejemplo, en algunas realizaciones, la muestra es una muestra de heces, una muestra de tejido, una muestra de jugo pancreático, una muestra de líquido de un quiste pancreático, una muestra de sangre (por ejemplo, plasma, suero, sangre completa), una excreción o una muestra de orina.
Asimismo, la tecnología no está limitada en el procedimiento utilizado para determinar el estado de metilación. En algunas realizaciones, el ensayo comprende usar una reacción en cadena de la polimerasa específica de metilación, secuenciación de ácido nucleico, espectrometría de masas, nucleasa específica de metilación, separación basada en masa o captura de dianas. En algunas realizaciones, el ensayo comprende el uso de un oligonucleótido específico de metilación. En algunas realizaciones, la tecnología utiliza secuenciación masivamente paralela (por ejemplo, secuenciación de próxima generación) para determinar el estado de metilación, por ejemplo, secuenciación por síntesis, secuenciación en tiempo real (por ejemplo, de una sola molécula), secuenciación de emulsión de perlas, secuenciación de nanoporos, etc.
La tecnología proporciona reactivos para detectar una DMR, por ejemplo, en algunas realizaciones se proporciona un conjunto de oligonucleótidos que comprenden las secuencias proporcionadas por las SEQ ID NO: 1-202. En algunas realizaciones se proporciona un oligonucleótido que comprende una secuencia complementaria a una región cromosómica que tiene una base en una DMR, por ejemplo, un oligonucleótido sensible al estado de metilación de una DMR.
La tecnología proporciona varios perfiles de marcadores, por ejemplo, en algunas realizaciones, el marcador comprende una región cromosómica que tiene una anotación que es ABCB1, ADCY1, BHLHE23 (LOC63930), c13orf18, CACNA1C, chr12.133, CLEC11A, ELMO1, EOMES, GJC1, IHIF1, IKZF1, KCNK12, KCNN2, NDRG4, PCBP3, PRKCB, RSPO3, SCARF2, SLC38A3, ST8SIA1, TWIST1, VWC2, WT1, o ZNF71, y que comprende el marcador (véanse las tablas 1 y 9). Además, las realizaciones proporcionan un procedimiento para analizar una DMR de la tabla 1 que es la DMR n.° 11, 14, 15, 65, 21,22, 23, 5, 29, 30, 38, 39, 41, 50, 51, 55, 57, 60, 61, 8, 75, 81, 82, 84, 87, 93, 94, 98, 99, 103, 104 o 107, y/o una DMR correspondiente a Chr16:58497395-58497458. Algunas realizaciones proporcionan la determinación del estado de metilación de un marcador, en la que una región cromosómica que tiene una anotación que es CLEC11A, C13ORF18, KCNN2, ABCB1, SLC38A3, CD1D, IKZF1, ADCY1, CHR12133, RSPO3, MBP3, PRKCB, NDRG4, ELMO o TWIST1 comprende el marcador. En algunas realizaciones, los procedimientos comprenden determinar el estado de metilación de dos marcadores, por ejemplo, un par de marcadores proporcionados en una fila de la tabla 5.
Se proporcionan realizaciones de kits, por ejemplo, un kit que comprende un reactivo bisulfito; y un ácido nucleico de control que comprende una secuencia de una DMR seleccionada de un grupo que consiste en DMR 1-107 (de la tabla 1) y/o una DMR seleccionada de un grupo que consiste en DMR 1-449 (de la tabla 10) y que tiene un estado de metilación asociado con un sujeto que no tiene un cáncer. En algunas realizaciones, los kits comprenden un reactivo bisulfito y un oligonucleótido como se describe en el presente documento. En algunas realizaciones, los kits comprenden un reactivo bisulfito; y un ácido nucleico de control que comprende una secuencia de una DMR seleccionada de un grupo que consiste en DMR 1-107 (de la tabla 1) y/o DMR 1-449 (de la tabla 10) y que tiene un estado de metilación asociado con un sujeto que tiene un cáncer. Algunas realizaciones del kit comprenden un recolector de muestras para obtener una muestra de un sujeto (por ejemplo, una muestra de heces); reactivos para aislar un ácido nucleico de la muestra; un reactivo bisulfito; y un oligonucleótido como se describe en el presente documento.
La tecnología está relacionada con realizaciones de composiciones (por ejemplo, mezclas de reacción). En algunas realizaciones, se proporciona una composición que comprende un ácido nucleico que comprende una DMR y un reactivo bisulfito. Algunas realizaciones proporcionan una composición que comprende un ácido nucleico que comprende una DMR y un oligonucleótido como se describe en el presente documento. Algunas realizaciones proporcionan una composición que comprende un ácido nucleico que comprende una DMR y una enzima de restricción sensible a la metilación. Algunas realizaciones proporcionan una composición que comprende un ácido nucleico que comprende una DMR y una polimerasa.
Se proporcionan realizaciones de procedimientos relacionados adicionales para la detección de una neoplasia en una muestra obtenida de un sujeto, por ejemplo, un procedimiento que comprende determinar un estado de metilación de un marcador en la muestra que comprende una base en una DMR que es una o más de DMR 1-107 (de la tabla 1) y/o una o más de DMR 1-449 (de la tabla 10); comparar el estado de metilación del marcador de la muestra del sujeto con un estado de metilación del marcador de una muestra de control normal de un sujeto que no tiene un cáncer; y determinar un intervalo de confianza y/o un valor p de la diferencia en el estado de metilación de la muestra del sujeto y la muestra de control normal. En algunas realizaciones, el intervalo de confianza es del 90 %, 95%, 97,5%, 98%, 99%, 99,5%, 99,9% o 99,99% y el valor p es 0,1, 0,05, 0,025, 0,02, 0,01, 0,005, 0,001 o 0,0001. Algunas realizaciones de procedimientos proporcionan etapas de hacer reaccionar un ácido nucleico que comprende una DMR con un reactivo bisulfito para producir un ácido nucleico que ha reaccionado con bisulfito; secuenciar el ácido nucleico que ha reaccionado con bisulfito para proporcionar una secuencia nucleotídica del ácido nucleico que ha reaccionado con bisulfito; comparar la secuencia nucleotídica del ácido nucleico que ha reaccionado con bisulfito con una secuencia nucleotídica de un ácido nucleico que comprende la DMR de un sujeto que no tiene un cáncer para identificar diferencias en las dos secuencias; e identificar al sujeto con una neoplasia cuando hay una diferencia.
La tecnología proporciona sistemas para el cribado de una neoplasia en una muestra obtenida de un sujeto. Las realizaciones ilustrativas de sistemas incluyen, por ejemplo, un sistema para el cribado de una neoplasia en una muestra obtenida de un sujeto, comprendiendo el sistema un componente de análisis configurado para determinar el estado de metilación de una muestra, un componente de programa informático configurado para comparar el estado de metilación de la muestra con una muestra de control o un estado de metilación de la muestra de referencia registrado en una base de datos, y un componente de alerta configurado para alertar a un usuario de un estado de metilación asociado con cáncer. En algunas realizaciones, una alerta se determina mediante un componente de programa informático que recibe los resultados de múltiples ensayos (por ejemplo, determinando los estados de metilación de múltiples marcadores, por ejemplo, DMR, por ejemplo, como se indica en la tabla 1, por ejemplo, como se indica en la tabla 10) y calcula un valor o resultado para informar basándose en los múltiples resultados. Algunas realizaciones proporcionan una base de datos de parámetros ponderados asociados con cada DMR proporcionada en el presente documento para su uso en el cálculo de un valor o resultado y/o una alerta para informar a un usuario (por ejemplo, un médico, enfermera, facultativo, etc.). En algunas realizaciones se informan todos los resultados de múltiples ensayos y en algunas realizaciones se usan uno o más resultados para proporcionar una puntuación, valor, o resultado basado en una combinación de uno o más resultados de múltiples ensayos que es indicativo de un riesgo de padecer cáncer en un sujeto.
En algunas realizaciones de sistemas, una muestra comprende un ácido nucleico que comprende una DMR. En algunas realizaciones, el sistema comprende además un componente para aislar un ácido nucleico, un componente para recoger una muestra tal como un componente para recoger una muestra de heces. En algunas realizaciones, el sistema comprende secuencias de ácido nucleico que comprenden una DMR. En algunas realizaciones, la base de datos comprende secuencias de ácido nucleico de sujetos que no tienen un cáncer. También se proporcionan ácidos nucleicos, por ejemplo, un conjunto de ácidos nucleicos, teniendo cada ácido nucleico una secuencia que comprende una DMR. En algunas realizaciones, el conjunto de ácidos nucleicos en el que cada ácido nucleico tiene una secuencia de un sujeto que no tiene un cáncer. Las realizaciones de sistemas relacionados comprenden un conjunto de ácidos nucleicos como se describe y una base de datos de secuencias de ácidos nucleicos asociadas con el conjunto de ácidos nucleicos. Algunas realizaciones comprenden además un reactivo bisulfito. Y, algunas realizaciones comprenden además un secuenciador de ácido nucleico.
Las realizaciones adicionales serán evidentes para los expertos en la materia relevante basándose en las enseñanzas contenidas en el presente documento.
Breve descripción de los dibujos
Estas y otras características, aspectos, y ventajas de la presente tecnología llegarán a entenderse mejor con la observación de los siguientes dibujos:
La figura 1 es un gráfico que muestra la importancia de los marcadores de un subconjunto de marcadores de metilación medido por la disminución media en la precisión para la predicción del sitio.
La figura 2 muestra los niveles de marcadores de BMP3 y NDRG4 en raspados (cardias esófago completo) en los casos de Barrett y controles como se describe en el ejemplo 8.
La figura 3 muestra el ABC de las heces de miR-1290 como se describe en el ejemplo 9.
Debe entenderse que las figuras no están necesariamente dibujadas a escala, ni los objetos de las figuras están necesariamente dibujados a escala en relación unos con otros. Las figuras son representaciones destinadas a aportar claridad y comprensión a varias realizaciones de aparatos, sistemas, composiciones y procedimientos desvelados en el presente documento. Donde sea posible, se utilizan los mismos números de referencia en todos los dibujos para referirse a partes iguales o similares. Además, se debe apreciar que los dibujos no pretenden limitar el ámbito de las presentes enseñanzas de ninguna manera.
Descripción detallada
En el presente documento se proporciona tecnología relacionada con la detección de neoplasia y, en particular, pero no exclusivamente, procedimientos, composiciones y usos relacionados para detectar neoplasias premalignas y malignas tales como cáncer de páncreas y colorrectal. A medida que la tecnología se describe en el presente documento, los encabezados de sección usados tienen fines organizativos solamente y no deben interpretarse como limitantes de la materia objeto en modo alguno.
En la presente descripción detallada de las diversas realizaciones, a efectos de explicación, se exponen numerosos detalles específicos para proporcionar una comprensión completa de las realizaciones desveladas. Sin embargo, un experto en la materia apreciará que estas diversas realizaciones se pueden practicar con o sin estos detalles específicos. En otros casos, las estructuras y los dispositivos se muestran en forma de diagrama de bloques. Asimismo, un experto en la materia puede apreciar fácilmente que las secuencias específicas en las que se presentan y ejecutan los procedimientos son ilustrativas y se contempla que las secuencias pueden variarse y permanecer dentro del espíritu y ámbito de las diversas realizaciones desveladas en el presente documento.
Toda la bibliografía y materiales similares citados en la presente solicitud, incluyendo, pero sin limitación, patentes, solicitudes de patente, artículos, libros, tratados, y páginas web de Internet se incorporan expresamente por referencia en su totalidad para cualquier finalidad. A menos que se defina de otro modo, todos los términos técnicos y científicos usados en el presente documento tienen el mismo significado que el que entiende habitualmente un experto en la materia a la que pertenecen las diversas realizaciones en el presente documento. Cuando las definiciones de los términos en las referencias incorporadas parecen diferir de las definiciones proporcionadas en las presentes enseñanzas, prevalecerá la definición proporcionada en las presentes enseñanzas.
Definiciones
Para facilitar el entendimiento de la presente tecnología, se definen varios términos y expresiones a continuación. Se exponen definiciones adicionales a lo largo de la descripción detallada.
A lo largo de toda la memoria descriptiva y las reivindicaciones, los siguientes términos tienen los significados que se asocian explícitamente en el presente documento, a menos de que el contexto dicte claramente otra cosa. La expresión "en una realización" como se utiliza en el presente documento no se refiere necesariamente a la misma realización, aunque puede ser. Asimismo, la expresión "en otra realización" como se utiliza en el presente documento no se refiere necesariamente a una realización diferente, aunque puede ser. Por tanto, como se describe posteriormente, se pueden combinar fácilmente distintas realizaciones de la invención, sin alejarse del ámbito o el espíritu de la invención.
Además, tal como se usa en el presente documento, el término "o" es un operador "o" incluyente y es equivalente al término "y/o" a menos de que el contexto dicte claramente otra cosa. La expresión "a base de" no es excluyente y permite que sea a base de factores adicionales no descritos, a menos de que el contexto dicte claramente otra cosa. Además, a lo largo de la memoria descriptiva, el significado de "un", "uno/una", y "el/la" incluye las referencias en plural. El significado de "en" incluye "en" y "sobre".
Como se usa en el presente documento, un "ácido nucleico" o "molécula de ácido nucleico" se refiere en general a cualquier ácido ribonucleico o ácido desoxirribonucleico, que puede ser ADN o ARN modificado o no modificado. Los "ácidos nucleicos" incluyen, sin limitación, ácidos nucleicos monocatenarios y bicatenarios. Como se usa en el presente documento, la expresión "ácido nucleico" también incluye ADN como se describió anteriormente que contiene una o más bases modificadas. Por tanto, el ADN con una cadena principal modificada para estabilidad o por otras razones es un "ácido nucleico". La expresión "ácido nucleico", como se usa en el presente documento, abarca formas química, enzimática o metabólicamente modificadas de ácidos nucleicos, así como las formas químicas del ADN características de virus y células, incluyendo, por ejemplo, células simples y complejas.
Los términos "oligonucleótido" o "polinucleótido" o "nucleótido" o "ácido nucleico" se refieren a una molécula que tiene dos o más desoxirribonucleótidos o ribonucleótidos, preferentemente más de tres, y normalmente más de diez. El tamaño exacto dependerá de muchos factores, que a su vez dependen de la función o uso en último término del oligonucleótido. El oligonucleótido puede generarse de cualquier manera, incluyendo la síntesis química, replicación de ADN, transcripción inversa, o una combinación de las mismas. Los desoxirribonucleótidos normales para el ADN son timina, adenina, citosina y guanina. Los ribonucleótidos normales para el ARN son uracilo, adenina, citosina y guanina.
Como se usa en el presente documento, los términos "locus" o "región" de un ácido nucleico se refieren a una subregión de un ácido nucleico, por ejemplo, un gen en un cromosoma, un solo nucleótido, una isla de CpG, etc. Los términos "complementario" y "complementariedad" se refieren a nucleótidos (por ejemplo, 1 nucleótido) o polinucleótidos (por ejemplo, una secuencia nucleotídica) relacionados por las reglas de apareamiento de bases. Por ejemplo, la secuencia 5-A-G-T-3' es complementaria a la secuencia 3-T-C-A-5'. La complementariedad puede ser "parcial", en la que solo algunas de las bases de ácido nucleico se emparejan de acuerdo con las reglas de emparejamiento de bases. O, puede ser una complementariedad "completa" o "total" entre los ácidos nucleicos. El grado de complementariedad entre las cadenas de ácido nucleico afecta a la eficacia y la resistencia de la hibridación entre las cadenas de ácidos nucleicos. Esto es de particular importancia en las reacciones de amplificación y en los procedimientos de detección que dependen de la unión entre ácidos nucleicos.
El término "gen" se refiere a una secuencia de ácido nucleico (por ejemplo, ADN o ARN) que comprende secuencias codificantes necesarias para la producción de un ARN o de un polipéptido o su precursor. Un polipéptido funcional puede ser codificado por una secuencia codificante de longitud completa o mediante cualquier parte de la secuencia codificante a condición de que mantenga la actividad deseada o las propiedades funcionales (por ejemplo, actividad enzimática, unión a ligandos, transducción de señales, etc.) del polipéptido. El término "parte" cuando se utiliza en referencia a un gen se refiere a fragmentos de ese gen. Los fragmentos pueden variar de tamaño desde pocos nucleótidos a la secuencia génica completa menos un nucleótido. Por tanto, "un nucleótido que comprende al menos una parte de un gen" puede comprender fragmentos del gen o el gen completo.
El término "gen" también abarca las regiones codificantes de un gen estructural e incluye secuencias ubicadas adyacentes a la región codificante tanto en los extremos 5' como 3', por ejemplo, para una distancia de aproximadamente 1 kb en cada extremo, tal que el gen corresponde a la longitud del ARNm de longitud completa (por ejemplo, que comprende secuencias codificantes, reguladoras, estructurales y otras). Se hace referencia a las secuencias que se ubican en 5' de la región codificante y que están presentes en el ARNm como secuencias en 5' no traducidas o no convertidas. Se hace referencia a las secuencias que se ubican en 3' o corriente abajo de la región codificante y que están presentes en el ARNm como secuencias en 3' no traducidas o en 3' no convertidas. El término "gen" abarca las formas tanto de ADNc como genómica de un gen. En algunos organismos (por ejemplo, eucariotas), una forma genómica o clon de un gen contiene la región codificante interrumpida por secuencias no codificantes llamadas "intrones" o "regiones de intervención" o " secuencias de intervención". Los intrones son segmentos de un gen que se transcriben en un ARN nuclear (ARNhn); los intrones pueden contener elementos reguladores tales como amplificadores. Los intrones se eliminan o "se cortan y empalman" de la transcripción primaria o nuclear; por lo tanto, los intrones están ausentes en la transcripción del ARN mensajero (ARNm). El ARNm funciona durante la traducción para especificar la secuencia o el orden de los aminoácidos en un polipéptido naciente.
Además de contener los intrones, las formas genómicas de un gen pueden incluir también secuencias ubicadas en ambos extremos 5' y 3' de las secuencias que están presentes en la transcripción de ARN. Se hace referencia a estas secuencias como secuencias o regiones "flanqueantes" (estas secuencias flanqueantes se localizan en 5' o 3' respecto a las secuencias no traducidas presentes en la transcripción de ARNm). La región flanqueante en 5' puede contener secuencias reguladoras tales como promotores y amplificadores que controlan o tienen influencia en la transcripción del gen. La región flanqueante en 3' puede contener secuencias que dirigen la terminación de la transcripción, la escisión tras la transcripción y la poliadenilación.
La expresión "de tipo silvestre" cuando se hace en referencia a un gen se refiere a un gen que tiene las características de un gen aislado de una fuente de origen natural. La expresión "de tipo silvestre" cuando se hace en referencia a un producto génico se refiere a un producto génico que tiene las características de un producto génico aislado de una fuente de origen natural. La expresión "de origen natural" como se aplica a un objeto se refiere al hecho de que un objeto puede encontrarse en la naturaleza. Por ejemplo, una secuencia polipeptídica o polinucleotídica que está presente en un organismo (incluyendo virus) que pueda aislarse de una fuente en la naturaleza y que no ha sido modificada intencionadamente por la mano del hombre en el laboratorio es de origen natural. Un gen de tipo silvestre es a menudo el gen o alelo que se observa más frecuentemente en una población y por lo tanto se denomina arbitrariamente la forma "normal" o "de tipo silvestre" del gen. Por el contrario, el término "modificado" o "mutante" cuando hace referencia a un gen o a un producto génico se refiere, respectivamente, a un gen o a un producto génico que presenta modificaciones en la secuencia y/o las propiedades funcionales (por ejemplo, características alteradas) cuando se compara con el gen o producto génico de tipo silvestre. Se señala que se pueden aislar mutantes de origen natural; estos se identifican por el hecho de que tienen características alteradas cuando se comparan con el gen o el producto génico de tipo silvestre.
El término "alelo" se refiere a una variación en un gen; las variaciones incluyen, pero no se limitan a variantes y mutantes, loci polimórficos y loci polimórficos de un único nucleótido, cambios de fase de lectura y mutaciones de corte y empalme. Un alelo puede ser de origen natural en una población, o puede aparecer durante la vida de cualquier individuo de la población.
Por tanto, los términos "variante" y "mutante" cuando se utilizan en referencia a una secuencia de nucleótidos se refiere a una secuencia de ácido nucleico que se diferencia por uno o más nucleótidos de otra, generalmente relacionada, secuencia de ácido nucleico. Una "variación" es una diferencia entre dos secuencias de nucleótidos diferentes; normalmente, una secuencia es la secuencia de referencia.
La "amplificación" es un caso especial de replicación de ácidos nucleicos que implica especificidad de molde. Debe contrastarse con la replicación de molde no específica (por ejemplo, la replicación que depende de molde pero no depende de un molde específico). La especificidad del molde se distingue en el presente documento de la fidelidad de replicación (por ejemplo, síntesis de la secuencia polinucleotídica apropiada) y de la especificidad nucleotídica (ribo- o desoxirribo-). La especificidad del molde se describe con frecuencia en términos de especificidad de "diana". Las secuencias diana son "dianas" en el sentido de que se busca clasificarlas de otros ácidos nucleicos. Las técnicas de amplificación se han diseñado principalmente para esta clasificación.
La amplificación de ácidos nucleicos generalmente se refiere a la producción de múltiples copias de un polinucleótido, o una parte del polinucleótido, normalmente a partir de una pequeña cantidad del polinucleótido (por ejemplo, una sola molécula polinucleotídica, de 10 a 100 copias de una molécula polinucleotídica, que puede ser exactamente igual o no), en la que los productos de amplificación o amplicones son en general detectables. La amplificación de polinucleótidos abarca una variedad de procedimientos químicos y enzimáticos. La generación de múltiples copias de ADN a partir de una o unas pocas copias de una molécula de ADN diana o molde durante una reacción en cadena de la polimerasa (PCR, por sus siglas en inglés) o una reacción en cadena de la ligasa (LCR, por sus siglas en inglés; véase, por ejemplo, la patente de EE.UU. n.° 5.494.810; incorporada en el presente documento por referencia en su totalidad) son formas de amplificación. Los tipos adicionales de amplificación incluyen, pero sin limitación, PCR específica de alelo (véase, por ejemplo, la patente de EE.UU. n.° 5.639.611; incorporada por referencia en su totalidad en el presente documento), PCR de ensamblaje (véase, por ejemplo, la patente de EE.UU. n.° 5.965.408; incorporada por referencia en su totalidad en el presente documento), amplificación dependiente de helicasa (véase, por ejemplo, la patente de EE.UU. n.° 7.662.594; incorporada por referencia en su totalidad en el presente documento), PCR de inicio en caliente (véase, por ejemplo, las patentes de EE.UU. n.° 5.773.258 y 5.338.671; cada una incorporada por referencia en su totalidad en el presente documento), PCR específica de intersecuencia, PCR inversa (véase, por ejemplo, Trigla, y col. (1988) Nucleic Acids Res., 16:8186; incorporado por referencia en su totalidad en el presente documento), PCR mediada por unión (véase, por ejemplo, Guilfoyle, R. y col., Nucleic Acids Research, 25:1854-1858 (1997); la patente de EE.UU. n.° 5.508.169; cada una incorporada por referencia en su totalidad en el presente documento), PCR específica de metilación (véase, por ejemplo, Herman, y col., (1996) PNAS 93(13) 9821-9826; incorporado por referencia en su totalidad en el presente documento), PCR con minicebador, amplificación de la sonda dependiente de unión múltiple (véase, por ejemplo, Schouten y col., (2002) Nucleic Acids Research 30(12): e57; incorporado por referencia en su totalidad en el presente documento), PCR múltiple (véase, por ejemplo, Chamberlain, y col., (1988) Nucleic Acids Research 16(23) 11141-11156; Ballabio, y col., (1990) Human Genetics 84(6) 571-573; Hayden, y col., (2008) BMC Genetics 9:80; cada uno incorporado por referencia en su totalidad en el presente documento), PCR anidada, PCR de superposición-extensión (véase, por ejemplo, Higuchi, y col., (1988) Nucleic Acids Research 16(15) 7351-7367; incorporado por referencia en su totalidad en el presente documento), PCR en tiempo real (véase, por ejemplo, Higuchi, y col., (1992) Biotechnology 10:413-417; Higuchi, y col., (1993) Biotechnology 11:1026-1030; cada uno incorporado por referencia en su totalidad en el presente documento), PCR de transcripción inversa (véase, por ejemplo, Bustin, S.A. (2000) J. Molecular Endocrinology 25:169-193; incorporado por referencia en su totalidad en el presente documento), PCR en fase sólida, PCR térmica de entrelazado asimétrico y PCR Touchdown (véase, por ejemplo, Don, y col., Nucleic Acids Research (1991) 19(14) 4008; Roux, K. (1994) Biotechniques 16(5) 812-814; Hecker y col., (1996) Biotechniques 20(3) 478-485; cada una de las cuales se incorpora por referencia en su totalidad en el presente documento. La amplificación de polinucleótidos también se puede lograr mediante PCR digital (véase, por ejemplo, Kalinina y col., Nucleic Acids Research. 25; 1999-2004, (1997); Vogelstein y Kinzler, Proc Natl Acad Sci EE.UU. 96; 9236-41, (1999); la publicación de patente internacional n.° WO05023091A2; la publicación de solicitud de patente de EE.UU. n.° 20070202525; cada una de las cuales se incorpora por referencia en su totalidad en el presente documento.
La expresión "reacción en cadena de la polimerasa" ("PCR") se refiere al procedimiento de K.B. Mullis en las patentes de EE.UU. n.° 4.683.195, 4.683.202 y 4.965.188, que describen un procedimiento para aumentar la concentración de un segmento de una secuencia diana en una mezcla de ADN genómico sin clonación ni purificación. Este procedimiento de amplificación de la secuencia diana consiste en introducir un gran exceso de dos cebadores oligonucleotídicos en la mezcla de ADN que contiene la secuencia diana deseada, seguido de una secuencia precisa de ciclos térmicos en presencia de una ADN polimerasa. Los dos cebadores son complementarios a sus respectivas cadenas de la secuencia diana de doble cadena. Para efectuar la amplificación, la mezcla se desnaturaliza y a continuación los cebadores se hibridan con sus secuencias complementarias dentro de la molécula diana. Después de la hibridación, los cebadores se extienden con una polimerasa para formar un nuevo par de cadenas complementarias. Las etapas de desnaturalización, hibridación de cebadores y extensión de la polimerasa se pueden repetir muchas veces (es decir, desnaturalización, hibridación y extensión constituyen un "ciclo"; puede haber numerosos "ciclos") para obtener una concentración alta de un segmento amplificado de la secuencia diana deseada. La longitud del segmento amplificado de la secuencia diana deseada está determinada por las posiciones relativas de los cebadores entre sí y, por lo tanto, esta longitud es un parámetro controlable. En virtud del aspecto repetitivo del procedimiento, el procedimiento se denomina "reacción en cadena de la polimerasa" ("PCR"). Debido a que los segmentos amplificados deseados de la secuencia diana se convierten en las secuencias predominantes (en términos de concentración) en la mezcla, se dice que están "amplificados por PCR" y son "productos de PCR" o "amplicones".
La especificidad del molde se logra en la mayoría de las técnicas de amplificación mediante la elección de la enzima. Las enzimas de amplificación son enzimas que, en las condiciones en que se utilizan, procesarán solo secuencias específicas de ácido nucleico en una mezcla heterogénea de ácido nucleico. Por ejemplo, en el caso de la Q-beta replicasa, el ARN de MDV-1 es el molde específico para la replicasa (Kacian y col., Proc. Natl. Acad. Sci. USA, 69:3038 [1972]). Esta enzima de amplificación no replicará otro ácido nucleico. De manera similar, en el caso de la ARN polimerasa T7, esta enzima de amplificación tiene una rigurosa especificidad para sus propios promotores (Chamberlin y col., Nature, 228:227 [1970]). En el caso de la ADN ligasa T4, la enzima no unirá los dos oligonucleótidos o polinucleótidos, cuando haya un emparejamiento incorrecto entre el oligonucleótido o polinucleotídico sustrato y el molde en la unión de ligación (Wu y Wallace (1989) Genomics 4:560). Para finalizar, las ADN polimerasas termoestables dependientes de molde (por ejemplo, ADN polimerasas Taq y Pfu), en virtud de su capacidad para funcionar a altas temperaturas, se encuentran que muestran una alta especificidad por las secuencias unidas y, por tanto, definidas por los cebadores; la alta temperatura da como resultado condiciones termodinámicas que favorecen la hibridación del cebador con las secuencias diana y no la hibridación con secuencias no diana (H. A. Erlich (ed.), PCR Technology, Stockton Press [1989]).
Como se usa en el presente documento, la expresión "ensayo de detección de ácido nucleico" se refiere a cualquier procedimiento para determinar la composición de nucleótidos de un ácido nucleico de interés. El ensayo de detección de ácido nucleico incluye, pero sin limitación, procedimientos de secuenciación de ADN, procedimientos de hibridación de sondas, ensayos de escisión de estructura específica (por ejemplo, el ensayo INVADER, Hologic, Inc.) y se describen, por ejemplo, en las patentes de EE.u U. n.° 5.846.717, 5.985.557, 5.994.069, 6.001.567, 6.090.543 y 6.872.816; Lyamichev y col., Nat. Biotech., 17:292 (1999), Hall y col., PNAS, EE.UU., 97:8272 (2000), y el documento US 2009/0253142, cada uno de los cuales se incorpora por referencia en su totalidad en el presente documento para todos los fines); procedimientos de escisión por emparejamiento incorrecto de enzimas (por ejemplo, Variagenics, patentes de EE.UU. n.° 6.110.684, 5.958.692 y 5.851.770, incorporadas por referencia en su totalidad en el presente documento); reacción en cadena de la polimerasa; procedimientos de hibridación ramificada (por ejemplo, Chiron, patentes de EE.UU. n.° 5.849.481, 5.710.264, 5.124.246 y 5.624.802, incorporadas por referencia en su totalidad en el presente documento); replicación por círculo rodante (por ejemplo, patentes de EE.UU. n.° 6.210.884, 6.183.960 y 6.235.502, incorporadas por referencia en su totalidad en el presente documento); NASBA (por ejemplo, patente de EE.UU. n.° 5.409.818, incorporada por referencia en su totalidad en el presente documento); tecnología de balizas moleculares (por ejemplo, patente de EE.UU. n.° 6.150.097, incorporada por referencia en su totalidad en el presente documento); tecnología de sensor electrónico (Motorola, patentes de EE.UU. n.° 6.248.229, 6.221.583, 6.013.170 y 6.063.573, incorporadas por referencia en su totalidad en el presente documento); tecnología de sonda cíclica (por ejemplo, patentes de EE.UU. n.° 5.403.711, 5.011.769 y 5.660.988, incorporadas por referencia en su totalidad en el presente documento); procedimientos de amplificación de señales de Dade Behring (por ejemplo, patentes de EE.UU. n.° 6.121.001, 6.110.677, 5.914.230, 5.882.867 y 5.792.614, incorporadas por referencia en su totalidad en el presente documento); reacción en cadena de la ligasa (por ejemplo, Barnay Proc. Natl. Acad. Sci USA 88, 189-93 (1991)); y procedimientos de hibridación en sándwich (por ejemplo, patente de EE.UU. n.° 5.288.609, incorporada por referencia en su totalidad en el presente documento).
La expresión "ácido nucleico amplificable" se refiere a un ácido nucleico que puede amplificarse mediante cualquier procedimiento de amplificación. Se contempla que "ácido nucleico amplificable" comprenderá normalmente "molde de muestra".
La expresión "molde de muestra" se refiere al ácido nucleico que se origina a partir de una muestra que se analiza para detectar la presencia de "diana" (definida a continuación). Por el contrario, "molde de fondo" se utiliza en referencia a un ácido nucleico distinto del molde de muestra que puede estar presente o no en una muestra. El molde de fondo suele ser inadvertido. Puede ser el resultado de un efecto residual o puede deberse a la presencia de contaminantes de ácidos nucleicos que se buscan purificar de la muestra. Por ejemplo, los ácidos nucleicos de organismos distintos de los que se van a detectar pueden estar presentes como fondo en una muestra de ensayo.
El término "cebador" se refiere a un oligonucleótido, sea de origen natural como en una digestión de restricción purificada o producido de manera sintética, que es capaz de actuar como un punto de inicio de la síntesis cuando se coloca en condiciones en las que se induce la síntesis de un producto de extensión del cebador que es complementario de una cadena de ácido nucleico, (por ejemplo, en presencia de nucleótidos y un agente de inducción tal como una ADN polimerasa y una temperatura y pH adecuados). El cebador preferentemente es de cadena sencilla para una máxima eficacia de amplificación, pero alternativamente puede ser de cadena doble. Si es de cadena doble, el cebador se trata primero para separar sus cadenas antes de utilizarse para preparar los productos de extensión. Preferentemente, el cebador es un oligodesoxirribonucleótido. El cebador debe ser lo suficientemente largo para cebar la síntesis de los productos de extensión en presencia del agente de inducción. Las longitudes exactas de los cebadores dependerán de muchos factores, que incluyen la temperatura, fuente del cebador y el uso del procedimiento.
El término "sonda" se refiere a un oligonucleótido (por ejemplo, una secuencia de nucleótidos), sea de origen natural como en una digestión de restricción purificada o producido de manera sintética, de manera recombinante o mediante amplificación por PCR, que es capaz de hibridarse con otro oligonucleótido de interés. Una sonda puede ser de cadena sencilla o cadena doble. Las sondas son útiles en la detección, identificación y aislamiento de secuencias de genes particulares (por ejemplo, una "sonda de captura"). Se contempla que cualquier sonda utilizada en la presente invención puede, en algunas realizaciones, marcarse con cualquier "molécula informadora", de manera que sea detectable en cualquier sistema de detección, incluyendo, pero sin limitarse a sistemas enzimáticos (por ejemplo, ELISA, así como ensayos histoquímicos basados en enzimas), fluorescentes, radiactivos, y luminiscentes. No se tiene la intención de que la presente invención se limite a cualquier sistema o marcador de detección en particular.
Como se usa en el presente documento, "metilación" se refiere a la metilación de citosina en las posiciones C5 o N4 de la citosina, la posición N6 de la adenina u otros tipos de metilación de ácidos nucleicos. El ADN amplificado in vitro generalmente no está metilado porque normalmente los procedimientos de amplificación de ADN in vitro no conservan el patrón de metilación del molde de amplificación. Sin embargo, "ADN no metilado" o "ADN metilado" también puede referirse a ADN amplificado cuyo molde original no estaba metilado o metilado, respectivamente.
Por consiguiente, como se usa en el presente documento, un "nucleótido metilado" o una "base de nucleótido metilado" se refiere a la presencia de una fracción metilo en una base de nucleótido, en el que la fracción metilo no está presente en una base de nucleótido normal reconocida. Por ejemplo, la citosina no contiene una fracción metilo en su anillo de pirimidina, pero la 5-metilcitosina contiene una fracción metilo en la posición 5 de su anillo de pirimidina. Por lo tanto, la citosina no es un nucleótido metilado y la 5-metilcitosina es un nucleótido metilado. En otro ejemplo, la timina contiene una fracción metilo en la posición 5 de su anillo de pirimidina; sin embargo, para los fines del presente documento, la timina no se considera un nucleótido metilado cuando está presente en el ADN, ya que la timina es una base de nucleótido normal del ADN.
Como se usa en el presente documento, una "molécula de ácido nucleico metilado" se refiere a una molécula de ácido nucleico que contiene uno o más nucleótidos metilados.
Como se usa en el presente documento, un "estado de metilación", "perfil de metilación" y "estado de metilación" de una molécula de ácido nucleico se refieren a la presencia o ausencia de una o más bases nucleotídicas metiladas en la molécula de ácido nucleico. Por ejemplo, una molécula de ácido nucleico que contiene una citosina metilada se considera metilada (por ejemplo, el estado de metilación de la molécula de ácido nucleico es metilado). Una molécula de ácido nucleico que no contiene ningún nucleótido metilado se considera no metilada.
El estado de metilación de una secuencia de ácido nucleico en particular (por ejemplo, un marcador génico o una región de ADN como se describe en el presente documento) puede indicar el estado de metilación de cada base en la secuencia o puede indicar el estado de metilación de un subconjunto de las bases (por ejemplo, de una o más citosinas) dentro de la secuencia, o puede indicar información con respecto a la densidad de metilación regional dentro de la secuencia con o sin proporcionar información precisa de las ubicaciones dentro de la secuencia en la que se produce la metilación.
El estado de metilación de un locus nucleotídico en una molécula de ácido nucleico se refiere a la presencia o ausencia de un nucleótido metilado en un locus particular de la molécula de ácido nucleico. Por ejemplo, el estado de metilación de una citosina en el 7° nucleótido de una molécula de ácido nucleico está metilado cuando el nucleótido presente en el 7° nucleótido de la molécula de ácido nucleico es 5-metilcitosina. De manera similar, el estado de metilación de una citosina en el 7° nucleótido de una molécula de ácido nucleico no está metilado cuando el nucleótido presente en el 7° nucleótido de la molécula de ácido nucleico es citosina (y no 5-metilcitosina).
El estado de metilación se puede representar o indicar opcionalmente mediante un "valor de metilación" (por ejemplo, que representa una frecuencia, fracción, relación, porcentaje, etc. de metilación). Se puede generar un valor de metilación, por ejemplo, mediante la cuantificación de la cantidad de ácido nucleico inalterado presente después de la digestión de restricción con una enzima de restricción dependiente de metilación o mediante la comparación de perfiles de amplificación después de la reacción con bisulfito o mediante la comparación de secuencias de ácidos nucleicos tratados con bisulfito y sin tratar. Por consiguiente, un valor, por ejemplo, un valor de metilación, representa el estado de metilación y, por tanto, se puede utilizar como un indicador cuantitativo del estado de metilación en múltiples copias de un locus. Esto es de particular utilidad cuando se desea comparar el estado de metilación de una secuencia en una muestra con un umbral o valor de referencia.
Como se usa en el presente documento, "frecuencia de metilación" o "porcentaje (%) de metilación" se refiere al número de casos en los que una molécula o locus está metilado en relación con el número de casos en que la molécula o locus no está metilado.
Como tal, el estado de metilación describe el estado de metilación de un ácido nucleico (por ejemplo, una secuencia genómica). Además, el estado de metilación se refiere a las características de un segmento de ácido nucleico en un locus genómico particular adecuado para la metilación. Dichas características incluyen, pero sin limitación, si alguno de los restos de citosina (C) dentro de esta secuencia de ADN está metilado, la ubicación del resto(s) de C metilado(s), la frecuencia o porcentaje de C metilada en cualquier región particular de un ácido nucleico, y las diferencias alélicas en la metilación debido a, por ejemplo, la diferencia en el origen de los alelos. Las expresiones "estado de metilación", "perfil de metilación" y "estado de metilación" también se refieren a la concentración relativa, concentración absoluta o patrón de C metilada o C no metilada en cualquier región particular de un ácido nucleico en una muestra biológica. Por ejemplo, si el (los) resto(s) de citosina (C) dentro de una secuencia de ácido nucleico están metilados, puede denominarse "hipermetilado" o que tiene "metilación aumentada", mientras que si el (los) resto(s) de citosina (C) dentro de una secuencia de ADN no están metilados, puede denominarse "hipometilado" o que tiene "metilación disminuida". Asimismo, si el (los) resto(s) de citosina (C) dentro de una secuencia de ácido nucleico están metilados en comparación con otra secuencia de ácido nucleico (por ejemplo, de una región diferente o de un individuo diferente, etc.) esa secuencia se considera hipermetilada o que tiene metilación aumentada en comparación con la otra secuencia de ácido nucleico. Como alternativa, si el (los) resto(s) de citosina (C) dentro de una secuencia de ADN no están metilados en comparación con otra secuencia de ácido nucleico (por ejemplo, de una región diferente o de un individuo diferente, etc.) esa secuencia se considera hipometilada o que tiene metilación disminuida en comparación con la otra secuencia de ácido nucleico. Adicionalmente, la expresión "patrón de metilación", como se usa en el presente documento, se refiere a los sitios colectivos de nucleótidos metilados y no metilados sobre una región de un ácido nucleico. Dos ácidos nucleicos pueden tener la misma o similar frecuencia de metilación o porcentaje de metilación, pero tener patrones de metilación diferentes cuando el número de nucleótidos metilados y no metilados es el mismo o similar en toda la región, pero las ubicaciones de los nucleótidos metilados y no metilados son diferentes. Se dice que las secuencias están "metiladas diferencialmente" o que tienen una "diferencia en la metilación" o que tienen un "estado de metilación diferente" cuando difieren en la extensión (por ejemplo, una tiene metilación aumentada o disminuida en relación con la otra), frecuencia o patrón de metilación. La expresión "metilación diferencial" se refiere a una diferencia en el nivel o patrón de metilación de ácido nucleico en una muestra positiva de cáncer en comparación con el nivel o patrón de metilación de ácido nucleico en una muestra negativa de cáncer. También puede referirse a la diferencia en los niveles o patrones entre pacientes que tienen recidiva del cáncer después de la cirugía y pacientes que no tienen recidiva. La metilación diferencial y los niveles o patrones específicos de metilación del ADN son biomarcadores pronósticos y predictivos, por ejemplo, una vez que se han definido el valor de corte o las características predictivas correctas.
La frecuencia del estado de mutilación se puede utilizar para describir una población de individuos o una muestra de un solo individuo. Por ejemplo, un locus nucleotídico que tiene una frecuencia de estado de metilación del 50 % está metilado en el 50 % de los casos y no metilado en el 50 % de los casos. Se puede utilizar dicha frecuencia, por ejemplo, para describir el grado en que un locus nucleotídico o región de ácido nucleico está metilado en una población de individuos o una colección de ácidos nucleicos. Por tanto, cuando la metilación en una primera población o grupo de moléculas de ácido nucleico es diferente de la metilación en una segunda población o grupo de moléculas de ácido nucleico, la frecuencia del estado de metilación de la primera población o grupo será diferente de la frecuencia del estado de metilación de la segunda población o grupo. Esta frecuencia también se puede utilizar, por ejemplo, para describir el grado en que un locus nucleotídico o una región de ácido nucleico está metilado en un solo individuo. Por ejemplo, dicha frecuencia se puede utilizar para describir el grado en el que un grupo de células de una muestra de tejido está metilado o no metilado en un locus nucleotídico o región de ácido nucleico.
Como se usa en el presente documento, un "locus nucleotídico" se refiere a la ubicación de un nucleótido en una molécula de ácido nucleico. Un locus nucleotídico de un nucleótido metilado se refiere a la ubicación de un nucleótido metilado en una molécula de ácido nucleico.
Normalmente, la metilación del ADN humano se produce en una secuencia de dinucleótidos que incluye una guanina y una citosina adyacentes en la que la citosina se ubica en el extremo 5' de la guanina (también denominadas secuencias de dinucleótidos CpG). La mayoría de las citosinas dentro de los dinucleótidos CpG están metiladas en el genoma humano, sin embargo, algunas permanecen no metiladas en regiones genómicas específicas ricas en dinucleótidos CpG, conocidas como islas de CpG (véase, por ejemplo, Antequera y col. (1990) Cell 62: 503-514).
Como se usa en el presente documento, una "isla de CpG" se refiere a una región rica en G:C de ADN genómico que contiene un número aumentado de dinucleótidos CpG en relación con el ADN genómico total. Una isla de CpG puede tener al menos 100, 200 o más pares de bases de longitud, en la que el contenido de G:C de la región es al menos del 50 % y la relación entre la frecuencia de CpG observada y la frecuencia esperada es 0,6; en algunos casos, una isla de CpG puede tener al menos 500 pares de bases de longitud, en la que el contenido de G:C de la región es de al menos del 55 %) y la relación entre la frecuencia de CpG observada y la frecuencia esperada es 0,65. La frecuencia de CpG observada sobre la frecuencia esperada se puede calcular de acuerdo con el procedimiento proporcionado en Gardiner-Garden y col. (1987) J. Mol. Biol. 196: 261-281. Por ejemplo, la frecuencia de CpG observada sobre la frecuencia esperada se puede calcular de acuerdo con la fórmula R = (A x B)/(C x D), en la que R es la relación de la frecuencia de CpG observada sobre la frecuencia esperada, A es el número de dinucleótidos CpG en una secuencia analizada, B es el número total de nucleótidos en la secuencia analizada, C es el número total de nucleótidos C en la secuencia analizada y D es el número total de nucleótidos G en la secuencia analizada. El estado de metilación se determina normalmente en islas de CpG, por ejemplo, en las regiones promotoras. Sin embargo, se apreciará que otras secuencias en el genoma humano son propensas a la metilación de ADN tales como CpA y CpT (véase Ramsahoye (2000) Proc. Natl. Acad. Sci. USA 97: 5237-5242; Salmon y Kaye (1970) Biochim. Biophys. Acta. 204: 340-351; Grafstrom (1985) Nucleic Acids Res. 13: 2827-2842; Nyce (1986) Nucleic Acids Res. 14: 4353-4367; Woodcock (1987) Biochem. Biophys. Res. Commun. 145: 888-894).
Como se usa en el presente documento, un reactivo que modifica un nucleótido de la molécula de ácido nucleico en función del estado de metilación de la molécula de ácido nucleico, o un reactivo específico de metilación, se refiere a un compuesto o composición u otro agente que puede cambiar la secuencia nucleotídica de una molécula de ácido nucleico de una manera que refleja el estado de metilación de la molécula de ácido nucleico. Los procedimientos para tratar una molécula de ácido nucleico con dicho reactivo pueden incluir poner en contacto la molécula de ácido nucleico con el reactivo, junto con etapas adicionales, si se desea, para lograr el cambio deseado de secuencia nucleotídica. Dicho cambio en la secuencia nucleotídica de la molécula de ácido nucleico puede dar como resultado una molécula de ácido nucleico en la que cada nucleótido metilado se modifica a un nucleótido diferente. Dicho cambio en la secuencia nucleotídica de ácido nucleico puede dar como resultado una molécula de ácido nucleico en la que cada nucleótido no metilado se modifica a un nucleótido diferente. Dicho cambio en la secuencia nucleotídica de ácido nucleico puede dar como resultado una molécula de ácido nucleico en la que cada uno de un nucleótido seleccionado que no está metilado (por ejemplo, cada citosina no metilada) se modifica a un nucleótido diferente. El uso de dicho reactivo para cambiar la secuencia nucleotídica de ácido nucleico puede dar como resultado una molécula de ácido nucleico en la que cada nucleótido que es un nucleótido metilado (por ejemplo, cada citosina metilada) se modifica a un nucleótido diferente. Como se usa en el presente documento, el uso de un reactivo que modifica un nucleótido seleccionado se refiere a un reactivo que modifica un nucleótido de los cuatro nucleótidos que se encuentran normalmente en una molécula de ácido nucleico (C, G, T y A para ADN y C, G, U y A para ARN), de manera que el reactivo modifica un nucleótido sin modificar los otros tres nucleótidos. En una realización ilustrativa, dicho reactivo modifica un nucleótido no metilado seleccionado para producir un nucleótido diferente. En otra realización ilustrativa, dicho reactivo puede desaminar nucleótidos de citosina no metilados. Un reactivo ilustrativo es bisulfito.
Como se usa en el presente documento, la expresión "reactivo bisulfito" se refiere a un reactivo que comprende en algunas realizaciones bisulfito, disulfito, sulfito de hidrógeno, o combinaciones de los mismos para distinguir entre citidinas metiladas y no metiladas, por ejemplo, en secuencias de dinucleótidos CpG.
La expresión "ensayo de mutilación" se refiere a cualquier ensayo para determinar el estado de mutilación de una o más secuencias de dinucleótidos CpG dentro de una secuencia de un ácido nucleico.
La expresión "MS AP-PCR" (reacción en cadena de la polimerasa cebada arbitrariamente sensible a la metilación) se refiere a la tecnología reconocida en la materia que permite una exploración global del genoma utilizando cebadores ricos en CG para centrarse en las regiones con más probabilidades de contener dinucleótidos CpG, y descrita por Gonzalgo y col. (1997) Cancer Research 57: 594-599.
El término "MethyLight™" se refiere a la técnica de PCR en tiempo real basada en fluorescencia reconocida en la materia descrita por Eads y col. (1999) Cancer Res. 59: 2302-2306.
El término "HeavyMethyl™" se refiere a un ensayo en el que sondas de bloqueo específicas de metilación (también denominadas en el presente documento bloqueadores) que cubren las posiciones de CpG entre, o cubiertas por, los cebadores de amplificación permiten la amplificación selectiva específica de metilación de una muestra de ácido nucleico.
La expresión ensayo "HeavyMethyl™ MethyLight™" se refiere a un ensayo HeavyMethyl™ MethyLight™, que es una variación del ensayo MethyLight™, en el que el ensayo MethyLight™ se combina con sondas de bloqueo específicas de metilación que cubren las posiciones de CpG entre los cebadores de amplificación.
El término "Ms-SNuPE" (Extensión del cebador de nucleótido único sensible a metilación) se refiere al ensayo reconocido en la materia descrito por Gonzalgo y Jones (1997) Nucleic Acids Res. 25: 2529-2531.
El término "MSP" (PCR específica de metilación) se refiere al ensayo de metilación reconocido en la materia descrito por Herman y col. (1996) Proc. Natl. Acad. Sci. USA 93: 9821-9826, y por la patente de EE.UU. n.° 5.786.146.
El término "COBRA" (Análisis de restricción con bisulfito combinado) se refiere al ensayo de metilación reconocido en la materia descrito por Xiong y Laird (1997) Nucleic Acids Res. 25: 2532-2534.
El término "MCA" (Amplificación de islas de CpG metiladas) se refiere al ensayo de metilación descrito por Toyota y col. (1999) Cancer Res. 59: 2307-12 y en el documento WO 00/26401A1.
Como se usa en el presente documento, un "nucleótido seleccionado" se refiere a un nucleótido de los cuatro nucleótidos que se encuentran normalmente en una molécula de ácido nucleico (C, G, T y A para ADN y C, G, U y A para ARN), y puede incluir derivados metilados de los nucleótidos normales (por ejemplo, cuando C es el nucleótido seleccionado, tanto la C metilada como la no metilada están incluidos en el significado de un nucleótido seleccionado), mientras que un nucleótido seleccionado metilado se refiere específicamente a un nucleótido que se encuentra normalmente metilado y un nucleótido seleccionado no metilado se refiere específicamente a un nucleótido que se encuentra normalmente no metilado.
Las expresiones "enzima de restricción específica de metilación" o "enzima de restricción sensible a metilación" se refieren a una enzima que digiere selectivamente un ácido nucleico dependiente del estado de metilación de su sitio de reconocimiento. En el caso de una enzima de restricción que corta específicamente si el sitio de reconocimiento no está metilado o está hemimetilado, el corte no tendrá lugar o tendrá lugar con una eficacia significativamente reducida si el sitio de reconocimiento está metilado. En el caso de una enzima de restricción que corta específicamente si el sitio de reconocimiento está metilado, el corte no tendrá lugar o tendrá lugar con una eficacia significativamente reducida si el sitio de reconocimiento no está metilado. Se prefieren enzimas de restricción específicas de metilación, cuya secuencia de reconocimiento contiene un dinucleótido CG (por ejemplo, una secuencia de reconocimiento tal como CGCG o CCCGGG). También se prefieren para algunas realizaciones enzimas de restricción que no cortan si la citosina en este dinucleótido está metilada en el átomo de carbono C5. Como se usa en el presente documento, un "nucleótido diferente" se refiere a un nucleótido que es químicamente diferente de un nucleótido seleccionado, normalmente dicho nucleótido diferente tiene propiedades de emparejamiento de bases de Watson-Crick que difieren del nucleótido seleccionado, por lo que el nucleótido de origen normal que es complementario del nucleótido seleccionado no es el mismo que el nucleótido de origen normal que es complementario del nucleótido diferente. Por ejemplo, cuando C es el nucleótido seleccionado, U o T pueden ser el nucleótido diferente, que se ejemplifica por la complementariedad de C a G y la complementariedad de U o T a A. Como se usa en el presente documento, un nucleótido que es complementario al nucleótido seleccionado o que es complementario al nucleótido diferente se refiere a un nucleótido que forma pares de bases, en condiciones de alta rigurosidad, con el nucleótido seleccionado o un nucleótido diferente con mayor afinidad que el emparejamiento de bases del nucleótido complementario con tres de los cuatro nucleótidos de origen normal. Un ejemplo de complementariedad es el emparejamiento de bases de Watson-Crick en el ADN (por ejemplo, A-T y C-G) y en el ARN (por ejemplo, A-U y C-G). Por tanto, por ejemplo, la base G se empareja, en condiciones de alta rigurosidad, con mayor afinidad con C que la base G con G, A, o T y, por lo tanto, cuando C es el nucleótido seleccionado, G es un nucleótido complementario del nucleótido seleccionado.
Como se usa en el presente documento, la "sensibilidad" de un marcador dado se refiere al porcentaje de muestras que informan un valor de metilación de ADN por encima de un valor umbral que distingue entre muestras neoplásicas y no neoplásicas. En algunas realizaciones, un positivo se define como una neoplasia confirmada por histología que informa un valor de mutilación de ADN por encima de un valor umbral (por ejemplo, el intervalo asociado con la enfermedad), y un falso negativo se define como una neoplasia confirmada por histología que informa un valor de metilación de ADN por debajo del valor umbral (por ejemplo, el intervalo asociado con ninguna enfermedad). El valor de la sensibilidad, por lo tanto, refleja la probabilidad de que una medición de metilación de ADN para un marcador dado obtenido de una muestra enferma conocida esté en el intervalo de mediciones asociadas a la enfermedad. Como se define en el presente documento, la relevancia clínica del valor de la sensibilidad calculado representa una estimación de la probabilidad de que un marcador dado detecte la presencia de una afección clínica cuando se aplica a un sujeto con esa afección.
Como se usa en el presente documento, la "especificidad" de un marcador dado se refiere al porcentaje de muestras no neoplásicas que informan un valor de metilación de ADN por debajo de un valor umbral que distingue entre muestras neoplásicas y no neoplásicas. En algunas realizaciones, un negativo se define como una muestra no neoplásica confirmada por histología que informa un valor de metilación de ADN por debajo del valor umbral (por ejemplo, el intervalo asociado con ninguna enfermedad) y un falso positivo se define como una muestra no neoplásica confirmada por histología que informa un valor de metilación de ADN por encima del valor umbral (por ejemplo, el intervalo asociado con la enfermedad). El valor de la especificidad, por lo tanto, refleja la probabilidad de que una medición de metilación de ADN para un marcador dado obtenido de una muestra no neoplásica conocida esté en el intervalo de mediciones no asociadas a enfermedades. Como se define en el presente documento, la relevancia clínica del valor de la especificidad calculado representa una estimación de la probabilidad de que un marcador dado detecte la ausencia de una afección clínica cuando se aplica a un paciente sin esa afección.
El término "ABC" como se usa en el presente documento es una abreviatura del "área bajo la curva". En particular, se refiere al área bajo una curva de rendimiento diagnóstico (ROC). La curva ROC es un gráfico de la tasa de verdaderos positivos frente a la tasa de falsos positivos para los posibles valores de corte diferentes de una prueba de diagnóstico. Muestra el equilibrio entre la sensibilidad y la especificidad dependiente del valor de corte seleccionado (cualquier aumento de la sensibilidad irá acompañado de una disminución de la especificidad). El área bajo una curva (ABC) ROC es una medida de la precisión de una prueba de diagnóstico (cuanto mayor sea el área, mejor; el óptimo es 1; una prueba aleatoria tendría una curva ROC en diagonal con un área de 0,5; para referencia: J. P. Egan. (1975) Signal Detection Theory and ROC Analysis, Academic Press, Nueva York).
Como se usa en el presente documento, el término "neoplasia" se refiere a "una masa anormal de tejido, cuyo crecimiento excede y no está coordinado con el de los tejidos normales" véase, por ejemplo, Willis RA, "The Spread of Tumors in the Human Body", Londres, Butterworth & Co, 1952.
Como se usa en el presente documento, el término "adenoma" se refiere a un tumor benigno de origen glandular. Aunque estos crecimientos son benignos, con el tiempo pueden progresar hasta volverse malignos.
El término "precanceroso" o "preneoplásico" y sus equivalentes se refieren a cualquier trastorno celular proliferativo que esté experimentando una transformación maligna.
Un "sitio" de una neoplasia, adenoma, cáncer, etc. es el tejido, órgano, tipo celular, área anatómica, parte del cuerpo, etc. en el cuerpo de un sujeto en el que se encuentra la neoplasia, adenoma, cáncer, etc.
Como se usa en el presente documento, una aplicación de prueba de "diagnóstico" incluye la detección o identificación de un estado de enfermedad o afección de un sujeto, determinar la probabilidad de que un sujeto contraiga una enfermedad o afección determinada, determinar la probabilidad de que un sujeto con una enfermedad o afección responda a la terapia, determinar el pronóstico de un sujeto con una enfermedad o afección (o su probable progresión o regresión) y determinar el efecto de un tratamiento en un sujeto con una enfermedad o afección. Por ejemplo, se puede usar un diagnósti
contraiga una neoplasia o la probabilidad de que dicho sujeto responda favorablemente a un compuesto (por ejemplo, un producto farmacéutico, por ejemplo, un fármaco) u otro tratamiento.
El término "marcador", tal como se usa en el presente documento, se refiere a una sustancia (por ejemplo, un ácido nucleico o una región de un ácido nucleico) que es capaz de diagnosticar un cáncer al distinguir células cancerosas de células normales, por ejemplo, basado en su estado de metilación.
El término "aislado" cuando se utiliza en relación con un ácido nucleico, como en "un oligonucleótido aislado" se refiere a una secuencia de ácido nucleico que se identifica y separa de al menos un ácido nucleico contaminante con el que se asocia habitualmente en su fuente natural. El ácido nucleico aislado está presente en una forma o conjunto que es diferente del que se encuentra en la naturaleza. Por el contrario, los ácidos nucleicos no aislados, tal como el ADN y ARN, se encuentran en el estado en que existen en la naturaleza. Ejemplos de ácidos nucleicos no aislados incluyen: una secuencia de ADN determinada (por ejemplo, un gen) que se encuentra en el cromosoma de la célula hospedadora en proximidad a genes vecinos; secuencias de ARN, tales como una secuencia de ARNm específica que codifica una proteína específica, que se encuentran en la célula como una mezcla con numerosos ARNm distintos que codifican una multitud de proteínas. Sin embargo, el ácido nucleico aislado que codifica una proteína en particular incluye, a modo de ejemplo, dicho ácido nucleico en células que expresan habitualmente la proteína, cuando el ácido nucleico está en una localización cromosómica diferente de la de las células naturales, o está de otra manera flanqueado por una secuencia de ácido nucleico diferente de la que se encuentra en la naturaleza. El ácido nucleico u oligonucleótido aislados pueden estar presentes en forma de cadena sencilla o cadena doble. Cuando un ácido nucleico u oligonucleótido aislados se van a utilizar para expresar una proteína, el oligonucleótido contendrá al mínimo la cadena en sentido o codificante (es decir, el oligonucleótido puede ser de cadena sencilla), pero puede contener ambas cadenas en sentido y antisentido (es decir, el oligonucleótido puede ser de cadena doble). Un ácido nucleico aislado puede, después del aislamiento de su entorno natural o normal, combinarse con otros ácidos nucleicos o moléculas. Por ejemplo, un ácido nucleico aislado puede estar presente en una célula hospedadora en la que se ha colocado, por ejemplo, para expresión heteróloga.
El término "purificado" se refiere a moléculas, ya sea secuencias de ácido nucleico o de aminoácidos que se eliminan de su entorno natural, se aíslan o separan. Una "secuencia de ácido nucleico aislada" puede ser, por lo tanto, una secuencia de ácido nucleico purificada. Las moléculas "sustancialmente purificadas" están al menos un 60 % libres, preferentemente al menos un 75 % libres, y más preferentemente al menos un 90 % libres de otros componentes con los que están asociados de manera natural. Como se usa en el presente documento, los términos "purificado" o "purificar" también se refieren a la eliminación de contaminantes de una muestra. La eliminación de proteínas contaminantes da como resultado un aumento en el porcentaje de polipéptido o ácido nucleico de interés en la muestra. En otro ejemplo, se expresan polipéptidos recombinantes en células hospedadoras de plantas, bacterias, levaduras, o mamíferos y los polipéptidos se purifican por la eliminación de las proteínas de la célula hospedadora; el porcentaje de polipéptidos recombinantes está por lo tanto aumentado en la muestra.
La expresión "composición que comprende" una determinada secuencia de polinucleótido o polipéptido se refiere ampliamente a cualquier composición que contiene la secuencia de polinucleótido o polipéptido determinada. La composición puede comprender una solución acuosa que contiene sales (por ejemplo, NaCl), detergentes (por ejemplo, SDS), y otros componentes (por ejemplo, solución de Denhardt, leche en polvo, ADN de esperma de salmón, etc.).
El término "muestra" se utiliza en su sentido más amplio. En un sentido se puede referir a una célula o tejido animal. En otro sentido, quiere decir que incluye un espécimen o cultivo obtenido de cualquier fuente, tal como muestras biológicas y ambientales. Las muestras biológicas se pueden obtener de plantas o animales (incluyendo seres humanos) y abarcan líquidos, sólidos, tejidos y gases. Las muestras ambientales incluyen material ambiental tal como materia superficial, suelo, agua y muestras industriales. Estos ejemplos no se tienen que considerar como limitantes de los tipos de muestra aplicables a la presente invención.
Como se usa en el presente documento, una "muestra lejana" como se usa en algunos contextos se relaciona con una muestra recogida indirectamente de un sitio que no es la célula, tejido u órgano fuente de la muestra. Por ejemplo, cuando el material de muestra que se origina en el páncreas se evalúa en una muestra de heces (por ejemplo, no de una muestra tomada directamente de un páncreas), la muestra es una muestra lejana.
Como se usa en el presente documento, los términos "paciente" o "sujeto" se refieren a organismos que se someterán a diversas pruebas proporcionadas por la tecnología. El término "sujeto" incluye animales, preferentemente mamíferos, incluyendo seres humanos. En una realización preferida, el sujeto es un primate. En una realización más preferida, el sujeto es un ser humano.
Como se usa en el presente documento, el término "kit" se refiere a cualquier sistema de administración para administrar materiales. En el contexto de ensayos de reacción, dichos sistemas de administración incluyen sistemas que permiten el almacenamiento, transporte o administración de reactivos de reacción (por ejemplo, oligonucleótidos, enzimas, etc. en los recipientes adecuados) y/o materiales de apoyo (por ejemplo, tampones, instrucciones escritas para realizar el ensayo, etc.) de un lugar a otro. Por ejemplo, los kits incluyen uno o más recintos (por ejemplo, cajas) que contienen los reactivos de reacción y/o materiales de apoyo oportunos. Como se usa en el presente documento, la expresión "kit fragmentado" se refiere a sistemas de administración que comprenden dos o más recipientes separados que contienen cada uno una subparte de los componentes totales del kit. Los recipientes se pueden administrar al destinatario previsto juntos o por separado. Por ejemplo, un primer recipiente puede contener una enzima para su uso en un ensayo, mientras que un segundo recipiente contiene oligonucleótidos. La expresión "kit fragmentado" pretende abarcar kits que contienen reactivos específicos de analitos (ASR, por sus siglas en inglés) regulados en la sección 520(e) de la Federal Food, Drug, and Cosmetic Act, pero no se limitan a ello. De hecho, cualquier sistema de administración que comprenda dos o más recipientes separados que contengan cada uno una subparte de los componentes totales del kit se incluyen en la expresión "kit fragmentado". Por el contrario, un "kit combinado" se refiere a un sistema de administración que contiene todos los componentes de un ensayo de reacción en un único recipiente (por ejemplo, en una única caja que aloja cada uno de los componentes deseados). El término "kit" incluye kits tanto fragmentados como combinados.
Realizaciones de la tecnología
En el presente documento se proporciona tecnología para marcadores de detección de cáncer de páncreas y otros marcadores de detección de cáncer gastrointestinal que proporcionan una relación señal/ruido alta y un nivel de fondo bajo cuando se detectan a partir de muestras tomadas de un sujeto (por ejemplo, muestra de heces). Los marcadores se identificaron en un estudio de casos y controles mediante la comparación del estado de mutilación de los marcadores de ADN de los tumores de sujetos con PanC en estadio I y estadio II con el estado de metilación de los mismos marcadores de ADN de los sujetos de control (por ejemplo, tejido normal tal como colon normal y/o páncreas no neoplásico) (véanse los ejemplos 1 y 11).
Se identificaron marcadores y/o perfiles de marcadores (por ejemplo, una región cromosómica que tiene una anotación seleccionada de ABCB1, ADCY1, BHLHE23 (LOC63930), c13orf18, CACNA1C, chr12 133, CLEC11A, ELMO1, EOMES, CLEC 11, SHH, GJC1, IHIF1, IKZF1, KCNK12, KCNN2, PCBP3, PRKCB, RSPO3, SCARF2, SLC38A3, ST8SIA1, TWIST1, VWC2, WT1 y ZNF71) en un estudio de casos y controles mediante la comparación del estado de metilación de los marcadores de ADN (por ejemplo, de tumores de sujetos con PanC en estadio I y II con el estado de metilación de los mismos marcadores de ADN de sujetos de control (por ejemplo, tejido normal tal como colon normal y/o páncreas no neoplásico) (véanse los ejemplos 2 y 8).
Se identificaron marcadores y/o perfiles de marcadores (por ejemplo, una región cromosómica que tiene una anotación seleccionada de n Dr g 4, SFRP1, BMP3, HPP1 y/o ApC) en estudios de casos y controles mediante la comparación del estado de metilación de marcadores de ADN de tejido esofágico de sujetos con esófago de Barrett con el estado de metilación de los mismos marcadores de ADN de sujetos de control (véanse los ejemplos 4 y 10). Se identificaron marcadores y/o perfiles de marcadores (por ejemplo, una región cromosómica que tiene una anotación seleccionada de ADCY1, PRKCB, KCNK12, C13ORF18, IKZF1, TWIST1, ELMO, 55957, CD1D, CLEC11A, KCNN2, BMP3 y/o NDRG4) en estudios de casos y controles mediante la comparación del estado de metilación de marcadores de ADN de una muestra de jugo pancreático de sujetos con cáncer de páncreas con el estado de metilación de los mismos marcadores de ADN de sujetos de control (véanse los ejemplos 5 y 6).
Se identificó un marcador (por ejemplo, una región cromosómica que tiene una anotación CD1D) en un estudio de casos y controles mediante la comparación del estado de metilación de un marcador de ADN (por ejemplo, CD1D) de una muestra de heces de sujetos con cáncer de páncreas con el estado de metilación del mismo marcador de ADN de sujetos de control que no tenían cáncer de páncreas (véase el ejemplo 7).
Se identificó un marcador (por ejemplo, miR-1290) en un estudio de casos y controles mediante la comparación de la cantidad cuantificada de un marcador de ADN (por ejemplo, miR-1290) de una muestra de heces de sujetos con cáncer de páncreas con la cantidad cuantificada del mismo marcador de ADN de sujetos de control que no tenían cáncer de páncreas (véase el ejemplo 9).
Además, la tecnología proporciona varios perfiles de marcadores, por ejemplo, en algunas realizaciones, el marcador comprende una región cromosómica que tiene una anotación que es ABCB1, ADCY1, BHLHE23 (LOC63930), c13orf18, CACNA1C, chr12.133, CLEC11A, ELMO1, EOMES, GJC1, IHIF1, IKZF1, KCNK12, KCNN2, NDRG4, PCBP3, PRKCB, RSPO3, SCARF2, SLC38A3, ST8SIA1, TWIST1, VWC2, WT1, o ZNF71, y que comprende el marcador (véanse las tablas 1 y 9). Además, las realizaciones proporcionan un procedimiento para analizar una DMR de la tabla 1 que es la DMR n.° 11, 14, 15, 65, 21, 22, 23, 5, 29, 30, 38, 39, 41, 50, 51, 55, 57, 60, 61, 8, 75, 81, 82, 84, 87, 93, 94, 98, 99, 103, 104 o 107, y/o una DMR correspondiente a Chr16:58497395-58497458. Algunas realizaciones proporcionan la determinación del estado de metilación de un marcador, en la que una región cromosómica que tiene una anotación que es CLEC11A, C13ORF18, KCNN2, ABCB1, SLC38A3, CD1D, IKZF1, ADCY1, CHR12133, RSPO3, MBP3, PRKCB, NDRG4, ELMO o TWIST1 comprende el marcador. En algunas realizaciones, los procedimientos comprenden determinar el estado de metilación de dos marcadores, por ejemplo, un par de marcadores proporcionados en una fila de la tabla 5.
Aunque la divulgación del presente documento se refiere a ciertas realizaciones ilustradas, se tiene que entender que estas realizaciones se presentan a modo de ejemplo y no a modo de limitación.
En aspectos particulares, la presente tecnología proporciona composiciones y procedimientos para identificar, determinar y/o clasificar un cáncer tal como un cáncer gastrointestinal superior (por ejemplo, cáncer de esófago, páncreas, estómago) o cáncer gastrointestinal inferior (por ejemplo, adenoma, cáncer colorrectal). En aspectos relacionados, la tecnología proporciona composiciones y procedimientos para identificar, predecir y/o detectar el sitio de un cáncer. Los procedimientos comprenden determinar el estado de metilación de al menos un marcador de metilación en una muestra biológica aislada de un sujeto, en la que un cambio en el estado de metilación del marcador es indicativo de la presencia, clase o sitio de un cáncer. Realizaciones particulares se relacionan con marcadores que comprenden una región metilada diferencialmente (DMR, por ejemplo, DMR 1-107, véase la tabla 1, por ejemplo, DMR 1-449, véase la tabla 10) que se utilizan para el diagnóstico (por ejemplo, detección) de trastornos proliferativos celulares neoplásicos (por ejemplo, cáncer), incluyendo la detección temprana durante las etapas precancerosas de la enfermedad y la predicción del sitio de una neoplasia (por ejemplo, mediante la discriminación entre tipos de cáncer, por ejemplo, cánceres gastrointestinales superiores y cánceres gastrointestinales inferiores). Asimismo, los marcadores se utilizan para la diferenciación de trastornos proliferativos celulares neoplásicos de benignos. En aspectos particulares, la presente tecnología desvela un procedimiento en el que un trastorno proliferativo de células neoplásicas se distingue de un trastorno proliferativo de células benignas.
Los marcadores de la presente tecnología son particularmente eficaces para detectar o distinguir entre trastornos proliferativos colorrectales y pancreáticos, proporcionando así medios mejorados para la detección temprana, clasificación y tratamiento de dichos trastornos.
Además de las realizaciones en las que se analiza el análisis de metilación de al menos un marcador, una región de un marcador, o una base de un marcador que comprende una DMR (por ejemplo, DMR 1-107 de la tabla 1) (por ejemplo, DMR 1-449 de la tabla 10) proporcionado en el presente documento y enumerado en la tabla 1 o 10, la tecnología también proporciona perfiles de marcadores que comprenden al menos un marcador, una región de un marcador, o una base de un marcador que comprende una DMR con utilidad para la detección de cánceres, en particular el cáncer colorrectal, de páncreas y otros cánceres GI superiores e inferiores.
Algunas realizaciones de la tecnología se basan en el análisis del estado de metilación de CpG de al menos un marcador, una región de un marcador, o una base de un marcador que comprende una DMR.
En algunas realizaciones, la presente tecnología proporciona el uso de la técnica con bisulfito en combinación con uno o más ensayos de metilación para determinar el estado de metilación de las secuencias de dinucleótidos CpG dentro de al menos un marcador que comprende una DMR (por ejemplo, como se proporciona en la tabla 1 (por ejemplo, DMR 1-107)) (por ejemplo, como se proporciona en la tabla 10 (por ejemplo, DMR 1-449)). Los dinucleótidos CpG genómicos pueden estar metilados o no metilados (conocidos alternativamente como metilados positivamente y negativamente, respectivamente). Sin embargo, los procedimientos de la presente invención son adecuados para el análisis de muestras biológicas de naturaleza heterogénea, por ejemplo, una baja concentración de células tumorales, o materiales biológicos de las mismas, dentro de un fondo de una muestra lejana (por ejemplo, sangre, efluente de órganos o heces). Por consiguiente, cuando se analiza el estado de metilación de una posición de CpG dentro de dicha muestra, se puede usar un ensayo cuantitativo para determinar el nivel (por ejemplo, porcentaje, fracción, relación, proporción, o grado) de metilación en una posición de CpG particular.
De acuerdo con la tecnología actual, la determinación del estado de metilación de secuencias de dinucleótidos CpG en marcadores que comprenden una DMR tiene utilidad tanto en el diagnóstico como en la caracterización de cánceres tales como cáncer gastrointestinal superior (por ejemplo, cáncer de esófago, páncreas, estómago) o cáncer gastrointestinal inferior (por ejemplo, adenoma, cáncer colorrectal).
Combinaciones de marcadores
En algunas realizaciones, la tecnología se relaciona con la evaluación del estado de metilación de combinaciones de marcadores que comprenden una DMR de la tabla 1 (por ejemplo, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 27, 29, 30) o la tabla 10 (por ejemplo, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 27, 29, 30), o más marcadores que comprenden una DMR. En algunas realizaciones, la evaluación del estado de metilación de más de un marcador aumenta la especificidad y/o sensibilidad de una detección o diagnóstico para identificar una neoplasia en un sujeto, por ejemplo, un cáncer gastrointestinal superior (por ejemplo, esófago, páncreas, estómago) o un cáncer gastrointestinal inferior (por ejemplo, adenoma, colorrectal). En algunas realizaciones, un marcador o una combinación de marcadores discrimina entre tipos y/o ubicaciones de una neoplasia. Por ejemplo, combinaciones de marcadores discriminan neoplasia esofágica, neoplasia de estómago, neoplasia pancreática, neoplasia colorrectal y adenomas entre sí, de otras neoplasias y/o de tejido normal (por ejemplo, no canceroso, no precanceroso).
Varios cánceres se predicen mediante diversas combinaciones de marcadores, por ejemplo, según lo identificado mediante técnicas estadísticas relacionadas con la especificidad y sensibilidad de la predicción. La tecnología proporciona procedimientos para identificar combinaciones predictivas y combinaciones predictivas validadas para algunos cánceres.
En algunas realizaciones, combinaciones de marcadores (por ejemplo, que comprenden una DMR) predicen el sitio de una neoplasia. Por ejemplo, durante el desarrollo de la tecnología descrita en el presente documento, se realizaron análisis estadísticos para validar la sensibilidad y especificidad de las combinaciones de marcadores. Por ejemplo, los pares de marcadores predijeron con precisión el sitio del tumor en > 90 % de las muestras, los 17 pares de marcadores principales predijeron con precisión el sitio del tumor en > 80 % de las muestras, y los 49 pares de marcadores principales predijeron con precisión el sitio del tumor en el 70 % de las muestras.
Procedimientos para analizar el estado de metilación
El procedimiento utilizado con más frecuencia para analizar un ácido nucleico para determinar la presencia de 5-metilcitosina se basa en el procedimiento con bisulfito descrito por Frommer, y col. para la detección de 5-metilcitosinas en el ADN (Frommer y col. (1992) Proc. Natl. Acad. Sci. USA 89: 1827-31 incorporado por referencia explícitamente en su totalidad en el presente documento para todos los fines) o variaciones del mismo. El procedimiento con bisulfito de mapeo de 5-metilcitosinas se basa en la observación de que la citosina, pero no la 5-metilcitosina, reacciona con el ion sulfito de hidrógeno (también conocido como bisulfito). La reacción generalmente se realiza de acuerdo con las siguientes etapas: en primer lugar, la citosina reacciona con el sulfito de hidrógeno para formar una citosina sulfonada. A continuación, la desaminación espontánea del intermediario de reacción sulfonado da como resultado un uracilo sulfonado. Para finalizar, el uricilo sulfonado se desulfona en condiciones alcalinas para formar uracilo. La detección es posible porque el uracilo forma pares de bases con la adenina (comportándose así como la timina), mientras que la base 5-metilcitosina se empareja con guanina (comportándose así como citosina). Esto hace posible la discriminación de citosinas metiladas de citosinas no metiladas mediante, por ejemplo, secuenciación genómica con bisulfito (Grigg G y Clark S, Bioessays (1994) 16: 431-36; Grigg G, DNA Seq. (1996) 6: 189-98) o PCR específica de metilación (MSP) como se desvela, por ejemplo, en la Patente de EE.UU. n.° 5.786.146.
Algunas tecnologías convencionales se relacionan con procedimientos que comprenden incluir el ADN a analizar en una matriz de agarosa, evitando así la difusión y renaturalización del ADN (el bisulfito solo reacciona con el ADN monocatenario), y reemplazando las etapas de precipitación y purificación con una diálisis rápida (Olek A, y col. (1996) "A modified and improved method for bisulfite based cytosine methylation analysis" Nucleic Acids Res. 24: 5064-6). Por tanto, es posible analizar células individuales para determinar el estado de metilación, ilustrando la utilidad y sensibilidad del procedimiento. Se proporciona una descripción general de los procedimientos convencionales para detectar 5-metilcitosina en Rein, T., y col. (1998) Nucleic Acids Res. 26: 2255.
La técnica con bisulfito normalmente implica amplificar fragmentos cortos y específicos de un ácido nucleico conocido después de un tratamiento con bisulfito, y a continuación evaluar el producto mediante secuenciación (Olek y Walter (1997) Nat. Genet. 17: 275-6) o una reacción de extensión del cebador (Gonzalgo y Jones (1997) Nucleic Acids Res. 25: 2529-31; documento WO 95/00669; patente de EE.UU. n.° 6.251.594) para analizar las posiciones de citosina individuales. Algunos procedimientos utilizan digestión enzimática (Xiong y Laird (1997) Nucleic Acids Res.
25: 2532-4). La detección mediante hibridación también se ha descrito en la materia (Olek y col., documento WO 99/28498). Adicionalmente, se ha descrito el uso de la técnica con bisulfito para la detección de metilación con respecto a genes individuales (Grigg y Clark (1994) Bioessays 16: 431-6; Zeschnigk y col. (1997) Hum Mol Genet. 6: 387-95; Feil y col. (1994) Nucleic Acids Res. 22: 695; Martin y col. (1995) Gene 157: 261-4; documentos WO 9746705; documentos WO 9515373).
Se conocen en la materia varios procedimientos de ensayo de metilación y se pueden usar junto con el tratamiento con bisulfito de acuerdo con la presente tecnología. Estos ensayos permiten la determinación del estado de metilación de uno o una pluralidad de dinucleótidos CpG (por ejemplo, islas de CpG) dentro de una secuencia de ácido nucleico. Dichos ensayos implican, entre otras técnicas, secuenciación de ácido nucleico tratado con bisulfito, PCR (para amplificación específica de secuencia), análisis de transferencia Southern y uso de enzimas de restricción sensibles a la metilación.
Por ejemplo, la secuenciación genómica se ha simplificado para el análisis de patrones de metilación y distribuciones de 5-metilcitosina mediante el uso del tratamiento con bisulfito (Frommer y col. (1992) Proc. Natl. Acad. Sci. USA 89: 1827-1831). Adicionalmente, la digestión con enzimas de restricción de productos de PCR amplificados a partir de ADN convertido con bisulfito se utiliza para evaluar el estado de metilación, por ejemplo, como lo describen Sadri y Hornsby (1997) Nucl. Acids Res. 24: 5058-5059 o como se incorpora en el procedimiento conocido como COBRA (Análisis de restricción con bisulfito combinado) (Xiong y Laird (1997) Nucleic Acids Res. 25: 2532-2534).
El análisis COBRA™ es un ensayo de metilación cuantitativo útil para determinar los niveles de metilación del ADN en loci específicos en pequeñas cantidades de ADN genómico (Xiong y Laird, Nucleic Acids Res. 25:2532-2534, 1997). En resumen, la digestión con enzimas de restricción se usa para descubrir diferentes secuencias dependientes de metilación en productos de PCR de ADN tratado con bisulfito de sodio. Las diferentes secuencias dependientes de metilación se introducen primero en el ADN genómico mediante tratamiento estándar con bisulfito de acuerdo con el procedimiento descrito por Frommer y col. (Proc. Natl. Acad. Sci. USA 89:1827-1831, 1992). A continuación, se realiza la amplificación por PCR del ADN convertido con bisulfito utilizando cebadores específicos para las islas de CpG de interés, seguido de digestión con endonucleasas de restricción, electroforesis en gel y detección usando sondas de hibridación marcadas y específicas. Los niveles de metilación en la muestra de ADN original están representados por las cantidades relativas de producto de PCR digerido y no digerido de una manera linealmente cuantitativa en un amplio espectro de niveles de metilación de ADN. Además, esta técnica se puede aplicar de forma fiable al ADN obtenido de muestras de tejido embebidas en parafina microdiseccionadas.
Los reactivos normales (por ejemplo, los que se pueden encontrar en un kit normal basado en COBRA™) para el análisis COBRA™ pueden incluir, pero sin limitación: cebadores de PCR para loci específicos (por ejemplo, genes específicos, marcadores, DMR, regiones de genes, regiones de marcadores, secuencia de ADN tratada con bisulfito, isla de CpG, etc.); enzima de restricción y tampón apropiado; oligonucleótido de hibridación de genes; oligonucleótido de hibridación de control; kit de marcaje de cinasas para sonda oligonucleotídica; y nucleótidos marcados. Adicionalmente, los reactivos de conversión de bisulfito pueden incluir: tampón de desnaturalización de ADN; tampón de sulfonación; reactivos o kits de recuperación de ADN (por ejemplo, precipitación, ultrafiltración, columna de afinidad); tampón de desulfonación; y componentes de recuperación de ADN.
Preferentemente, ensayos como "MethyLight™" (una técnica de PCR en tiempo real basada en fluorescencia) (Eads y col., Cancer Res. 59:2302-2306, 1999), reacciones de Ms-SNuPE™ (Extensión de cebador de nucleótido único sensible a metilación) (Gonzalgo y Jones, Nucleic Acids Res. 25:2529-2531, 1997), PCR específica de metilación ("MSP"; Herman y col., Proc. Natl. Acad. Sci. USA 93:9821-9826, 1996; patente de EE.UU. n.° 5.786.146) y amplificación de isla de CpG metilada ("MCA"; Toyota y col., Cancer Res. 59:2307-12, 1999) se utilizan solos o en combinación con uno o más de estos procedimientos.
La técnica del ensayo "HeavyMethyl™" es un procedimiento cuantitativo para evaluar las diferencias de mutilación basado en la amplificación específica de mutilación del ADN tratado con bisulfito. Las sondas de bloqueo específicas de metilación ("bloqueadores") que cubren las posiciones de CpG entre, o cubiertas por, los cebadores de amplificación permiten la amplificación selectiva específica de metilación de una muestra de ácido nucleico.
La expresión ensayo "HeavyMethyl™ MethyLight™" se refiere a un ensayo HeavyMethyl™ MethyLight™, que es una variación del ensayo MethyLight™, en el que el ensayo MethyLight™ se combina con sondas de bloqueo específicas de metilación que cubren las posiciones de CpG entre los cebadores de amplificación. El ensayo HeavyMethyl™ también puede usarse en combinación con cebadores de amplificación específicos de metilación.
Los reactivos normales (por ejemplo, los que se pueden encontrar en un kit normal basado en MethylLight™) para el análisis HeavyMethyl™ pueden incluir, pero sin limitación: cebadores de PCR para loci específicos (por ejemplo, genes específicos, marcadores, DMR, regiones de genes, regiones de marcadores, secuencia de ADN tratada con bisulfito, isla de CpG, secuencia de ADN tratada con bisulfito o isla de CpG, etc.); oligonucleótidos bloqueadores; tampones de PCR optimizados y desoxinucleótidos; y polimerasa Taq.
La MSP (PCR de metilación específica) permite evaluar el estado de metilación de prácticamente cualquier grupo de sitios CpG dentro de una isla de CpG, independientemente del uso de enzimas de restricción sensibles a la metilación (Herman y col. Proc. Natl. Acad. Sci. USA 93:9821-9826, 1996; patente de EE.UU. n.° 5.786.146). En resumen, el ADN se modifica mediante bisulfito de sodio, que convierte las citosinas no metiladas, pero no las metiladas, a uracilo, y los productos se amplifican posteriormente con cebadores específicos para a Dn metilado frente a ADN no metilado. La MSP requiere solo pequeñas cantidades de ADN, es sensible al 0,1 % de los alelos metilados de un locus de isla de CpG dado y se puede realizar en ADN extraído de muestras incluidas en parafina. Los reactivos normales (por ejemplo, los que se pueden encontrar en un kit normal basado en MSP) para el análisis de MSP pueden incluir, pero sin limitación: cebadores de PCR metilados y no metilados para loci específicos (por ejemplo, genes específicos, marcadores, DMR, regiones de genes, regiones de marcadores, secuencia de ADN tratada con bisulfito, isla de CpG, etc.); tampones de PCR optimizados y desoxinucleótidos, y sondas específicas.
El ensayo MethyLight™ es un ensayo de metilación cuantitativo de alto rendimiento que utiliza PCR en tiempo real basada en fluorescencia (por ejemplo, TaqMan®) que no requiere manipulaciones adicionales después de la etapa de PCR (Eads y col., Cancer Res. 59:2302-2306, 1999). En resumen, el procedimiento MethyLight™ comienza con una muestra mixta de ADN genómico que se convierte, en una reacción con bisulfito de sodio, en un grupo mixto de diferentes secuencias dependientes de la metilación de acuerdo con los procedimientos estándar (el procedimiento con bisulfito convierte restos de citosina no metilados en uracilo). La PCR basada en fluorescencia se realiza a continuación en una reacción "sesgada", por ejemplo, con cebadores de PCR que se superponen a dinucleótidos CpG conocidos. La discriminación de secuencia se produce tanto al nivel del procedimiento de amplificación como al nivel del procedimiento de detección de fluorescencia.
El ensayo MethyLight™ se utiliza como prueba cuantitativa para patrones de metilación en un ácido nucleico, por ejemplo, una muestra de ADN genómico, en el que la discriminación de secuencia ocurre al nivel de la hibridación de sonda. En una versión cuantitativa, la reacción de PCR proporciona una amplificación específica de metilación en presencia de una sonda fluorescente que se superpone a un supuesto sitio de metilación particular. Un control no sesgado de la cantidad de ADN de entrada se proporciona mediante una reacción en la que ni los cebadores, ni la sonda, se superponen a cualquier dinucleótido CpG. Como alternativa, se logra una prueba cualitativa para metilación genómica mediante el sondaje del grupo de PCR sesgado con oligonucleótidos de control que no cubren los sitios de metilación conocidos (por ejemplo, una versión basada en fluorescencia de las técnicas HeavyMethyl™ y MSP) o con oligonucleótidos que cubren posibles sitios de metilación.
El procedimiento MethyLight™ se utiliza con cualquier sonda adecuada (por ejemplo, una sonda "TaqMan®", una sonda Lightcycler®, etc.) Por ejemplo, en algunas solicitudes, el ADN genómico de doble cadena se trata con bisulfito de sodio y se somete a uno de los dos conjuntos de reacciones de PCR utilizando sondas TaqMan®, por ejemplo, con cebadores de MSP y/u oligonucleótidos bloqueadores de HeavyMethyl y una sonda TaqMan®. La sonda TaqMan® está marcada de forma dual con moléculas fluorescentes "informadoras" y "desactivadoras" y está diseñada para ser específica para una región de contenido en GC relativamente alto, de modo que se funde a una temperatura aproximadamente 10 °C más alta en el ciclo de PCR que en los cebadores directos o inversos. Esto permite que la sonda TaqMan® permanezca completamente hibridada durante la etapa de hibridación/extensión de PCR. Como la polimerasa Taq sintetiza enzimáticamente una nueva cadena durante la PCR, acabará alcanzando la sonda hibridada TaqMan®. La actividad endonucleasa de 5' a 3' de la polimerasa Taq desplazará entonces la sonda TaqMan® mediante su digestión para liberar la molécula informadora fluorescente para la detección cuantitativa de su señal ahora sin desactivar utilizando un sistema de detección fluorescente en tiempo real.
Los reactivos normales (por ejemplo, los que se pueden encontrar en un kit normal basado en MethyLight™) para el análisis MethyLight™ pueden incluir, pero sin limitación: cebadores de PCR para loci específicos (por ejemplo, genes específicos, marcadores, DMR, regiones de genes, regiones de marcadores, secuencia de ADN tratada con bisulfito, isla de CpG, etc.); sondas TaqMan® o Lightcycler®; tampones de PCR optimizados y desoxinucleótidos; y polimerasa Taq.
El ensayo QM™ (mutilación cuantitativa) es una prueba cuantitativa alternativa para los patrones de mutilación en muestras de ADN genómico, en el que la discriminación de secuencia ocurre al nivel de la hibridación de sonda. En esta versión cuantitativa, la reacción de PCR proporciona una amplificación no sesgada en presencia de una sonda fluorescente que se superpone a un supuesto sitio de metilación particular. Un control no sesgado de la cantidad de ADN de entrada se proporciona mediante una reacción en la que ni los cebadores, ni la sonda, se superponen a cualquier dinucleótido CpG. Como alternativa, se logra una prueba cualitativa para metilación genómica mediante el sondaje del grupo de PCR sesgado con oligonucleótidos de control que no cubren los sitios de metilación conocidos (una versión basada en fluorescencia de las técnicas HeavyMethyl™ y MSP) o con oligonucleótidos que cubren posibles sitios de metilación.
El procedimiento QM™ puede usarse con cualquier sonda adecuada, por ejemplo, sondas "TaqMan®", sondas Lightcycler®, en el procedimiento de amplificación. Por ejemplo, el ADN genómico de doble cadena se trata con bisulfito de sodio y se somete a cebadores no sesgados y la sonda TaqMan®. La sonda TaqMan® está marcada de forma dual con moléculas fluorescentes "informadoras" y "desactivadoras" y está diseñada para ser específica para una región de contenido en GC relativamente alto, de modo que se funde a una temperatura aproximadamente 10 °C más alta en el ciclo de PCR que en los cebadores directos o inversos. Esto permite que la sonda TaqMan® permanezca completamente hibridada durante la etapa de hibridación/extensión de PCR. Como la polimerasa Taq sintetiza enzimáticamente una nueva cadena durante la PCR, acabará alcanzando la sonda hibridada TaqMan®. La actividad endonucleasa de 5' a 3' de la polimerasa Taq desplazará entonces la sonda TaqMan® mediante su digestión para liberar la molécula informadora fluorescente para la detección cuantitativa de su señal ahora sin desactivar utilizando un sistema de detección fluorescente en tiempo real. Los reactivos normales (por ejemplo, los que se pueden encontrar en un kit normal basado en QM™) para el análisis QM™ pueden incluir, pero sin limitación: cebadores de PCR para loci específicos (por ejemplo, genes específicos, marcadores, DMR, regiones de genes, regiones de marcadores, secuencia de ADN tratada con bisulfito, isla de CpG, etc.); sondas TaqMan® o Lightcycler®; tampones de PCR optimizados y desoxinucleótidos; y polimerasa Taq.
La técnica Ms-SNuPE™ es un procedimiento cuantitativo para evaluar las diferencias de metilación en sitios CpG específicos basado en el tratamiento de ADN con bisulfito, seguido de la extensión del cebador de un solo nucleótido (Gonzalgo y Jones, Nucleic Acids Res. 25:2529-2531, 1997). En resumen, el ADN genómico se hace reaccionar con bisulfito de sodio para convertir la citosina no metilada en uracilo sin modificar la 5-metilcitosina. A continuación, se realiza la amplificación de la secuencia diana deseada usando cebadores de PCR específicos para ADN convertido con bisulfito, y el producto resultante se aísla y se usa como molde para el análisis de metilación en el sitio CpG de interés. Pueden analizarse pequeñas cantidades de ADN (por ejemplo, secciones de patología microdiseccionadas) y ello evita la utilización de enzimas de restricción para determinar el estado de metilación en los sitios CpG.
Los reactivos normales (por ejemplo, los que se pueden encontrar en un kit normal basado en Ms-SNuPE™) para el análisis de Ms-SNuPE ™ pueden incluir, pero sin limitación: cebadores de PCR para loci específicos (por ejemplo, genes específicos, marcadores, DMR, regiones de genes, regiones de marcadores, secuencia de ADN tratada con bisulfito, isla de CpG, etc.); tampones de PCR optimizados y desoxinucleótidos; kit de extracción en gel; cebadores de control positivo; cebadores Ms-SNuPE™ para loci específicos; tampón de reacción (para la reacción Ms-SNuPE); y nucleótidos marcados. Adicionalmente, los reactivos de conversión de bisulfito pueden incluir: tampón de desnaturalización de ADN; tampón de sulfonación; reactivos o kit de recuperación de ADN (por ejemplo, precipitación, ultrafiltración, columna de afinidad); tampón de desulfonación; y componentes de recuperación de ADN.
La secuenciación con bisulfito de representación reducida (RRBS, por sus siglas en inglés) comienza con el tratamiento con bisulfito del ácido nucleico para convertir todas las citosinas no metiladas en uracilo, seguida de digestión con enzimas de restricción (por ejemplo, por una enzima que reconoce un sitio que incluye una secuencia CG tal como MspI) y secuenciación completa de fragmentos después del acoplamiento a un ligando adaptador. La elección de la enzima de restricción enriquece los fragmentos para regiones densas de CpG, reduciendo el número de secuencias redundantes que se pueden mapear en múltiples posiciones de genes durante el análisis. Como tal, la RRBS reduce la complejidad de la muestra de ácido nucleico mediante la selección de un subconjunto (por ejemplo, mediante la selección de tamaño usando electroforesis en gel preparativa) de fragmentos de restricción para secuenciación. A diferencia de la secuenciación con bisulfito del genoma completo, cada fragmento producido mediante la digestión con enzimas de restricción contiene información de metilación de ADN para al menos un dinucleótido CpG. Como tal, la RRBS enriquece la muestra para promotores, islas de CpG y otras características genómicas con una alta frecuencia de sitios de corte de enzimas de restricción en estas regiones y, por tanto, proporciona un ensayo para evaluar el estado de metilación de uno o más loci genómicos.
Un protocolo normal para RRBS comprende las etapas de digerir una muestra de ácido nucleico con una enzima de restricción tal como MspI, rellenar salientes y cola A, unión de adaptadores, conversión con bisulfito y PCR. Véanse, por ejemplo, y col. (2005) "Genome-scale DNA methylation mapping of clinical samples at single-nucleotide resolution" Nat Methods 7: 133-6; Meissner y col. (2005) "Reduced representation bisulfite sequencing for comparative high-resolution DNA methylation analysis" Nucleic Acids Res. 33: 5868-77.
En algunas realizaciones, para evaluar el estado de metilación se utiliza un ensayo cuantitativo de amplificación de señal y diana en tiempo real específico de alelo (QuARTS, por sus siglas en inglés). Se producen tres reacciones secuencialmente en cada ensayo de QuARTS, incluyendo amplificación (reacción 1) y escisión de la sonda diana (reacción 2) en la reacción primaria; y escisión de FRET y generación de señal fluorescente (reacción 3) en la reacción secundaria. Cuando el ácido nucleico diana se amplifica con cebadores específicos, una sonda de detección específica con una secuencia colgajo se une libremente al amplicón. La presencia del oligonucleótido invasivo específico en el sitio de unión a la diana hace que la escisión libere la secuencia colgajo mediante el corte entre la sonda de detección y la secuencia colgajo. La secuencia colgajo es complementaria a una parte sin horquilla de un casete FRET correspondiente. Por consiguiente, la secuencia colgajo funciona como un oligonucleótido invasivo en el casete FRET y produce una escisión entre el fluoróforo del casete FRET y un desactivador, que produce una señal fluorescente. La reacción de escisión puede cortar múltiples sondas por diana y así liberar múltiples fluoróforos por colgajo, proporcionando amplificación de señal exponencial. QuARTS puede detectar múltiples dianas en un solo pocillo de reacción mediante el uso de casetes FRET con diferentes colorantes. Véanse, por ejemplo, en Zou y col. (2010) "Sensitive quantification of methylated markers with a novel methylation specific technology" Clin Chem 56: A199; las solicitudes de patente de EE.UU. n.° de serie 12/946.737, 12/946.745, 12/946.752 y 61/548.639.
La expresión "reactivo bisulfito" se refiere a un reactivo que comprende bisulfito, disulfito, sulfito de hidrógeno, o combinaciones de los mismos, útil como se desvela en el presente documento para distinguir entre secuencias de dinucleótidos CpG metiladas y no metiladas. Los procedimientos de dicho tratamiento son conocidos en la materia (por ejemplo, documento PCT/EP2004/011715, que se incorpora por referencia en su totalidad). Se prefiere que el tratamiento con bisulfito se realice en presencia de disolventes desnaturalizantes tales como, pero sin limitación, nalquilenglicol o dietilenglicol dimetiléter (DME), o en presencia de dioxano o derivados de dioxano. En algunas realizaciones, los disolventes desnaturalizantes se utilizan en concentraciones entre el 1 % y el 35 % (v/v). En algunas realizaciones, la reacción con bisulfito se lleva a cabo en presencia de depuradores tales como, pero sin limitación, derivados de cromano, por ejemplo, ácido 6-hidroxi-2,5,7,8-tetrametilcromano 2-carboxílico o ácido trihidroxibenzona y derivados de los mismos, por ejemplo, ácido gálico (véase: el documento PCT/EP2004/011715, que se incorpora por referencia en su totalidad). La conversión con bisulfito se lleva a cabo preferentemente a una temperatura de reacción entre 30 °C y 70 °C, por lo que la temperatura se aumenta a más de 85 °C durante cortos períodos de tiempo durante la reacción (véase: el documento PCT/EP2004/011715, que se incorpora por referencia en su totalidad). El ADN tratado con bisulfito se purifica preferentemente antes de la cuantificación. Lo que puede realizarse mediante cualquier medio conocido en la materia, tal como, pero sin limitación, ultrafiltración, por ejemplo, por medio de columnas Microcon™ (fabricadas por Millipore™). La purificación se lleva a cabo de acuerdo con un protocolo del fabricante modificado (véase, por ejemplo, el documento PCT/EP2004/011715, que se incorpora por referencia en su totalidad).
En algunas realizaciones, los fragmentos del ADN tratado se amplifican usando conjuntos de oligonucleótidos cebadores de acuerdo con la presente invención (por ejemplo, véase la tabla 2) y una enzima de amplificación. La amplificación de varios segmentos de ADN se puede realizar simultáneamente en un mismo recipiente de reacción. Normalmente, la amplificación se lleva a cabo mediante una reacción en cadena de la polimerasa (PCR). Los amplicones suelen tener una longitud de 100 a 2000 pares de bases.
En otra realización del procedimiento, el estado de metilación de las posiciones CpG dentro o cerca de un marcador que comprende una DMR (por ejemplo, DMR 1-107 como se proporciona en la tabla 1) (por ejemplo, DMR 1-449 como se proporciona en la tabla 10) puede detectarse mediante el uso de oligonucleótidos cebadores específicos de metilación. Esta técnica (MSP) se ha descrito en la patente de EE.UU. 6.265.171 de Herman. El uso de cebadores específicos del estado de metilación para la amplificación de ADN tratado con bisulfito permite la diferenciación entre ácidos nucleicos metilados y no metilados. Los pares de cebadores de la MSP contienen al menos un cebador que se hibrida con un dinucleótido CpG tratado con bisulfito. Por lo tanto, la secuencia de dichos cebadores comprende al menos un dinucleótido CpG. Los cebadores de la MSP específicos para ADN no metilado contienen una "T" en la posición de la posición C en el CpG.
Los fragmentos obtenidos mediante la amplificación pueden portar un marcador detectable directa o indirectamente. En algunas realizaciones, los marcadores son marcadores fluorescentes, radionúclidos, o fragmentos de moléculas separables que tienen una masa normal que se puede detectar en un espectrómetro de masas. Cuando dichos marcadores son marcadores de masa, algunas realizaciones prevén que los amplicones marcados tengan una sola carga neta positiva o negativa, permitiendo una mejor delectabilidad en el espectrómetro de masas. La detección se puede realizar y visualizar mediante, por ejemplo, espectrometría de masas de ionización/desorción láser asistida por matriz (MALDI, por sus siglas en inglés) o mediante espectrometría de masas por pulverización de electrones (ESI, por sus siglas en inglés).
Se conocen en la materia procedimientos para aislar ADN adecuados para estas tecnologías de ensayo. En particular, algunas realizaciones comprenden el aislamiento de ácidos nucleicos como se describe en la solicitud patente de EE.UU. n.° de serie 13/470.251 ("Isolation of Nucleic Acids"), incorporada por referencia en su totalidad en el presente documento.
Procedimientos
En algunas realizaciones de la tecnología, se proporcionan procedimientos que comprenden las siguientes etapas: 1) poner en contacto un ácido nucleico (por ejemplo, ADN genómico, por ejemplo, aislado de un líquido corporal tal como una muestra de heces o tejido pancreático) obtenido del sujeto con al menos un reactivo o serie de reactivos que distingue entre dinucleótidos CpG metilados y no metilados dentro de al menos un marcador que comprende una DMR (por ejemplo, DMR 1-107, por ejemplo, como se proporciona en la tabla 1) (por ejemplo, DMR 1-449, por ejemplo, como se proporciona en la tabla 10) y
2) detectar una neoplasia o un trastorno proliferativo (por ejemplo, con una sensibilidad mayor o igual al 80 % y una especificidad mayor o igual al 80 %).
En algunas realizaciones de la tecnología, se proporcionan procedimientos que comprenden las siguientes etapas: 1) poner en contacto un ácido nucleico (por ejemplo, ADN genómico, por ejemplo, aislado de un líquido corporal tal como una muestra de heces o tejido pancreático) obtenido del sujeto con al menos un reactivo o serie de reactivos que distingue entre dinucleótidos CpG metilados y no metilados dentro de al menos un marcador seleccionado de una región cromosómica que tiene una anotación seleccionado del grupo formado por ABCB1, ADCY1, BHLHE23 (LOC63930), c13orf18, CACNA1C, chr12 133, CLEC11A, ELMO1, EOMES, CLEC 11, SHH, GJC1, IHIF1, IKZF1, KCNK12, KCNN2, PCBP3, PRKCB, RSPO3, SCARF2, SLC38A3, ST8SIA1, TWIST1, VWC2, WT1 y ZNF71 y
2) detectar cáncer de páncreas (por ejemplo, con una sensibilidad mayor o igual al 80 % y una especificidad mayor o igual al 80 %).
En algunas realizaciones de la tecnología, se proporcionan procedimientos que comprenden las siguientes etapas: 1) poner en contacto un ácido nucleico (por ejemplo, ADN genómico, por ejemplo, aislado de un líquido corporal tal como una muestra de heces o tejido esofágico) obtenido del sujeto con al menos un reactivo o serie de reactivos que distingue entre dinucleótidos CpG metilados y no metilados dentro de al menos un marcador seleccionado de una región cromosómica que tiene una anotación seleccionado del grupo formado por NDRG4, SFRP1, BMP3, HPP1 y APC, y
2) detectar el esófago de Barrett (por ejemplo, con una sensibilidad mayor o igual al 80 % y una especificidad mayor o igual al 80 %).
En algunas realizaciones de la tecnología, se proporcionan procedimientos que comprenden las siguientes etapas: 1) poner en contacto un ácido nucleico (por ejemplo, ADN genómico, por ejemplo, aislado de un líquido corporal tal como una muestra de heces o tejido pancreático) obtenido del sujeto con al menos un reactivo o serie de reactivos que distingue entre dinucleótidos CpG metilados y no metilados dentro de al menos un marcador seleccionado de una región cromosómica que tiene una anotación seleccionado del grupo formado por ADCY1, PRKCB, KCNK12, C13ORF18, IKZF1, TWIST1, ELMO, 55957, CD1D, CLEC11A, KCNN2, BMP3 y NDRG4 y 2) detectar cáncer de páncreas (por ejemplo, con una sensibilidad mayor o igual al 80 % y una especificidad mayor o igual al 80 %).
En algunas realizaciones de la tecnología, se proporcionan procedimientos que comprenden las siguientes etapas: 1) poner en contacto un ácido nucleico (por ejemplo, ADN genómico, por ejemplo, aislado de una muestra de heces) obtenido del sujeto con al menos un reactivo o serie de reactivos que distingue entre dinucleótidos CpG metilados y no metilados dentro de una región cromosómica que tiene un CD1D, y
2) detectar cáncer de páncreas (por ejemplo, con una sensibilidad mayor o igual al 80 % y una especificidad mayor o igual al 80 %).
Preferentemente, la sensibilidad es de aproximadamente un 70% a aproximadamente un 100%, o de aproximadamente un 80 % a aproximadamente un 90 %, o de aproximadamente un 80 % a aproximadamente un 85%. Preferentemente, la especificidad es de aproximadamente un 70% a aproximadamente un 100%, o de aproximadamente un 80 % a aproximadamente un 90 %, o de aproximadamente un 80 % a aproximadamente un 85 %.
El ADN genómico puede aislarse por cualquier medio, incluyendo el uso de kits disponibles comercialmente. En resumen, cuando el ADN de interés está encapsulado por una membrana celular, la muestra biológica debe romperse y lisarse mediante medios enzimáticos, químicos o mecánicos. A continuación, la solución de ADN puede eliminarse de proteínas y otros contaminantes, por ejemplo, mediante digestión con proteinasa K. A continuación, se recupera el a Dn genómico de la solución. Esto puede llevarse a cabo mediante una variedad de procedimientos que incluyen desestabilización salina, extracción orgánica o unión del ADN a un soporte en fase sólida. La elección del procedimiento se verá afectada por varios factores, incluyendo el tiempo, gastos y cantidad requerida de ADN. Todos los tipos de muestras clínicas que comprenden materia neoplásica o materia preneoplásica son adecuados para su uso en el presente procedimiento, por ejemplo, líneas celulares, portaobjetos histológicos, biopsias, tejido embebido en parafina, líquidos corporales, heces, efluente colónico, orina, plasma sanguíneo, suero sanguíneo, sangre completa, células sanguíneas aisladas, células aisladas de la sangre y combinaciones de las mismas.
La tecnología no se limita a los procedimientos utilizados para preparar las muestras y proporcionar un ácido nucleico para el ensayo. Por ejemplo, en algunas realizaciones, un ADN se aísla de una muestra de heces o de sangre o de una muestra de plasma mediante captura directa de genes, por ejemplo, como se detalla en la solicitud de patente de EE.UU. n.° de serie 61/485386 o por un procedimiento relacionado.
A continuación, la muestra de ADN genómico se trata con al menos un reactivo o una serie de reactivos, que distingue entre dinucleótidos CpG metilados y no metilados dentro de al menos un marcador que comprende una DMR (por ejemplo, DMR 1-107, por ejemplo, como se indica en la tabla 1) (por ejemplo, DMR 1-449, por ejemplo, como se indica en la tabla 10).
En algunas realizaciones, el reactivo convierte las bases de citosina que no están metiladas en la posición 5' en uracilo, timina, u otra base que sea diferente a la citosina en términos de comportamiento de hibridación. Sin embargo, en algunas realizaciones, el reactivo puede ser una enzima de restricción sensible a la metilación.
En algunas realizaciones, la muestra de ADN genómico se trata de tal manera que las bases de citosina que no están metiladas en la posición 5' se convierten en uracilo, timina, u otra base que es diferente a la citosina en términos de comportamiento de hibridación. En algunas realizaciones, este tratamiento se realiza con bisulfato (hidrogenosulfito, disulfito) seguido de hidrólisis alcalina.
El ácido nucleico tratado se analiza a continuación para determinar el estado de metilación de las secuencias génicas diana (al menos un gen, secuencia genómica, o nucleótido de un marcador que comprende una DMR, por ejemplo, al menos una DMR elegida de DMR 1-107, por ejemplo, como se indica en la tabla 1) (al menos un gen, secuencia genómica, o nucleótido de un marcador que comprende una DMR, por ejemplo, al menos una DMR elegida de DMR 1-449, por ejemplo, como se indica en la tabla 10). El procedimiento de análisis puede seleccionarse entre los conocidos en la materia, incluyendo los enumerados en el presente documento, por ejemplo, QuARTS y MSP como se describe en el presente documento.
La metilación anómala, más específicamente, hipermetilación de un marcador que comprende una DMR (por ejemplo, DMR 1-107, por ejemplo, como se indica en la tabla 1) (por ejemplo, DMR 1-449, por ejemplo, como se indica en la tabla 10) está asociada con un cáncer y, en algunas realizaciones, predice el sitio del tumor.
La tecnología se relaciona con el análisis de cualquier muestra asociada con un cáncer del sistema gastrointestinal. Por ejemplo, en algunas realizaciones, la muestra comprende un tejido y/o líquido biológico obtenido de un paciente. En algunas realizaciones, la muestra comprende una secreción. En algunas realizaciones, la muestra comprende sangre, suero, plasma, secreciones gástricas, jugo pancreático, una muestra de biopsia gastrointestinal, células microdiseccionadas de una biopsia gastrointestinal, células gastrointestinales desprendidas en el lumen gastrointestinal y/o células gastrointestinales recuperadas de las heces. En algunas realizaciones, el sujeto es un ser humano. Estas muestras pueden provenir del tracto gastrointestinal superior, el tracto gastrointestinal inferior, o comprenden células, tejidos y/o secreciones tanto del tracto gastrointestinal superior como del tracto gastrointestinal inferior. La muestra puede incluir células, secreciones o tejidos del hígado, conductos biliares, páncreas, estómago, colon, recto, esófago, intestino delgado, apéndice, duodeno, pólipos, vesícula biliar, ano y/o peritoneo. En algunas realizaciones, la muestra comprende líquido celular, ascitis, orina, heces, líquido pancreático, líquido obtenido durante una endoscopia, sangre, moco o saliva. En algunas realizaciones, la muestra es una muestra de heces. Dichas muestras pueden obtenerse mediante cualquier número de medios conocidos en la materia, tal como resultará evidente para el experto. Por ejemplo, las muestras de orina y heces son fáciles de obtener, mientras que las muestras de sangre, ascitis, suero o líquido pancreático se pueden obtener por vía parenteral utilizando una aguja y una jeringa, por ejemplo. Se pueden obtener muestras libres de células o sustancialmente libres de células sometiendo la muestra a diversas técnicas conocidas por los expertos en la materia que incluyen, pero sin limitación, centrifugación y filtración. Aunque generalmente se prefiere que no se utilicen técnicas invasivas para obtener la muestra, todavía puede ser preferible obtener muestras tales como homogeneizados de tejidos, cortes de tejido y muestras de biopsia.
En algunas realizaciones, la tecnología se relaciona con un procedimiento para tratar a un paciente (por ejemplo, un paciente con cáncer gastrointestinal, con cáncer gastrointestinal en estadio temprano, o que puedan desarrollar cáncer gastrointestinal), comprendiendo el procedimiento determinar el estado de metilación de una o más DMR como se proporciona en el presente documento y administrar un tratamiento al paciente basado en los resultados de la determinación del estado de metilación. El tratamiento puede ser la administración de un compuesto farmacéutico, una vacuna, realizar una cirugía, obtener imágenes del paciente, realizar otra prueba. Preferentemente, dicho uso es en un procedimiento de detección clínica, un procedimiento de evaluación del pronóstico, un procedimiento de seguimiento de los resultados de la terapia, un procedimiento para identificar a los pacientes con más probabilidades de responder a un tratamiento terapéutico particular, un procedimiento para obtener imágenes de un paciente o sujeto, y un procedimiento para la detección y el desarrollo de fármacos.
En algunas realizaciones de la tecnología, se proporciona un procedimiento para diagnosticar un cáncer gastrointestinal en un sujeto. Los términos "diagnosticar" y "diagnóstico", como se usan en el presente documento, se refieren a procedimientos mediante los cuales el experto en la materia puede estimar e incluso determinar si un sujeto padece o no una enfermedad o afección determinada o puede desarrollar una enfermedad o afección determinada en el futuro. El experto en la materia a menudo hace un diagnóstico basándose en uno o más indicadores de diagnóstico, tal como, por ejemplo, un biomarcador (por ejemplo, una DMR como se desvela en el presente documento), cuyo estado de metilación es indicativo de la presencia, intensidad o ausencia de la afección.
Junto con el diagnóstico, el pronóstico clínico de cáncer se relaciona con la determinación de la agresividad del cáncer y la probabilidad de recurrencia del tumor para planificar la terapia más eficaz. Si se puede hacer un pronóstico más preciso o incluso si se puede evaluar un posible riesgo de desarrollar el cáncer, puede elegirse una terapia adecuada y, en algunos casos, una terapia menos intensa para el paciente. La evaluación (por ejemplo, determinación del estado de metilación) de los biomarcadores del cáncer es útil para separar a los sujetos con buen pronóstico y/o bajo riesgo de desarrollar cáncer que no necesitarán terapia o terapia limitada de aquellos con más probabilidades de desarrollar cáncer o sufrir una recurrencia del cáncer que se beneficiarán de tratamientos más intensivos.
Como tal, "hacer un diagnóstico" o "diagnosticar", tal como se usa en el presente documento, incluye además determinar un riesgo de desarrollar cáncer o determinar un pronóstico, que puede prever un resultado clínico (con o sin tratamiento médico), seleccionar un tratamiento adecuado (o si el tratamiento sería eficaz), o controlar un tratamiento actual y posiblemente cambiar el tratamiento, basándose en la medida de los biomarcadores de diagnóstico (por ejemplo, DMR) desvelados en el presente documento. Además, en algunas realizaciones de la materia objeto actualmente desvelada, se puede realizar una determinación múltiple de los biomarcadores a lo largo del tiempo para facilitar el diagnóstico y/o el pronóstico. Se puede usar un cambio temporal en el biomarcador para predecir un resultado clínico, controlar la progresión del cáncer gastrointestinal y/o controlar la eficacia de las terapias adecuadas dirigidas contra el cáncer. En dicha realización, por ejemplo, se podría esperar ver un cambio en el estado de metilación de uno o más biomarcadores (por ejemplo, DMR) desvelados en el presente documento (y posiblemente uno o más biomarcadores adicionales, si se controlan) en una muestra biológica a lo largo del tiempo durante la evolución de una terapia eficaz.
La materia objeto actualmente desvelada además proporciona en algunas realizaciones un procedimiento para determinar si iniciar o continuar la profilaxis o el tratamiento de un cáncer en un sujeto. En algunas realizaciones, el procedimiento comprende proporcionar una serie de muestras biológicas durante un período de tiempo del sujeto; analizar la serie de muestras biológicas para determinar un estado de metilación de al menos un biomarcador desvelado en el presente documento en cada una de las muestras biológicas; y comparar cualquier cambio medible en los estados de metilación de uno o más de los biomarcadores en cada una de las muestras biológicas. Cualquier cambio en los estados de metilación de los biomarcadores durante el período de tiempo se puede utilizar para predecir el riesgo de desarrollar cáncer, predecir un resultado clínico, determinar si iniciar o continuar la profilaxis o la terapia del cáncer, y si una terapia actual está tratando eficazmente el cáncer. Por ejemplo, se puede seleccionar un primer punto temporal antes del inicio de un tratamiento y se puede seleccionar un segundo punto temporal en algún momento después del inicio del tratamiento. Los estados de metilación se pueden medir en cada una de las muestras tomadas en diferentes puntos temporales y se pueden observar diferencias cualitativas y/o cuantitativas. Un cambio en los estados de metilación de los niveles de biomarcadores de las diferentes muestras puede correlacionarse con el riesgo de padecer cáncer gastrointestinal, el pronóstico, la determinación de la eficacia del tratamiento y/o la progresión del cáncer en el sujeto.
En realizaciones preferidas, los procedimientos y composiciones de la invención son para el tratamiento o diagnóstico de enfermedades en una etapa temprana, por ejemplo, antes de que aparezcan los síntomas de la enfermedad. En algunas realizaciones, los procedimientos y composiciones de la invención son para el tratamiento o diagnóstico de enfermedades en una etapa clínica.
Como se indica, en algunas realizaciones, se pueden realizar múltiples determinaciones de uno o más biomarcadores de diagnóstico o pronóstico, y se puede usar un cambio temporal en el marcador para determinar un diagnóstico o pronóstico. Por ejemplo, se puede determinar un marcador de diagnóstico en un momento inicial y nuevamente en un segundo momento. En tales realizaciones, un aumento del marcador desde el momento inicial hasta el segundo momento puede ser diagnóstico de un tipo o intensidad particular de cáncer, o de un pronóstico determinado. Asimismo, una disminución en el marcador desde el momento inicial hasta el segundo momento puede ser indicativa de un tipo o intensidad particular de cáncer, o de un pronóstico determinado. Asimismo, el grado de cambio de uno o más marcadores puede estar relacionado con la intensidad del cáncer y los eventos adversos futuros. El experto en la materia entenderá que, mientras que en determinadas realizaciones se pueden realizar mediciones comparativas del mismo biomarcador en múltiples puntos temporales, también se puede medir un biomarcador dado en un punto temporal y un segundo biomarcador en un segundo punto temporal, y una comparación de estos marcadores puede proporcionar información de diagnóstico.
Como se usa en el presente documento, la expresión "determinar el pronóstico" se refiere a procedimientos mediante los cuales el experto en la materia puede predecir la evolución o resultado de una afección en un sujeto. El término "pronóstico" no se refiere a la capacidad de predecir la evolución o el resultado de una afección con una precisión del 100 %, o incluso que es más o menos probable que se produzca una evolución o resultado dado según el estado de metilación de un biomarcador (por ejemplo, una DMR). En cambio, el experto en la materia comprenderá que el término "pronóstico" se refiere a una mayor probabilidad de que se produzca una determinada evolución o resultado; es decir, que es más probable que ocurra una evolución o resultado en un sujeto que presenta una afección determinada, en comparación con aquellos individuos que no presentan la afección. Por ejemplo, en individuos que no presentan la afección (por ejemplo, que tienen un estado de mutilación normal de una o más DMR), la posibilidad de un resultado dado (por ejemplo, sufrir un cáncer gastrointestinal) puede ser muy baja.
En algunas realizaciones, un análisis estadístico asocia un indicador de pronóstico con una predisposición a un resultado adverso. Por ejemplo, en algunas realizaciones, un estado de metilación diferente al de una muestra de control normal obtenida de un paciente que no tiene cáncer puede indicar que un sujeto tiene más probabilidades de sufrir un cáncer que los sujetos con un nivel que es más similar al estado de metilación en la muestra de control, según lo determinado por un nivel de significación estadística. Adicionalmente, un cambio en el estado de metilación desde un nivel inicial (por ejemplo, "normal") puede reflejar el pronóstico del sujeto, y el grado de cambio en el estado de metilación puede estar relacionado con la intensidad de los eventos adversos. La significación estadística a menudo se determina mediante la comparación de dos o más poblaciones y la determinación de un intervalo de confianza y/o un valor p. Véase, por ejemplo, Dowdy y Wearden, Statistics for Research, John Wiley & Sons, Nueva York, 1983, incorporado por referencia en su totalidad en el presente documento. Los intervalos de confianza ilustrativos de la presente materia objeto son 90 %, 95 %, 97,5 %, 98 %, 99 %, 99,5 %, 99,9 % y 99,99 %, mientras que los valores p ilustrativos son 0,1, 0,05, 0,025, 0,02, 0,01, 0,005, 0,001 y 0,0001.
En otras realizaciones, se puede establecer un grado umbral de cambio en el estado de metilación de un biomarcador de pronóstico o diagnóstico desvelado en el presente documento (por ejemplo, una DMR), y el grado de cambio en el estado de metilación del biomarcador en una muestra biológica se compara simplemente con el grado umbral de cambio en el estado de metilación. Un cambio de umbral preferido en el estado de metilación para los biomarcadores proporcionados en el presente documento es de aproximadamente un 5 %, aproximadamente un 10%, aproximadamente un 15%, aproximadamente un 20%, aproximadamente un 25%, aproximadamente un 30%, aproximadamente un 50%, aproximadamente un 75%, aproximadamente un 100% y aproximadamente un 150 %. En otras realizaciones más, se puede establecer un "nomograma", por el cual un estado de metilación de un indicador de pronóstico o diagnóstico (biomarcador o combinación de biomarcadores) está directamente relacionado con una disposición asociada hacia un resultado dado. El experto en la materia está familiarizado con el uso de dichos nomogramas para relacionar dos valores numéricos con el entendimiento de que la incertidumbre en esta medición es la misma que la incertidumbre en la concentración del marcador porque se referencian las mediciones de muestras individuales, no promedios poblacionales.
En algunas realizaciones, se analiza una muestra de control al mismo tiempo que la muestra biológica, de manera que los resultados obtenidos de la muestra biológica puedan compararse con los resultados obtenidos de la muestra de control. Adicionalmente, se contempla que se puedan proporcionar curvas estándar, con las que se pueden comparar resultados del ensayo para la muestra biológica. Dichas curvas estándar presentan estados de metilación de un biomarcador en función de las unidades de ensayo, por ejemplo, intensidad de la señal fluorescente, si se utiliza un marcador fluorescente. Usando muestras tomadas de múltiples donantes, se pueden proporcionar curvas estándar para controlar los estados de metilación de uno o más biomarcadores en tejido normal, así como para los niveles "en riesgo" de uno o más biomarcadores en tejido tomado de donantes con metaplasia o de donantes con cáncer gastrointestinal. En determinadas realizaciones del procedimiento, se identifica un sujeto que tiene metaplasia al identificar un estado de metilación anómalo de una o más DMR proporcionadas en el presente documento en una muestra biológica obtenida del sujeto. En otras realizaciones del procedimiento, la detección de un estado de metilación anómalo de uno o más de dichos biomarcadores en una muestra biológica obtenida del sujeto da como resultado que se identifique que el sujeto tiene cáncer.
El análisis de marcadores se puede realizar por separado o simultáneamente con marcadores adicionales dentro de una muestra de ensayo. Por ejemplo, se pueden combinar varios marcadores en una prueba para un procesamiento eficaz de múltiples muestras y para proporcionar posiblemente una mayor precisión de diagnóstico y/o pronóstico. Además, un experto en la materia reconocería el valor de analizar múltiples muestras (por ejemplo, en puntos temporales sucesivos) del mismo sujeto. Dicho análisis de muestras en serie puede permitir la identificación de cambios en los estados de metilación de los marcadores a lo largo del tiempo. Los cambios en el estado de metilación, así como la ausencia de cambio en el estado de metilación, puede proporcionar información útil sobre el estado de la enfermedad que incluye, pero sin limitación, identificar el tiempo aproximado desde el inicio del evento, la presencia y cantidad de tejido recuperable, la idoneidad de las terapias farmacológicas, la eficacia de varias terapias, y la identificación del resultado del sujeto, incluido el riesgo de eventos futuros.
El análisis de biomarcadores se puede llevar a cabo en una variedad de formatos físicos. Por ejemplo, el uso de placas de microtitulación o la automatización pueden utilizarse para facilitar el procesamiento de un gran número de muestras de ensayo. Como alternativa, se podrían desarrollar formatos de muestra única para facilitar el tratamiento y el diagnóstico inmediatos de manera oportuna, por ejemplo, en el transporte ambulatorio o en la sala de emergencias.
En algunas realizaciones, al sujeto se le diagnostica un cáncer gastrointestinal si, en comparación con un estado de metilación de control, existe una diferencia medible en el estado de metilación de al menos un biomarcador en la muestra. Por el contrario, cuando no se identifica ningún cambio en el estado de metilación en la muestra biológica, se puede identificar que el sujeto no tiene cáncer gastrointestinal, no tiene riesgo de padecer cáncer o tener un riesgo bajo de padecer cáncer. A este respecto, los sujetos que tienen cáncer o riesgo de padecerlo se pueden diferenciar de los sujetos que tienen bajo o sustancialmente ningún cáncer o riesgo de padecerlo. Aquellos sujetos que tengan riesgo de desarrollar un cáncer gastrointestinal se pueden colocar en un programa de detección más intensivo y/o regular, incluida la vigilancia endoscópica. Por otro lado, aquellos sujetos que tienen un riesgo bajo o sustancialmente nulo pueden evitar someterse a una endoscopia, hasta el momento en que una futura detección, por ejemplo, una detección realizada de acuerdo con la presente tecnología, indique que ha aparecido un riesgo de padecer cáncer gastrointestinal en esos sujetos.
Como se ha mencionado anteriormente, dependiendo de la realización del procedimiento de la presente tecnología, detectar un cambio en el estado de metilación de uno o más biomarcadores puede ser una determinación cualitativa o puede ser una determinación cuantitativa. Como tal, la etapa de diagnosticar que un sujeto tiene, o está en riesgo de desarrollar, un cáncer gastrointestinal indica que se realizan determinadas mediciones de umbral, por ejemplo, el estado de metilación de uno o más biomarcadores en la muestra biológica varía de un estado de metilación de control predeterminado. En algunas realizaciones del procedimiento, el estado de metilación de control es cualquier estado de metilación detectable del biomarcador. En otras realizaciones del procedimiento en el que una muestra de control se analiza al mismo tiempo que la muestra biológica, el estado de metilación predeterminado es el estado de metilación en la muestra de control. En otras realizaciones del procedimiento, el estado de metilación predeterminado se basa y/o se identifica mediante una curva estándar. En otras realizaciones del procedimiento, el estado de metilación predeterminado es un estado o intervalo de estado específico. Como tal, se puede elegir el estado de metilación predeterminado, dentro de los límites aceptables que serán evidentes para los expertos en la materia, basándose en parte en la realización del procedimiento que se está practicando y la especificidad deseada, etc.
Además, con respecto a los procedimientos de diagnóstico, un sujeto preferido es un sujeto vertebrado. Un vertebrado preferido es el de sangre caliente; un vertebrado de sangre caliente preferido es un mamífero. Un mamífero preferido es lo más preferentemente un ser humano. Como se usa en el presente documento, el término "sujeto" incluye sujetos tanto humanos como animales. Por tanto, se proporcionan en el presente documento usos terapéuticos veterinarios. Como tal, la presente tecnología proporciona el diagnóstico de mamíferos tales como seres humanos, así como aquellos mamíferos de importancia por estar en peligro de extinción, tales como tigres siberianos; de importancia económica, tales como animales criados en granjas para consumo humano; y/o animales de importancia social para los seres humanos, tales como animales que se mantienen como mascotas o en zoológicos. Los ejemplos de dichos animales incluyen, pero sin limitación: carnívoros tales como perros y gatos; ganado porcino, incluyendo cerdos, puercos y jabalíes; rumiantes y/o ungulados tales como ganado, bueyes, ovejas, jirafas, ciervos, cabras, bisontes y camellos; y caballos. Por tanto, también se proporciona el diagnóstico y tratamiento del ganado, incluyendo, pero sin limitación, cerdos domesticados, rumiantes, ungulados, caballos (incluyendo caballos de carreras) y similares. La materia objeto actualmente desvelada incluye además un sistema para diagnosticar un cáncer gastrointestinal en un sujeto. El sistema se puede proporcionar, por ejemplo, como un kit comercial que puede utilizarse para detectar un riesgo de cáncer gastrointestinal o diagnosticar un cáncer gastrointestinal en un sujeto del que se ha recogido una muestra biológica. Un sistema ilustrativo proporcionado de acuerdo con la presente tecnología incluye evaluar el estado de metilación de una DMR como se proporciona en la tabla 1.
Ejemplos
Ejemplo 1 - Identificación de marcadores usando RRBS
Colectivamente, los cánceres gastrointestinales son responsables de más muertes que los de cualquier otro sistema orgánico, y la incidencia añadida de cáncer gastrointestinal superior y la del cáncer colorrectal (CCR) son comparables. Para maximizar la eficacia de la detección y el diagnóstico, se necesitan marcadores moleculares para el cáncer gastrointestinal que sean específicos del sitio cuando se analizan de medios distantes, tales como sangre o heces. Aunque son ampliamente informativos, los marcadores de ácidos nucleicos metilados de manera anómala a menudo son comunes a los cánceres gastrointestinales superiores y al CCR.
Durante el desarrollo de la tecnología proporcionada en el presente documento, se recogieron datos de un estudio de casos y controles para demostrar que una estrategia de búsqueda en todo el genoma identifica marcadores candidatos novedosos e informativos. Los experimentos preliminares demostraron que el análisis de heces de un marcador génico metilado (BMP3) detecta PanC. A continuación, se demostró que un ensayo combinado de BMP3 metilado y KRAS mutante aumentaba la detección sobre cualquier marcador solo. Sin embargo, los marcadores discriminantes en el tejido demostraron ser malos marcadores en las heces debido a un alto fondo de metilación, por ejemplo, detectado en las muestras de control.
Población de estudio, adquisición de piezas y muestras
La población diana fueron los pacientes con cáncer de páncreas atendidos en la Mayo Clinic. La población accesible incluye aquellos que se han sometido a una pancreatectomía distal, una pancreoduodenectomía o una colectomía con una pieza de resección archivada y un diagnóstico patológico confirmado. El ADN del epitelio colónico se extrajo previamente de piezas microdiseccionadas por el laboratorio Biospecimens Accessioning Processing (BAP) utilizando un protocolo de fenol-cloroformo. El personal de Pancreas SPORE utilizó datos sobre las variables coincidentes para estas muestras para seleccionar muestras de registro de tejidos. Estas fueron revisadas por un patólogo experto para confirmar el estado del caso y control y excluir los casos de neoplasias que surgen de IPMN, que puede tener una biología subyacente diferente. El personal de SPORE organizó la microdisección del laboratorio BAP y la extracción de ADN de las muestras de caso y control pancreático y proporcionó 500 ng de ADN al personal del laboratorio que no conocía el estado del caso y control. Las muestras de ácido nucleico de archivo incluían 18 adenocarcinomas de páncreas, 18 páncreas normales y 18 epitelios colónicos normales emparejados por sexo, edad y tabaquismo.
Los tipos de muestra fueron:
1) tejidos PanC del registro SPORE de páncreas de la Mayo Clinic limitados a los estadios I y II de AJCC;
2) páncreas de control libres de PanC;
3) epitelio colónico de control archivado libre de PanC; y
4) neoplasia de colon de la que se extrajo ADN y se almacenó en el laboratorio BAP.
Los casos y controles se emparejaron por sexo, edad (en incrementos de 5 años) y estado de tabaquismo (actual o anterior frente nunca).
Variables principales
La variable principal fue el porcentaje de metilación de cada amplicón individual de 101 pares de bases de las regiones HCP. El porcentaje de metilación en las muestras de casos se comparó con las muestras de control siguiendo RRBS.
Procedimientos
Las bibliotecas se prepararon de acuerdo con procedimientos previamente informados (véase, por ejemplo, Gu y col. (2011) "Preparation of reduced representation bisulfite sequencing libraries for genome-scale DNA methylation profiling" Nature Protocols 6: 468-81) mediante la fragmentación de ADN genómico (300 ng) por digestión con 10 unidades de Mspl, una enzima de restricción específica de metilación que reconoce motivos que contienen CpG. Este tratamiento enriquece las muestras para el contenido de CpG y elimina áreas redundantes del genoma. Los fragmentos digeridos se repararon en los extremos y se poliadenilaron con 5 unidades de fragmento de Klenow (3'-5' exo) y se unieron durante la noche a adaptadores Illumina que contenían una de las cuatro secuencias de código de barras para unir cada fragmento a su ID de muestra. La selección del tamaño de los fragmentos de 160-340 pb (que tienen insertos de 40-220 pb) se realizó usando perlas/tampón SPRI (AMPure XP, Beckman Coulter). Los límites de tampón fueron de 0,7x a 1,1x del volumen de muestra de perlas/tampón. Las muestras se eluyeron en un volumen de 22 |jl (tampón EB, Qiagen). Se utilizó qPCR para medir la eficacia de la unión y la calidad del fragmento en una pequeña alícuota de muestra. A continuación, las muestras se sometieron a dos rondas de conversión con bisulfito usando un protocolo EpiTect modificado (Qiagen). Las qPCR y PCR convencional (Pfu Turbo Cx hotstart, Agilent), seguidas de la evaluación con Bioanalyzer 2100 (Agilent) en alícuotas de muestra convertidas, determinaron el número de ciclo de PCR óptimo antes de la amplificación de la biblioteca final. La PCR final se realizó en un volumen de 50 j l (5 j l de tampón de PCR 10x; 1,25 j l de cada dNTP a 10 mM; 5 j l de un cóctel de cebadores a aproximadamente 5 jM, 15 j l de molde (muestra), 1 j l de PfuTurbo Cx hotstart y 22,75 j l de agua. El ciclo térmico comenzó con incubaciones iniciales a 95 °C durante 5 minutos y a 98 °C durante 30 segundos, seguidas de 16 ciclos a 98 °C durante 10 segundos, 65 °C durante 30 segundos y a 72 °C durante 30 segundos. Después de los ciclos, las muestras se incubaron a 72 °C durante 5 minutos y se mantuvieron a 4°C hasta su posterior procesamiento y análisis. Las muestras se combinaron en cantidades equimolares en bibliotecas de 4 plex basadas en un esquema de aleatorización y se analizaron con el bioanalizador para la verificación del tamaño final. Las muestras también se analizaron con qPCR utilizando patrones phiX y cebadores específicos de adaptador.
Para la secuenciación, las muestras se cargaron en carriles de celda de flujo de acuerdo con una asignación de carril aleatoria con carriles adicionales reservados para controles de ensayo internos. La secuenciación se realizó mediante NGS Core en el Medical Genome Facility de Mayo en el Illumina HiSeq 2000. Las lecturas fueron unidireccionales durante 101 ciclos. Cada carril de la celda de flujo generó 100-120 millones de lecturas, suficientes para una cobertura mediana de profundidad de secuenciación de 30x a 50x (según el número de lecturas por CpG) para secuencias alineadas. Se utilizó el programa informático de conexión estándar de Illumina para analizar las lecturas en combinación con RRBSMAP (Xi, y col. (2012) "RRBSMAP: a fast, accurate and user-friendly alignment tool for reduced representation bisulfite sequencing" Bioinformatics 28: 430-432) y una conexión interna (SAAP-RRBS) desarrollada por personal de Mayo Biomedical and Statistics (Sun y col. (2012)" SAAP-RRBS: streamlined analysis and annotation pipeline for reduced representation bisulfite sequencing" Bioinformatics 28: 2180-1). Los análisis bioinformáticos consistieron en 1) evaluación y limpieza de lecturas de secuencia, 2) alineación con el genoma de referencia, 3) extracción del estado de metilación y 4) notificación y anotación de CpG.
Consideraciones estadísticas
La comparación primaria evaluó las diferencias de metilación entre casos y controles pancreáticos en cada CpG y/o ventana de CpG en mosaico. La comparación secundaria evaluó las diferencias de metilación entre casos y controles de colon. Los marcadores se analizaron para la metilación diferencial mediante:
1. Evaluación de las distribuciones del porcentaje de mutilación para cada marcador y descarte de los marcadores que estaban metilados en más del 1 % en el 10 % de los controles;
2. Análisis de la distribución de metilación de los marcadores restantes entre casos y controles utilizando la prueba de la suma de rangos de Wilcoxon y los marcadores de clasificación por valores p; y
3. Uso de valores Q para estimar tasas de descubrimiento falso (FDR, por sus siglas en inglés) (Benjamini y col. (1995) Revista "Multiple Testing" de la Royal Statistical Society. Series B (Methodological) 57: 289-300; Storey y col. (2003) "Statistical significance for genomewide studies" Proc Natl Acad Sci USA 1O0: 9440-5). A nivel de descubrimiento, una FDR de hasta el 25 % es aceptable.
Análisis de los datos
Se desarrolló una conexión de análisis de datos en el paquete del programa informático de análisis estadístico R ("R: A Language and Environment for Statistical Computing" (2012), R Foundation for Statistical Computing). El flujo de trabajo consta de las siguientes etapas:
1. Lectura en los 6.101.049 de sitios CpG
2. Para un análisis más detallado, identificación de solo aquellos sitios CpG en los que la profundidad de cobertura total del grupo es de 200 lecturas o más. Este valor de corte se basó en una evaluación de potencia para detectar una diferencia de metilación entre el 20 % y el 30 % entre dos grupos cualesquiera porque cualquier valor inferior a este intervalo tiene pocas posibilidades de ser significativo. La profundidad de cobertura de grupo mide el número de lecturas para todos los sujetos de un grupo (por ejemplo, si hay 18 sujetos por grupo y cada sujeto tiene 12 lecturas, entonces la profundidad de cobertura de grupo es 12 x 18 = 216).
3. Estimación de la asociación del subtipo de enfermedad con el % de metilación usando la regresión de Poisson inflada con varianza; los sitios CpG más discriminados se determinaron mediante la comparación del ajuste del modelo x2 al percentil 95 de todos los modelos ajustados. Excluir todos los sitios CpG en los que la varianza del porcentaje de metilación entre los grupos es 0 porque estos sitios son sitios CpG no informativos.
La aplicación de los filtros de 2 y 3 dejó un total de 1.217.523 de sitios CpG.
4. Realización de una regresión logística en el % de metilación (basado en los recuentos reales) utilizando grupos definidos como colon normal, páncreas normal y páncreas canceroso. Dado que la variabilidad en el % de metilación entre sujetos es mayor que la permitida por el supuesto binomial, se utilizó un modelo de regresión logística sobredispersado para explicar el aumento de la varianza. Este parámetro de dispersión se estimó mediante el Chi-cuadrado de Pearson del ajuste.
5. A partir de estos ajustes de los modelos, cálculo de un valor muestral F general para la comparación de grupos basada en el cambio en la desviación entre los modelos con y sin cada grupo como regresor. Esta desviación se mejoró por el parámetro de dispersión estimado.
6. Creación de islas de CpG en cada cromosoma según la distancia entre las ubicaciones de los sitios CpG. Aproximadamente, cuando la distancia entre dos ubicaciones de CpG supera los 100 pb, cada ubicación se define como una isla independiente. Algunas islas eran únicas y fueron excluidas.
7. A partir de la definición de isla anterior, se calcula el valor muestral F promedio. Cuando el valor muestral F excede el 95 % (es decir, el 5 % superior) de todos los sitios CpG para el cromosoma particular, se genera un sumario gráfico.
El análisis adicional comprendió los siguientes filtros de selección:
1. Valor de corte del valor p de ANOVA < 0,01
2. Relaciones de % de metilación de PanC a páncreas normal y colon normal > 10
3. % de metilación de normales < 2 %
4. Número de CpG contiguos que cumplen los criterios > 3
Se evaluó la ventana de metilación para incluir CpG contiguos adicionales que presentan metilación significativa. A continuación, los candidatos se clasificaron por nombre de gen para las regiones anotadas y por ubicación cromosómica para las regiones no anotadas.
Resultados
Se mapearon aproximadamente 6 millones de CpG con una cobertura > 10x. Más de 500 islas de CpG cumplieron los criterios de significación para la metilación diferencial. Después de aplicar los criterios de filtro anteriores, se identificaron 107 regiones metiladas diferencialmente (DMR) (Tabla 1).
Tabla 1: DMR
DMR n.° anotación génica cromosoma cadena región en el cromosoma (base inicialbase final)
1 ninguna 1 F 35394805-35394875
2 ninguna 1 F 240161479-240161546
3 ninguna 1 R 156406057-156406118
(continuación)
DMR n.° anotación génica cromosoma cadena región en el cromosoma (base inicialbase final)
4 AK055957 12 F 133484978-133485738
5 ninguna 12 R 133484979-133485739
6 APBA2 15 F 29131299-29131369
7 ninguna 2 F 71503632-71503860
8 PCBP3 21 R 47063793-47064177
9 TMEM200A 6 F 130687223-130687729
10 ninguna 9 R 120507311-120507354
11 ABCB1 7 R 87229775-87229856
12 ADAMTS17 15 R 100881373-100881437
13 ADAMTS18 16 R 77468655-77468742
14 ADCY1 7 F 45613877-45614564
15 ADCY1 7 R 45613878-45614572
16 AGFG2 7 F 100136884-100137350
17 ARHGEF7 13 F 111767862-111768355
18 AUTS2 7 R 69062531-69062585
19 BTBD11 12 F 107715014-107715095
20 BVES 6 R 105584524-105584800
21 c13orf18 13 F 46960770-46961464
22 c13orf18 13 R 46960910-46961569
23 CACNA1C 12 F 2800665-2800898
24 CBLN1 16 R 49315846-49315932
25 CBS 21 F 44496031-44496378
26 CBS 21 R 44495926-44496485
27 CD1D 1 F 158150797-158151142
28 CELF2 10 F 11059508-11060151
29 CLEC11A 19 F 51228217-51228703
30 CLEC11A 19 R 51228325-51228732
31 CNR1 6 F 88876367-88876445
32 CNR1 6 R 88875699-88875763
33 CHRH2 7 F 30721941-30722084
34 DBNL 7 F 44084171-44084235
35 DBX1 11 R 20178177-20178304
36 DHRS12 13 F 52378159-52378202
37 DLL1 6 F 170598241-170600366
38 ELMO1 7 F 37487539-37488498
39 ELMO1 7 R 37487540-37488477
40 EN1 2 R 119607676-119607765
41 EOMES 3 F 27763358-27763617
42 FBLN1 22 R 45898798-45898888
43 FEM1C 5 F 114880375-114880442
44 FER1L4 20 R 34189679-34189687
45 FKBP2 11 F 64008415-64008495
46 FLT3 13 F 28674451-28674629
47 FNIP1 5 F 131132146-131132232
48 FOXP2 7 R 113727624-113727693
49 GFRA4 20 R 3641457-3641537
50 GJC1 17 F 42907705-42907798
51 GJC1 17 R 42907752-42907827
52 GRIN2D 19 F 48946755-48946912
(continuación)
DMR n.° anotación génica cromosoma cadena región en el cromosoma (base inicialbase final)
53 HECW1 7 R 43152309-43152375
54 HOXA1 7 R 27136030-27136245
55 IFIH1 2 R 163174541-163174659
56 IGF2BP1 17 F 47073394-47073451
57 IKZF1 7 R 50343848-50343927
58 INSM1 (región 1) 20 F 20345123-20345150
59 INSM1 (región 2) 20 F 20350520-20350532
60 KCNK12 2 F 47797332-47797371
61 KCNN2 5 F 113696984-113697057
62 KCTD15 19 R 34287890-34287972
63 UNGO3 19 F 2290471-2290541
64 LOC100126784 11 R 19733958-19734013
65 LOC63930 20 F 61637950-61638000
66 LOC642345 13 R 88323571-88323647
67 MLLT1 19 R 6236992-6237089
68 MPND 19 R 4343896-4242968
69 MYEF2 15 F 48470117-48470606
70 NDUFAB1 16 R 23607524-23607650
71 NFASC 1 F 204797781-204797859
72 NR5A1 9 F 127266951-127267032
73 PDE6B 4 F 657586-657665
74 PLAGL1 6 R 144384503-144385539
75 PRKCB 16 R 23846964-23848004
76 PRRT3 3 F 9988302-9988499
77 PTF1A 10 F 23480864-23480913
78 RASGRF2 5 R 80256215-80256313
79 RIMKLA 1 R 42846119-42846174
80 RNF216 7 F 5821188-5821283
81 RSPO3 6 F 127440526-127441039
82 RSPO3 6 R 127440492-127440609
83 RYBP 3 R 72496092-72496361
84 SCARF2 22 F 20785373-20785464
85 SHH 7 F 155597771-155597951
86 SLC35E3 12 F 69140018-69140202
87 SLC38A3 3 R 50243467-50243553
88 SLC6A3 5 R 1445384-1445473
89 SPSB4 3 F 140770135-140770193
90 SRCIN1 17 R 36762706-36762763
91 ST6GAL2 2 F 107502978-107503055
92 ST6GAL2 2 R 107503155-107503391
93 ST8SIA1 12 F 22487528-22487827
94 ST8SIA1 12 R 22487664-22487848
95 ST8SIA6 10 F 17496177-17496310
96 SUSD5 3 R 33260338-33260423
97 TOX2 20 F 42544666-42544874
98 TWIST1 7 F 19156788-19157093
99 TWIST1 7 R 19156815-19157227
100 USP3 15 R 63795435-63795636
101 USP44 12 R 95942179-95942558
(continuación)
DMR n.° anotación génica cromosoma cadena región en el cromosoma (base inicialbase final)
102 VIM 10 F 17271896-17271994
103 VWC2 7 R 49813182-49814168
104 WT1 11 R 32460759-32460800
105 ZFP30 19 F 38146299-38146397
106 ZNF570 19 F 37958078-37958134
107 ZNF71 19 F 57106617-57106852
En la tabla 1, las bases están numeradas de acuerdo con el ensamblaje del genoma humano GRCh37/hg19 de febrero de 2009 (véase, por ejemplo, Rosenbloom y col. (2012) "ENCODE wholegenome data in the UCSC Genome Browser: update 2012" Nucleic Acids Research 40: D912-D917). Los nombres de los marcadores BHLHE23 y LOC63930 se refieren al mismo marcador.
En estos candidatos, las firmas de mutilación van desde 3 CpG vecinos hasta 52 CpG. Algunos marcadores presentan metilación en ambas cadenas; otros están hemimetilados. Dado que las cadenas no son complementarias después de la conversión con bisulfito, las regiones directa e inversa se contaron por separado. Mientras que la tabla 1 indica la cadena en la que se encuentra el marcador, la tecnología no se limita a detectar la metilación solo en la cadena indicada. La tecnología abarca la medición de la metilación en cadenas directa o inversa y/o en ambas cadenas directa e inversa; y/o la detección de un cambio en el estado de metilación en cadenas directa o inversa y/o en ambas cadenas directa e inversa.
Los niveles de metilación de los cánceres de páncreas rara vez superaron el 25 % en los CpG filtrados, lo que sugirió que los tejidos cancerosos pueden tener altos niveles de estroma y/o células normales contaminantes. Para probar esto, cada uno de los cánceres se secuenció para las mutaciones KRAS para verificar las frecuencias alélicas de las muestras positivas. Para el 50 % que albergaba un cambio de base de KRAS heterocigoto, la frecuencia del alelo mutante fue al menos 4 veces menor que la del alelo de tipo silvestre correspondiente, en apoyo de la contaminación por estroma y/o células normales.
Se encontró que 7 de los 107 marcadores están en regiones no anotadas y se encuentran en regiones genómicas sin elementos codificantes de proteínas. Un marcador es adyacente a una secuencia reguladora de ARNnc (AK055957). De los 99 marcadores candidatos restantes, aproximadamente 30 se han descrito como asociados con el cáncer, algunos de los cuales se clasifican como supresores de tumores. Algunos ejemplos:
ADCY1 Disminuido en osteosarcoma
ELMO1 Promueve la invasión de gliomas
HOXA2 Hipermetilado en colangioca
RSPO3 Regulador de señalización wnt
SUSD5 Media la metástasis ósea en cáncer de pulmón
KCNK12 Hipermetilado en cáncer de colon
CLEC11A GF de células madre en la leucemia
USP3 Requerido para la progresión de la fase S
Los otros 69 marcadores candidatos tienen una asociación débil previamente identificada con el cáncer (por ejemplo, mutaciones y/o alteraciones en el número de copias observadas en las detecciones de todo el genoma) o no tienen asociaciones de cáncer identificadas previamente.
Ejemplo 2 - Validación de marcadores
Para validar las DMR como marcadores de cáncer, se realizaron dos estudios de validación basados en PCR en conjuntos de muestras ampliados. El primer estudio utilizó muestras de grupos de pacientes similares a los utilizados en el ejemplo 1 (por ejemplo, PanC, páncreas normal, colon normal) y muestras añadidas que comprenden ADN procedente de la capa leucoplaquetaria de pacientes normales que no tenían antecedentes de cáncer. El segundo estudio utilizó una selección de cánceres pan-GI.
Para el primer estudio de validación, se analizó una combinación de muestras de RRBS analizadas previamente y muestras almacenadas más nuevas para verificar la precisión técnica y confirmar la reproducibilidad biológica, respectivamente. Se diseñaron cebadores para PCR específica de metilación (MSP) para cada una de las regiones marcadoras, excluyendo solo cadenas complementarias en casos de metilación no específica de cadena. El programa informático de ordenador (Methprimer) ayudó al diseño semimanual de los cebadores para MSP por personal experimentado; los ensayos se analizaron y optimizaron mediante qPCR con colorantes SYBR Green en diluciones de controles de ADN genómico universalmente metilado y no metilado. Las secuencias de cebadores para MSP, cada uno de los cuales incluye 2-4 CpG, se diseñaron para proporcionar un medio rápido de evaluar la mutilación en las muestras y se sesgaron para maximizar la eficacia de amplificación. Las secuencias de cebadores y los parámetros físicos se proporcionan en la tabla 2a y la tabla 2b:
Tabla 2a: Cebadores para MSP
Nombre Longitud (nt) Secuencia (5 '^ - 3') Contenido Tf Th SEQ de GC (%) NO: abcb1f 21 GAT TTT GTT CGT CGT TAG TGC 42,9 52,3 60,0 1 abcb1r 19 TCT CTA AAC CCG CGA ACG A 52,6 56,0 60,0 2 adamts17f 25 TTC GAA GTT TCG GGA TAG GAA
GCG T 48,0 60,0 65,0 3 adamts17r 20 CCT ACC GAC CTT CGA ACG CG 65,0 60,3 65,0 4 adamts18f 21 GGC GGC GCG TAT TTT TTT CGC 57,1 60,6 60,0 5 adamts18r 23 CGC TAC GAT ATA AAC GAC GAC 47,8 56,4 60,0 6 GA
adcy1f 19 GGT TCG GTT GTC GTA GCG C 63,2 59,0 65,0 7 adcy1r 20 CCG ACC GTA ATC CTC GAC GA 60,0 58,6 65,0 8 agfg2f 25 TTA GGT CGG GAA TCG TTA TTG
TTT C 40,0 55,1 60,0 9 agfg2r 22 GTA AAT AAC CCC GCG CTA AAC
G 50,0 56,5 60,0 10 arhgof7f 24 A TT
G C C GTT TGT TTT TCG GGT CGT 45,8 58,1 60,0 11 arhgef7r 24 ACC ACG TAA CGA TTT ACT CGA 45,8 57,8 60,0 12 CGA
auts2f 23 T C
C GT TTT CGG ATT TGA AGT CGT 43,5 54,8 65,0 13 auts2r 19 CGC CTC GTC TTC CAA CGA A 57,9 57,7 65,0 14 btbd11f 19 AGG GCG TTC GGT TTT AGT C 52,6 55,1 60,0 15 btbd1r 22 AAC CGA AAA CGA CAA AAT CGA
T 36,4 53,4 60,0 16 Bvesf 21 TTT GAG CGG CGG TCG TTG ATC 57,1 60,4 60,0 17 Bvesr 22 TCC CCG AAT CTA AAC GCT ACG 50,0 57,8 60,0 18 A
C13orf18f 25 TTT AGG GAA GTA AAG CGT CGT 40,0 55,6 60,0 19 TTT C
C13orf18r 22 AAC GAC GTC TCG ATA CCT ACG 50,0 A 57,1 60,0 20 cacna1cf 22 GGA GAG TAT TTC GGT TTT TCG 45,5 54,2 65,0 21 C
cacna1cr 24 ACA AAC AAA ATC GAA AAA CAC 37,5 55,2 65,0 22 CCG
cbln1f 23 GTT TTC GTT TCG GTC GAG GTT 47,8 56,2 60,0 23 AC
cbln1r 25 GCC ATT AAC TCG ATA AAA AAC
GCG A 40,0 56,3 60,0 24 Cbsf 25 GAT TTA ATC GTA GAT TCG GGT
CGT C 44,0 55,2 65,0 25 Cbsr 22 CCG AAA CGA ACG AAC TCA AAC
G 50,0 56,8 65,0 26 cd1df 17 GCG CGT AGC GGC GTT TC 70,6 60,7 60,0 27 cd1dr 19 CCC ATA TCG CCC GAC GTA A 57,9 56,9 60,0 28 celf2f 22 TCG TAT TTG GCG TTC GGT AGT 50,0 57,0 70,0 29 C
celf2r 21 CGA AAT CCA ACG CCG AAA CGA 52,4 58,4 70,0 30 (continuación)
Longitud (nt) Secuencia (5'^- 3') Contenido Tf Th de GC (%)
24 TTG TCG TTC GTC GAA TTC GAT
TTC 41,7 55,8 65,0 31 23 AAC CCG ACG CTA AAA AAC GAC 47,8 59,2 65,0 32 GA
25 TTG CGT TGG TTA CGT TTT TTT 40,0 57,3 60,0 33 ACG C
23 ACG CCG TAC GAA TAA CGA AAC 47,8 58,7 60,0 34 GA
21 CGT TTT TCG GGT CGG GTT CGC 61,9 61,5 60,0 35 19 TCC GAC GCT CGA CTC CCG A 68,4 63,1 60,0 36 22 TCG GCG TAT TTT TCG TAG ACG
C 50,0 57,6 60,0 37 24 CGC AAT CTTAAA CGT ACG CTT
CGA 45,8 57,7 60,0 38 24 GGT TTA TAA AGA GTT CGG TTT
CGC 41,7 54,4 60,0 39 24 AAA ACG CTA AAC TAC CCG AAT
ACG 41,7 55,3 60,0 40 19 TGG GCG GGT TTC GTC GTA C 63,2 60,2 65,0 41 21 GTC CCG AAA CAT CGC AAA CGA 52,4 58,2 65,0 42 20 GCG TTT GGA TTT TGC GTT C 55,0 58,0 60,0 43
20 AAA ATA CGC CGC TAC CGA TA 55,0 60,6 60,0 44
20 GTT TAG GGA GTC GCG GTT AC 55,0 55,4 60,0 45 23 CAA ATC CTA CGA ACG AAC GAA
CG 47,8 56,2 60,0 46 22 AGT TTG GCG TAG TCG GTA GAT
C 50,0 56,4 60,0 47 22 GCG CGC AAA TAC CGA ATA AAC 50,0 57,5 60,0 48 G
22 TCG GTT TTT AGC GTT CGT TCG C 58,4 60,0 49 23 AAA CAA CGA AAC GCC AAT CCC 47,8 59,9 60,0 50 GA
25 TAG TTT TTG GGC GTT ATT TTC 40,0 56,1 60,0 51 GGT C
21 GCA ACT CCG TAC ACT CGA CGA 57,1 59,0 60,0 52 26 TTT TTC GTT TGT TTT TCG GTA
TTC GC 34,6 55,5 60,0 53 22 CGA ATC CTA ACG AAC TAT CCG
A 45,5 53,9 60,0 54 25 TTC GGT GGA TTT TCG TAT TGA
TTT C 36,0 54,0 60,0 55 24 AAA CGA AAC CGC GAA CTA AAA
CGA 41,7 57,6 60,0 56 22 TTA CGT GAT AGT TCG GGG TTT
C 45,5 54,6 60,0 57 21 ATA AAA CGA CGC GAC GAA ACG 47,6 56,2 60,0 58 24 TTT CGG GTT TTG CGT TTT ATT
CGC 41,7 57,2 60,0 59 28 GAA AAA AAA AAA CGC TAA AAA 28,6 53,3 60,0 60 TAC GAC G
21 TAG CGC GTA GTG GTC GTA GTC 57,1 58,4 60,0 61 (continuación)
Longitud (nt) Secuencia (5'^- 3') Contenido Tf Th de GC (%)
18 CCT CCG CCG CTA CAA CCG 72,2 61,5 60,0 62 22 TCG TTG TTT TAG GAT CGC GTT C 45,5 55,6 60,0 63 22 GAC GAA CGA TAA ACG ACG ACG
A 50,0 56,9 60,0 64 21 TTC GGT CGC GTT GTT CGT TAC 52,4 58,0 60,0 65 25 AAA CGA AAA ACA ACT CGA ATA
ACG A 32,0 53,8 60,0 66 18 AGT CGG GGT CGG AGT CGC 72,2 62,3 60,0 67 23 ATA AAT CCC TCC GAA ACC CAC
GA 47,8 58,2 60,0 68 21 TCG GAA GTG ACG TAG GGT AGC 57,1 58,3 60,0 69 19 CAC ACG CCC GCT AAC ACG A 63,2 60,6 60,0 70 21 GCG CGT TCG GGT TTA TAT TGC 52,4 57,2 65,0 71 20 GAC CAA CTA CCG CTA CTC GA 55,0 56,1 65,0 72 20 AGG GGA GAA TTT CGC GGT TC 55,0 57,6 65,0 73 24 AAC TAA ATT AAA CCT CAA CCG 41,7 55,9 65,0 74 CCG
20 TTA GGA GGC GAG GTT TGC GC 60,0 60,3 65,0 75 28 GAC GAA ACC GTA ACG AAA ATA 35,7 56,4 65,0 76 AAA ACG A
24 CGA ACT ATC CGA AAA AAC GAC
GAA 41,7 55,6 65,0 77 22 GCG ACG CGA GCG TTA ATT TTT
C 50,0 57,6 65,0 78 23 TTC GCG TAT ATA TTC GTC GAG
TC 43,5 54,2 60,0 79 20 CAC GAC CAC TAT CAC GAC GA 55,0 56,5 60,0 80 22 GTA CGT CGG TTT AGT TCG TAG
C 50,0 55,3 60,0 8i 21 CCG AAA CGC GAT ATC AAC CGA 52,4 57,6 60,0 82 20 CGG GCG GTT AGA GGG TTG TC 65,0 60,4 60,0 83 26 CTC GAA AAT TCG TAA AAA CCC
TCC GA 42,3 57,4 60,0 84 29 CGA GTA GTT TTT TTT TTT ATC
GTT TAG AC 27,6 52,1 65,0 85 24 CAA AAA ACG ACA CGT AAA CGA
TCG 41,7 55,2 65,0 86 24 GTT TCG TTT TGC GTT TTT TTG
CGC 41,7 57,5 65,0 87 19 TCC CGA ATC GCT ACT CCG A 57,9 57,8 65,0 88 17 GCG GTT AGG CGG GTT GC 70,6 60,2 60,0 89 25 ATT ATA TCA ATC CCA AAA ACA 36,0 54,3 60,0 90 CGC G
22 TAT TTT TCG AAT TCG AGT TCG C 36,4 51,7 60,0 9i 22 TCA CCC GAT AAA AAC GAA AAC
G 40,9 53,8 60,0 92 2i GCG TCG TTA GTA GTA CGA AGC 52,4 55,3 60,0 93 2i GCA CCT CAA CGA AAA CAC CGA 52,4 58,2 60,0 94 23 TCG AGG CGG TTA ATT TTA TTC
C 43,5 55,8 6 G 5,0 95 23 GCT CTA ACC CAA ATA CGC TAC
G 47,8 56,6 65,0 96A
(continuación)
Nombre Longitud (nt) Secuencia (5'^- 3') Contenido Tf Th SEQ ID de GC (%) NO: kctd 15f 22 TCG GTT TCG AGG TAA GTT TAG
C 45,5 54,7 60,0 97 kctd 15r 23 CAC TTC GAA ACA AAA TTA CGC 39,1 54,3 60,0 98 GA
lingo3f 20 GGA AGC GGA CGT TTT CGT TC 55,0 56,8 65,0 99 lingo3r 22 ACC CAA AAT CCG AAA ACG ACG 45,5 57,3 65,0 100 A
LOC100126784 19 AGG TTG CGG GCG TGA TTT C 57,9 58,8 65,0 101 (NAV2)f
LOC100126784 20 CCA AAA CCA CGC GAA CAC GA 55,0 58,8 65,0 102 (NAV2) r
LOC63930 20 GTT CGG AGT GTC GTA GTC GC 60,0 57,7 70,0 103 (bhlhe23)f
LOC63930 21 AAT CTC GCC TAC GAA ACG ACG 52,4 57,2 70,0 104 (bhlhe23)r
LOC642345f 22 GTT TAG GGA CGT TTT CGT TTT C 40,9 52,5 65,0 105 LOC642345r 20 AAC GAA CGC TCG ATA ACC GA 50,0 56,5 65,0 106 m lltlf 20 TTT GGG TCG GGT TAG GTC GC 60,0 59,9 60,0 107 mlltlr 25 GAA ACC AAA AAA ACG CTA ACT 36,0 54,4 60,0 108 CGT A
Mpndf 20 CGT TGT TGG AGT TTG GCG TC 55,0 57,1 65,0 109 Mpndr 21 TAC CCG AAC CGC GAT AAA ACG 52,4 57,5 65,0 110 myef2f 25 GGT ATA GTT CGG TTT TTA GTC
GTT C 40,0 53,6 65,0 111 myef2r 24 C 45,8 57,8 65,0 112 A TC
C T
G TTT CT CCG AAA ACC GAA
NDUFAB1f 23 GGT TAC GGT TAG TAT TCG GAT 43,5 53,0 60,0 113 TC
NDUFAB1r 20 ATA TCA ACC GCC TAC CCG CG 60,0 59,7 60,0 114 NFASCf 24 T
G T G T C TGT TTT AAT GCG GCG GTT 45,8 59,6 65,0 115 NFASCr 22 TAT CCG AAC TAT CCG CTA CCG 50,0 56,9 65,0 116 A
pcbp3f 19 GGT CGC GTC GTT TTC GAT C 57,9 56,6 60,0 117 pcbp3r 17 GCC GCA AAC GCC GAC GA 70,6 62,4 60,0 118 PDE6Bf 21 AAT CGG CGG TAG TAC GAG TAC 52,4 56,1 55,0 119 PDE6Br 26 A
TA A A A C C G CA AAT CCG TAA CGA TAA 34,6 53,9 55,0 120 PLAGL 1f 26 GAG TTT TGT TTT CGA AAT TAT 30,8 52,4 65,0 121 TTC GC
PLAGL1 r 18 CCC GAA TTA CCG ACG ACG 61,1 55,7 65,0 122 PRKCBf 21 AGG TTC GGG TTC C-AC GAT TTC 52,4 57,3 70,0 123 PRKCBr 21 AAC TCT ACA ACG CCG AAA CCG 52,4 57,7 70,0 124 PRRT3f 23 T
TC TA GTT CGT TTA GCG ATG GCG 47,8 57,4 60,0 125 PRRT3r 20 CCG AAA CTA TCC CGC AAC GA 55,0 57,5 60,0 126 PTF1Af 21 TTC GTC GTT TGG GTT ATC GGC 52,4 57,8 60,0 127 PTF1Ar 23 GCC CTA AAA CTA AAA CAA CCG
CG 47,8 57,1 60,0 128 RASGRF2f 22 GGT TGT CGT TTT AGT TCG TCG
C 50,0 56,6 60,0 129 RASGRF2r 19 GCG AAA ACG CCC GAA CCG A 63,2 61,4 60,0 130 (continuación)
Nombre Longitud (nt) Secuencia (5'^- 3') Contenido Tf Th SEQ ID de GC (%) NO: RIMKLAf 22 TCG TTT GGG AGA CGT ATT CGT
C 50,0 56,7 60,0 131 RIMKLAr 25 ACT CGA AAA ATT TCC GAA CTA 36,0 55,0 60,0 132 ACG A
RNF216f 20 TCG GCG GTT TTC GTT ATC GC 55,0 58,4 60,0 133 RNF216r 21 CCA CGA AAC TCG CAA CTA CGA 52,4 57,4 60,0 134 rspo3f 25 CGT TTA TTT AGC GTA ATC GTT 40,0 55,0 65,0 135 TCG C
rspo3r 24 GAA TAA CGA ACG TTC GAC TAC
CGA 45,8 56,6 65,0 136 RYBPf 24 CGG ACG AGA TTA GTT TTC GTT
AGC 45,8 55,7 60,0 137 RYBPr 24 TCG TCA ATC ACT CGA CGA AAA
CGA 45,8 58,4 60,0 138 SCARF2f 22 TCG GTT CGT AGG TAT ACG TGT
C 50,0 55,8 60,0 139 SCARF2r 22 GCT ACT ACC AAT ACT TCC GCG
A 50,0 56,4 60,0 140 SLC35E3f 21 GTT AGA CGG TTT TAG TTT CGC 42,9 51,8 60,0 141 SLC35E3r 20 AAA AAC CCG ACG ACG ATT CG 50,0 55,8 60,0 142 slc38a3f 21 GTT AGA GTT CGC GTA GCG TAC 52,4 55,3 65,0 143 slc38a3r 25 GAA AAA ACC AAC CGA ACG AAA
ACG A 40,0 56,9 65,0 144 slc6a3f 19 CGG GGC GTT TCG ATG TCG C 68,4 62,0 65,0 145 slc6a3r 24 46 A CCG AAC GAC CAA ATA AAA CCA 45,8 57,0 65,0 1CG
srcin 1f 22 CGT TTT ATG TTG GGA GCG TTC 50,0 56,8 65,0 147 G
srcinlr 20 GAC CGA ACC GCG TCT AAA CG 60,0 58,5 65,0 148 st6gal2f 21 TAC GTA TCG AGG TTG CGT CGC 57,1 59,3 65,0 149 st6gal2r 25 AAA CTC TAA AAC GAA CGA AAC
TCG A 36,0 54,9 65,0 150 st8sia1f 21 TCG AGA CGC GTT TTT TGC GTC 52,4 58,7 60,0 151 st8sia1r r 20 AAC GAT CCC GAA CCG CCG TA 60,0 61,3 60,0 152 ST8SIA6f 21 CGA GTA GTG CGT TTT TCG GTC 52,4 56,2 60,0 153 ST8SIA6r 22 GAC AAC AAC GAT AAC GAC GAC 50,0 56,1 60,0 154 G
SUSD5f 22 AGC GTG CGT TAT TCG GTT TTG 50,0 59,1 65,0 155 C
SUSD5r 23 ACC TAC GAT TCG TAA ACC GAA 47,8 56,9 65,0 156 CG
TOX2f 23 AGT TCG CGT TTT TTT CGG TCG
TC 47,8 58,5 70,0 157 TOX2r 21 AAC CGA CGC ACC GAC TAA CGA 57,1 61,0 70,0 158 twistlf 22 TTG CGT CGT TTG CGT TTT TCG C 50,0 59,9 60,0 159 twistlr 20 CAA CTC GCC AAT CTC GCC GA 60,0 60,2 60,0 160 USP3f 18 TAT TGC GGG GAG GTG TTC 55,6 54,7 60,0 161 USP3r 24 TCA AAA AAT AAT TAA CCG AAC
CGA 29,2 51,3 60,0 162 USP44f 24 TTA GTT TTC GAA GTT TTC GTT
CGC 37,5 54,4 60,0 163 USP44r 19 TCC GAC CCT ATC CCG ACG A 63,2 59,9 60,0 164 (continuación)
Nombre Longitud (nt) Secuencia (5'^- 3') Contenido Tf Th SEQ ID de GC (%) NO:
VIMf 27 GAT TAG TTA ATT AAC GAT AAA
GTT CGC 29,6 51,0 60,0 165 VIMr 23 CCG AAA ACG CAT AAT ATC CTC 43,5 55,0 60,0 166 GA
vwc2f 26 TTG
G G C AG AGT TTT TCG AAT TTT 34,6 5 TTC 5,2 65,0 167 vwc2r 19 GAA AAC CAC CCT AAC GCC G 57,9 56,6 65,0 168 wt1f 17 CGC GGG GTT CGT AGG TC 70,6 58,5 65,0 169 wt1r 23 CGA CAA A
A CA ACA ACG AAA TCG
A 39,1 54,5 65,0 170 zfp30f 22 AGT AGC GGT TAT AGT GGC GTT
C 50,0 56,7 65,0 171 zfp30r 22 GCA TTC GCG ACG AAA ACA AAC
G 50,0 58,0 65,0 172 ZNF569f 20 GTA TTG AGG TCG GCG TTG TC 55,0 55,9 60,0 173 ZNF569r 19 CCG CCC GAA TAA ACC GCG A 63,2 60,8 60,0 174 ZNF71f 20 CGT AGT TCG GCG TAG TTC GC 60,0 58,2 65,0 175 ZNF71 r 21 AAC CCG CCC GAC GAC AAT ACG 61,9 62,1 65,0 176 En la tabla 2a, Th es la temperatura de hibridación optimizada y Tf es la temperatura de fusión en °C en NaCI 50 mM. Los cebadores celf2f y celf2r; LOC63930 (bhlhe23)f y LOC63930 (bhlhe23)r; PRKCBf y PRKCBr; y TOX2f y TOX2r se utilizan en una reacción de 2 etapas.
Piezas
Se utilizaron muestras de ADN archivadas de pacientes de la Mayo Clinic para ambas validaciones. Los casos y los controles fueron cegados y emparejados por edad y sexo. El primer conjunto de muestras incluía ADN de 38 adenocarcinomas pancreáticos y controles (20 epitelios de colon normales, 15 páncreas normales y 10 capas leucoplaquetarias normales). El segundo conjunto de muestras incluía ADN de 38 neoplasias colorrectales (20 adenocarcinomas colorrectales y 18 adenomas > 1 cm), 19 adenocarcinomas de esófago, 10 cánceres gástricos (de estómago) y 10 colangiocarcinomas.
Procedimientos
El ADN archivado se volvió a purificar usando perlas SPRI (AMPure XP-Beckman Coulter) y se cuantificó mediante absorbencia. A continuación, se trataron 1-2 |jg de ADN de muestra con bisulfito de sodio y se purificó usando el protocolo EpiTect (Qiagen). El material eluido (10-20 ng) se amplificó en un Roche 480 LightCycler usando bloques de 384 pocillos. Cada placa acomodaba 4 marcadores (y patrones y controles), utilizando así un total de 23 placas. Los 88 ensayos de MSP tenían diferentes perfiles de amplificación óptima y se agruparon en consecuencia. Las temperaturas de hibridación específicas se proporcionan en la tabla 2. Las reacciones de 20 j l se llevaron a cabo utilizando LightCycler 480 SYBR I Master mix (Roche) y 0,5 jmol de cebador durante 50 ciclos y se analizaron, en general, por el procedimiento de la segunda derivada incluido con el programa informático LightCycler. Los datos brutos, expresados en número de copias genómicas, se normalizaron a la cantidad de ADN de entrada y se tabularon. El análisis a nivel de tejido comprendió la realización de PCA (complementado con una validación cruzada de k veces), regresión neta elástica y construcción de diagramas de caja de marcadores netos elásticos distintos de cero. De esta manera, los marcadores se clasificaron colectivamente. De estos candidatos, debido a la importancia de minimizar la metilación de fondo celular normal para los análisis de heces y sangre, la clasificación se comparó con aquellos marcadores que presentaron la mayor diferencia de cambio de veces entre casos y controles.
Resultados
Entre los 107 marcadores de ADN metilados con discriminación comprobada para cánceres GI, la validación con MSP se realizó en 88 de los cuales se identificaron subconjuntos para mostrar datos resumidos más detallados. Detección de cáncer de páncreas
Un subconjunto de marcadores de metilación fue particularmente discriminatorio para el cáncer de páncreas: ABCB1, ADCY1, BHLHE23 (LOC63930), c13orf18, CACNA1C, chr12 133, CLEC11A, ELMO1, EOMES, GJC1, IHIF1, IKZF1, KCNK12, KCNN2, PCBP3, PRKCB, RSPO3, SCARF2, SLC38A3, ST8SIA1, TWIST1, VWC2, WT1 y ZNF71 (véase la tabla 1). Los valores individuales del ABC (PanC frente a páncreas o colon normales) para estos marcadores fueron superiores a 0,87, lo que indica una sensibilidad y especificidad clínicas superiores.
Inicialmente, los dos mejores marcadores independientes parecían ser CLEC11A y c13orf18, que eran 95 % y 82 % sensibles al cáncer de páncreas, respectivamente, con una especificidad del 95 %. Experimentos adicionales diseñaron cebadores adicionales para dirigirse a los CpG más específicos dentro de las DMR específicas de marcadores seleccionados. Estos cebadores adicionales mejoraron aún más la discriminación. Por ejemplo, el diseño de una nueva MSP para el marcador PRKCB (sensibilidad inicial del 68 %) aumentó drásticamente la discriminación del cáncer de páncreas y logró una sensibilidad del 100 % con una especificidad del 100 %. Además, la mediana de la relación señal-ruido de metilación para este marcador, comparando el cáncer con el tejido normal, fue superior a 8000. Esto proporciona un parámetro clave para la detección de marcadores de cáncer en muestras con altos niveles de heterogeneidad celular normal. Tener perfiles de metilación de nivel de base de las DMR de los datos de RRBS filtrados permite la construcción de ensayos de detección altamente sensibles y específicos. Estos resultados obtenidos de los diseños mejorados de MSP demuestran que se pueden obtener características de rendimiento similares de las otras 106 DMR con mejoras adicionales de diseño, validación y formatos de ensayo.
Tabla 2b: Cebadores para MSP
Nombre Longitud Secuencia (5 '^ 3') Contenido Tf Th SEQ ID (nt) de GC (%) NO: dll (en sentido)r 20 GTC GAG CGC GTT CGT TGT AC 60,0 58,9 65 177 dll (en sentido)r 22 GAC CCG AAA AAT AAA TCC CGA A 40,9 53,3 65 178 dll (antisentido) f 24 GAT TTT TTT AGT TTG TTC GAC GGC 37,5 53,5 65 179 dll (antisentido) r 25 AAA ATT ACT AAA CGC GAA ATC GAC G 36,0 54,4 65 180 en1 (en sentido)f 26 TAA TGG GAT GAT AAA TGT ATT CGC GG 38,5 55,2 65 181 en1 (en sentido)r 26 ACC GCC TAA TCC AAC TCG AAC TCG TA 50,0 61,2 65 182 en1 (antisentido)f 22 GGT GTT TTT AAA GGG TCG TCG T 45,5 55,7 65 183 en1 (antisentido)r 19 GAC CCG ACT CCT CCA CGT A 63,2 58,4 65 184 foxp2 (en sentido) f 30 GGA AGT TTA TAG TGG TTT CGG CGG GTA 53,3 63,6 60 185 GGC
foxp2 (en sentido) r 22 GCG AAA AAC GTT CGA ACC CGC G 59,1 61,9 60 186 grin2d (en sentido)f 28 TGT CGT CGT CGC GTT ATT TTA GTT GTT 42,9 59,2 60 187 C
grin2d (en sentido)r 22 AAC CGC CGT CCA AAC CAT CGT A 54,6 61,3 60 188 nr5a1 (en sentido) f 25 GAA GAG TTA GGG TTC GGG ACG CGA G 60,0 62,6 65 189 nr5a1 (en sentido) r 25 AAC GAC CAA ATA AAC GCC GAA CCG A 48,0 61,1 65 190 nr5a1 (antisentido)f 25 CGT AGG AGC GAT TAG GTG GGC GTC G 64,0 64,6 60 191 nr5a1 (antisentido)r 23 AAA CCA AAA CCC GAA ACG CGA AA 43,5 58,5 60 192 shh (en sentido)f 26 CGA TTC GGG GGA TGG ATT AGC GTT GT 53,9 62,6 65 193 shh (en sentido)r 30 CGA AAT CCC CCT AAC GAA AAT CTC CGA 43,3 60,4 65 194 AAA
shh (antisentido)f 25 CGG GGT TTT TTT AGC GGG GGT TTT C 52,0 61,0 65 195 shh (antisentido)r 29 CGC GAT CCG AAA AAT AAA TTA ACG CTA 37,9 57,8 65 196 CT
spsb4 (en sentido) f 20 AGC GGT TCG AGT TGG GAC GG 65,0 62,3 65 197 spsb4 (en sentido) r 24 GAA AAA CGC GAT CGC CGA AAA CGC 54,2 61,8 65 198 spsb4 (antisentido)f 28 GAA GGT TAT TAA TTT AAT AGT CGC GGA 32,1 53,7 65 199 A
spsb4 (antisentido)r 25 AAA AAA AAC GTT CCC GAC GAC CGC G 52,0 62,4 65 200 prkcbf (rediseño) 25 AGT TGT TTT ATA TAT CGG CGT TCG G 40,0 55,3 65 201 prkcbr (rediseño) 23 GAC TAT ACA CGC TTA ACC GCG AA 47,8 56,9 65 202 En la tabla 2b, Th es la temperatura de hibridación optimizada y Tf es la temperatura de fusión en °C en mM.
Detección de otras neoplasias GI
A continuación se evaluaron los marcadores en el 2° conjunto de muestras, que incluía otros cánceres GI y precánceres como se indicó anteriormente. Los procedimientos, incluyendo las condiciones de reacción y la plataforma, fueron idénticos a la primera validación descrita anteriormente. Los datos se normalizaron a la cantidad de ADN de entrada, permitiendo comparar los números de copia entre las dos validaciones. El análisis consistió en PCA y validación cruzada de k veces, como anteriormente.
Algunas secuencias de mutilación que se identificaron presentaron grados de discriminación extraordinarios, incluso como marcadores independientes. Por ejemplo, IKZF1 tenía una sensibilidad del 95 % para el adenoma y del 80 % para el CCR, prácticamente sin metilación de fondo en muestras normales. Las relaciones S/R superaron los 10.000 - un grado de discriminación que rara vez se ve con cualquier clase de marcadores. En el ensayo chr12.133, específico de un tramo de ADN metilado completamente sin anotaciones ni descripciones, también fue hábil en detectar todos los cánceres igualmente bien. Varios marcadores (cdld, chr12.133, clec11a, elmo1, vwc2, zuf71) lograron individualmente una discriminación perfecta para el cáncer gástrico, al igual que twist1 para el cáncer colorrectal (Tabla 6).
Predicción del sitio del tumor
Los datos recopilados durante el desarrollo de realizaciones de la tecnología demuestran que los estados de metilación de marcadores de ADN particulares predicen con precisión el sitio de la neoplasia. En este análisis, se utilizó un modelo de regresión de particionamiento recursivo en un análisis de árbol de decisiones basado en combinaciones de marcadores con actividad complementaria para generar una clasificación de sitio sólida.
En particular, se realizaron análisis estadísticos para validar la sensibilidad y especificidad de las combinaciones de marcadores. Por ejemplo, utilizando un modelo de "bosque aleatorio" (véase, por ejemplo, Breiman (2001) "Random Forests" Machine Learning 45: 5-32), se construyeron modelos de árboles utilizando regresión de árboles de particionamiento recursivo, por ejemplo, implementado por el paquete rPart en el programa informático estadístico R. La regresión de árbol de particionamiento recursivo es una técnica de regresión que intenta minimizar una función de pérdida y así maximizar el contenido de información para problemas de clasificación. El árbol se construye mediante el siguiente procedimiento: primero se encuentra la variable única que mejor divide los datos en dos grupos. Los datos se separan y, a continuación, este procedimiento se aplica por separado a cada subgrupo, y así sucesivamente hasta que los subgrupos alcancen un tamaño mínimo o hasta que no se puedan realizar mejoras. La segunda etapa del procedimiento consiste en utilizar la validación cruzada para recortar el árbol completo. Se calcula una estimación de riesgo con validación cruzada para un conjunto anidado de subárboles y se produce un modelo final a partir del subárbol con la estimación de riesgo más baja. Véanse, por ejemplo, Therneau (2012) "An Introduction to Recursive Partitioning Using RPART Routines", disponible en The Comprehensive R Archive Network; Breiman y col. (1983) "Classification and Regression Trees" Wadsworth, Belmont, CA; Clark y col. (1992) "Tree-based models" en J.M. Chambers y T.J. Hastie, eds., Statistical Models in S, capítulo 9. Wadsworth y Brooks/Cole, Pacific Grove, CA; Therneau (1983) "A short introduction to recursive partitioning" Orion Technical Report 21, Universidad de Stanford, Departamento de Estadística; Therneau y col. (1997) "An introduction to recursive partitioning using the rpart routines" Divsion of Biostatistics 61, Mayo Clinic.
Como se usa en este análisis, la clasificación es lesión GI superior frente a lesión GI inferior frente a muestras normales. En cada nodo de la regresión, todas las variables se consideran para el ingreso, pero solo se ingresa la variable con la mayor disminución en el riesgo de resultado previsto. Los nodos posteriores se añaden al árbol hasta que no haya cambios en el riesgo. Para evitar el sobreajuste, se utilizó regresión de bosques aleatorios. En este enfoque, se generaron 500 árboles de predicción utilizando muestreo con reposición de muestras y selección aleatoria de variables. Para determinar la importancia de la i-ésima variable, la variable i-ésima se aparta y se comparan las tasas de error correspondientes para el ajuste completo (incluyendo todos los datos) frente al ajuste reducido (todos los datos excepto la variable i-ésima) utilizando las 500 predicciones.
Se construyó un bosque de 500 árboles para analizar el poder predictivo de los marcadores candidatos para discriminar entre tejidos normales, lesiones gastrointestinales superiores y lesiones gastrointestinales inferiores. Este procedimiento se realiza con un nivel muy alto de consistencia. En primer lugar, para cada creación de árbol, se toma una muestra de muestreo con reposición del conjunto de datos para crear un conjunto de capacitación y todas las observaciones no seleccionadas se utilizan como un conjunto de validación. En cada rama del árbol, se utiliza y evalúa un subconjunto aleatorio de marcadores para determinar el mejor marcador a utilizar en ese nivel particular del árbol. En consecuencia, todos los marcadores tienen las mismas posibilidades de ser seleccionados. La técnica proporciona una rigurosa validación y evaluación de la importancia relativa de cada marcador. A cada uno de los 500 árboles se le permite "votar" a qué clase pertenece una muestra en particular, ganando la mayoría de votos. La tasa estimada de clasificación errónea se calcula a partir de todas las muestras no utilizadas para un árbol en particular.
Para analizar la importancia relativa de un marcador dado, se vuelve a utilizar el conjunto de validación. En este caso, una vez que se ajusta un árbol, los datos de validación se pasan por el árbol y se anota la tasa de clasificación correcta. A continuación, los valores del marcador se permutan aleatoriamente dentro del m-ésimo marcador, se transmiten por el árbol y se anota nuevamente la clasificación correcta. Si un marcador tiene mucha importancia, los datos reales proporcionan una mejor clasificación que los datos permutados aleatoriamente. La clasificación errónea por los datos permutados se conoce como la disminución media de la precisión. Si un marcador no es importante, los datos reales proporcionarán una clasificación similar a la de los datos permutados aleatoriamente. La figura 1 es un gráfico de la importancia del marcador medida por la disminución media de la precisión. Las líneas verticales están al 2,5 % y al 5 %. Estos datos indican que, por ejemplo, para clec11a, la disminución media estimada de la precisión es aproximadamente del 12 %, indicando que al permutar aleatoriamente los resultados de este marcador, la precisión general de la predicción disminuye en un 12%. La figura 1 enumera los marcadores en orden de importancia.
La tasa de clasificación errónea general estimada de los 500 árboles en el bosque fue de 0,0989. Los resultados del procedimiento de votación en los 500 árboles del bosque se resumen en la tabla 3 y se expanden por subtipo en la tabla 4. En las tablas, el tipo de muestra de tejido aparece en la primera columna (por ejemplo, no canceroso ("Normal"), cáncer gastrointestinal superior ("Superior") o cáncer gastrointestinal inferior ("Inferior") en la tabla 3; adenoma ("Ad"), colon normal ("Colon Normal"), cáncer colorrectal ("CCR"), cáncer esofágico ("C Eso"), cáncer de páncreas ("C Pan"), páncreas normal ("Pan Normal") y cáncer de estómago ("C Estómago") en la tabla 4). Se proporciona una clasificación cuantitativa de la muestra mediante el análisis como un número en las columnas 1, 2 o 3, para su clasificación como cáncer gastrointestinal superior (columna 1), cáncer gastrointestinal inferior (columna 2) o tejido normal (columna 3), respectivamente. Los números proporcionan una medida que indica la tasa de éxito del clasificador (por ejemplo, el número de veces que el clasificador clasificó el tipo de muestra en la primera columna como el tipo indicado en la primera fila).
Tabla 3
1 2 3 error de clase
Superior 59,00 1,00 7,00 0,12
Inferior 3,00 33,00 2,00 0,13
Normal 1,00 0,00 44,00 0,02
columna 1 = GI superior; columna 2 = GI inferior; columna 3 = normal
Tabla 4
Tipo de muestra CGIS* Previsto por el modelo CRN** Normal CGIS*
Cáncer de páncreas 35 0 3 Cáncer de esófago 15 0 3 Cáncer de estómago 9 1 0 CRN**
Cáncer de colon 2 16 2 Adenoma de colon 1 17 0 Controles
Páncreas normal 0 0 15 Colon normal 0 0 20 Capa leucoplaquetaria normal 1 0 9 * CGIS = cáncer GI superior, ** CRN = CCR Adenoma > 1 cm
Un análisis adicional demostró que una combinación de dos marcadores predijo con precisión el sitio del tumor en > 90% de las muestras, las 17 combinaciones principales de dos marcadores predijeron con precisión el sitio del tumor en > 80 % de las muestras, y las 49 combinaciones principales predijeron con precisión el sitio del tumor en el 70 % de las muestras. Esta observación de que múltiples combinaciones de marcadores de metilación del ADN predicen con precisión el sitio del tumor demuestra la solidez de la tecnología.
Usando los dos marcadores superiores en el árbol de decisión de particionamiento recursivo, todos los tejidos normales se clasificaron correctamente como normales, todos los cánceres gástricos se clasificaron correctamente como GI superior, casi todos los cánceres de esófago y páncreas se clasificaron correctamente como GI superior, y casi todos los cánceres colorrectales y precánceres (adenomas) se clasificaron correctamente como GI inferior. Durante el desarrollo de las realizaciones de la tecnología proporcionada en el presente documento, los análisis estadísticos se centraron en un conjunto de marcadores específicos que consisten en clec11a, c13orf18, kcnn2, abcb1, slc38a3, cd1c, ikzfl, adcy1, chr12133, rspo3 y twist1. En particular, los análisis estadísticos descritos anteriormente se dirigieron a identificar conjuntos de marcadores (por ejemplo, que tengan dos o más marcadores) que proporcionen mayor poder para identificar un cáncer y/o discriminar entre cánceres. La Tabla 5 resume la precisión de cada conjunto de marcadores por pares, a saber clec11a, c13orf18, kcnn2, abcb1, slc38a3, cd1c, ikzf1, adcy1, chr12133, rspo3 y twist1. De acuerdo con el presente análisis, el par de marcadores que consiste en clec11a y twist1 es el más informativo, pero varias otras combinaciones tienen una precisión similar.
Tabla 5 - Precisión para la predicción del sitio utilizando varias combinaciones de marcadores
precisión marcadores
90,7 clec11a twist1
88,7 clec11a chr12.133
88,7 clec11a rspo3
(continuación)
precisión marcadores
88 clec11a ikzfl
86,7 clec11a adcy1
84,7 twist1 c13orf18
84 clec11a cd1d
83,3 twist1 abcb1
83,3 c13orf18 chr12.133
83,3 abcb1 chr12.133
83,3 abcb1 rspo3
82 c13orf18 rspo3
81,3 abcb1 ikzf1
80,7 abcb1 adcy1
80 twist1 kcnn2
80 c13orf18 adcy1
80 cd1d rspo3
79,3 c13orf18 cd1d
79,3 kcnn2 adcy1
79,3 kcnn2 rspo3
79,3 cd1d ikzf1
78,7 c13orf18 ikzf1
77,3 kcnn2 ikzf1
77,3 abcb1 cd1d
76,7 twist1 cd1d
76,7 kcnn2 chr12.133
76,7 chr12.133 rspo3
76 cd1d chr12.133
75,3 twist1 rspo3
75,3 kcnn2 cd1d
74,7 twist1 ikzf1
74 twist1 slc38a3
74 slc38a3 ikzf1
74 slc38a3 chr12.133
73,3 twist1 chr12.133
73,3 slc38a3 adcy1
73,3 adcy1 rspo3
72,7 slc38a3 rspo3
72 cd1d adcy1
72 ikzf1 chr12.133
72 adcy1 chr12.133
71,3 ikzf1 adcy1
70,7 clec11a c13orf18
70,7 clec11a. kcnn2
70,7 clec11a abcb1
70,7 clec11a slc38a3
70,7 ikzf1 rspo3
70 twist1 adcy1
70 kcnn2 abcb1
68 slc38a3 cd1d
66,7 c13orf18 abcb1
65,3 c13orf18 kcnn2
65,3 kcnn2 slc38a3
64,7 c13orf18 slc38a3
56 abcb1 slc38a3
Ejemplo 3 - Análisis del ABC de marcadores individuales
El análisis estadístico incluyó el análisis de componentes principales para identificar combinaciones lineales no correlacionadas de los marcadores cuya varianza explica el mayor porcentaje de variabilidad observado en los datos originales. El análisis determinó los pesos relativos de cada marcador para discriminar entre los grupos de tratamiento. Como resultado de este análisis, los valores de punto final del ABC se determinaron para un subconjunto de los marcadores que miden el poder de cada marcador para discriminar un cáncer específico (esófago, estómago, páncreas, colorrectal y adenoma) de 1) los otros tipos de cáncer y de 2) muestras normales (por ejemplo, que no comprenden tejido canceroso o no de un paciente que tiene cáncer o que puede desarrollar cáncer). Estos datos se proporcionan en la tabla 6.
Tabla 6 - Valores del ABC para un subconjunto de marcadores
BMP3 NDRG4 abcb1 adcy1
C. Eso frente a otro 0,51 0,58 0,67 0,39
C. Eso frente a normal 0,82 0,86 0,83 0,63
C. Estómago frente a otro 0,72 0,70 0,87 0,65
C. Estómago frente a normal 0,91 0,95 1,00 0,86
C. Pan frente a otro 0,59 0,66 0,73 0,69
C. Pan frente a normal 0,90 0,90 0,91 0,94
CCR frente a otro 0,74 0,59 0,46 0,69
CCR frente a normal 0,91 0,87 0,72 0,86
Ad. frente a otro 0,74 0,71 0,35 0,71
Ad. frente a normal 0,96 0,94 0,61 0,99
c13orf18 cacna1c cd1d chr12.133
C. Eso frente a otro 0,60 0,27 0,52 0,52
C. Eso frente a normal 0,75 0,42 0,85 0,86
C. Estómago frente a otro 0,78 0,70 0,75 0,81
C. Estómago frente a normal 0,88 0,96 1,00 1,00
C. Pan frente a otro 0,81 0,85 0,73 0,57
C. Pan frente a normal 0,89 0,96 0,94 0,86
CCR frente a otro 0,37 0,56 0,67 0,73
CCR frente a normal 0,51 0,75 0,88 0,89
Ad. frente a otro 0,21 0,42 0,54 0,72
Ad. frente a normal 0,35 0,53 0,88 0,99
clec11a elmo1 eomes glc1
C. Eso frente a otro 0,55 0,46 0,37 0,51
C. Eso frente a normal 0,81 0,76 0,54 0,69
C. Estómago frente a otro 0,84 0,76 0,70 0,74
C. Estómago frente a normal 1,00 1,00 0,89 0,88
C. Pan frente a otro 0,89 0,62 0,70 0,54
C. Pan frente a normal 0,98 0,93 0,87 0,73
CCR frente a otro 0,31 0,71 0,61 0,64
CCR frente a normal 0,56 0,83 0,79 0,80
Ad. frente a otro 0,35 0,70 0,59 0,65
Ad. frente a normal 0,59 0,92 0,77 0,82
ihif1 kcnk12 kcnn2 loc63930
C. Eso frente a otro 0,11 0,39 0,68 0,40
C. Eso frente a normal 0,10 0,66 0,84 0,69
C. Estómago frente a otro 0,80 0,65 0,76 0,65
C. Estómago frente a normal 0,98 0,90 0,91 0,88
C. Pan frente a otro 0,91 0,71 0,76 0,61
C. Pan frente a normal 0,97 0,94 0,91 0,88
CCR frente a otro 0,50 0,71 0,46 0,84
CCR frente a normal 0,58 0,93 0,67 0,95
Ad. frente a otro 0,21 0,67 0,30 0,69
Ad. frente a normal 0,22 0,92 0,47 0,93
(continuación)
prkcb rspo3 scarf2 slc38a3
C. Eso frente a otro 0,44 0,42 0,13 0,34
C. Eso frente a normal 0,62 0,68 0,21 0,50
C. Estómago frente a otro 0,71 0,64 0,70 0,81
C. Estómago frente a normal 0,85 0,86 0,82 0,97
C. Pan frente a otro 0,74 0,57 0,93 0,83
C. Pan frente a normal 0,90 0,93 0,94 0,96
CCR frente a otro 0,56 0,80 0,49 0,57
CCR frente a normal 0,71 0,93 0,57 0,73
Ad. frente a otro 0,46 0,82 0,26 0,32
Ad. frente a normal 0,66 1,00 0,34 0,47
twist1 vwc2 wt1 znf71
C. Eso frente a otro 0,42 0,52 0,35 0,70
C. Eso frente a normal 0,74 0,83 0,66 0,90
C. Estómago frente a otro 0,58 0,78 0,70 0,89
C. Estómago frente a normal 0,92 1,00 0,91 1,00
C. Pan frente a otro 0,67 0,58 0,76 0,50
C. Pan frente a normal 0,94 0,92 0,98 0,79
CCR frente a otro 0,83 0,72 0,69 0,63
CCR frente a normal 1,00 0,90 0,92 0,91
Ad. frente a otro 0,70 0,76 0,64 0,64
Ad. frente a normal 0,95 0,98 0,89 0,90
st8sia1 ikzf1 pcbp3 PCA1
C. Eso frente a otro 0,45 0,55 0,54 0,47
C. Eso frente a normal 0,64 0,88 0,86 0,79
C. Estómago frente a otro 0,77 0,74 0,76 0,81
C. Estómago frente a normal 0,92 0,97 0,97 0,99
C. Pan frente a otro 0,65 0,49 0,64 0,72
C. Pan frente a normal 0,93 0,85 0,86 0,96
CCR frente a otro 0,58 0,81 0,67 0,68
CCR frente a normal 0,74 0,94 0,90 0,96
Ad. frente a otro 0,67 0,80 0,63 0,62
Ad. frente a normal 0,84 0,99 0,86 0,98
Ejemplo 4 - Esófago de Barrett y cáncer de esófago
El desarrollo del cáncer de esófago está estrechamente relacionado con la metaplasia epitelial de Barrett y el adenocarcinoma de páncreas surge de metaplasias aisladas de células mucosas. Véanse, por ejemplo, Biankin y col. (2003) "Molecular pathogenesis of precursor lesions of pancreatic ductal adenocarcinoma" Pathology 35:14-24; Cameron y col. (1995) "Adenocarcinoma of the esophagogastric junction and Barrett's esophagus" Gastroenterology 109: 1541-1546.
Para frenar significativamente la creciente incidencia de adenocarcinoma de esófago, se necesitan procedimientos eficaces para detectar en la población el precursor clave del esófago de Barrett (EB). Se han propuesto herramientas mínimamente o no invasivas para la detección de EB, pero se han visto obstaculizadas por la falta de marcadores específicos y de sensibilidad óptima. Los marcadores de detección deseados discriminan EB de la mucosa esofagogástrica normal. Determinados genes metilados de manera anómala se asocian como marcadores candidatos para EB (véase, por ejemplo, Gastroenterology 2011; 140: S-222).
Por consiguiente, durante el desarrollo de realizaciones de la tecnología se realizaron experimentos para evaluar el valor de marcadores de ADN metilados seleccionados para discriminar EB de esófago escamoso adyacente (EE) y cardias gástrico (CG) y de EE y CG en controles sanos.
Los pacientes con y sin EB conocido fueron reclutados antes de la endoscopia digestiva alta de rutina. Los casos de EB tenían > 1 cm de longitud de mucosa columnar circunferencial con metaplasia intestinal confirmada histológicamente; los controles no tenían EB según se determinó endoscópicamente. Se obtuvieron biopsias en casos de EB, casos de CG (1 cm por debajo de la línea Z) y EE (> 2 cm por encima de EB), y en los controles de CG (como para EB) y EE (5 cm por encima de la línea Z), y rápidamente se congelaron. Las muestras de biopsia se procesaron como un lote y se analizaron a ciegas. Después de la extracción de ADN y el tratamiento con bisulfito, se analizó la metilación en genes diana mediante PCR específica de metilación para los marcadores APC, HPP1, SFRP1 y mediante ensayo QuARTS para los marcadores BMP3 y NDRG4. La p-actina se cuantificó como un marcador de control para el ADN humano total.
Entre 25 casos de EB y 22 controles, las edades medias fueron 67 (intervalo de 39-83) y 50 (intervalo de 20-78), respectivamente, y los hombres representaron el 72 % y el 46 % de los sujetos en los grupos de EB y de control, respectivamente. La longitud mediana de EB fue de 6 cm (intervalo de 2-14 cm). Excepto para APC, los niveles medios de marcadores metilados fueron significativa y sustancialmente (por ejemplo, 200-1100 veces) más altos en EB que en EE adyacente y CG o en relación con EE y CG normales. Las sensibilidades para EB en diversas especificidades se muestran para cada marcador (Tabla 7). Los marcadores metilados fueron significativamente más altos en CG adyacente a EB que en CG de controles normales. APC metilada fue mayor en EB que en EE, pero no distinguió EB de CG. A diferencia de los marcadores metilados, las distribuciones de p-actina fueron similares entre los grupos de tejidos. Los niveles de marcador aumentaron con la longitud de EB para NDRG4, SFRP1, BMP3 y HPP1 (p = 0,01, 0,01, 0,02 y 0,04, respectivamente). Los factores que no afectan significativamente los niveles de marcadores incluyen la edad, sexo, inflamación y presencia de displasia (ninguna (8), grado bajo (6), grado alto (11)).
Como tal, estos datos demuestran que los marcadores de ADN metilados seleccionados discriminan en gran medida EB de CG y EE, y proporcionan aplicaciones de detección útiles.
Tabla 7
Figure imgf000047_0001
Ejemplo 5 - Marcadores de ADN metilados en jugo pancreático discriminan el cáncer de páncreas de la pancreatitis crónica y los controles normales
El análisis de jugo pancreático se ha explorado como un enfoque mínimamente invasivo para la detección temprana del cáncer de páncreas (CP). Sin embargo, la citología y muchos marcadores moleculares en el jugo pancreático han demostrado ser insensibles o no lograron distinguir el CP de la pancreatitis crónica (véase, por ejemplo, J Clin Oncol 2005; 23: 4524). Se realizaron experimentos para verificar que el ensayo de genes metilados de manera anómala puede representar un enfoque más preciso para la detección de CP a partir de jugo pancreático (véase, por ejemplo, Cancer Res 2006; 66: 1208). En particular, se recogieron datos para evaluar marcadores de ADN metilados seleccionados analizados a partir de jugo pancreático para discriminar los casos de pacientes con CP de los controles con pancreatitis crónica (PC) o un páncreas normal (PN).
Un perfil de 110 pacientes (66 CP, 22 PC, 22 controles con PN) se sometieron a extracción de jugo pancreático estimulada por secretina durante una ecografía endoscópica. Los diagnósticos se confirmaron histológicamente para CP y radiográficamente para PC y PN. El jugo se congeló rápidamente y se almacenó a -80 °C. Los ensayos se realizaron a ciegas en muestras descongeladas en lotes. Los marcadores de ADN metilados candidatos se seleccionaron mediante secuenciación de los metilomas completos en un estudio de tejido separado. Después de que se extrajo el ADN del jugo pancreático y se trató con bisulfito, la metilación génica se determinó mediante PCR específica de metilación para CD1D, ClEc 11A y KCNN2, o mediante QuARTS para BMP3 y NDRG4. Las mutaciones KRAS (7 en total) se analizaron mediante QuARTS (la presencia de cualquier mutación KRAS se consideró positiva). La p-actina, un marcador para el ADN humano, también se analizó mediante QuARTS, para proporcionar control de la cantidad de ADN.
Respectivamente para CP, PC y PN, la mediana de edad fue 67 (intervalo de 43-90), 64 (intervalo de 44-86) y 60 (intervalo de 35-78); los hombres representaron el 56, 68 y 21 % de estos grupos, respectivamente. Todos los marcadores discriminaron CP de PN pero en un grado variable. El ABC fue 0,91 (IC del 95 %, 0,85-0,97), 0,85 (0,77­ 0,94), 0,85 (0,76-0,94), 0,78 (0,67-0,89) y 0,75 (0,64-0,87) para CD1D, NDRG4, CLEC11A, KCNN2 y BMP3 metilados, respectivamente, y 0,75 (0,64-0,86) para KRAS mutante. La discriminación para CP mediante CD1D fue significativamente mayor que mediante KRa S (p = 0,01), KCNN2 (p = 0,02) o Bm P3 (p < 0,01). Las tasas de positividad en CP y PC se muestran para cada marcador en valores de corte de especificidad normal del 95 y 100 % (Tabla 8); la tasa de positividad en PC (falsos positivos) fue más baja con CD1D y más alta con KRAS. Los niveles de marcador no se vieron afectados significativamente por el sitio del CP (cabeza, cuerpo, cola) o estadio (N0 frente a N1). Los niveles de p-actina fueron similares en todos los grupos de pacientes.
Estos datos muestran que los marcadores de ADN metilados discriminan CP de PC y PN cuando se analizan a partir de jugo pancreático, por ejemplo, jugo pancreático estimulado por secretina. En particular, CD1D metilado fue significativamente más sensible para CP y mostró sustancialmente menos falsos positivos con PC que KRAS mutante.
Tabla 8
Figure imgf000048_0001
Ejemplo 6 - Perfil de marcadores de ADN sensibles para la detección de cáncer de páncreas mediante ensayo en jugo pancreático
El análisis de jugo pancreático representa un enfoque mínimamente invasivo para la detección del cáncer de páncreas (CP) y precáncer. Se ha encontrado que los marcadores de ADN metilados específicos en el jugo pancreático discriminan el CP de la pancreatitis crónica (PC) y el páncreas normal (Gastroenterology 2013;144:S-90), pero los nuevos marcadores y combinaciones de marcadores permanecen sin explorar.
Se realizaron experimentos para evaluar el valor de marcadores de ADN metilados recientemente descubiertos y KRAS mutante analizados solos y combinados en jugo pancreático para discriminar CP de pancreatitis crónica (PC) y controles de referencia (CON).
Se estudiaron 167 pacientes (85 CP, 30 PC, 23 neoplasias mucinosas intraductales premalignas (IPMN, por sus siglas en inglés), 29 CON) que se habían sometido a extracción de jugo pancreático estimulada por secretina durante una EUS. Los diagnósticos se basaron histológicamente para CP, radiográficamente para PC, e histológica o radiográficamente para IPMN. La especificidad se basó en CON, que incluyó pacientes con factores de riesgo para CP, enzimas pancreáticas elevadas o síntomas GI pero páncreas radiográficamente normal. Las muestras de jugo archivadas a -80 °C se analizaron por lotes a ciegas. En el ADN extraído de 200 pl de jugo pancreático, se determinó la metilación génica después del tratamiento con bisulfito mediante amplificación cuantitativa de señal y diana en tiempo real específica de alelo (QuARTS) para el ensayo de ADCY1, CD1D, BMP3, PRKCB, KCNK12, C13ORF18, IKZF1, CLEC11A, TWIST1, NDRG4, ELMO y 55957. Las mutaciones de KRAS mutante (7 en total) y la p-actina (un marcador para el ADN humano total) también se analizaron mediante QuARTS. A partir de datos cuantitativos, se siguió un algoritmo para lograr una discriminación óptima mediante un perfil que combinaba todos los marcadores.
Respectivamente para CP, PC, IPMN, y CON: la mediana de edad fue 67 (IQR 60-77), 66 (55-77), 66 (60-76) y 70 (62-77); los hombres comprendieron el 52, 53, 49 y 72 %. En los valores de corte de especificidad respectivos del 90 % y el 95 %: el perfil de marcadores combinados logró las sensibilidades más altas de CP (88 % y 77 %); ADCY1, el marcador individual más sensible, detectó el 84 % y 71 %. Otros marcadores individuales detectaron CP pero en grados variables (tabla). La discriminación general por área bajo la curva ROC fue mayor por perfil que por cualquier marcador único (p < 0,05), excepto ADCY1 (tabla). Con una especificidad del 90%, el perfil detectó el 44 % de todos las IPMN y el 75 % (3/4) del subconjunto con displasia de alto grado. Las tasas de positividad fueron sustancialmente más bajas en PC que en CP para todos los marcadores que se muestran en la Tabla 7 (p < 0,0001). Con una especificidad del 100 %, el perfil fue positivo en el 58 % para CP, 17 % para IPMN y 13 % para PC. Por consiguiente, estos resultados demuestran que un perfil de nuevos marcadores de ADN metilados y KRAS mutante analizados a partir de jugo pancreático logra alta sensibilidad para el CP.
Tabla 7: Tasas de positividad de marcadores en jugo pancreático de pacientes con cáncer de páncreas (CP), neoplasia mucinosa papilar intraductal (IPMN) y pancreatitis crónica (PC).
Figure imgf000049_0001
Ejemplo 7: Detección de cáncer de páncreas en muestras de heces usando el marcador CD1D.
Se recogieron muestras de heces de 45 individuos que tenían cáncer de páncreas y de 45 individuos que no tenían cáncer de páncreas y se analizaron para determinar la presencia del marcador CD1D. El cáncer de páncreas se detectó con éxito utilizando el marcador CD1D a partir de las heces.
Ejemplo 8: Nuevos marcadores de metilación de ADN asociados con el cáncer de páncreas en estadio temprano.
Resumen del estudio:
En estudios de tejido de casos y controles independientes, se realizaron experimentos para identificar marcadores de metilación novedosos y altamente discriminantes para PanC utilizando RRBS para la fase de descubrimiento y PCR específica de metilación (MSP) para la fase de validación.
Población de estudio:
Después de la aprobación por la Mayo Clinic Institutional Review Board, se identificaron muestras de tejido de los registros de cáncer existentes. La población accesible incluyó a aquellos que se sometieron a pancreatectomía distal, pancreoduodenectomía, colectomía o biopsia de colon con una pieza archivada congelada. Todos los tejidos fueron revisados por un patólogo gastrointestinal experto para confirmar la clasificación correcta. Las muestras de casos de PanC incluyeron tejidos de adenocarcinoma ductal pancreático limitado a la enfermedad en estadio temprano (AJCC estadios I y II) (Edge SBB, D.R.; Compton, C.C.; Fritz, A.G.; Greene, F.L.; Trotti, A. (Eds.), editor. AJCC Cancer Staging Manual. 7a ed: Springer, Nueva York; 2010). Se excluyeron las neoplasias derivadas de lesiones por IPMN. Se estudiaron dos grupos de control. El primero, denominado "páncreas normal", incluyó los márgenes de resección histológicamente normales de bajo riesgo (cistoadenoma seroso) o neoplasias pancreáticas focales (tumores neuroendocrinos). El segundo grupo de control incluyó tejidos epiteliales colónicos de pacientes confirmados libres de PanC o neoplasias colónicas. Los casos y ambos controles se emparejaron por sexo, edad (en incrementos de 5 años) y estado de tabaquismo (actual o anterior frente a nunca). En un laboratorio central, se microdiseccionaron los tejidos de casos y controles y se extrajo el ADN mediante una técnica de fenol-cloroformo, produciendo al menos 500 ng de ADN. La identificación de casos, el emparejamiento y la extracción de ADN se realizaron por personal independiente para mantener el cegamiento del personal de laboratorio al estado de caso y control.
Secuenciación con bisulfito de representación reducida:
Preparación de la biblioteca (Gu H, Bock C, Mikkelsen TS, Jager N, Smith ZD, Tomazou E, y col. Genome-scale DNA methylation mapping of clinical samples at single-nucleotide resolution. Nat Methods. 2010;7:133-6): El ADN genómico (300 ng) se fragmentó mediante digestión con 10 unidades de MspI, una enzima de restricción específica de metilación que reconoce motivos que contienen CpG. Esto enriquece las muestras para el contenido de CpG y elimina áreas redundantes del genoma. Los fragmentos digeridos se repararon en los extremos y se poliadenilaron con 5 unidades de fragmento de Klenow (3'-5' exo-), y se unieron durante la noche a adaptadores TruSeq metilados (Illumina, San Diego CA) que contenían una de cuatro secuencias de código de barras (para unir cada fragmento a su ID de muestra). La selección del tamaño de fragmentos de 160-340 pb (insertos de 40-220 pb) se realizó usando perlas/tampón Agencourt AMPure XP SPRI (Beckman Coulter, Brea CA). Los límites de tampón fueron de 0,7X a 1,1X volúmenes de muestra de perlas/tampón. El volumen de elución final fue de 22 j l (tampón EB - Qiagen, Germantown MD). Se utilizó qPCR de para medir la eficacia de la unión y la calidad del fragmento en una pequeña alícuota de muestra. A continuación, las muestras se sometieron a conversión con bisulfito (dos veces) utilizando un protocolo EpiTect modificado (Qiagen). La qPCR y PCR convencional (PfuTurbo Cx hotstart - Agilent, Santa Clara CA) seguidas de la evaluación mediante Bioanalyzer 2100 (Agilent) en alícuotas de muestras convertidas determinaron el número de ciclo de PCR óptimo antes de la amplificación de la biblioteca final. Condiciones para PCR final: 50 j l rxn: 5 j l de tampón 10X, 1,25 j l de 10 mM cada dNTP, 5 jl de cóctel de cebadores (~ 5 jM), 15 j l de molde (muestra), 1 jl de PfuTurbo Cx hotstart, 22,75 agua. 95C-5 minutos; 98C-30 segundos; 16 ciclos de 98C-10 segundos, 65C-30 segundos, 72C-30 segundos; 72C-5 minutos; 4C. Las muestras se combinaron (equimolar) en bibliotecas de 4 plex basadas en el esquema de aleatorización y se analizaron con el bioanalizador para la verificación del tamaño final y con qPCR usando patrones phiX y cebadores específicos del adaptador.
Secuenciación y bioinformática:
Las muestras se cargaron en carriles de celda de flujo de acuerdo con una asignación de carril aleatoria con carriles adicionales reservados para controles de ensayo internos. La secuenciación se realizó por el Next Generation Sequencing Coreen en las instalaciones de Mayo Clinic Medical Genome Facility en el Illumina HiSeq 2000. Las lecturas fueron unidireccionales durante 101 ciclos. Cada carril de la celda de flujo generó 100-120 millones de lecturas, suficiente para una cobertura mediana de 30 a 50 veces la profundidad de secuenciación (número de lectura por CpG) para secuencias alineadas. Se utilizó el programa informático de conexión estándar de Illumina para la identificación de nucleótidos y la generación de lecturas de secuencias en el formato fastq. Como se describió anteriormente (Sun Z, Baheti S, Middha S, Kanwar R, Zhang Y, Le X, y col. SAAP-RRBS: streamlined analysis and annotation pipeline for reduced representation bisulfite sequencing. Bioinformatics. 2012;28:2180-1), SAAP-RRBS, una conexión de análisis y anotación optimizada para una secuenciación con bisulfito de representación reducida, se utilizó para la alineación de secuencias y la obtención de metilación.
Estudios de validación mediante PCR específica de metilación:
Visión general: Se realizaron dos estudios de validación basados en MSP en conjuntos de muestras expandidos para confirmar la precisión y reproducibilidad de los candidatos metilados diferencialmente observados. El primero, un estudio de validación interna, se realizó en muestras no cegadas y no emparejadas utilizando réplicas biológicas y técnicas de PanC y colon normal y réplicas técnicas de páncreas normal. Esta etapa se realizó para asegurar que los sitios de metilación diferencial identificados por la filtración de datos RRBS, en el que el % de metilación fue la unidad de análisis, se reflejarían en MSP, en la que la unidad de análisis es el número absoluto de copias genómicas de la secuencia diana, corregido por la concentración de ADN de entrada para cada muestra. El segundo, un experimento de validación externa, utilizó MSP para evaluar a los mejores candidatos en muestras de PanC, páncreas benigno y colon normal asignadas al azar, emparejadas, cegadas, e independientes.
Diseño de cebadores: Los cebadores para cada marcador se diseñaron para dirigirse a las secuencias metiladas modificadas con bisulfito de cada gen diana (IDT, Coralville IA) y a una región sin sitios de citosina-fosfato-guanina en el gen p-actina, como referencia de tratamiento con bisulfito y entrada de ADN. El diseño se realizó mediante el programa informático Methprimer (Universidad de California, San Francisco CA) o mediante procedimientos semimanuales (mediante H.Z. y W.R.T). A continuación, los ensayos se analizaron y optimizaron ejecutando mediante la ejecución con colorantes SYBR Green (Life Technologies, Grand Island NY) en diluciones de controles de ADN genómico universalmente metilados y no metilados.
PCR específica de metilación: Las reacciones de MSP se realizaron en ADN extraído de tejido como se describió anteriormente (Kisiel JB, Yab TC, Taylor WR, Chari ST, Petersen GM, Mahoney DW, y col. Stool DNA testing for the detection of pancreatic cancer: assessment of methylation marker candidates. Cancer. 2012;118:2623-31). En resumen, el ADN se trató con bisulfito utilizando el kit de metilación de ADN EZ (Zymo Research, Orange, CA) y se eluyó en tampón. Se utilizó un pl de ADN tratado con bisulfito como molde para la cuantificación de la metilación con una PCR en tiempo real basada en fluorescencia, realizada con la mezcla maestra SYBR Green (Roche, Mannheim Alemania). Las reacciones se ejecutaron en Roche 480 LightCyclers (Indianapolis, IN), en el que el ADN metilado CpGenome Universal tratado con bisulfito (Millipore, Billerica, mA) se utilizó como control positivo y se diluyó en serie para crear curvas patrón para todas las placas. Las secuencias de oligonucleótidos y las temperaturas de hibridación están a disposición de los interesados.
Análisis estadístico
RRBS: La principal comparación de interés fue la diferencia de metilación entre casos y controles pancreáticos en cada CpG mapeada. Las islas de CpG se definen bioquímicamente mediante una relación CpG observada a esperada superior a 0,6 (Gardiner-Garden M, Frommer M. CpG islands in vertebrate genomes. Journal of molecular biology 1987;196:261-82). Sin embargo, para este modelo, se crearon unidades en mosaico de análisis CpG "región diferencialmente metilada (DMR)" basándose en la distancia entre las ubicaciones de los sitios CpG para cada cromosoma. Como la distancia entre cualquier CpG dada excedió la ubicación anterior o siguiente en más de 100 pb, se creó un nuevo identificador de isla. Se excluyeron las islas con una sola CpG. El resultado secundario fue la misma comparación entre casos y controles de colon. Los sitios CpG individuales se consideraron para el análisis diferencial solo si la profundidad total de cobertura por grupo de enfermedad era > 200 lecturas (lo que equivale aproximadamente a un promedio de 10 lecturas por sujeto) y la varianza del % de metilación era mayor que cero (se excluyeron sitios CpG no informativos con varianza 0). Los criterios para la profundidad de lectura se basaron en el poder estadístico deseado para detectar una diferencia del 10 % en la tasa de metilación entre dos grupos en los que el tamaño de la muestra de individuos para cada grupo era 18.
La significación estadística se determinó mediante regresión logística sobre el % de metilación por DMR (utilizando los recuentos reales) con los grupos definidos como PanC, páncreas normal y colon normal. Para tener en cuenta las diferentes profundidades de lectura en sujetos individuales, se utilizó un modelo de regresión logística sobredisperso, en el que el parámetro de dispersión se estimó usando el valor muestral Chi-cuadrado de Pearson de los restos del modelo ajustado. Para evaluar la metilación específica de una cadena, las regiones directa e inversa se analizaron por separado. A continuación, las DMR se clasificaron de acuerdo con su nivel de significación y se consideraron como una región marcadora viable si la tasa de metilación en los controles era < 1 % pero > 10 % en PanC. Cada DMR significativa se consideró como un marcador candidato.
Para el estudio de validación interna, el resultado primario fue el área bajo la curva (ABC) de rendimiento diagnóstico para cada marcador. Esto se calculó mediante regresión logística (JMP versión 9.0.1, SAS Institute, Cary NC) para modelar la solidez del número de copias corregidas por concentración de cada marcador con PanC en comparación con el páncreas normal y el colon normal. Los marcadores con los valores de ABC más altos y la relación más amplia de número medio de copias genómicas entre casos y controles se seleccionaron para el estudio de validación externa. El resultado principal del experimento de validación externa fue el ABC de cada marcador representado frente a la solidez de la señal de cada marcador, medido mediante el logaritmo de la relación de la mediana del número de copias corregidas en los casos en comparación con los controles. Con dieciocho casos, hay > 80 % de poder para detectar un área bajo la curva de 0,85 o más a partir de la hipótesis nula de 0,5 a un nivel de significación bilateral de 0,05. El criterio de valoración secundario fue el ABC de las combinaciones de dos marcadores, medido mediante regresión logística, en el que se requirió que ambos marcadores se asociaran de forma independiente con los casos de PanC.
Descubrimiento del marcador RRBS
Se secuenciaron mediante RRBS extractos de ADN emparejados, cegados y asignados aleatoriamente de 18 tumores de cáncer de páncreas, 18 tejidos de control pancreático benignos y 18 tejidos epiteliales de colon normal. La mediana de edad fue 61 (recorrido intercuartílico 52-65), el 61 % eran mujeres y el 44 % eran fumadores o exfumadores. Se registraron un total de 6.101.049 de sitios CpG en cualquiera de las muestras con una cobertura de al menos 10X. Después de seleccionar solo los sitios CpG en los que se cumplieron los criterios de varianza y cobertura de grupo, un total de 1.217.523 de sitios CpG se consideraron adicionalmente para el análisis. Aproximadamente 500 DMR cumplieron los criterios de significación para la metilación diferencial. Entre estos, se identificaron 107 regiones candidatas con suficientes firmas de metilación para el diseño de cebadores para MSP. Las firmas de metilación variaron de 3 CpG vecinos a 52 CpG. Los niveles de metilación de los cánceres de páncreas rara vez superaron el 25 % en los CpG filtrados, reflejando altos niveles de células estromales contaminantes. Esto se confirmó después de secuenciar cada uno de los cánceres para mutaciones KRAS para verificar las frecuencias alélicas de las muestras positivas; para el 50 % de las muestras de PanC que albergaban un cambio de base de KRAS heterocigoto, la frecuencia del alelo mutante fue al menos 4 veces menor que el alelo de tipo silvestre correspondiente.
Validación interna
Según el número de CpG vecinas en cada firma de metilación de genes candidatos, se diseñaron cebadores para 87 de los 107 marcadores candidatos. A continuación, se utilizó MSP para analizar a los candidatos en una muestra de ADN de otras 20 lesiones de PanC no cegadas, 10 muestras adicionales de epitelio colónico normal (réplicas biológicas), así como, muestras de ADN restantes de las 18 lesiones de PanC secuenciadas, 15 de los tejidos pancreáticos benignos secuenciados y 10 de las muestras de colon normal secuenciadas (réplicas técnicas). Con diseños de cebadores del primer paso, se amplificaron con éxito 74 de 87 marcadores. Con el rediseño, se amplificaron con éxito los 13 cebadores restantes y se analizaron en 12 muestras de PanC no cegadas y 10 muestras de colon normal. La p-actina se amplificó en todas las muestras. Con MSP del primer y segundo paso, 31 de 87 marcadores candidatos tenían un ABC > 0,85. Según la magnitud de la diferencia en el número medio de copias genómicas entre casos y controles para cada marcador candidato, 23 fueron seleccionados para validación externa en muestras independientes. Éstos eran ABCB1, ADCY1, BMP3, C13ORF18, CACNA1C, CD1D, CHR12133484978-133485738 (CHR12 133), CLEC11A, ELMO1, FOXP2, GRIN2D, IKZF1, KCNK12, KCNN2, NDRG4, PRKCB, RSPO3, SCARF2, SHH, SLC38A3, TWIST1, VWC3 y WT1.
Validación externa
Se analizó el ADN emparejado, ciego y asignado aleatoriamente de 18 muestras de PanC, 18 pancreáticas benignas y 36 muestras de epitelio de colon normal mediante MSP para los 23 candidatos principales. La mediana de edad de este subconjunto fue de 60 años (recorrido intercuartílico 54 - 64). La mayoría (55 %) de las muestras procedían de hombres y el 61 % eran fumadores o exfumadores. La p-actina se amplificó en todas las muestras. 9 de 23 candidatos mostraron una excelente asociación con PanC. Los valores individuales del ABC para CACNA1C, CHR12.133, WT1, GRIN2D, ELMO1, TWIST1, C13ORF18, KCNN2, y CLEC11A fueron 0,95, 0,95, 0,94, 0,94, 0,93, 0,92, 0,91, 0,90 y 0,90, respectivamente. Se observó buena asociación con otros 9 candidatos; los valores del ABC para PRKCB, CD1D, SLC38A3, ABCB1, KCNK12, VWC2, RSPO3, SHH y ADCY1 fueron 0,89, 0,88, 0,86, 0,86, 0,86, 0,85, 0,85, 0,85 y 0,84 respectivamente.
La relación logarítmica de la mediana de los valores de casos y controles para cada marcador se representó frente al ABC. Ocho marcadores, SHH, KCNK12, PRKCB, CLEC11, C13ORF18, TWIST1, ELMO1 y CHR12.133 tenían cada uno un ABC superior a 0,85 y mostraron un número de copias genómicas superior a 1,5 log (> 30 veces) mayor entre los casos que entre los controles. KCNK12, PRKCB, ELMO1 y CHR12.133 mostraron una diferencia mayor de 2 log (> 100 veces).
Análisis de complementariedad
Entre las 231 combinaciones posibles de 2 marcadores, ambos marcadores se mantuvieron altamente significativos en 30 (13%) modelos de asociación por pares con PanC. De aquellos, 18 (8%) mostraron una mejora del ABC. Destacado entre varios marcadores complementarios, C13ORF18 mejoró la precisión de CACNA1C, WT1, GRIND2D, SLC38A3 y SCARF2 con ABC de 0,99, 0,99, 0,97, 0,96 y 0,95, respectivamente, para cada combinación. Aunque el ABC de SHH como marcador individual fue 0,85, mejoró el rendimiento de otros 6 marcadores cuando se emparejaron. El ABC de CACNA1C, WT1, SLC38A3, ABCB1, VWC2 y RSPO3 mejoró a 0,96, 0,95, 0,92, 0,98, 0,88 y 0,95, respectivamente cuando se combinaron en modelos con SHH. De las 18 combinaciones de marcadores más sólidas, se podrían analizar 9 combinaciones en comparaciones por pares del conjunto de datos de validación interna. De estas, 7 pares (78 %) siguieron siendo muy significativos en ambos conjuntos de datos.
Ejemplo 9: Marcadores de ADN metilados altamente discriminantes para la detección de esófago de Barrett Para frenar la creciente incidencia de adenocarcinoma de esófago, se necesitan procedimientos eficaces para detectar en la población el precursor crítico de esófago de Barrett (EB). Se han propuesto herramientas mínimamente o no invasivas, pero obstaculizadas por la falta de marcadores específicos y de sensibilidad óptima. Se realizaron experimentos y se identificaron BMP3 y NDRG4 metilados de manera anómala como marcadores candidatos discriminantes para EB.
Un objetivo de dichos experimentos fue evaluar prospectivamente la precisión de BMP3 y NDRG4 metilados para identificar EB usando biopsias endoscópicas (Fase 1) y cepillados de todo el esófago y cardias para simular dispositivos de muestreo no endoscópicos (Fase 2).
Los casos con y los controles sin EB se reclutaron antes de la endoscopia. Los casos de EB tenían > 1 cm de mucosa columnar circunferencial con metaplasia intestinal confirmada; los controles no tenían EB endoscópicamente. En la fase 1, se obtuvieron biopsias en casos de EB, cardias gástrico ((CG); 1 cm por debajo de la línea Z) y epitelio escamoso ((EE); > 2 cm por encima de EB) y en controles de CG (como para e B) y EE (5 cm por encima de la línea Z); a continuación de congelaron rápidamente. Las muestras de biopsia se procesaron como un lote y se analizaron a ciegas. En la fase 2, las piezas se obtuvieron utilizando un cepillo de citología endoscópica de alta capacidad (Hobbs Medical, Stafford Springs CT); el cardias, EB (en los casos) y la longitud total del esófago se cepillaron para simular un dispositivo de muestreo de esponjas ingeridas. Después de la extracción de ADN y el tratamiento con bisulfito, se ensayó la metilación en genes diana mediante amplificación cuantitativa de señal y diana en tiempo real específica de alelo. También se cuantificó la p-actina como marcador del ADN humano total.
Se estudiaron prospectivamente 100 sujetos. Fase 1: Entre 40 casos de EB y 40 controles: la mediana de edad fue 65 (cuartiles 55-77) y 54 (37-69) y los hombres comprendieron el 78 % y 48 %, respectivamente. La mediana de la longitud del EB fue de 6 cm (intervalo de 3-10). Las medianas de los niveles de marcadores metilados fueron sustancialmente más altas (34-600 veces) en EB que en EE y CG adyacentes o que en EE y CG normales (Tabla). A diferencia de los marcadores metilados, las distribuciones de p-actina fueron similares entre los grupos de tejidos. Ambos niveles de marcadores aumentaron con la longitud de EB y la edad, p < 0,001 mientras que solo NDRG4 aumentó significativamente con la presencia de displasia (ninguna (19), grado bajo (9), grado alto (11); p = 0,003). Los factores que no afectaron significativamente los niveles de marcadores incluyeron el sexo y la inflamación. Fase 2: Entre 10 casos de EB y 10 controles, la mediana de edad fue 64 (59-70) y 66 (49, 71) y los hombres comprendieron el 80 y 30% respectivamente. La mediana de la longitud del EB fue de 2 cm (intervalo de 1-4). La discriminación de EB por marcadores fue extraordinaria con un ABC de 1,0 para NDRG4 y 0,99 para BMP3; los niveles fueron > 100 veces más altos en los casos que en los controles (Figura 2).
Estos experimentos demuestran que los marcadores de ADN metilados seleccionados discriminan mucho EB de CG y EE normales, tanto en biopsia como en muestras cepilladas. La tabla 9 muestra las asociaciones de función y biología del cáncer de los marcadores de ADN metilados seleccionados.
Tabla 8: Niveles de marcadores (número de copias de marcadores ajustados para beta actina) para biopsias de BMP3 y NDRG4 de casos de EB (cardias, de Barrett, escamoso) y controles (cardias, escamoso).
Figure imgf000053_0001
Tabla 9. Asociaciones de función y biología del cáncer de los principales marcadores candidatos
Figure imgf000053_0002
continuación
Figure imgf000054_0001
continuación
Figure imgf000055_0001
Lee WK, Chakraborty PK, Thevenod F. Pituitary homeobox 2 (PITX2) protects renal cáncer cell lines against doxorubicin toxicity by transcriptional activation of the multidrug transporter ABCB1. International journal of cancer Journal international du cancer. 2013;133:556-67.
Vincent A, Omura N, Hong SM, Jaffe A, Eshleman J, Goggins M. Genome-wide analysis of promoter methylation associated with gene expression profile in pancreatic adenocarcinoma. Clinical cancer research: an official journal of the American Association for Cancer Research. 2011;17:4341-54.
Yang N, Eijsink JJ, Lendvai A, Volders HH, Klip H, Buikema HJ, y col. Methylation markers for CCNA1 and C13ORF18 are strongly associated with high-grade cervical intraepithelial neoplasia and cervical cancer in cervical scrapings. Cancer epidemiology, biomarkers & prevention: a publication of the American Association for Cancer Research, copatrocinado por la American Society of Preventive Oncology. 2009; 18:3000-7.
Liu D, Song L, Brawley VS, Robison N, Wei J, Gao X, y col. Medulloblastoma expresses CD1d and can be targeted for immunotherapy with NKT cells. Clin Immunol. 2013;149:55-64. Li H, Yang L, Fu H, Yan J, Wang Y, Guo H, y col. Association between Galphai2 and ELMO1/Dock180 connects chemokine signalling with Rac activation and metastasis. Nat Commun. 2013;4:1706.
Stumm L, Burkhardt L, Steurer S, Simon R, Adam M, Becker A, y col. Strong expression of the neuronal transcription factor FOXP2 is linked to an increased risk of early PSA recurrence in ERG fusion-negative cancers. Journal of clinical pathology. 2013;66:563-8.
Campbell AJ, Lyne L, Brown PJ, Launchbury RJ, Bignone P, Chi J, y col. Aberrant expression of the neuronal transcription factor FOXP2 in neoplastic plasma cells. British journal of haematology. 2010;149:221-30.
Jiao X, Wood LD, Lindman M, Jones S, Buckhaults P, Polyak K, y col. Somatic mutations in the Notch, NF-KB, PIK3CA, and Hedgehog pathways in human breast cancers. Genes, chromosomes & cancer. 2012;51:480-9.
Asai D, Imamura T, Suenobu S, Saito A, Hasegawa D, Deguchi T, y col. IKZF1 deletion is associated with a poor outcome in pediatric B-cell precursor acute lymphoblastic leukemia in Japan. Cancer Med. 2013;2:412-9.
Kober P, Bujko M, Oledzki J, Tysarowski A, Siedlecki JA. Methyl-CpG binding column-based identification of nine genes hypermethylated in colorectal cancer. Molecular carcinogenesis. 2011;50:846-56.
Camoes MJ, Paulo P, Ribeiro FR, Barros-Silva JD, Almeida M, Costa VL, y col. Potential downstream target genes of aberrant ETS transcription factors are differentially affected in Ewing's sarcoma and prostate carcinoma. PLoS ONE.
2012;7:e49819.
Kisiel JB, Yab TC, Taylor WR, Chari ST, Petersen GM, Mahoney DW, y col. Stool DNA testing for the detection of pancreatic cancer: assessment of methylation marker candidates. Cancer. 2012;118:2623-31.
Ahlquist DA, Zou H, Domanico M, Mahoney DW, Yab TC, Taylor WR, y col. Next-Generation Stool DNA Test Accurately Detects Colorectal Cancer and Large Adenomas. Gastroenterology. 2012;142:248-56.
Surdez D, Benetkiewicz M, Perrin V, Han ZY, Pierron G, Ballet S, y col. Targeting the EWSR1-FLI1 oncogeneinduced protein kinase PKC-beta abolishes ewing sarcoma growth. Cancer research. 2012;72:4494-503.
Seshagiri S, Stawiski EW, Durinck S, Modrusan Z, Storm EE, Conboy CB, y col. Recurrent R-spondin fusions in colon cancer. Nature. 2012;488:660-4.
Zhao J, Liang Q, Cheung KF, Kang W, Lung RW, Tong JH, y col. Genome-wide identification of Epstein-Barr virusdriven promoter methylation profiles of human genes in gastric cancer cells. Cancer. 2013;119:304-12.
Gurung B, Feng Z, Iwamoto DV, Thiel A, Jin G, Fan CM, y col. Menin epigenetically represses Hedgehog signaling in MEN1 tumor syndrome. Cancer research. 2013;73:2650-8.
Person RJ, Tokar EJ, Xu Y, Orihuela R, Ngalame NN, Waalkes MP. Chronic cadmium exposure in vitro induces cancer cell characteristics in human lung cells. Toxicol Appl Pharmacol. 2013.
Shin SH, Lee K, Kim BH, Cho NY, Jang JY, Kim YT, y col. Bile-based detection of extrahepatic cholangiocarcinoma with quantitative DNA methylation markers and its high sensitivity. The Journal of molecular diagnostics: JMD.
2012;14:256-63.
Jacobs DI, Mao Y, Fu A, Kelly WK, Zhu Y. Dysregulated methylation at imprinted genes in prostate tumor tissue detected by methylation microarray. BMC Urol. 2013;13:37.
Ejemplo 9: Un perfil de marcadores de ADN y microARN basado en heces para la detección de cáncer de páncreas
Dada la extraordinaria letalidad del cáncer de páncreas (CP), se necesitan procedimientos prácticos no invasivos para la detección presintomática. Los microARN (miARN) tienen expresión alterada en CP.
Se realizaron experimentos con el objetivo de explorar la viabilidad de miR-1290 en heces para la detección de CP. Se analizaron muestras de heces de archivo de 58 casos de CP y 64 controles sanos emparejados por edad, sexo y antecedentes de tabaquismo. La detección de miARN se realizó mediante un enfoque de reacción en cadena de la polimerasa con transcripción inversa cuantitativa (qRT-PCR, por sus siglas en inglés) de tallo-bucle. La cuantificación de miARN se basó en medir las copias absolutas por nanogramo de ARN extraído. Los marcadores de ADN (BMP3 metilado, KRAS mutante y p-actina) se registraron de forma híbrida y se amplificaron como se describe (Cancer 2012, 118:2623). Un modelo de regresión logística por etapas, limitado a 5 variables, se utilizó para construir un perfil de marcadores optimizado basado en miR-1290, marcadores de ADN y edad. Las áreas bajo la curva (ABC) ROC ajustadas por edad para cada uno de los modelos se compararon utilizando los procedimientos de DeLong y col. La asociación de miR-1290 con factores clínicos se evaluó usando el ensayo Wilcoxon Rank Sums. Las distribuciones de miR-1290 fueron significativamente mayores en las heces de los casos de CP que en los controles (P = 0,0002). Los niveles de miR-1290 en heces no se vieron afectados por la edad, sexo, sitio del tumor o estadio del tumor. El ABC de miR-1290 en heces fue 0,74 (IC del 95 %: 0,65 - 0,82, Figura 3) para la detección de CP en comparación con un ABC de 0,81 (0,73 - 0,89) mediante el perfil de marcadores de ADN en heces. La adición de miR-1290 a los marcadores de ADN resultó ser incremental (P = 0,0007) con un ABC de 0,87 (0,81 - 0,94). La adición de miR-1290 al perfil de ADN aumentó la sensibilidad del ensayo en todo el intervalo de especificidades, incluyendo la región clave del 90-100 %. La sensibilidad de CP del perfil de marcadores combinados fue del 64 % (50 % - 76 %) con una especificidad del 95 % (87 % - 99 %) y del 79 % (67 % - 89 %) con una especificidad del 85 % (74 % - 92 %).
Estos experimentos identificaron miR-1290 en heces como marcador de CP.
Ejemplo 11 - Identificación de marcadores usando RRBS
Durante el desarrollo de la tecnología proporcionada en el presente documento, se recogieron datos de un estudio de casos y controles para demostrar que una estrategia de búsqueda en todo el genoma identifica marcadores novedosos e informativos.
Población de estudio, adquisición de piezas y muestras
La población diana fueron los pacientes con cáncer de páncreas atendidos en la Mayo Clinic. La población accesible incluye aquellos que se han sometido a una pancreatectomía distal, una pancreoduodenectomía o una colectomía con una pieza de resección archivada y un diagnóstico patológico confirmado. El ADN del epitelio colónico se extrajo previamente de piezas microdiseccionadas por el laboratorio Biospecimens Accessioning Processing (BAP) utilizando un protocolo de fenol-cloroformo. El personal de Pancreas SPORE utilizó datos sobre las variables coincidentes para estas muestras para seleccionar muestras de registro de tejidos. Estas fueron revisadas por un patólogo experto para confirmar el estado del caso y control y excluir los casos de neoplasias que surgen de IPMN, que puede tener una biología subyacente diferente. El personal de SPORE organizó la microdisección del laboratorio BAP y la extracción de ADN de las muestras de caso y control pancreático y proporcionó 500 ng de ADN al personal del laboratorio que no conocía el estado del caso y control. Las muestras de ácido nucleico de archivo incluían 18 adenocarcinomas de páncreas, 18 páncreas normales y 18 epitelios colónicos normales emparejados por sexo, edad y tabaquismo.
Los tipos de muestra fueron:
1) tejidos PanC del registro SPORE de páncreas de la Mayo Clinic limitados a los estadios I y II de AJCC;
2) páncreas de control libres de PanC;
3) epitelio colónico de control archivado libre de PanC; y
4) neoplasia de colon de la que se extrajo ADN y se almacenó en el laboratorio BAP.
Los casos y controles se emparejaron por sexo, edad (en incrementos de 5 años) y estado de tabaquismo (actual o anterior frente nunca).
Procedimientos
Las bibliotecas se prepararon de acuerdo con procedimientos previamente informados (véase, por ejemplo, Gu y col. (2011) "Preparation of reduced representation bisulfite sequencing libraries for genome-scale DNA methylation profiling" Nature Protocols 6: 468-81) mediante la fragmentación de ADN genómico (300 ng) por digestión con 10 unidades de Mspl, una enzima de restricción específica de metilación que reconoce motivos que contienen CpG. Este tratamiento enriquece las muestras para el contenido de CpG y elimina áreas redundantes del genoma. Los fragmentos digeridos se repararon en los extremos y se poliadenilaron con 5 unidades de fragmento de Klenow (3'-5' exo) y se unieron durante la noche a adaptadores Illumina que contenían una de las cuatro secuencias de código de barras para unir cada fragmento a su ID de muestra. La selección del tamaño de los fragmentos de 160-340 pb (que tienen insertos de 40-220 pb) se realizó usando perlas/tampón SPRI (AMPure XP, Beckman Coulter). Los límites de tampón fueron de 0,7x a 1,1x del volumen de muestra de perlas/tampón. Las muestras se eluyeron en un volumen de 22 |jl (tampón EB, Qiagen). Se utilizó qPCR para medir la eficacia de la unión y la calidad del fragmento en una pequeña alícuota de muestra. A continuación, las muestras se sometieron a dos rondas de conversión con bisulfito usando un protocolo EpiTect modificado (Qiagen). Las qPCR y PCR convencional (Pfu Turbo Cx hotstart, Agilent), seguidas de la evaluación con Bioanalyzer 2100 (Agilent) en alícuotas de muestra convertidas, determinaron el número de ciclo de PCR óptimo antes de la amplificación de la biblioteca final. La PCR final se realizó en un volumen de 50 j l (5 j l de tampón de PCR 10x; 1,25 j l de cada dNTP a 10 mM; 5 j l de un cóctel de cebadores a aproximadamente 5 jM, 15 j l de molde (muestra), 1 j l de PfuTurbo Cx hotstart y 22,75 j l de agua. El ciclo térmico comenzó con incubaciones iniciales a 95 °C durante 5 minutos y a 98 °C durante 30 segundos, seguidas de 16 ciclos a 98 °C durante 10 segundos, 65 °C durante 30 segundos y a 72 °C durante 30 segundos. Después de los ciclos, las muestras se incubaron a 72 °C durante 5 minutos y se mantuvieron a 4°C hasta su posterior procesamiento y análisis. Las muestras se combinaron en cantidades equimolares en bibliotecas de 4 plex basadas en un esquema de aleatorización y se analizaron con el bioanalizador para la verificación del tamaño final. Las muestras también se analizaron con qPCR utilizando patrones phiX y cebadores específicos de adaptador.
Para la secuenciación, las muestras se cargaron en carriles de celda de flujo de acuerdo con una asignación de carril aleatoria con carriles adicionales reservados para controles de ensayo internos. La secuenciación se realizó mediante NGS Core en el Medical Genome Facility de Mayo en el Illumina HiSeq 2000. Las lecturas fueron unidireccionales durante 101 ciclos. Cada carril de la celda de flujo generó 100-120 millones de lecturas, suficientes para una cobertura mediana de profundidad de secuenciación de 30x a 50x (según el número de lecturas por CpG) para secuencias alineadas. Se utilizó el programa informático de conexión estándar de Illumina para analizar las lecturas en combinación con RRBSMAP (Xi, y col. (2012) "RRBSMAP: a fast, accurate and user-friendly alignment tool for reduced representation bisulfite sequencing" Bioinformatics 28: 430-432) y una conexión interna (SAAP-RRBS) desarrollada por personal de Mayo Biomedical and Statistics (Sun y col. (2012)" SAAP-RRBS: streamlined analysis and annotation pipeline for reduced representation bisulfite sequencing" Bioinformatics 28: 2180-1). Los análisis bioinformáticos consistieron en 1) evaluación y limpieza de lecturas de secuencia, 2) alineación con el genoma de referencia, 3) extracción del estado de metilación y 4) notificación y anotación de CpG.
Consideraciones estadísticas:
La principal comparación de interés son las diferencias de metilación entre casos y controles de enfermedad en cada CpG y/o ventana de CpG en mosaico. El resultado secundario es la misma comparación entre los casos y los controles de capa leucoplaquetaria y colon normal. Los marcadores se analizaron para la metilación diferencial mediante:
1. Evaluación de las distribuciones del porcentaje de metilación para cada marcador y descarte de los marcadores con más del 2,5 % de fondo metilado en controles de colon y capa leucoplaquetaria normal 2. Análisis de la distribución de metilación de los marcadores restantes entre casos y controles utilizando la prueba de suma de rangos de Wilcoxon y los marcadores de clasificación por valores p.
3. Uso de valores Q para estimar las tasas de descubrimiento falso (FDR) (Benjamini y col. (1995) "Multiple Testing" Journal of the Royal Statistical Society. Series B (Methodological) 57: 289-300; Storey y col. (2003) "Statistical significance for genomewide studies" Proc Natl Acad Sci USA 100: 9440-5). A nivel de descubrimiento, una FDR de hasta el 25 % es aceptable.
Análisis de los datos
Se desarrolló una conexión de análisis de datos en el paquete del programa informático de análisis estadístico R ("R: A Language and Environment for Statistical Computing" (2012), R Foundation for Statistical Computing). El flujo de trabajo consta de las siguientes etapas:
1. Lectura en todos los sitios CpG
2. Se consideraron solo aquellos sitios CpG en los que la profundidad de cobertura total del grupo fue de 200 lecturas o más. Esto se basa en la evaluación de la potencia para detectar una diferencia entre el 20 % y el 30 % de metilación entre dos grupos cualesquiera; todo lo que sea menos tiene pocas posibilidades de ser significativo. Por lo tanto, si hay 18 materias por grupo y cada materia tiene 12 lecturas, la profundidad de cobertura del grupo es 12*18 = 216.
3. Se excluyeron todos los sitios CpG en los que la varianza del % de metilación entre los grupos era 0 (sitios CpG no informativos).
4. Se realizó una regresión logística sobredispersada en el % de metilación (usando los recuentos reales) con los grupos definidos como colon normal/capa leucoplaquetaria, control específico de enfermedad y cáncer específico de interés (casos) para determinar la significación estadística del % de metilación para los análisis primarios y secundarios. Se utilizó un modelo logístico sobredispersado ya que la variabilidad en el % de metilación entre sujetos es mayor de lo que permite el supuesto binomial. Este parámetro de dispersión se estimó mediante el Chi-cuadrado de Pearson del ajuste.
5. Área generada bajo los valores de la curva de rendimiento diagnóstico (ROC). El área bajo la curva ROC es una medida de precisión predictiva del % de metilación específico del sujeto y se estimó para el análisis primario (casos frente a control de enfermedad) y el análisis secundario (casos frente a colon normal/capa leucoplaquetaria), por separado.
6. De manera similar al n.° 5, el cambio de veces (FC, por sus siglas en inglés, una medida de la separación entre casos y controles) para el análisis primario y secundario también se estimó utilizando la relación de % medio de metilación entre casos y el grupo de control correspondiente.
7. Se realizaron 4-6 anteriores en sitios CpG individuales así como en regiones CpG metiladas. Estas regiones se definieron para cada cromosoma como un grupo de al menos 5 sitios CpG dentro de aproximadamente 100 pares de bases (pb) de distancia con un % de metilación promedio < 2,5 % en controles de colon normal/capa leucoplaquetaria.
8. Se identificaron regiones CpG prometedoras para la validación técnica y biológica que tenían una diferencia de metilación estadísticamente significativa, un FC grande y un ABC alto para los análisis primarios o secundarios. Análisis post-R:
1. Regiones CpG y CpG individuales clasificadas por valor p, FC y ABC. Los límites fueron < 0,01, > 20 y > 0,85 respectivamente, aunque a menudo se ajustaban en función de la solidez de los datos. Por ejemplo, el tejido neoplásico altamente heterogéneo da como resultado valores de % de metilación más bajos, lo que a su vez afecta al filtrado. Las comparaciones primarias y secundarias se pueden clasificar juntas o por separado según los requisitos de especificidad de la solicitud. Se incluyen epitelios colónicos normales como control para descubrir marcadores adecuados para el análisis de heces. Si se está analizando el jugo pancreático, el tejido colónico es innecesario. Esto puede dar como resultado un conjunto de marcadores completamente diferente. 2. Regiones de marcadores clasificadas según los requisitos de la plataforma de ensayo. En la actualidad, la PCR específica de metilación (MSP) o plataformas de amplificación similares en las que la discriminación se basa en la especificidad de la hibridación del cebador, es la plataforma elegida. Para esta metodología, es imperativo tener 2-5 CpG discriminadas por oligonucleótido dentro de un tramo amplificable de ADN. Para los análisis de heces, este requisito es aún más estricto porque los amplicones deben ser cortos (< 100 pb). La selección de marcadores, por lo tanto, debe realizarse sobre la base de tramos cortos contiguos de CpG altamente discriminados. Si la plataforma evoluciona a una tecnología basada en secuencias, los requisitos de distribución de CpG dentro de una región pueden ser completamente diferentes.
Resultados
Se secuenciaron mediante RRBS extractos de ADN emparejados, cegados y asignados aleatoriamente de 18 tumores de cáncer de páncreas, 18 tejidos de control pancreático benignos y 18 tejidos epiteliales colónicos normales. La mediana de edad fue 61 (recorrido intercuartílico 52-65), el 61 % eran mujeres y el 44 % eran fumadores o exfumadores. Se mapearon aproximadamente 6 millones de CpG con una cobertura > 10x. Más de 2000 regiones CpG cumplieron los criterios de significación para la metilación diferencial. Después de aplicar los criterios de filtro anteriores, se identificaron 449 regiones metiladas diferencialmente (DMR) (Tabla 10). La tabla 11 presenta las 449 regiones diferencialmente metiladas (DMR) identificadas clasificadas mediante el área bajo la curva (ABC) ROC decreciente.
En estos marcadores, las firmas de metilación van desde 3 CpG vecinos hasta 56 CpG. Los niveles de metilación de los cánceres de páncreas rara vez superaron el 25 % en los CpG filtrados, lo que sugirió que los tejidos cancerosos pueden tener altos niveles de estroma y/o células normales contaminantes. Para probar esto, cada uno de los cánceres se secuenció para las mutaciones KRAS para verificar las frecuencias alélicas de las muestras positivas. Para el 50 % que albergaba un cambio de base de KRAS heterocigoto, la frecuencia del alelo mutante fue al menos 4 veces menor que la del alelo de tipo silvestre correspondiente, en apoyo de la contaminación por estroma y/o células normales.
Se encontró que 58 de los 449 marcadores están en regiones no anotadas y se encuentran en regiones genómicas sin elementos codificantes de proteínas. De los 391 marcadores candidatos restantes, aproximadamente 225 se han descrito como asociados con el cáncer, algunos de los cuales se clasifican como supresores de tumores. Los otros 166 marcadores candidatos tienen una asociación débil previamente identificada con el cáncer (por ejemplo, mutaciones y/o alteraciones en el número de copias observadas en las detecciones de todo el genoma) o no tienen asociaciones de cáncer identificadas previamente.
Tabla 10: DMR
N.° de marcador Cromosoma Coordenadas cromosómicas Anotación
1 chr7 87229775-87229856 ABCB1
2 chr2 207307687-207307794 ADAM23
3 chr15 100881373-100881437 ADAMTS17
4 chr16 77468655-77468742 ADAMTS18
5 chr19 41224781-41225006 ADCK4
6 chr7 45613877-45614572 ADCY1
7 chr2 70994498-70994755 ADD2
8 chr14 105190863-105191031 ADSSL1
9 chr10 116064516-116064600 AFAP1L2
10 chr4 87934353-87934488 AFF1
11 chr2 100720494-100720679 AFF3
12 chr7 100136884-100137350 AGFG2
13 chr9 116151083-116151315 ALAD
14 chr14 103396870-103396920 AMN
15 chr19 10206736-10206757 ANGPTL6
16 chr19 17438929-17438974 ANO8
17 chr15 90358267-90358400 ANPEP
18 chr15 29131299-29131369 APBA2
19 chr19 45430362-45430458 APOC1P1
20 chr13 111767862-111768355 ARHGEF7
21 chr7 98990897-98990989 ARPC1B
22 chr22 51066374-51066431 ARSA
23 chr9 120175665-120176057 ASTN2
24 chr1 203619509-203619829 ATP2B4
25 chr7 69062853-69062972 AUTS2
26 chr8 104152963-104152974 BAALC
27 chr11 64052053-64052132 BAD
28 chr10 121411207-121411375 BAG3
29 chr7 98029116-98029383 BAIAP2L1
30 chr9 135462730-135462765 BARHL1
31 chr10 133795124-133795423 BNIP3
32 chr12 107715014-107715095 BTBD11
33 chr6 105584524-105584800 BVES
34 chr10 21816267-21816490 C10orf140
35 chr12 21680381-21680438 C12orf39
36 chr12 21680681-21680817 C12orf39
37 chr12 117174873-117175030 C12orf49
38 chr13 46960767-46961669 C13orf18
(continuación)
N.° de marcador Cromosoma Coordenadas cromosómicas Anotación 9 chr14 50099743-50099930 C14orf104 0 chr19 16772631-16772712 C19orf42 1 chr20 31061389-31061649 C20orf112 2 chr5 175665232-175665311 C5orf25 3 chr6 42858890-42859092 C6orf226 4 chr9 139735581-139735683 C9orf172 5 chr12 2800756-2800899 CACNA1C 6 chr3 54156904-54156987 CACNA2D3 7 chr11 115373179-115373281 CADM1 8 chr16 89007413-89007432 CBFA2T3 9 chr16 49316205-49316258 CBLN1 0 chr21 44495919-44495933 CBS 1 chr17 77810085-77810206 CBX4 2 chr17 8649567-8649665 CCDC42 3 chr11 64110001-64110069 CCDC88B 4 chr14 91883473-91883674 CCDC88C 5 chr14 99946756-99946806 CCNK 6 chr1 158150797-158151205 CD1D 7 chr5 175969660-175969699 CDHR2 8 chr7 39989959-39990020 CDK13 9 chr16 80837397-80837505 CDYL2 0 chr10 11059508-11060151 CELF2 1 chr22 47130339-47130459 CERK 2 chr2 233389020-233389049 CHRND 3 chr7 73245708-73245798 CLDN4 4 chr19 51228217-51228732 CLEC11A 5 chr3 139654045-139654132 CLSTN2 6 chr7 155302557-155302639 CNPY1 7 chr6 88875699-88875763 CNR1 8 chr6 88876367-88876445 CNR1 9 chr6 88876701-88876726 CNR1 0 chr2 165698520-165698578 COBLL1 1 chr6 75794978-75795024 COL12A1 2 chr12 48398051-48398093 COL2A1 3 chr12 48398306-48398375 COL2A1 4 chr18 449695-449798 COLEC12 5 chr7 30721980-30722020 CRHR2 6 chr16 84875643-84875772 CRISPLD2 7 chr7 151127086-151127195 CRYGN 8 chr10 126812450-126812653 CTBP2 9 chr20 56089440-56089547 CTCFL 0 chr2 219261190-219261327 CTDSP1 1 chr2 80530326-80530374 CTNNA2 2 chr22 43044555-43044737 CYB5R3 3 chr19 1406516-1406625 DAZAP1 4 chr7 44084171-44084235 DBNL 5 chr11 20178177-20178304 DBX1 6 chr4 151000325-151000356 DCLK2 7 chr4 151000358-151000403 DCLK2 8 chr4 183817058-183817157 DCTD (continuación) N.° de marcador Cromosoma Coordenadas cromosómicas Anotación 9 chr13 52378159-52378202 DHRS12 0 chr8 13014567-13014682 DLC1 1 chr11 84432067-84432186 DLG2 2 chr6 170598276-170598782 DLL1 3 chr19 39989824-39989852 DLL3 4 chr19 12996198-12996321 DNASE2 5 chr2 230578698-230578802 DNER 6 chr2 225907414-225907537 DOCK10 7 chr18 32073971-32074004 DTNA 8 chr2 233352345-233352605 ECEL1 9 chr7 37487539-37488596 ELMO1 00 chr20 39995010-39995051 EMILIN3 01 chr19 48833763-48833967 EMP3 02 chr2 119607676-119607765 EN1 03 chr3 27763358-27763617 EOMES 04 chr3 27763909-27763981 EOMES 05 chr12 132435207-132435428 EP400 06 chr19 16473958-16474095 EPS15L1 07 chr6 152129293-152129450 ESR1 08 chr3 185825887-185826002 ETV5 09 chr9 140201493-140201583 EXD3 10 chr6 133562127-133562229 EYA4 11 chr1 160983607-160983768 F11R 12 chr20 821836-821871 FAM110A 13 chr22 45898798-45898888 FBLN1 14 chr9 97401449-97401602 FBP1 15 chr16 750679-750715 FBXL16 16 chr5 15500208-15500399 FBXL7 17 chr5 15500663-15500852 FBXL7 18 chr5 114880375-114880442 FEM1C 19 chr20 34189488-34189693 FER1L4 20 chr14 53417493-53417618 FERMT2 21 chr2 219849962-219850042 FEV 22 chr17 7339280-7339492 FGF11 23 chr19 49256413-49256451 FGF21 24 chr10 103538848-103539033 FGF8 25 chr11 64008415-64008495 FKBP2 26 chr11 128564106-128564209 FLI1 27 chr10 102985059-102985130 FLJ41350 28 chr13 28674451-28674629 FLT3 29 chr1 240255240-240255264 FMN2 30 chr5 131132146-131132232 FNIP1 31 chr6 108882636-108882682 FOXO3 32 chr3 71478053-71478206 FOXP1 33 chr7 113724864-113725006 FOXP2 34 chr7 113727624-113727693 FOXP2 35 chr5 160975098-160975142 GABRB2 36 chr12 51786085-51786218 GALNT6 37 chr5 179780839-179780955 GFPT2 38 chr20 3641457-3641537 GFRA4 (continuación) N.° de marcador Cromosoma Coordenadas cromosómicas Anotación 39 chr17 4462834-4463034 GGT6 40 chr17 4463796-4464037 GGT6 41 chr17 42907549-42907807 GJC1 42 chr8 144358251-144358266 GL14 43 chr16 4377510-4377615 GLIS2 44 chr12 56881329-56881414 GLS2 45 chr6 24776486-24776667 GMNN 46 chr19 3095019-3095055 GNA11 47 chr22 19710910-19710984 GP1BB 48 chr22 19711364-19711385 GP1BB 49 chr2 131485151-131485219 GPR148 50 chr2 165477564-165477609 GRB14 51 chr2 165477839-165477886 GRB14 52 chr17 73390467-73390597 GRB2 53 chr19 48918266-48918311 GRIN2D 54 chr19 48946755-48946912 GRIN2D 55 chr13 114018369-114018421 GRTP1 56 chr12 13254503-13254606 GSG1 57 chr7 43152309-43152375 HECW1 58 chr7 139440133-139440341 HIPK2 59 chr6 34205664-34206018 HMGA1 60 chr12 121416542-121416670 HNF1A 61 chr20 42984244-42984427 HNF4A 62 chr20 43040031-43040119 HNF4A 63 chr5 177632203-177632260 HNRNPAB 64 chr7 27136030-27136245 HOXA1 65 chr2 176971915-176971968 HOXD11 66 chr19 35540057-35540200 HPN 67 chr2 163174366-163174659 IFIH1 68 chr17 47073421-47073440 IGF2BP1 69 chr11 133797643-133797789 IGSF9B 70 chr7 50343838-50344029 IKZF1 71 chr7 50344414-50344453 IKZF1 72 chr20 20345123-20345150 INSM1 73 chr20 20350520-20350532 INSM1 74 chr15 76632356-76632462 ISL2 75 chr2 182321880-182322022 ITGA4 76 chr2 182322168-182322198 ITGA4 77 chr2 173293542-173293644 ITGA6 78 chr19 2097386-2097437 IZUMO4 79 chr21 27011846-27011964 JAM2 80 chr2 47797260-47797371 KCNK12 81 chr10 79397895-79397945 KCNMA1 82 chr5 113696524-113696682 KCNN2 83 chr5 113696971-113697058 KCNN2 84 chr1 154733071-154733232 KCNN3 85 chr8 99439457-99439482 KCNS2 86 chr19 34287890-34287972 KCTD15 87 chr12 121905558-121905792 KDM2B 88 chr8 136469529-136469873 KHDRBS3 (continuación)
N.° de marcador Cromosoma Coordenadas cromosómicas Anotación
89 chr16 85646495-85646594 KIAA0182
90 chr18 46190841-46190970 KIAA0427
91 chr4 37245694-37245718 KIAA1239
92 chr17 72350351-72350403 KIF19
93 chr2 149633039-149633137 KIF5C
94 chr22 50987245-50987312 KLHDC7B
95 chr12 53298237-53298384 KRT8
96 chr19 54974004-54974086 LENG9
97 chr1 180198528-180198542 LHX4
98 chr19 2290471-2290541 LING03
99 chr11 19733958-19734013 LOC 100126784 00 chr19 58513829-58513851 LOC 100128398 01 chr17 43324999-43325188 LOC100133991 02 chr17 43325784-43325960 LOC100133991 03 chr2 109745715-109745742 LOC 100287216 04 chr1 178063099-178063167 LOC100302401 05 chr12 53447992-53448072 LOC283335
06 chr1 45769962-45770141 LOC400752
07 chr20 61637950-61638000 LOC63930
08 chr13 88323571-88323647 LOC642345
09 chr6 111873064-111873162 LOC643749
10 chr5 87956937-87956996 LOC645323
11 chr5 87970260-87970568 LOC645323
12 chr5 87970751-87970850 LOC645323
13 chr12 85430135-85430175 LRRIQ1
14 chr19 497878-497933 MADCAM1
15 chr5 71404528-71404563 MAP1B
16 chr2 39665069-39665282 MAP4K3
17 chr1 156406057-156406118 MAX.chr1.156406057-156406118
18 chr1 23894874-23894919 MAX.chr1.23894874-23894919
19 chr1 240161479-240161546 MAX.chr1.240161479-240161546
20 chr1 244012804-244012986 MAX.chr1.244012804-244012986
21 chr1 35394690-35394876 MAX.chr1.35394690-35394876
22 chr1 35395179-35395201 MAX.chr1.35395179-35395201
23 chr1 39044345-39044354 MAX.chr1.39044345-39044354
24 chr10 101282185-101282257 MAX.chr10.101282185-101282257
25 chr10 127033272-127033428 MAX.chr10.127033272-127033428
26 chr11 120382450-120382498 MAX.chr11.120382450-120382498
27 chr11 47421719-47421776 MAX.chr11.47421719-47421776
28 chr12 133484978-133485066 MAX.chr12.133484978-133485066
(continuación)
N.° de marcador Cromosoma Coordenadas cromosómicas Anotación
29 chr12 133485702-133485739 MAX.chr12.133485702-133485739
30 chr12 54151078-54151153 MAX.chr12.54151078-54151153
31 chr12 58259413-58259475 MAX.chr12.58259413-58259475
32 chr13 25322044-25322165 MAX.chr13.25322044-25322165
33 chr13 29394692-29394771 MAX.chr13.29394692-29394771
34 chr14 100751586-100751695 MAX.chr14.100751586-100751695
35 chr14 61123624-61123707 MAX.chr14.61123624-61123707
36 chr14 89507100-89507162 MAX.chr14.89507100-89507162
37 chr15 40361431-40361644 MAX.chr15.40361431-40361644
38 chr15 89942904-89943197 MAX.chr15.89942904-89943197
39 chr16 25042924-25043187 MAX.chr16.25042924-25043187
40 chr16 85230248-85230405 MAX.chr16.85230248-85230405
41 chr17 1835463-1835690 MAX.chr17.1835463-1835690 42 chr17 60218266-60218449 MAX.chr17.60218266-60218449
43 chr17 76337726-76337824 MAX.chr17.76337726-76337824
44 chr19 11805543-11805639 MAX.chr19.11805543-11805639
45 chr19 22034747-22034887 MAX.chr19.22034747-22034887
46 chr19 32715650-32715707 MAX.chr19.32715650-32715707
47 chr19 5805881-5805968 MAX.chr19.5805881-5805968 48 chr2 127783183-127783233 MAX.chr2.127783183-127783233
49 chr2 232530964-232531124 MAX.chr2.232530964-232531124
50 chr2 239957125-239957163 MAX.chr2.239957125-239957163
51 chr2 43153331-43153424 MAX.chr2.43153331-43153424
52 chr2 71503632-71503860 MAX.chr2.71503632-71503860
53 chr20 43948422-43948484 MAX.chr20.43948422-43948484
54 chr21 47063798-47063877 MAX.chr21.47063798-47063877
55 chr22 17849540-17849622 MAX.chr22.17849540-17849622
56 chr22 38732124-38732211 MAX.chr22.38732124-38732211
57 chr22 42764974-42765049 MAX.chr22.42764974-42765049 ___________________________________ (continuación)____________________
N.° de marcador Cromosoma Coordenadas cromosómicas Anotación
58 chr22 46974925-46975007 MAX.chr22.46974925-46975007
59 chr22 50342922-50343232 MAX.chr22.50342922-50343232
60 chr3 132273353-132273532 MAX.chr3.132273353-132273532
61 chr3 193858771-193858843 MAX.chr3.193858771-193858843
62 chr3 24563009-24563117 MAX.chr3.24563009-24563117
63 chr3 75411368-75411473 MAX.chr3.75411368-75411473
64 chr4 26828422-26828522 MAX.chr4.26828422-26828522
65 chr4 8965831-8965868 MAX.chr4.8965831-8965868 66 chr5 142100518-142100780 MAX.chr5.142100518-142100780
67 chr6 169613138-169613249 MAX.chr6.169613138-169613249
68 chr6 64168133-64168268 MAX.chr6.64168133-64168268
69 chr7 129794337-129794536 MAX.chr7.129794337-129794536
70 chr7 1705957-1706065 MAX.chr7.1705957-1706065 71 chr7 28893550-28893569 MAX.chr7.28893550-28893569
72 chr7 47650711-47650882 MAX.chr7.47650711-47650882
73 chr7 64408106-64408135 MAX.chr7.64408106-64408135
74 chr9 108418404-108418453 MAX.chr9.108418404-108418453
75 chr9 120507310-120507354 MAX.chr9.120507310-120507354
76 chr5 89769002-89769411 MBLAC2
77 chr12 51319165-51319319 METTL7A
78 chr2 191272534-191272765 MFSD6
79 chr19 6236947-6237089 MLLT1
80 chr6 168333306-168333467 MLLT4
81 chr8 89339567-89339662 MMP16
82 chr17 2300399-2300476 MNT
83 chr7 156802460-156802490 MNX1
84 chr19 4343896-4242968 MPND
85 chr16 56715756-56716025 MT1X
86 chr15 48470062-48470503 MYEF2
87 chr15 48470606-48470725 MYEF2
88 chr5 16936010-16936058 MYO10
89 chr3 39851068-39851989 MYRIP
90 chr13 33001061-33001251 N4BP2L1
91 chr4 2060477-2060624 NAT8L
92 chr12 125002129-125002192 NCOR2
93 chr16 23607524-23607650 NDUFAB1
94 chr10 105338596-105338843 NEURL
(continuación) N.° de marcador Cromosoma Coordenadas cromosómicas Anotación 95 chr1 204797773-204797785 NFASC 96 chr2 233877877-233878027 NGEF 97 chr18 31803017-31803114 NOL4 98 chr9 139438534-139438629 NOTCH1 99 chr5 32714270-32714325 NPR3 00 chr9 127266951-127267032 NR5A1 01 chr11 124615979-124616029 NRGN 02 chr11 124616860-124617005 NRGN 03 chr20 327754-327871 NRSN2 04 chr8 99952501-99952533 OSR2 05 chr5 76926598-76926703 OTP 06 chr3 8809858-8809865 OXTR 07 chr19 14172823-14172948 PALM3 08 chr6 52268531-52268702 PAQR8 09 chr20 21686466-21686563 PAX1 10 chr21 47063793-47064177 PCBP3 11 chr7 100203461-100203600 PCOLCE 12 chr4 657555-657666 PDE6B 13 chr7 544848-545022 PDGFA 14 chr2 239194812-239194946 PER2 15 chr19 43979400-43979435 PHLDB3 16 chr6 144384503-144385539 PLAGL1 17 chr2 28844174-28844270 PLB1 18 chr1 242687719-242687746 PLD5 19 chr12 6419210-6419489 PLEKHG6 20 chr22 50745629-50745727 PLXNB2 21 chr2 105471752-105471787 POU3F3 22 chr13 79177868-79177951 POU4F1 23 chr1 203044913-203044929 PPFIA4 24 chr22 50825886-50825981 PPP6R2 25 chr17 74519328-74519457 PRCD 26 chr7 601162-601552 PRKAR1B 27 chr16 23846964-23847339 PRKCB 28 chr16 23847507-23847617 PRKCB 29 chr16 23847825-23848168 PRKCB 30 chr22 18923785-18923823 PRODH 31 chr22 45099093-45099304 PRR5 32 chr3 9988302-9988499 PRRT3 33 chr1 11538685-11538738 PTCHD2 34 chr1 11539396-11539540 PTCHD2 35 chr10 23480864-23480913 PTF1A 36 chr19 5340273-5340743 PTPRS 37 chr2 1747034-1747126 PXDN 38 chr2 1748338-1748444 PXDN 39 chr7 4923056-4923107 RADIL 40 chr19 15568448-15568639 RASAL3 41 chr5 80256215-80256313 RASGRF2 42 chr17 77179784-77179887 RBFOX3 43 chr4 40516823-40516984 RBM47 44 chr4 57775698-57775771 REST (continuación)
N.° de marcador Cromosoma Coordenadas cromosómicas Anotación 45 chr10 43572798-43572896 RET 46 chr10 121302439-121302501 RGS10 47 chr16 318717-318893 RGS11 48 chr1 241520322-241520334 RGS7 49 chr1 42846119-42846174 RIMKLA 50 chr21 43189031-43189229 RIPK4 51 chr7 5821188-5821283 RNF216 52 chr19 23941063-23941142 RPSAP58 53 chr19 23941384-23941670 RPSAP58 54 chr16 29118636-29118891 RRN3P2 55 chr6 127440492-127441039 RSPO3 56 chr17 42392669-42392701 RUNDC3A 57 chr6 45345446-45345595 RUNX2 58 chr6 45387405-45387456 RUNX2 59 chr3 72496092-72496361 RYBP 60 chr22 20785373-20785464 SCARF2 61 chr8 145561664-145561696 SCRT1 62 chr7 54826636-54826706 SEC61G 63 chr10 38691448-38691521 SEPT7L 64 chr4 154712157-154712232 SFRP2 65 chr7 155597793-155597973 SHH 66 chr4 77610781-77610824 SHROOM3 67 chr21 38120336-38120558 SIM2 68 chr15 68115602-68115675 SKOR1 69 chr17 6949717-6949778 SLC16A11 70 chr11 35441199-35441260 SLC1A2 71 chr19 59025337-59025385 SLC27A5 72 chr2 27486089-27486170 SLC30A3 73 chr12 69140018-69140206 SLC35E3 74 chr12 46661132-46661306 SLC38A1 75 chr3 50243467-50243553 SLC38A3 76 chr7 150760388-150760530 SLC4A2 77 chr5 1445384-1445473 SLC6A3 78 chr2 40679298-40679326 SLC8A1 79 chr5 506178-506343 SLC9A3 80 chr20 61284095-61284194 SLCO4A1 81 chr5 101631546-101631731 SLCO4C1 82 chr10 98945242-98945493 SLIT1 83 chr13 88330094-88330355 SLITRK5 84 chr15 66999854-67000014 SMAD6 85 chr10 112064230-112064280 SMNDC1 86 chr6 84419007-84419072 SNAP91 87 chr17 36508733-36508891 SOCS7 88 chr4 7367687-7367825 SORCS2 89 chr17 70116754-70116823 SOX9 90 chr4 57687746-57687764 SPINK2 91 chr3 140770014-140770193 SPSB4 92 chr17 36762706-36762763 SRCIN1 93 chr6 43141954-43142058 SRF 94 chr7 105029460-105029585 SRPK2 (continuación)
N.° de marcador Cromosoma Coordenadas cromosómicas Anotación 95 chr16 70415312-70415673 ST3GAL2 96 chr2 107502978-107503055 ST6GAL2 97 chr2 107503155-107503391 ST6GAL2 98 chr12 22487528-22487848 ST8SIA1 99 chr10 17496177-17496310 ST8SIA6 00 chr2 242447608-242447724 STK25 01 chr3 120626999-120627116 STXBP5L 02 chr3 33260338-33260423 SUSD5 03 chr16 19179713-19179744 SYT17 04 chr12 115122614-115122632 TBX3 05 chr19 3606372-3606418 TBXA2R 06 chr10 70359250-70359439 TET1 07 chr16 4310204-4310233 TFAP4 08 chr21 32930371-32930409 TIAM1 09 chr4 942190-942382 TMEM175 10 chr6 130686773-130686820 TMEM200a 11 chr6 130687200-130687735 TMEM200a 12 chr3 185215700-185215782 TMEM41A 13 chr20 42544780-42544835 TOX2 14 chr9 140091343-140091644 TPRN 15 chr8 126441476-126441519 TRIB1 16 chr5 14143759-14143880 TRIO 17 chr22 38148620-38148716 TRIOBP 18 chr7 19156788-19157227 TWIST1 19 chr7 19157436-19157533 TWIST1 20 chr4 41259387-41259594 UCHL1 21 chr15 63795401-63795636 USP3 22 chr17 9548120-9548325 USP43 23 chr12 95942077-95942558 USP44 24 chr10 17271896-17271994 VIM 25 chr7 49813135-49814168 VWC2 26 chr7 151078646-151078674 WDR86 27 chr12 49372205-49372274 WNT1 28 chr11 32460759-32460800 WT1 29 chr19 4061206-4061360 ZBTB7A 30 chr8 144623045-144623088 ZC3H3 31 chr2 145274698-145274874 ZEB2 32 chr19 38146299-38146397 ZFP30 33 chr16 88521287-88521377 ZFPM1 34 chr4 2298384-2298498 ZFYVE28 35 chr4 2415252-2415286 ZFYVE28 36 chr20 45986341-45986684 ZMYND8 37 chr22 22862957-22862983 ZNF280B 38 chr6 43336449-43336545 ZNF318 39 chr19 53661819-53662279 ZNF347 40 chr16 88497041-88497148 ZNF469 41 chr19 57019064-57019137 ZNF471 42 chr19 2842178-2842235 ZNF555 43 chr19 37958078-37958134 ZNF570 44 chr8 125985552-125985847 ZNF572 (continuación)
N.° de marcador Cromosoma Coordenadas cromosómicas Anotación
445 chr19 53696101-53696195 ZNF665
446 chr19 53696497-53696704 ZNF665
447 chr19 20149796-20149923 ZNF682
448 chr19 57106617-57106967 ZNF71
449 chr7 6655380-6655652 ZNF853
En la tabla 10, las bases están numeradas de acuerdo con el ensamblaje del genoma humano GRCh37/hg19 de febrero de 2009 (véase, por ejemplo, Rosenbloom y col. (2012) "ENCODE wholegenome data in the UCSC Genome Browser: update 2012" Nucleic Acids Research 40: D912-D917). Los nombres de los marcadores BHLHE23 y LOC63930 se refieren al mismo marcador.
Tabla 11.
Cromosoma Coordenadas cromosómicas Anotación Área bajo la curva ROC chr12 53298237-53298384 KRT8 1,00
chr7 129794337-129794536 MAX.chr7.129794337-129794536 1,00
chr10 101282185-101282257 MAX.chr10.101282185-101282257 0,99
chr10 126812450-126812653 CTBP2 0,99
chr9 116151083-116151315 ALAD 0,99
chr8 13014567-13014682 DLC1 0,99
chr7 139440133-139440341 HIPK2 0,99
chr3 39851068-39851989 MYRIP 0,99
chr19 4061206-4061360 ZBTB7A 0,99
chr16 84875643-84875772 CRISPLD2 0,99
chr6 52268531-52268702 PAQR8 0,99
chr2 239194812-239194946 PER2 0,99
chr17 1835463-1835690 MAX.chr17.1835463-1835690 0,99
chr5 506178-506343 SLC9A3 0,99
chr20 31061389-31061649 C20orf112 0,98
chr9 139438534-139438629 NOTCH 1 0,98
chr15 48470606-48470725 MYEF2 0,98
chr12 125002129-125002192 NCOR2 0,98
chr4 7367687-7367825 SORCS2 0,98
chr19 6236947-6237089 MLLT1 0,98
chr7 544848-545022 PDGFA 0,98
chr7 98029116-98029383 BAIAP2L1 0,98
chr4 2415252-2415286 ZFYVE28 0,98
chr12 6419210-6419489 PLEKHG6 0,98
chr22 50825886-50825981 PPP6R2 0,97
chr20 45986341-45986684 ZMYND8 0,97
chr5 142100518-142100780 MAX.chr5.142100518-142100780 0,97
chr19 16473958-16474095 EPS15L1 0,97
chr16 29118636-29118891 RRN3P2 0,97
chr6 75794978-75795024 COL12A1 0,97
chr9 139735581-139735683 C9orf172 0,97
chr17 4462834-4463034 GGT6 0,97
chr17 4463796-4464037 GGT6 0,96
chr12 95942077-95942558 USP44 0,96
chr20 42984244-42984427 HNF4A 0,96
chr7 47650711-47650882 MAX.chr7.47650711-47650882 0,96
chr4 942190-942382 TMEM175 0,96
(continuación)
Cromosoma Coordenadas cromosómicas Anotación Área bajo la curva ROC chr7 73245708-73245798 CLDN4 0,96
chr22 46974925-46975007 MAX.chr22.46974925-46975007 0,96
chr10 127033272-127033428 MAX.chr10.127033272-127033428 0,96
chr3 132273353-132273532 MAX.chr3.132273353-132273532 0,96
chr4 26828422-26828522 MAX.chr4.26828422-26828522 0,96
chr20 61284095-61284194 SLCO4A1 0,96
chr19 35540057-35540200 HPN 0,96
chr22 45099093-45099304 PRR5 0,95
chr17 60218266-60218449 MAX.chr17.60218266-60218449 0,95
chr6 168333306-168333467 MLLT4 0,95
chr10 105338596-105338843 NEURL 0,95
chr9 120175665-120176057 ASTN2 0,95
chr4 183817058-183817157 DCTD 0,95
chr6 108882636-108882682 FOXO3 0,95
chr7 27136030-27136245 HOXA1 0,95
chr19 14172823-14172948 PALM3 0,95
chr3 75411368-75411473 MAX.chr3.75411368-75411473 0,94
chr6 64168133-64168268 MAX.chr6.64168133-64168268 0,94
chr16 318717-318893 RGS11 0,94
chr20 43040031-43040119 HNF4A 0,94
chr7 49813135-49814168 VWC2 0,94
chr16 85230248-85230405 MAX.chr16.85230248-85230405 0,94
chr22 38148620-38148716 TRIOBP 0,94
chr5 89769002-89769411 MBLAC2 0,94
chr1 158150797-158151205 CD1D 0,93
chr19 1406516-1406625 DAZAP1 0,93
chr12 121416542-121416670 HNF1A 0,93
chr17 76337726-76337824 MAX.chr17.76337726-76337824 0,93
chr13 88330094-88330355 SLITRK5 0,93
chr19 54974004-54974086 LENG9 0,93
chr22 47130339-47130459 CERK 0,92
chr7 601162-601552 PRKAR1B 0,92
chr2 70994498-70994755 ADD2 0,92
chr15 40361431-40361644 MAX.chr15.40361431-40361644 0,92
chr19 15568448-15568639 RASAL3 0,92
chr6 24776486-24776667 GMNN 0,92
chr18 449695-449798 COLEC12 0,92
chr7 150760388-150760530 SLC4A2 0,92
chr21 38120336-38120558 SIM2 0,91
chr15 66999854-67000014 SMAD6 0,91
chr2 28844174-28844270 PLB1 0,91
chr11 115373179-115373281 CADM1 0,91
chr21 47063793-47064177 PCBP3 0,91
chr2 1748338-1748444 PXDN 0,91
chr21 47063798-47063877 MAX.chr21.47063798-47063877 0,91
chr16 56715756-56716025 MT1X 0,90
chr4 87934353-87934488 AFF1 0,90
chr9 140091343-140091644 TPRN 0,90
chr5 15500208-15500399 FBXL7 0,90
(continuación)
Cromosoma Coordenadas cromosómicas Anotación Área bajo la curva ROC chr19 48833763-48833967 EMP3 0,90
chr6 43141954-43142058 SRF 0,90
chr3 185215700-185215782 TMEM41A 0,90
chr1 160983607-160983768 F11R 0,90
chr12 58259413-58259475 MAX.chr12.58259413-58259475 0,90
chr2 47797260-47797371 KCNK12 0,89
chr16 4377510-4377615 GLIS2 0,89
chr15 63795401-63795636 USP3 0,89
chr13 33001061-33001251 N4BP2L1 0,89
chr3 120626999-120627116 STXBP5L 0,89
chr7 19156788-19157227 TWIST1 0,89
chr18 46190841-46190970 KIAA0427 0,89
chr7 100203461-100203600 PCOLCE 0,88
chr19 51228217-51228732 CLEC11A 0,88
chr19 17438929-17438974 ANO8 0,88
chr12 2800756-2800899 CACNA1C 0,88
chr6 34205664-34206018 HMGA1 0,88
chr15 76632356-76632462 ISL2 0,88
chr6 111873064-111873162 LOC643749 0,88
chr10 70359250-70359439 TET1 0,88
chr2 39665069-39665282 MAP4K3 0,88
chr2 43153331-43153424 MAX.chr2.43153331-43153424 0,87
chr22 17849540-17849622 MAX.chr22.17849540-17849622 0,87
chr2 233877877-233878027 NGEF 0,87
chr8 89339567-89339662 MMP16 0,87
chr13 46960767-46961669 C13orf18 0,87
chr6 170598276-170598782 DLL1 0,87
chr4 40516823-40516984 RBM47 0,87
chr3 139654045-139654132 CLSTN2 0,87
chr2 27486089-27486170 SLC30A3 0,87
chr17 74519328-74519457 PRCD 0,86
chr2 163174366-163174659 IFIH1 0,86
chr4 41259387-41259594 UCHL1 0,86
chr7 45613877-45614572 ADCY1 0,86
chr7 98990897-98990989 ARPC1B 0,86
chr3 54156904-54156987 CACNA2D3 0,86
chr16 49316205-49316258 CBLN1 0,86
chr3 71478053-71478206 FOXP1 0,86
chr5 87956937-87956996 LOC645323 0,86
chr21 43189031-43189229 RIPK4 0,86
chr12 22487528-22487848 ST8SIA1 0,86
chr20 42544780-42544835 TOX2 0,86
chr20 821836-821871 FAM110A 0,86
chr16 4310204-4310233 TFAP4 0,86
chr11 64110001-64110069 CCDC88B 0,85
chr8 136469529-136469873 KHDRBS3 0,85
chr10 102985059-102985130 FLJ41350 0,85
chr2 176971915-176971968 HOXD11 0,85
chr12 51319165-51319319 METTL7A 0,85
chr22 50342922-50343232 MAX.chr22.50342922-50343232 0,85
(continuación)
Cromosoma Coordenadas cromosómicas Anotación Área bajo la curva ROC chr7 155597793-155597973 SHH 0,85
chr4 154712157-154712232 SFRP2 0,84
chr19 57019064-57019137 ZNF471 0,84
chr5 87970260-87970568 LOC645323 0,84
chr6 130686773-130686820 TMEM200a 0,84
chr9 140201493-140201583 EXD3 0,84
chr12 53447992-53448072 LOC283335 0,84
chr22 43044555-43044737 CYB5R3 0,84
chr19 49256413-49256451 FGF21 0,84
chr17 77810085-77810206 CBX4 0,84
chr7 156802460-156802490 MNX1 0,84
chr7 151127086-151127195 CRYGN 0,83
chr6 169613138-169613249 MAX.chr6.169613138-169613249 0,83
chr2 71503632-71503860 MAX.chr2.71503632-71503860 0,83
chr20 21686466-21686563 PAX1 0,83
chr2 173293542-173293644 ITGA6 0,83
chr7 87229775-87229856 ABCB1 0,83
chr2 207307687-207307794 ADAM23 0,83
chr12 21680381-21680438 C12orf39 0,83
chr15 89942904-89943197 MAX.chr15.89942904-89943197 0,83
chr10 43572798-43572896 RET 0,83
chr19 5805881-5805968 MAX.chr19.5805881-5805968 0,83
chr19 53661819-53662279 ZNF347 0,83
chr22 38732124-38732211 MAX.chr22.38732124-38732211 0,83
chr11 124615979-124616029 NRGN 0,83
chr2 100720494-100720679 AFF3 0,83
chr19 497878-497933 MADCAM1 0,82
chr5 14143759-14143880 TRIO 0,82
chr18 32073971-32074004 DTNA 0,82
chr15 48470062-48470503 MYEF2 0,82
chr3 50243467-50243553 SLC38A3 0,82
chr16 70415312-70415673 ST3GAL2 0,82
chr11 35441199-35441260 SLC1A2 0,82
chr12 51786085-51786218 GALNT6 0,82
chr2 232530964-232531124 MAX.chr2.232530964-232531124 0,81
chr22 19710910-19710984 GP1BB 0,81
chr19 2097386-2097437 IZUMO4 0,81
chr11 20178177-20178304 DBX1 0,81
chr7 37487539-37488596 ELMO1 0,81
chr11 128564106-128564209 FLI1 0,81
chr7 105029460-105029585 SRPK2 0,81
chr10 103538848-103539033 FGF8 0,81
chr11 124616860-124617005 NRGN 0,81
chr19 57106617-57106967 ZNF71 0,81
chr9 97401449-97401602 FBP1 0,81
chr5 113696971-113697058 KCNN2 0,80
chr19 53696497-53696704 ZNF665 0,80
chr1 45769962-45770141 LOC400752 0,80
chr14 91883473-91883674 CCDC88C 0,80
chr17 43324999-43325188 LOC100133991 0,80
(continuación)
Cromosoma Coordenadas cromosómicas Anotación Área bajo la curva ROC chr16 23846964-23847339 PRKCB 0,80
chr19 11805543-11805639 MAX.chr19.11805543-11805639 0,80
chr12 117174873-117175030 C12orf49 0,80
chr20 39995010-39995051 EMILIN3 0,80
chr5 87970751-87970850 LOC645323 0,80
chr7 4923056-4923107 RADIL 0,80
chr19 23941063-23941142 RPSAP58 0,80
chr6 45387405-45387456 RUNX2 0,80
chr17 6949717-6949778 SLC16A11 0,80
chr2 165477564-165477609 GRB14 0,80
chr20 34189488-34189693 FER1L4 0,80
chr22 50745629-50745727 PLXNB2 0,79
chr7 155302557-155302639 CNPY1 0,79
chr7 19157436-19157533 TWIST1 0,79
chr1 203619509-203619829 ATP2B4 0,79
chr2 230578698-230578802 DNER 0,79
chr19 23941384-23941670 RPSAP58 0,79
chr17 73390467-73390597 GRB2 0,79
chr15 68115602-68115675 SKOR1 0,79
chr17 2300399-2300476 MNT 0,79
chr13 79177868-79177951 POU4F1 0,79
chr19 59025337-59025385 SLC27A5 0,79
chr9 135462730-135462765 BARHL1 0,78
chr8 125985552-125985847 ZNF572 0,78
chr5 175665232-175665311 C5orf25 0,78
chr6 42858890-42859092 C6orf226 0,78
chr12 21680681-21680817 C12orf39 0,78
chr14 50099743-50099930 C14orf104 0,78
chr5 175969660-175969699 CDHR2 0,78
chr16 80837397-80837505 CDYL2 0,78
chr19 12996198-12996321 DNASE2 0,78
chr13 28674451-28674629 FLT3 0,78
chr1 154733071-154733232 KCNN3 0,78
chr1 35395179-35395201 MAX.chr1.35395179-35395201 0,78
chr19 5340273-5340743 PTPRS 0,78
chr3 33260338-33260423 SUSD5 0,78
chr2 145274698-145274874 ZEB2 0,78
chr13 25322044-25322165 MAX.chr13.25322044-25322165 0,78
chr2 80530326-80530374 CTNNA2 0,78
chr12 56881329-56881414 GLS2 0,78
chr3 24563009-24563117 MAX.chr3.24563009-24563117 0,78
chr7 6655380-6655652 ZNF853 0,78
chr4 2298384-2298498 ZFYVE28 0,77
chr5 177632203-177632260 HNRNPAB 0,77
chr22 19711364-19711385 GP1BB 0,77
chr2 165477839-165477886 GRB14 0,77
chr13 29394692-29394771 MAX.chr13.29394692-29394771 0,77
chr14 103396870-103396920 AMN 0,77
chr12 132435207-132435428 EP400 0,77
chr8 99439457-99439482 KCNS2 0,77
(continuación)
Cromosoma Coordenadas cromosómicas Anotación Área bajo la curva ROC chr7 5821188-5821283 RNF216 0,77
chr17 9548120-9548325 USP43 0,77
chr3 185825887-185826002 ETV5 0,77
chr12 121905558-121905792 KDM2B 0,77
chr3 193858771-193858843 MAX.chr3.193858771-193858843 0,77
chr19 53696101-53696195 ZNF665 0,77
chr7 69062853-69062972 AUTS2 0,77
chr1 242687719-242687746 PLD5 0,76
chr20 43948422-43948484 MAX.chr20.43948422-43948484 0,76
chr6 84419007-84419072 SNAP91 0,76
chr17 43325784-43325960 LOC100133991 0,76
chr19 41224781-41225006 ADCK4 0,76
chr5 15500663-15500852 FBXL7 0,76
chr20 20350520-20350532 INSM1 0,76
chr1 23894874-23894919 MAX.chr1.23894874-23894919 0,76
chr1 11538685-11538738 PTCHD2 0,76
chr14 105190863-105191031 ADSSL1 0,76
chr22 22862957-22862983 ZNF280B 0,76
chr17 72350351-72350403 KIF19 0,76
chr7 50343838-50344029 IKZF1 0,76
chr2 191272534-191272765 MFSD6 0,76
chr17 47073421-47073440 IGF2BP1 0,76
chr10 133795124-133795423 BNIP3 0,75
chr5 101631546-101631731 SLCO4C1 0,75
chr12 133485702-133485739 MAX.chr12.133485702-133485739 0,75
chr22 18923785-18923823 PRODH 0,75
chr20 56089440-56089547 CTCFL 0,75
chr6 43336449-43336545 ZNF318 0,75
chr14 61123624-61123707 MAX.chr14.61123624-61123707 0,75
chr7 30721980-30722020 CRHR2 0,75
chr17 7339280-7339492 FGF11 0,75
chr11 84432067-84432186 DLG2 0,75
chr2 233352345-233352605 ECEL1 0,75
chr3 27763358-27763617 EOMES 0,75
chr5 160975098-160975142 GABRB2 0,75
chr1 244012804-244012986 MAX.chr1.244012804-244012986 0,75
chr16 25042924-25043187 MAX.chr16.25042924-25043187 0,75
chr4 57775698-57775771 REST 0,75
chr6 127440492-127441039 RSPO3 0,75
chr8 145561664-145561696 SCRT1 0,75
chr8 144623045-144623088 ZC3H3 0,75
chr12 48398051-48398093 COL2A1 0,75
chr2 182321880-182322022 ITGA4 0,75
chr9 120507310-120507354 MAX.chr9.120507310-120507354 0,74
chr6 133562127-133562229 EYA4 0,74
chr2 127783183-127783233 MAX.chr2.127783183-127783233 0,74
chr11 47421719-47421776 MAX.chr11.47421719-47421776 0,74
chr19 10206736-10206757 ANGPTL6 0,74
chr2 225907414-225907537 DOCK10 0,74
chrl 35394690-35394876 MAX.chr1.35394690-35394876 0,74
(continuación)
Cromosoma Coordenadas cromosómicas Anotación Área bajo la curva ROC chr4 2060477-2060624 NAT8L 0,74
chr2 1747034-1747126 PXDN 0,74
chr6 45345446-45345595 RUNX2 0,74
chr7 50344414-50344453 IKZF1 0,74
chr1 180198528-180198542 LHX4 0,74
chr14 53417493-53417618 FERMT2 0,74
chr17 77179784-77179887 RBFOX3 0,74
chr10 98945242-98945493 SLIT1 0,74
chr2 40679298-40679326 SLC8A1 0,74
chr12 48398306-48398375 COL2A1 0,74
chr22 50987245-50987312 KLHDC7B 0,73
chr12 54151078-54151153 MAX.chr12.54151078-54151153 0,73
chr7 28893550-28893569 MAX.chr7.28893550-28893569 0,73
chr10 38691448-38691521 SEPT7L 0,73
chr1 203044913-203044929 PPFIA4 0,73
chr22 51066374-51066431 ARSA 0,73
chr7 113724864-113725006 FOXP2 0,73
chr12 13254503-13254606 GSG1 0,73
chr11 19733958-19734013 LOC100126784 0,73
chr1 39044345-39044354 MAX.chr1.39044345-39044354 0,73
chr3 9988302-9988499 PRRT3 0,73
chr22 20785373-20785464 SCARF2 0,73
chr6 130687200-130687735 TMEM200a 0,73
chr12 46661132-46661306 SLC38A1 0,73
chr19 20149796-20149923 ZNF682 0,73
chr11 133797643-133797789 IGSF9B 0,73
chr2 105471752-105471787 POU3F3 0,72
chr5 179780839-179780955 GFPT2 0,72
chr8 99952501-99952533 OSR2 0,72
chr19 16772631-16772712 C19orf42 0,72
chr2 119607676-119607765 EN1 0,72
chr12 49372205-49372274 WNT1 0,72
chr5 113696524-113696682 KCNN2 0,72
chr17 8649567-8649665 CCDC42 0,72
chr7 1705957-1706065 MAX.chr7.1705957-1706065 0,71
chr2 149633039-149633137 KIF5C 0,71
chr19 2842178-2842235 ZNF555 0,71
chr10 121302439-121302501 RGS10 0,71
chr21 44495919-44495933 CBS 0,71
chr10 11059508-11060151 CELF2 0,71
chr19 48946755-48946912 GRIN2D 0,71
chr12 133484978-133485066 MAX.chr12.133484978-133485066 0,71
chr5 16936010-16936058 MYO10 0,71
chr17 42392669-42392701 RUNDC3A 0,71
chr16 88521287-88521377 ZFPM1 0,71
chr4 37245694-37245718 KIAA1239 0,71
chr16 23847507-23847617 PRKCB 0,71
chr5 76926598-76926703 OTP 0,71
chr18 31803017-31803114 NOL4 0,71
chr2 182322168-182322198 ITGA4 0,70
(continuación)
Cromosoma Coordenadas cromosómicas Anotación Área bajo la curva ROC chr15 90358267-90358400 ANPEP 0,70
chr12 107715014-107715095 BTBD11 0,70
chr16 89007413-89007432 CBFA2T3 0,70
chr4 151000325-151000356 DCLK2 0,70
chr6 152129293-152129450 ESR1 0,70
chr19 38146299-38146397 ZFP30 0,70
chr1 204797773-204797785 NFASC 0,70
chr22 42764974-42765049 MAX.chr22.42764974-42765049 0,70
chr2 165698520-165698578 COBLL1 0,70
chr8 144358251-144358266 GLI4 0,70
chr2 219261190-219261327 CTDSP1 0,70
chr2 239957125-239957163 MAX.chr2.239957125-239957163 0,70
chr10 121411207-121411375 BAG3 0,69
chr2 233389020-233389049 CHRND 0,69
chr14 99946756-99946806 CCNK 0,69
chr11 120382450-120382498 MAX.chr11.120382450-120382498 0,69
chr16 750679-750715 FBXL16 0,69
chr15 100881373-100881437 ADAMTS17 0,69
chr1 11539396-11539540 PTCHD2 0,69
chr2 242447608-242447724 STK25 0,69
chr16 23847825-23848168 PRKCB 0,69
chr17 42907549-42907807 GJC1 0,69
chr19 48918266-48918311 GRIN2D 0,69
chr10 79397895-79397945 KCNMA1 0,69
chr5 71404528-71404563 MAP1B 0,69
chr19 43979400-43979435 PHLDB3 0,69
chr17 70116754-70116823 SOX9 0,69
chr16 88497041-88497148 ZNF469 0,69
chr2 131485151-131485219 GPR148 0,69
chr8 126441476-126441519 TRIB1 0,68
chr4 151000358-151000403 DCLK2 0,68
chr19 39989824-39989852 DLL3 0,68
chr14 89507100-89507162 MAX.chr14.89507100-89507162 0,68
chr12 115122614-115122632 TBX3 0,68
chr19 58513829-58513851 LOC100128398 0,68
chr5 32714270-32714325 NPR3 0,68
chr3 140770014-140770193 SPSB4 0,68
chr6 88875699-88875763 CNR1 0,68
chr4 657555-657666 PDE6B 0,68
chr16 19179713-19179744 SYT17 0,67
chr3 8809858-8809865 OXTR 0,67
chr10 116064516-116064600 AFAP1L2 0,67
chr4 77610781-77610824 SHROOM3 0,67
chr6 88876367-88876445 CNR1 0,67
chr7 151078646-151078674 WDR86 0,67
chr2 109745715-109745742 LOC100287216 0,67
chr14 100751586-100751695 MAX.chr14.100751586-100751695 0,67
chr21 32930371-32930409 TIAM1 0,67
chr4 57687746-57687764 SPINK2 0,67
chr2 219849962-219850042 FEV 0,66
(continuación)
Cromosoma Coordenadas cromosómicas Anotación Área bajo la curva ROC chr20 327754-327871 NRSN2 0,66
chr1 178063099-178063167 LOC100302401 0,66
chr19 45430362-45430458 APOC1P1 0,66
chr13 111767862-111768355 ARHGEF7 0,66
chr19 37958078-37958134 ZNF570 0,66
chr19 32715650-32715707 MAX.chr1 9.32715650-32715707 0,66
chr8 104152963-104152974 BAALC 0,66
chr19 3095019-3095055 GNA11 0,66
chr19 3606372-3606418 TBXA2R 0,66
chr12 69140018-69140206 SLC35E3 0,66
chr4 8965831-8965868 MAX.chr4.8965831-8965868 0,66
chr17 36508733-36508891 SOCS7 0,66
chr16 85646495-85646594 KIAA0182 0,65
chr7 54826636-54826706 SEC61G 0,65
chr9 108418404-108418453 MAX.chr9.108418404-108418453 0,65
chr7 64408106-64408135 MAX.chr7.64408106-64408135 0,65
chr10 21816267-21816490 C10orf140 0,65
chr7 39989959-39990020 CDK13 0,65
chr1 240255240-240255264 FMN2 0,65
chr13 114018369-114018421 GRTP1 0,65
chr13 88323571-88323647 LOC642345 0,65
chr5 80256215-80256313 RASGRF2 0,65
chr10 112064230-112064280 SMNDC1 0,65
chr12 85430135-85430175 LRRIQ1 0,65
chr1 241520322-241520334 RGS7 0,65
chr19 22034747-22034887 MAX.chr19.22034747-22034887 0,65
chr21 27011846-27011964 JAM2 0,65
chr11 64052053-64052132 BAD 0,65
chr1 42846119-42846174 RIMKLA 0,64
chr10 17271896-17271994 VIM 0,64
chr13 52378159-52378202 DHRS12 0,63
chr3 27763909-27763981 EOMES 0,63
chr7 100136884-100137350 AGFG2 0,62
chr6 88876701-88876726 CNR1 0,62
chr19 2290471-2290541 LINGO3 0,62
chr6 105584524-105584800 BVES 0,61
chr16 23607524-23607650 NDUFAB1 0,61
chr11 64008415-64008495 FKBP2 0,60
chr20 3641457-3641537 GFRA4 0,59
chr19 4343896-4242968 MPND 0,59
chr2 107503155-107503391 ST6GAL2 0,59
chr1 240161479-240161546 MAX.chr1.240161479-240161546 0,57
chr6 144384503-144385539 PLAGL1 0,57
chr3 72496092-72496361 RYBP 0,57
chr5 131132146-131132232 FNIP1 0,55
chr17 36762706-36762763 SRCIN1 0,55
chr11 32460759-32460800 WT1 0,55
chr9 127266951-127267032 NR5A1 0,53
chr7 44084171-44084235 DBNL 0,46
chr15 29131299-29131369 APBA2 0,44

Claims (8)

REIVINDICACIONES
1. Procedimiento de detección de una neoplasia en una muestra obtenida de un sujeto, comprendiendo el procedimiento:
1) analizar un estado de metilación de un marcador en una muestra obtenida de un sujeto; y
2) identificar que el sujeto tiene una neoplasia cuando el estado de metilación del marcador es diferente al estado de metilación del marcador analizado en un sujeto que no tiene una neoplasia,
en el que una región cromosómica que tiene una anotación de CD1D comprende el marcador,
en el que el marcador comprende una base en una región diferencialmente metilada (DMR) 27, y
en el que la neoplasia es una neoplasia de páncreas.
2. Procedimiento según la reivindicación 1 que comprende además ubicar el sitio de la neoplasia dentro del sujeto, en el que el estado de metilación del marcador indica el sitio de la neoplasia dentro del sujeto.
3. Procedimiento según la reivindicación 1 que comprende analizar una pluralidad de marcadores.
4. Procedimiento según la reivindicación 1 en el que el análisis del estado de metilación del marcador en la muestra comprende determinar el estado de metilación de una o más bases.
5. Procedimiento según la reivindicación 1 en el que el estado de metilación del marcador comprende una metilación aumentada o disminuida del marcador en relación con un estado de metilación normal del marcador o un patrón de metilación diferente del marcador en relación con un estado de metilación normal del marcador.
6. Procedimiento según la reivindicación 1 en el que la muestra es una muestra de heces, una muestra de tejido, una muestra de jugo pancreático, una muestra de líquido de un quiste pancreático, una muestra de sangre o una muestra de orina.
7. Procedimiento según la reivindicación 1 en el que el análisis comprende usar una reacción en cadena de la polimerasa específica de metilación, secuenciación de ácido nucleico, espectrometría de masas, nucleasa específica de metilación, separación basada en masa o captura de dianas.
8. Procedimiento según la reivindicación 6 en el que el tejido es tejido esofágico o tejido pancreático.
ES19150809T 2013-03-14 2014-03-12 Detección de neoplasia Active ES2859645T3 (es)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
US201361784429P 2013-03-14 2013-03-14

Publications (1)

Publication Number Publication Date
ES2859645T3 true ES2859645T3 (es) 2021-10-04

Family

ID=51529812

Family Applications (3)

Application Number Title Priority Date Filing Date
ES14776150T Active ES2712798T3 (es) 2013-03-14 2014-03-12 Detección de neoplasias
ES19150809T Active ES2859645T3 (es) 2013-03-14 2014-03-12 Detección de neoplasia
ES21157412T Active ES2947873T3 (es) 2013-03-14 2014-03-12 Detección de neoplasias

Family Applications Before (1)

Application Number Title Priority Date Filing Date
ES14776150T Active ES2712798T3 (es) 2013-03-14 2014-03-12 Detección de neoplasias

Family Applications After (1)

Application Number Title Priority Date Filing Date
ES21157412T Active ES2947873T3 (es) 2013-03-14 2014-03-12 Detección de neoplasias

Country Status (7)

Country Link
US (6) US9994911B2 (es)
EP (4) EP4234721A3 (es)
CN (2) CN118028467A (es)
AU (1) AU2014244608B2 (es)
CA (1) CA2902916C (es)
ES (3) ES2712798T3 (es)
WO (2) WO2014159650A2 (es)

Families Citing this family (43)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
ES2633111T3 (es) 2010-03-26 2017-09-19 Hongzhi Zou Métodos y materiales para detectar neoplasia colorrectal
US20130282390A1 (en) * 2012-04-20 2013-10-24 International Business Machines Corporation Combining knowledge and data driven insights for identifying risk factors in healthcare
CN118028467A (zh) 2013-03-14 2024-05-14 梅奥医学教育和研究基金会 检测赘生物
EP3029148B1 (en) * 2013-07-30 2018-06-27 BGI Genomics Co., Limited Method for determining nucleic acid composition of nucleic acid mixture
EP3126529B1 (en) 2014-03-31 2020-05-27 Mayo Foundation for Medical Education and Research Detecting colorectal neoplasm
US10184154B2 (en) 2014-09-26 2019-01-22 Mayo Foundation For Medical Education And Research Detecting cholangiocarcinoma
CA3183545A1 (en) 2014-12-12 2016-06-16 Exact Sciences Corporation Compositions and methods for performing methylation detection assays
WO2016094839A2 (en) 2014-12-12 2016-06-16 Exact Sciences Corporation Compositions and methods for performing methylation detection assays
WO2016109284A1 (en) * 2014-12-29 2016-07-07 The Regents Of The University Of Michigan Biomarkers for predicting responsiveness to decitabine therapy
US10030272B2 (en) 2015-02-27 2018-07-24 Mayo Foundation For Medical Education And Research Detecting gastrointestinal neoplasms
EP3274477B1 (en) * 2015-03-27 2021-06-09 The Johns Hopkins University Method of identifying risk for autism
CN115927612A (zh) * 2015-03-27 2023-04-07 精密科学公司 检测食管疾病
KR20180081042A (ko) * 2015-08-31 2018-07-13 메이오 파운데이션 포 메디칼 에쥬케이션 앤드 리써치 위 신생물 검출 방법
CA3002196C (en) 2015-10-30 2024-05-14 Exact Sciences Development Company, Llc Multiplex amplification detection assay and isolation and detection of dna from plasma
CN106222169A (zh) * 2015-12-13 2016-12-14 周平 长链非编码rna apoc1p1-3基因及其用途
US10370726B2 (en) 2016-04-14 2019-08-06 Mayo Foundation For Medical Education And Research Detecting colorectal neoplasia
WO2017180886A1 (en) * 2016-04-14 2017-10-19 Mayo Foundation For Medical Education And Research Detecting pancreatic high-grade dysplasia
CA3029866A1 (en) * 2016-07-06 2018-01-11 Case Western Reserve University Methods and compositions for detecting esophageal neoplasias and/or metaplasias in the esophagus
EP4293128A3 (en) * 2016-09-02 2024-03-20 Mayo Foundation for Medical Education and Research Detecting hepatocellular carcinoma
CA3049459A1 (en) * 2017-01-27 2018-08-02 Exact Sciences Development Company, Llc Detection of colon neoplasia by analysis of methylated dna
US10783262B2 (en) 2017-02-03 2020-09-22 Adobe Inc. Tagging documents with security policies
CA3054836A1 (en) 2017-02-28 2018-09-07 Mayo Foundation For Medical Education And Research Detecting prostate cancer
CN106947822B (zh) * 2017-04-12 2020-04-10 广州市康立明生物科技有限责任公司 Itga4基因甲基化检测试剂、试剂盒及检测方法
AU2018374176A1 (en) * 2017-11-30 2020-06-11 Exact Sciences Corporation Detecting breast cancer
CN110511997A (zh) * 2018-05-22 2019-11-29 广州市康立明生物科技有限责任公司 肿瘤标志物、甲基化试剂、试剂盒及其应用
EP3856903A4 (en) 2018-09-27 2022-07-27 Grail, LLC METHYLATION MARKER AND TARGETED METHYLATION PROBE PANEL
AU2019200359A1 (en) * 2019-01-18 2020-09-10 Clinical Genomics Pty Ltd Screening method
EP3914733A4 (en) * 2019-01-24 2023-05-17 Mayo Foundation for Medical Education and Research ENDOMETRIAL CANCER DETECTION
CN113811622A (zh) * 2019-04-03 2021-12-17 梅约医学教育与研究基金会 在血浆中检测胰腺导管腺癌
WO2020210754A1 (en) 2019-04-10 2020-10-15 University Of Pittsburgh - Of The Commonwealth System Of Higher Education Computational filtering of methylated sequence data for predictive modeling
AU2020274348A1 (en) * 2019-05-13 2021-12-09 Grail, Llc Model-based featurization and classification
EP3976830A1 (en) * 2019-05-29 2022-04-06 Université de Paris Detection of hypermethylated genes for diagnosing pancreatic cancer
US11001898B2 (en) 2019-05-31 2021-05-11 Universal Diagnostics, S.L. Detection of colorectal cancer
US11396679B2 (en) 2019-05-31 2022-07-26 Universal Diagnostics, S.L. Detection of colorectal cancer
US11898199B2 (en) 2019-11-11 2024-02-13 Universal Diagnostics, S.A. Detection of colorectal cancer and/or advanced adenomas
WO2021097302A1 (en) * 2019-11-13 2021-05-20 University Of South Florida Systems and methods of deep learning for colorectal polyp screening
EP4127215A1 (en) * 2020-03-31 2023-02-08 Freenome Holdings, Inc. Methods and systems for detecting colorectal cancer via nucleic acid methylation analysis
WO2022002424A1 (en) 2020-06-30 2022-01-06 Universal Diagnostics, S.L. Systems and methods for detection of multiple cancer types
US11821045B2 (en) 2021-04-13 2023-11-21 Geninus Inc. Colorectal cancer-specific methylation biomarkers for diagnosing colorectal cancer
CA3236697A1 (en) * 2021-11-05 2023-05-11 William R. Taylor Compositions and methods for detecting oropharyngeal cancer
EP4299764A1 (en) * 2022-06-28 2024-01-03 Universal Diagnostics, S.A. Methods for detecting pancreatic cancer using dna methylation markers
CN115424666B (zh) * 2022-09-13 2023-07-11 江苏先声医学诊断有限公司 一种基于全基因组重亚硫酸盐测序数据筛选泛癌早筛分子标志物的方法及系统
WO2024112806A1 (en) * 2022-11-21 2024-05-30 Moonwalk Biosciences, Inc. Generation and use of epigenetic maps for drug discovery

Family Cites Families (112)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5288609A (en) 1984-04-27 1994-02-22 Enzo Diagnostics, Inc. Capture sandwich hybridization method and composition
US4683195A (en) 1986-01-30 1987-07-28 Cetus Corporation Process for amplifying, detecting, and/or-cloning nucleic acid sequences
US4965188A (en) 1986-08-22 1990-10-23 Cetus Corporation Process for amplifying, detecting, and/or cloning nucleic acid sequences using a thermostable enzyme
US4683202A (en) 1985-03-28 1987-07-28 Cetus Corporation Process for amplifying nucleic acid sequences
US5011769A (en) 1985-12-05 1991-04-30 Meiogenics U.S. Limited Partnership Methods for detecting nucleic acid sequences
US5541308A (en) 1986-11-24 1996-07-30 Gen-Probe Incorporated Nucleic acid probes for detection and/or quantitation of non-viral organisms
US5359100A (en) 1987-10-15 1994-10-25 Chiron Corporation Bifunctional blocked phosphoramidites useful in making nucleic acid mutimers
US5124246A (en) 1987-10-15 1992-06-23 Chiron Corporation Nucleic acid multimers and amplified nucleic acid hybridization assays using same
US5403711A (en) 1987-11-30 1995-04-04 University Of Iowa Research Foundation Nucleic acid hybridization and amplification method for detection of specific sequences in which a complementary labeled nucleic acid probe is cleaved
CA1340807C (en) 1988-02-24 1999-11-02 Lawrence T. Malek Nucleic acid amplification process
US5639611A (en) 1988-12-12 1997-06-17 City Of Hope Allele specific polymerase chain reaction
US5362623A (en) 1991-06-14 1994-11-08 The John Hopkins University Sequence specific DNA binding by p53
US6800617B1 (en) 1989-03-29 2004-10-05 The Johns Hopkins University Methods for restoring wild-type p53 gene function
US5527676A (en) 1989-03-29 1996-06-18 The Johns Hopkins University Detection of loss of the wild-type P53 gene and kits therefor
US6677312B1 (en) 1989-03-29 2004-01-13 The Johns Hopkins University Methods for restoring wild-type p53 gene function
CA2036946C (en) 1990-04-06 2001-10-16 Kenneth V. Deugau Indexing linkers
US5494810A (en) 1990-05-03 1996-02-27 Cornell Research Foundation, Inc. Thermostable ligase-mediated DNA amplifications system for the detection of genetic disease
US5849481A (en) 1990-07-27 1998-12-15 Chiron Corporation Nucleic acid hybridization assays employing large comb-type branched polynucleotides
US5352775A (en) 1991-01-16 1994-10-04 The Johns Hopkins Univ. APC gene and nucleic acid probes derived therefrom
US5846717A (en) 1996-01-24 1998-12-08 Third Wave Technologies, Inc. Detection of nucleic acid sequences by invader-directed cleavage
US5994069A (en) 1996-01-24 1999-11-30 Third Wave Technologies, Inc. Detection of nucleic acids by multiple sequential invasive cleavages
US6872816B1 (en) 1996-01-24 2005-03-29 Third Wave Technologies, Inc. Nucleic acid detection kits
US5338671A (en) 1992-10-07 1994-08-16 Eastman Kodak Company DNA amplification with thermostable DNA polymerase and polymerase inhibiting antibody
SE501439C2 (sv) 1993-06-22 1995-02-13 Pharmacia Lkb Biotech Sätt och anordning för analys av polynukleotidsekvenser
US6235470B1 (en) 1993-11-12 2001-05-22 The Johns Hopkins University School Of Medicine Detection of neoplasia by analysis of saliva
WO1995014106A2 (en) 1993-11-17 1995-05-26 Id Biomedical Corporation Cycling probe cleavage detection of nucleic acid sequences
EP0734436B1 (en) 1993-11-30 1999-04-14 McGILL UNIVERSITY Inhibition of dna methyltransferase
JPH09512428A (ja) 1994-04-25 1997-12-16 アビテック ディアゴノスティックス インク リゾルベース開裂による突然変異の検出
US5851770A (en) 1994-04-25 1998-12-22 Variagenics, Inc. Detection of mismatches by resolvase cleavage using a magnetic bead support
EP0842294B1 (en) 1994-12-23 2002-10-23 Dade Behring Inc. Detection of nucleic acids by nuclease-catalyzed product formation
US5882867A (en) 1995-06-07 1999-03-16 Dade Behring Marburg Gmbh Detection of nucleic acids by formation of template-dependent product
US5773258A (en) 1995-08-25 1998-06-30 Roche Molecular Systems, Inc. Nucleic acid amplification using a reversibly inactivated thermostable enzyme
US5854033A (en) 1995-11-21 1998-12-29 Yale University Rolling circle replication reporter systems
US5965408A (en) 1996-07-09 1999-10-12 Diversa Corporation Method of DNA reassembly by interrupting synthesis
US5914230A (en) 1995-12-22 1999-06-22 Dade Behring Inc. Homogeneous amplification and detection of nucleic acids
US5670325A (en) 1996-08-14 1997-09-23 Exact Laboratories, Inc. Method for the detection of clonal populations of transformed cells in a genomically heterogeneous cellular sample
US5985557A (en) 1996-01-24 1999-11-16 Third Wave Technologies, Inc. Invasive cleavage of nucleic acids
US5741650A (en) 1996-01-30 1998-04-21 Exact Laboratories, Inc. Methods for detecting colon cancer from stool samples
US5891651A (en) 1996-03-29 1999-04-06 Mayo Foundation For Medical Education And Research Methods of recovering colorectal epithelial cells or fragments thereof from stool
EP0892808B1 (en) 1996-04-12 2008-05-14 PHRI Properties, Inc. Detection probes, kits and assays
US6017704A (en) 1996-06-03 2000-01-25 The Johns Hopkins University School Of Medicine Method of detection of methylated nucleic acid using agents which modify unmethylated cytosine and distinguishing modified methylated and non-methylated nucleic acids
US5786146A (en) 1996-06-03 1998-07-28 The Johns Hopkins University School Of Medicine Method of detection of methylated nucleic acid using agents which modify unmethylated cytosine and distinguishing modified methylated and non-methylated nucleic acids
US5928870A (en) 1997-06-16 1999-07-27 Exact Laboratories, Inc. Methods for the detection of loss of heterozygosity
US6020137A (en) 1996-08-14 2000-02-01 Exact Laboratories, Inc. Methods for the detection of loss of heterozygosity
US5952178A (en) 1996-08-14 1999-09-14 Exact Laboratories Methods for disease diagnosis from stool samples
US6096273A (en) 1996-11-05 2000-08-01 Clinical Micro Sensors Electrodes linked via conductive oligomers to nucleic acids
US6251594B1 (en) 1997-06-09 2001-06-26 Usc/Norris Comprehensive Cancer Ctr. Cancer diagnostic method based upon DNA methylation differences
US6013459A (en) 1997-06-12 2000-01-11 Clinical Micro Sensors, Inc. Detection of analytes using reorganization energy
DE19754482A1 (de) 1997-11-27 1999-07-01 Epigenomics Gmbh Verfahren zur Herstellung komplexer DNA-Methylierungs-Fingerabdrücke
US6063573A (en) 1998-01-27 2000-05-16 Clinical Micro Sensors, Inc. Cycling probe technology using electron transfer detection
WO1999040222A1 (en) 1998-02-04 1999-08-12 Variagenics, Inc. Mismatch detection techniques
US6235502B1 (en) 1998-09-18 2001-05-22 Molecular Staging Inc. Methods for selectively isolating DNA using rolling circle amplification
US7700324B1 (en) 1998-11-03 2010-04-20 The Johns Hopkins University School Of Medicine Methylated CpG island amplification (MCA)
US6335193B1 (en) 1999-04-15 2002-01-01 Padmanabhan P Nair Isolated colonocytes
WO2001042781A2 (en) 1999-12-07 2001-06-14 Exact Sciences Corporation Supracolonic aerodigestive neoplasm detection
EP1294947A2 (en) 2000-06-30 2003-03-26 Epigenomics AG Method and nucleic acids for pharmacogenomic methylation analysis
KR100870486B1 (ko) 2000-09-01 2008-12-11 에피제노믹스 아게 게놈 디엔에이 시료의 서열 콘택스트 5'-씨피쥐-3'에서 특정 시토신의 메틸화 정도 측정방법
US20050021240A1 (en) * 2000-11-02 2005-01-27 Epigenomics Ag Systems, methods and computer program products for guiding selection of a therapeutic treatment regimen based on the methylation status of the DNA
AU2002342004A1 (en) 2001-10-05 2003-04-22 Case Western Reserve University Methods and compositions for detecting colon cancers
CN1650033A (zh) 2002-03-07 2005-08-03 约翰霍普金斯大学医学院 针对与癌症相关的表观遗传学沉默基因的基因组筛选
US7662594B2 (en) 2002-09-20 2010-02-16 New England Biolabs, Inc. Helicase-dependent amplification of RNA
AU2004221394A1 (en) 2003-03-17 2004-09-30 The Johns Hopkins University Aberrantly methylated genes in pancreatic cancer
US7485420B2 (en) 2003-08-14 2009-02-03 Case Western Reserve University Methods and compositions for detecting colon cancers
US8346482B2 (en) * 2003-08-22 2013-01-01 Fernandez Dennis S Integrated biosensor and simulation system for diagnosis and therapy
EP1664077B1 (en) 2003-09-05 2016-04-13 Trustees of Boston University Method for non-invasive prenatal diagnosis
US20080039413A1 (en) 2003-10-21 2008-02-14 Morris David W Novel compositions and methods in cancer
CA2560696C (en) 2004-03-02 2019-06-25 The Johns Hopkins University Mutations of the pik3ca gene in human cancers
US8114587B2 (en) 2005-06-23 2012-02-14 Ambergen, Inc. Methods for the detection of colorectal cancer
US7851154B2 (en) 2005-07-22 2010-12-14 Simon Daniel Spivack GC tag-modified bisulfite genomic DNA sequencing for continuous methylation spectra
DK3002338T3 (da) 2006-02-02 2019-08-05 Univ Leland Stanford Junior Ikke-invasiv føtal genetisk screening ved digital analyse
JP4490382B2 (ja) 2006-02-28 2010-06-23 富士フイルム株式会社 感熱転写受像シートおよびその製造方法
WO2007116417A1 (en) 2006-04-07 2007-10-18 Silvia Sabbioni Novel dna methylation markers useful for the diagnosis of neoplastic diseases
EP2021515A4 (en) 2006-05-26 2010-06-02 Meltzer Stephen J METHYLATED PROMOTERS AS BIOMARKERS OF COLON CANCER
GB0700374D0 (en) * 2007-01-09 2007-02-14 Oncomethylome Sciences S A NDRG family methylation markers
US20080213870A1 (en) * 2007-03-01 2008-09-04 Sean Wuxiong Cao Methods for obtaining modified DNA from a biological specimen
CN101353695B (zh) 2007-07-23 2013-05-01 上海市肿瘤研究所 尿沉淀dna甲基化谱式分析诊断膀胱癌的方法和试剂盒
US9050280B2 (en) * 2007-09-17 2015-06-09 Mdxhealth Sa Methylation detection of MGMT
EP2816122A1 (en) 2008-02-15 2014-12-24 Mayo Foundation For Medical Education And Research Detecting neoplasm from a stool sample
CN102301000B (zh) 2008-03-15 2015-04-29 豪洛捷公司 核酸分子扩增反应的分析组分及方法
US10927415B2 (en) 2008-11-26 2021-02-23 The Johns Hopkins University Methods for identifying cancer risk
US20110318738A1 (en) * 2008-12-23 2011-12-29 University Of Utah Research Foundation Identification and regulation of a novel dna demethylase system
EP2233590A1 (en) 2009-01-28 2010-09-29 AIT Austrian Institute of Technology GmbH Methylation assay
ES2541178T3 (es) 2009-02-03 2015-07-16 Mdxhealth Sa Método de detección de cáncer colorrectal
CN102292458A (zh) * 2009-04-03 2011-12-21 A&T株式会社 大肠肿瘤的检测方法
US20120164110A1 (en) * 2009-10-14 2012-06-28 Feinberg Andrew P Differentially methylated regions of reprogrammed induced pluripotent stem cells, method and compositions thereof
DE102010043541B4 (de) * 2009-12-16 2012-01-26 Technische Universität Dresden Verfahren und Mittel zur Vorhersage der Überlebensdauer beim Pankreaskarzinom durch Analyse von Biomarkern
ES2633111T3 (es) 2010-03-26 2017-09-19 Hongzhi Zou Métodos y materiales para detectar neoplasia colorrectal
US20130012410A1 (en) * 2010-03-29 2013-01-10 Mayo Foundation For Medical Education And Research Methods and materials for detecting colorectal cancer and adenoma
US10167513B2 (en) * 2010-05-25 2019-01-01 The Johns Hopkins University Compositions and methods for detecting a neoplasia
EP4303584A3 (en) * 2010-07-23 2024-04-03 President and Fellows of Harvard College Methods for detecting signatures of disease or conditions in bodily fluids
WO2012047899A2 (en) 2010-10-04 2012-04-12 The Johns Hopkins University Novel dna hypermethylation diagnostic biomarkers for colorectal cancer
US8715937B2 (en) 2010-11-15 2014-05-06 Exact Sciences Corporation Mutation detection assay
US8361720B2 (en) 2010-11-15 2013-01-29 Exact Sciences Corporation Real time cleavage assay
US8916344B2 (en) 2010-11-15 2014-12-23 Exact Sciences Corporation Methylation assay
US20140113286A1 (en) 2010-12-21 2014-04-24 Sloan-Kettering Institute For Cancer Research Epigenomic Markers of Cancer Metastasis
EP2481813A1 (en) * 2011-02-01 2012-08-01 Centro di Riferimento Oncologico - Istituto Nazionale Tumori - Aviano Markers of cutaneous melanoma and uses thereof
US20140057262A1 (en) 2011-03-14 2014-02-27 Mayo Foundation For Medical Education And Research Methods and materials for using the contents of phagocytes to detect neoplasms
US8993341B2 (en) 2011-05-12 2015-03-31 Exact Sciences Corporation Removal of PCR inhibitors
US8808990B2 (en) 2011-05-12 2014-08-19 Exact Sciences Corporation Serial isolation of multiple DNA targets from stool
US8980107B2 (en) 2011-05-12 2015-03-17 Exact Sciences Corporation Spin filter
CN104450680A (zh) 2011-05-12 2015-03-25 精密科学公司 核酸的分离
US20130065228A1 (en) 2011-06-01 2013-03-14 University Of Southern California Genome-scale analysis of aberrant dna methylation in colorectal cancer
US20130022974A1 (en) 2011-06-17 2013-01-24 The Regents Of The University Of Michigan Dna methylation profiles in cancer
WO2012175562A2 (en) * 2011-06-21 2012-12-27 University Of Tartu Methylation and microrna markers of early-stage non-small cell lung cancer
JPWO2013081188A1 (ja) 2011-11-30 2015-04-27 独立行政法人国立がん研究センター 誘導悪性幹細胞
WO2013130880A1 (en) * 2012-02-28 2013-09-06 The Johns Hopkins University Hypermethylated gene markers for head and neck cancer
EP2825888A4 (en) 2012-03-15 2015-09-23 Mayo Foundation METHOD AND MATERIALS FOR NONINVASIVE DETECTION OF COLORECTAL NEOPLASIA RELATED TO INFLAMMATORY ENDURANCE
EP2698436A1 (en) * 2012-08-14 2014-02-19 Max-Planck-Gesellschaft zur Förderung der Wissenschaften e.V. Colorectal cancer markers
CA2922005A1 (en) 2012-09-27 2014-04-03 Population Diagnostics, Inc. Methods and compositions for screening and treating developmental disorders
CN118028467A (zh) * 2013-03-14 2024-05-14 梅奥医学教育和研究基金会 检测赘生物
JP6369857B2 (ja) 2013-05-29 2018-08-08 シスメックス株式会社 肝細胞癌に関する情報の取得方法、ならびに肝細胞癌に関する情報を取得するためのマーカーおよびキット
EP3034624A1 (en) 2014-12-18 2016-06-22 Hospital Clínic de Barcelona Method for the prognosis of hepatocellular carcinoma

Also Published As

Publication number Publication date
EP4234721A2 (en) 2023-08-30
US20200283853A1 (en) 2020-09-10
ES2712798T3 (es) 2019-05-14
EP3543360A2 (en) 2019-09-25
US20180258498A1 (en) 2018-09-13
EP3878977B1 (en) 2023-05-03
AU2014244608B2 (en) 2017-09-14
EP3878977A1 (en) 2021-09-15
WO2014159652A2 (en) 2014-10-02
US20240182980A1 (en) 2024-06-06
EP2971179A2 (en) 2016-01-20
US10683555B2 (en) 2020-06-16
US20160040246A1 (en) 2016-02-11
US20140274748A1 (en) 2014-09-18
CA2902916C (en) 2018-08-28
AU2014244608A1 (en) 2015-09-10
WO2014159652A3 (en) 2014-11-27
EP2971179B1 (en) 2019-01-09
US9506116B2 (en) 2016-11-29
US9982310B2 (en) 2018-05-29
CN105143465A (zh) 2015-12-09
EP4234721A3 (en) 2023-10-18
US11821039B2 (en) 2023-11-21
WO2014159650A3 (en) 2014-11-20
US20160355892A1 (en) 2016-12-08
WO2014159650A2 (en) 2014-10-02
ES2947873T3 (es) 2023-08-23
CA2902916A1 (en) 2014-10-02
US9994911B2 (en) 2018-06-12
EP2971179A4 (en) 2017-01-25
EP3543360A3 (en) 2020-01-08
EP3543360B1 (en) 2021-02-17
CN118028467A (zh) 2024-05-14

Similar Documents

Publication Publication Date Title
US11821039B2 (en) Detecting neoplasm
US11104960B2 (en) Detecting esophageal disorders
ES2956257T3 (es) Detección de carcinoma hepatocelular
ES2812753T3 (es) Detección de neoplasma colorectal
US20210317538A1 (en) Detecting pancreatic high-grade dysplasia
US11542557B2 (en) Detecting colorectal neoplasia
US20230028856A1 (en) Detecting gastrointestinal neoplasms
US20240182976A1 (en) Detecting ovarian cancer