ES2656487T3 - Evaluación de la respuesta a la terapia de neoplasmas neuroendocrinos gastroenteropancreáticas (GEP-NEN) - Google Patents

Evaluación de la respuesta a la terapia de neoplasmas neuroendocrinos gastroenteropancreáticas (GEP-NEN) Download PDF

Info

Publication number
ES2656487T3
ES2656487T3 ES12709436.5T ES12709436T ES2656487T3 ES 2656487 T3 ES2656487 T3 ES 2656487T3 ES 12709436 T ES12709436 T ES 12709436T ES 2656487 T3 ES2656487 T3 ES 2656487T3
Authority
ES
Spain
Prior art keywords
gep
nen
biomarkers
seq
expression
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
ES12709436.5T
Other languages
English (en)
Inventor
Irvin M. Modlin
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Yale University
Original Assignee
Yale University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Yale University filed Critical Yale University
Application granted granted Critical
Publication of ES2656487T3 publication Critical patent/ES2656487T3/es
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N33/00Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
    • G01N33/48Biological material, e.g. blood, urine; Haemocytometers
    • G01N33/50Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing
    • G01N33/53Immunoassay; Biospecific binding assay; Materials therefor
    • G01N33/574Immunoassay; Biospecific binding assay; Materials therefor for cancer
    • G01N33/57407Specifically defined cancers
    • G01N33/57438Specifically defined cancers of liver, pancreas or kidney
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6876Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
    • C12Q1/6883Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material
    • C12Q1/6886Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material for cancer
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N33/00Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
    • G01N33/48Biological material, e.g. blood, urine; Haemocytometers
    • G01N33/50Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing
    • G01N33/68Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing involving proteins, peptides or amino acids
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/112Disease subtyping, staging or classification
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/118Prognosis of disease development
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/158Expression markers

Landscapes

  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Immunology (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Organic Chemistry (AREA)
  • Pathology (AREA)
  • Analytical Chemistry (AREA)
  • Molecular Biology (AREA)
  • Urology & Nephrology (AREA)
  • Wood Science & Technology (AREA)
  • Genetics & Genomics (AREA)
  • Zoology (AREA)
  • Biochemistry (AREA)
  • Biotechnology (AREA)
  • Microbiology (AREA)
  • General Health & Medical Sciences (AREA)
  • Physics & Mathematics (AREA)
  • Biomedical Technology (AREA)
  • Hematology (AREA)
  • Oncology (AREA)
  • Hospice & Palliative Care (AREA)
  • Biophysics (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • General Engineering & Computer Science (AREA)
  • Food Science & Technology (AREA)
  • General Physics & Mathematics (AREA)
  • Cell Biology (AREA)
  • Medicinal Chemistry (AREA)
  • Gastroenterology & Hepatology (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
  • Investigating Or Analysing Biological Materials (AREA)
  • Peptides Or Proteins (AREA)

Abstract

Un método para evaluar la respuesta a la terapia de un neoplasma neuroendocrino gastroenteropancreático (GEP-NEN) o una célula de GEP-NEN, que comprende: (a) poner en contacto una muestra de prueba biológica del sujeto con un conjunto de polinucleótidos que hibridan específicamente o se unen a los biomarcadores GEP-NEN AKAP8L, BRAF, CD59, COMMD9, Ki67, MORF4L2, OAZ2, RAF1, SST1, SST3, TECPR2, ZFHX3 y ZXDC, en donde la muestra de prueba biológica es un tejido, una muestra de sangre o plasma; (b) detectar la unión de biomarcadores de GEP-NEN al conjunto de polinucleótidos, detectando de ese modo los niveles de expresión o el perfil de expresión de los biomarcadores de GEP-NEN en la muestra de prueba del sujeto; (c) comparar los niveles de expresión o el perfil de expresión de los biomarcadores de GEP-NEN detectados con un nivel de referencia o un perfil de referencia de los biomarcadores en una muestra de referencia del mismo sujeto antes del tratamiento; y (d) con base en las diferencias entre los niveles de expresión o el perfil de expresión de los niveles de los biomarcadores de GEP-NEN detectados y el nivel de referencia o el perfil de referencia de los biomarcadores que determinan la respuesta al tratamiento o determinan si el sujeto se ha vuelto clínicamente estable después de intervención quirúrgica o terapia con análogos de somatostatina para GEP-NEN, con al menos 90% de precisión.

Description

Evaluación de la respuesta a la terapia de neoplasmas neuroendocrinos gastroenteropancreáticas (GEP-NEN)
Campo de la invención
La invención descrita en la presente memoria se refiere a biomarcadores de neoplasmas neuroendocrinos gastroenteropancreáticos (GEP-NEN). Más particularmente, la invención reivindicada se refiere a la detección de un conjunto de biomarcadores de GEP-NEN para monitorear la eficacia del tratamiento de un GEP-NEN.
Estado de la Técnica
El neoplasma neuroendocrino gastroenteropancreático (GEP-NEN, también llamado tumor neuroendocrino gastroenteropancreático (GEP) y tumor neuroendocrino (NET)) es el segundo tumor maligno más frecuente del tracto gastrointestinal (GI) en los EE. UU., más prevalente que los neoplasmas gástrico, esofágico, pancreático y hepatobiliar, con una incidencia de aproximadamente 2,5-5 casos por cada 100.000 habitantes. La incidencia y la prevalencia han aumentado entre 100 y 600 por ciento en los EE. UU. en los últimos treinta años, sin aumento en la supervivencia.
La heterogeneidad y complejidad de los GEP-NEN ha dificultado el diagnóstico, el tratamiento y la clasificación. Estos neoplasmas carecen de varias mutaciones comúnmente asociadas con otros cánceres; la inestabilidad de microsatélites está en gran parte ausente. Véase Tannapfel A, Vomschloss S, Karhoff D, et al., "BRAF gene mutations are rare events in gastroenteropancreatic neuroendocrine tumors", Am J. Clin. Pathol. 2005; 123 (2): 25660; Kidd M, Eick G, Shapiro MD, et al. "Microsatellite instability and gene mutations in transforming growth factorbeta type II receptor are absent in small bowel carcinoid tumors", Cancer 2005; 103 (2): 229-36. Los subtipos histopatológicos individuales se asocian con un comportamiento clínico distinto, sin embargo, no existe un esquema de predicción o clasificación patológica definitivo y generalmente aceptado, lo que impide el desarrollo del tratamiento.
Los enfoques de diagnóstico y pronóstico existentes incluyen imagenología (por ejemplo, CT y MRI), histología y detección de algunos productos de los genes. Los métodos disponibles son limitados, por ejemplo, por baja sensibilidad y/o especificidad, e incapacidad para detectar una enfermedad en estadio temprano. Los GEP-NEN a menudo no se diagnostican hasta que son metastásicos y, a menudo, intratables. Khan et al. (2011) Clin. Can. Res. 17, 337-345 informaron, por ejemplo, que las células tumorales circulantes en pacientes con tumores neuroendocrinos metastásicos, que incluyen NET pancreáticos, se pueden identificar sobre la base de la expresión de EpCam.
Existe una necesidad por métodos y agentes específicos y sensibles para la detección de GEP-NEN, incluidos los GEP-NEN de fase temprana, por ejemplo, para su uso en diagnóstico, pronóstico, predicción, estadificación, clasificación, tratamiento, monitoreo y evaluación de riesgos, y para investigar y comprender factores moleculares de patogénesis, malignidad y agresividad de esta enfermedad. Por ejemplo, se requiere que tales métodos y agentes se puedan realizar de manera simple, rápida y a un costo relativamente bajo.
El análisis de microarreglos de oligonucleótidos se ha empleado previamente para investigar la expresión génica asociada con los GEP-NEN, por ejemplo, para la clasificación de GEP-NEN. Véase, por ejemplo, Maitra et al. (2003) Clin. Cancer. Res. 9, 5988-5995: " Global expression analysis of well-differentiated pancreatic endocrine neoplasms using oligonucleotide microarrays", Duerr et al. (2008) Endocrine Related Cancer 15, 243-256; "Defining molecular classifications and targets in gastroenteropancreatic neuroendocrine tumors through DNA microarray analysis" y Arvidsson et al. (2008) Endocrine Related Cancer 15, 569-581. La solicitud internacional publicada WO2005/020795 (Universidad John Hopkins) informa estudios que analizan la expresión diferencial de transcritos de ARN en neoplasmas endocrinos pancreáticos en comparación con células de islotes pancreáticos normales que emplean la matriz GeneChip® U133A humana de Affymetrix para análisis de microarreglos de oligonucleótidos. Esos estudios revelaron una serie de transcritos de genes expresados diferencialmente en GEP-NEN, incluidos MLLT10/AF10, IGFB3, fibronectina, MUCH18, p21/Cipl, GADD45, NME3 y junD. Sin embargo, no se ha demostrado que estas correlaciones tengan un valor clínico en el monitoreo de la eficacia del tratamiento.
Resumen
La presente invención proporciona ahora un método para evaluar la respuesta a la terapia de GEP-NEN basándose en la detección de transcritos de genes correspondientes a al menos un subconjunto de 13 genes de un panel del gen marcador 51.
Más particularmente, la presente invención proporciona un método para evaluar la respuesta a la terapia de un neoplasma neuroendocrino gastroenteropancreático (GEP-NEN) o célula de GEP-NEN, que comprende:
(a)
poner en contacto una muestra de prueba biológica del sujeto con un conjunto de polinucleótidos que hibridan específicamente o se unen a los biomarcadores de GEP-NEN AKAP8L, BRAF, CD59, COMMD9, Ki67, MORF4L2, OAZ2, RAF1, SST1, SST3, TECPR2, ZFHX3 y ZXDC, en donde la muestra de prueba biológica es un tejido, una muestra de sangre o de plasma;
(b)
detectar la unión de biomarcadores de GEP-NEN al conjunto de polinucleótidos, detectando de ese modo los niveles de expresión o perfil de expresión de los biomarcadores de GEP-NEN en la muestra de prueba del sujeto;
(c)
comparar los niveles de expresión o el perfil de expresión de los biomarcadores de GEP-NEN detectados con un nivel de referencia o un perfil de referencia de los biomarcadores en una muestra de referencia del mismo sujeto antes del tratamiento; y
(d)
con base en las diferencias entre los niveles de expresión o el perfil de expresión de los niveles de los biomarcadores de GEP-NEN detectados y el nivel de referencia o el perfil de referencia de los biomarcadores
determinar la capacidad de respuesta al tratamiento o determinar si el sujeto se ha vuelto clínicamente estable después de una intervención quirúrgica o terapia con análogos de somatostatina para GEP-NEN, con al menos 90% de precisión.
Como se muestra aquí, el panel de genes empleado puede expandirse deseablemente para incluir adicionalmente APLP2, ARAF1, ATP6V1H, BNIP3L, C21orf7, CTGF, ENPP4, FAM131A, FLJ10357, FZD7, GLT8D1, HDAC9, HSF2, KRAS, LEOI, NAP1L1, NOL3, NUDT3, PANK2, PHF21A, PKD1, PLD3, PNMA2, PQBP1, RNF41, RSF1, RTN2, SMARCD3, SPATA7, SST4, SST5, TPH1, TRMT112, VMAT1, VMAT2, VPS13C, WDFY3 y ZZZ3.
Se describen adicionalmente en el presente documento agentes, conjuntos de agentes y sistemas que contienen los agentes para el pronóstico, detección y diagnóstico de GEP-NEN. Típicamente, los sistemas incluyen una pluralidad de agentes (por ejemplo, un conjunto de agentes), donde la pluralidad se une específicamente y/o detecta una pluralidad de biomarcadores de GEP-NEN en un panel de biomarcadores de GEP-NEN. Típicamente, los agentes son polipéptidos o polinucleótidos aislados que se unen específicamente a uno o más biomarcadores de GEP-NEN. Por ejemplo, se proporcionan conjuntos de polinucleótidos y polipéptidos aislados que se unen a un panel de biomarcadores de GEP-NEN, y métodos y usos de los mismos.
También se proporcionan métodos de pronóstico, diagnóstico y predictivos y usos de los agentes, composiciones, sistemas y kits para GEP-NEN y afecciones, síndromes y síntomas asociados. Por ejemplo, se proporcionan métodos y usos para la detección, diagnóstico, clasificación, predicción, control terapéutico, pronóstico u otra evaluación de GEP-NEN o un resultado, etapa o nivel de agresividad o riesgo del mismo, o una afección asociada. En algunas realizaciones, los métodos se llevan a cabo determinando la presencia, ausencia, niveles de expresión o perfil de expresión de un biomarcador de GEP-NEN, más típicamente una pluralidad de biomarcadores de GEP-NEN, tales como un panel de biomarcadores, y/o comparando tal información con niveles de expresión normal o de referencia o perfiles o estándares. Por lo tanto, en algunas realizaciones, los métodos se llevan a cabo obteniendo una muestra de prueba biológica y detectando la presencia, ausencia, niveles de expresión o perfil de expresión de un biomarcador de GEP-NEN como se describe en la presente memoria, más típicamente de un panel de al menos dos de los biomarcadores de GEP-NEN proporcionados. Por ejemplo, los métodos pueden realizarse con cualquiera de los sistemas de agentes, por ejemplo, polinucleótidos o polipéptidos, proporcionados en la presente memoria. Por ejemplo, los métodos generalmente se llevan a cabo usando uno o más de los sistemas proporcionados.
Se proporcionan métodos, agentes y composiciones para la detección y distinción entre varios tipos, etapas y sitios diferentes de GEP-NEN (por ejemplo, GEP-NEN pancreático frente al de intestino delgado). En un aspecto, la diferenciación entre sitios puede proporcionar información de pronóstico o ayudar a identificar el GEP-NEN. Por lo tanto, en algunas realizaciones, los métodos distinguen entre NEN de intestino delgado (SI-NEN) y NEN pancreáticos (PI-NEN). Los ejemplos de tipos y etapas de GEP-NEN incluyen GEP-NEN metastásico y primario, GEP-NEN que responden o no a diversos enfoques de tratamiento y varios subtipos de GEP-NEN, incluido NET bien diferenciado (WDNET), carcinoma neuroendocrino primario bien diferenciado (WDNEC), tumor neuroendocrino primario pobremente diferenciado (PDNET), NEC primario pobremente diferenciado (PDNEC), WDNET metastásico (WDNET MET), WDNEC metastásico (WDNEC MET), PDNEC metastásico (PDNEC MET) y PDNET metastásico (PDNET MET).
En un aspecto, los métodos y composiciones proporcionados se pueden usar para detectar en forma específica y sensible GEP-NEN, tales como GEP-NEN en fase temprana, primarios o asintomáticos; en algunos aspectos, los métodos y composiciones pueden usarse para predecir la progresión de la enfermedad, la respuesta al tratamiento y la metástasis. Los métodos y composiciones proporcionados en este documento son útiles para el diagnóstico, pronóstico, predicción (es decir, predicción de metástasis en GEP-NEN primarios y en etapa temprana), estadificación, clasificación, tratamiento, control, evaluación del riesgo e investigación de factores moleculares asociados con enfermedad por GEP-NEN.
Se proporcionan dichos métodos capaces de llevarse a cabo de forma rápida, sencilla y a un coste relativamente bajo, en comparación con otros métodos de diagnóstico y pronóstico.
Se proporcionan métodos y composiciones que son útiles para definir la clasificación basada en la expresión génica de GEP-NEN, y por lo tanto son útiles para permitir la predicción de malignidad y metástasis, tales como enfermedad en estadio temprano o el uso de muestras histológicamente negativas, proporcionando una estadificación precisa, facilitando la terapia racional y el desarrollo de grandes conjuntos de datos clínicos validados para la terapéutica específica de GEP-NEN.
Los biomarcadores de GEP-NEN incluyen biomarcadores, cuya expresión es diferente en o está asociada con la presencia o ausencia de GEP-NEN, o es diferente en, o está asociada con, una clasificación, etapa, agresividad, gravedad, grado, metástasis, síntoma, riesgo, respuesta o eficacia al tratamiento o síndrome asociado particular. El panel de biomarcadores de GEP-NEN típicamente incluye al menos 2 biomarcadores de GEP-NEN, típicamente al menos 3 biomarcadores. En algunas realizaciones, el panel de biomarcadores incluye al menos 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39, 40, 41, 42, 43, 44, 45, 46, 47, 48, 49, 50, 51, 52, 53, 54, 55, 56, 57, 58, 59, 60, 61, 62, 63, 64, 65, 66, 67, 68, 69, 70, 71, 72, 73, 74, 75, 80, 85, 90, 95, o 100 biomarcadores o más, o incluye aproximadamente 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39, 40, 41, 42, 43, 44, 45, 46, 47, 48, 49, 50, 51, 52, 53, 54, 55, 56, 57, 58, 59, 60, 61, 62, 63, 64, 65, 66, 67, 68, 69, 70, 71, 72, 73, 74, 75, 80, 85, 90, 95 o 100 biomarcadores de GEP-NEN, o más.
Por ejemplo, en algunos aspectos, el panel de biomarcadores incluye al menos 3, al menos 11, al menos 21, o al menos 29 biomarcadores, al menos 51 biomarcadores, o al menos 75 biomarcadores o más. En un ejemplo particular, el panel contiene al menos 51 biomarcadores o aproximadamente 51 biomarcadores o 51 biomarcadores. Debido a que los sistemas contienen una pluralidad de agentes (generalmente polipéptidos o polinucleótidos) que se unen específicamente o hibridan a los biomarcadores en el panel, el número de biomarcadores generalmente se relaciona con el número de agentes en un sistema particular. Por ejemplo, entre los sistemas proporcionados hay un sistema que contiene 51 agentes, que hibridan específicamente o se unen a un panel de 51 biomarcadores de GEP-NEN, respectivamente.
En algunos aspectos, el panel de biomarcadores incluye al menos 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39, 40, 41, 42, 43, 44, 45, 46, 47, 48, 49, 50 o 51, y/o todos los siguientes grupos de productos de los genes, incluyendo polinucleótidos (por ejemplo, transcritos) y polipéptidos:
Productos de los genes AKAP8L, ATP6V1H, BNIP3L, C21orf7, COMMD9, ENPP4, FAM13A, FLJ10357, GLT8D1, HDAC9, HSF2, LEOI, MORF4L2, NOL3, NUDT3, OAZ2, PANK2, PHF21A, PKD1, PLD3, PQBP1, RNF41, RSF1, RTN2, SMARCD3, SPATA7, SST1, SST3, SST4, SST5, TECPR2, TRMT112, VPS13C, WDFY3, ZFHX3, ZXDC, ZZZ3, APLP2, CD59, ARAF1, BRAF1, KRAS y RAF1;
productos de los genes AKAP8L, ATP6V1H, BNIP3L, C21orf7, COMMD9, ENPP4, FAM13A, FLJ10357, GLT8D1, HDAC9, HSF2, LEOI, MORF4L2, NOL3, NUDT3, OAZ2, PANK2, PHF21A, PKD1, PLD3, PQBP1, RNF41, RSF1, RTN2, SMARCD3, SPATA7, SST1, SST3, SST 4, SST5, TECPR2, TRMT112, VPS13C, WDFY3, ZFHX3, ZXDC y ZZZ3; y productos de los genes APLP2, ARAF1, BRAF, CD59, CTGF, FZD7, Ki67, KRAS, NAP1L1, PNMA2, RAF1, TPH1, VMAT1 y VMAT2.
En algunos ejemplos, el panel de biomarcadores incluye los productos de los genes AKAP8L, ATP6V1H, BNIP3L, C21orf7, COMMD9, ENPP4, FAM13A, FLJ10357, GLT8D1, HDAC9, HSF2, LEOI, MORF4L2, NOL3, NUDT3, OAZ2, PANK2, PHF21A, PKD1, PLD3, PQBP1, RNF41, RSF1, RTN2, SMARCD3, SPATA7, SST1, SST3, SST4, SST5, TECPR2, TRMT112, VPS13C, WDFY3, ZFHX3, ZXDC y ZZZ3.
En algunos ejemplos, el panel de biomarcadores incluye los productos de los genes APLP2, ARAF1, BRAF, CD59, CTGF, FZD7, Ki67, KRAS, NAP1L1, PNMA2, RAF1, TPH1, VMAT1 y VMAT2.
En algunos ejemplos, el panel de biomarcadores incluye los productos de los genes AKAP8L, APLP2, ARAF1, ATP6V1H, BNIP3L, BRAF, C21orf7, CD59, COMMD9, CTGF, ENPP4, FAM13A, FLJ10357, FZD7, GLT8D1, HDAC9, HSF2, Ki67, KRAS, LEOI, MORF4L2, NAP1L1, NOL3, NUDT3, OAZ2, PANK2, PHF21A, PKD1, PLD3, PNMA2, PQBP1, RAF1, RNF41, RSF1, RTN2, SMARCD3, SPATA7, SST1, SST3, SST4, SST5, TECPR2, TPH1, TRMT112, VMAT1, VMAT2, VPS 13C, WDFY3, ZFHX3, ZXDC y ZZZ3.
En algunos ejemplos, el panel de biomarcadores incluye un producto del gen APLP2, un producto del gen CD59, un producto del gen ARAF1, un producto del gen BRAF1, un producto del gen KRAS, o un producto del gen RAF1.
En algunos ejemplos, el panel de biomarcadores de GEP-NEN incluye los productos de los genes APLP2, ARAF1,
BRAF, CD59, CTGF, FZD7, Ki67, KRAS, NAP1L1, PNMA2, RAF1, TPH1 y VMAT2; o el panel de biomarcadores de GEP-NEN incluye los productos de los genes APLP2, ARAF1, BRAF1, CD59, KRAS, RAF1, CXCL14, GRIA2, HOXC6, NKX2-3, OR51E1, PNMA2, PTPRN2, SCG5, SPOCK1, X2BTB48, CgA, CTGF, FZD7, Ki-67, Kiss1, MAGE-D2, MTA1, NAP1L1, NRP2, Tph1, VMAT1, VMAT2 y Survivina.
En algunos ejemplos, incluye además un producto del gen seleccionado del grupo que consiste en los productos de los genes MAGE-D2, MTA1, Survivina, Kiss1, HOXC6, NRP2, X2BTB48, CXCL14, GRIA2, NKX2-3, OR51E1, CTGF, PTPRN2., SPOCK1 y SCG5.
En otros ejemplos, el panel de biomarcadores de GEP-NEN incluye al menos 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18., 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29 o incluye cada uno de los biomarcadores en uno, más o todos los siguientes grupos de productos de los genes, incluidos polinucleótidos (por ejemplo, transcripciones) y polipéptidos:
(a)
productos de los genes APLP2, ARAF1, BRAF1, CD59, KRAS, RAF1, CXCL14, GRIA2, HOXC6, NKX2-3, OR51E1, PNMA2, PTPRN2, SCG5, SPOCK1, X2BTB48, CgA, CTGF, FZD7, Ki-67, Kiss1, MAGE-D2, MTA1, NAP1L1, NRP2, Tph1, VMAT1, VMAT2 y Survivina; (b) productos de los genes MAGE-D2, MTA1, NAP1L1, Ki67, survivina, FZD7, Kiss1, NRP2, X2BTB48, CXCL14, GRIA2, NKX2-3, OR51E1, PNMA2, SPOCK1, HOXC6, CTGF, PTPRN2, SCG5 y Tph; (c) productos de los genes ARAF1, BRAF, CTGF, FZD7, Ki67, KRAS, NAP1L1, PNMA2, RAF1, TPH1 y VMAT2; (d) productos de los genes CXCL14, GRIA2, HOXC6, Ki-67, Kiss1, MAGE-D2, MTA1, NAP1L1, NKX2-3, OR51E1, PTPRN2, SCG5, SPOCK1 y X2BTB48; (e) productos de los genes CXCL14, GRIA2, HOXC6, NKX2-3, OR51E1, PNMA2, PTPRN2, SCG5, SPOCK1 y X2BTB48; (f) productos de los genes APLP2, ARAF1, BRAF, CD59, CTGF, FZD7, Ki67, KRAS, NAP1L1, PNMA2, RAF1, TPH1 y VMAT2; (g) productos de los genes APLP2, ARAF1, BRAF1, CD59, KRAS y RAF1; y/o (h) productos de los genes ARAF1, BRAF1, CD59, KRAS, RAF1, CXCL14, GRIA2, HOXC6, NKX2-3, OR51E1, PNMA2, PTPRN2, SCG5, SPOCK1, X2BTB48, CgA, CTGF, FZD7, Ki-67, Kiss1, MAGE-D2, MTA1, NAP1L1, NRP2, Tph1, VMAT1, VMAT2 y Survivina.
En algunos ejemplos, los biomarcadores incluyen al menos 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39, 40, 41, 42, 43, 44, 45, 46, 47, 48, 49, 50
o 51 de los siguientes productos de los genes (el término producto del gen que incluye, por ejemplo, polinucleótidos (por ejemplo, Transcritos) y polipéptidos): productos de los genes AKAP8L, APLP2, ARAF1, ATP6V1H, BNIP3L, BRAF, C21orf7, CD59, COMMD9, CTGF, ENPP4, FAM13A, FLJ10357, FZD7, GLT8D1, HDAC9, HSF2, Ki67, KRAS, LEO1, MORF4L2, NAP1L1, NOL3, NUDT3, OAZ2, PANK2, PHF21A, PKD1, PLD3, PNMA2, PQBP1, RAF1, RNF41, RSF1, RTN2, SMARCD3, SPATA7, SST1, SST3, SST4, SST5, TECPR2, TPH1, TRMT112, VMAT1, VMAT2, VPS13C, WDFY3, ZFHX3, ZXDC y ZZZ3.
En algunos aspectos, los biomarcadores incluyen los productos de los genes AKAP8L, APLP2, ARAF1, ATP6V1H, BNIP3L, BRAF, C21orf7, CD59, COMMD9, CTGF, ENPP4, FAM13A, FLJ10357, FZD7, GLT8D1, HDAC9, HSF2, Ki67, KRAS, LEOI, MORF4L2, NAP1L1, NOL3, NUDT3, OAZ2, PANK2, PHF21A, PKD1, PLD3, PNMA2, PQBP1, RAF1, RNF41, RSF1, RTN2, SMARCD3, SPATA7, SST1, SST3, SST4, SST5, TECPR2, TPH1, TRMT112, VMAT1, VMAT2, VPS13C, WDFY3, ZFHX3, ZXDC y ZZZ3.
En algunos ejemplos, los biomarcadores incluyen al menos 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37 o 38 de los siguientes productos de los genes (el término producto del gen incluye, por ejemplo, polinucleótidos (por ejemplo, transcritos) y polipéptidos): productos de los genes AKAP8L, ATP6V1H, BNIP3L, C21orf7, COMMD9, ENPP4, FAM13A, FLJ10357, GLT8D1, HDAC9, HSF2, LEOI, MORF4L2, NOL3, NUDT3, OAZ2, PANK2, PHF21A, PKD1, PLD3, PQBP1, RNF41, RSF1, RTN2, SMARCD3, SPATA7, SST1, SST3, SST4, SST5, TECPR2, TRMT112, VPS13C, WDFY3, ZFHX3, ZXDC y ZZZ3.
En algunos aspectos, los biomarcadores incluyen AKAP8L, ATP6V1H, BNIP3L, C21orf7, COMMD9, ENPP4, FAM13A, FLJ10357, GLT8D1, HDAC9, HSF2, LEOI, MORF4L2, NOL3, NUDT3, OAZ2, PANK2, PHF21A, PKD1, PLD3, PQBP1, RNF41, RSF1, RTN2, SMARCD3, SPATA7, SST1, SST3, SST4, SST5, TECPR2, TRMT112, VPS13C, WDFY3, ZFHX3, ZXDC y ZZZ3.
En algunos ejemplos, los biomarcadores incluyen al menos dos biomarcadores de GEP-NEN seleccionados entre los productos de los genes APLP2, ARAF1, BRAF1, CD59, KRAS, RAF1, CXCL14, GRIA2, HOXC6, NKX2-3, OR51E1, PNMA2, PTPRN2, SCG5, SPOCK1, X2BTB48, CgA, CTGF, FZD, Ki-67, Kiss1, MAGE-D2, MTA1, NAP1L1, NRP2, Tph1, VMAT1, VMAT2 y Survivina.
En una realización, la pluralidad de biomarcadores de GEP-NEN incluye un producto del gen APLP2 o un producto del gen CD59. En una realización, los biomarcadores de GEP-NEN incluyen un producto del gen APLP2. En una realización, incluyen un producto del gen CD59.
En una realización, los biomarcadores de GEP-NEN incluyen un producto del gen APLP2, CD59, ARAF1, BRAF1,
KRAS o RAF1.
En algunas realizaciones, el panel de biomarcadores de GEP-NEN incluye un producto del gen APLP2, ARAF1, BRAF, CD59, KRAS o RAF1 o un producto del gen GTGF, FZD7, Ki67, NAP1L1, PNMA2, TPH1 o VMAT2. En algunas realizaciones, el panel de biomarcadores de GEP-NEN incluye un producto del gen PNMA2. En algunas realizaciones, el panel de biomarcadores de GEP-NEN incluye un producto del gen VMAT2. En algunas realizaciones, el panel de biomarcadores de GEP-NEN incluye un producto del gen CgA, CXCL14, GRIA2, HOXC6, Kiss1, MAGE-D2, MTA1, NKX2-3, NRP2, OR51E1, PTPRN2, SCG5, SPOCK1, survivina, VMAT1 o X2BTB48. En otras realizaciones, el panel incluye un biomarcador de PNMA2. En algunas realizaciones, el panel incluye un biomarcador de VMAT2.
En algunas realizaciones, el panel incluye los productos de los genes APLP2, ARAF1, BRAF, CD59, CTGF, FZD7, Ki67, KRAS, NAP1L1, PNMA2, RAF1, TPH1 y VMAT2; o incluye los productos de los genes MAGE-D2, MTA1, NAP1L1, Ki67, Survivina, FZD7, Kiss1, NRP2, X2BTB48, CXCL14, GRIA2, NKX2-3, OR51E1, PNMA2, SPOCK1, HOXC6, CTGF, PTPRN2, SCG5, CgA y Tph . En un aspecto, los biomarcadores incluyen al menos uno de o incluye cada uno de los siguientes biomarcadores: productos de los genes APLP2, ARAF1, BRAF1, CD59, KRAS, RAF1, CXCL14, GRIA2, HOXC6, NKX2-3, OR51E1, PNMA2, PTPRN2, SCG5, SPOCK1, X2BTB48, CTGF, FZD7, Ki-67, Kiss1, MAGE-D2, MTA1, NAP1L1, NRP2, Tph1, VMAT1, VMAT2, Survivina y X2BTB48. En una de tales realizaciones, los biomarcadores incluyen además un producto del gen CgA.
En una realización, los biomarcadores de GEP-NEN incluyen uno o más productos de los genes que tienen una secuencia de nucleótidos con al menos en o aproximadamente 90 o en aproximadamente 90, 91, 92, 93, 94, 95, 96, 97, 98, 99% de identidad o 100% de identidad con (es decir, que tiene una secuencia de nucleótidos de) SEQ ID NO: 1, o con la SEQ ID NO: 1, de los residuos de nucleótidos 158-2449; SEQ ID NO: 2, o con la SEQ ID NO: 2 de los residuos de nucleótidos 195-2015 de la SEQ ID NO: 3 o con la SEQ ID NO: 3, de los residuos de nucleótidos 622362; SEQ ID NO: 4 o con la SEQ ID NO: 4, de los residuos de nucleótidos 278-664; SEQ ID NO: 5, o con la SEQ ID NO: 5 de los residuos de nucleótidos 1 a 1374; SEQ ID NO: 6, o con la SEQ ID NO: 6 de los residuos de nucleótidos 207-1256; SEQ ID NO: 7, o con la SEQ ID NO: 7 de los residuos de nucleótidos 466-801; SEQ ID NO: 8, o con la SEQ ID NO: 8 de los residuos de nucleótidos 62-1786; SEQ ID NO: 9, o con la SEQ ID NO: 9 de los residuos de nucleótidos 460-3111; SEQ ID NO: 10, o con la SEQ ID NO: 10 de los residuos de nucleótidos 113-820; SEQ ID NO: 11, o con la SEQ ID NO: 11 de los residuos de nucleótidos 196-9966; SEQ ID NO: 12, o con la SEQ ID NO: 12 de los residuos de nucleótidos 155-571; SEQ ID NO: 13, o con la SEQ ID NO: 13 de los residuos de nucleótidos 182751; SEQ ID NO: 14, o con la SEQ ID NO: 14 de los residuos de nucleótidos 100-1920; SEQ ID NO: 15, o con la SEQ ID NO: 15 de los residuos de nucleótidos 188-2335; SEQ ID NO: 16, o con la SEQ ID NO: 16 de los residuos de nucleótidos 413-1588; SEQ ID NO: 17, o con la SEQ ID NO: 17 de los residuos de nucleótidos 200-1294; SEQ ID NO: 18, o con la SEQ ID NO: 18 de los residuos de nucleótidos 792-3587; SEQ ID NO: 19, o con la SEQ ID NO: 19 de los residuos de nucleótidos 145-1101; SEQ ID NO: 20, o con la SEQ ID NO: 20 de los residuos de nucleótidos 771-1865; SEQ ID NO: 21, o con la SEQ ID NO: 21 de los residuos de nucleótidos 122-3169; SEQ ID NO: 22, o con la SEQ ID NO: 22 de los residuos de nucleótidos 416-2362; SEQ ID NO: 23, o con la SEQ ID NO: 23 de los residuos de nucleótidos 118-756; SEQ ID NO: 24, o con la SEQ ID NO: 24 de los residuos de nucleótidos 152-1471; SEQ ID NO: 25, o con la SEQ ID NO: 25 residuos de nucleótidos 2811-2921, 3174-3283, 5158-5275, 11955-12044, o con la SEQ ID NO: 34; SEQ ID NO: 26, o con la SEQ ID NO: 26 de los residuos de nucleótidos 27-1361; SEQ ID NO: 27, o con la SEQ ID NO: 27 de los residuos de nucleótidos 472-2049; SEQ ID NO: 28, o con la SEQ ID NO: 28 de los residuos de nucleótidos 32-1576; SEQ ID NO: 29, o con la SEQ ID NO: 29 de los residuos de nucleótidos 467-1801; SEQ ID NO: 105, o con la SEQ ID NO: 105 de los residuos de nucleótidos 122-1456; SEQ ID NO: 201, o con la SEQ ID NO: 201 de los residuos de nucleótidos 100-2040; SEQ ID NO: 204, o con la SEQ ID NO: 204, de los residuos de nucleótidos 293-1744; SEQ ID NO: 205, o con la SEQ ID NO: 205, de los residuos de nucleótidos 125-784; SEQ ID NO: 206, o con la SEQ ID NO: 206 de los residuos de nucleótidos 278-1006; SEQ ID NO: 207, o con la SEQ ID NO: 207 de los residuos de nucleótidos 38-508; SEQ ID NO: 208, o con la SEQ ID NO: 208 de los residuos de nucleótidos 260-1621; SEQ ID NO: 209, o con la SEQ ID NO: 209 de los residuos de nucleótidos 281-1126; SEQ ID NO: 210, o con la SEQ ID NO: 210 de los residuos de nucleótidos 30-4589; SEQ ID NO: 211, o con la SEQ ID NO: 211 de los residuos de nucleótidos 852-1967; SEQ ID NO: 212, o con la SEQ ID NO: 212 de los residuos de nucleótidos 362-2128; SEQ ID NO: 213, o con la SEQ ID NO: 213 de los residuos de nucleótidos 188-1798; SEQ ID NO: 215, o con la SEQ ID NO: 215 de los residuos de nucleótidos 17-2017; SEQ ID NO: 217, o con la SEQ ID NO: 217 de los residuos de nucleótidos 505-1371; SEQ ID NO: 218, o con la SEQ ID NO: 218 de los residuos de nucleótidos 194-853; SEQ ID NO: 219, o con la SEQ ID NO: 219 de los residuos de nucleótidos 319-837; SEQ ID NO: 220, o con la SEQ ID NO: 220 de los residuos de nucleótidos 216-311 y 313-786; SEQ ID NO: 221, o con la SEQ ID NO: 221 de los residuos de nucleótidos 312-1151; SEQ ID NO: 222, o con la SEQ ID NO: 222 de los residuos de nucleótidos 625-2667; SEQ ID NO: 223, o con la SEQ ID NO: 223 de los residuos de nucleótidos 21013117, o con la secuencia referenciada en el GenBank gi Número 205360961 o con aquella secuencia de los residuos de nucleótidos 210-13118; SEQ ID NO: 224, o con la SEQ ID NO: 224 de los residuos de nucleótidos 3991871; SEQ ID NO: 225, o con la SEQ ID NO: 225 de los residuos de nucleótidos 122-919; SEQ ID NO: 227, o con la
SEQ ID NO: 227 de los residuos de nucleótidos 320-1273; SEQ ID NO: 228, o con la SEQ ID NO: 228 de los residuos de nucleótidos 121-4446; SEQ ID NO: 229, o con la SEQ ID NO: 229 de los residuos de nucleótidos 2291866; SEQ ID NO: 232, o con la SEQ ID NO: 232 de los residuos de nucleótidos 102-1553; SEQ ID NO: 233, o con la SEQ ID NO: 233 de los residuos de nucleótidos 176-1879; SEQ ID NO: 234, o con la SEQ ID NO: 234 de los residuos de nucleótidos 618-1793; SEQ ID NO: 235, o con la SEQ ID NO: 235 de los residuos de nucleótidos 5261782; SEQ ID NO: 236, o con la SEQ ID NO: 236 de los residuos de nucleótidos 65-1231; SEQ ID NO: 237, o con la SEQ ID NO: 237 de los residuos de nucleótidos 89-1183; SEQ ID NO: 238, o con la SEQ ID NO: 238 de los residuos de nucleótidos 227-4030; SEQ ID NO: 239, o con la SEQ ID NO: 239 de los residuos de nucleótidos 104-1969; SEQ ID NO: 240, o con la SEQ ID NO: 240 de los residuos de nucleótidos 94-612, SEQ ID NO: 243, o con la SEQ ID NO: 243 de los residuos de nucleótidos 409-10988, SEQ ID NO: 244, o con la SEQ ID NO: 244 de los residuos de nucleótidos 130-8499, SEQ ID NO: 245, o con la SEQ ID NO: 245 de los residuos de nucleótidos 55-2187, y/o SEQ ID NO: 246, o con la SEQ ID NO: 246 de los residuos de nucleótidos 477-3188.
Entre los métodos, agentes y sistemas proporcionados están aquellos que son capaces de clasificar o detectar un GEP-NEN en una muestra de sangre humana. En algunas realizaciones, los sistemas y métodos proporcionados pueden identificar o clasificar un GEP-NEN en una muestra de sangre humana; en algunas realizaciones, puede diferenciar entre un sujeto con GEP-NEN y un sujeto con otro tipo de cáncer gastrointestinal (GI) (u otro cáncer) o puede determinar el sitio de un GEP-NEN, por ejemplo, al diferenciar entre un sujeto con NEN del intestino delgado y un sujeto con un NEN pancreático. En algunos ejemplos, los sistemas pueden proporcionar dicha información con una especificidad, sensibilidad y/o precisión de al menos 75%, 80%, 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% o 100%, por ejemplo, al menos 80%.
En realizaciones de la invención, el sistema puede predecir la capacidad de respuesta al tratamiento para o determinar si un paciente se ha vuelto clínicamente estable después o es sensible o no sensible a un tratamiento de GEP-NEN, o que es una intervención quirúrgica o una terapia con análogos de somatostatina. Esto se logra con al menos 90% de precisión.
Ahora también se divulgan métodos que pueden determinar información de diagnóstico o pronóstico con respecto a un sujeto previamente diagnosticado con GEP-NEN, por ejemplo, si el sujeto tiene enfermedad estable, enfermedad progresiva o está en remisión completa (por ejemplo, sería clínicamente categorizado por tener una enfermedad estable, enfermedad progresiva o en remisión completa).
En algunas realizaciones, los agentes para detectar los biomarcadores (por ejemplo, los conjuntos de agentes polinucleótidos o polipeptídicos), y sus usos, son capaces de distinguir entre la presencia y la ausencia de GEP-NEN en una muestra biológica, entre GEP-NEN y otras muestras intestinales y mucosas, tales como muestras de enterocromafína (EC) y mucosa del intestino delgado (SI) y muestras de GEP-NEN, entre muestras metastásicas o agresivas y primarias de GEP-NEN, y/o entre clases o subtipos específicos de GEP-NEN.
En algunas realizaciones, los métodos distinguen entre GEP-NEN y otros cánceres, tales como adenocarcinomas, incluyendo adenocarcinoma gastrointestinal o uno de cáncer de mama, próstata o páncreas, o un cáncer gástrico o hepático, tal como cáncer de esófago, páncreas, vesícula biliar, colon o rectal. En otras realizaciones, los métodos y sistemas diferencian entre GEP-NEN de diferentes sitios, tales como entre GEP-NEN del intestino delgado y aquellos del páncreas.
En una realización, el conjunto de agentes distingue entre enterocromafína (EC) y de mucosa del intestino delgado (SI). En un aspecto, el panel de biomarcadores de GEP-NEN comprende los productos de los genes CTGF, CXCL14, FZD7, Kiss1, FZD, Kiss1, NKX2-3, PNMA2, PTPRN2, SCG5, SPOCK1 y X2BTB48. En otra realización, el sistema o conjunto de agentes distingue entre adenocarcinoma y GEP-NEN, tal como un adenocarcinoma y una muestra de GEP-NEN. En un aspecto, el panel de biomarcadores de GEP-NEN comprende al menos dieciséis biomarcadores de GEP-NEN, que incluyen un producto del gen CgA. En otra realización, el sistema o conjunto de agentes distingue entre una enfermedad por GEP-NEN primaria o metastásica. En un aspecto de esta realización, el panel de biomarcadores de GEP-NEN incluye al menos dieciocho biomarcadores de GEP-NEN.
En algunas realizaciones, el sistema o conjunto de agentes o uso de los mismos distingue entre uno o más diversos subtipos de GEP-NEN, y/o contiene agentes que se unen a o detectan un conjunto de biomarcadores cuyo perfil de expresión o la expresión sumada (por ejemplo expresión sumada vectorialmente) de la cual difiere significativamente entre los diversos subtipos. En un aspecto de esta realización, el sistema distingue entre PDNEC primario y WDNET primario; en un ejemplo, el panel de biomarcadores incluye productos de los genes CXCL14 y MAGE-D2. En otra realización, el sistema distingue entre PDNEC primario y WDNEC primario; en un ejemplo, el panel de biomarcadores de GEP-NEN incluye tres biomarcadores, que incluyen un producto del gen PTPRN2. En otra realización, el sistema distingue entre PDNEC primario y PDNET primario; en un ejemplo, el panel de biomarcadores incluye productos de los genes MTA1 y PNMA2. En otra realización, el sistema distingue entre PDNET primario y WDNET primario; en un ejemplo, el panel de biomarcadores de NE incluye al menos cuatro biomarcadores. En otra
realización, el sistema distingue entre WDNEC primario y WDNET primario; en un ejemplo, el conjunto contiene al menos 21 biomarcadores.
En otra realización, el sistema distingue entre subtipos metastásicos de GEP-NEN, tales como entre WDNEC metastásico y WDNET metastásico, por ejemplo, donde el panel contiene al menos tres biomarcadores, que incluyen un producto del gen CXCL14; entre PDNEC metastásico y WDNEC metastásico, por ejemplo, donde el conjunto de biomarcadores incluye al menos cuatro biomarcadores, incluido un producto del gen NAP1L1; entre PDNEC metastásico y WDNET metastásico, por ejemplo, donde el panel de biomarcadores de GEP-NEN incluye al menos seis biomarcadores, por ejemplo, incluido un producto del gen NRP2.
En un aspecto, el sistema puede clasificar o detectar un GEP-NEN en una muestra de sangre humana o muestra de saliva humana. En un aspecto, la muestra humana es sangre completa o ácido nucleico o proteína preparada a partir de sangre completa, sin primera clasificación o enriquecimiento para cualquier población particular de células. En un aspecto, el sistema incluye agentes que se unen a biomarcadores en un panel de al menos 29 biomarcadores de GEP-NEN.
En algunos aspectos, los métodos y sistemas proporcionan información o determinación de diagnóstico, diferenciación, detección, predicción o pronóstico tal como se describió anteriormente con una mayor sensibilidad, especificidad o precisión en comparación con otro método de diagnóstico, tal como método de detección o diagnóstico disponible, tal como la detección de niveles circulantes de CgA.
En algunas realizaciones, además de los agentes que se unen a los biomarcadores de GEP-NEN, los sistemas proporcionados contienen uno o más agentes que se unen a productos de los genes para su uso en la normalización
o como controles, por ejemplo, productos del gen de mantenimiento, incluyendo uno cualquiera o más de: productos de los genes ACTB, TOX4, TPT1 y TXNIP;
productos del gen de mantenimiento, que incluyen uno o más de: los productos de los genes 18S, GAPDH, ALG9, SLC25A3, VAPA, TXNIP, ADD3, DAZAP2, ACTG1, ACTB, ACTG4B, ARF1, HUWE1, MORF4L1 RHOA, SERP1, SKP1, TPT1, TOX4, TFCP2, y ZNF410;
genes de mantenimiento incluyendo uno o más de los productos de los genes 18S, GAPDH, ALG9, SLC25A3, VAPA, TXNIP, ADD3, DAZAP2, ACTG1, ACTB, ACTG4B, ARF1, HUWE1, MORF4L1 RHOA, SERP1, SKP1, TPT1 y TOX4; o
genes de mantenimiento incluyendo uno cualquiera o más de: productos de los genes ALG9, TFCP2, ZNF410, 18S y GAPDH.
En algunas realizaciones, el sistema distingue entre enterocromafines (EC) y la mucosa del intestino delgado (SI) y el panel de biomarcadores de GEP-NEN incluye además los productos de los genes CTGF, CXCL14, FZD7, Kiss1, FZD, Kiss1, NKX2-3, PNMA2, PTPRN2, SCG5, SPOCK1 y X2BTB48. En otra realización, el panel de biomarcadores de GEP-NEN incluye los productos de los genes MAGE-D2, MTA1, NAP1L1, Ki67, Survivina, FZD7, Kiss1, NRP2, X2BTB48, CXCL14, GRIA2, NKX2-3, OR51E1, PNMA2, SPOCK1, HOXC6, CgA, CTGF, PTPRN2, SCG5 y Tph1. En otra realización, el sistema distingue entre adenocarcinoma y GEP-NEN e incluye un conjunto de polinucleótidos o polipéptidos que hibridan específicamente con un panel de dieciséis o más biomarcadores de GEP-NEN, que incluyen un producto del gen CgA.
En algunas realizaciones, los métodos y sistemas determinan la presencia, ausencia, niveles de expresión o perfil de expresión que indica la presencia, ausencia, clasificación, pronóstico, riesgo, capacidad de respuesta al tratamiento, agresividad, gravedad o metástasis del GEP-NEN. Por ejemplo, en un aspecto, la presencia, ausencia, niveles de expresión o perfil de expresión detectado en la muestra de prueba indica la eficacia de un tratamiento GEP-NEN. En un aspecto, la presencia, la ausencia, los niveles de expresión o el perfil de expresión detectada distinguen entre PDNEC primario y WDNET primario y el panel de biomarcadores incluye productos de los genes CXCL14 y MAGE-D2; en otros aspectos, distingue entre PDNEC primario y WDNEC primario y el panel de biomarcadores incluye tres biomarcadores, que incluyen un producto del gen PTPRN2; en otro aspecto, distingue entre PDNEC primario y PDNET primario, y el panel de biomarcadores incluye los productos de los genes MTA1 y PNMA2; en otro aspecto, distingue entre PDNET primario y WDNET primario o en PDNET primario y WDNEC primario, y el panel de biomarcadores incluye al menos cuatro biomarcadores; en otro aspecto, distingue entre WDNEC primario y WDNET primario, el panel de biomarcadores incluye veintiún biomarcadores; en otro aspecto, distingue entre WDNEC metastásico y WDNET metastásico y el panel de biomarcadores incluye al menos tres biomarcadores, que incluyen un producto del gen CXCL14; en otro aspecto, distingue entre PDNEC metastásico y WDNEC metastásico y el panel comprende al menos cuatro biomarcadores, que incluyen un producto del gen NAP1L1; en otro aspecto, distingue entre PDNEC metastásico y WDNET metastásico y el panel comprende al menos seis biomarcadores, incluido un producto del gen NRP2.
Como se indicó anteriormente, la muestra de prueba biológica utilizada con un método de la invención puede ser una muestra de tejido, sangre o plasma tomada de un paciente con GEP-NEN.
Dicho método incluye además comparar los niveles de expresión o el perfil de expresión de los biomarcadores detectados en la muestra de prueba con un nivel de referencia de expresión o perfil de expresión de referencia en una muestra de referencia del mismo paciente antes del tratamiento.
En algunos casos, se realiza un análisis estadístico para determinar si existe una diferencia, tal como una diferencia significativa, entre los niveles de expresión detectados en la muestra biológica de prueba y la muestra de referencia. Por ejemplo, una diferencia puede considerarse significativa cuando hay un valor p de menos de 0,05 o cuando hay una desviación estándar de ± 2. Otros métodos para determinar la significancia son conocidos en la técnica.
De este modo, la muestra de prueba puede ser de sangre y la muestra biológica de prueba es del paciente con GEP-NEN después del tratamiento y la muestra de referencia es del mismo paciente con GEP-NEN que la muestra biológica de prueba antes del tratamiento.
Los agentes para la detección de biomarcadores son típicamente polinucleótidos aislados o polipéptidos o proteínas aislados, tales como anticuerpos, por ejemplo, aquellos que hibridan específicamente o se unen a un panel de biomarcadores de GEP-NEN que incluyen al menos 21 biomarcadores de GEP-NEN.
Dichos métodos se realizan poniendo en contacto la muestra de ensayo con uno de los agentes proporcionados, más típicamente con una pluralidad de los agentes proporcionados, por ejemplo, uno de los sistemas proporcionados, tal como un conjunto de polinucleótidos que se unen específicamente al panel de biomarcadores de GEP-NEN. En algunas realizaciones, el conjunto de polinucleótidos incluye ADN, ARN, ADNc, PNA, ADN genómico u oligonucleótidos sintéticos. En algunas realizaciones, los métodos incluyen la etapa de aislar ARN de la muestra de prueba antes de la detección, tal como mediante RT-PCR, por ejemplo, QPCR. Por lo tanto, en algunas realizaciones, la detección de los biomarcadores de GEP-NEN, tales como niveles de expresión de los mismos, incluye detectar la presencia, ausencia o cantidad de ARN. En un ejemplo, el ARN se detecta por PCR o por hibridación.
En un aspecto, los polinucleótidos incluyen cebadores sentido y antisentido, tales como un par de cebadores que es específico para cada uno de los biomarcadores de GEP-NEN en el panel de biomarcadores. En un aspecto de esta realización, la detección de los biomarcadores de GEP-NEN se lleva a cabo mediante PCR, típicamente PCR cuantitativa o en tiempo real. Por ejemplo, en un aspecto, la detección se lleva a cabo produciendo ADNc a partir de la muestra de ensayo mediante transcripción inversa; luego amplificando el ADNc usando los pares de cebadores sentido y antisentido que se hibridan específicamente con el panel de biomarcadores de GEP-NEN y detectando productos de la amplificación. En algunas realizaciones, los biomarcadores de GEP-NEN incluyen ARNm, ADNc o proteína.
En algunas realizaciones, los métodos son capaces de detectar bajos volúmenes de GEP-NEN, GEP-NEN de fase temprana, micrometástasis, células GEP-NEN circulantes y/u otras instancias de GEP-NEN que son difíciles de detectar mediante métodos disponibles, tales como imagenología o detección de biomarcadores disponibles tales como GEP-NEN. Por ejemplo, en algunas realizaciones, la muestra es una muestra de sangre, tal como una muestra de sangre completa, y el método detecta al menos a, o aproximadamente, tres células de GEP-NEN por mililitro (mL) de sangre completa.
En algunos aspectos, los métodos comprenden adicionalmente análisis estadísticos y análisis usando modelos predictivos tales como algoritmos matemáticos. En un ejemplo, los métodos incluyen calcular un nivel de expresión medio para el panel de biomarcadores de GEP-NEN en la muestra biológica de prueba. En un aspecto de esta realización, el cálculo se lleva a cabo sumando vectorialmente los niveles de expresión detectados para cada uno de la pluralidad de biomarcadores de GEP-NEN. En algunos aspectos, el nivel de expresión media se compara con un nivel de expresión media de referencia, como el obtenido al realizar los métodos en una muestra de referencia o normal. A menudo, la comparación revela una diferencia significativa en los niveles medios de expresión en la muestra de prueba en comparación con los niveles medios de expresión de referencia. En algunos aspectos, la expresión detectada o los perfiles de expresión son suficientemente diferentes, tales como significativamente diferente o suficientemente sobrerregulados o subregulados, donde hay un valor p de menos de o alrededor de 0,05, o una diferencia de + desviación estándar, o un valor S de ± 0,4, con S < -0,4 o S > 0,4 u otro método conocido, como los descritos en la presente memoria. En algunos aspectos, la expresión, como expresión media, expresión suma media o perfil de expresión detectado y/o determinado en la muestra biológica de prueba se correlaciona con la de otra muestra de GEP-NEN, tal como cuando la muestra de prueba es sangre completa u otra muestra de fluido biológico, y la cantidad se correlaciona con la de un tejido de GEP-NEN o una población celular purificada. Por ejemplo, con un R2 de al menos aproximadamente 0,4, 0,5, 0,6, 0,7, 0,8, 0,9 o 1.
En una realización, el método identifica la presencia o ausencia, clasificación o etapa de GEP-NEN con entre 80% y
100%, tal como en, o aproximadamente, o al menos en, o aproximadamente, 80, 81, 82, 83, 84, 85, 86, 87, 88, 89, 90, 91, 92, 93, 94, 95, 96, 97, 98, 99 o 100% de valor predictivo, sensibilidad o especificidad. En algunas realizaciones, los métodos incluyen una etapa de comprimir los niveles de expresión detectados de los biomarcadores de la muestra biológica de prueba. Típicamente, la compresión se lleva a cabo para determinar el perfil de expresión del panel de biomarcadores.
En algunas realizaciones, la muestra biológica de prueba es una muestra de sangre completa o saliva de un paciente con GEP-NEN y los niveles de expresión o perfil de expresión detectados o determinados para el correlato
o correlatos de muestra biológica de prueba con los niveles de expresión o perfil de expresión para los mismos biomarcadores de GEP-NEN para una muestra de tejido GEP-NEN o una muestra de células GEP-NEN purificadas obtenidas del mismo paciente, con un R2 de al menos aproximadamente 0,4.
En algunas realizaciones, los métodos incluyen etapas para analizar los datos usando un algoritmo predictivo, modelo y/o análisis topográfico. En algunos ejemplos, el algoritmo predictivo es máquinas de vectores de soporte (SVM), análisis discriminante lineal (LDA), vecino más próximo de K (KNN) o Bayes sin procesar (NB). En algunos ejemplos, el algoritmo predictivo es máquinas de vectores de soporte (SVM), análisis discriminante lineal (LDA) o vecino más próximo de K (KNN). En otros ejemplos, el algoritmo es árbol de decisión, SVM, RDA o Perceptron, u otro modelo conocido en la técnica o descrito en este documento. En un aspecto, el modelo o algoritmo determina la presencia, ausencia, naturaleza metastásica o no metastásica de un GEP-NEN, o distingue entre dos o más clases de GEP-NEN con una tasa de clasificación errónea de entre 0,05 a 0.
También entre los métodos proporcionados están los métodos para detectar células tumorales neuroendocrinas en sangre, obteniendo una muestra de sangre; y poner en contacto la muestra de sangre con uno o más agentes, que se unen específicamente a un panel de biomarcadores de GEP-NEN, que incluye al menos dos biomarcadores de GEP-NEN, en los que el método detecta al menos o aproximadamente uno, dos, tres, cuatro, o cinco células por mL de sangre. Células de GEP-NEN por mL de sangre.
También entre las realizaciones proporcionadas se encuentran métodos para enriquecer o aislar células de GEP-NEN de fluidos y mezclas de células, tales como plasma, sangre, capa leucocitaria, cultivo celular, fluido biológico u otra preparación celular. En un aspecto de esta realización, el método se lleva a cabo poniendo en contacto la mezcla de células con un agente que se une específicamente a un biomarcador de GEP-NEN y purificando las células que se unen al agente. En un aspecto de esta realización, el biomarcador es CD164. En un aspecto, el biomarcador es un biomarcador polipeptídico. En uno de esos aspectos, el agente es un anticuerpo que se une específicamente al biomarcador, tal como un anticuerpo CD164. En algunas realizaciones, la purificación es mediante FACS o purificación en columna o cualquier otro método conocido para purificar células basándose en la afinidad. En un aspecto, el contacto incluye además poner en contacto las células con otro agente específico de GEP-NEN. En algunos aspectos, el método enriquece o aísla al menos en, o aproximadamente, una, dos, tres, cuatro o cinco células por mL de sangre.
También se proporcionan métodos y usos de los biomarcadores, agentes, sistemas y métodos de detección proporcionados para usar en el tratamiento de GEP-NEN y el monitoreo del tratamiento. Por ejemplo, se proporcionan métodos que usan los métodos de diagnóstico, predictivo y de detección descritos anteriormente junto con el tratamiento de GEP-NEN, como para analizar una muestra obtenida de un sujeto sometido a tratamiento o que se estaba sometiendo previamente a tratamiento para GEP-NEN. En una realización, dichos métodos se llevan a cabo obteniendo una muestra de dicho paciente y detectando o determinando la presencia o ausencia de expresión, niveles de expresión o perfil de expresión de un biomarcador de GEP-NEN, típicamente un panel de biomarcadores de GEP-NEN, en la muestra. En un aspecto, el método incluye primero proporcionar un tratamiento al paciente. En tales métodos, el biomarcador o paneles generalmente es o se detectan usando un agente o sistema como se proporciona en este documento, tal como los descritos anteriormente. En algunos aspectos, el método incluye además, antes de proporcionar el tratamiento, determinar una cantidad de pretratamiento, presencia, ausencia, niveles de expresión o perfil de expresión en una muestra del paciente del biomarcador o panel de biomarcadores. Por lo tanto, en algunos ejemplos, la cantidad de pretratamiento, presencia, ausencia, niveles de expresión o perfil de expresión es o se comparan con la cantidad, presencia, ausencia, niveles de expresión o perfil de expresión determinado o detectado en el paciente después del tratamiento.
En algunos casos, este análisis determina que existe una diferencia en los niveles de expresión entre los niveles de expresión previos al tratamiento y los niveles de expresión posteriores al tratamiento, que pueden indicar la eficacia del tratamiento. En algunos casos, el método incluye además determinar la cantidad de expresión, presencia, ausencia, niveles o perfiles de los biomarcadores en el paciente o una muestra del paciente en un momento posterior. Dichos métodos pueden incluir además la comparación de la información desde el momento posterior hasta la detectada o determinada originalmente. Esta información, por ejemplo, una diferencia entre los niveles de expresión, presencia, ausencia, niveles o perfiles puede indicar información sobre si el individuo ha respondido al tratamiento, por ejemplo, puede indicar recurrencia, falta de respuesta al tratamiento, enfermedad estable, o
enfermedad progresiva.
En algunas realizaciones, tales métodos proporcionan la ventaja de proporcionar información más sensible, específica o precisa en comparación con los métodos de diagnóstico disponibles, tales como la detección de niveles de CgA en el suero u otra muestra. Por lo tanto, en un ejemplo, los métodos proporcionan la información de diagnóstico, pronóstico o predictiva indicada en un caso donde los niveles de expresión de CgA no son significativamente diferentes en las muestras analizadas, por ejemplo, entre las muestras de pretratamiento y post tratamiento y/o la muestra tomada en un punto de tiempo posterior, o entre la muestra de prueba y la muestra normal.
En algunos casos, el tratamiento se interrumpe o modifica basándose en la determinación de los métodos. Los métodos se pueden realizar de forma iterativa, reevaluando o modificando el tratamiento de acuerdo con los niveles de expresión o perfiles o comparaciones. Por lo tanto, en algunas realizaciones, los métodos incluyen además interrumpir el tratamiento o modificar el tratamiento proporcionado al paciente, por ejemplo, basándose en la información determinada por el enfoque de diagnóstico. En algunos casos, la cantidad de comparación y/o expresión, presencia, ausencia, niveles o perfil indica la presencia de una micrometástasis de GEP-NEN en el paciente. En un ejemplo, una o más de las muestras tomadas del paciente está o se determinó que estaba libre de GEP-NEN, metástasis de GEP-NEN o recurrencia de GEP-NEN por otro método de diagnóstico, tal como mediante histología o detección de CgA solo.
En otras realizaciones, los métodos de tratamiento se llevan a cabo obteniendo una primera muestra de un paciente con GEP-NEN y detectando los niveles de expresión de un panel de biomarcadores de GEP-NEN en la primera muestra; proporcionar un tratamiento al paciente; obtener una segunda muestra del paciente con GEP-NEN y detectar los niveles de expresión del panel de biomarcadores de GEP-NEN en la segunda muestra; y comparar los niveles de expresión detectados en la primera muestra con los detectados en la segunda muestra. En un aspecto, el método incluye además determinar si existe una diferencia en los niveles de expresión entre la primera y la segunda muestra, por ejemplo, determinar que existe tal diferencia. En un ejemplo, la diferencia indica la eficacia del tratamiento. En una realización adicional, el método incluye además obtener una tercera muestra del paciente, detectar los niveles de expresión en la tercera muestra y compararlos con los niveles de expresión en la primera o la segunda muestra. En algunos casos, la comparación indica la presencia de una metástasis, tal como micrometástasis. En algunas realizaciones, una o más de las muestras se toman de un paciente que se ha determinado que está libre de GEP-NEN, metástasis de GEP-NEN o recurrencia de GEP-NEN mediante otro ensayo, tal como la detección de CgA solo, imagenología o histología, sin embargo, los métodos detectan la presencia de GEP-NEN, metástasis de GEP-NEN o recurrencia de GEP-NEN en la misma muestra.
En un ejemplo, el método incluye además determinar que existe una diferencia entre los niveles de expresión detectados en la segunda y tercera muestras, donde la diferencia indica una recurrencia o falta de respuesta al tratamiento. En algunos aspectos, los niveles de expresión de CgA en la segunda muestra no son significativamente diferentes en comparación con los de la primera muestra o la tercera muestra.
Breve descripción de los dibujos
FIG. 1. Distribución de expresión génica a través de tejidos normales, localizados y malignos. La expresión de genes individuales (enumerados en gráficos individuales anteriores) en las muestras se comparó con la expresión promedio en las células enterocromafines (EC) normal y se asignó a la clase sobrerregulada, subregulada o de línea base. Cada gráfico muestra resultados para tejidos normales, malignos y localizados, de izquierda a derecha. Las elipsoides corresponden a un umbral de ± 2 desviaciones estándar (SD). Todos los valores p: p <0,05.
FIG. 2. Análisis del componente principal (PC) de los tumores neuroendocrinos primarios de intestino delgado, metástasis y células EC normales. Niveles de expresión por PCR en tiempo real normalizados a Ln de biomarcadores indicados, reducidos a 3 PC, que representan una varianza del 75,6% en subtipos de tumores primarios y preparaciones de células EC normales (2A) y varianza del 73,2% en subtipos de tumores primarios y las correspondientes metástasis (2C). Para tumores primarios y células EC normales, se observaron tres grupos de genes con patrones de expresión similares (2B), con dos grupos identificados en las metástasis correspondientes (2D).
FIG. 3: Matriz de similitud usando la correlación de Pearson de las expresiones del gen marcador en tumores neuroendocrinos primarios de intestino delgado y células EC normales. Niveles de expresión de PCR en tiempo real normalizados en Ln de genes indicados graficados en los ejes X y Y.
FIG. 4: Mapa de densidad de distribuciones entre células EC normales y tumores neuroendocrinos de intestino delgado. Los niveles de expresión de los transcritos indicados como se identifican mediante FS graficado en los ejes X y Y, con muestras normales y neoplásicas dispersas según las respectivas expresiones de pares de genes, las densidades de distribución basadas en la distancia euclidiana promedio (diferencia en expresión) entre muestras se
colorearon en verde (normales) y rojo (neoplásicas). Las áreas azules indican una región de transición entre grupos normales y neoplásicos.
FIG. 5: Árbol de decisión que clasifica tumores neuroendocrinos primarios de intestino delgado. Los niveles de expresión de NAP1L1 y Ki-67 se identificaron como discriminadores principales en el clasificador del árbol de decisión utilizando la selección de características. El modelo se construyó correlacionando los valores de NAP1L1 y Ki-67 con los subtipos de tumores primarios. Los porcentajes entre paréntesis indican las frecuencias de aparición de los subtipos de tumores neuroendocrinos primarios del intestino delgado.
FIG. 6: Mapa de densidad de las distribuciones entre los tumores neuroendocrinos primarios de intestino delgado y sus metástasis. Los niveles de expresión de transcritos Kiss1, NAP1L1, MAGE-D2 y CgA identificadas por el algoritmo FS trazadas en los ejes X y Y. Subtipos de tumores neuroendocrinos primarios de intestino delgado (WDNET, WDNEC, PDNEC) y las metástasis respectivas (MET) dispersos según sus respectivas expresiones de pares de genes (6A-C). Las densidades de distribución basadas en la distancia euclidiana promedio (diferencia en la expresión) entre las muestras se colorearon de azul (tumores primarios) y de rojo (metástasis). Las áreas verdes indican una región de transición entre los subtipos de tumores primarios y las metástasis respectivas.
FIG. 7: Evaluación del desempeño del clasificador en los conjuntos de prueba y entrenamiento. El gráfico muestra el porcentaje de muestras validadas correctamente en los conjuntos de entrenamiento y prueba, mostrando las células EC normales validadas en forma cruzada con el 77% de precisión y predichas en un conjunto de prueba independiente con el 76% de precisión (p = 0,84). Los NET localizados se validaron en forma cruzada con un 78% de precisión y se predijeron con una precisión del 63% en el conjunto de prueba (p = 0,25). Los NET malignos se validaron en forma cruzada con el 83% de precisión y se predijeron con un 83% de precisión en un conjunto independiente (p = 0,80).
FIG. 8: análisis del componente principal (PCA) y expresión de genes marcadores en NET, adenocarcinomas y tejidos normales. 8A. Las expresiones de transcritos del panel de 21 marcadores genéticos se redujeron a 3 componentes principales que capturan la mayor parte de la varianza (83%) dentro del conjunto de datos. Cada centroide (expresión promedio) corresponde al perfil de expresión del transcrito de la muestra como lo proporciona su vector componente principal. En esta representación, la proximidad de la separación entre los centroides es indicativa del grado de similitud. Por lo tanto, el panel de genes marcadores puede distinguir con éxito los adenocarcinomas (mama, colon, páncreas), la mucosa de SI normal, las células EC normales y los subtipos NET primarios y metastásicos. Es de destacar que las células EC normales tienen un perfil genético sustancialmente diferente de la mucosa SI normal y el tejido neoplásico. 8B. Un análisis de la proporción de muestras que expresan cada uno de los genes marcadores, demostró que significativamente más muestras de NET (> 95%) fueron positivas para 16 de los genes marcadores en comparación con los adenocarcinomas (AC). Los genes altamente expresados en ambos tipos de tumores incluyeron CTGF, FZD7, NRP2, PNMA2 y survivina. NML = mucosa de SI normal, NML_EC = célula de EC normal, MET = metástasis, WDNET = NET bien diferenciada; WDNEC = carcinoma neuroendocrino bien diferenciado; PDNET = NET poco diferenciado; PDNEC = NEC pobremente diferenciado. *p <0,002 de NET de SI versus adenocarcinomas (prueba exacta de Fisher).
FIG. 9: Mapa de calor de los coeficientes de correlación y red de relaciones de pares de genes altamente correlacionados. 9A. Coeficientes de correlación de Pearson (R2) para cada gen en todos los tipos de tejidos se calcularon y representaron como un mapa de calor con el valor más bajo (-0,03) representado en negro, medio (0,4) en gris oscuro y el más alto (1) en gris claro. 9B. Se construyó una red de coexpresión de modo que los pares de transcritos con R2 > 0,40 se conectaran por un borde. Los valores reales de R2 se superponen en cada borde.
FIG. 10: Gráficos de volcán de intervalos de genes y valores de significancia (p) para una prueba t. 10 A. Se calculó una prueba t de dos muestras para identificar genes expresados diferencialmente en 1) células EC, mucosa de SI normal y tejidos primarios y metastásicos; 2) subtipos de NET primario; 3) subtipos de NET metastásico. En células EC normales comparadas con mucosa de SI normal, la expresión del transcrito del marcador neuroendocrino clásico Tph1, fue significativamente mayor (p < 0,001, S = 0,7). 10B. Comparado con la mucosa de SI normal, el tejido neoplásico expresó niveles más altos de transcrito de CgA y GRIA-2, sin embargo, la expresión de CgA no se alteró significativamente (p = 0,07, S = 0,39) entre el tejido neoplásico y células de EC normales. 10C. No hubo genes expresados diferencialmente entre todas las metástasis como un grupo y todos los diferentes subtipos de NET primario cuando se analizaron como un grupo. 10D. No hubo transcritos diferencialmente expresadas entre PDNET-PDNEC y WDNET-PDNEC, y en WDNEC-PDNEC, MAGE-D2 fue el único marcador significativo (p=0,009, S=1,03). CgA, Kiss1, NRP2 y Tph1 se expresaron diferencialmente entre todos los subtipos de metástasis.
FIG. 11: expresión del transcrito en sangre completa. Los genes de mantenimiento (ALG-9, TFCP2, ZNF410) se identificaron en el plasma después del aislamiento del ARNm de Trizol (11A) y el enfoque del mini kit de sangre de ARN de QIAamp (11B), mostrando la identificación de genes de mantenimiento en significativamente más muestras (8/15 frente a 2/15, p = 0,05) después del aislamiento con el enfoque del Mini Kit de sangre de ARN de QIAamp.
Los niveles de expresión del transcrito de los mismos 3 genes de mantenimiento y 11 genes biomarcadores de NET se evaluaron mediante PCR en ARNm preparado a partir de sangre completa de 3 donantes sanos (muestras normales), que muestran niveles de expresión de genes detectados altamente correlacionados a través de las muestras (11C).
FIG. 12. Expresión del transcrito combinado promedio de cada gen (12A). Los transcritos exhibieron una baja variabilidad: 0,04-0,45 (mediana 0,12). Análisis del componente principal de la expresión del gen marcador promedio para todas las muestras (12B). Los algoritmos matemáticos (SVM, LDA, KNN y NB) identificaron que las llamadas correctas se realizaron para tiempos 0, 30 minutos, 1 hora, 2 horas y 4 horas. Las tasas de llamadas inconsistentes ocurrieron entre 8 -48 horas, lo que indica que el tiempo óptimo para el almacenamiento en un refrigerador antes de la congelación es de 0 a 4 horas.
FIG. 13: Identificación del gen de mantenimiento más apropiado y determinación del efecto de la alimentación de transcritos de ALG-9 en sangre completa. La expresión del transcrito de 5 genes de mantenimiento se evaluó en 5 controles sanos. ALG-9 fue identificado por tener la menor variación (13A). La expresión de ALG-9 se midió en función del tiempo después de la alimentación, y no mostró alteración significativa después de la alimentación (hasta 4 horas) (13B).
FIG. 14: Análisis topológico de los genes candidatos de mantenimiento mapeados para el interactoma sanguíneo
(7.000 genes, 50.000 interacciones): Grado (14A), intermediación (14B) y agrupamiento (14C). Los genes con los valores más bajos en cada categoría incluyen TXNIP, ACTB, TOX4 y TPT1. El análisis de los genes de mantenimiento asociados a la sangre y al tejido identificó posibles genes candidatos para los protocolos de normalización.
FIG. 15: Valores de CT sin procesar graficados como una función de genes de mantenimiento candidatos derivados de tejido o derivados de sangre. Los genes con la menor variación incluyen ALG9, ARF1, ATG4B, RHDA y SKP1. Se incluyen la media y la SD. Se asignó un valor de 40 a las muestras sin amplificación. Las muestras sin expresión génica reciben un valor de 40 (por ejemplo, 4 muestras amplificadas usando MORF4L1). El análisis de los genes de mantenimiento candidatos identificó un número relativamente pequeño (n = 6) que mostraron baja variabilidad y fueron candidatos para el desarrollo de protocolos de normalización.
FIG. 16: Valores de M para cada uno de los genes de mantenimiento candidatos calculados usando el programa geNorm. ALG9 fue el más estable de los genes derivados de tejido. Nueve de los 10 genes derivados de sangre (excepto SERP1) se consideraron robustos. Marcadores robustos (cuadros punteados).
FIG. 17: Curvas de eficiencia de PCR graficadas para cada uno de los genes de mantenimiento candidatos. La amplificación eficiente ocurre entre 0,9-1,0. Los valores inferiores a 0,9 indican una unión subóptima del cebador y una amplificación ineficaz. Los valores superiores a 1,0 identifican sobreamplificación, presumiblemente a través de una unión de cebadores no específica. Los genes con una eficiencia apropiada incluyen 18S, ALG9 y TPT1. Media ± SD, n = 3. Un pequeño número de candidatos (n = 3) mostraron eficacia como genes de mantenimiento.
FIG. 18: Varianza en la cinética de amplificación para los genes de mantenimiento y objetivo. Los valores ~0,1 demuestran eficiencias de PCR similares e indican que el gen de mantenimiento puede usarse en métodos comparativos de CT. ALG9 fue el único gen de mantenimiento que exhibió una eficiencia aceptable para los protocolos de normalización.
FIG. 19: Varianza en la expresión del gen objetivo en muestras normales usando un protocolo geNorm (usando como genes de mantenimiento 18S, ALG9 y GAPDH) o ∆∆CT con ALG9. Este último exhibió un coeficiente de variación significativamente menor para cada uno de los genes objetivo y ~60% de los genes exhibieron una distribución normal. * p <0,004 (prueba de Mann-Whitney). El método óptimo para la normalización fue ∆∆CT.
FIG. 20: Identificación de genes asociados al tejido de matrices U133A y HUGE. PCA de los GEP-NEN comparada con otras neoplasias (mama, colon, próstata e hígado) identificó que el transcriptoma era más similar a la enfermedad de Crohn (20A). La resta de expresión del transcrito asociada con otra neoplasia identificó una firma de gen de GEP-NEN específica (modelada como un interactoma, 20B). El análisis retrospectivo de las matrices tisulares identificó 21 marcadores novedosos que diferenciaron el control de los GEP-NEN tanto por análisis jerárquico de conglomerados (20C) como por análisis de componentes principales (PCA) (20D). Los SI-NEN exhiben un espectro del transcrito diferente a otros cánceres. Se puede identificar una firma genética específica de NEN, que puede diferenciar estos tumores de las muestras de control.
FIG. 21: Perfiles de expresión génica en la sangre (21A, D), "Propio" (21B, E), y conjuntos de datos públicos (21C, F). El análisis de la expresión del transcrito identificó que las muestras tanto del, tejido de GEP-NEN como de sangre podrían diferenciarse de los controles. Esto indica que cada uno de estos compartimentos contiene una huella molecular de GEP-NEN definible que se puede medir y usar para distinguir los tumores de los controles.
FIG. 22: perfiles de correlación de los cambios del transcrito en muestras de sangre y tejido. Ambas bases de datos de tejidos estaban altamente correlacionadas (R = 0,59, 22A) pero se observaron correlaciones más bajas entre los transcriptomas de sangre y el conjunto de datos "propio" (R = -0,11, 22B) o el conjunto de datos públicos (R = -0,05, 22C) . Los genes comunes identificados tanto en el tejido como en las muestras de sangre proporcionaron un grupo de transcritos del marcador candidato que luego se examinaron en sangre.
FIG. 23: A: procesos biológicos correlacionados y anti-correlacionados en transcriptomas de GEP-NEN de sangre periférica y muestras de tejido tumoral. B y C: Ochenta y cinco genes asociados con la función tumoral (señalización intracelular y transcripción y regulación de la muerte celular), se sobrerregularon en muestras de tejido y sangre. Se consideró que este grupo representaba biomarcadores circulantes candidatos evaluables.
FIG. 24: La expresión de los 22 genes con bajo número de parálogos (0-3) es ~ 3 veces más central en el interactoma de la sangre en comparación con todos los otros genes (~6.000 genes). Este grupo de genes específicos, con pocos parientes, está presente en la sangre y puede considerarse como marcadores potenciales de neoplasias neuroendocrinas.
FIG. 25: FACS de sangre completa teñida dual AO/APC-CD164 de un paciente con NET metastásicos. El análisis de citometría de flujo después de tinción dual AO (naranja de acridina)/APC-CD164 de sangre completa de un paciente con NET metastásico mostró una población distinta de células de tamaño constante con células NET (P1, flecha: 25A) que presenta la positividad característica de AO/APC de los NET (25B). Esta población de células se recolectó (25C); la inmunotinción con anti-TPH confirmó que las células eran células de NET (inserción 25C).
FIG. 26: Relación entre los niveles de marcador de PCR de sangre completa y los NET circulantes recolectados por FACS y tejido. Los niveles de expresión de sangre completa de transcritos de biomarcadores estaban altamente correlacionados (p <0,0001) con muestras clasificadas por FACS (que representan células tumorales circulantes (26A)) y con tejido (26B), confirmando que la sangre completa es un compartimento apropiado para medir transcritos de NET.
FIG. 27: ROC y sensibilidad y especificidades para predecir los NET. Se calcularon ROC y AUC para genes seleccionados (3 paneles superiores) y transcritos sumados (V1) (abajo a la izquierda) en muestras de Yale (NET y controles) como se describe en el Ejemplo 5D. El uso de cortes predichos se analizó en los NET de Berlín y Uppsala y se proporcionan sensibilidades y especificidades (abajo a la derecha).
FIG. 28: Estudios de reproducibilidad de genes objetivo en sangre. La reproducibilidad del gen marcador ALG9 y el gen objetivo, FZD7, demostró alta correlación: R2: 0,92-0,97, p <0,0001 (28A-B). Las reproducibilidades intra e inter ensayo fueron altas para FDZ7 normalizado (28C-D, CV = 2,28-3,95%); no se observaron diferencias entre FZD7 normalizado en controles y muestras tumorales (28D), lo que demuestra la reproducibilidad significativa de las mediciones en sangre.
FIG. 29: Desempeño del panel del gen marcador en la diferenciación del tejido normal de GEP-NEN (tratado y sin tratamiento). Los cuatro algoritmos matemáticos exhibieron métricas de desempeño similares de ~ 88%.
FIG. 30: Corrección de tasas de llamadas para cada uno de los algoritmos matemáticos (SVM, LDA, KNN y Bayes) en cada uno de los cuatro conjuntos independientes. El panel de 51 marcadores tuvo significativamente más llamadas correctas (20% mejor) que cualquiera de los 25 o 13 subconjuntos del panel. El aumento del número de genes marcadores aumentó la sensibilidad de detección de GEP-NEN en la sangre. Media ± SEM. * p <0,008 frente a 13 y 25 paneles (valor de Yates 6,8-14,7; prueba de probabilidad exacta de 2 colas de #Fisher <0,005).
FIG. 31: Alteraciones en los niveles del marcador de PCR en sangre y CgA durante la resección quirúrgica. La escisión tumoral redujo significativamente los niveles de expresión de un panel de biomarcadores ("PCR") como se describe en el Ejemplo 5H, cuando se midió 2 semanas después de la operación (31A). Los niveles de CgA fueron variables (31B). horizontal = media n = 9 pacientes.
FIG. 32: Alteraciones en los niveles del marcador de PCR en sangre y CgA durante la terapia con Octreótido LAR. El Octreótido LAR redujo significativamente los niveles de expresión en sangre del panel de biomarcadores ("PCR") como se describe en el Ejemplo 5H; la expresión permaneció suprimida durante el curso del tiempo (32A). Los niveles de CgA fueron variables antes de reducirse en 6 meses (32B). *p <0,02 frente a BEFORE #p = 0,06 frente a 1 MES. Línea horizontal = media MON = mes. n = 8 pacientes.
FIG. 33: Alteraciones en los niveles del marcador de PCR en sangre y CgA después de crioablación. Los niveles de expresión de CgA y un panel de 13 biomarcadores (PCR+) en el paciente SK antes y en diversos momentos después de la crioablación, como se describe en el Ejemplo 5H, con cambios en la expresión de biomarcadores que se correlacionan con la aparición de micrometástasis.
FIG. 34: Alteraciones en los niveles de marcadores de PCR en sangre y CgA durante la resección quirúrgica y terapia con Octreótido LAR. Los niveles de expresión de CgA y los niveles de un panel de biomarcador de NET en el paciente BG, como se describe en el Ejemplo 5H, se midieron hasta 2 semanas después de la operación y después de Octreótido LAR.
FIG. 35: porcentaje total de llamadas correctas para pacientes en remisión completa (Grupo I: respondedores completos [CR], n = 12), considerados clínicamente como que muestran enfermedad estable (SD) después de la cirugía (n = 42, Grupo II -SD-Sx) o después del tratamiento con análogos de somatostatina de acción prolongada (LAR: n = 78, Grupo III -SD-LAR). *Esto incluye pasireotida: n = 1 y everolimus: n = 4). La prueba de PCR exhibió entre 90-100% de tasas de llamadas correctas para las muestras tratadas.
FIG. 36: Los análisis matemáticos que incluyen SVM, LDA, KNN y Bayes demostraron que el panel de 13 marcadores podría diferenciar entre enfermedad estable y progresiva con sensibilidades de ~ 73%.
FIG. 37: Comparación de los niveles de CgA DAKO en muestras de sangre de control y con GEP-NEN (no tratadas y tratadas) (n = 130). Se observaron diferencias entre las muestras no tratadas y las tratadas utilizando la prueba t de Student (37A) o los análisis no paramétricos (37B). Las cruces rojas representan valores atípicos (37A) y la escala y se transforma logarítmicamente con fines de visualización (37A, B). Los niveles de CgA pueden distinguir consistentemente entre grupos normales y no tratados, pero muestran una superposición significativa con las muestras tratadas.
FIG. 38: Utilidad de ELISA de CgA para detectar correctamente GEP-NEN y diferenciar las muestras tratadas de las no tratadas. Utilizando 19 U/L como punto de corte (según los criterios DAKO), el porcentaje total de llamadas correctas para GEP-NEN y controles fue del 70% y las medidas de desempeño fueron mejores en pacientes no tratados en comparación con pacientes tratados (sensibilidad del 63% frente a 45%). Los niveles de CgA identifican mejor a pacientes no tratados y muestras de individuos sin enfermedad (controles).
FIG. 39: Comparación de las tasas de llamadas correctas para los niveles circulantes de CgA DAKO y los algoritmos individuales usando el enfoque basado en PCR a través de muestras de sangre de control y con GEP-NEN (no tratadas y tratadas) (n = 130). Las tasas de llamadas fueron significativamente mayores para la prueba basada en PCR (~90-95% para cada uno de los algoritmos) en comparación con ~ 50% de CgA (FIG. 39A). La inclusión de valores de CgA en el algoritmo no aumentó las tasas de llamadas correctas, y se asoció con una disminución en las llamadas correctas para el algoritmo KNN (FIG. 39B).
FIG. 40: puntaje de PCR para una muestra de sangre obtenida de un control normal (línea punteada negra: puntaje de PCR = 15, llamada "normal") y del caso 1 que presenta metástasis mesentérica (línea punteada roja: puntaje de PCR: 68 llamada "tumor no tratado". Las distribuciones de población están en líneas continuas. Esto proporciona una ilustración de la relación entre las llamadas de algoritmo y un puntaje (índice de transcripción).
FIG. 41: PCA de SI-NEN (n = 46) y PNEN (n = 18) identificaron que el panel de marcador 51 podría diferenciar entre NEN pancreáticos y NEN de intestino delgado (41A). Una variedad de algoritmos matemáticos que incluyen SVM, LDA, KNN y Bayes demostraron que estos dos grupos tumorales podrían diferenciarse con una sensibilidad global de ~92% (FIG. 41B). La firma para SI-NEN es diferente a la de PNEN.
FIG. 42: PCA de GEP-NEN (n = 64) y cánceres GI (n = 42) identificaron que el panel marcador 51 podría diferenciar entre los dos tipos de neoplasia (FIG. 42A). Los análisis matemáticos que incluyen SVM, LDA, KNN y Bayes demostraron que estos dos tipos de tumores podrían diferenciarse con sensibilidades de ~83% (FIG. 42B). La firma para GEP-NEN es diferente a los cánceres GI.
FIG. 43: Comparación del enfoque basado en PCR y los niveles de CgA DAKO a través de muestras de sangre de control y de GEP-NEN (no tratadas y tratadas) (n = 130). Las tasas de llamadas fueron significativamente más altas para la prueba basada en PCR para identificar un GEP-NEN o para diferenciar entre muestras tratadas y no tratadas. * p <0,0005 frente a CgA, #p <0,02 frente a CgA. La prueba de sangre por PCR es significativamente más precisa que la medición de los niveles de CgA para detectar tumores y diferenciar a los pacientes tratados de los no tratados.
Descripción detallada
A. Definiciones
A menos que se defina lo contrario, todos los términos de la técnica, anotaciones y otras terminologías científicas utilizadas en el presente documento pretenden tener los significados comúnmente entendidos por los expertos en la técnica a la que pertenece esta invención. En algunos casos, los términos con significados comúnmente entendidos se definen aquí para mayor claridad y/o para referencia rápida, y la inclusión de tales definiciones en el presente
documento no debe interpretarse necesariamente como una diferencia sustancial con respecto a lo que generalmente se entiende en la técnica. Las técnicas y procedimientos descritos o referenciados en este documento son generalmente bien entendidos y comúnmente empleados usando metodología convencional por los expertos en la técnica, tales como, por ejemplo, las metodologías de clonación molecular ampliamente utilizadas descritas en Sambrook et al., Molecular Cloning: A Laboratory Manual. 2da. edición (1989) Cold Spring Harbor Laboratory Press, Cold Spring Harbor, N.Y. Según corresponda, los procedimientos que implican el uso de kits y reactivos disponibles comercialmente generalmente se llevan a cabo de acuerdo con los protocolos y/o parámetros definidos por el fabricante a menos que se indique lo contrario.
Como se usa en el presente documento, el término "biomarcador de GEP-NEN" y "biomarcador de NET" se refieren de forma sinónima a una molécula biológica, tal como un producto del gen, cuya expresión o presencia (por ejemplo, el nivel de expresión o perfil de expresión) por sí mismo o en comparación con uno o más biomarcadores (por ejemplo, expresión relativa) difiere (es decir, aumenta o disminuye) dependiendo de la presencia, ausencia, tipo, clase, gravedad, metástasis, ubicación, etapa, pronóstico, síntoma asociado, resultado, riesgo, probabilidad de respuesta al tratamiento o pronóstico de la enfermedad GEP-NEN, o se asocia de manera positiva o negativa con dichos factores o con la predicción de los mismos.
Como se usa en el presente documento, el término "polinucleótido" o molécula de ácido nucleico significa una forma polimérica de nucleótidos de al menos 10 bases o pares de bases de longitud, ya sean ribonucleótidos o desoxinucleótidos o una forma modificada de cualquier tipo de nucleótido, y se entiende que incluye formas de ADN de cadena simple o doble. Como se usa en el presente documento, una molécula o secuencia de ácido nucleico o ácido nucleico de la invención que sirve como sonda en un análisis de microarreglos preferiblemente comprende una cadena de nucleótidos, más preferiblemente ADN y/o ARN. En otras realizaciones, una molécula de ácido nucleico o secuencia de ácido nucleico de la invención comprende otros tipos de estructuras de ácido nucleico tales como, por ejemplo, una hélice de ADN/ARN, ácido nucleico peptídico (PNA), ácido nucleico bloqueado (LNA) y/o una ribozima. Por lo tanto, como se usa en este documento, el término "molécula de ácido nucleico" también abarca una cadena que comprende nucleótidos no naturales, nucleótidos modificados y/o bloques de construcción no nucleotídicos que exhiben la misma función que los nucleótidos naturales.
Como se usa en el presente documento, el término "polipéptido" significa un polímero de al menos 10 aminoácidos. A lo largo de la especificación, se usan designaciones estándar de tres letras o letras únicas para aminoácidos.
Como se usa en este documento, los términos "hibridar", "que hibrida" y similares, usados en el contexto de polinucleótidos, se refieren a condiciones de hibridación convencionales, preferiblemente tales como hibridación en al 50% de formamida/6XSSC/0,1% SDS/100 µg/mL de ADNmc, en el que las temperaturas para la hibridación son superiores a 37ºC y las temperaturas para el lavado en 0.1XSSC/0.1% SDS están por encima de 55ºC y lo más preferiblemente a condiciones de hibridación rigurosas.
En el contexto de las comparaciones de secuencias de aminoácidos, el término "identidad" se usa para expresar el porcentaje de residuos de aminoácidos en la misma posición relativa que son los mismos. También en este contexto, el término "homología" se usa para expresar el porcentaje de residuos de aminoácidos en las mismas posiciones relativas que son idénticas o similares, usando los criterios de aminoácidos conservados del análisis BLAST, como se entiende generalmente en la técnica. A continuación se proporcionan más detalles con respecto a las sustituciones de aminoácidos, que se consideran conservadoras según dichos criterios.
Se proporcionan definiciones adicionales a lo largo de las subsecciones que siguen.
B. Enfermedad y biomarcadores de GEP-NEN
El diagnóstico y el pronóstico de GEP-NEN han sido difíciles, en parte debido a los síntomas y síndromes prosaicos de la enfermedad, tales como síndrome carcinoide, diarrea, rubor, sudoración, broncoconstricción, hemorragia GI, enfermedad cardíaca, dolor abdominal intermitente, que a menudo permanece en silencio durante años. Los métodos de diagnóstico disponibles incluyen la localización anatómica, tal como mediante imagenología, por ejemplo, rayos X, endoscopia gastrointestinal, tomografía computarizada (TC) abdominal, radiocirugía estereotáctica combinada (SRS)/CT y MRI, y detección de algunos productos de los genes. Los métodos conocidos son limitados, por ejemplo, por baja especificidad y/o sensibilidad y/o en la capacidad de detectar una enfermedad en estadio temprano. La detección de biomarcadores individuales no ha sido del todo satisfactoria, por ejemplo, para identificar malignidad en muestras de sangre humana y predecir resultados complejos como fibrosis y metástasis. Véase Michiels S, Koscielny S, Hill C, "Interpretation of microarray data in cancer", Br J Cancer 2007; 96 (8): 1155-8. Las limitaciones en los métodos disponibles han contribuido a las dificultades en la clasificación patológica, la estadificación y la predicción, el desarrollo del tratamiento y el control de los efectos terapéuticos. Entre las realizaciones proporcionadas en este documento están los métodos y composiciones que abordan estas limitaciones.
En un aspecto, la invención proporcionada se refiere a la detección e identificación de biomarcadores de GEP-NEN y paneles de tales biomarcadores, por ejemplo, en muestras biológicas. Se proporcionan métodos y composiciones (por ejemplo, agentes, tales como polinucleótidos) para detectar, determinar niveles de expresión y reconocer o unirse a los biomarcadores, en muestras biológicas, típicamente muestras de sangre, y para detectar y analizar perfiles de expresión (firmas) de paneles de biomarcadores. También se proporcionan composiciones y combinaciones que contienen los agentes, incluidos conjuntos (paneles) de agentes, sistemas y kits, para su uso en los métodos proporcionados.
También se proporcionan métodos y composiciones para la detección, enriquecimiento, aislamiento y purificación de células de GEP-NEN, por ejemplo, células de GEP-NEN circulantes (CNC), por ejemplo, de una muestra de sangre, cultivo, mezcla de células, fluido, u otra muestra biológica, con base en la expresión de uno o más de los biomarcadores de GEP-NEN.
También se proporcionan modelos y algoritmos biomatemáticos, por ejemplo, algoritmos de aprendizaje supervisados y métodos que usan los mismos, para la predicción, clasificación y evaluación de GEP-NEN y resultados asociados, por ejemplo, prediciendo el grado de riesgo, la capacidad de respuesta al tratamiento, metástasis o agresividad, y para determinar el subtipo de GEP-NEN.
La detección de los biomarcadores que usan las realizaciones proporcionadas es útil para mejorar los diagnósticos y pronósticos de GEP-NEN, y para informar los protocolos de tratamiento. En algunos aspectos, la detección de los biomarcadores y/o los niveles de expresión mediante las realizaciones proporcionadas confirma o indica la presencia, ausencia, etapa, clase, ubicación, subtipo, agresividad, malignidad, metástasis, pronóstico u otro resultado de GEP-NEN, o una célula de GEP-NEN, tal como una célula de GEP-NEN circulante (CNC). Los métodos y composiciones proporcionados pueden usarse para la localización tumoral y para predecir o detectar metástasis, micrometástasis y lesiones pequeñas, y/o para determinar el grado de riesgo, la probabilidad de recurrencia, la respuesta o remisión del tratamiento, e informar los cursos de tratamiento apropiados. Por ejemplo, la detección de los biomarcadores, por ejemplo, en circulación, puede usarse para detectar GEP-NEN en etapa temprana y primarios (por ejemplo, para identificar la enfermedad o metástasis de GEP-NEN en un paciente previamente considerado "negativo" por otro enfoque, tal como localización anatómica).
Los métodos y composiciones proporcionados se pueden usar para diseñar, implementar y supervisar estrategias de tratamiento, que incluyen estrategias de tratamiento específicas del paciente. En un ejemplo, los niveles de expresión detectados de los biomarcadores de GEP-NEN sirven como marcadores sustitutos para la eficacia del tratamiento, por ejemplo, para controlar los efectos de la terapia quirúrgica (por ejemplo, eliminación de tumores), terapia médica dirigida (por ejemplo, inhibición de la secreción/proliferación tumoral), y otros enfoques terapéuticos, mediante la detección de la remisión o la recurrencia de tumores, incluso en forma de pequeñas micrometástasis. Los métodos también se pueden usar para evaluar los síntomas clínicos y los resultados, y para la clasificación histológica y la caracterización molecular de GEP-NEN.
C. Biomarcadores de GEP-NEN
Los biomarcadores proporcionados incluyen biomarcadores de GEP-NEN y paneles (conjuntos) de los mismos. Entre los biomarcadores de GEP-NEN provistos se encuentran productos de los genes, como ADN, ARN, por ejemplo, transcritos y proteínas, que se expresan diferencialmente en la enfermedad de GEP-NEN, y/o en diferentes etapas o subtipos de GEP-NEN, o en diferentes tumores de GEP-NEN, tales como productos de los genes expresados diferencialmente en tumores metastásicos frente a tumores primarios, tumores con diferentes grados de agresividad, tumores de alto riesgo versus bajo riesgo, tumores receptivos versus no receptivos, tumores que exhiben diferentes clasificaciones patológicas y/o probabilidad de respuesta a cursos particulares de tratamiento, así como aquellos asociados con características de la enfermedad, estadio o tipo de GEP-NEN, o con células neuroendocrinas o tipos celulares relacionados.
Por ejemplo, los biomarcadores incluyen productos de los genes cuya expresión está asociada con o implicada en tumorigenicidad, metástasis o producción de hormonas, o un fenotipo de GEP-NEN primario o metastásico, tal como adhesión, migración, proliferación, apoptosis, metástasis, y secreción de hormonas, y aquellas asociadas con neoplasias o tumores malignos en general. Los biomarcadores también incluyen productos de los genes expresados en tejidos normales relacionados, como células neuroendocrinas, la mucosa del intestino delgado (SI) y células enterocromafines (EC).
Entre los biomarcadores se encuentran productos de secreción de células de GEP-NEN, que incluyen hormonas y aminas, por ejemplo, gastrina, grelina, polipéptido pancreático, sustancia P, histamina y serotonina, y factores de crecimiento tales como factor de crecimiento tumoral beta (TGF-β) y el factor de crecimiento del tejido conectivo (CTGF), que son detectables en la circulación. Los productos de secreción pueden variar con el subtipo y el origen del tumor.
En un ejemplo, los biomarcadores son productos de genes asociados con genotipos reguladores (es decir, adhesión, migración, proliferación, apoptosis, metástasis y/o secreción de hormonas) que se basan en varios subtipos de GEP-NEN, etapas, grados de agresividad o respuesta al tratamiento.
También entre los biomarcadores de GEP-NEN hay productos de los genes expresados diferencialmente en GEP-NEN primarios y metástasis hepáticas en comparación con la mucosa del intestino delgado normal y preparaciones puras de células EC. Véase Modlin et al., "Genetic differentiation of appendiceal tumor malignancy: a guide for the perplexed," Ann Surg 2006;244(1):52-60; Kidd M, et al., "The role of genetic markers, NAP1L1, MAGE-D2 and MTA1, in defining small intestinal carcinoid neoplasia", Annals of Surgical Oncology 2006;13:253-62; Kidd M et al., "Q RT-PCR detection of Chromogranin A: A new standard in the identification of neuroendocrine tumor disease", Annals of Surgery 2006;243:273-80.
Los biomarcadores de GEP-NEN incluyen: AKAP8L (proteína de anclaje de quinasa A (PRKA) tipo 8), ATP6V1H (ATPasa, transportadora de H+, lisosomal 50/57kDa, V1, subunidad H), BNIP3L (proteína de interacción de 19 kDa de BCL2/adenovirus E1B tipo 3), C21orf7 (marco de lectura abierto 7 del cromosoma 21), COMMD9 (dominio COMM que contiene 9), ENPP4 (ectonucleótido pirofosfatasa/fosfodiesterasa 4). FAM13A (familia con similitud de secuencia 13, miembro A), FLJ10357 (factor 40 de intercambio de nucleótidos de guanina Rho), GLT8D1 (glicosiltransferasa 8 que contiene 1 dominio), HDAC9 (histona desacetilasa 9), HSF2 (factor 2 de transcripción de choque térmico), LEO1 (componente del complejo Paf1/ARN polimerasa II, homólogo (S. cerevisiae)), MORF4L2 (factor de mortalidad 4 de MORF4L2 tipo 2), NOL3 (proteína 3 nucleolar (represor de apoptosis con dominio CARD)), NUDT3 (motivo 3 tipo nudix ( fracción X enlazada al nucleósido difosfato)), OAZ2 (antizima ornitina descarboxilasa 2), PANK2 (pantotenato quinasa 2), PHF21A (proteína dedo PHD 21A), PKD1 (enfermedad renal poliquística 1 (autosómica dominante)), PLD3 (familia de fosfolipasa D, miembro 3), PQBP1 (proteína 1 de unión a poliglutamina), RNF41 (proteína 1 de enlazamiento a poliglutamina), RSF1 (factor 1 de remodelación y de espaciamiento), RTN2 (reticulón 2), SMARCD3 (relacionado con SWI/SNF, asociado a la matriz, regulador dependiente de actina de la cromatina, subfamilia d, miembro 3p), SPATA7 (espermatogénesis asociada 7), SST1 (receptor 1 de somatostatina), SST3 (receptor 3 de somatostatina), SST4 (receptor 4 de somatostatina), SST5 (receptor 5 de somatostatina), TECPR2 (tectonina que contiene 2 repeticiones de hélice beta), TRMT112 (homólogo de ARNt metiltransferasa 11-2 (S. cerevisiae), VPS13C (homólogos C de clasificación de proteína vacuolar 13 (S. cerevisiae)), WDFY3 (repetición WD y FYVE que contiene 3 dominios), ZFHX3 (homeocaja de dedo de zinc 3), ZXDC (familia ZXD de dedo de zinc C), ZZZ3 ( tipo ZZ, que contiene 3 dedos de zinc), proteína 2 tipo precursora beta amiloide (A4) 2 (APLP2); homólogo del oncogén viral del sarcoma murino v-raf 3611 (ARAF1); homólogo B1 del oncogén viral del sarcoma murino v-raf (BRAF1); CD59; Cromogranina A (CgA, también llamada proteína secretora paratiroidea 1, CHGA); factor de crecimiento del tejido conectivo (CTGF); ligando 14 de quimioquina (motivo C-X-C) (CXCL14); homólogo 7 rizado (FZD7); receptor de glutamato, ionotrópico, AMPA 2 (GRIA2); homeocaja C6 (HOXC6); Ki-67; Supresor de metástasis KiSS-1 (Kiss1); homólogo de oncogén de sarcoma de rata Kirsten v-Ki-ras2 (KRAS); familia del antígeno de melanoma D, 2 (MAGE-D2); metástasis asociada 1 (MTA1); proteína 1 de ensamblaje de nucleosomas tipo 1 (NAP1L1); factor relacionado de transcripción NK2, locus 3 (por ejemplo, factor relacionado de transcripción NK2 de Homo sapiens, locus 3 (Drosophila)) (NKX2-3); neuropilin 2 (NRP2); receptor olfatorio, familia 51, subfamilia E, miembro 1 (OR51E1); antígeno paraneoplásico MA2 (PNMA2); proteína tirosina fosfatasa, tipo receptor, polipéptido N2 (PTPRN2); homólogo 1 del oncogén viral de leucemia murina v-raf-1 (RAF1); secretogranina V (proteína 7B2) (SCG5); sparc/osteonectina, proteoglicano de los dominios tipo cwcv y kazal (testican) 1 (SPOCK1); gen de survivina inhibidor de apoptosis (BIRC5; API4; EPR-1) (survivina); triptófano hidroxilasa 1 (TPH1), familia 18 de portadores de soluto (monoamina vesicular), miembro 1 (VMAT1); familia 18 de portadores de soluto (monoamina vesicular), miembro 2 (VMAT2); y X2BTB48 (inhibidor de serpina peptidasa, clado A (antiproteinasa alfa-1, antitripsina), miembro 10), que incluye productos de los genes típicamente productos de genes humanos, incluidos transcritos, ARNm, ADNc, secuencias codificantes, proteínas y polipéptidos, así como polinucleótidos (ácidos nucleicos) que codifican las proteínas y polipéptidos, que incluyen variantes de origen natural, por ejemplo, variantes alélicas, variantes de empalme, variantes de transcritos y variantes de polimorfismo de nucleótido único (SNP). Por ejemplo, los biomarcadores incluyen polinucleótidos, proteínas y polipéptidos que tienen las secuencias descritas en este documento, y variantes de los mismos de origen natural.
Los biomarcadores de GEP-NEN incluyen adicionalmente CD164. En otro aspecto, los biomarcadores incluyen NALP, por ejemplo, productos del gen de apoptosis activador de caspasa-3 y marcador apoptótico, NALP.
Los biomarcadores de APLP2 incluyen productos del gen de APLP2 humano, que incluyen variantes naturales, por ejemplo, variantes alélicas, y homólogos y análogos de los mismos. En un ejemplo, el biomarcador APLP2 es un polinucleótido que tiene la secuencia de nucleótidos expuesta en la SEQ ID NO: 1 (referenciada en GenBank gi número 214010177) o que contiene una porción de la misma que codifica proteína, (por ejemplo, el marco de lectura abierto en los nucleótidos 158-2449 de la SEQ ID NO: 1), una variante natural de la misma, o una proteína codificada por dicho polinucleótido.
Los biomarcadores ARAF1 incluyen productos del gen ARAF1 humano, que incluyen variantes naturales, por ejemplo, variantes alélicas, y homólogos y análogos de los mismos. En un ejemplo, el biomarcador ARAF1 es un polinucleótido que tiene la secuencia de nucleótidos expuesta en la SEQ ID NO: 2 (referenciada en GenBank gi número 283484007), o que contiene una porción codificante de proteína, (por ejemplo, el marco de lectura abierto en los nucleótidos 195 -2015 de la SEQ ID NO: 2), una variante natural de la misma, o una proteína codificada por dicho polinucleótido.
Los biomarcadores BRAF1 incluyen productos del gen BRAF1, que incluyen variantes naturales, por ejemplo, variantes alélicas, y homólogos y análogos de los mismos. En un ejemplo, el biomarcador BRAF1 es un polinucleótido que tiene la secuencia de nucleótidos expuesta en la SEQ ID NO: 3 (referenciada en GenBank gi número 187608632), o que contiene una porción de la misma que codifica proteína, (por ejemplo, el marco de lectura abierto en nucleótidos 62 -2362 de la SEQ ID NO: 3), una variante natural de la misma, o una proteína codificada por dicho polinucleótido.
Los biomarcadores de CD59 incluyen productos de los genes CD59 humanos, que incluyen variantes naturales, por ejemplo, variantes alélicas, y homólogos y análogos de los mismos. En un ejemplo, el biomarcador CD59 es un polinucleótido que tiene la secuencia de nucleótidos expuesta en la SEQ ID NO: 4 (referenciada en GenBank gi número 187829037), o que contiene una porción codificante de proteína, (por ejemplo, el marco de lectura abierto en nucleótidos 278 -664 de la SEQ ID NO: 4), una variante natural de la misma, o una proteína codificada por dicho polinucleótido.
Los biomarcadores CgA incluyen productos de los genes CGA o CHGA humanos, que incluyen variantes naturales, por ejemplo, variantes alélicas, y homólogos y análogos de los mismos. En un ejemplo, el biomarcador CgA es un polinucleótido que tiene la secuencia de nucleótidos expuesta en la SEQ ID NO: 5 (referenciada en GenBank gi número 33990769), o que contiene una porción de la misma que codifica proteína, (por ejemplo, el marco de lectura abierto en nucleótidos 1 a 1374 de la SEQ ID NO: 5), una variante natural de la misma, o una proteína codificada por dicho polinucleótido. El CgA humano codifica una glicoproteína ácida soluble en agua almacenada en los gránulos secretores de células neuroendocrinas y detectable en plasma.
Los biomarcadores CTGF incluyen productos del gen CTGF humano, que incluyen variantes naturales, por ejemplo, variantes alélicas, y homólogos y análogos de los mismos. En un ejemplo, el biomarcador CTGF es un polinucleótido que tiene la secuencia de nucleótidos expuesta en la SEQ ID NO: 6 (referenciada en GenBank gi número 98986335), o que contiene una porción de la misma que codifica proteína, (por ejemplo, el marco de lectura abierto en nucleótidos 207 -1256 de la SEQ ID NO: 6), una variante natural de la misma, o una proteína codificada por dicho polinucleótido.
Los biomarcadores CXCL14 incluyen productos del gen CXCL14 humano, que incluyen variantes naturales, por ejemplo, variantes alélicas, y homólogos y análogos de los mismos. En un ejemplo, el biomarcador CXCL14 es un polinucleótido que tiene la secuencia de nucleótidos expuesta en la SEQ ID NO: 7 (referenciada en GenBank gi número 208022628), o que contiene una porción de la misma que codifica proteína, (por ejemplo, el marco de lectura abierto en nucleótidos 466 -801 de la SEQ ID NO: 7), una variante natural de la misma, o una proteína codificada por dicho polinucleótido.
Los biomarcadores de FZD7 incluyen productos de gen de FZD7 humano, por ejemplo, homólogo 7 rizado de Homo sapiens (Drosophila) (FDZ7), que incluye variantes naturales, por ejemplo, variantes alélicas, y homólogos y análogos de los mismos. En un ejemplo, el biomarcador FDZ7 es un polinucleótido que tiene la secuencia de nucleótidos expuesta en la SEQ ID NO: 8 (referenciada en GenBank gi número 4503832), o que contiene una porción de la misma que codifica proteína, (por ejemplo, el marco de lectura abierto en nucleótidos 62 -1786 de la SEQ ID NO: 8, una variante natural de la misma, o una proteína codificada por dicho polinucleótido.
Los biomarcadores GRIA2 incluyen productos del gen GRIA2 humano, que incluyen variantes naturales, por ejemplo, variantes alélicas, y homólogos y análogos de los mismos. En un ejemplo, el biomarcador GRIA2 es un polinucleótido que tiene la secuencia de nucleótidos expuesta en la SEQ ID NO: 9 (referenciada en GenBank gi número 134304849), o que contiene una porción de la misma que codifica proteína, (por ejemplo, el marco de lectura abierto en los nucleótidos 460 -3111 de la SEQ ID NO: 9), una variante natural de la misma, o una proteína codificada por dicho polinucleótido.
Los biomarcadores de homeocaja C6 (HOXC6) incluyen productos del gen HOXC6 humano, que incluyen variantes naturales, por ejemplo, variantes alélicas, y homólogos y análogos de los mismos. En un ejemplo, el biomarcador HOXC6 es un polinucleótido que tiene la secuencia de nucleótidos expuesta en la SEQ ID NO: 10 (referenciada en GenBank gi número 93141222) o que contiene una porción de la misma que codifica proteína, (por ejemplo, el marco de lectura abierto en los nucleótidos 113-820 de la SEQ ID NO: 10), una variante natural de la misma, o una proteína codificada por dicho polinucleótido.
Los biomarcadores Ki67 incluyen productos del gen Ki67 humano, que incluyen variantes naturales, por ejemplo, variantes alélicas, y homólogos y análogos de los mismos. En un ejemplo, el biomarcador Ki67 es un polinucleótido que tiene la secuencia de nucleótidos expuesta en la SEQ ID NO: 11 (referenciada en GenBank gi número 225543213) o que contiene la región de codificación de la misma (por ejemplo, Nucleótidos 196-9966) de la SEQ ID NO: 11 ), una variante natural de la misma, o una proteína codificada por dicho polinucleótido.
Los biomarcadores Kiss1 incluyen productos del gen KISS1 humano, que incluyen variantes naturales, por ejemplo, variantes alélicas, y homólogos y análogos de los mismos. En un ejemplo, el biomarcador KISS1 es un polinucleótido que tiene la secuencia de nucleótidos expuesta en la SEQ ID NO: 12 (referenciada en GenBank gi número 116829963), o que contiene una porción de la misma que codifica proteína, (por ejemplo, el marco de lectura abierto en nucleótidos 155 -571 de la SEQ ID NO: 12), una variante natural de la misma, o una proteína codificada por dicho polinucleótido.
Los biomarcadores KRAS incluyen productos del gen KRAS humano, que incluyen variantes naturales, por ejemplo, variantes alélicas, y homólogos y análogos de los mismos. En un ejemplo, el biomarcador KRAS es un polinucleótido que tiene la secuencia de nucleótidos expuesta en la SEQ ID NO: 13 (referenciada en GenBank gi número 34485724) o que contiene la región codificante de la misma (por ejemplo, Nucleótidos 182-751 de la SEQ ID NO: 13), una variante natural de la misma, o una proteína codificada por dicho polinucleótido.
Los biomarcadores MAGE-D2 incluyen productos del gen MAGE-D2 humano, que incluyen variantes naturales, por ejemplo, variantes alélicas, y homólogos y análogos de los mismos. En un ejemplo, el biomarcador MAGE-D2 es un polinucleótido que tiene la secuencia de nucleótidos expuesta en la SEQ ID NO: 14 (referenciada en GenBank gi número 29171703) o que contiene una porción codificante de proteína, (por ejemplo, el marco de lectura abierto en nucleótidos 100-1920 de la SEQ ID NO: 14), una variante natural de la misma, o una proteína codificada por dicho polinucleótido. MAGE-D2 codifica una proteína asociada a la adhesión.
Los biomarcadores MTA1 incluyen los productos del gen MTA1 humanos, que incluyen variantes naturales, por ejemplo, variantes alélicas, y homólogos y análogos de los mismas. En un ejemplo, el biomarcador MTA1 es un polinucleótido que tiene la secuencia de nucleótidos expuesta en la SEQ ID NO: 15 (referenciada en GenBank gi número 115527079) o que contiene la región codificante de la misma (por ejemplo, Nucleótidos 188-2335 de la SEQ ID NO: 15), una variante natural de la misma, o una proteína codificada por dicho polinucleótido. MTA, un gen maligno de cáncer de mama con estrógenos-antagonistas, se ha utilizado para identificar enfermedad progresiva (metastásica) en otros tumores, incluidos los carcinomas de mama, hepatocelulares, esofágico, gástrico y colorrectal.
Los biomarcadores NAP1L1 incluyen productos del gen NAP1L1 humano, que incluyen variantes naturales, por ejemplo, variantes alélicas, y homólogos y análogos de los mismos. En un ejemplo, el biomarcador NAP1L1 es un polinucleótido que tiene la secuencia de nucleótidos expuesta en la SEQ ID NO: 16 (referenciada en GenBank gi número 219842231) o que contiene una porción de la misma que codifica proteína, (por ejemplo, el marco de lectura abierto en los nucleótidos 413-1588 de la SEQ ID NO: 16), una variante natural de la misma, o una proteína codificada por tal polinucleótido. NAP1L1 es un gen regulador de la mitosis que codifica una proteína nuclear implicada en el ensamblaje de la cromatina y la replicación del ADN.
Los biomarcadores NKX2-3 incluyen productos del gen NKX2-3 humano, que incluye variantes naturales, por ejemplo, variantes alélicas, y homólogos y análogos de los mismos. En un ejemplo, el biomarcador NKX2-3 es un polinucleótido que tiene la secuencia de nucleótidos expuesta en la SEQ ID NO: 17 (referenciada en GenBank gi número 148746210) o que contiene una porción de la misma que codifica proteína, (por ejemplo, el marco de lectura abierto en nucleótidos 200 -1294 de la SEQ ID NO: 17), una variante natural de la misma, o una proteína codificada por dicho polinucleótido.
Los biomarcadores NRP2 incluyen los productos del gen NRP2 humano, que incluye variantes naturales, por ejemplo, variantes alélicas, y homólogos y análogos de los mismos. En un ejemplo, el biomarcador NRP2 es un polinucleótido que tiene la secuencia de nucleótidos expuesta en la SEQ ID NO: 18 (referenciada en GenBank gi número 41872561) o que contiene una porción de la misma que codifica proteína, (por ejemplo, el marco de lectura abierto en los nucleótidos 792-3587 de la SEQ ID NO: 18), una variante natural de la misma, o una proteína codificada por dicho polinucleótido.
Los biomarcadores OR51E1 incluyen los productos del gen OR51E1 humano, que incluyen variantes naturales, por ejemplo, variantes alélicas, y homólogos y análogos de los mismos. En un ejemplo, el biomarcador OR51E1 es un polinucleótido que tiene la secuencia de nucleótidos expuesta en la SEQ ID NO: 19 (referenciada en GenBank gi número 205277377) o que contiene una porción de la misma que codifica proteína, (por ejemplo, el marco de lectura abierto en nucleótidos 145-1101 de la SEQ ID NO: 19), una variante natural de la misma, o una proteína codificada por dicho polinucleótido.
Los biomarcadores PNMA2 incluyen productos del gen PNMA2 humano, que incluyen variantes naturales, por ejemplo, variantes alélicas, y homólogos y análogos de los mismos. En un ejemplo, el biomarcador PNMA2 es un polinucleótido que tiene la secuencia de nucleótidos expuesta en la SEQ ID NO: 20 (referenciada en GenBank gi número 156766040) o que contiene una porción de la misma que codifica proteína, (por ejemplo, el marco de lectura abierto en los nucleótidos 771-1865 de la SEQ ID NO: 20), una variante natural de la misma, o una proteína codificada por dicho polinucleótido.
Los biomarcadores PTPRN2 incluyen productos del gen PTPRN2 humano, que incluyen variantes naturales, por ejemplo, variantes alélicas, y homólogos y análogos de los mismos. En un ejemplo, el biomarcador PTPRN2 es un polinucleótido que tiene la secuencia de nucleótidos expuesta en la SEQ ID NO: 21 (referenciada en GenBank gi número 194097439) o que contiene una porción de la misma que codifica proteína, (por ejemplo, el marco de lectura abierto en nucleótidos 122-3169 de la SEQ ID NO: 21), una variante natural de la misma, o una proteína codificada por dicho polinucleótido.
Los biomarcadores de RAF1 incluyen productos de gen de RAF1 humano, que incluyen variantes naturales, por ejemplo, variantes alélicas, y homólogos y análogos de los mismos. En un ejemplo, el biomarcador RAF1 es un polinucleótido que tiene la secuencia de nucleótidos expuesta en la SEQ ID NO: 22 (referenciada en GenBank gi número 189458830) o que contiene una porción de la misma que codifica proteína, (por ejemplo, el marco de lectura abierto en nucleótidos 416-2362 de la SEQ ID NO: 22), una variante natural de la misma, o una proteína codificada por dicho polinucleótido.
Los biomarcadores de SCG5 incluyen productos de gen SCG5 humano, que incluyen variantes naturales, por ejemplo, variantes alélicas, y homólogos y análogos de los mismos. En un ejemplo, el biomarcador SCG5 es un polinucleótido que tiene la secuencia de nucleótidos expuesta en la SEQ ID NO: 23 (referenciada en GenBank gi número 221139784) o que contiene una porción de la misma que codifica proteína, (por ejemplo, el marco de lectura abierto en los nucleótidos 118-756 de la SEQ ID NO: 23), una variante natural de la misma, o una proteína codificada por dicho polinucleótido.
Los biomarcadores SPOCK1 incluyen productos del gen SPOCK1 humano, que incluyen variantes naturales, por ejemplo, variantes alélicas, y homólogos y análogos de los mismos. En un ejemplo, el biomarcador SPOCK1 es un polinucleótido que tiene la secuencia de nucleótidos expuesta en la SEQ ID NO: 24 (referenciada en GenBank gi número 82659117) o que contiene una porción de la misma que codifica proteína, (por ejemplo, el marco de lectura abierto en nucleótidos 152-1471 de la SEQ ID NO: 24), una variante natural de la misma, o una proteína codificada por dicho polinucleótido.
Los biomarcadores de Survivina incluyen productos del gen de Survivina humano, que incluyen variantes naturales, por ejemplo, variantes alélicas, y homólogos y análogos de los mismos. En un ejemplo, el biomarcador Survivina es un polinucleótido que tiene la secuencia de nucleótidos expuesta en la SEQ ID NO: 25 (referenciada en GenBank gi número 59859877) o que contiene una porción de la misma que codifica proteína, (por ejemplo, el marco de lectura abierto en los nucleótidos 122-550 de la SEQ ID NO: 25) o un polinucleótido que tiene la secuencia codificante de proteína (SEQ ID NO: 34) de los nucleótidos 2811-2921, 3174-3283, 5158-5275, 11955-12044 de GenBank gi número 2315862), una variante natural de la misma, o una proteína codificada por dicho polinucleótido.
Los biomarcadores de TPH1 incluyen productos del gen de TPH1 humano, que incluyen variantes naturales, por ejemplo, variantes alélicas, y homólogos y análogos de los mismos. En un ejemplo, el biomarcador TPH1 es un polinucleótido que tiene la secuencia de nucleótidos expuesta en la SEQ ID NO: 26 (referenciada en GenBank gi número 226342925) o que contiene una porción de la misma que codifica proteína (por ejemplo, El marco de lectura abierto en los nucleótidos 27-1361 de la SEQ ID NO: 26), una variante natural de la misma, o una proteína codificada por dicho polinucleótido. TPH1 codifica una enzima producida por células enterocromafines (EC) del tracto GI, importante para la producción de serotonina.
Los biomarcadores de VMAT1 incluyen productos del gen de VMAT1 humano, que incluyen variantes naturales, por ejemplo, variantes alélicas, y homólogos y análogos de los mismos. En un ejemplo, el biomarcador VMAT1 es un polinucleótido que tiene la secuencia de nucleótidos expuesta en la SEQ ID NO: 27 (referenciada en GenBank gi número 215272388) o que contiene la región codificante de la misma (por ejemplo, Nucleótidos 472-2049 de la SEQ ID NO: 27), una variante natural de la misma, o una proteína codificada por dicho polinucleótido.
Los biomarcadores de VMAT2 incluyen productos del gen de VMAT2 humano, que incluyen variantes naturales, por ejemplo, variantes alélicas, y homólogos y análogos de los mismos. En un ejemplo, el biomarcador VMAT2 es un polinucleótido que tiene la secuencia de nucleótidos expuesta en la SEQ ID NO: 28 (referenciada en GenBank gi número 141803164) o que contiene la región codificante de la misma (por ejemplo, Nucleótidos 32-1576 de la SEQ ID NO: 28), una variante natural de la misma, o una proteína codificada por dicho polinucleótido.
Los biomarcadores X2BTB48 incluyen un inhibidor de serpina peptidasa humano, los productos del gen de clado A
(antiproteinasa alfa-1, antitripsina), miembro 10), que incluyen variantes naturales, por ejemplo, variantes alélicas, y homólogos y análogos de los mismos. En un ejemplo, el biomarcador X2BTB48 es un polinucleótido que tiene la secuencia de nucleótidos expuesta en la SEQ ID NO: 29 (referenciada en GenBank gi número 154759289) o que contiene la región codificante de la misma (por ejemplo, Nucleótidos 467-1801 de la SEQ ID NO: 29), una variante natural de la misma, tal como la secuencia de nucleótidos referenciada en GenBank gi número 154759290 (SEQ ID NO: 105) o una secuencia codificante de la misma, por ejemplo, la secuencia codificante de la misma en los nucleótidos 122-1456, o una proteína codificada por dichos polinucleótidos, tal como la proteína que tiene la secuencia de aminoácidos referenciada en GenBank gi número 7705879.
Los biomarcadores AKAP8L (proteína de anclaje de quinasa A (PRKA) tipo 8) incluyen los productos del gen AKAP8L humano, que incluyen variantes naturales, por ejemplo, variantes alélicas, y homólogos y análogos de las mismas. En un ejemplo, el biomarcador AKAP8L es un polinucleótido que tiene la secuencia de nucleótidos expuesta en la SEQ ID NO: 201 (referenciada en GenBank gi número 49472840), o que contiene una porción de la misma que codifica proteína, por ejemplo, la secuencia codificante de la misma de nucleótidos 100-2040 de la SEQ ID NO: 201, una variante natural de la misma, o una proteína codificada por dicho polinucleótido.
Los biomarcadores ATP6V1H (ATPasa, que transporta H+, lisosómico 50/57 kDa, subunidades V1 H) incluyen productos del gen ATP6V1H humano, que incluye variantes naturales, por ejemplo, variantes alélicas, y homólogos y análogos de los mismos. En un ejemplo, el biomarcador ATP6V1H es un polinucleótido que tiene la secuencia de nucleótidos expuesta en la SEQ ID NO: 204 (referenciada en GenBank gi número 47717103), o que contiene una porción de la misma que codifica proteína, por ejemplo, la secuencia codificante de la misma de nucleótidos 2931744, una variante natural del mismo, o una proteína codificada por dicho polinucleótido.
Los biomarcadores BNIP3L (proteína de interacción de 19kDa de BCL2/adenovirus E1B tipo 3) incluyen productos del gen BNIP3L humano, que incluyen variantes naturales, por ejemplo, variantes alélicas, y homólogos y análogos de los mismos. En un ejemplo, el biomarcador BNIP3L es un polinucleótido que tiene la secuencia de nucleótidos expuesta en la SEQ ID NO: 205 (referenciada en GenBank gi número 47078259), o que contiene una porción de la misma que codifica proteína, por ejemplo, la secuencia codificante de la misma en nucleótidos 125-784 de la SEQ ID NO: 205, una variante natural de la misma, o una proteína codificada por dicho polinucleótido.
Los biomarcadores C21orf7 (marco de lectura abierta 7 del cromosoma 21) que incluye los productos del gen C21orf7 humano, que incluyen variantes naturales, por ejemplo, variantes alélicas, y homólogos y análogos de los mismos. En un ejemplo, el biomarcador C21orf7 es un polinucleótido que tiene la secuencia de nucleótidos expuesta en la SEQ ID NO: 206 (referenciada en GenBank gi número 31542267), o que contiene una porción de la misma que codifica proteína, por ejemplo, la secuencia codificante de la misma en los nucleótidos 278-1006 de la SEQ ID NO: 206, una variante natural de la misma, o una proteína codificada por dicho polinucleótido.
Los biomarcadores COMMD9 (dominio COMM que contiene 9) incluyen productos del gen ATP6V1H humano, que incluyen variantes naturales, por ejemplo, variantes alélicas, y homólogos y análogos de los mismos. En un ejemplo, el biomarcador COMMD9 es un polinucleótido que tiene la secuencia de nucleótidos expuesta en la SEQ ID NO: 207 (referenciada en GenBank gi número 156416006), o que contiene una porción de la misma que codifica proteína, por ejemplo, la secuencia codificante de la misma en los nucleótidos 38-508 de la SEQ ID NO: 207, una variante natural de la misma, o una proteína codificada por dicho polinucleótido.
Los biomarcadores ENPP4 (ectonucleótido pirofosfatasa/fosfodiesterasa 4) incluyen productos del gen ENPP4 humano, que incluyen variantes naturales, por ejemplo, variantes alélicas, y homólogos y análogos de los mismos. En un ejemplo, el biomarcador ENPP4 es un polinucleótido que tiene la secuencia de nucleótidos expuesta en la SEQ ID NO: 208 (referenciada en GenBank gi número 194688140), o que contiene una porción de la misma que codifica proteína, por ejemplo, la secuencia codificante de la misma de los nucleótidos 260-1621 de la SEQ ID NO: 208, una variante natural de la misma, o una proteína codificada por dicho polinucleótido.
Los biomarcadores FAM13A (familia con similitud de secuencia 13, miembro A) incluyen productos del gen FAM13A humano, que incluyen variantes naturales, por ejemplo, variantes alélicas, y homólogos y análogos de los mismos. En un ejemplo, el biomarcador FAM13A es un polinucleótido que tiene la secuencia de nucleótidos expuesta en la SEQ ID NO: 209 (referenciada en GenBank gi número 283806631), o que contiene una porción de la misma que codifica proteína, por ejemplo, la secuencia codificante de la misma en nucleótidos 281-1126 de la SEQ ID NO: 209, una variante natural de la misma, o una proteína codificada por dicho polinucleótido.
Los biomarcadores FLJ10357 (factor 40 de intercambio de nucleótido Rho guanina) incluyen productos del gen ARHGEF40 humano, que incluyen variantes naturales, por ejemplo, variantes alélicas, y homólogos y análogos de los mismos. En un ejemplo, el biomarcador FLJ10357 es un polinucleótido que tiene la secuencia de nucleótidos expuesta en la SEQ ID NO: 210 (referenciada en GenBank gi número 50843836), o que contiene una porción de la misma que codifica proteína, por ejemplo, la secuencia codificante de la misma de los nucleótidos 30-4589 de la
SEQ ID NO: 210, una variante natural de la misma, o una proteína codificada por dicho polinucleótido.
Los biomarcadores GLT8D1 (glicosiltransferasa 8 que contiene 1 dominio) incluyen productos de gen GLT8D1 humano, que incluyen variantes naturales, por ejemplo, variantes alélicas, y homólogos y análogos de los mismos. En un ejemplo, el biomarcador GLT8D1 es un polinucleótido que tiene la secuencia de nucleótidos expuesta en la SEQ ID NO: 211 (referenciada en GenBank gi número 58331224), o que contiene una porción de la misma que codifica proteína, por ejemplo, la secuencia codificante de la misma de nucleótidos 852-1967 de la SEQ ID NO: 211, una variante natural de la misma, o una proteína codificada por dicho polinucleótido.
Los biomarcadores HDAC9 (histona deacetilasa 9) incluyen productos del gen humano HDAC9, que incluyen variantes naturales, por ejemplo, variantes alélicas, y homólogos y análogos de los mismos. En un ejemplo, el biomarcador HDAC9 es un polinucleótido que tiene la secuencia de nucleótidos expuesta en la SEQ ID NO: 212 (referenciada en GenBank gi número 323423043), o que contiene una porción de la misma que codifica proteína, por ejemplo, la secuencia codificante de la misma en los nucleótidos 362-2128 de la SEQ ID NO: 212, una variante natural de la misma, o una proteína codificada por dicho polinucleótido.
Los biomarcadores HSF2 (factor 2 de transcripción de choque térmico) incluyen productos del gen HSF2 humano, que incluyen variantes naturales, por ejemplo, variantes alélicas, y homólogos y análogos de los mismos. En un ejemplo, el biomarcador HSF2 es un polinucleótido que tiene la secuencia de nucleótidos establecida en la SEQ ID NO: 213 (referenciada en GenBank gi número 207113145), o que contiene una porción de la misma que codifica proteína, por ejemplo, la secuencia codificante de la misma de los nucleótidos 188-1798 de la SEQ ID NO: 213, una variante natural de la misma, o una proteína codificada por dicho polinucleótido.
Los biomarcadores de LEO1 (componente del complejo Pafl/ARN polimerasa II, homólogo (S. cerevisiae)) incluyen productos del gen LEO1 humano, que incluye variantes naturales, por ejemplo, variantes alélicas, y homólogos y análogos de los mismos. En un ejemplo, el biomarcador LEO1 es un polinucleótido que tiene la secuencia de nucleótidos expuesta en la SEQ ID NO: 215 (referenciada en GenBank gi número 37059738), o que contiene una porción de la misma que codifica proteína, por ejemplo, la secuencia codificante de la misma en los nucleótidos 172017 de la SEQ ID NO: 215, una variante natural de la misma, o una proteína codificada por dicho polinucleótido.
Los biomarcadores MORF4L2 (factor 4 de mortalidad MORF4L2 tipo 2) incluyen productos del gen MORF4L2 humano, que incluyen variantes naturales, por ejemplo, variantes alélicas, y homólogos y análogos de los mismos. En un ejemplo, el biomarcador MORF4L2 es un polinucleótido que tiene la secuencia de nucleótidos expuesta en la SEQ ID NO: 217 (referenciada en GenBank gi número 215490020), o que contiene una porción de la misma que codifica proteína, por ejemplo, la secuencia codificante de la misma en los nucleótidos 505-1371, una variante natural de la misma, o una proteína codificada por dicho polinucleótido.
Los biomarcadores NOL3 (proteína 3 nucleolar represor de apoptosis con dominio CARD)) incluyen productos del gen NOL3 humano, que incluyen variantes naturales, por ejemplo, variantes alélicas, y homólogos y análogos de los mismos. En un ejemplo, el biomarcador NOL3 es un polinucleótido que tiene la secuencia de nucleótidos expuesta en la SEQ ID NO: 218 (referenciada en GenBank gi número 297632351), o que contiene una porción de la misma que codifica proteína, por ejemplo, la secuencia codificante de la misma en los nucleótidos 194-853, una variante natural de la misma, o una proteína codificada por dicho polinucleótido.
Los biomarcadores NUDT3 (motivo 3 tipo nudix) fracción X enlazada al nucleósido difosfato)) incluyen productos del gen NUDT3 humano, que incluyen variantes naturales, por ejemplo, variantes alélicas, y homólogos y análogos de los mismos. En un ejemplo, el biomarcador NUDT3 es un polinucleótido que tiene la secuencia de nucleótidos expuesta en la SEQ ID NO: 219 (referenciada en GenBank gi número 322302838), o que contiene una porción de la misma que codifica proteína, por ejemplo, la secuencia codificante de la misma en nucleótidos 319-837 de la SEQ ID NO: 219, una variante natural de la misma, o una proteína codificada por dicho polinucleótido.
Los biomarcadores OAZ2 (antizima 2 ornitina descarboxilasa) incluyen productos del gen OAZ2 humano, que incluyen variantes naturales, por ejemplo, variantes alélicas, y homólogos y análogos de los mismos. En un ejemplo, el biomarcador OAZ2 es un polinucleótido que tiene la secuencia de nucleótidos expuesta en la SEQ ID NO: 220 (referenciada en GenBank gi número 161377456), o que contiene una porción de la misma que codifica proteína, por ejemplo, la secuencia codificante de la misma en los nucleótidos 216-311 y 313-786, o una variante natural de la misma, o una proteína codificada por dicho polinucleótido.
Los biomarcadores de PANK2 (pantotenato quinasa 2) incluyen productos del gen PANK2 humano, que incluyen variantes naturales, por ejemplo, variantes alélicas, y homólogos y análogos de los mismos. En un ejemplo, el biomarcador PANK2 es un polinucleótido que tiene la secuencia de nucleótidos expuesta en la SEQ ID NO: 221 (referenciada en GenBank gi número 85838514), o que contiene una porción de la misma que codifica proteína, por ejemplo, la secuencia codificante de la misma en los nucleótidos 312-1151, una variante natural de la misma, o una proteína codificada por dicho polinucleótido.
Los biomarcadores de PHF21A (proteína 21A de dedo PHD) incluyen productos del gen de PHF21A humano, que incluyen variantes naturales, por ejemplo, variantes alélicas, y homólogos y análogos de los mismos. En un ejemplo, el biomarcador PHF21A es un polinucleótido que tiene la secuencia de nucleótidos expuesta en la SEQ ID NO: 222 (referenciada en GenBank gi número 156546893), o que contiene una porción de la misma que codifica proteína, por ejemplo, la secuencia codificante de la misma en nucleótidos 625-2667, una variante natural de la misma, o una proteína codificada por dicho polinucleótido.
Los biomarcadores PKD1 (enfermedad 1 de riñón poliquístico) incluyen productos del gen PKD1 humano, que incluyen variantes naturales, por ejemplo, variantes alélicas, y homólogos y análogos de los mismos. En un ejemplo, el biomarcador PKD1 es un polinucleótido que tiene la secuencia de nucleótidos expuesta en la SEQ ID NO: 223, o la secuencia referenciada en GenBank gi Número 205360961, o que contiene una porción de la misma que codifica proteína de dicha secuencia, por ejemplo, la secuencia codificante de la misma en los nucleótidos 210-13118 o nucleótidos 210-13117 de GenBank gi Número 205360961 o la SEQ ID NO: 223, una variante natural de la misma, o una proteína codificada por dicho polinucleótido.
Los biomarcadores de PLD3 (familia de la fosfolipasa D, miembro 3) incluyen productos del gen PLD3 humano, que incluyen variantes naturales, por ejemplo, variantes alélicas, y homólogos y análogos de los mismos. En un ejemplo, el biomarcador PLD3 es un polinucleótido que tiene la secuencia de nucleótidos expuesta en la SEQ ID NO: 224 (referenciada en GenBank gi número 166197669), o que contiene una porción de la misma que codifica proteína, por ejemplo, la secuencia codificante de la misma en los nucleótidos 399-1871 de la SEQ ID NO: 224, una variante natural de la misma, o una proteína codificada por dicho polinucleótido.
Los biomarcadores de PQBP1 (proteína 1 de unión a poliglutamina) incluyen productos del gen PQBP1 humano, que incluyen variantes naturales, por ejemplo, variantes alélicas, y homólogos y análogos de los mismos. En un ejemplo, el biomarcador PQBP1 es un polinucleótido que tiene la secuencia de nucleótidos expuesta en la SEQ ID NO: 225 (referenciada en GenBank gi número 74027246), o que contiene una porción de la misma que codifica proteína, por ejemplo, la secuencia codificante de la misma en los nucleótidos 122-919, una variante natural de la misma, o una proteína codificada por dicho polinucleótido.
Los biomarcadores RNF41 (proteína 1 de unión a poliglutamina) incluyen productos del gen RNF41 humano, que incluyen variantes naturales, por ejemplo, variantes alélicas, y homólogos y análogos de los mismos. En un ejemplo, el biomarcador RNF41 es un polinucleótido que tiene la secuencia de nucleótidos expuesta en la SEQ ID NO: 227 (referenciada en GenBank gi número 338827617), o que contiene una porción de la misma que codifica proteína, por ejemplo, la secuencia codificante de la misma en los nucleótidos 320-1273 de la SEQ ID NO: 227, una variante natural de la misma, o una proteína codificada por dicho polinucleótido.
Los biomarcadores RSF1 (factor 1 de remodelación y espaciamiento) incluyen productos del gen RSF1 humano, que incluyen variantes naturales, por ejemplo, variantes alélicas, y homólogos y análogos de los mismos. En un ejemplo, el biomarcador RSF1 es un polinucleótido que tiene la secuencia de nucleótidos expuesta en la SEQ ID NO: 228 (referenciada en GenBank gi número 38788332), o que contiene una porción de la misma que codifica proteína, por ejemplo, la secuencia codificante de la misma en nucleótidos 121-4446 de la SEQ ID NO: 228, una variante natural de la misma, o una proteína codificada por dicho polinucleótido.
Los biomarcadores RTN2 (reticulón 2) incluyen productos del gen RTN2 humano, que incluyen variantes naturales, por ejemplo, variantes alélicas, y homólogos y análogos de los mismos. En un ejemplo, el biomarcador RTN2 es un polinucleótido que tiene la secuencia de nucleótidos expuesta en la SEQ ID NO: 229 (referenciada en GenBank gi número 46255010), o que contiene una porción de la misma que codifica proteína, por ejemplo, la secuencia codificante de la misma en nucleótidos 229-1866 de la SEQ ID NO: 229, una variante natural de la misma, o una proteína codificada por dicho polinucleótido.
Los biomarcadores SMARCD3 (regulador de cromatina dependiente de actina, asociado a matriz, relacionado con SWI/SNF, subfamilia d, miembro 3p), incluyen productos del gen SMARCD3 humano, que incluyen variantes naturales, por ejemplo, variantes alélicas, y homólogos y análogos de los mismos. En un ejemplo, el biomarcador SMARCD3 es un polinucleótido que tiene la secuencia de nucleótidos expuesta en la SEQ ID NO: 232 (referenciada en GenBank gi número 51477701), o que contiene una porción de la misma que codifica una proteína, por ejemplo, la secuencia codificante de la misma en los nucleótidos 102-1553, una variante natural de la misma, o una proteína codificada por dicho polinucleótido.
Los biomarcadores SPATA7 (espermatogénesis asociada a 7), incluyen productos del gen SPATA7 humano, que incluyen variantes naturales, por ejemplo, variantes alélicas, y homólogos y análogos de los mismos. En un ejemplo, el biomarcador SPATA7 es un polinucleótido que tiene la secuencia de nucleótidos expuesta en la SEQ ID NO: 233 (referenciada en GenBank gi número 295789142), o que contiene una porción de la misma que codifica proteína, por ejemplo, la secuencia codificante de la misma en los nucleótidos 176-1879 de la SEQ ID NO: 233, una variante
natural de la misma, o una proteína codificada por dicho polinucleótido.
Los biomarcadores SST1 (receptor 1 de somatostatina) incluyen productos del gen SST1 humano, que incluyen variantes naturales, por ejemplo, variantes alélicas, y homólogos y análogos de los mismos. En un ejemplo, el biomarcador SST1 es un polinucleótido que tiene la secuencia de nucleótidos expuesta en la SEQ ID NO: 234 (referenciada en GenBank gi número 33946330), o que contiene una porción de la misma que codifica proteína, por ejemplo, la secuencia codificante de la misma en los nucleótidos 618-1793 de la SEQ ID NO: 234, una variante natural de la misma, o una proteína codificada por dicho polinucleótido.
Los biomarcadores SST3 (receptor 3 de somatostatina) incluyen productos del los gen SST3 humano, que incluyen variantes naturales, por ejemplo, variantes alélicas, y homólogos y análogos de los mismos. En un ejemplo, el biomarcador SST3 es un polinucleótido que tiene la secuencia de nucleótidos expuesta en la SEQ ID NO: 235 (referenciada en GenBank gi número 44890055), o que contiene una porción de la misma que codifica proteína, por ejemplo, la secuencia codificante de la misma en los nucleótidos 526-1782 de la SEQ ID NO: 235, una variante natural de la misma, o una proteína codificada por dicho polinucleótido.
Los biomarcadores SST4 (receptor 4 de somatostatina) incluyen productos del gen SST3 humanos, que incluyen variantes naturales, por ejemplo, variantes alélicas, y homólogos y análogos de los mismos. En un ejemplo, el biomarcador SST3 es un polinucleótido que tiene la secuencia de nucleótidos expuesta en la SEQ ID NO: 236 (referenciada en GenBank gi número 149944553), o que contiene una porción de la misma que codifica proteína, por ejemplo, la secuencia codificante de la misma en nucleótidos 65-1231, una variante natural de la misma, o una proteína codificada por dicho polinucleótido.
Los biomarcadores SST5 (receptor 5 de somatostatina) incluyen productos del gen SST3 humanos, que incluyen variantes naturales, por ejemplo, variantes alélicas, y homólogos y análogos de los mismos. En un ejemplo, el biomarcador SST3 es un polinucleótido que tiene la secuencia de nucleótidos expuesta en la SEQ ID NO: 237 (referenciada en GenBank gi número 289547751), o que contiene una porción de la misma que codifica proteína, por ejemplo, la secuencia codificante de la misma en los nucleótidos 89-1183, una variante natural del mismo, o una proteína codificada por dicho polinucleótido.
Los biomarcadores TECPR2 (tectonina que contiene 2 repeticiones de hélice beta) incluyen productos del gen TECPR2 humano, que incluyen variantes naturales, por ejemplo, variantes alélicas, y homólogos y análogos de los mismos. En un ejemplo, el biomarcador TECPR2 es un polinucleótido que tiene la secuencia de nucleótidos expuesta en la SEQ ID NO: 238 (referenciada en GenBank gi número 289547516), o que contiene una porción de la misma que codifica proteína, por ejemplo, la secuencia codificante de la misma en los nucleótidos 227-4030 de la SEQ ID NO: 238, una variante natural de la misma, o una proteína codificada por tal polinucleótido.
Los biomarcadores TRMT112 (homólogo de ARNt metiltransferasa 11-2 (S. cerevisiae)) incluyen productos del gen humano TRMT112, que incluyen variantes naturales, por ejemplo, variantes alélicas, y homólogos y análogos de los mismos. En un ejemplo, el biomarcador TRMT112 es un polinucleótido que tiene la secuencia de nucleótidos expuesta en la SEQ ID NO: 241 (referenciada en GenBank gi número 7705476), o que contiene una porción de la misma que codifica proteína, por ejemplo, la secuencia codificante de la misma en los nucleótidos 36-413 de la SEQ ID NO: 241, una variante natural de la misma, o una proteína codificada por dicho polinucleótido.
Los biomarcadores VPS13C (homólogo C de clasificación de proteína vacuolar 13 (S. cerevisiae)) incluyen productos del gen VPS13C humano, que incluyen variantes naturales, por ejemplo, variantes alélicas, y homólogos y análogos de los mismos. En un ejemplo, el biomarcador VPS13C es un polinucleótido que tiene la secuencia de nucleótidos expuesta en la SEQ ID NO: 242 (referenciada en GenBank gi número 308081495), o que contiene una porción de la misma que codifica proteína, por ejemplo, la secuencia codificante de la misma en los nucleótidos 9210978, una variante natural del mismo, o una proteína codificada por dicho polinucleótido.
Los biomarcadores WDFY3 (repetición WD y FYVE que contiene 3 dominios) incluyen productos del gen WDFY3 humano, que incluyen variantes naturales, por ejemplo, variantes alélicas, y homólogos y análogos de los mismos. En un ejemplo, el biomarcador WDFY3 es un polinucleótido que tiene la secuencia de nucleótidos expuesta en la SEQ ID NO: 243, o la secuencia referenciada en GenBank gi número 195972885, o que contiene una porción de la misma que codifica proteína, por ejemplo, la secuencia codificante en nucleótidos 409-10988 de la SEQ ID NO: 243
o GenBank gi número 195972885, una variante natural de la misma, o una proteína codificada por dicho polinucleótido.
Los biomarcadores ZFHX3 (homeocaja 3 de dedo de Zinc) incluyen productos del gen ZFHX3 humano, que incluyen variantes naturales, por ejemplo, variantes alélicas, y homólogos y análogos de los mismos. En un ejemplo, el biomarcador ZFHX3 es un polinucleótido que tiene la secuencia de nucleótidos expuesta en la SEQ ID NO: 244 (referenciada en GenBank gi número 258613986), o que contiene una porción de la misma que codifica proteína, por ejemplo, la secuencia codificante de la misma en nucleótidos 130-8499 de la SEQ ID NO: 244, una variante natural
de la misma, o una proteína codificada por dicho polinucleótido.
Los biomarcadores ZXDC (dedo de Zinc C de la familia ZXD) incluyen productos del gen ZXDC humanos, que incluyen variantes naturales, por ejemplo, variantes alélicas, y homólogos y análogos de los mismos. En un ejemplo, el biomarcador ZXDC es un polinucleótido que tiene la secuencia de nucleótidos expuesta en la SEQ ID NO: 245 (referenciada en GenBank gi número 217035098), o que contiene una porción de la misma que codifica proteína, por ejemplo, la secuencia codificante de la misma en los nucleótidos 55-2187 de la SEQ ID NO: 245, una variante natural de la misma, o una proteína codificada por dicho polinucleótido.
Los biomarcadores ZZZ3 (tipo ZZ, que contiene 3 dedos de zinc) incluyen productos del gen ZZZ3 humano, que incluyen variantes naturales, por ejemplo, variantes alélicas, y homólogos y análogos de los mismos. En un ejemplo, el biomarcador ZZZ3 es un polinucleótido que tiene la secuencia de nucleótidos expuesta en la SEQ ID NO: 246 (referenciada en GenBank gi número 141803158), o que contiene una porción de la misma que codifica proteína, por ejemplo, la secuencia codificante de la misma en los nucleótidos 477-3188 de la SEQ ID NO: 246, una variante natural de la misma, o una proteína codificada por dicho polinucleótido.
En algunos aspectos, los métodos y composiciones proporcionados detectan un biomarcador de GEP-NEN; en algunos ejemplos, los métodos y composiciones proporcionados detectan paneles de biomarcadores de GEP-NEN, incluidos dos o más biomarcadores de GEP-NEN, tales como al menos 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39, 40, 41, 42, 43, 44, 45, 46, 47, 48, 49, 50, 51, 52, 53, 54, 55, 56, 57, 58, 59, 60, 61, 62, 63, 64, 65, 66, 67, 68, 69, 70, 71, 72, 73, 74, 75, 80, 85, 90, 95, o 100 biomarcadores.
Por ejemplo, se proporcionan métodos y composiciones que detectan al menos 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39, 40, 41, 42, 43, 44, 45, 46, 47, 48, 49, 50 o 51, y/o todos los siguientes conjuntos de biomarcadores:
Productos de los genes AKAP8L, ATP6V1H, BNIP3L, C21orf7, COMMD9, ENPP4, FAM13A, FLJ10357, GLT8D1, HDAC9, HSF2, LEOI, MORF4L2, NOL3, NUDT3, OAZ2, PANK2, PHF21A, PKD1, PLD3, PQBP1, RNF41, RSF1, RTN2, SMARCD3, SPATA7, SST1, SST3, SST4, SST5, TECPR2, TRMT112, VPS13C, WDFY3, ZFHX3, ZXDC, ZZZ3, APLP2, CD59, ARAF1, BRAF1, KRAS y RAF1;
Productos de los genes AKAP8L, ATP6V1H, BNIP3L, C21orf7, COMMD9, ENPP4, FAM13A, FLJ10357, GLT8D1, HDAC9, HSF2, LEOI, MORF4L2, NOL3, NUDT3, OAZ2, PANK2, PHF21A, PKD1, PLD3, PQBP1, RNF41, RSF1, RTN2, SMARCD3, SPATA7, SST1, SST3, SST4, SST5, TECPR2, TRMT112, VPS13C, WDFY3, ZFHX3, ZXDC y ZZZ3; y
Productos de los gene APLP2, ARAF1, BRAF, CD59, CTGF, FZD7, Ki67, KRAS, NAP1L1, PNMA2, RAF1, TPH1, VMAT1 y VMAT2.
También se proporcionan métodos y composiciones que detectan al menos 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28 o 29 de los siguientes conjuntos de biomarcadores:
APLP2, ARAF1, BRAF1, CD59, CgA, CTGF, CXCL14, FZD7, GRIA2, HOXC6, Ki-67; Kiss1, KRAS, MAGE-D2, MTA1, NAP1L1, NKX2-3, NRP2, OR51E1, PNMA2, PTPRN2, RAF1, SCG5, SPOCK1, Survivina, TPH1, VMAT1, VMAT2); y X2BTB48;
APLP2, ARAF1, BRAF1, CD59, KRAS, RAF1, CXCL14, GRIA2, HOXC6, NKX2-3, OR51E1, PNMA2, PTPRN2, SCG5, SPOCK1 y X2BTB48;
CXCL14, GRIA2, HOXC6, NKX2-3, OR51E1, PNMA2, PTPRN2, SCG5, SPOCK1 y X2BTB48; o CgA (cromogranina A), CTGF, FZD7 (homólogo 7 rizado), Ki-67 (un marcador de proliferación), Kiss1 (supresor de metástasis Kiss1), MAGE-D2 (familia D2 de antígeno de melanoma), MTA1 (asociado a metástasis 1), NAP1L1, NRP2 (neuropilina 2), Tph1, VMAT1, VMAT2 y Survivina.
En algunos aspectos, los paneles incluyen además CD164.
En algunos aspectos, incluyen además NALP u otros biomarcadores conocidos.
En algunas realizaciones, el panel de polinucleótidos incluye además uno o más polinucleótidos capaces de hibridar específicamente con genes de "mantenimiento" o de referencia, por ejemplo, genes para los cuales se conocen diferencias en la expresión o no se espera que se correlacionen con las diferencias en las variables analizadas, por ejemplo, con la presencia o ausencia de GEP-NEN u otra enfermedad neoplásica, diferenciación de diversos subtipos de GEP-NEN, metástasis, tipos de mucosa u otros tipos de tejido, indicaciones de pronósticos y/u otro fenotipo, predicción o resultado. En algunos aspectos, los niveles de expresión de dichos genes de mantenimiento
se detectan y se usan como estándares del nivel de expresión global, tales como para normalizar los datos de expresión obtenidos para biomarcadores de GEP-NEN a través de varias muestras.
Los genes de mantenimiento son bien conocidos en la técnica. Típicamente, los genes de mantenimiento incluyen uno o más genes caracterizados como particularmente apropiados para analizar muestras de GEP-NEN, tales como ALG9, TFCP2 y ZNF410. Véase Kidd M, et al., "GeneChip, geNorm Gastrointestinal tumors: Novel reference genes for real time PCR". Physiol Genomics 2007; 30: 363-70. Otros genes de mantenimiento y polinucleótidos son bien conocidos en la técnica e incluyen gliceraldehído-3-fosfato deshidrogenasa (GAPDH), hipoxantina fosforribosiltransferasa (HPRT) y ARN 18S.
Los genes de mantenimiento ALG9 incluyen productos del gen ALG9 humano (glicosilación asociada a asparagina 9, homólogo de alfa-1,2-manosiltransferasa), que incluyen variantes naturales, por ejemplo, variantes alélicas, y homólogos y análogos de los mismos. En un ejemplo, el gen de mantenimiento ALG9 es un polinucleótido que tiene la secuencia de nucleótidos expuesta en la SEQ ID NO: 35 y referenciado en GenBank gi número: 118026920 o que contiene la región codificante de la misma de los nucleótidos 100-1956 de la SEQ ID NO: 35, a variante natural de la misma, o una proteína codificada por dicho polinucleótido.
Los genes de mantenimiento TFCP2 incluyen productos del gen TFCP2 humano (factor CP2 de transcripción), que incluyen variantes naturales, por ejemplo, variantes alélicas, y homólogos y análogos de los mismos. En un ejemplo, el gen de mantenimiento TFCP2 es un polinucleótido que tiene la secuencia de nucleótidos establecida en la SEQ ID NO: 36 y referenciada en GenBank gi número. 291219872, o que contiene la región codificante de la misma en los nucleótidos 722-2230 de la SEQ ID NO: 36, una variante natural de la misma, o una proteína codificada por dicho polinucleótido.
Los genes de mantenimiento ZNF410 incluyen productos del gen de ZNF410 humano (proteína 410 de dedo de zinc), que incluyen variantes naturales, por ejemplo, variantes alélicas, y homólogos y análogos de las mismas. En un ejemplo, el gen de mantenimiento ZNF410 es un polinucleótido que tiene la secuencia de nucleótidos expuesta en la SEQ ID NO: 37 y referenciada en GenBank gi número 10863994, o que contiene la región codificante del mismo en los nucleótidos 183-1619 de la SEQ ID NO: 37, una variante natural de la misma, o una proteína codificada por dicho polinucleótido.
Los genes de mantenimiento GAPDH incluyen productos del gen de GAPDH humano (gliceraldehído-3-fosfato deshidrogenasa), que incluyen variantes naturales, por ejemplo, variantes alélicas, y homólogos y análogos de los mismos. En un ejemplo, el gen de mantenimiento GAPDH es un polinucleótido que tiene la secuencia de nucleótidos expuesta en la SEQ ID NO: 38 y referenciada en el GenBank gi número 83641890 o que contiene la región codificante de la misma en los nucleótidos 103-1110 de la SEQ ID NO: 38, una variante natural de la misma, o una proteína codificada por dicho polinucleótido.
Los genes de mantenimiento 18S incluyen 18S humano (ARNr 18S eucariota), que incluyen variantes naturales, por ejemplo, variantes alélicas, y homólogos y análogos de los mismos. En un ejemplo, el gen de mantenimiento 18S es un polinucleótido que tiene la secuencia de nucleótidos expuesta en la SEQ ID NO: 39 y referenciada en GenBank gi número 36162 o una variante natural de la misma.
Los genes de mantenimiento HPRT incluyen productos del gen HPRT humano, que incluyen variantes naturales, por ejemplo, variantes alélicas, y homólogos y análogos de los mismos. En un ejemplo, el gen de mantenimiento HPRT es un polinucleótido que tiene la secuencia de nucleótidos expuesta en la SEQ ID NO: 40, y referenciada en GenBank gi número 164518913, o que contiene la región codificante de la misma en los nucleótidos 168-824 de la SEQ ID NO: 40, una variante natural de la misma, o una proteína codificada por dicho polinucleótido.
Los genes de mantenimiento SLC25A3 incluyen los productos del gen SLC25A3 humano (familia 25 del portador de soluto (portador mitocondrial, portador de fosfato), miembro 3), que incluyen variantes naturales, por ejemplo, variantes alélicas, y homólogos y análogos de los mismos. En un ejemplo, el gen de mantenimiento SLC25A3 es un polinucleótido que tiene la secuencia de nucleótidos expuesta en la SEQ ID NO: 247 y referenciada en GenBank gi número: 223718119, o que contiene una región codificante de la misma, por ejemplo, la secuencia codificante de la misma en los nucleótidos 121-1209 de la SEQ ID NO: 247, una variante natural de la misma, o una proteína codificada por tal polinucleótido.
Los genes de mantenimiento VAPA incluyen productos del gen VAPA humano (proteína A asociada a (proteína de membrana asociada a la vesícula), que incluyen variantes naturales, por ejemplo, variantes alélicas, y homólogos y análogos de los mismos. En un ejemplo, el gen de mantenimiento VAPA es un polinucleótido que tiene la secuencia de nucleótidos expuesta en la SEQ ID NO: 248 y referenciada en GenBank gi número: 94721249, o que contiene una región codificante de la misma, por ejemplo, la secuencia codificante de la misma en los nucleótidos 300-1184 de la SEQ ID NO: 248, una variante natural de la misma, o una proteína codificada por dicho polinucleótido.
Los genes de mantenimiento TXNIP incluyen productos del gen TXNIP humano (proteína que interacciona con tiorredoxina), que incluyen variantes naturales, por ejemplo, variantes alélicas, y homólogos y análogos de las mismas. En un ejemplo, el gen de mantenimiento TXNIP es un polinucleótido que tiene la secuencia de nucleótidos expuesta en la SEQ ID NO: 249 y referenciada en GenBank gi número: 171184420, o que contiene una región codificante de la misma, por ejemplo, Su secuencia codificante en los nucleótidos 342-1517 de la SEQ ID NO: 249, una variante natural de la misma, o una proteína codificada por dicho polinucleótido.
Los genes de mantenimiento ADD3 incluyen productos del gen ADD3 humano (aducina 3 (gamma)), que incluyen variantes naturales, por ejemplo, variantes alélicas, y homólogos y análogos de los mismos. En un ejemplo, el gen de mantenimiento ADD3 es un polinucleótido que tiene la secuencia de nucleótidos expuesta en la SEQ ID NO: 250 y referenciada en GenBank gi número: 62912451, o que contiene una región codificante de la misma, por ejemplo, la secuencia codificante de la misma en los nucleótidos 377-2497 de la SEQ ID NO: 250, una variante natural de la misma, o una proteína codificada por dicho polinucleótido.
Los genes de mantenimiento DAZAP2 incluyen productos del gen DAZAP2 humano (proteína asociada a DAZ 2), que incluyen variantes naturales, por ejemplo, variantes alélicas, y homólogos y análogos de los mismos. En un ejemplo, el gen de mantenimiento DAZAP2 es un polinucleótido que tiene la secuencia de nucleótidos expuesta en la SEQ ID NO: 251 y referenciada en GenBank gi número: 211904132 o que contiene una región codificante de la misma, por ejemplo, la secuencia codificante de la misma en los nucleótidos 185-691, una variante natural de la misma, o una proteína codificada por dicho polinucleótido.
Los genes de mantenimiento ACTG1 incluyen productos del gen ACTG1 humano (actina, gamma 1), que incluyen variantes naturales, por ejemplo, variantes alélicas, y homólogos y análogos de los mismos. En un ejemplo, el gen de mantenimiento ACTG1 es un polinucleótido que tiene la secuencia de nucleótidos expuesta en la SEQ ID NO: 252 y referenciada en GenBank gi número: 316659408, o que contiene una región codificante de la misma, por ejemplo, la secuencia codificante de la misma en los nucleótidos 259-1386 de la SEQ ID NO: 252, una variante natural de la misma, o una proteína codificada por dicho polinucleótido.
Los genes de mantenimiento de ACTB incluyen productos del gen ACTB humano (actina, beta), que incluyen variantes naturales, por ejemplo, variantes alélicas, y homólogos y análogos de los mismos. En un ejemplo, el gen de mantenimiento ACTB es un polinucleótido que tiene la secuencia de nucleótidos expuesta en la SEQ ID NO: 200 y referenciada en GenBank gi número: 168480144, o que contiene una región codificante de la misma, por ejemplo, la secuencia codificante en los nucleótidos 85-1212 de la SEQ ID NO: 200, una variante natural de la misma, o una proteína codificada por dicho polinucleótido.
Los genes de mantenimiento ATG4B incluyen productos del gen ATG4B humano (homólogo B relacionado con autofagia 4 (S. cerevisiae)), que incluyen variantes naturales, por ejemplo, variantes alélicas, y homólogos y análogos de los mismos. En un ejemplo, el gen de mantenimiento ACTG4B es un polinucleótido que tiene la secuencia de nucleótidos establecida en la SEQ ID NO: 203, o que contiene una región codificante de la misma, por ejemplo, la secuencia codificante de la misma en los nucleótidos 104-1285 de la SEQ ID NO: 203, o secuencia referenciada en GenBank gi número: 47132610, una variante natural de la misma, o una proteína codificada por dicho polinucleótido.
Los genes de mantenimiento ARF1 incluyen productos del gen ARF1 humano (factor 1 de ribosilación ADP), que incluyen variantes naturales, por ejemplo, variantes alélicas, y homólogos y análogos de los mismos. En un ejemplo, el gen de mantenimiento ARF1 es un polinucleótido que tiene la secuencia de nucleótidos expuesta en la SEQ ID NO: 202 y referenciada en GenBank gi número: 66879659 o que contiene una región codificante de la misma, por ejemplo, la secuencia codificante en los residuos de nucleótidos 229-774, una variante natural de la misma, o una proteína codificada por dicho polinucleótido.
Los genes de mantenimiento HUWE1 incluyen productos del gen HUWE1 humano (HECT, UBA y dominio WWE que contienen 1), que incluyen variantes naturales, por ejemplo, variantes alélicas, y homólogos y análogos de los mismos. En un ejemplo, el gen de mantenimiento HUWE1 es un polinucleótido que tiene la secuencia de nucleótidos expuesta en la SEQ ID NO: 214 y referenciada en GenBank gi número: 195963314, o que contiene la región codificante de la misma, por ejemplo, la secuencia codificante en los nucleótidos 403-13527, una variante natural de la misma, o una proteína codificada por dicho polinucleótido.
Los genes de mantenimiento MORF4L1 incluyen productos del gen MORF4L1 humano (factor 4 de mortalidad tipo 1), que incluyen variantes naturales, por ejemplo, variantes alélicas, y homólogos y análogos de los mismos. En un ejemplo, el gen de mantenimiento MORF4L1 es un polinucleótido que tiene la secuencia de nucleótidos expuesta en la SEQ ID NO: 216 y referenciada en GenBank gi número: 45643136, o que contiene una región codificante de la misma, por ejemplo, la secuencia codificante en los nucleótidos 189-1160, una variante natural de la misma, o una proteína codificada por dicho polinucleótido.
Los genes de mantenimiento RHOA incluyen productos del gen RHOA humano (familia del gen homólogo ras, miembro A), que incluyen variantes naturales, por ejemplo, variantes alélicas, y homólogos y análogos de los mismos. En un ejemplo, el gen de mantenimiento RHOA es un polinucleótido que tiene la secuencia de nucleótidos expuesta en la SEQ ID NO: 226 y referenciada en GenBank gi número: 50593005, o que contiene una región codificante de la misma, por ejemplo, la secuencia codificante de la misma en los nucleótidos 277-858, una variante natural de la misma, o una proteína codificada por dicho polinucleótido.
Los genes de mantenimiento SERP1 incluyen productos del gen SERP1 humano (proteína 1 del retículo endoplásmico asociado a estrés), que incluyen variantes naturales, por ejemplo, variantes alélicas, y homólogos y análogos de los mismos. En un ejemplo, el gen de mantenimiento SERP1 es un polinucleótido que tiene la secuencia de nucleótidos expuesta en la SEQ ID NO: 230 y referenciada en GenBank gi número: 109809760, o que contiene una región codificante de la misma, por ejemplo, la secuencia codificante de la misma en los nucleótidos 507-707, una variante natural de la misma, o una proteína codificada por dicho polinucleótido.
Los genes de mantenimiento SKP1 incluyen productos del gen SKP1 humano (proteína 1 asociada a quinasa de fase S), que incluyen variantes naturales, por ejemplo, variantes alélicas, y homólogos y análogos de los mismos. En un ejemplo, el gen de mantenimiento SKP1 es un polinucleótido que tiene la secuencia de nucleótidos expuesta en la SEQ ID NO: 231 y referenciada en GenBank gi número: 160420325, o que contiene una región codificante de la misma, por ejemplo, la secuencia codificante de la misma en los nucleótidos 180-662, una variante natural de la misma, o una proteína codificada por dicho polinucleótido.
Los genes de mantenimiento TOX4 incluyen productos del gen TOX4 humano (miembro 4 de la familia de caja del grupo de alta movilidad TOX), que incluyen variantes naturales, por ejemplo, variantes alélicas, y homólogos y análogos de los mismos. En un ejemplo, el gen de mantenimiento TOX4 es un polinucleótido que tiene la secuencia de nucleótidos expuesta en la SEQ ID NO: 239 y referenciada en GenBank gi número: 99077116, o que contiene una región codificante de la misma, por ejemplo, la secuencia codificante de la misma en los nucleótidos 104-1969, una variante natural de la misma, o una proteína codificada por dicho polinucleótido.
Los genes de mantenimiento TPT1 incluyen productos del gen TPT1 humano (proteína tumoral 1, controlada por traducción), que incluyen variantes naturales, por ejemplo, variantes alélicas, y homólogos y análogos de los mismos. En un ejemplo, el gen de mantenimiento TPT1 es un polinucleótido que tiene la secuencia de nucleótidos expuesta en la SEQ ID NO: 240 y referenciada en GenBank gi número: 141801911, o que contiene una región codificante de la misma, por ejemplo, la secuencia codificante de la misma en los nucleótidos 94-612, una variante natural de la misma, o una proteína codificada por dicho polinucleótido.
D. Métodos y agentes para detectar los biomarcadores, tumores y células de GEP-NEN
También se proporcionan métodos, composiciones y sistemas para la detección de los biomarcadores de GEP-NEN y para identificar, aislar y enriquecer tumores y células que expresan los biomarcadores de GEP-NEN. Por ejemplo, se proporcionan agentes, conjuntos de agentes y sistemas para detectar los biomarcadores de GEP-NEN y los métodos para su uso, incluidos los usos de diagnóstico y pronóstico.
1. Agentes y sistemas para detectar los biomarcadores
En una realización, los agentes son proteínas, polinucleótidos u otras moléculas que se unen específicamente o se hibridan específicamente con los biomarcadores de GEP-NEN. Los agentes incluyen polinucleótidos, tales como sondas y cebadores, por ejemplo, cebadores de PCR sentido y antisentido, que tienen identidad o complementariedad con los biomarcadores de polinucleótidos, tales como ARNm, y proteínas, tales como anticuerpos, que se unen específicamente a tales biomarcadores. También se proporcionan conjuntos y kits que contienen los agentes, tales como agentes que hibridan específicamente o unen el panel de biomarcadores.
Por lo tanto, los sistemas, por ejemplo, microarreglos, conjuntos de polinucleótidos y kits, proporcionados en este documento incluyen aquellos con moléculas de ácido nucleico, típicamente oligonucleótidos de ADN, tales como cebadores y sondas, cuya longitud típicamente varía entre 15 bases y varias kilobases. bases, tales como entre 20 bases y 1 kilobase, entre 40 y 100 bases, y entre 50 y 80 nucleótidos o entre 20 y 80 nucleótidos. En un aspecto, la mayoría (es decir, al menos el 60% de) las moléculas de ácido nucleico de un microarreglo de nucleótidos, un kit u otro sistema, son capaces de hibridarse con biomarcadores de GEP-NEN.
En un ejemplo, se proporcionan sistemas que contienen polinucleótidos que hibridan específicamente con los biomarcadores, por ejemplo, microarreglos de ácido nucleico, para detectar y medir cambios en los niveles de expresión y determinar los perfiles de expresión de los biomarcadores de acuerdo con los métodos proporcionados. Entre tales sistemas, por ejemplo, microarreglos, están aquellos que comprenden polinucleótidos capaces de hibridar con al menos 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39, 40, 41, 42, 43, 44, 45, 46, 47, 48, 49, 50, 51, 52, 53, 54, 55, 56, 57, 58, 59, 60,
61, 62, 63, 64, 65, 66, 67, 68, 69, 70, 71, 72, 73, 74, 75, 80, 85, 90, 95, o 100 biomarcadores tales como al menos, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39, 40, 41, 42, 43, 44, 45, 46, 47, 48, 49, 50 o 51, y/o todas los siguientes conjuntos de biomarcadores:
Productos de los genes AKAP8L, ATP6V1H, BNIP3L, C21orf7, COMMD9, ENPP4, FAM13A, FLJ10357, GLT8D1, HDAC9, HSF2, LEO1, MORF4L2, NOL3, NUDT3, OAZ2, PANK2, PHF21A, PKD1, PLD3, PQBP1, RNF41, RSF1, RTN2, SMARCD3, SPATA7, SST1, SST3, SST4, SST5, TECPR2, TRMT112, VPS13C, WDFY3, ZFHX3, ZXDC, ZZZ3, APLP2, CD59, ARAF1, BRAF1, KRAS y RAF1;
Productos de los genes AKAP8L, ATP6V1H, BNIP3L, C21orf7, COMMD9, ENPP4, FAM13A, FLJ10357, GLT8D1, HDAC9, HSF2, LEO1, MORF4L2, NOL3, NUDT3, OAZ2, PANK2, PHF21A, PKD1, PLD3, PQBP1, RNF41, RSF1, RTN2, SMARCD3, SPATA7, SST1, SST3, SST4, SST5, TECPR2, TRMT112, VPS13C, WDFY3, ZFHX3, ZXDC y ZZZ3; y
Productos de los genes APLP2, ARAF1, BRAF, CD59, CTGF, FZD7, Ki67, KRAS, NAP1L1, PNMA2, RAF1, TPH1, VMAT1 y VMAT2; o
al menos 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28 o 29 de APLP2, ARAF1, BRAF1, CD59, CgA, CTGF, CXCL14, FZD7, GRIA2, HOXC6, Ki-67; Kiss1, KRAS, MAGE-D2, MTA1, NAP1L1, NKX2-3, NRP2, OR51E1, PNMA2, PTPRN2, RAF1, SCG5, SPOCK1, Survivina, TPH1, VMAT1, VMAT2); y X2BTB48; o de los biomarcadores APLP2, ARAF1, BRAF1, CD59, KRAS, RAF1, CXCL14, GRIA2, HOXC6, NKX2-3, OR51E1, PNMA2, PTPRN2, SCG5, SPOCK1 y X2BTB48; o de los biomarcadores CXCL14, GRIA2, HOXC6, NKX23, OR51E1, PNMA2, PTPRN2, SCG5, SPOCK1 y X2BTB48.
En algunos aspectos, al menos el 60%, o al menos el 70%, al menos el 80% o más de las moléculas de ácido nucleico del sistema, por ejemplo, microarreglos, son capaces de hibridar con biomarcadores en el panel de biomarcadores. En un ejemplo, las sondas inmovilizadas en tales microarreglos de nucleótidos comprenden al menos 2, y típicamente al menos 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39, 40, 41, 42, 43, 44, 45, 46, 47, 48, 49, 50, 51, 52, 53, 54, 55, 56, 57, 58, 59, 60, 61, 62, 63, 64, 65, 66, 67, 68, 69, 70, 71, 72, 73, 74, 75, 80, 85, 90, 95, o 100 o más biomarcadores, tal como al menos 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39, 40, 41, 42, 43, 44, 45, 46, 47, 48, 49, 50 o 51, o más moléculas de ácido nucleico capaces de hibridar con al menos 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39, 40, 41, 42, 43, 44, 45, 46, 47, 48, 49, 50, 51, 52, 53, 54, 55, 56, 57, 58, 59, 60, 61, 62, 63, 64, 65, 66, 67, 68, 69, 70, 71, 72, 73, 74, 75, 80, 85, 90, 95, o más biomarcadores, tal como al menos 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39, 40, 41, 42, 43, 44, 45, 46, 47, 48, 49, 50 o 51, o más de los biomarcadores, donde cada una de las moléculas de ácido nucleico es capaz de hibridarse específicamente con cada uno de los diferentes biomarcadores, de modo que al menos se puedan unir muchos biomarcadores diferentes.
En un ejemplo, las moléculas de ácido nucleico restantes, tales como 40% o como máximo 40% de las moléculas de ácido nucleico en el microarreglo o en el conjunto de polinucleótidos son capaces de hibridar con un conjunto de genes de referencia o un conjunto de genes de normalización (como genes de mantenimiento), por ejemplo, para la normalización a fin de reducir el sesgo sistémico. El sesgo sistémico produce variación por diferencias entre arreglos en el desempeño global, que puede deberse, por ejemplo, a inconsistencias en la fabricación, tinción y escaneo de arreglos, y la variación entre muestras de ARN marcadas, que puede deberse, por ejemplo, a variaciones en la pureza. El sesgo sistémico puede introducirse durante el manejo de la muestra en un experimento de microarreglos. Para reducir el sesgo sistémico, los niveles de ARN determinados se corrigen preferiblemente por la hibridación no específica de fondo y se normalizan.
El uso de tales sondas de referencia es ventajoso pero no obligatorio. En una realización, se proporciona un conjunto de polinucleótidos o sistema, por ejemplo, se provee un microarreglo, en el que al menos el 90% de las secuencias de ácido nucleico son capaces de hibridarse con los biomarcadores de GEP-NEN; realizaciones adicionales incluyen tales sistemas y conjuntos en los que al menos el 95% o incluso el 100% de los polinucleótidos se hibridan con los biomarcadores.
Se describen en los ejemplos, ejemplos de polinucleótidos adecuados, tales como cebadores de PCR. Otras sondas y cebadores de ácidos nucleicos, capaces de hibridarse a diferentes regiones de los biomarcadores son, por supuesto, también adecuados para su uso en relación con los sistemas, kits y métodos proporcionados.
2. Detección de los biomarcadores
También se proporcionan métodos para detectar y cuantificar los biomarcadores, que incluyen detectar la presencia,
ausencia, cantidad o cantidad relativa, tales como niveles de expresión o perfil de expresión de los biomarcadores. Típicamente, los métodos son métodos basados en ácido nucleico, por ejemplo, medir la presencia, cantidad o niveles de expresión de la expresión de ARNm del biomarcador. Tales métodos típicamente se llevan a cabo poniendo en contacto agentes polinucleotídicos con muestras biológicas, tales como muestras de prueba y muestras normales y de referencia, por ejemplo, para cuantificar los niveles de expresión de biomarcadores de ácidos nucleicos (por ejemplo, ARNm) en las muestras.
La detección y análisis de biomarcadores de acuerdo con las realizaciones proporcionadas se puede realizar con cualquier método adecuado conocido en la técnica. Por ejemplo, cuando los biomarcadores son biomarcadores de ARN, se utilizan métodos de cuantificación y detección de ARN.
Los ejemplos de métodos para cuantificar o detectar niveles de expresión de ácido nucleico, por ejemplo, expresión de ARNm, son bien conocidos e incluyen transferencia de Northern e hibridación in situ (Parker and Barnes, Methods in Molecular Biology 106: 247-283, 1999); Ensayos de protección de RNAsa (Hod, Biotechniques 13: 852854, 1992); y reacción en cadena de la polimerasa de transcripción inversa cuantitativa o semicuantitativa (RT-PCR) (Weis et al., Trends in Genetics 8: 263-264, 1992), los métodos representativos para el análisis de expresión génica basada en secuenciación incluyen el análisis serial de la expresión génica (SAGE), y el análisis de la expresión génica mediante secuenciación de firma masivamente paralela (MPSS).
Por lo tanto, en una realización, la expresión del biomarcador o panel de biomarcador incluye expresión de ARN; los métodos incluyen determinar los niveles de ARN de los biomarcadores, tales como ARN obtenido y/o presente en una muestra de un paciente, y realizar análisis, diagnóstico o determinaciones predictivas basadas en los niveles de expresión de ARN determinado para los biomarcadores o panel de biomarcadores .
Las muestras de ARN se pueden procesar de numerosas maneras, como es conocido por los expertos en la técnica. Varios métodos son bien conocidos para el aislamiento de ARN de muestras, incluida la extracción con tiocianato de guanidinio-fenol-cloroformo, que puede llevarse a cabo utilizando el reactivo TRIZOL®, una formulación patentada (véase Chomczynski P, Sacchi N (2006). "The singlestep method of RNA isolation by acid guanidinium thiocyanatephenol-chloroform extraction: twenty-something years on". Nat Protoc 1 (2): 581-5). En este método, TRIZOL® se usa para extraer ARN y ADN; el cloroformo y la centrifugación se utilizan para separar el ARN de otros ácidos nucleicos, seguido de una serie de lavados con etanol para la limpieza de la muestra de ARN.
Las muestras de ARN se pueden preparar recientemente a partir de células o tejidos en el momento de la recolección; alternativamente, se pueden preparar a partir de muestras que se almacenan a -70°C hasta que se procesen para la preparación de la muestra. Alternativamente, los tejidos o las muestras de células se pueden almacenar y/o someterse a otras condiciones conocidas en la técnica para preservar la calidad del ARN, incluida la fijación, por ejemplo, con formalina o un agente similar; e incubación con inhibidores de RNasa tales como RNAsin® (Pharmingen) o RNasecure® (Ambion); soluciones acuosas tales como RNAlater® (Assuragen), efecto de protección del disolvente orgánico mediado por regulador de Hepes-ácido glutámico (HOPE) y RCL2 (Alphelys); y soluciones no acuosas tales como Universal Molecular Fixative (Sakura Finetek USA Inc.). También se puede utilizar un regulador de lisis de aislamiento de ácido nucleico caotrópico (método Boom, Boom et al., J Clin Microbiol. 1990;
28: 495-503) para aislamiento de ARN.
En una realización, se aísla el ARN a partir de una capa leucocitaria mediante incubación de muestras con TRIZOL®, seguido de limpieza del ARN. El ARN se disuelve en pirocarbonato de dietilo y agua y se mide espectrofotométricamente, y se analiza una alícuota en un Bioanalizador (Agilent Technologies, Palo Alto, CA) para evaluar la calidad del ARN (Kidd M, et al., "The role of Genetics markers --NAP1L1, MAGE-D2 y MTA1--In defining small-intestinal carcinoid neoplasia", "Ann Surg Oncol 2006; 13 (2): 253-62). En otra realización, el ARN se aísla del plasma usando el Mini Kit QIAamp de ARN en sangre; en algunos casos, este método permite una mejor detección mediante PCR en tiempo real de significativamente más genes de mantenimiento de plasma comparado con el enfoque con TRIZOL®. En otra realización, el ARN se aísla directamente de sangre completa, por ejemplo, usando el Mini Kit QIAamp para ARN en sangre de una manera similar.
Los métodos para aislar ARN a partir de tejidos fijados embebidos en parafina como fuente de ARN son bien conocidos y generalmente incluyen aislamiento, purificación, extensión del cebador y amplificación del ARNm (por ejemplo: TE Godfrey et al., J. Molec. Diagnostics 2: 84-91 [2000], K. Specht et al., Am. J. Pathol. 158: 419 -29 [2001]). En un ejemplo, el ARN se extrae de una muestra tal como una muestra de sangre usando el Mini Kit QIAamp para ARN en sangre. Típicamente, se extrae el ARN del tejido, seguido de la eliminación de proteínas y ADN y el análisis de la concentración de ARN. Se puede incluir una etapa de reparación y/o amplificación de ARN, tal como una etapa para la transcripción inversa de ARN para RT-PCR.
Los niveles o cantidades de expresión de los biomarcadores de ARN se pueden determinar o cuantificar mediante cualquier método conocido en la técnica, por ejemplo, mediante cuantificación de la expresión de ARN relativa al
gen de mantenimiento o con relación a los niveles de ARN de otros genes medidos al mismo tiempo. Los métodos para determinar los niveles de ARN de genes son conocidos por una persona experta e incluyen, pero no se limitan a, transferencia Northern, PCR (cuantitativa) y análisis de microarreglos.
La transferencia de Northern se puede realizar para la cuantificación de ARN de un gen biomarcador específico o producto del gen, mediante hibridación de una sonda marcada que interactúa específicamente con el ARN, después de la separación del ARN mediante electroforesis en gel. Las sondas se marcan, por ejemplo, con isótopos radiactivos o sustratos quimioluminiscentes. La cuantificación de la sonda marcada que ha interactuado con dicho producto de expresión de ácido nucleico sirve como una medida para determinar el nivel de expresión. El nivel determinado de expresión se puede normalizar para las diferencias en las cantidades totales de productos de expresión de ácido nucleico entre dos muestras separadas con, por ejemplo, un calibrador interno o externo comparando el nivel de expresión de un gen que se sabe que no difiere en el nivel de expresión entre muestras o agregando una cantidad conocida de ARN antes de determinar los niveles de expresión.
Para RT-PCR, el ARN biomarcador se transcribe de forma inversa en ADNc. La reacción en cadena de la polimerasa con transcriptasa inversa (RT-PCR) se realiza, por ejemplo, usando cebadores específicos que hibridan con una secuencia de ARN de interés y una enzima transcriptasa inversa. Además, RT-PCR se puede realizar con cebadores aleatorios, como por ejemplo hexámeros o decámeros al azar que hibridan aleatoriamente a lo largo del ARN, u oligo d(T) que hibrida con la cola de poli(A) del ARNm y la enzima transcriptasa inversa.
En algunas realizaciones, los niveles de expresión de ARN de los biomarcadores en la muestra, tal como una de un paciente que padece o se sospecha que padece de GEP-NEN o síntoma o síndrome asociado, se determinan usando métodos cuantitativos tales como rt-PCR en tiempo real (qPCR) o análisis de microarreglos. En algunas realizaciones, la reacción en cadena de polimerasa cuantitativa (QPCR) se usa para cuantificar el nivel de expresión de ácidos nucleicos. En un aspecto, la detección y determinación de los niveles de expresión de los biomarcadores se lleva a cabo mediante RT-PCR, análisis GeneChip, PCR cuantitativa en tiempo real (Q RT-PCR) o inmunotinción/cuantificación de un microarreglo de tejido carcinoide (TMA), por ejemplo, comparar el ARN de biomarcador, por ejemplo, ARNm u otros productos de expresión, niveles en diferentes poblaciones de muestra, caracterizar patrones de expresión génica, discriminar entre los ARNm estrechamente relacionados y analizar la estructura del ARN.
En un ejemplo, se realiza QPCR usando PCR en tiempo real (RTPCR), en donde la cantidad de producto se controla durante la reacción de amplificación, o mediante mediciones de punto final, en las que se determina la cantidad de un producto final. Como es conocido por una persona experta, la rtPCR se realiza por ejemplo mediante el uso de un intercalador de ácido nucleico, como por ejemplo bromuro de etidio o colorante SYBR® Green I, que interactúa con todos los productos bicatenarios generados que dan como resultado un aumento de la fluorescencia durante amplificación, o por ejemplo mediante el uso de sondas marcadas que reaccionan específicamente con el producto de doble cadena generado del gen de interés. Los métodos de detección alternativos que se pueden usar se proporcionan, entre otras cosas, mediante amplificación de señal de dendrímeros, amplificación de señal de hibridación y las balizas moleculares.
En una realización, la transcripción inversa en ARN total se lleva a cabo usando el kit de archivo de ADNc de alta capacidad (Applied Biosystems (ABI), Foster City, CA) siguiendo el protocolo sugerido por el fabricante (brevemente, usando 2 microgramos de ARN total en 50 microlitros de agua, mezclando con 50 µL de mezcla 2XRT que contiene regulador de transcripción inversa, solución de trifosfato de desoxinucleótido, cebadores aleatorios y transcriptasa inversa MultiScribe). Las condiciones de reacción de RT son bien conocidas. En un ejemplo, la reacción de RT se realiza usando las siguientes condiciones del termociclador: 10 minutos, 25ºC; 120 min., 37°C (véase Kidd M, et al., "The role of genetic markers--NAP1L1, MAGE-D2 y MTA1—in defining small-intestinal carcinoid neoplasia", Ann Surg Oncol 2006; 13 ( 2): 253-62).
Para la medición de niveles de transcrito individuales, en una realización, se usan los productos Assays-on-DemandMR con el Sistema de detección de secuencias ABI 7900 de acuerdo con las sugerencias del fabricante (véase Kidd M, Eick G, Shapiro MD, et al., Microsatellite instability and gene mutations in transforming growth factorbeta type II receptor are absent in small bowel carcinoid tumors. Cancer 2005; 103 (2): 229-36). En un ejemplo, el ciclo se realiza en condiciones estándar, usando el protocolo TaqMan® Universal PCR Master Mix, mezclando ADNc en 7,2 µL de agua, 0,8 µL del cebador 20·Assays-on-Demand y mezcla de sonda y 8 µL de la mezcla 2X TaqMan Universal Master, en una placa de reacción óptica de 384 pozos, bajo las siguientes condiciones: 50°C, 2 min; 95°C; 10 minutos.; 50 ciclos a 95°C durante 15 min., 60°C durante 1 min (véase, Kidd M, et al., "The role of genetic markers--NAP1L1, MAGE-D2 y MTA1--in defining small-intestinal carcinoid neoplasia", Ann Surg Oncol 2006; 13 (2): 253-62).
Típicamente, los resultados de la PCR en tiempo real se normalizan, usando patrones internos y/o mediante la comparación con niveles de expresión para los genes de mantenimiento. Por ejemplo, en una realización, los datos
de ∆CT sin procesar (delta CT = cambio en el tiempo del ciclo en función de la amplificación) de QPCR como se describió anteriormente se normalizan usando métodos bien conocidos, tales como geNorm (véase Vandesompele J, De Preter K, Pattyn F, et al., Accurate normalization of real-time quantitative RT-PCR data by geometric averaging of multiple internal control genes. Genome Biol 2002;3(7):RESEARCH0034). La normalización por niveles de expresión génica de mantenimiento también es bien conocida. Véase Kidd M, et al., "GeneChip, geNorm, and gastrointestinal tumors: novel reference genes for real-time PCR," Physiol Genomics 2007;30(3):363-70.
El análisis de microarreglos implica el uso de moléculas de ácido nucleico seleccionadas que están inmovilizadas en una superficie. Estas moléculas de ácido nucleico, denominadas sondas, son capaces de hibridar con productos de expresión de ácido nucleico. En una realización preferida, las sondas se exponen a ácido nucleico de una muestra marcada, se hibridan, se lavan y se determina la cantidad (relativa) de productos de expresión de ácido nucleico en la muestra que son complementarios a una sonda. El análisis de microarreglos permite la determinación simultánea de los niveles de expresión de ácido nucleico de una gran cantidad de genes. En un método de acuerdo con la invención, se prefiere que al menos 5 genes de acuerdo con la invención se midan simultáneamente.
La corrección de fondo puede realizarse, por ejemplo, de acuerdo con el método de "compensación" que evita valores de intensidad negativos después de la resta del fondo. Además, la normalización se puede realizar para hacer que los dos canales en cada matriz individual sean comparables, por ejemplo, usando la normalización global loess, y la normalización de escala que asegura que las relaciones logarítmicas se escalen para tener la misma desviación absoluta media (MAD) a través de los arreglos.
Los niveles de proteína pueden, por ejemplo, medirse usando ensayos de unión basados en anticuerpos. Se pueden usar anticuerpos marcados con enzimas, marcados radiactivamente o marcados fluorescentemente para detección de proteínas. Los ejemplos de ensayos incluyen ensayos de inmunoabsorción ligados a enzimas (ELISA), ensayos de radioinmunoensayo (RIA), ensayos de transferencia de Western y ensayos de tinción inmunohistoquímica. Alternativamente, para determinar el nivel de expresión de proteínas múltiples simultáneamente se usan matrices de proteínas tales como matrices de anticuerpos.
Típicamente, los biomarcadores y marcadores de mantenimiento se detectan en una muestra biológica, tal como una muestra de tejido o fluido, tal como sangre, tal como sangre completa, muestra de plasma, suero, heces, orina, saliva, lágrimas, suero o semen, o una muestra preparada a partir de dicho tejido o fluido, como una preparación celular, que incluye células de sangre, saliva o tejido, como mucosa intestinal, tejido tumoral y tejidos que contienen y/o se sospecha que contienen metástasis de GEP-NEN o células tumorales arrojadas, tales como de hígado, hueso y sangre. En una realización, se obtiene una preparación celular específica mediante clasificación celular activada por fluorescencia (FACS) de suspensiones celulares o fluido de tejido o fluido, tal como muestras de mucosa, por ejemplo, muestras de mucosa intestinal, sangre o capa leucocitaria.
En algunas realizaciones, la muestra se toma de un paciente con GEP-NEN, un paciente sospechoso de tener GEP-NEN, un paciente que tiene y/o se sospecha que tiene en general cáncer, un paciente que presenta uno o más síntomas de GEP-NEN o síndromes o se determina que están en riesgo para GEP-NEN, o un paciente con GEP-NEN sometido a tratamiento o que ha completado el tratamiento, incluidos los pacientes cuya enfermedad está y/o se cree que está en remisión.
En otras realizaciones, la muestra se toma de un humano sin enfermedad de GEP-NEN, tal como un individuo sano
o un individuo con un tipo diferente de cáncer, tal como adenocarcinoma, por ejemplo, un adenocarcinoma gastrointestinal o un cáncer de: mama, próstata o páncreas, o un cáncer gástrico o hepático, tal como cáncer de esófago, páncreas, vesícula biliar, colon o rectal.
En algunos ejemplos, los métodos y sistemas distinguen entre GEP-NEN y otros cánceres, tales como adenocarcinomas, incluyendo adenocarcinoma gastrointestinal o uno de cáncer de mama, próstata o páncreas, o un cáncer gástrico o hepático, tal como cáncer de esófago, pancreático, vesícula biliar, colon o rectal. En otras realizaciones, los métodos y sistemas diferencian entre GEP-NEN de sitios diferentes, tales como entre GEP-NEN del intestino delgado y los del páncreas. Dichas realizaciones son útiles, por ejemplo, para determinar la ubicación primaria de un tumor donde se desconoce y para determinar el pronóstico (particularmente porque los tumores de GEP-NEN pueden mostrar un pronóstico significativamente diferente dependiendo del sitio de origen). En algunas realizaciones, los métodos y sistemas diferencian entre GEP-NEN de sitios diferentes, por ejemplo, tumores pancreáticos y de intestino delgado, con una precisión de al menos 80, 85, 90, 91, 92 o mayor. En otras realizaciones, los métodos pueden diagnosticar o detectar adenocarcinomas con componentes neuroendocrinos.
En algunas realizaciones, la muestra se toma del tumor o metástasis de GEP-NEN. En otras realizaciones, la muestra se toma del paciente con GEP-NEN, pero de un tejido o fluido que no se espera contenga GEP-NEN o células de GEP-NEN; tales muestras pueden usarse como muestras de referencia o normales. Alternativamente, la muestra normal o de referencia puede ser un tejido o fluido u otra muestra biológica de un paciente sin enfermedad
de GEP-NEN, tal como un tejido correspondiente, fluido u otra muestra, tal como una muestra de sangre normal, una muestra de mucosa de intestino delgado (SI) normal, una preparación celular normal enterocromafines (EC).
En algunas realizaciones, la muestra es una muestra de sangre completa. A medida que los tumores neuroendocrinos hacen metástasis, generalmente arrojan células a la sangre. Por consiguiente, la detección de los paneles de biomarcadores de GEP-NEN proporcionados en este documento en plasma y muestras de sangre puede usarse para la identificación de GEP-NEN en un punto temporal temprano y para predecir la presencia de metástasis tumorales, por ejemplo, incluso si los estudios de localización anatómica son negativos. En consecuencia, los agentes y métodos proporcionados son útiles para el diagnóstico precoz.
Por lo tanto, en algunas realizaciones, los métodos pueden identificar una firma molecular de GEP-NEN o un perfil de expresión en 1 mL o aproximadamente 1 mL de sangre completa. En algunos aspectos, la firma molecular o el perfil de expresión es estable durante hasta cuatro horas (por ejemplo, cuando las muestras se refrigeran a 4-8°C después de flebotomía) antes de la congelación. En un aspecto, el enfoque capaz de diagnosticar, pronosticar o predecir un resultado dado asociado a GEP-NEN usando una muestra obtenida de tejido tumoral también puede hacer el mismo diagnóstico, pronóstico o predicción usando una muestra de sangre.
Varias metodologías de detección y diagnóstico existentes requieren de 7 a 10 días para producir un posible resultado positivo, y pueden ser costosas. Por lo tanto, en un aspecto, los métodos y composiciones proporcionados son útiles para mejorar la simplicidad y reducir los costes asociados con el diagnóstico de GEP-NEN, y hacer factible el diagnóstico en la etapa inicial.
Por lo tanto, en un ejemplo, los biomarcadores se detectan en circulación, por ejemplo, mediante detección en una muestra de sangre, tal como suero, plasma, células, por ejemplo, células mononucleares de sangre periférica (PBMC), obtenidas de la capa leucocitaria, o muestra de sangre completa.
Se han detectado transcritos específicos de tumor en sangre completa en algunos cánceres. Véase Sieuwerts AM, et al., "Molecular characterization of circulating tumor cells in large quantities of contaminating leukocytes by a multiplex real time PCR," Breast Cancer Res Treat 2009; 118(3): 455-68 and Mimori K, et al., "A large-scale study of MT1-MMP as a marker for isolated tumor cells in peripheral blood and bone marrow in gastric cancer cases," Ann Surg Oncol 2008;15(10): 2934-42.
La prueba CellSearchMR CTC (Veridex LLC) (descrita por Kahan L., "Medical devices; immunology and microbiology devices; classification of the immunomagnetic circulating cancer cell selection and enumeration system. Final rule," Fed Regist 2004; 69: 26036-8) usa perlas magnéticas recubiertas con anticuerpos específicos de EpCAM que detectan células epiteliales (CK-8/18/19) y leucocitos (CD45), como se describe por Sieuwerts AM, Kraan J, Bolt-de Vries J, et al., "Molecular characterization of circulating tumor cells in large quantities of contaminating leukocytes by a multiplex real-time PCR", Breast Cancer Res Treat 2009; 118 (3): 455-68. Este método se ha utilizado para detectar células tumorales circulantes (CTC) y controlar la progresión de la enfermedad y la eficacia de la terapia en próstata metastásica (Danila DC, Heller G, Gignac GA et al. Circulating tumor cell number and prognosis in progressive castration-resistant prostate cancer. Clin Cancer Res 2007; 13(23): 7053-8), colorectal (Cohen SJ, Alpaugh RK, Gross S, et al. Isolation and characterization of circulating tumor cells in patients with metastatic colorectal cancer. Clin Colorectal Cancer 2006; 6(2): 125-32, y mama (Cristofanilli M, Budd GT, Ellis MJ, et al., Circulating tumor cells, disease progression, and survival in metastatic breast cancer. N Engl J Med 2004; 351(8): 781-91).
Este y otros enfoques existentes no han sido del todo satisfactorios para la detección de células de GEP-NEN, que pueden mostrar expresión variable y/o no expresar citoqueratina (véase Van Eeden S, et al., Classification of lowgrade neuroendocrine tumors of midgut and unknown origin," Hum Pathol 2002; 33(11): 1126-32; Cai YC, et al., "Cytokeratin 7 and 20 and thyroid transcription factor 1 can help distinguish pulmonary from gastrointestinal carcinoid and pancreatic endocrine tumors," Hum Pathol 2001; 32(10): 1087-93, y los estudios descritos en este documento, que detectan la expresión del transcrito de EpCAM en dos de las veintinueve muestras de GEP-NEN).
Los factores a considerar en los métodos de detección disponibles para células tumorales circulantes son números relativamente bajos de células en sangre periférica, típicamente aproximadamente 1 por 106 células mononucleares de sangre periférica (PBMC) (véase Ross AA, et al. "Detection and viability of tumor cells in peripheral blood stem cell collections from breast cancer patients using immunocytochemical and clonogenic assay techniques," Blood 1993; 82(9): 2605-10), y el potencial para contaminación de leucocitos. Véase, Sieuwerts AM, et al. "Molecular characterization of circulating tumor cells in large quantities of contaminating leukocytes by a multiplex real-time PCR," Breast Cancer Res Treat 2009; 118(3): 455-68; Mimori K, et al) y la complejidad técnica de los enfoques disponibles. Estos factores pueden hacer que los métodos disponibles no sean del todo satisfactorios para su uso en el laboratorio clínico.
En algunas realizaciones, las células neuroendocrinas se clasifican por FACS según la heterogeneidad, usando
métodos conocidos, después de la tinción y absorción de naranja de acridina (AO), como se describe Kidd M, et al., "Isolation, Purification and Functional Characterization of the Mastomys EC cell," Am J Physiol 2006; 291: G778-91; Modlin IM, et al., "The functional characterization of normal and neoplastic human enterochromaffin cells," J Clin Endocrinol Metab 2006; 91(6): 2340-8.
En algunas realizaciones, los métodos de detección proporcionados se usan para detectar, aislar o enriquecer las células y/o biomarcadores de GEP-NEN en dos a tres mL de sangre o menos. Los métodos se realizan usando aparatos de laboratorio estándar y, por lo tanto, se realizan fácilmente en el laboratorio clínico. En un ejemplo, se obtiene una lectura dentro de las 12 horas, a un costo promedio de aproximadamente 20-30 por muestra.
E. Usos para diagnóstico, pronóstico y predictivos
También se proporcionan usos para diagnóstico, pronóstico y predictivos para los agentes y métodos de detección proporcionados en la presente memoria, tales como para el diagnóstico, pronóstico y predicción de GEP-NEN, resultados asociados y capacidad de respuesta al tratamiento. Por ejemplo, los métodos de clasificación de GEP-NEN disponibles son limitados, en parte debido a clasificaciones incorrectas y las lesiones o tumores individuales pueden evolucionar a diferentes subtipos o patrones de GEP-NEN y/o contener más de un subtipo de GEP-NEN. Los sistemas de clasificación conocidos están limitados, por ejemplo, a la capacidad de predecir la respuesta al tratamiento o discriminar con precisión entre tumores con características histopatológicas similares que pueden variar sustancialmente en el curso clínico y la respuesta al tratamiento, y para predecir la capacidad de respuesta del tratamiento.
Por ejemplo, los criterios de clasificación de la Organización Mundial de la Salud (OMS), adoptados en el año 2000, distinguen entre NET bien diferenciados (WDNET) (comportamiento benigno o potencial maligno incierto), carcinomas neuroendocrinos bien diferenciados (malignidad de grado bajo) (WDNEC), tumores neuroendocrinos poco diferenciados (PDNET) (malignidad de grado medio) y NEC pobremente diferenciados (generalmente de células pequeñas) (PDNEC) (malignidad de alto grado), según el tamaño, la tasa de proliferación, la localización, la diferenciación y la producción de hormonas. Los subtipos metastásicos siguen la misma nomenclatura y estrategia de clasificación (MET-WDNET; MET-WDNEC, MET-PDNET, MET-PDNEC). Las alternativas propuestas para la clasificación pueden ser subjetivas. Existe una necesidad de esquemas de clasificación basados en genes o moleculares. Los métodos y sistemas proporcionados, incluidos los modelos basados en genes predictivos específicos de GEP-NEN, abordan estos problemas y pueden utilizarse para identificar y analizar parámetros moleculares que son predictivos del comportamiento biológico y la predicción basada en dichos parámetros.
Entre los métodos de diagnóstico, pronóstico y predictivo provistos están los que emplean análisis estadísticos y algoritmos biomatemáticos y modelos predictivos para analizar la información detectada sobre la expresión de biomarcadores de GEP-NEN y otros marcadores tales como genes de mantenimiento. En algunas realizaciones, los niveles de expresión, la unión detectada u otra información se normalizan y se evalúan frente a valores de referencia, tales como niveles de expresión en muestras o patrones normales. Las realizaciones proporcionadas incluyen métodos y sistemas para la clasificación y predicción de GEP-NEN usando la información detectada y medida sobre la expresión de los biomarcadores de GEP-NEN, por ejemplo, en clasificación, estadificación, pronóstico, diseño de tratamiento, evaluación de opciones de tratamiento y predicción de los resultados de la enfermedad de GEP-NEN, por ejemplo, prediciendo el desarrollo de metástasis.
Detección y diagnóstico de GEP-NEN
En algunas realizaciones, los métodos se usan para establecer el diagnóstico de GEP-NEN, tal como el diagnóstico
o detección de enfermedad o metástasis en estadio temprano, definir o predecir el alcance de la enfermedad, identificar la diseminación temprana o metástasis, predecir el resultado o el pronóstico, predecir la progresión, clasificar la enfermedad, controlar la capacidad de respuesta al tratamiento, detectar o controlar la recurrencia y facilitar la intervención terapéutica temprana. Por ejemplo, entre los métodos y algoritmos proporcionados están aquellos para uso en clasificación, estadificación, pronóstico, diseño de tratamiento, evaluación de opciones de tratamiento y predicción de resultados de enfermedad de GEP-NEN, por ejemplo, predicción de desarrollo de metástasis.
En una realización, los métodos, algoritmos y modelos son útiles para la vigilancia del diagnóstico, tal como una vigilancia de rutina. En algunas realizaciones, los métodos, algoritmos y modelos proporcionan un diagnóstico temprano; en un aspecto, los métodos son capaces de detectar tumores de bajo volumen y detectar células tumorales circulantes, incluso en etapas tempranas de la enfermedad, tal como la detección de tan solo unas 3 células circulantes de GEP-NEN por mililitro de sangre. En algunas realizaciones, la detección temprana permite una intervención terapéutica temprana, en un momento en que las terapias son más eficaces, lo que puede mejorar las tasas de supervivencia y los resultados de la enfermedad.
Por ejemplo, en una realización, los métodos útiles para la detección temprana de la recurrencia y/o metástasis de
GEP-NEN, tal como después del tratamiento, por ejemplo, después de una intervención quirúrgica o química. En algún aspecto, los métodos se realizan semanalmente o mensualmente después de la intervención terapéutica, por ejemplo, en muestras de sangre humana. En algunos aspectos, los métodos son capaces de detectar micrometástasis que son demasiado pequeñas para ser detectadas por medios convencionales, tal como por ejemplo mediante métodos de imagenología. Por ejemplo, en un aspecto, los métodos son capaces de detectar metástasis de menos de un centímetro (cm), como metástasis de 1 o aproximadamente 1, 0,9, 0,8, 0,7, 0,6, 0,5, 0,4, 0,3, 0,2 o 0,1 cm, tales como en el hígado
Por ejemplo, entre los métodos y sistemas proporcionados están aquellos que determinan la presencia o ausencia (o ambos) de un GEP-NEN en un sujeto o muestra con una tasa de llamada correcta de entre 56 y 92%, tal como al menos o al menos aproximadamente 65, 70, 75, 80, 81, 82, 83, 84, 85, 86, 87, 88, 89, 90, 91, 92, 93, 94, 95, 96, 97, 98, 99, o 100% de tasa de llamada correcta. En algunos casos, los métodos son útiles para el diagnóstico con una especificidad o sensibilidad de al menos o al menos aproximadamente 70, 75, 80, 81, 82, 83, 84, 85, 86, 87, 88, 89, 90, 91, 92, 93, 94, 95, 96, 97, 98, 99 o 100%.
En otros aspectos, los métodos son capaces de detectar la recurrencia, metástasis o diseminación de GEP-NEN después del tratamiento o durante la progresión inicial de la enfermedad en una etapa más temprana en comparación con otros métodos de diagnóstico, tales como imagenología y detección de biomarcadores disponibles. En algunos aspectos, los niveles de expresión detectados y/o la firma de expresión de los biomarcadores se correlacionan significativamente con la progresión de la enfermedad, la gravedad o agresividad de la enfermedad, la falta de respuesta al tratamiento, la reducción de la eficacia del tratamiento, los eventos asociados con GEN-NEN, el riesgo y el pronóstico, tipo o clase de GEP-NEN o estadio de la enfermedad.
Por ejemplo, en algunas realizaciones, los métodos son capaces de predecir o controlar los efectos de una intervención terapéutica. En un aspecto, los métodos suministrados son capaces de detectar una mejora en la enfermedad como resultado del tratamiento más pronto o más eficaz que los métodos disponibles para la detección y el diagnóstico, como la detección de tumores y metástasis mediante imagenología y detección de biomarcadores disponibles, tales como CgA.
Desarrollo y control de tratamientos y usos terapéuticos
Entre las realizaciones proporcionadas están los métodos que usan los biomarcadores proporcionados y su detección en el desarrollo, la estrategia y el seguimiento del tratamiento, incluida la evaluación de la respuesta al tratamiento y las estrategias de tratamiento individualizadas o específicas del paciente que toman en consideración la probable historia natural del tumor y el estado general de salud del paciente.
Las estrategias de manejo de GEP-NEN incluyen cirugía para lograr la cura (raramente lograda) o citorreducción, intervención radiológica, por ejemplo, por quimioembolización o quimioterapia de ablación por radiofrecuencia, crioablación y tratamiento con somatostatina y análogos de somatostatina (tal como Sandostatina LAR® (inyección de acetato de Octreótido)) para controlar los síntomas causados por péptidos y neuroaminas liberados, C -PET-CT y resección met. Se están investigando los agentes biológicos, incluidos el interferón y la terapia hormonal, y los radionucleótidos marcados con somatostatina.
En un ejemplo, la crioablación libera tejido de GEP-NEN para la entrada en la sangre, que a su vez induce síntomas, como describen Mazzaglia PJ, et al., "Laparoscopic radiofrequency ablation of neuroendocrine liver metastases: a 10-year experience evaluating predictors of survival" Surgery 2007; 142 (1): 10-9.
Los agentes quimioterapéuticos, por ejemplo, agentes quimioterapéuticos citotóxicos sistémicos, incluyen etopósido, cisplatino, 5-fluorouracilo, estreptozotocina, doxorrubicina; inhibidores del factor de crecimiento endotelial vascular, inhibidores del receptor tirosina quinasa (por ejemplo, sunitinib, sorafenib y vatalanib), y el mamífero objetivo de los inhibidores de rapamicina (mTOR) (por ejemplo, temsirolimus y everolimus), y combinaciones de los mismos, por ejemplo para tratar una enfermedad diseminada y/o poco diferenciada. Otros enfoques de tratamiento son bien conocidos.
En algunas realizaciones, los métodos de detección y diagnóstico se usan junto con el tratamiento, por ejemplo, realizando los métodos semanalmente o mensualmente antes y/o después del tratamiento. En algunos aspectos, los niveles de expresión y los perfiles se correlacionan con la progresión de la enfermedad, la ineficacia o la efectividad del tratamiento, y/o la recurrencia o la falta de la misma de la enfermedad. En algunos aspectos, la información de la expresión indica que es preferible una estrategia de tratamiento diferente. Por lo tanto, aquí se proporcionan métodos terapéuticos, en los que los métodos de detección de biomarcadores de GEP-NEN se realizan antes del tratamiento, y luego se usan para controlar los efectos terapéuticos.
En diversos momentos después de iniciar o reanudar el tratamiento, cambios significativos en los niveles de expresión o perfiles de expresión de los biomarcadores (por ejemplo, en comparación con la expresión o los perfiles
de expresión antes del tratamiento o en algún otro momento después del tratamiento, y/o en una muestra normal o de referencia) indica que una estrategia terapéutica es o no exitosa, que la enfermedad es recurrente, o que se debe usar un enfoque terapéutico diferente. En algunas realizaciones, la estrategia terapéutica se cambia después de la realización de los métodos de detección, tal como mediante la adición de una intervención terapéutica diferente, además o en lugar del enfoque actual, aumentando o disminuyendo la agresividad o la frecuencia del enfoque actual, o detener o reinstituir el régimen de tratamiento.
En otro aspecto, los niveles de expresión detectados o el perfil de expresión de los biomarcadores identifica la enfermedad de GEP-NEN por primera vez o proporciona el primer diagnóstico o clasificación definitiva de la enfermedad de GEP-NEN. Por ejemplo, en algunos aspectos, el método distingue entre una o más clasificaciones de GEP-NEN, tales como WDNEC, WDNET, PDNEC, PDNET y formas metastásicas de las mismas, y/o distingue entre GEP-NEN y otros cánceres, incluidos otros cánceres intestinales. En algunos aspectos de esta realización, se diseña un enfoque de tratamiento basado en los niveles de expresión o los perfiles de expresión, y/o la clasificación determinada. Los métodos incluyen enfoques iterativos, mediante los cuales los métodos de detección de biomarcadores son seguidos por iniciación o cambio en la intervención terapéutica, seguidos por un control periódico continuo, reevaluación y cambio, cese o adición de un nuevo enfoque terapéutico, opcionalmente con control continuo.
En algunos aspectos, los métodos y sistemas determinan si el sujeto analizado es o no receptivo al tratamiento, tal como un sujeto que está clínicamente clasificado como en remisión completa o que presenta una enfermedad estable. En algunos aspectos, los métodos y sistemas determinan si el sujeto no recibe tratamiento (o no ha sido tratado, es decir, no ha recibido tratamiento) o no responde (es decir, se clasifica clínicamente como "progresivo". Por ejemplo, se proporcionan métodos para distinguir a los pacientes que responden y que no responden al tratamiento, y para distinguir a los pacientes con enfermedad estable o aquellos en remisión completa, y aquellos con enfermedad progresiva. En varios aspectos, los métodos y sistemas hacen tales llamadas con al menos o aproximadamente 65, 70, 75, 80, 81, 82, 83, 84, 85, 86, 87, 88, 89, 90, 91, 92, 93, 94, 95, 96, 97, 98, 99 o 100% de tasa de llamada correcta (es decir, precisión), especificidad o sensibilidad.
En algunos aspectos, la sensibilidad o tasa de llamada correcta para el resultado diagnóstico o predictivo o pronóstico es mayor que, por ejemplo, significativamente mayor que, la obtenida usando un diagnóstico o método de pronóstico conocido, tal como detección y medición de CgA circulante o otra proteína individual.
Análisis estadístico, algoritmos matemáticos y modelos predictivos
Típicamente, los métodos de diagnóstico, pronóstico y predictivos incluyen análisis estadístico y modelado matemático. Por lo tanto, se proporcionan algoritmos de aprendizaje supervisados útiles para la construcción de modelos predictivos, basados en los biomarcadores de GEP-NEN identificados aquí, y los métodos y usos de los mismos para la predicción y clasificación de GEP-NEN.
Se puede usar cualquiera de una cantidad de métodos bien conocidos para evaluar las diferencias en la expresión génica. Dichos métodos varían desde simples comparaciones de niveles medios de expresión en cada población, por ejemplo, utilizando ANOVA (que es limitado ya que la relevancia de los cambios es compleja de cuantificar) hasta análisis matemáticos basados en protocolos topográficos basados en reconocimiento de patrones, por ejemplo, máquinas de vectores de soporte (SVM) (Noble WS. What is a support vector machine? Nat Biotechnol. 2006; 24 (12): 1565-7). Las técnicas basadas en aprendizaje de máquina son típicamente deseables para desarrollar algoritmos sofisticados, automáticos y/u objetivo para analizar datos biomédicos multimodales y multidimensionales.
En algunos ejemplos, se usa SVM, una variante del algoritmo de aprendizaje supervisado, en conexión con los métodos y sistemas proporcionados. Los SVM se han utilizado para predecir la clasificación de los astrocitomas con una precisión > 90% y los carcinomas prostáticos con una precisión del 74-80% (Glotsos D, Tohka J, Ravazoula P, Cavouras D, Nikiforidis G. Automated diagnosis of brain tumours astrocytomas using probabilistic neural network clustering and support vector machines. Int J Neural Syst 2005; 15(1-2): 1-11; Glotsos D, Tohka J, Ravazoula P, Cavouras D, Nikiforidis G. Automated diagnosis of brain tumours astrocytomas using probabilistic neural network clustering and support vector machines. Int J Neural Syst 2005; 15(1-2): 1-11).
Otros algoritmos para su uso con los métodos y sistemas proporcionados incluyen análisis discriminante lineal (LDA), Bayes (NB) y protocolos del vecino más cercano de K (KNN). Dichos enfoques son útiles para identificar alteraciones individuales o multivariables en las afecciones neoplásicas (Drozdov I, Tsoka S, Ouzounis CA, Shah AM, Genome-wide expression patterns in physiological cardiac hypertrophy. BMC Genomics. 2010; 11: 55; Freeman TC, Goldovsky L, Brosch M, et al. Construction, visualisation, and clustering of transcription networks from microarray expression data. PLoS Comput Biol 2007; 3(10): 2032-42; Zampetaki A, Kiechl S, Drozdov I, et al. Plasma microRNA profiling reveals loss of endothelial miR-126 and other microRNAs in type 2 diabetes. Circ Res. 2010; 107(6): 810-7. Epub 2010 Jul 22; Dhawan M, Selvaraja S, Duan ZH. Application of committee kNN classifiers for gene expression
profile classification. Int J Bioinform Res Appl. 2010; 6(4): 344-52; Kawarazaki S, Taniguchi K, Shirahata M, et al. Conversion of a molecular classifier obtained by gene expression profiling into a classifier based on real-time PCR: a prognosis predictor for gliomas. BMC Med Genomics. 2010; 3: 52; Vandebriel RJ, Van Loveren H, Meredith C. Altered cytokine (receptor) mRNA expression as a tool in immunotoxicology. Toxicology. 1998; 130(1): 43-67; Urgard E, Vooder T, Vosa U, et al. Metagenes associated with survival in non-small cell lung cancer. Cancer Inform. 2011;
10: 175-83. Epub 2011 Jun 2; Pimentel M, Amichai M, Chua K, Braham L. Validating a New Genomic Test for Irritable Bowel Syndrome Gastroenterology 2011; 140 (Suppl 1): S-798; Lawlor G, Rosenberg L, Ahmed A, et al. Increased Peripheral Blood GATA-3 Expression in Asymptomatic Patients With Active Ulcerative Colitis at Colonoscopy. Gastroenterology 2011; 140 (Suppl 1)).
En algunas realizaciones, los métodos y sistemas proporcionados analizan la expresión de los biomarcadores de GEP-NEN como un grupo, con salidas dependientes de una firma de expresión, tales como firmas de expresión o perfiles que son distintos entre muestras normales o de referencia y muestras obtenidas de un sujeto con un "GEP-NEN". En dichas realizaciones, generalmente se usan protocolos de reconocimiento de patrones. Dichos enfoques son útiles, por ejemplo, para identificar firmas malignas y vías de señalización en tejido tumoral de GEP-NEN (tales como los descritos en Drozdov I, Kidd M, Nadler B, et al. Predicting neuroendocrine tumor (carcinoid) neoplasia using gene expression profiling and supervised machine learning. Cancer. 2009; 115(8): 1638-50) y determinar si se obtuvieron muestras de plasma individuales del control normal o GEP-NEN (por ejemplo, como se describe en Modlin IM, Gustafsson BI, Drozdov I, Nadler B, Pfragner R, Kidd M. Principal component analysis, hierarchical clustering, and decision tree assessment of plasma mRNA and hormone levels as an early detection strategy for small intestinal neuroendocrine (carcinoid) tumors. Ann Surg Oncol 2009; 16 (2): 487 -98).
Los métodos que usan los algoritmos y modelos predictivos usan análisis estadístico y métodos de compresión de datos, tales como aquellos bien conocidos en la técnica. Por ejemplo, los datos de expresión pueden transformarse, por ejemplo, In-transformed e importarse en un programa de análisis estadístico, como Partek® Genomics Suite ("Partek", Partek® Genomics SuiteMR, ed. Revisión 6.3 St. Louis: Partek Inc., 2008) o un programa similar, por ejemplo. Los datos se comprimen y se analizan para comparación.
Los análisis estadísticos incluyen determinar la media (M), por ejemplo, media geométrica, de los niveles de expresión génica para tipos de muestra individuales, desviaciones estándar (SD) entre tipos de muestras, número de veces que se produce un cambio geométrico (FC) entre diferentes tipos o condiciones de la muestra, calculados como la relación de las medias geométricas para dos grupos de muestras o valores, comparación de niveles de expresión mediante la prueba de Fisher de dos colas o la prueba t de dos muestras, por ejemplo, para identificar genes de biomarcadores expresados diferencialmente entre varias muestras y tipos de tejidos. El análisis de varianza (ANOVA) se utiliza para evaluar las diferencias en los niveles de expresión de biomarcadores entre la expresión en diferentes muestras y/o valores. En un ejemplo, se implementa un algoritmo no apareado de dos clases, tal como por niveles de expresión de una prueba y muestra normal o valor de referencia que define los dos grupos.
Si las diferencias en niveles, cantidades o valores de expresión se consideran significativas, se puede determinar mediante enfoques estadísticos bien conocidos, y típicamente se hace designando un umbral para un parámetro estadístico particular, tal como un valor p de umbral (por ejemplo, p < 0,05), umbral del valor S (por ejemplo, ± 0,4, con S < -0,4 o S > 0,4), u otro valor, en el cual las diferencias se consideran significativas, por ejemplo, cuando la expresión de un biomarcador se considera significativamente subregulado o sobrerregulado, respectivamente, entre dos muestras diferentes, por ejemplo, representando dos subtipos de GEP-NEN diferentes, tumores, etapas, localizaciones, agresividad u otro aspecto de GEP-NEN o muestra normal o de referencia.
En un aspecto, los algoritmos, modelos predictivos y métodos se basan en biomarcadores expresados a partir de genes asociados con genotipos reguladores (es decir, adhesión, migración, proliferación, apoptosis, metástasis y secreción de hormonas) que subyacen en varios subtipos de GEP-NEN.
En un aspecto, los métodos aplican las formulaciones matemáticas, algoritmos o modelos que identifican puntos de corte específicos, por ejemplo, niveles o cantidades de expresión, que distinguen entre muestras normales y de GEP-NEN, entre GEP-NEN y otros cánceres, y entre varios subtipos, etapas y otros aspectos de la enfermedad o el resultado de la enfermedad. En otro aspecto, los métodos se usan para la predicción, clasificación, pronóstico y control y diseño del tratamiento. En un aspecto, las formas de realización predictivas son útiles para identificar parámetros moleculares predictivos del comportamiento biológico, y la predicción de diversos resultados asociados a GEP-NEN usando los parámetros. En un aspecto de estas realizaciones, se usan enfoques de aprendizaje de máquina, por ejemplo, para desarrollar algoritmos sofisticados, automáticos y objetivos para el análisis de datos biomédicos multidimensionales y multimodales.
Compresión de datos y determinación de perfiles de expresión
Para la comparación de niveles de expresión u otros valores, y para identificar los perfiles de expresión (firmas de expresión) o firmas reguladoras basadas en la expresión de biomarcadores de GEP-NEN, se comprimen los datos. La compresión típicamente es por análisis de componentes principales (PCA) o una técnica similar para describir y visualizar la estructura de datos altamente dimensionales. PCA permite la visualización y comparación de la expresión de biomarcadores de GEP-NEN y la determinación y comparación de perfiles de expresión (firmas de expresión, patrones de expresión) entre diferentes muestras, tales como entre muestras normales o de referencia y de prueba y entre diferentes tipos de tumores.
En algunas realizaciones, los datos de nivel de expresión se adquieren, por ejemplo, mediante PCR en tiempo real, y se reducen o comprimen, por ejemplo, hasta los componentes principales.
PCA se usa para reducir dimensionalmente los datos (por ejemplo, valores de expresión medidos) en componentes principales no correlacionados (PC) que explican o representan la mayoría de la varianza en los datos, tales como aproximadamente 50, 60, 70, 75, 80, 85, 90, 95 o 99% de la varianza.
En un ejemplo, el PCA es un PCA de 3 componentes, en el que se usan tres PC que colectivamente representan la mayor parte de la varianza, por ejemplo, aproximadamente el 75%, 80%, 85%, 90% o más varianza en los datos (Jolliffe IT, "Principle Component Anlysis", Springer, 1986).
El mapeo de PCA, por ejemplo, el mapeo de PCA de 3 componentes se usa para mapear datos en un espacio tridimensional para visualización, tal como mediante asignación del primer (1er), segundo (2do) y tercero (3er) PC a los ejes x, y, y z, respectivamente.
PCA puede usarse para determinar perfiles de expresión para los biomarcadores en diversas muestras. Por ejemplo, los datos de expresión reducida para tipos de muestra individuales (por ejemplo, cada tipo de tumor, subtipo o grado, o tipo de muestra normal) se localizan en un sistema de coordenadas de PCA y los datos localizados se usan para determinar perfiles de expresión de transcritos individuales o firmas.
En un aspecto, el perfil de expresión se determina para cada muestra graficando o definiendo un centroide (centro de masa, expresión promedio), que corresponde o representa el perfil de expresión del transcrito individual de la muestra (firma reguladora), según lo dado por el vector componente principal, según lo determinado por PCA para el panel de biomarcadores.
Generalmente, dos centroides o puntos de localización separados por una distancia relativamente grande en este sistema de coordenadas representan dos perfiles de expresión de transcritos relativamente distintos. Del mismo modo, los centroides relativamente cercanos representan perfiles relativamente similares. En esta representación, la distancia entre los centroides es inversamente equivalente a la medida de similitud (mayor distancia = menos similitud) para las diferentes muestras, de modo que grandes distancias o separación entre centroides indican muestras que tienen firmas de expresión de transcritos distintos. La proximidad de los centroides indica similitud entre las muestras. Por ejemplo, la distancia relativa entre centroides para diferentes muestras tumorales de GEP-NEN representa la similitud relativa de sus firmas reguladoras o perfiles de expresión del transcrito.
Correlación, relaciones lineales y agrupaciones reguladoras
En un aspecto, el análisis estadístico y comparativo incluye determinar la correlación inversa entre los niveles de expresión o valores para dos biomarcadores. En un ejemplo, esta correlación y el coseno del ángulo entre vectores de expresión individuales (mayor ángulo = menor similitud), se usa para identificar agrupamientos de expresión génica relacionados (Gabriel KR, "The biplot graphic display of matrices with application to principal component analysis," Biometrika 1971; 58(3): 453).
En algunas realizaciones, existe una correlación lineal entre los niveles de expresión de dos o más biomarcadores, y/o la presencia o ausencia de GEP-NEN, subtipo, etapa u otro resultado. En un aspecto, existe una correlación dependiente de la expresión entre los biomarcadores de GEP-NEN proporcionados y las características de las muestras biológicas, tales como entre biomarcadores (y sus niveles de expresión) y varios subtipos de GEP-NEN (primarios o metastásicos), muestras normales frente a muestras de GEP-NEN, y/o enfermedad primaria frente a metastásica o agresiva.
Los coeficientes de correlación de Pearson (PC) (R2) se pueden usar para evaluar relaciones lineales (correlaciones) entre pares de valores, tal como entre los niveles de expresión de un biomarcador para diferentes muestras biológicas (por ejemplo, subtipos de tumores) y entre pares de biomarcadores. Este análisis se puede utilizar para separar linealmente la distribución en patrones de expresión, mediante el cálculo de los coeficientes de PC para pares individuales de los biomarcadores (representados en los ejes x e y de las matrices de similitud individuales). Los umbrales pueden establecerse para grados variables de correlación lineal, tales como un umbral para la correlación altamente lineal de (R2 > 0,50 o 0,40). Los clasificadores lineales se pueden aplicar a los conjuntos de
datos. En un ejemplo, el coeficiente de correlación es 1,0.
En una realización, los grupos reguladores se determinan construyendo redes de correlaciones usando análisis estadísticos, por ejemplo, para identificar agrupaciones reguladoras compuestas de subconjuntos del panel de biomarcadores. En un ejemplo, los coeficientes de correlación de PC se determinan y se usan para construir dichas redes de correlaciones. En un ejemplo, las redes se identifican por bordes de dibujo entre pares de transcripciones que tienen R2 por encima del umbral predefinido. El grado de correlación puede proporcionar información sobre reproducibilidad y robustez.
Modelos predictivos y algoritmos de aprendizaje supervisado
También se proporcionan en este documento algoritmos objetivos, modelos predictivos, y métodos analíticos topográficos, y métodos que usan los mismos, para analizar datos biomédicos multidimensionales y multimodales, tales como los datos obtenidos usando los métodos proporcionados para detectar la expresión de los paneles de los biomarcador de GEP-NEN. Como se discutió anteriormente, los algoritmos, modelos y métodos analíticos objetivo incluyen análisis matemáticos basados en protocolos topográficos basados en el reconocimiento de patrones, por ejemplo, máquinas de vectores de soporte (SVM) (Noble WS. ¿What is a support vector machine? Nat Biotechnol. 2006; 24 (12): 1565-7), análisis discriminante lineal (LDA), Bayes sin procesar (NB) y protocolos de vecino más próximo de K (KNN), así como otros algoritmos y modelos de aprendizaje supervisados, como árbol de decisión, Perceptron y análisis discriminante regularizado (RDA), y modelos y algoritmos similares bien conocidos en la técnica (Gallant SI, "Perceptron-based learning algorithms", algoritmos de aprendizaje con base en Perceptron 1990; 1 (2): 179-91).
En algunas realizaciones, los datos de expresión de biomarcadores se analizan en muestras biológicas, usando redes neuronales de alimentación directa; se seleccionan los mejores predictores de transcritos.
En algunas realizaciones, se aplica la selección de características (FS) para eliminar las características más redundantes de un conjunto de datos, tal como un conjunto de datos de expresión de biomarcadores de GEP-NEN. FS mejora la capacidad de generalización, acelera el proceso de aprendizaje y mejora la interpretación del modelo. En un aspecto, FS se emplea utilizando un enfoque de selección "codicioso directo", seleccionando el subconjunto más relevante de características para los modelos de aprendizaje robustos. (Peng H, Long F, Ding C, "Feature selection based on mutual information: criteria of max-dependency, max-relevance, and min-redundancy," IEEE Transactions on
Pattern Analysis and Machine Intelligence, 2005;27(8): 1226-38).
En algunas realizaciones, se usan algoritmos de máquinas de vectores de soporte (SVM) para clasificación de datos mediante el incremento del margen entre los conjuntos de n datos (Cristianini N, Shawe-Taylor J. Introducción a Support Vector Machines: and other kernel-based learning Methods. Cambridge: Cambridge University Press, 2000).
En algunas realizaciones, los modelos predictivos incluyen el árbol de decisión, que mapea las observaciones sobre un ítem a una conclusión sobre su valor objetivo (Zhang H, Cantante B. "Recursive Partitioning in the Health Sciences," (Statistics for Biology and Health): Springer, 1999.). Las hojas del árbol representan clasificaciones y ramas representan conjunciones de características que se convierten en las clasificaciones individuales. Se ha utilizado eficazmente (70-90%) para predecir el pronóstico del cáncer de mama metastásico (Yu L et al., "TGF-beta receptor-activated p38 MAP kinase mediates Smad-independent TGFbeta responses.,"Embo J 2002;21(14):374959), así como cáncer de colon (Zhang H et al "Recursive partitioning for tumor classification with gene expression microarray data.," Proc Natl Acad Sci U S A 2001;98(12):6730-5.), para predecir la clasificción de los astrocitomas (Glotsos D et al "Automated diagnosis of brain tumours astrocytomas using probabilistic neural network clustering and support vector machines.," Int J Neural Syst 2005;15(1-2):1-11.) con una precisión > 90%, y carcinomas prostáticos con una precisión del 74-80% (Mattfeldt T et al., "Classification of prostatic carcinoma with artificial neural networks using comparative genomic hybridization and quantitative stereological data.," Pathol Res Pract 2003;199(12):773-84.). La eficacia de esta técnica se midió mediante validación cruzada de 10 veces (Pirooznia M et al., "A comparative study of different machine learning methods on microarray gene expression data.," BMC Genomics 2008; 9 Suppl 1: S13.).
Los modelos predictivos y algoritmos incluyen además Perceptron, un clasificador lineal que forma una red neuronal de avance y mapea una variable de entrada a un clasificador binario (Gallant SI. "Perceptron-based learning algorithms," algoritmos de aprendizaje con base en Perceptron 1990; 1 (2): 179-91). Se ha utilizado para predecir la malignidad del cáncer de mama (Markey MK et al. "Perceptron error surface analysis: a case study in breast cancer diagnosis.," Comput Biol Med 2002; 32 (2): 99-109). En este modelo, la tasa de aprendizaje es una constante que regula la velocidad de aprendizaje. Una menor tasa de aprendizaje mejora el modelo de clasificación, mientras que aumenta el tiempo para procesar la variable (Markey MK et al. "Perceptron error surface analysis: A case study in Breast cancer diagnosis", Comput Biol Med 2002; 32 (2): 99 -109). En un ejemplo, se usa una tasa de aprendizaje
de 0,05. En un aspecto, se usa un algoritmo de Perceptron para distinguir entre tumores localizados o primarios y tumores metastásicos correspondientes. En un aspecto, se utilizan tres escaneos de datos para generar límites de decisión que explícitamente separan datos en clases.
Los modelos predictivos y los algoritmos incluyen además el análisis discriminante regularizado (RDA), que puede usarse como una alternativa flexible a otras técnicas de minería de datos, incluidos el análisis discriminante lineal y cuadrático (LDA, QDA) (Lilien RH, Farid H, Donald BR. "Probabilistic disease classification of expression-dependent proteomic data from mass spectrometry of human serum", "J Comput Biol 2003; 10 (6): 925-46; Cappellen D, NH Luong-Nguyen, Bongiovanni S, et al. " Transcriptional program of mouse osteoclast differentiation governed by the macrophage colony-stimulating factor and the ligand for the receptor activator of NFkappa B.", J Biol Chem 2002; 277 (24): 21971-82). Los parámetros de regularización de RDA, γ y λ, se utilizan para diseñar un clasificador intermedio entre LDA y QDA. QDA se realiza cuando γ =0y λ = 0 mientras que LDA se realiza cuando γ =0y λ =1 (Picon A, Gold LI, Wang J, Cohen A, Friedman E. A subset of metastatic human colon cancers expresses elevated levels of transforming growth factor beta1. Cancer Epidemiol Biomarkers Prev 1998; 7 (6): 497-504).
Para reducir el ajuste excesivo, los parámetros de RDA se seleccionan para minimizar el error de validación cruzada mientras no sean iguales a 0,0001, forzando así a RDA a producir un clasificador entre LDA, QDA y L2 (Pima I, Aladjem M., "Regularized discriminant analysis for face recognition", "Pattern Recognition 2003; 37 (9): 1945-48). Finalmente, la regularización misma se ha utilizado ampliamente para superar el exceso de ajuste en el aprendizaje de máquina (Evgeniou T, Pontil M, Poggio T. "Regularization Networks and Support Vector Machines", Advances in Computational Math 2000;13(1):1-50.; Ji S, Ye J. Kernel "Uncorrelated and Regularized Discriminant Analysis: A Theoretical and Computational Study", IEEE Transactions on Knowledge and Data Engineering 2000;20(10):131121).
En un ejemplo, los parámetros de regularización se definen como γ = 0,002 y λ = 0. En un ejemplo, para cada par de clases, los valores S se asignan a todas los transcritos que luego se disponen mediante un valor S decreciente. El RDA se realiza, por ejemplo, 21 veces, de manera que la enésima iteración consiste de los mejores N puntajes de transcritos. La estimación de error se puede llevar a cabo mediante una validación cruzada de 10 veces del clasificador de RDA. Esto se puede hacer dividiendo el conjunto de datos de tejido en subconjuntos complementarios, realizando el análisis en un subconjunto (llamado conjunto de entrenamiento) y validando el análisis en el otro subconjunto (llamado conjunto de validación o conjunto de prueba).
Cálculo de error de clasificación errónea
En un ejemplo, el error de clasificación errónea se promedia para reducir la variabilidad en la evaluación predictiva global, que puede proporcionar un enfoque más preciso para la estimación de errores en comparación con otros enfoques, incluidos la trampa de refuerzo y la validación cruzada dejando uno fuera (Kohavi R. "A study of crossvalidation and bootstrap for accuracy estimation and model selection", Proceedings of the Fourteenth International Joint Conference on Artificial Intelligence, 1995;2(12):1137-43.).
En un ejemplo, la selección para la clasificación de tejido se realiza, por ejemplo, calculando la puntuación del intervalo (S) para cada gen y para cada par de clases como:
en donde µC1 y µC2 representan la media de la primera y segunda clase respectivamente y σC1 y σC2 son desviaciones estándar entre clases. Un gran valor S es indicativo de una expresión diferencial sustancial ("veces que cambia ") y una desviación estándar baja ("estabilidad del transcrito") dentro de cada clase. Los genes pueden clasificarse mediante un valor S decreciente y usarse como entradas para el algoritmo del análisis discriminante regularizado (RDA).
Los algoritmos y modelos se pueden evaluar, validar y validar de forma cruzada, por ejemplo, para validar las capacidades predictivas y de clasificación de los modelos, y para evaluar la especificidad y la sensibilidad. En un ejemplo, la función de base radial se usa como kernel, y se usa una validación cruzada de 10 veces para medir la sensibilidad de la clasificación (Cristianini N, Shawe-Taylor J. "An Introduction to Support Vector Machines and other kernel-based learning methods", Cambridge: Cambridge University Press, 2000.). Se pueden comparar varios modelos de clasificación y algoritmos mediante los métodos proporcionados, por ejemplo, mediante el entrenamiento y la validación cruzada, como se establece en este documento, para comparar el desempeño de los modelos predictivos para predecir resultados particulares.
Las realizaciones de los métodos, sistemas y modelos predictivos proporcionados son reproducibles, con un alto intervalo dinámico, pueden detectar pequeños cambios en los datos, y se realizan usando métodos simples, a bajo costo, por ejemplo, para su implementación en un laboratorio clínico.
F. Kits
Para uso en las aplicaciones de diagnóstico, pronóstico, predictivo y terapéutico descritas o sugeridas anteriormente, se proporcionan kits y otros artículos de fabricación. En algunas realizaciones, los kits incluyen un soporte, paquete
o empaque, compartimentado para recibir uno o más contenedores tales como viales, tubos, placas y pozos, en los que cada uno de los contenedores incluye uno de los elementos separados para su uso en los métodos aquí proporcionados, y en algunos aspectos incluye además una etiqueta o inserto con instrucciones de uso, como los usos descritos en este documento. En un ejemplo, los contenedores individuales incluyen agentes individuales para la detección de los biomarcadores de GEP-NEN como se proporciona en la presente memoria; en algunos ejemplos, los contenedores individuales incluyen agentes para la detección de genes de mantenimiento y/o normalización.
Por ejemplo, el o los contenedores pueden comprender un agente, tal como una sonda o cebador, que es o puede ser marcado en forma detectable. Cuando el método utiliza hibridación de ácido nucleico para la detección, el kit también puede tener contenedores que contienen nucleótido o nucleótidos para la amplificación de la secuencia de ácido nucleico objetivo. Los kits pueden comprender un contenedor que comprende un informador, tal como una proteína de unión a biotina, tal como avidina o estreptavidina, unida a una molécula indicadora, tal como una etiqueta enzimática, fluorescente o radioisotópica; dicho informador puede usarse con, por ejemplo, un ácido nucleico o anticuerpo.
Los kits típicamente comprenderán el contenedor o contenedores descritos anteriormente y uno o más de otros contenedores asociados con los mismos que comprenden materiales deseables desde un punto de vista comercial y de usuario, que incluyen reguladores, diluyentes, filtros, agujas, jeringas; soporte, empaque, contenedor, vial y/o tubo, etiquetas que enumeran los contenidos y/o las instrucciones de uso, y los prospectos con instrucciones de uso.
Una etiqueta puede estar presente en o con el contenedor para indicar que la composición se usa para una aplicación terapéutica o no terapéutica específica, tal como una aplicación de pronóstico, profiláctica, diagnóstica o de laboratorio, y también puede indicar instrucciones para cualquiera uso in vivo o in vitro, tal como los descritos en este documento. Las instrucciones u otra información también se pueden incluir en un inserto o insertos o etiqueta o etiquetas que se incluyen con o en el kit. La etiqueta puede estar en o asociada al contenedor. Una etiqueta puede estar en un contenedor cuando las letras, números u otros caracteres que forman la etiqueta están moldeados o grabados en el propio contenedor; una etiqueta puede asociarse con un contenedor cuando está presente dentro de un receptáculo o soporte que también contiene el contenedor, por ejemplo, tal como un prospecto. La etiqueta puede indicar que la composición se usa para diagnostico, tratamiento, profilaxis o pronostico de una condición, tal como GEP-NEN.
En otra realización, se proporciona un artículo o artículos de fabricación que contiene composiciones, tales como una secuencia o secuencias de aminoácidos, una molécula o moléculas pequeñas, una secuencia o secuencias de ácido nucleico y/o un anticuerpo o anticuerpos, por ejemplo, materiales útiles para el diagnóstico, pronóstico o terapia de GEP-NEN. El artículo de fabricación comprende típicamente al menos un contenedor y al menos una etiqueta. Los contenedores adecuados incluyen, por ejemplo, botellas, viales, jeringas y tubos de ensayo. Los contenedores se pueden formar a partir de una variedad de materiales tales como vidrio, metal o plástico. El contenedor puede contener una secuencia o secuencias de aminoácidos, una molécula o moléculas pequeñas, una secuencia o secuencias de ácidos nucleicos, una población o poblaciones de células y/o un anticuerpo o anticuerpos. En una realización, el contenedor contiene un polinucleótido para uso en el examen del perfil de expresión de ARNm de una célula, junto con los reactivos usados para este fin. En otra realización, un contenedor comprende un anticuerpo, fragmento de unión del mismo o proteína de unión específica para uso en la evaluación de la expresión proteica de biomarcadores de GEP-NEN en células y tejidos, o para fines relevantes de laboratorio, de pronóstico, de diagnóstico, profilácticos y terapéuticos; las indicaciones y/o instrucciones para tales usos se pueden incluir en o con dicho contenedor, al igual que los reactivos y otras composiciones o herramientas utilizadas para estos fines.
El artículo de fabricación puede comprender además un segundo contenedor que comprende un regulador farmacéuticamente aceptable, tal como solución salina regulada con fosfato, solución de Ringer y/o solución de dextrosa. Puede incluir además otros materiales deseables desde un punto de vista comercial y de usuario, que incluyen otros reguladores, diluyentes, filtros, agitadores, agujas, jeringas y/o prospectos con indicaciones y/o instrucciones de uso.
Ejemplos
Varios aspectos de la invención se describen e ilustran adicionalmente por medio de los diversos ejemplos que siguen, ninguno de los cuales pretende limitar el alcance de la invención.
Ejemplo 1: Detección y determinación de los niveles de expresión de biomarcadores en GEP-NEN y muestras normales
Preparación de muestras, extracción de ARN, PCR en tiempo real
Se obtuvieron muestras normales y neoplásicas para la detección y determinación de niveles de expresión de biomarcadores de GEP-NEN mediante PCR en tiempo real. Las muestras normales incluyeron veintisiete (27) muestras normales de mucosa del intestino delgado (SI) (NML) y trece (13) preparaciones de células enterocromafines (EC) humanas normales (NML_EC), obtenidas a través de clasificación de células activadas por fluorescencia (FACS) de mucosa normal; > 98% de células EC puras (Modlin IM et al., "The functional characterization of normal and neoplastic human enterochromaffin cells", J Clin Endocrinol Metab 2006;91(6):23408).
Las muestras neoplásicas incluyeron cincuenta y tres (53) GEP-NEN primarios de SI y veintiuna (21) correspondientes a metástasis de hígado recogidas de un biobanco de muestras congeladas (todos los tejidos microdiseccionados). Las muestras de GEP-NEN se obtuvieron de pacientes inscritos de acuerdo con los protocolos aprobados por la Junta de Revisión Institucional de la Universidad de Yale. Cada uno fue clasificado como funcional, con más del 80% de células neoplásicas puras y como positivo para TPH1, confirmando que era derivado de células EC (Modlin IM et al., "The functional characterization of normal and neoplastic human enterochromaffin cells", J Clin Endocrinol Metab 2006;91(6):2340-8). También se tomaron muestras de pacientes de adenocarcinomas de mama (n = 53), colon (n = 21) y páncreas (n = 16).
Los GEP-NEN primarios se clasificaron patológicamente de acuerdo con el estándar de la Organización Mundial de la Salud 2000 (OMS), así como los NET diferenciados ((WDNET) (n = 26) (comportamiento benigno o potencial maligno incierto)); carcinomas neuroendocrinos bien diferenciados ((WDNEC) (n = 20) (malignidad de bajo grado)); tumores neuroendocrinos poco diferenciados ((PDNET) (n = 5) (malignidad de grado medio)); y carcinomas neuroendocrinos mal diferenciados (células típicamente pequeñas) ((PDNEC) (n = 2) (malignidad de alto grado)). Las muestras de tejido de GEP-NEN metastásicas (metástasis, MET) (obtenidas de resecciones de hígado de los tipos de tumores correspondientes), se clasificaron utilizando un estándar similar, como WDNET MET (n = 6), WDNEC MET (n = 12) y PDNEC MET (n = 3). Los PDNET metastásicos (PDNET MET) se clasifican utilizando el mismo método.
Para PCR en tiempo real, se extrajo ARN de varias muestras normales y neoplásicas (27 muestras de mucosa de SI normal, 13 preparaciones de células EC humanas normales, 53 de GEP-NEN primarios de SI, 21 correspondientes a metástasis de hígado y 53 muestras de adenocarcinoma ) usando el reactivo TRIzol® (solución monofásica lista para usar de fenol y isotiocianato de guanidina; InvitrogenMR, Carlsbad, California).
Los niveles de expresión de transcritos se midieron mediante PCR en tiempo real usando productos de expresión génica Assays-on-DemandMR y el sistema de detección de secuencia ABI 7900 (ambos de Applied Biosystems) de acuerdo con las sugerencias del fabricante (Kidd M et al, "Microsatellite instability and gene mutations in transforming growth factor-beta type II receptor are absent in small bowel carcinoid tumors", Cancer 2005;103(2):229-36). El ciclo se realizó bajos condiciones estándar usando el protocolo de mezcla madre de PCR universal TaqMan® (Applied Biosystems).
Se detectaron biomarcadores de GEP-NEN y los niveles de expresión se midieron mediante PCR en tiempo real, usando conjuntos de pares de cebadores de polinucleótidos, donde cada conjunto contenía pares de cebadores diseñados para unirse específicamente y amplificar un panel de biomarcadores de GEP-NEN. El panel de biomarcadores de GEP-NEN incluyó productos (transcritos) de genes implicados en fenotipos de GEP-NEN primarios y metastásicos típicos, por ejemplo, genes implicados en la adhesión, migración, proliferación, apoptosis, metástasis y secreción de hormonas y genes marcadores neuroendocrinos. También se midieron los niveles de expresión del gen de mantenimiento (ALG9, TFCP2 y ZNF410). Los valores ∆CT sin procesar para la expresión de biomarcadores se normalizaron usando el algoritmo geNorm (Vandesompele J et al., "Accurate normalization of realtime quantitative RT-PCR data by geometric averaging of multiple internal control genes", Genome Biol 2002; 3 (7): RESEARCH0034) y los niveles de expresión del gen de mantenimiento.
Los datos normalizados fueron transformados mediante el logaritmo natural (ln) para compresión y se importaron en Genomic Suite Partek® (Partek, "Partek® Genomics SuiteMR", ed. Revisión 6.3 St. Louis: Partek Inc., 2008). Se calcularon los niveles medios de expresión génica (M) de los diversos transcritos de biomarcadores y desviaciones estándar (SD). Todos los cálculos estadísticos se llevaron a cabo utilizando el lenguaje R 2.9 para cálculo estadístico (R Development Core Team. R, "A language and environment for statistical computing", Viena, Austria: R Foundation for Statistical Computing, 2008).
Detección y determinación de los niveles de expresión de transcripción de un panel de 9 biomarcadores
Los niveles de expresión se determinaron mediante PCR en tiempo real como se describió anteriormente usando un conjunto de pares de cebadores específicos para un panel de nueve transcritos de biomarcadores de GEP-NEN (MAGE-D2, MTA1, NAP1L1, Ki-67, Survivina, FZD7, Kiss1, NRP2 y CgA (véase Kidd M et al., "The role of genetic
markers-NAP1L1, MAGE-D2, and MTA1--in defining small-intestinal carcinoid neoplasia," Ann Surg Oncol 2006;13(2):253-62; Kidd M et al., "Q RT-PCR detection of chromogranin A: a new standard in the identification of neuroendocrine tumor disease," Ann Surg 2006;243(2): 273-80). Las secuencias de los pares de cebadores se enumeran en la Tabla 1A, a continuación, con otra información acerca de los pares de cebadores enumerados en la 5 Tabla 1 B. La expresión de los nueve biomarcadores (transcritos) se midió en muestras de GEP-NEN primario de SI (NET AKA de SI) (n = 53), correspondiente a metástasis de hígado (n = 21) y preparaciones normales de células EC (n = 13). Los niveles de expresión en las muestras tumorales se compararon para cada biomarcador con los niveles promedio de expresión correspondientes en las preparaciones de células enterocromafines (EC) normales. Con base en esta comparación, se clasificaron los niveles de expresión en las muestras tumorales como sobrerregulado,
10 subregulado o de línea base.
Tabla 1: Conjunto de cebadores para biomarcadores de GEP-NEN y genes de mantenimiento Tabla 1A: secuencias de cebadores
Biomarcador de GEP-NEN o gen de mantenimiento
Secuencia del cebador directo SEQ ID NO: Secuencia del cebador inverso SEQ ID NO:
AKAP8L
106 107
APLP2
41 42
ARAF1
43 44
ATP6V1H
108 109
BNIP3L
110 111
BRAF1
45 46
C21ORF7
112 113
CD59
47 48
CgA
49 50
Biomarcador de GEP-NEN o gen de mantenimiento
Secuencia del cebador directo SEQ ID NO: Secuencia del cebador inverso SEQ ID NO:
COMMD 9
114 115
CTGF
51 52
CXCL14
53 54
ENPP4
116 117
FAM131 A
118 119
FLJ10357
120 121
FZD7
55 56
GLT8D1
122 123
GRIA2
57 58
HDAC9
124 125
HOXC6
59 60
HSF2
126 127
Biomarcador de GEP-NEN o gen de mantenimiento
Secuencia del cebador directo SEQ ID NO: Secuencia del cebador inverso SEQ ID NO:
Ki-67
61 62
Kiss 1
63 64
KRAS
65 66
LEO1
128 129
MAGE-D2
67 68
MORF4L 2
130 131
MTA1
69 70
NAP1L1
71 72
NKX2-3
73 74
NOL3
132 133
NRP2
75 76
NUDT3
134 135
OAZ2
136 137
Biomarcador de GEP-NEN o gen de mantenimiento
Secuencia del cebador directo SEQ ID NO: Secuencia del cebador inverso SEQ ID NO:
OR51E1
77 78
PANK2
138 139
PHF21A
140 141
PKD1
142 143
PLD3
144 145
PNMA2
79 80
PQB1
146 147
PTPRN2
81 82
RAF1
83 84
RNF41
148 149
RSF1
150 151
RTN2
152 153
Biomarcador de GEP-NEN o gen de mantenimiento
Secuencia del cebador directo SEQ ID NO: Secuencia del cebador inverso SEQ ID NO:
SMARCD 3
154 155
SPATA7
156 157
SCG5
85 86
SPOCK1
87 88
SST1
158 159
SST3
160 161
SST4
162 163
SST5
164 165
Survivina
89 90
TECPR2
166 167
Tph1
91 92
TRMT112
168 169
Biomarcador de GEP-NEN o gen de mantenimiento
Secuencia del cebador directo SEQ ID NO: Secuencia del cebador inverso SEQ ID NO:
VMAT1
93 94
VMAT2
95 96
VPS13C
170 171
WDFY3
172 173
X2BTB48
97 98
ZFHX3
174 175
ZXDC
176 177
ZZZ3
178 179
ALG9
99 100
TFCP2
101 102
ZNF410
103 104
18S
30 31
Biomarcador de GEP-NEN o gen de mantenimiento
Secuencia del cebador directo SEQ ID NO: Secuencia del cebador inverso SEQ ID NO:
GAPDH
32 33
ACTB
180 181
ARF1
182 183
ATG4B
184 185
HUWE1
186 187
MORF4L 1
188 189
RHOA
190 191
SERP1
192 193
SKP1
194 195
TOX4
196 197
TPT1
198 199
Tabla 1B: Otra información
Los resultados se presentan en la FIG. 1, con cada uno de los nueve paneles de las figuras que muestran los niveles de expresión promedio para un biomarcador individual en muestras de EC normal (izquierda), maligna/metastásica (centro) y localizada (derecha). Los elipsoides corresponden a un umbral de ± 2 desviaciones estándar (SD). Todos los valores p: p <0,05. Los resultados demuestran niveles de expresión significativamente más altos de MAGE-D2, MTA1, NAP1L1, Ki-67. FZD7, CgA y NRP2, y niveles reducidos de Survivina y Kiss1 en GEP-NEN de SI (NET AKA de SI), confirmando la expresión diferencial de estos biomarcadores de GEP-NEN en muestras de GEP-NEN comparado con células normales, y entre diferentes grados de tumores de GEP-NEN.
Detección y determinación del nivel de expresión para transcritos del panel de 21 biomarcadores
Se llevó a cabo una PCR cuantitativa en tiempo real (QPCR) como se describió anteriormente, usando un conjunto de pares de cebadores para medir los niveles de expresión de los transcritos de un panel de biomarcadores de GEP-NEN de 21 genes (incluyendo MAGE-D2, MTA1, NAP1L1, Ki67, Survivina, FZD7, Kiss1, NRP2, X2BTB48, CXCL14, GRIA2, NKX2-3, OR51E1, PNMA2, SPOCK1, HOXC6, CTGF, PTPRN2, SCG5 y Tph1). Las secuencias e información del cebador se enumeran en las Tablas 1A y 1B, más arriba. La expresión de los 21 biomarcadores se midió en 167 muestras de tejido humano, incluidas muestras de células EC normales (n = 13), mucosa de SI normal (n = 27) y del subtipo de GEP-NEN primario (n = 53) y metastásico (n = 21 de MET de hígado) y 53 de adenocarcinoma (colon, mama y páncreas). Este estudio demostró que cada uno de los 21 biomarcadores se expresa significativamente diferencialmente en muestras de tumores de GEP-NEN.
Para cada uno de los 21 biomarcadores, se calculó la proporción de muestras de GEP-NEN frente a muestras de adenocarcinoma en las que se detectaron niveles de transcrito y se comparó usando una prueba de Fisher de 2 colas (GraphPad Prizm 4; Fig. 8B: *p <0,002 GEP-NEN de SI frente a adenocarcinomas (prueba exacta de Fisher)). Como se muestra en la FIG. 8B, una proporción significativamente mayor (> 95%) de las muestras de GEP-NEN en este estudio expresaron (es decir, fueron positivas para) 16 de los 21 genes de los biomarcadores de GEP-NEN (76%), comparado con los adenocarcinomas (p <0,002). Los genes altamente expresados en ambos tipos de tumores incluyeron CTGF, FZD7, NRP2, PNMA2 y survivina.
A diferencia de los diferentes subtipos de GEP-NEN, las diversas muestras de células de EC normales exhibieron una expresión homogénea de transcritos, con baja variación de transcritos (57%) entre las muestras. Diferentes subtipos de GEP-NEN neoplásicos de SI (también conocido como NET de SI) mostraron heterogeneidad en el nivel de transcritos, lo que indica que diferentes subtipos de GEP-NEN podrían diferenciarse mediante la detección y determinación de niveles de expresión de transcritos en el panel de 21 biomarcadores.
Ejemplo 2: Análisis de componentes principales (PCA)
Después de la transformación de logaritmo natural (ln), y la importación en Partek® Genomic Suite, se realizó el análisis de componentes principales (PCA) para describir la estructura de los datos de expresión de alta dimensión. PCA permitió la visualización y comparación de los patrones de expresión de transcritos entre varias muestras (por ejemplo, GEP-NEN normal, neoplásico, frente a otro tumor, subtipos de GEP-NEN, primarios frente a metastásicos/malignos). PCA redujo la dimensionalidad de los datos de expresión obtenidos con cada uno de los nueve biomarcadores y veintiún paneles de biomarcadores a tres componentes principales no correlacionados (PC), que explicaron la mayoría de las variaciones (Jolliffe IT, "Principle Component Analysis", Springer, 1986. ) El mapeo de PCA se visualizó en un espacio de 3 dimensiones, con el primer (1er), segundo (2do) y tercer (3er) PC asignados a los ejes x, y, y z, respectivamente.
Para los nueve y los veintiún paneles de genes, los datos de expresión promedio para varias muestras se superpusieron en este sistema de coordenadas de PCA. El centroide (centro de masa (expresión promedio)) de cada muestra representaba su perfil de expresión del transcrito individual (firma reguladora) dado por el vector componente principal. En esta representación, la distancia entre centroides es inversamente equivalente a la medida de similitud (mayor distancia = menor similitud). Por lo tanto, las grandes distancias o la separación entre centroides indicaron muestras con firmas de expresiones de transcrito distintas; la proximidad de los centroides indica similitud entre las muestras. Por ejemplo, la distancia entre centroides para diferentes muestras de tipo de tumor representa la similitud relativa de sus firmas reguladoras (niveles de expresión del transcrito).
Panel de 9 biomarcadores
PCA se llevó a cabo, como se describió anteriormente, para los datos de expresión de PCR en tiempo real para el panel de biomarcadores de nueve genes (MAGE-D2, MTA1, NAP1L1, Ki-67, Survivina, FZD7, Kiss1, NRP2 y CgA) Tres PC (PC # 1, PC # 2, PC # 3) reflejaron la mayor parte de la varianza de la expresión entre GEP-NEN primarios de SI, preparaciones de células EC normales y metástasis respectivas. Los datos reducidos se mapearon en un espacio tridimensional (FIG. 2). Como se muestra en la FIG. 2, para los GEP-NEN primarios de SI y las preparaciones de células EC normales, PC # 1, PC # 2 y PC # 3 representaron 31,7%, 26,5% y 17,4% de la varianza, respectivamente; en general, las tres PC representaron el 75.6% de la varianza.
Las tres PC representaron el 75,6% de la varianza para los subtipos de tumores primarios y las preparaciones de células EC normales (FIG. 2A), y el 73,2% de la varianza para los subtipos de tumores de GEP-NEN primarios y las metástasis correspondientes (FIG. 2C). Para metástasis, PC # 1, PC # 2 y PC # 3 representaron 40,4%, 19,9% y 12,.9% de la varianza, respectivamente; en general, el 73,2% de la varianza en los datos estuvo representada por las 3 PC (FIG. 2C).
La correlación inversa entre los niveles de expresión de biomarcadores y el coseno del ángulo entre los vectores de expresión individuales (mayor ángulo = menor similitud) se utilizó para identificar grupos de expresión génica relacionados. Los grupos se muestran en la FIG. 2B para GEP-NEN primarios de SI ((1) CgA, NRP2, NAP1L1, FZD7; (2) MAGE-D2, MTA1, Kiss1 y (3) Ki-67, Survivina)) y en la FIG. 2D para las metástasis correspondientes ((1) NAP1L1, FZD7, CgA, Survivina, Ki-67, Kiss1; (2) MTA1, MAGE-D2, NRP2) (Gabriel KR, "The biplot graphic display of matrices with application to principal component analysis", Biometrika 1971; 58(3): 453).
PCA del panel de 21 biomarcadores
PCA también se llevó a cabo como se describió anteriormente para el panel de 21 biomarcadores (MAGE-D2, MTA1, NAP1L1, Ki67, Survivina, FZD7, Kiss1, NRP2, X2BTB48, CXCL14, GRIA2, NKX2-3, OR51E1, PNMA2, SPOCK1, HOXC6, CTGF, PTPRN2, SCG5 y Tph1). Tres componentes principales capturaron la mayor parte de la varianza (83%) dentro del conjunto de datos. Los datos reducidos se mapearon en un espacio tridimensional.
La FIG. 8A muestra una comparación de perfiles de expresión para GEP-NEN (incluidos varios subtipos primarios y metastásicos), adenocarcinomas (subtipos) y tejidos normales (EC y SI). Como se muestra, los centroides para los tres tipos de adenocarcinoma se separaron de aquellos para los subtipos de mucosa normal de SI y de tejido de GEP-NEN neoplásico. Esta observación confirma una diferencia significativa en los niveles de expresión en este otro tipo de tumor (epitelial), que se muestra usando la prueba exacta de Fisher, descrita anteriormente (FIG. 8B). Los diversos subtipos neoplásicos (GEP-NEN de SI) mostraron perfiles de expresión heterogéneos, mostrando que podían distinguirse usando este panel de biomarcadores.
Todas las preparaciones de EC normales mostraron expresión homogénea de transcrito (con baja variación (57%) dentro de las muestras). Además, los perfiles de expresión de muestras normales fueron sustancialmente diferentes en comparación con los de otros tipos de tejidos, incluida la mucosa normal de SI. El perfil genético para células EC normales fue sustancialmente diferente en comparación con la mucosa normal de SI y el tejido neoplásico.
Los resultados demuestran diferencias en los perfiles de expresión para los biomarcadores de GEP-NEN y firmas distintivas de expresión reguladora para subtipos de tumores de GEP-NEN primarios de SI, preparaciones de células EC normales y metástasis de GEP-NEN de SI. Este estudio confirma que la medición de la expresión de los 21 biomarcadores puede distinguir con éxito entre subtipos de GEP-NEN, tipos de adenocarcinoma, mucosa normal SI, células EC normales y entre subtipos de GEP-NEN primarios y metastásicos.
Ejemplo 3: Perfil y análisis de tumores.
Se realizaron análisis estadísticos y perfiles tumorales en datos de expresión transformados obtenidos con los paneles de nueve y veintiún biomarcador descritos anteriormente.
Panel de 9 biomarcadores
Se calcularon los niveles medios de expresión del transcrito (M) y las desviaciones estándar (SD) para el panel de nueve biomarcadores, para los subtipos de tumores primarios y las preparaciones de células EC normales. La expresión normal media de CgA (MNormal = -9,2, SD = 4,2), Ki-67 (MNormal = -4,5, SDNormal = 1,1), Kiss1 (MNormal = -4,0, SDNormal = 3,2), NAP1L1 (MNormal = -8,3, SDNormal = 1.1), NRP2 (MNormal = -9,3, SD = 3,8) y Survivina (MNormal = -6,0, SDNormal = 1,0) fue significativamente diferente en comparación con la expresión media en tumores primarios, tanto generales (todos los tumores) como entre subtipos individuales. Véanse los valores p y las veces que cambia (FC), que se enumeran en la Tabla 2, a continuación. Las mediciones del nivel de expresión del transcrito se reevaluaron en un subconjunto de muestras (n = 35). Los datos estaban altamente correlacionados (R2 = 0,93, p = 0,001), demostrando que este enfoque era altamente reproducible y robusto.
Se llevó a cabo el análisis de varianza (ANOVA) para evaluar las diferencias en los niveles de expresión de biomarcadores entre muestras tumorales y normales, y entre muestras normales y muestras de subtipos de tumores individuales. Específicamente, ANOVA comparó la expresión entre las preparaciones de células de EC normales y los tejidos de tumores primarios, y entre las preparaciones de células EC normales y los tipos de tumores primarios individuales (Tabla 2). Se implementó un algoritmo no apareado de dos clases, con datos de muestra de tumor (subtipo total o individual) y datos de expresión de muestra normales que definen los dos grupos. Como no había valores faltantes en los conjuntos de datos, la imputación era innecesaria. Para cada transcrito de biomarcador, se calculó el número de veces que se produce un cambio geométrico (FC) como la relación de medias geométricas
para el grupo de tumores y el grupo normal.
Los genes de los biomarcadores calculados para tener diferencias en la expresión entre grupos normales y tumorales, con p <0,05, se consideraron significativamente modificados. Los transcritos con p <0,05 y FC absoluto ≥ 2,0 se consideraron expresadas diferencialmente entre los grupos. CgA, FZD7, Ki-67, NAP1L1, NRP2 y Survivina se alteraron significativamente en WDNET en comparación con las preparaciones de células EC normales. Los niveles del transcrito de CgA, Ki-67, MAGE-D2 y NRP2 se modificaron significativamente en WDNEC. Los PDNET mostrados alternativamente expresaron niveles de CgA, Ki-67, NAP1L1, NRP2 y Survivina. Finalmente, los PDNEC fueron diferentes solo en expresiones de NAP1L1 y NRP2.
Tabla 2:
ANOVA que compara los niveles de expresión de biomarcadores en GEP-NEN de SI, y sub-tipos individuales de GEP-NEN de SI, con los niveles de expresión en muestras de células EC normales
Todos los tumores vs. Normal
WDNET vs. Normal WDNEC vs. Normal PDNET vs. Normal PDNEC vs. Normal
Gen
p FC p FC p FC p FC p FC
CgA
1,3x10 -4 17,7 1,05x10 -4 28,3 0,03 8,3 0,01 13,5 NS 20,5
FZD7
0,05 3,6 0,02 5,9 NS -1,1 NS 5,5 NS 6,9
Ki-67
1,1x10 -3 -3,5 0,01 -3,0 0,02 -3,5 2,7x10 -3 -5,5 NS -3,7
Kiss1
0,02 -3,9 0,05 -3,7 NS -4,5 NS -4,4 NS -1,8
MAGE-D2
NS 1,2 NS -1,6 6,4x10 4 5,3 NS 1,6 NS -1,8
MTA1
NS -1,2 NS -1,5 NS 1,1 NS 1,1 NS -1,6
NAP1L1
4,7x10 -5 13,7 4,1x10 -6 24,8 NS 2,9 7,4x10 -4 17,3 0,01 26,9
NRP2
2,2x10 -8 39,5 1,6x10 -6 31,5 2,3x10 5 33,7 1,9x10 -6 82,08 5,0x10 3 47,1
Survivina
0,01 -3,5 0,04 -3,1 NS -3,1 0,02 -5,1 NS -5,07
WDNET = Tumores neuroendocrinos bien diferenciados, WDNEC = Carcinomas neuroendocrinos bien diferenciados, PDNET = Tumores neuroendocrinos mal diferenciados, PDNEC = Carcinomas neuroendocrinos mal diferenciados; NS = p≥0,05, FC = Veces que cambia
Se calcularon los coeficientes de correlación de Pearson (PC) (R2) para el panel de nueve biomarcadores para
evaluar las relaciones lineales entre pares de biomarcadores y entre la diferenciación del subtipo de tumor y la
expresión de los biomarcadores. La distribución de la expresión de biomarcadores entre los subtipos de GEP-NEN
primarios y las muestras EC normales se separó linealmente calculando coeficientes de PC para pares individuales 15 de los biomarcadores (representados en los ejes x, y y de las matrices de similitud individuales mostradas en la FIG.
3). El estudio determinó la correlación de expresión altamente lineal (R2 > 0,50) para cuatro pares de biomarcadores
(MTA1: MAGE-D2, MTA1: Kiss1, FZD7: NAP1L1 y Survivina: Ki-67 (altamente correlacionado (R2 > 0,50)).
Adicionalmente, la distribución de los perfiles de expresión para WDNET, WDNEC y PDNET se correlacionó con las
expresiones por pares de Kiss1: Survivina, FZD7: NAP1L1, Survivina: MTA1 y MTA1: MAGE-D2, lo que indica que
20 un clasificador lineal podría aplicarse al conjunto de datos. Los datos sugieren además una correlación dependiente de la expresión entre los biomarcadores y los subtipos de tumores primarios.
Panel de 21 biomarcadores
Los coeficientes de correlación de Pearson (PC) se usaron para identificar relaciones lineales entre niveles de
expresión de biomarcadores en el panel de 21 genes. Se calcularon coeficientes de PC para cada par de los 21 25 biomarcadores, en todos los tipos de tejidos (FIG. 9A). La FIG. 9 muestra los resultados en un mapa de calor, con
los pares con las correlaciones más bajas (-0,03), medias (0,4) y más altas (1) indicadas en negro, gris oscuro y gris claro, respectivamente. El panel de 21 biomarcadores contenía 27 pares de transcritos altamente correlacionados (R2 > 0,40), con el mayor coeficiente de correlación (R2 = 1,00) entre MTA1, NRP2 y Kiss1.
A partir de estos datos, se construyó una red de correlaciones dibujando un borde entre cualquier par de transcritos que tienen un R2 por encima de un umbral predefinido (R2 > 0,40) (FIG. 9B, con valores R2 reales superpuestos en cada borde). Como se muestra en la FIG. 9B, se identificaron cinco grupos reguladores distintos dentro de la red, cada uno con un conjunto único de biomarcadores: (1) MAGE-D2, NRP2, Kiss1, MTA1 y CgA (el grupo más firmemente conectado (cada valor de R2 > 0,79)) ; (2) GRIA2, OR51E1, SPOCK1 y SCG5; (3), CXCL14, NKX2-3, HOXC6, CTGF, PTPRN2; (4) NAP1L1, FZD7 y PNMA2; y (5) Survivina y Tph1. En la FIG. 9B, los valores R2 se superponen en los bordes individuales. El valor R2 más bajo es 0,40 dentro de cada grupo; el valor más alto es 1,0. Los resultados demuestran que los niveles de expresión del panel de biomarcadores son biológicamente relevantes para GEP-NEN.
Se usó un cálculo de prueba t de dos muestras para identificar genes de biomarcadores que se expresan diferencialmente entre: 1) células EC, mucosa normal de SI y tejidos primarios y metastásicos; 2) subtipos de GEP-NEN primarios; y 3) subtipos de GEP-NEN metastásicos (FIG. 10).
Los valores S calculados para cada subconjunto variaron de -1,4 a 1,1. Según el número de genes (n = 21) y el tamaño de la muestra (n = 114), el umbral de significancia estadística para el valor S se estableció en ± 0,4 (Nadler B, "Discussion of "On consistency and sparsity for principal component analysis in high dimensions", Journal of the American Statistical Association 2009; 104: 694-97). Los transcritos con S< -0,4 o S> 0,4, y p <0,05, se consideraron reguladas significativamente subregulados y sobrerregulados, respectivamente. Los resultados se presentan en la FIG. 10, con gráficos de volcán de intervalos de genes y valores de significancia (p) para la prueba t.
La FIG. 10A muestra la comparación entre mucosa normal de SI, células EC normales y GEP-NEN de SI. En comparación con la mucosa normal, la expresión del transcripto del marcador neuroendocrino clásico Tph1 fue significativamente mayor (p <0,001, S = 0,7; FIG. 10A) en las muestras de GEP-NEN de SI. Comparado con la mucosa normal de SI, el tejido neoplásico expresó niveles más altos de transcritos de CgA y GRIA2 (FIG. 10B); la expresión de CgA no se alteró significativamente (p = 0,07, S = 0,39) entre tejido neoplásico y células EC normales.
La FIG. 10B muestra la comparación entre todas las muestras de GEP-NEN (tumor) y todas las muestras normales, todas las muestras de GEP-NEN metastásicas y todas las muestras normales, y todas las muestras de GEP-NEN metastásicas y todas las muestras de GEP-NEN primarias. Ninguno de los transcritos de biomarcadores se expresó diferencialmente en las muestras colectivas de GEP-NEN metastásicas, cuando se analizaron como un grupo completo, en comparación con las muestras colectivas de GEP-NEN primarias, analizadas como un grupo.
La FIG. 10C muestra la comparación entre subtipos de GEP-NEN primario y todas las metástasis como grupo. No se expresaron diferencialmente transcritos de biomarcadores en muestras de PDNET en comparación con muestras de PDNEC (PDNET-PDNEC), o muestras de WDNET en comparación con muestras de PDNEC (WDNET-PDNEC). Entre WDNEC y PDNEC (WDNEC-PDNEC), MAGE-D2 fue el único marcador diferenciador significativo (p = 0,009, S = 1,03, FIG. 10C).
La FIG. 10D muestra una comparación entre tumores primarios y subtipos metastásicos. CgA, Kiss1, NRP2 y Tph1 se expresaron diferencialmente entre todos los subtipos de metástasis (FIG. 10D).
Ejemplo 4: Modelos predictivos para clasificar GEP-NEN
Los niveles de expresión de biomarcadores de GEP-NEN obtenidos en los estudios en los Ejemplos 1-4 se analizaron adicionalmente con algoritmos y modelos de aprendizaje supervisado, incluyendo máquinas de vector de apoyo (SVM), árbol de decisión, Perceptron y análisis discriminante regularizado RDA (Gallant SI, "Perceptronbased Learning algorithms", algoritmos de aprendizaje basados en Perceptron 1990; 1 (2): 179-91)).
Ejemplo 4A: Predicción y modelado con expresión detectada del panel de nueve biomarcadores
Los datos de expresión obtenidos en el estudio de nueve biomarcadores se analizaron usando el modelo de clasificación selección de características (FS). El modelo se empleó utilizando un enfoque de selección "codicioso directo", seleccionando el subconjunto más relevante de características para los modelos de aprendizaje robustos, como lo describen Peng H, Long F, Ding C, "Feature selection based on mutual information: criteria of maxdependency, max-relevance, and min-redundancy," IEEE Transactions on Pattern Analysis and Machine Intelligence, 2005;27(8): 1226-38.
FS determinó que para este estudio, los niveles de expresión de NAP1L1, FZD7, Kiss1 y MAGE-D2 fueron las mejores variables (de los nueve biomarcadores) para la clasificación de SVM. Por lo tanto, SVM se llevó a cabo
mediante la comparación de los niveles de expresión de estos biomarcadores en las preparaciones de células EC normales (n = 13) y GEP-NEN primarios de SI (n = 36). Para SVM, se utilizó la función de base radial como núcleo y se utilizó una validación cruzada de 10 veces para medir la sensibilidad de la clasificación. Véase Cristofanilli M et al. "Circulating tumor cells, disease progression, and survival in metastatic breast cancer", N Engl J Med 2004. Los resultados se muestran en la Tabla 3 a continuación, y en la FIG. 4. Como se muestra, SMV predijo GEP-NEN de SI en este estudio con 100% de sensibilidad y 92% de especificidad de clase; las preparaciones de células EC normales se predijeron con precisión con un 77% de sensibilidad, con una especificidad de clase del 100%.
Tabla 3: Predicciones de clase producidas por el modelo de clasificación máquinas de vectores de soporte usando niveles de expresión de transcritos de NAP1L1, FZD7, Kiss1 y MAGE-D2
Normal verdadero
Tumor verdadero Precisión de clase
Normal predicho
10 0 100%
Tumor predicho
3 36 92%
Recordatorio de clase
77% 100%
Los mapas de densidad en la FIG. 4 muestran distribuciones entre GEP-NEN de SI y células EC normales, coloreadas con la densidad de las muestras produjeron zonas diferenciales que dependen de las expresiones génicas individuales. Los niveles de expresión de los transcritos NRP2, MAGE-D2, Kiss1 y FZD7 como los identificados por el algoritmo de selección de características se graficaron en los ejes X y Y. Los datos de las muestras normales y neoplásicas se dispersaron de acuerdo con sus respectivas expresiones de pares de genes. Las densidades de distribución basadas en la distancia euclidiana promedio (diferencia en la expresión) entre las muestras se colorearon en verde (normales) y rojo (neoplásicas). Las áreas azules indican una región de transición entre grupos normales y neoplásicos. La clara separación entre células EC normales y tumores primarios de intestino delgado indica la utilidad de los transcritos seleccionadas como marcadores de malignidad.
La selección de características identificó los niveles de expresión de NAP1L1 y Ki-67 como discriminadores principales en el clasificador del árbol de decisiones. Con base en este resultado, se construyó el modelo de clasificación de arboles de decisión sobre datos de expresión para subtipos de GEP-NEN primarios individuales de SI al correlacionar los valores del nivel de expresión de NAP1L1 y Ki-67 con los correspondientes niveles de expresión para subtipos de tumores primarios, como se determinó anteriormente. Los resultados se muestran en la FIG. 5, con las hojas del árbol representando clasificaciones y ramas que representan conjunciones de características que se convierten en las clasificaciones individuales. Se usó una validación cruzada de 10 veces para medir la eficacia de esta técnica, según lo descrito por Pirooznia M, et al., "A comparative study of different machine learning methods on microarray gene expression data," BMC Genomics 2008; 9 Suppl 1: S13. Los porcentajes que se muestran entre paréntesis en la FIG. 5 indican las frecuencias de ocurrencia de los subtipos de GEP-NEN primarios de SI. Como se muestra en la Tabla 4 a continuación, la clasificación de árboles de decisión predijo WDNET en este estudio con un 78% de sensibilidad y un 82% de especificidad; predijo WDNEC en este estudio con 78% de sensibilidad y 64% de especificidad; y predijo los PDNET en este estudio con un 71% de sensibilidad y un 63% de especificidad. Con el panel de nueve biomarcadores, los PDNEC se clasificaron erróneamente en este estudio como WDNET o PDNET. (FIG. 5, Tabla 4).
Tabla 4: Predicciones de clase producidas por el modelo de clasificación de árboles de decisión utilizando expresión de transcritos de Ki-67 y NAP1L1.
WDNET verdadero
WDNEC verdadero PDNET verdadero PDNEC verdadero Precisión de clase
WDNET predicho
14 1 1 1 82%
WDNEC predicho
3 7 1 0 64%
PDNET predicho
1 1 5 1 63%
PDNEC predicho
0 0 0 0 0%
Recordatorio de clase
78% 78% 78% 0%
Se realizó ANOVA para identificar transcritos expresados diferencialmente en subtipos de GEP-NEN primarios de SI y metástasis correspondientes (Tabla 5). La ganancia significativa de Kiss1 (p <0,005) se asoció con metástasis en todos los subtipos de tumores.
Tabla 5: Resultados de ANOVA a través de subtipos de tumores neuroendocrinos de intestino delgado y las correspondientes metástasis.
WDNET vs. WDNET MET
WDNEC vs. WDNEC MET PDNEC vs. PDNEC MET
Gen
p FC p FC p FC
Kiss1
5,7x10 -7 52,8 1,2x10 -7 81,2 0,004 41,6
MAGE-D2
5,2x10 -3 5,6 NS -1,04 0,03 10,4
CgA
0,02 9,08 0,01 12,4 0,08 21,1
Ki-67
NS 2,7 0,02 3,7 NS 1,5
MTA1
0,02 2,8 NS 1,1 NS 4,4
Survivina
NS 4,02 0,05 4,4 NS 6,1
FZD7
NS 1,7 1,8x10 -3 27,2 NS 1,2
NAP1L1
NS 1,1 0,01 12,05 NS -1,9
NRP2
NS 1,2 NS -1,6 NS -1,4
MET = Metástasis; FC = Veces que cambia; "p" = valor p; NS = p ≥ 0,05
Los niveles de expresión detectados de MAGE-D2, NAP1L1 y Kiss1 (como los identificados por FS) se analizaron en WDNET primarios y metastásicos correspondientes, usando SVM para construir un clasificador. Para evaluar la expresión de biomarcadores en comparación con el potencial metastásico de tumores primarios, las muestras se representaron en correlación con los niveles de expresión génica seleccionados y las densidades de distribución se colorearon para delinear la separación de muestras primarias y metastásicas (FIG. 6A).
Los resultados de WDNET y WDNET metastásicos dispersos según sus respectivas expresiones de pares de genes, con densidades de distribución basadas en la distancia euclidiana promedio (diferencia en expresión) entre muestras coloreadas de azul (tumores primarios) y rojas (metástasis), indicando las áreas verdes una región de transición entre tumores primarios y metastásicos. Como se muestra, WDNET y WDNET MET se predijeron con un 100% de sensibilidad y especificidad. Se podría predecir que WDNET haría metástasis si los niveles de transcrito de 1) NAP1L1> -2,71 y Kiss1> -2,50; 2) NAP1L1> -3,82 y MAGE-D2> -4,42; 3) MAGE-D2> -3,21 y Kiss1> -2,12.
Se usó un clasificador Perceptron (Markey MK et al., "Perceptron error surface analysis: a case study in breast cancer diagnosis", Comput Biol Med 2002; 32(2): 99-109) de 0,05 para distinguir entre tumores localizados y las metástasis correspondientes. Se ha demostrado que esta metodología predice con eficacia la malignidad del cáncer de mama (Markey MK et al., "Perceptron error surface analysis: a case study in breast cancer diagnosis," Comput Biol Med 2002; 32(2): 99-109). Se usó un clasificador Perceptron (utilizando tres escaneos de datos para generar los límites de decisión que explícitamente separan los datos en clases, con una tasa de aprendizaje de 0,05) para predecir metástasis de WDNEC y PDNEC.
El algoritmo FS predijo que NAP1L1 y Kiss1 se expresaron altamente específicamente en WDNEC MET y que CgA se expresó altamente específicamente en PDNEC MET. El potencial metastásico de los tumores primarios se visualizó graficando las expresiones de los genes presentados y coloreando las densidades de distribución de los tumores primarios y sus metástasis. Los datos se presentan en la FIG. 6B y FIG. 6C, que muestran datos de subtipos de tumores primarios y metástasis respectivas dispersas de acuerdo con sus respectivas expresiones de pares de genes, con densidades de distribución basadas en la distancia euclidiana promedio (diferencia en expresión) entre muestras coloreadas de azul (tumores primarios) y rojo (metástasis) y áreas verde que indican regiones de transición entre subtipos de tumores primarios y metástasis respectivas. Se pronosticó que los WDNEC hacen metástasis con valores de NAP1L1> -5,28 y Kiss1> -2,83, mientras que se podía predecir que los PDNEC hacen metástasis cuando CgA> -3,5. Estos resultados muestran una separación clara de subtipos de GEP-NEN primarios de SI y las metástasis respectivas, demostrando la utilidad de los biomarcadores proporcionados como
marcadores de metástasis.
Ejemplo 4B: Evaluación de la clasificación y las capacidades predictivas del panel de nueve biomarcadores
Para evaluar la clasificación y las capacidades predictivas utilizando el panel de nueve biomarcadores, se realizó una PCR en tiempo real en muestras obtenidas de un conjunto independiente de tejidos de GEP-NEN de SI (n = 37), incluyendo preparaciones de células EC normales (n = 17 ), GEP-NEN localizados de SI (n = 8) y GEP-NEN malignos de SI (n = 12), para medir la expresión del transcrito del gen marcador. Todos los WDNET se consideraron como "localizados" mientras que otros subtipos de tumores se consideraron "malignos". La evaluación de los pares de transcritos correlacionados linealmente identificó un patrón similar al conjunto de entrenamiento mientras que los pares de transcritos MTA1:MAGE-D2, MTA1:Kiss1, FZD7:NAP1L1 y Survivina: Ki-67 estaban altamente correlacionados (R2 > 0,50). El modelo de SVM entrenado se aplicó para diferenciar las preparaciones de células EC normales de las neoplasias con el 76% de precisión.
Los resultados (mostrados en la FIG. 7) indicaron que en este estudio (utilizando subconjuntos del panel de nueve biomarcadores), las células EC normales se validaron en forma cruzada con solo el 77% de precisión y se predijeron en un conjunto de pruebas independiente con un 76% precisión (p = 0,84). Las GEP-NEN localizadas se validaron en forma cruzada con solo el 78% de precisión y se predijeron con un 63% de precisión en el conjunto de prueba (p = 0,25). Los GEP-NEN malignos se validaron en forma cruzada con solo 83% de precisión y se predijeron con un 83% de precisión en un conjunto independiente (p = 0,80). El modelo de árbol de decisión podría predecir GEP-NEN localizados y malignos con solo el 63% y el 83% de precisión, respectivamente (FIG. 7). La estadística de la prueba F se calculó para confirmar que los resultados de clasificación del entrenamiento y los conjuntos independientes no fueron significativamente diferentes. Los valores p para los subgrupos normales, localizados y malignos fueron 0,84, 0,25 y 0,80 respectivamente.
Ejemplo 4C: Predicción y modelado usando niveles de expresión del panel de 21 biomarcador
Se diseñó un algoritmo de análisis discriminante regularizado (RDA) y se aplicó a los datos de expresión para el panel de veintiuno biomarcadores (MAGE-D2, MTA1, NAP1L1, Ki67, Survivina, FZD7, Kiss1, NRP2, X2BTB48, CXCL14, GRIA2, NKX2-3, OR51E1, PNMA2, SPOCK1, HOXC6, CTGF, PTPRN2, SCG5 y Tph1), descritos anteriormente. La selección de genes para la clasificación de tejidos se realizó calculando la puntuación del intervalo
(S) para cada gen y para cada par de clases como:
donde µC1 y µC2 representan medios de primera y segunda clase, respectivamente, y σC1 y σC2 son desviaciones estándar entre clases. Un gran valor de S era indicativo de una expresión diferencial sustancial ("veces que cambia") y una baja desviación estándar ("estabilidad del transcrito") dentro de cada clase. Los genes se clasificaron por un valor S decreciente y se usaron como entradas para el RDA.
Los parámetros de regularización de RDA, γ y λ se usaron para diseñar un clasificador intermedio entre LDA (realizado cuando γ =0y λ = 1) y QDA (realizado cuando γ =0y λ = 0) (Picon A, Gold LI, Wang J, Cohen A, Friedman E. A subset of metastatic human colon cancers expresses elevated levels of transforming growth factor beta1. Cancer Epidemiol Biomarkers Prev 1998; 7(6): 497-504). Para reducir el ajuste excesivo, los parámetros del RDA se seleccionaron para minimizar el error de validación cruzada sin ser igual a 0,0001, forzando así al RDA a producir un clasificador entre LDA, QDA y L2 (Pima I, Aladjem M. Regularized discriminant analysis for face recognition. Pattern Recognition 2003; 37 (9): 1945-48).
Los parámetros de regularización se definieron como γ = 0,002 y λ = 0. Para cada par de clases, los valores S se asignaron a datos de expresión para transcritos individuales, que luego se organizaron mediante un valor S decreciente. El RDA se realizó 21 veces, de modo que la enésima iteración consistió en los mejores N puntajes de transcritos. La estimación del error se realizó mediante una validación cruzada de 10 veces del clasificador del RDA, al dividir el conjunto de datos del tejido en subconjuntos complementarios, realizar el análisis en un subconjunto (denominado conjunto de entrenamiento) y validar el análisis en el otro subconjunto (llamado el conjunto de validación o conjunto de prueba). Esta operación se realizó para todas las permutaciones de conjuntos de pruebaentrenamiento y el error de clasificación errónea se promedió para reducir la variabilidad en la evaluación predictiva general.
Ejemplo 4D: Clasificación matemática precisa y sensible de tejidos desconocidos y GEP-NEN, diferenciación de subtipos de GEP-NEN y estadificación de GEP-NEN usando datos de expresión de un panel de veintiún biomarcadores
Este algoritmo del RDA se aplicó a los datos de expresión obtenidos como se describió anteriormente para el panel de 21 biomarcadores (MAGE-D2, MTA1, NAP1L1, Ki67, Survivina, FZD7, Kiss1, NRP2, X2BTB48, CXCL14, GRIA2, NKX2-3, OR51E1, PNMA2, SPOCK1, HOXC6, CTGF, PTPRN2, SCG5 y Tph1). El algoritmo se utilizó para distinguir muestras de tipos de tejido desconocidos (EC (células enterocromafines normales); "Normal" (mucosa intestinal
5 normal), "Tumor" (agregación de GEP-NEN primarios y metastásicos y carcinomas (NET/NEC)); y WDNET primario; WDNEC; PDNET; PDNEC), para la clasificación matemática de GEP-NEN, de la siguiente manera.
Para cada muestra, primero se determinó si el tejido era normal o neoplásico. Los tejidos considerados neoplásicos se evaluaron para determinar si eran primarios o metastásicos. Los subtipos de GEP-NEN (primarios o metastásicos) se caracterizaron luego. El algoritmo del RDA se aplicó en cada etapa usando el mismo conjunto de
10 parámetros de aprendizaje (γ = 0,002 y λ = 0). El desempeño del clasificador se midió calculando la tasa de clasificación errónea (proporción general de falsos positivos entre dos clases).
Los resultados se muestran en las Tablas 6A-C (enumerando la tasa de clasificación errónea frente a los números de transcritos de genes (biomarcadores) detectados, comenzando con el transcrito de mayor puntuación para cada distinción).
15 Tabla 6A: Tasas de clasificación errónea en comparación con el número de transcritos detectados (normal frente a GEP-NEN; primario frente a metástasis)
Número de Transcritos
Tasas de clasificación errónea
Células EC vs. Tumor
Mucosa normal de SI vs. Tumor Primario vs. Metástasis
1
0,08 0,21 0,28
2
0,06 0,15 0,27
3
0,06 0,16 0,22
4
0,05 0,17 0,23
5
0,02 0,17 0,18
6
0,01 0,12 0,19
7
0,01 0,07 0,18
8
0 0,09 0,14
9
0 0,06 ,14,
10
0 0,07 0,11
11
0,01 0,05 0,12
12
0,01 0,04 0,07
13
0 0,03 0,08
14
0,01 0,03 0,05
15
0 0,02 0,03
16
0 0,01 0,02
17
0 0,01 0,02
18
0 0,01 0
19
0 0,01 0
20
0 0 0,02
Tabla 6B: Tasas de clasificación errónea en comparación con el número de transcritos detectados (GEP-NEN primarios)
Número de Transcriptos
Tasas de clasificación errónea
1
PDNEC vs. WDNET PDNEC vs. WDNEC PDNEC vs. PDNET PDNET vs. WDNET PDNET vs. WDNEC
2
0,07 0,09 0,14 0,16 0,2
3
0,04 0 0 0,29 0,2
4
0 0 0 0,16 0,08
5
0 0 0 0,04 0,05
6
0 0 0 0 0
(continuación)
Número de Transcriptos
Tasas de clasificación errónea
1
PDNEC vs. WDNET 1 PDNEC vs. WDNET 1 PDNEC vs. WDNET
7
0 0 0 0 0
8
0 0 0 0 0
9
0 0 0 0 0
10
0 0 0 0 0
11
0 0 0 0 0
12
0 0 0 0 0
13
0 0 0 0 0
14
0 0 0 0 0
15
0 0 0 0 0
16
0 0 0 0 0
17
0 0 0 0 0
18
0 0 0 0 0
19
0 0 0 0 0
20
0 0 0 0 0
21
0 0 0 0 0
Tabla 6C: tasas de clasificación errónea en comparación con el número de transcritos detectados (GEP-NEN metastásicos)
Número de Transcriptos
Tasas de clasificación errónea
WDNEC MET vs. WDNET MET
PDNEC MET vs. WDNEC MET PDNEC MET vs. WDNET MET
1
0,17 0,2 0,22
2
0,28 0,27 0,22
3
0,06 0 0,11
4
0,06 0 0
5
0,06 0 0
6
0 0 0
7
0 0 0
8
0 0 0
9
0 0 0
10
0 0 0
11
0 0 0
12
0 0 0
13
0 0 0
14
0 0 0
15
0 0 0
16
0 0 0
17
0 0 0
18
0 0 0
19
0 0 0
20
0 0 0
21
0 0 0
Como se muestra en las Tablas 6A-C, los métodos y el algoritmo del RDA pudieron detectar la presencia, etapa y clasificación (subtipo), con cero tasas de clasificación errónea a través de iteraciones en pares de células EC normales, mucosa normal de intestino delgado y subtipos de GEP-NEN.
5 Como se muestra en la Tabla 6A, el algoritmo del RDA distinguió células EC normales de tejido neoplásico. La detección y el análisis de los niveles de expresión de solo el transcrito del biomarcador mejor clasificado (PNMA2) fue capaz de hacer esta distinción con una tasa de clasificación errónea de 0,08; la detección y análisis del biomarcador individual respectivo mejor clasificado (CgA) fue capaz de distinguir entre la mucosa normal de SI y tejido neoplásico con una tasa de clasificación errónea de 0,21 (Tabla 6A).
10 Aplicando el método a los datos para una pluralidad de biomarcadores (detectando la expresión de niveles de paneles de biomarcadores y aplicando el algoritmo del RDA a los datos) se pudo detectar y distinguir los GEP-NEN de muestras normales con clasificación errónea cero. La distinción de células EC del tejido tumoral con una tasa de clasificación errónea de cero se logró utilizando un panel de ocho (8) transcritos de biomarcadores. La distinción de la mucosa normal de SI del tejido tumoral con una tasa de clasificación errónea de cero se logró usando un panel
15 de veinte (20) transcritos de biomarcadores (Tabla 7). En este estudio, las tasas de clasificación errónea fueron más altas con menos transcritos. Estos resultados demuestran la especificidad de los biomarcadores para diferentes
grupos de tejidos y confirman la capacidad de los presentes métodos para detectar la enfermedad de GEP-NEN y distinguir el tejido de GEP-NEN de diferentes tipos de tejidos normales, con alta especificidad.
Del mismo modo, la aplicación del algoritmo del RDA a los niveles de expresión de paneles de biomarcadores podría determinar con 100% de precisión si una muestra de tejido desconocida era primaria o metastásica. Para esta
5 determinación, los niveles de expresión se detectaron para dieciocho (18) transcritos de biomarcadores y los datos incluidos en el modelo del RDA (Tabla 7), con tasas de clasificación erróneas más altas usando menos transcritos. La detección de la expresión y la aplicación del algoritmo solo al transcrito mejor clasificado (MAGE-D2) distinguió muestras primarias y metastásicas con una tasa de clasificación errónea de 0,28. (Tabla 6A).
Los subtipos de GEP-NEN primarios también podrían diferenciarse con 100% de precisión usando el algoritmo del
10 RDA. Las tasas de clasificación erróneas cuando solo se detectaron los transcritos mejor clasificados individuales en el intervalo de 0,07 (PTPRN2, para distinguir entre PDNEC y WDNEC) a 0,37 (NRP2, para distinguir entre WDNEC y WDNET). Aplicando el algoritmo del RDA a los niveles de expresión de todos los transcritos de 21 biomarcadores, los métodos distinguieron entre WDNET y WDNEC con una tasa de clasificación errónea de cero (Tabla 6B), con mayores tasas de clasificación erróneas usando menos biomarcadores.
15 Como se muestra en la Tabla 6C, se usó también el algoritmo del RDA para distinguir con 100% de precisión entre subtipos de GEP-NEN metastásicos. Las tasas de clasificación errónea con solo los transcritos mejor clasificados fueron 0,22 (CXCL14, para distinguir entre WDNET MET y WDNEC MET), 0,2 (NAP1L1, para distinguir entre PDNEC MET y WDNEC MET), y 0,17 (NRP2, para distinguir entre PDNEC MET y WDNET MET), respectivamente (Tabla 6C).
20 Tabla 7. Tasas de clasificación errónea con detección de diversas cantidades de transcritos; logrando una clasificación errónea mínima; SVM, árboles de decisión (DT) y clasificadores Perceptron multicapa (MLP).
Muestra/Clase distinguida
Tasa de clasificación errónea más baja en este ejemplo Número de transcritos para lograr la tasa de clasificación errónea más baja en este ejemplo
SVM
DT MLP SVM DT MLP
EC vs Mucosa normal de SI
0,02 0,05 0 14 21 8
EC vs Tumor
0,01 0,03 0 18 3 5
Mucosa normal de SI vs Tumor
0,14 0,14 0,01 16 21 13
Primario vs Metástasis
0,19 0,19 0,14 3 2 7
PDNEC vs WDNET
0,07 0,07 0 21 21 4
PDNEC vs WDNEC
0,09 0,09 0 21 21 2
PDNEC vs PDNET
0,14 0,28 0,14 21 21 3
PDNET vs WDNET
0,16 0,16 0,03 21 1 11
PDNET vs WDNEC
0 0,20 0 19 21 10
WDNEC vs WDNET
0,02 0,26 0,02 21 21 16
WDNEC MET vs WDNET MET
0,11 0,33 0,11 3 21 12
PDNEC MET vs WDNEC MET
0,20 0,20 0 21 21 12
PDNEC MET vs WDNET MET
0,22 0,33 0 21 21 14
"Normal" = mucosa normal de intestino delgado; "Tumor"= agregación de NET primarios y metastásicos y carcinomas (NET/NEC)
La Tabla 8 resume los números de biomarcadores NET capaces de distinguir entre muestras indicadas usando el algoritmo del RDA en este ejemplo. En este ejemplo, todos los 21 biomarcadores distinguieron WDNEC de WDNET con clasificación errónea cero (clasificación errónea más alta con menos transcritos), por el contrario, tan pocos 5 como dos biomarcadores podrían diferenciar entre PDNEC y WDNET (MAGE-D2, CXCL14), y entre PDNEC y PDNET (PTPRN2, MTA1) con clasificación errónea cero. En este ejemplo, 11 biomarcadores distinguieron las células enterocromafines (EC) normales de mucosa normal de SI con clasificación errónea cero (PNMA2, CXCL14, PTPRN2, Tph1, FZD7, CTGF, X2BTB48, NKX2-3, SCG5, Kiss1, SPOCK1, con una tasa de clasificación errónea mayor utilizando menos biomarcadores), menos transcritos fueron capaces de distinguir células EC normales de
10 tejido neoplásico (n = 8, PNMA2, Tph1, PTPRN2, SCG5, SPOCK1, X2BTB48, GRIA2, OR51E1), la expresión de veinte de los biomarcadores (con la excepción de CXCL14) podría diferenciar la mucosa normal SI de tejido neoplásico con clasificación errónea cero (mayores tasas de clasificación errónea con menos transcritos).
Tabla 8: Número de transcritos de biomarcadores utilizadas para distinciones por pares con tasa de clasificación errónea cero mediante RDA
Distinción
Número de transcritos que lograron una tasa de clasificación errónea cero
EC vs Normal
11
EC vs Tumor
8
Normal vs Tumor
20
Primario vs Metástasis
18
PDNEC vs WDNET
3
PDNEC vs WDNEC
2
PDNEC vs PDNET
2
PDNET vs WDNET
4
PDNET vs WDNEC
4
WDNEC vs WDNET
21
WDNEC MET vs WDNET MET
3
PDNEC MET vs WDNEC MET
4
PDNEC MET vs WDNET MET
6
Finalmente, se aplicaron los clasificadores SVM, árboles de decisión (DT) y MLP, tal como se describió
anteriormente, usando datos para transcritos del panel de veintiun biomarcadores, de una manera similar que para
RDA. El desempeño de RDA se comparó con el desempeño de SVM, árboles de decisión y Perceptron multicapa
(MLP) para la clasificación de subtipos de GEP-NEN al detectar la expresión del panel de veintiun biomarcadores. 20 Todos los clasificadores se sometieron al protocolo entrenamiento y validación cruzada descritos en el Ejemplo 4A.
Se calcularon as tasas de clasificación errónea (Tabla 7), SVM fue capaz de lograr una clasificación errónea de cero
para distinguir PDNET de WDNEC. Los árboles de decisión distinguieron con tasas de clasificación errónea en el
intervalo de 0,03 (entre EC y muestra tumoral) a 0,33 (entre WDNEC MET y WDNET MET, y entre PDNEC MET y
WDNET MET). Algo comparable al RDA, el clasificador MLP produjo tasas de clasificación errónea cero con 7/13 25 iteraciones, con una alta precisión general. El enfoque del RDA fue más confiable en este ejemplo con el panel de
21 genes marcadores, logrando tasas de clasificación erróneas de cero en todas las iteraciones.
Ejemplo 5: Detección de células de GEP-NEN circulantes (CNC) e identificación de transcritos de biomarcadores
(ARNm) del plasma
Se detectaron células de GEP-NEN circulantes (CNC) en sangre humana usando los métodos y biomarcadores proporcionados. Para este proceso, se obtuvieron muestras de sangre humana (plasma, capa leucocitaria y sangre completa) y se sometieron a tinción, clasificación de células, y PCR en tiempo real (para detectar biomarcadores de GEP-NEN y genes de mantenimiento).
Ejemplo 5A: Preparación de muestra y aislamiento de ARN de plasma, capa leucocitaria y sangre completa
En los siguientes estudios para la detección de biomarcadores en plasma humano y capa leucocitaria, se obtuvieron muestras de sangre humana de un banco de datos de sangre, con muestras de controles sanos (n = 85) o pacientes (n = 195) que habían sido tratados por Enfermedad de GEP-NEN, en Yale New Haven Hospital, Uppsala o Berlín, véase Kidd M, et al, "CTGF, intestinal stellate cells and carcinoid fibrogenesis", World J Gastroenterol 2007; 13 (39): 5208-16. Se recogieron 5 mL de sangre en tubos que contenían ácido etilendiaminotetraacético (EDTA). El plasma se separó de la capa leucocitaria después de 2 ciclos de centrifugado (5 minutos a 2.000 rpm) y luego se almacenó a -80°C antes del aislamiento del ácido nucleico y/o el análisis de hormonas (CgA).
Aislamiento de ARN de diversas muestras de sangre
Para aislamiento de ARN de la capa leucocitaria, las muestras se incubaron con TRIZOL®, seguido de la limpieza del ARN. Se disolvió el ARN en pirocarbonato de dietilo-agua y se midió espectrofotométricamente, y se analizó una alícuota en un Bioanalizador (Agilent Technologies, Palo Alto, CA) para evaluar la calidad del ARN (Kidd M, et al, "The role of genetic markers-NAP1L1, MAGE-D2, and MTA1--in defining small-intestinal carcinoid neoplasia", Ann Surg Oncol
2006; 13(2): 253-62).
Para aislamiento de ARN del paciente con GEP-NEN y plasma de control, se usó el Mini Kit para ARN en sangre QIAamp (FIG, 11A), que en este estudio permitió la detección en tiempo real de genes de mantenimiento en significativamente más muestras en comparación con el enfoque con TRIZOL® (FIG, 11B) (8/15 versus 2/15, p = 0,05). Para el aislamiento del ARN directamente de sangre completa, se usó el Mini Kit para ARN en sangre QIAamp siguiendo las directrices del fabricante.
Estabilidad y reproducibilidad de las muestras
La prueba de sangre se basa en la identificación de la firma molecular de GEP-NEN en 1 mL de sangre completa, recogida en un tubo con EDTA. Se determinó que la firma del gen es estable hasta durante cuatro horas (refrigeración a 4-8°C, después de la flebotomía) antes de congelación (FIG, 13). No se ve afectada por ayuno/alimentación. El análisis de reproducibilidad entre ensayos (mismas muestras procesadas en días separados) varió de 98,8-99,6% mientras que la reproducibilidad en intra ensayo fue 99,1-99,6%.
Estos estudios identificaron que la firma del gen es altamente reproducible (~99%), es estable durante hasta cuatro horas en refrigeración (antes de congelación) y no se ve afectada por ayuno/alimentación.
PCR en tiempo real
El ARN total obtenido de plasma, capa leucocitaria y sangre completa como se describió anteriormente se sometió a transcripción inversa con el kit de archivo de ADNc de alta capacidad (Applied Biosystems (ABI), Foster City, CA) siguiendo el protocolo sugerido por el fabricante. En resumen, se mezclaron 2 microgramos de ARN total en 50 microlitros de agua con 50 µL de mezcla 2XRT que contiene regulador de transcripción inversa, solución de trifosfato de desoxinucleótido, cebadores aleatorios y transcriptasa inversa multiscribe. La reacción de RT se realizó en un termociclador durante 10 minutos a 25°C seguido de 120 minutos a 37°C, según lo descrito por Kidd M, et al, ""The role of genetic markers-NAP1L1, MAGE-D2, and MTA1--in defining small-intestinal carcinoid neoplasia", Ann Surg Oncol 2006; 13(2): 253-62).", Ann Surg Oncol 2006; 13 (2): 253-62. Los niveles de transcritos de los genes marcadores se midieron usando los productos Assays-on-DemandMR y el sistema de detección de secuencias ABI 7900 de acuerdo con las sugerencias del fabricante (ver Kidd M, Eick G, Shapiro MD, et al, Microsatellite instability and gene mutations in transforming growth factor-beta type II receptor are absent in small bowel carcinoid tumors. Cancer 2005;103(2):229-36).
El ciclo se realizó en condiciones estándar, usando el protocolo de mezcla madre de PCR universal TaqMan® En resumen, ADN complementario en 7,2 µL de agua se mezcló con 0,8 µL de cebador 20·Assays-on-Demand y mezcla de sondas y aproximadamente 8 µL 2X de mezcla madre universal TaqMan® en una placa de reacción óptica de 384 pozos. Se usaron las siguientes condiciones de PCR: 50°C durante 2 min y luego 95°C durante 10 min, seguidos de 50 ciclos a 95°C durante 15 min. min y 60°C durante 1 min, como lo describe Kidd M, et al, "The role of genetic markers-NAP1L1, MAGE-D2, and MTA1--in defining small-intestinal carcinoid neoplasia", Ann Surg
Oncol 2006; 13(2): 253-62).", Ann Surg Oncol 2006; 13 (2): 253-62". ∆CT sin procesar (delta CT = cambio en el tiempo del ciclo en función de la amplificación) normalizado usando geNorm (véase Vandesompele J, De Preter K, Pattyn F, et al., Accurate normalization of real-time quantitative RT-PCR data by geometric averaging of multiple internal control genes. Genome Biol 2002;3(7):RESEARCH0034), y expresión de los genes de mantenimiento ALG9, TFCP2 y ZNF410, Véase Kidd M, et al, "GeneChip, geNorm, and gastrointestinal tumors: novel reference genes for real-time PCR," Physiol Genomics 2007;30(3):363-70. Los datos normalizados se transformaron con logaritmo natural (In) para compresión, se utilizó ALG-9 como gen de mantenimiento, se detectó su expresión y se usó para normalizar los datos de expresión del biomarcador de GEP-NEN.
Para el análisis estadístico, todos los cálculos se llevaron a cabo utilizando el lenguaje R 2,9 para cálculo estadístico. Véase R Development Core Team, R: A language and environment for statistical computing. Viena, Austria: R Foundation for Statistical Computing, 2008, se usaron GraphPad (Prizm 4) y SPSS 16,0 para todos los análisis estadísticos, mediante curvas características receptor-operador (ROC), prueba exacta de Fisher y/o ANOVA, usando pruebas de 2 colas, con p <0,05, consideradas significativas.
Ejemplo 5B: Detección de genes de mantenimiento y detección en sangre completa
Se determinaron los niveles de expresión de transcrito de tres (3) genes de mantenimiento (ALG9, TFCP2 y ZNF410) en ARNm aislado utilizando el enfoque de TRIZOL®, descrito anteriormente, a partir de un recubrimiento leucocitario de cinco donantes sanos. Los tres genes se detectaron con niveles de ∆CT entre 30 y 35. Las secuencias y la información para pares de cebadores ejemplares se enumeran en las Tablas 1A y 1B.
Se evaluaron los niveles de expresión del transcrito de los mismos 3 genes de mantenimiento y 11 genes biomarcadores de GEP-NEN en ARNm preparado a partir de sangre completa de 3 donantes sanos (muestras normales). Para este proceso, se aisló el ARNm, se sintetizó el ADNc y la PCR se realizó por diferentes personas en días diferentes, en placas separadas, usando reactivos preparados de forma independiente, hechos en días diferentes. Los niveles de expresión de genes detectados en las muestras se correlacionaron fuertemente (FIG, 11C; R> 0,99, p <0,0001).
La expresión de 5 genes de mantenimiento (18S, ALG9, GAPDH, TFCP2 y ZNF410) se detectó mediante PCR en tiempo real en ARNm aislado utilizando TRIZOL®, a partir de muestras de sangre completa, de 5 donantes sanos, los pares cebadores se enumeran en las tablas 1A y 1B. En este estudio, la expresión de ALG9 fue la menos variable entre las muestras (coeficiente de variación = 1,6%) (FIG, 13A). Los niveles del transcrito ALG9 se determinaron mediante PCR en tiempo real en ARN aislado de sangre completa de 5 pacientes de control sanos, antes y a intervalos de treinta minutos después de la alimentación. Los resultados mostraron que los niveles de expresión de ALG9 no se alteraron significativamente hasta 4 horas después de la administración oral (según lo determinado por n ANOVA: p> 0,05) (FIG. 13B). Estos resultados demuestran que la detección de productos génicos de acuerdo con los métodos proporcionados produce resultados consistentes y es útil para la comparación de datos de muestras de pacientes adquiridas y preparadas en diferentes días por distintos investigadores.
Delineación de un gen de mantenimiento
Para identificar los genes de mantenimiento más útiles para la normalización, se examinó un panel (n = 19) de marcadores candidatos que comprendía aquellos identificados del tejido de GEP-NEN (n = 9), y aquellos a través del cribado de transcriptomas de sangre de GEP-NEN (n = 10). Para seleccionar los marcadores de "mantenimiento", se utilizaron varios criterios, entre ellos: importancia topológica cuando se mapeó con el interactoma sanguíneo (7.000 genes, 50.000 interacciones) _ENREF_3, la estabilidad (valor M) después de la PCR en tiempo real y la eficiencia de la transcripción en la sangre. Además, se examinó la presencia de eficiencias entre los genes objetivo y el gen de mantenimiento. Tal correlación soporta un algoritmo relativo basado en cuantificación para el cálculo. Los 19 genes incluidos en el análisis se derivaron de tejido: 18S, GAPDH, ALG9, SLC25A3, VAPA, TXNIP, ADD3, DAZAP2, ACTG1 y derivados de microarreglos sanguíneos: ACTB, ACTG4B, ARF1, HUWE1, MORF4L1 RHOA, SERP1, SKP1, TPT1 y TOX4. Los objetivos que se consideraron cuidadores apropiados mostraron ≥ 3 características.
Importancia topológica en microarreglo sanguíneo
Se examinaron tres características topológicas: "Grado" = número de conexiones en cada gen; "Intermediación" = importancia de un gen en la transducción de señales, y "Agrupamiento" = coeficiente de agrupamiento o la medida en que los vecinos de un gen están interconectados. Un alto "grado" indica muchas conexiones por gen, una alta "intermediación" indica un papel más crítico en el flujo de información dentro del interactoma, mientras que un coeficiente de agrupamiento "alto" significa que más vecinos de un gen están conectados entre sí. El gen más apropiado tendría valores bajos para Grado, Intermediación y Agrupamiento. Los genes que cumplen todas estas características incluyen ACTB, TOX4, TPT1 y TXNIP (FIG, 14A-C), El orden de los genes es:
TXNIP = ACTB = TOX4 = TPT1> ALG9 = ARF1> GAPDH> DAZAP2> VAPA = ATG4B = HUWE1 = MORF4L1 =
RHOA = SERP1> ADD3,
Variabilidad (Coeficiente de variación y valor M)
Se usaron dos enfoques para evaluar la variación en la expresión del gen de mantenimiento, en primer lugar la variabilidad y, en segundo lugar, la robustez (el valor "M") medidos mediante geNorm, los valores de CT sin procesar se examinaron para la variación (FIG, 15) y si la expresión pasó la prueba de normalidad D'Agostino y Pearson (Tabla 9).
Tabla 9. Genes candidatos de mantenimiento y formalidad de la expresión
18S
ACTG1 ADD3 ALG9 DAZAP 2 GAPDH SLC25A3 TXNIP VAPA
CV
17,9% 11,03% 13,21% 6,93% 10,01% 10,36% 18,43% 15,09% 14,09%
Prueba DP
N Y N Y Y Y Y N Y
ACTB
ARF1 ATGB 4 HUWE 1 MORF4 L1 RHDA SERP1 SKP1 TOX4 TPT1
CV
9,27% 5,81% 6,9% 8,39% 9,76% 7,14% 9,33% 4,36% 4,34% 7,65 %
Prueba DP
N Y Y Y N Y N Y N Y
CV = coeficiente de variación, DP = Prueba de normalidad general de D'Agostino y Pearson, N = no distribuido normalmente, Y = paso la prueba de normalidad.
El análisis de variabilidad identificó que ALG9, ARF1, ATG4B, RHDA y SKP1 eran los genes menos variables, los 10 genes seleccionados por geNorm que muestran la menor variación entre las muestras (y de ahí la mayor estabilidad
o expresión robusta) se indican en la FIG. 16. El valor "M" es una medida de la estabilidad del gen y se define como la variación promedio por pares de un gen particular con todos los otros genes de referencia potenciales. Los genes más estables incluyen: ALG9, ACTB, ARF1, ATG4B, HUWE4, MORF4L1, RHDA, SKP1, TPT1 y TOX4.
Eficiencia de PCR
15 Se examinó la eficacia de la PCR para evaluar qué genes candidatos de mantenimiento cumplían criterios adecuados de amplificación. Esto se llevó a cabo en dos muestras independientes usando una curva estándar (dilución: 2.000-0,01 ng/µL). La eficiencia de la PCR se calculó usando el Ecuación de Fink:
Eficiencia = 10^(-1/pendiente) -1
El análisis identificó que 18S y ALG9 eran los genes derivados de tejido más eficientemente transcritos mientras que 20 TPT1 era el gen candidato de mantenimiento derivado de sangre más eficazmente transcrito (FIG. 17).
Eficacia de amplificación comparada con genes objetivo
Finalmente, se examinaron las cinéticas de amplificación de los genes objetivo y de referencia para similitudes. Este es un requisito previo necesario para cualquier protocolo de amplificación por PCR apropiado, o de lo contrario, se requiere un factor de corrección en algoritmos de cuantificación para tratar cálculos de expresión sobreestimados.
25 También es importante para cualquier método comparativo de CT por ejemplo, ∆∆CT particularmente cuando las estimaciones de datos sin procesar son más precisas que las de las curvas estándar.
En general, un gen de mantenimiento se considera apropiado si la diferencia en CT para el gen de referencia objetivo a través de una serie de diluciones es ≤0,1. Un gen de mantenimiento identificado que compartió eficacias similares de PCR con genes objetivo fue ALG9 (FIG. 18).
30 Ninguno de los genes candidatos de mantenimiento derivados de microarreglos sanguíneos exhibió las características apropiadas necesarias para actuar como un gen de mantenimiento. ALG9, el gen candidato de mantenimiento derivado de tejido, por el contrario, exhibió baja variabilidad (valor M y prueba de DP), características topológicas apropiadas, se transcribió de manera eficiente y compartió características de amplificación similares con los genes objetivo de interés. Por lo tanto, este gen se seleccionó como un gen de mantenimiento apropiado para
normalizar los transcritos tumorales circulantes.
Normalización de objetivos
Existen dos métodos principales para normalizar la expresión del gen objetivo: cuantificación absoluta y relativa. El primero requiere de una curva estándar (y por lo tanto utiliza un espacio superior en la placa), requiere más mano de obra y es menos preciso que los protocolos basados en valores de CT sin procesar. Este estudio se centró en los enfoques de cuantificación relativa. Se han desarrollado varios algoritmos para cuantificación relativa, incluidos el modelo Gentle, el modelo Pfaffl, modelos basados en gráficos de amplificación, Q-Gene y geNorm. La mayoría de los métodos incluyen mecanismos para estimar las diferencias en las eficiencias de PCR, el uso de múltiples genes de mantenimiento, por ejemplo, geNorm, o solo pueden adquirirse comercialmente (por ejemplo, qBasePLUS de Biogazelle), Un método que es fácil de usar y no requiere factores de estimación es el protocolo ∆∆CT, Este es un modelo matemático que calcula los cambios en la expresión génica como una diferencia relativa de veces entre una muestra experimental y un calibrador. Depende de eficiencias de amplificación similares para los genes de mantenimiento y objetivo (una característica identificada para ALG9), requiere la amplificación de productos de PCR pequeños (<150 bprs -una característica de Applied Biosystems Taqman), y un método de PCR que ha sido optimizado (por ejemplo, se ha establecido una concentración de partida del objetivo). El enfoque ∆∆CT se selecciono para normalización de los 51 gens candidatos en sangre periférica. La utilidad de este enfoque se demostró cuando se comparó este método (normalización ∆∆CT con ALG9) con geNorm (normalización con 18S, ALG9 y GAPDH) (FIG., 19).
La variación en la expresión del gen objetivo fue significativamente menor en muestras de control usando el protocolo de ∆∆CT (p <0,004 vs geNorm) mientras que la mayoría de los objetivos exhibieron una distribución normal (62% versus 0%, prueba de normalidad general de D'Agostino y Pearson) después de normalización con ALG9. Se ha demostrado que el protocolo de ∆∆CT (con ALG9) normaliza con éxito la expresión objetivo en el tejido tumoral de GEP-NEN. Se identificó un enfoque de ∆∆CT que usa ALG9 como gen de mantenimiento como el protocolo de normalización más apropiado para los 51 genes marcadores candidatos de GEP-NEN. En consecuencia, este enfoque se seleccionó para perfilar la expresión del transcrito en muestras de sangre.
Identificación de genes marcadores tumorales candidatos
Para identificar genes marcadores potenciales, tanto los microarreglos de tejido basados en tejido como en sangre fueron de muestras de GEP-NEN como fuentes para detectar genes marcadores candidatos. La selección de genes se optimizó aplicando y desarrollando una serie de algoritmos biomatemáticos.
Inicialmente, se analizaron transcriptomas de GEP-NEN (obtenidos de intestino delgado) y se comparó esto con la mucosa normal del intestino delgado (chips U133A, n = 8 tumores y n = 4 controles), usando dCHIP (veces que cambia el límite inferior ≥1,2 veces, prueba t desapareada y agrupación jerárquica basada en la correlación de Pearson) se identificaron 1.451 genes sobrerregulados en muestras tumorales. Se seleccionaron treinta y dos marcadores candidatos en función del nivel de sobrerregulación (> 3 veces, por ejemplo, NAP1L1), procesos biológicos conocidos (proliferación, por ejemplo, Ki67, supervivencia, por ejemplo, survivina) y significado clínico (por ejemplo, expresión del receptor de somatostatina, CgA). En un estudio separado, la expresión basada en PCR en tejido tumoral de nueve de estos marcadores candidatos se confirmaron como predictivos de malignidad de GEP-NEN. En el presente estudio, los 32 genes candidatos se examinaron adicionalmente y 17 se incluyeron en el panel final de genes.
Como segunda estrategia, se utilizaron dos conjuntos de datos de microarreglos de tejido tumoral (HUGE y U133A, un total de n = 30 tumores y n = 10 controles) y se compararon los GEP-NEN (obtenidos de sitios del intestino delgado) con otros tumores (cánceres de mama, colon, próstata e hígado) de bases de datos disponibles públicamente. También se evaluó el material del intestino delgado de la enfermedad de Crohn, que se sabe que altera la actividad celular neuroendocrina local y se asocia con el riesgo de NEN de SI, para delinear aún más el panorama general del gen de GEP-NEN y ayudar a identificar marcadores candidatos. Con el fin de evaluar las relaciones de los genes involucrados, se construyó un análisis teórico gráfico de redes de coexpresión de genes. Este enfoque determinó que la red de genes de "GEP-NEN" (generada mediante la integración de las dos plataformas, U133A y HUGE) consistió en 6.244 genes y 46.948 enlaces. La red de genes era altamente modular (es decir, los genes tendían a organizarse en comunidades interconectadas) y, por lo tanto, contenían genes que estaban funcionalmente relacionados (tal como ocurrieron dentro de la misma comunidad). Un algoritmo de detección comunitario imparcial identificó 20 comunidades (colecciones de genes relacionados) con ≥20 genes cada una. El enriquecimiento de cada comunidad de genes para procesos biológicos identificó términos que incluyen "reducción de la oxidación" (agrupación 1/2), "respuesta inmune" (agrupación 5) y "ciclo celular" (agrupación 18). De importancia fue la identificación de que la red del gen de GEP-NEN era topológicamente diferente de otros cánceres comunes (pero compartía similitud) con la enfermedad de Crohn (FIG. 20A). Este último puede reflejar la proliferación conocida de células neuroendocrinas en la enfermedad de Crohn.
La distinción topológica refleja patrones de conectividad únicos alrededor de cada gen en el interactoma, proporcionando información de que un panel de genes o interacciones génicas puede ser específico para el tumor (GEP-NEN). Tal firma específica de tumor se generó eliminando las interacciones gen-gen encontradas en las redes de genes de cáncer de mama, colon, próstata e hígado de la red de genes de GEP-NEN. La firma específica resultante de GEP-NEN produjo 124 genes y 150 interacciones (FIG. 20B).
Al mapear estos 124 genes específicos de GEP-NEN de nuevo en la microarreglo basado en el tejido U133A se identificó que 41 genes se expresaban en forma diferencial, de los cuales 21 estaban sobrerregulados (FIG. 20C) y podían diferenciar entre GEP-NEN y controles ( Fig. 20D). Estos 21 genes sobrerregulados se examinaron adicionalmente, y se incluyeron 12 en el panel final de genes.
Como tercera estrategia, se examinaron los transcriptomas de GEP-NEN circulantes para identificar marcadores candidatos adicionales. Para estos estudios, los transcriptomas de sangre periférica (n = 7 controles, n = 7 GEP-NEN) se compararon con el arreglo de tejido "propio" (n = 3 controles, n = 9 GEP-NEN [del intestino delgado]) y un arreglo publicada de la base de datos ArrayExpress (número de acceso: E-TABM-389: n = 6 controles, n = 3 NEN primarios de intestino medio y n = 3 metástasis de GEP-NEN [MET]).
Las muestras tumorales se diferenciaron claramente de los controles (FIG, 21A-C) y se identificaron genes expresados en forma diferencial para cada uno de los grupos: conjuntos de datos de Blood (n = 2.354), "propio" (n = 1.,976) y públicos ( n = 4.353) (FIG. 21D-F).
Como se esperaba, había una gran correlación entre los cambios en la expresión génica para los conjuntos de datos de tejido "propios" y públicos (R = 0,59, FIG. 22A). Si bien la correlación entre los conjuntos de datos de Blood y "propios" y públicos fue baja (R = -0,11 y -0,05, respectivamente) (FIG. 22A, B), 157 (33%) de los 483 genes significativamente cambiados ("propios"/Blood) y 423 (45%) de los 947 genes significativamente modificados (públicas/Blood), se correlacionaron positivamente,
En general, entre los conjuntos de datos de Blood, "propios" y públicos, 85 genes se correlacionaron en sangre y tejido, mientras que 196 se correlacionaron en forma inversa o contraria (FIG. 23A). Los genes correlacionados codificaron procesos tales como señalización intracelular, muerte celular y regulación de transcripción (FIG. 23B) mientras que los genes correlacionados en forma contraria codificaron procesos tales como mantenimiento de los telómeros, desarrollo del tubo neural y ensamblaje del complejo de proteínas (FIG. 23C).
Treinta y nueve de los 85 (46%) genes expresados concordantemente tanto en sangre como en tejido estaban sobrerregulados y 46 transcritos están subregulados. Un análisis de los genes sobrerregulados identificó que 22 tenían 0-3 parálogos y se expresaron en niveles >3 veces. La integración de estos genes con el interactoma sanguíneo confirmó que estaban altamente interconectados (más central en el interactoma), demostrando su relevancia biológica "putativa" en el contexto de GEP-NEN (FIG. 24).
Estos enfoques, incluido el análisis y la integración del tejido tumoral y los transcritos de sangre periférica circulante, permitieron la identificación de un panel de 75 genes marcadores candidatos asociados con GEP-NEN. La utilidad de estos genes para identificar GEP-NEN se estudió luego en muestras de sangre periférica.
Huella dactilar de GEP-NEN circulante (panel de genes de 51 marcadores)
Para desarrollar un panel de marcadores utilizables, se midieron los niveles de transcritos de cada uno de los 75 marcadores candidatos en ARNm aislado a partir de 77 muestras de sangre (controles: n = 49; GEP-NEN: n = 28). Se desarrolló un protocolo de 2 etapas (aislamiento de ARN, producción de ADNc y PCR) ya que es más preciso que los protocolos de 1 etapa. La reproducibilidad de los protocolos de 2 etapas es alta (correlación de Pearson> 0,97; para el enfoque de 2 etapas, la correlación es 0,987-0,996). En estudios preliminares, el método preferido para el aislamiento de ARNm de muestras de sangre era el Kit de sangre mini (Qiagen: calidad de ARN > 1,8 relación A260:280, RIN> 5,0, apropiado para aplicaciones PCR37) con ADNc producido usando el kit de transcriptasa inversa de alta capacidad (Applied Biosystems: producción de ADNc 2.000-2.500 ng/µL). La PCR en tiempo real se realizó consistentemente con 200 ng/µL de ADNc en una máquina HT-7900 usando placas de 384 pozos y 16 µL de reactivos/pozo (mezcla madre de PCR universal rápido, Applied Biosystems). El límite de detección para PCR se determinó como 40 ciclos (200 ng/µL de ADNc amplificado positivamente en 95,3 ± 0,2% de casos). Al aumentar el número de ciclos a 45-50 ciclos, se identificó una expresión positiva en <1% de muestras objetivo; la tasa de falsos negativos se calculó utilizando un corte de CT de 40 para ser 0,8%. Este número de ciclos es más estricto que el enfoque europeo aceptado para la detección de leucemia, pero es coherente con otros protocolos de detección basados en PCR. Los cebadores abarcaban el exón para minimizar la amplificación de ADN genómico y eran <150 pb. Se usaron cebadores de Applied Biosystems comercialmente disponibles (ensayo de 5'-nucleasa). Los parámetros consistentes para el aislamiento de ARN, la síntesis de ADNc y la PCR en tiempo real proporcionan una plataforma estable para el análisis de genes objetivo y de mantenimiento.
51 de los 75 marcadores candidatos se identificaron como productores de producto detectable (CT <40 ciclos) en sangre. Este panel de 51 genes incluye: AKAP8L, APLP2, ARAF1, ATP6V1H, BNIP3L, BRAF, C21orf7, CD59, COMMD9, CTGF, ENPP4, FAM13A, FLJ10357, FZD7, GLT8D1, HDAC9, HSF2, Ki67, KRAS, LEO1, MORF4L2, NAP1L1, NOL3, NUDT3, OAZ2, PANK2, PHF21A, PKD1, PLD3, PNMA2, PQBP1, RAF1, RNF41, RSF1, RTN2, SMARCD3, SPATA7, SST1, SST3, SST4, SST5, TECPR2, TPH1, TRMT112, VMAT1, VMAT2, VPS13C, WDFY3, ZFHX3, ZXDC, ZZZ3. Trece de estos 51 genes marcadores se han asociado anteriormente con GEP-NEN, ya sea de los estudios previos o de otros.
Habiendo definido un panel de genes marcadores potencialmente útiles, se examinaron los recursos transcriptómicos de GEP-NEN para identificar los genes de mantenimiento preferidos y determinar los métodos preferidos para la normalización de los datos. La identificación de los genes de mantenimiento apropiados y la aplicación de protocolos de normalización facilitaría la cuantificación de cada uno de los 51 transcritos candidatos y determinaría si representaban un panel de genes marcadores de GEP-NEN.
Ejemplo 5C: Detección de células de GEP-NEN circulantes y expresión de biomarcadores en sangre completa
Utilizando PCR en tiempo real, citometría de flujo y clasificación de células activadas por fluorescencia (FACS), se identificó CD164 como un marcador capaz de detectar células de GEP-NEN circulantes en sangre completa. La detección de los niveles de expresión del transcrito CD164 por PCR en tiempo real demostró que este biomarcador es sobreexpresado consistentemente (300-10.000 x) en muestras de pacientes con GEP-NEN (29/29 células de GEP-NEN y 4 líneas celulares de GEP-NEN) comparado con células EC normales y leucocitos, demostrando que CD164 es útil como biomarcador para la identificación de células de GEP-NEN en muestras humanas, por ejemplo, sangre completa.
Se realizó citometría de flujo de múltiples parámetros en muestras de sangre completa obtenidas de 10 pacientes con GEP-NEN y 10 controles emparejados por edad y sexo. Se detectó una población de células del tamaño de células de GEP-NEN (FIG. 25A), que era doblemente positiva para naranja de acridina (AO)-PE-CY7 y CD164-APC en muestras de GEP-NEN, pero ausente en muestras de control normales ( Fig. 25B). La recolección e inmunotinción de estas células para la expresión de TPH confirmó que eran células de GEP-NEN positivas para serotonina (FIG. 25C, recuadro).
Después marcación doble con AO y CD164, se clasificaron 3-12 células de GEP-NEN, por mL de sangre, mediante FACS y se recogieron. La PCR en tiempo real identificó niveles de expresión elevados (> 2 veces, p <0,03) de los 21 biomarcadores de GEP-NEN descritos anteriormente (MAGE-D2, MTA1, NAP1L1, Ki67, Survivina, FZD7, Kiss1, NRP2, X2BTB48, CXCL14, GRIA2, NKX2-3, OR51E1, PNMA2, SPOCK1, HOXC6, CTGF, PTPRN2, SCG5 y Tph1), normalizados a genes de mantenimiento en comparación con muestras de sangre normales completas, lo que confirma que estas células eran células tumorales de GEP-NEN. Se identificaron niveles de expresión significativamente más altos (3-5 veces, p <0,05) en muestras obtenidas de seis pacientes con enfermedad metastásica, en comparación con cuatro pacientes con enfermedad local.
Se detectó la expresión de un panel de 13 biomarcadores de GEP-NEN mediante PCR en tiempo real en ARN preparado directamente a partir de sangre completa obtenida de 12 pacientes. Para comparación, se realizó PCR en paralelo sobre ARN purificado a partir de células de GEP-NEN circulantes en sangre purificadas por FACS (como se describió anteriormente) y mucosa tumoral de 12 pacientes del mismo estudio. Los niveles de expresión de los transcritos de biomarcadores detectados en sangre completa se correlacionaron en gran medida con los niveles detectados en células de GEP-NEN circulantes purificadas (R2 = 0,6, p <0,0001) (FIG. 26A) y en tejido tumoral (R2 = 0,81, p <0,0001) (FIG. 26B).
Estos resultados confirman que células de GEP-NEN circulantes (CNC) existen en sangre y pueden detectarse por PCR usando ARN preparado a partir de sangre completa y otras muestras de sangre para detección, estadificación, pronóstico y predicción con los métodos y composiciones proporcionados en la presente memoria.
Ejemplo 5D: Detección de expresión del biomarcador de GEP-NEN y análisis estadístico usando muestras de sangre completa
Los niveles de expresión de transcritos de biomarcadores individuales (VMAT2, NAP1L1 y PNMA2), así como los niveles de expresión sumados de un panel de trece (13) biomarcadores de GEP-NEN (APLP2, ARAF1, BRAF, CD59, CTGF, FZD7, Ki67, KRAS, NAP1L1, PNMA2, RAF1, TPH1, VMAT2) se determinaron mediante PCR en tiempo real como se describió anteriormente, en muestras de sangre completa de 3 grupos de muestras humanas obtenidas de: 1) un grupo de entrenamiento del Yale New Haven Hospital, que incluye 55 pacientes con GEP-NEN (todos los que llegaron, incluidos los pacientes con enfermedad de alto nivel y aquellos considerados libres de enfermedad) y 47 pacientes control, 2) un grupo de prueba independiente de Berlín (n = 144 (n = 120 pacientes, n = 24 controles)) y 3) un grupo de prueba independiente de Uppsala (n = 34 (n = 20 pacientes, n = 14 controles)), respectivamente. Las secuencias del par de cebadores y otra información sobre cebadores se enumeran en las
Tablas 1A y 1B.
Para facilitar la representación, los niveles de expresión detectados de los 13 transcritos de biomarcadores se sumaron vectorialmente (> + 1 = Σ genes sobreexpresados; > -1 = Σ genes cuya expresión está disminuida) y se representaron gráficamente.
[0392] Se empleó una estrategia de curva ROC para la identificación de GEP-NEN, en muestras del grupo (1). Los resultados demostraron áreas debajo de la curva (AUC) para los tres transcritos de biomarcadores individuales que varían de 0,66 a 0,90 (0,92 para transcritos sumados (V1: p <0,0001)) en muestras de pacientes con GEP-NEN (FIG. 27, que muestra los ROC para cada uno). La sensibilidad, especificidad, valor predictivo positivo y valor predictivo negativo para determinar la enfermedad de GEP-NEN usando los niveles de expresión del transcrito sumados fueron 96,1%; 90,2%; 83,3% y 97,9%, respectivamente. El uso de los puntos de corte predichos se probó en los dos conjuntos de prueba independientes (2) y (3). Las sensibilidades y especificidades para V1 oscilaron entre 95-97% y 81-87%. También se observó que el género no estaba asociado con niveles de expresión del transcrito (puntaje de Mann Whitney = 0,11, p = 0,19) detectados en sangre. El almacenamiento a -80°C no tuvo un efecto significativo en los niveles de expresión del transcrito de los 13 biomarcadores detectados (R = 0,987-0,996, p <0,0001),
Se detectaron los niveles de expresión del transcrito de biomarcadores de GEP-NEN, mantenimiento y sumados en 29 muestras de control y de paciente (Yale y Berlín), ensayadas en días separados en dos series de PCR separadas. La expresión del gen de mantenimiento ALG9 y el marcador FZD7 se correlacionaron altamente entre sí cuando se analizaron en días separados: R2: 0,92-0,97, p <0,0001 en dos análisis separados (FIG. 28A-B) y no se observaron diferencias significativas entre FZD7 normalizado en controles y muestras tumorales en días separados (FIG. 28C-D). La reproducibilidad intraensayo e interensayos fue alta para FDZ7 (C.V. = 2,28-3,95%) demostrando que las mediciones en sangre de genes objetivo son altamente reproducibles. Los resultados demuestran la reproducibilidad intraensayo e interensayos para la detección del biomarcador de GEP-NEN y de mantenimiento usando PCR en tiempo real sobre ARN obtenido de sangre completa.
Estos datos demostraron que la detección de niveles de expresión del transcrito del biomarcador de GEP en sangre completa puede usarse para identificar células de GEP-NEN circulantes (CNC), que los niveles de expresión detectados en sangre completa se correlacionan bien con los niveles de expresión del tejido y pueden identificar pacientes con GEP-NEN con alta sensibilidad y especificidad, y con alta reproducibilidad.
Ejemplo 5E: Detección de lesiones y respuesta al tratamiento
Para evaluar la utilidad del panel de genes de 51 marcadores tanto como técnica como firma GEP-NEN circulante para detectar estas lesiones, así como la respuesta al tratamiento, se estableció un conjunto de prueba de 130 muestras (controles: n = 67, GEP-NEN : n = 63 [enfermedad no tratada, n = 28, tratado, n = 35]). La PCR se realizó en todos los marcadores y los valores se normalizaron para ALG9 (∆∆CT), utilizando el grupo de control como control poblacional (muestra calibradora). El flujo de trabajo para identificar la utilidad del panel de marcadores incluyó la normalización (ANOVA identificó 39 de 51 genes que se expresarían diferencialmente en los 3 conjuntos) y las evaluaciones matemáticas con base en la máquina de soporte de la expresión génica .
Utilizando los cuatro algoritmos, se determinó una tasa de llamada correcta del 88% (FIG, 29), mientras que las medidas de desempeño se incluyen en la Tabla 10. Los datos de la prueba molecular para diferenciar muestras normales de GEP-NEN (ambos tratados y sin tratamiento) son los siguientes: sensibilidad global (94,0%), especificidad (85,7%), valor predictivo positivo (PPV) (87,5%) y valor predictivo negativo (NVP) (93,1%).
Tabla 10. Evaluación del desempeño de muestras normales que se distinguen de GEP-NEN
Normal (verdadero)
GEP-NEN (verdadero)
Normal (Predicho)
63 9
GEP-NEN (Predicho)
4 54
Usando el mismo panel de genes, se determinó que los GEP-NEN tratados y no tratados se podían distinguir con las siguientes medidas de desempeño (Tabla 11): Sensibilidad = 85,7%, Especificidad = 85,7%, PPV = 88,2% y NPV= 82,8%.
Tabla 11, Evaluación del desempeño para distinguir entre GEP-NEN tratados y no tratados
GEP-NEN tratados (Verdaderos)
GEP-NEN sin tratar (Verdaderos)
GEP-NEN tratados (Predichos)
30 4
GEP-NEN sin tratar (Predichos)
5 24
Para el desempeño general como una prueba para diferenciar los NEN de los controles, la tasa de llamadas fue del 94%, mientras que la capacidad para identificar las muestras tratadas fue del 85%.
Estos resultados indican que los protocolos de reconocimiento de patrones que permiten el análisis de la expresión
5 de 51 marcadores candidatos (como grupo) tienen utilidad para diferenciar entre "normales" o "GEP-NEN". Esto confirmó que los enfoques, por ejemplo, SVM usados en tejido tumoral, son aplicables al análisis de transcritos de sangre periférica e identificación de la enfermedad tumoral neuroendocrina.
Ejemplo 5F: Evaluación de la huella dactilar molecular como predictor de GEP-NEN
La eficacia de este panel de genes de 51 marcadores como posible prueba se examinó en cuatro conjuntos de datos
10 independientes para establecer si podía identificar correctamente GEP-NEN frente a los controles. Se construyeron cuatro conjuntos independientes: el conjunto independiente 1 incluyó 35 GEP-NEN y 36 controles; el conjunto independiente 2 incluyó 33 GEP-NEN y 31 controles; el conjunto independiente 3 incluyó 47 GEP-NEN y 24 controles; y el conjunto independiente 4 incluyó 89 GEP-NEN y ningún control,
Se evaluaron los cuatro algoritmos: SVM, LDA, KNN y Bayes por su utilidad para determinar si una muestra de
15 sangre era una GEP-NEN o un control en cada uno de los conjuntos independientes. Los resultados tabulados identificaron que las tasas de llamadas correctas generales (que identificaron tanto GEP-NEN como controles correctamente) oscilaban entre 56-68% en el conjunto independiente 1, 53-78% en el conjunto 2, 82-92% en el conjunto 3 y 48-74% en el conjunto 4 (Tabla 12), las tasas promedio sobre todos los conjuntos fueron 67-69% para SVM, LDA y Bayes; KNN obtuvo una puntuación más alta: 73%,
20 Tabla 12. Tasas de llamadas totales (porcentaje) para cada uno de los algoritmos en cada uno de los conjuntos independientes
SVM
LDA KNN Bayes
Conjunto 1
56 57 68 59
Conjunto 2
78 77 70 53
Conjunto 3
90 92 89 82
Conjunto 4
48 48 65 74
Promedio (%)
68 69 73 67
Un análisis adicional de las llamadas identificó si las tasas de llamadas correctas correspondían a la identificación de controles o muestras tumorales (Tabla 13). Las llamadas correctas más consistentes para los controles fueron los
25 algoritmos SVM (90% global) y LDA (91%). Las tasas más altas de llamadas correctas para GEP-NEN se identificaron con el algoritmo de Bayes (85%),
Tabla 13. Tasas de llamadas (porcentaje) para cada uno de los grupos, control o GEP-NEN, en cada uno de los conjuntos independientes
SVM
LDA KNN Bayes
CON
NEN CON NEN CON NEN CON NEN
Conjunto 1
97 14 97 17 97 37 33 86
Conjunto 2
73 70 77 76 58 82 3 100
Conjunto 3
100 85 100 87 100 83 88 79
Conjunto 4
NA 48 NA 48 NA 65 NA 74
Promedio (%)
90 54 91 57 85 67 41 85
NA = no aplica ( controles no incluidos en este conjunto)
Las sensibilidades, especificidades, valores predictivos positivos y valores predictivos negativos calculados para cada uno de los algoritmos en los 3 conjuntos independientes se incluyen en la Tabla 14,
Tabla 14, Medidas de desempeño para cada uno de los algoritmos en cada uno de los conjuntos independientes
SVM
LDA KNN Bayes
A
B C D A B C D A B C D A B C D
Conjunto 1
14 97 83 54 17 97 86 54 37 97 93 61 86 33 55 70
Conjunto 2
70 87 85 73 76 77 78 75 81 58 68 75 100 3 52 100
Conjunto 3
85 100 100 77 87 100 100 80 83 100 100 75 79 88 93 68
A=sensibilidad, B=especificidad, C=valor predictivo positivo, D=valor negativo predictivo, Conjunto 4 no tenía controles,
El algoritmo de Bayes fue el mejor para detectar GEP-NEN (sensibilidad = 83%), mientras que el algoritmo de SVM fue el mejor para determinar los controles (especificidad = 96%). La debilidad de Bayes es un falso positivo alto; la debilidad de SVM es que no funciona adecuadamente en los conjuntos de muestras que exhiben la mayoría de las muestras bien tratadas (enfermedad de remisión completa/estable).
Para el desempeño global como una prueba para diferenciar los NEN de los controles, los algoritmos SVM, LDA y KNN tenían valores predictivos positivos de ~ 90% y valores predictivos negativos de 70%.
Ejemplo 5G: Panel de genes de 51 marcadores para identificación de GEP-NEN
Para confirmar que el panel de genes de 51 marcadores era eficaz, se compararon las tasas de llamadas correctas para el panel en cada uno de los conjuntos independientes (Tabla 12) y se compararon con subconjuntos de 13 y 25 marcadores. El subconjunto de 13 marcadores estaba limitado a genes confirmados como predictivos de malignidad de GEP-NEN en tejido; el panel de 25 marcadores incluyó estos genes, así como otros 12 genes específicos de GEP-NEN identificados en la FIG. 20D. Examinando las llamadas correctas en cada uno de los 4 conjuntos independientes identificó que el panel de 51 marcadores funcionaba significativamente mejor que el panel de 13 o 25 marcadores (FIG. 30)
Estos resultados indican que una serie de protocolos de reconocimiento de patrones basados en los genes de 51 marcadores candidatos pueden distinguir entre muestras de control y GEP-NEN con alta eficacia y sensibilidad.
Ejemplo 5H: Detección de niveles de expresión del biomarcador de GEP-NEN en sangre completa, para evaluación de la respuesta terapéutica y la predicción de metástasis (comparación con CgA)
Se llevó a cabo la detección de los niveles de expresión del transcripto de biomarcadores de GEP-NEN sumados (panel de 13 biomarcadores) en sangre completa, antes y después de la intervención terapéutica (resección y octreótido LAR), demostrando la utilidad clínica de las realizaciones de los métodos y sistemas proporcionados. Además, la comparación con la detección de la expresión de CgA demostró una mejor sensibilidad de los métodos proporcionados en la detección de GEP-NEN, la determinación del riesgo y el control de las respuestas terapéuticas. CgA es un marcador de GEP-NEN de SI presente en 60-80% de los GEP NET como lo describen Modlin IM et al., Chromogranin A-Biological Function and Clinical Utility in Neuro Endocrine Tumor Disease, Ann Surg Oncol. 2010 Sep; 17(9): 2427-43. Epub 2010 Marzo 9.
Detección de biomarcadores de GEP-NEN después de intervención quirúrgica:
Nueve pacientes se sometieron a una resección metastásica hepática y de intestino delgado (lo que resulta en una
reducción de aproximadamente el 90% en el volumen del tumor). Los niveles de expresión de los 13 transcritos de biomarcadores de GEP-NEN sumados (APLP2, ARAF1, BRAF, CD59, CTGF, FZD7, Ki67, KRAS, NAP1L1, PNMA2, RAF1, TPH1, VMAT2) se determinaron como se describió anteriormente usando PCR en tiempo real en muestras preparadas a partir de muestras de sangre completas, tomadas un día antes de la cirugía y luego dos semanas después de la operación.
Los resultados se muestran en la FIG. 31 (barras horizontales que representan los niveles medios de expresión antes y después de la cirugía). Dos semanas después de la cirugía, los niveles de expresión sumados (como se describió anteriormente) de los niveles de Biomarkers de GEP-NEN se redujeron significativamente (de una media de 84 antes de la cirugía a una media de 19 después de la cirugía, más del 75% de reducción, con p <0,02) (FIG. 31A). Como se muestra en la FIG. 31B, la detección de los niveles de expresión de CgA solos no mostró una disminución significativa (reducción del 20% en la expresión media).
Estos resultados demuestran que los niveles de expresión de biomarcadores detectados con los métodos y sistemas proporcionados reflejan con precisión la eliminación del tumor y pueden usarse para evaluar la capacidad de respuesta y la eficacia de la intervención quirúrgica.
Detección de biomarcadores de GEP-NEN después de terapia con el fármaco análogo de somatostatina (Sandostatina LAR® (inyección de acetato de octreótido)).
Los niveles de expresión sumados (como se describió anteriormente) para los trece biomarcadores también se detectaron en ocho muestras de pacientes mediante PCR en tiempo real, antes, un mes después y dos meses después del tratamiento con Sandostatina LAR® (inyección de acetato de octreótido), un análogo de somatostatina. Los resultados se muestran en la FIG. 32.
Los resultados mostraron una reducción significativa (p = 0,017) en la expresión de los transcritos de biomarcadores sumados un mes después del tratamiento continuo. Después de seis meses de tratamiento continuo, los niveles de transcritos se redujeron en un 50% adicional (p = 0,06 frente a 1 mes) y estaban en el intervalo normal (FIG. 32A). Por el contrario, no se observó un cambio significativo en los niveles de expresión de CgA, solo, un mes después del tratamiento con LAR® (FIG. 32B); en este estudio, los niveles detectados de expresión de CgA solo disminuyeron 6 meses después. Estos resultados muestran que, en cuanto a la intervención quirúrgica, los sistemas y métodos proporcionados para la detección de biomarcadores pueden usarse para controlar el tratamiento con LAR®, proporcionando una mayor sensibilidad en comparación con la detección de un único biomarcador de GEP-NEN individual, por ejemplo, CgA.
Detección temprana de micrometástasis de bajo volumen y evaluación de la eficacia del tratamiento en pacientes individuales
Se controlaron los niveles de expresión de los 13 biomarcadores de GEP-NEN sumados (como se describió anteriormente) para evaluar la eficacia del tratamiento y predecir el riesgo en dos pacientes individuales, tratados con crioablación y resección metastásica hepática, respectivamente.
El paciente SK, un hombre de 63 años, con GEP-NEN metastásico de intestino delgado (SI) fue evaluado como normal por radiocirugía estereotáctica (SRS)/tomografía computarizada (CT), y se consideró libre de enfermedad. Se evaluó expresión resumida de transcritos en sangre completa usando PCR en tiempo real como se describió anteriormente. Los resultados, presentados en la FIG. 33, mostraron niveles de expresión normales de CgA. Por el contrario, se evaluaron los niveles de expresión sumados del panel de 13 biomarcadores de GEP-NEN (APLP2, ARAF1, BRAF, CD59, CTGF, FZD7, Ki67, KRAS, NAP1L1, PNMA2, RAF1, TPH1, VMAT2) ("PCR(+)") (FIG. 33). Con base en esta información, el paciente se sometió a 11C-PET-CT en Suecia, demostrando que tenía una metástasis hepática de aproximadamente 0,5 cm. Posteriormente, el paciente se sometió a crioablación, que libera tejido de GEP-NEN para su entrada en la sangre, induciendo síntomas, como lo describe Mazzaglia PJ, et al., "Laparoscopic radiofrequency ablation of neuroendocrine liver metastases: a 10-year experience evaluating predictors of survival," Surgery 2007; 142(1): 10-9.
Los niveles de expresión se controlaron mensualmente durante seis meses después de la crioablación, mediante PCR en tiempo real en ARN preparado a partir de sangre completa. Los resultados demostraron niveles de expresión elevados del panel de biomarcadores, pero no de CgA solo, después de la crioablación. Entre cuatro y cinco meses después de la crioablación, se identificaron micrometástasis óseas; la PCR demostró la aparición de estas micrometástasis correlacionadas con niveles elevados de expresión del transcrito del panel de biomarcadores de GEP-NEN; la expresión de CgA sola se detectó como normal. Después de terapia con LAR® (que bloquea la secreción y la proliferación de células de GEP-NEN), se determinaron los niveles de expresión del panel de biomarcador en la sangre para normalizar (PCR en tiempo real),
Este estudio demuestra que la detección de paneles de biomarcadores de GEP-NEN mediante los métodos
proporcionados puede reflejar con precisión eventos asociados a GEP-NEN agudos, lo que demuestra la sensibilidad implícita de los métodos proporcionados (por ejemplo, en comparación con la detección de un biomarcador disponible, CgA solo) y sistemas para detectar biomarcadores de GEP-NEN en el análisis predictivo y de pronostico y la evaluación de la eficacia del tratamiento y la detección de recaídas o enfermedad en estadio temprano, particularmente cuando la enfermedad está limitada a micrometástasis raras.
Paciente BG, una mujer de 69 años con GEP-NEN metastásico del intestino delgado, Grado T2N1M1, se sometió a resección quirúrgica del intestino delgado y metástasis hepática, seguida de 9 meses de tratamiento con Octreotide LAR®. Se controlaron los niveles de expresión de CgA y los 13 biomarcadores de GEP-NEN ("PCR (+)") mediante PCR en tiempo real en muestras de sangre completa como se describió anteriormente, antes de la cirugía, dos semanas después de la operación y mensualmente durante doce meses. Todos los síntomas se resolvieron después de doce meses de tratamiento. Como se muestra en la FIG. 34, la detección de niveles de expresión de CgA solo reveló fluctuaciones dramáticas no correlacionadas con el tratamiento o la reducción de los síntomas. Los niveles de expresión del panel de biomarcadores ("PCR(+)"), por el contrario, se detectaron como significativamente reducidos después de la extirpación quirúrgica del tumor, medidos dos semanas después de la operación, y se redujeron significativamente después del tratamiento con LAR®, quedando reducidos a los doce meses (en cuyo momento todos los síntomas quedaron resueltos).
Este estudio demuestra que la detección de paneles de biomarcadores de GEP-NEN mediante los métodos proporcionados puede reflejar de forma sensible la gravedad de la enfermedad y la capacidad de respuesta al tratamiento, proporcionando una mejora sobre los métodos de detección de biomarcadores disponibles. Los métodos y sistemas proporcionados son útiles para controlar la respuesta al tratamiento y la recaída, y pueden detectar tanto la presencia (FIG. 33) como la ausencia (FIG. 34) de la enfermedad de GEP-NEN con alta fidelidad. Estos resultados demuestran que la detección de los biomarcadores proporcionados en sangre proporcionan un valor diagnóstico y de tratamiento agregado, por ejemplo, como marcadores sustitutos de la eficacia del tratamiento para controlar los efectos de la cirugía (eliminación de tumores) o terapia médica dirigida (inhibición de la secreción/proliferación de tumores). Véase Arnold R, et al, "Placebo-controlled, double-blind, prospective, randomized study of the effect of octreotide LAR in the control of tumor growth in patients with metastatic neuroendocrine midgut tumors: A report from the PROMID study group," ASCO 2009, Gastrointestinal Cancers Symposium, Abstract #121. 2009.
Ejemplo 6: Evaluación de la huella digital molecular como indicador de la eficacia del tratamiento
La eficacia de este panel de genes 51 marcadores como prueba potencial se examinó en los cuatro conjuntos de datos independientes para establecer si podía diferenciar entre los tumores que respondían al tratamiento (aquellos que estaban clínicamente categorizados como en remisión completa o que presentaban enfermedad estable) y sin tratamiento (sin tratamiento previo) o sin respuesta (clínicamente categorizado como "progresivo"). Además, se evaluó un subconjunto de 13 marcadores del panel de genes de 51 marcadores para determinar si podría usarse para proporcionar información adicional con respecto a la respuesta a la terapia, específicamente si podría proporcionar información más específica sobre la enfermedad progresiva no tratada en comparación con la enfermedad estable.
El conjunto independiente 1 incluyó 35 GEP-NEN. Los detalles clínicos completos estaban disponibles para todos los pacientes; 33 de las muestras se consideraron en remisión completa o tenían enfermedad estable. Sesenta por ciento de las muestras estaban bajo tratamiento (predominantemente con LAR: 96%).
El conjunto independiente 2 incluyó 32 GEP-NEN. Los detalles clínicos completos estaban disponibles para todos; 28 de las muestras se consideraron en remisión completa o tenían enfermedad estable. El 84% de las muestras estaban en tratamiento (LAR: ~ 40%, cirugía ~ 25%).
El conjunto independiente 3 incluyó 47 NEN. Los detalles clínicos completos estaban disponibles para todos; 30 de las muestras se consideraron en remisión completa o tenían enfermedad estable. El 56% de las muestras estaban bajo tratamiento (LAR: ~ 75%).
El conjunto independiente 4 incluyó 89 GEP-NEN. Los detalles clínicos completos estaban disponibles para todos los pacientes; 71 de las muestras se consideraron en remisión completa o tenían enfermedad estable. El 46% de las muestras estaban bajo tratamiento (predominantemente LAR: 85%).
Se evaluaron los cuatro algoritmos: SVM, LDA, KNN y Bayes con respecto a la utilidad para determinar si una muestra de sangre estaba asociada con un fenotipo "tratado" (enfermedad clínicamente sensible/estable) o podría identificar una enfermedad no tratada/progresiva. Se consideró que las muestras tumorales llamadas "normales" o "tratadas" exhibían un fenotipo "tratado" o clínicamente sensible ("que responde al tratamiento"). Aquellos considerados "no tratados" se clasificaron como no sensibles (o "que no responden al tratamiento"). Los algoritmos como grupo (algoritmo de "escrutinio") fueron examinados por su utilidad e incluyen tasas de llamadas correctas de
los mejores 3 de 4 algoritmos.
Los resultados tabulados indican que las tasas de llamadas correctas generales (que identifican las muestras apropiadamente tratadas y las que no responden) fueron 73-94% en el conjunto independiente 1, 81-89% en el conjunto 2, 82-94% en el conjunto 3 y 72-94% en el conjunto 4 (Tabla 15). Las tasas promedio fueron 83-88% para cada uno de los algoritmos. Una combinación, mejores "3 de 4", dio como resultado una tasa de llamadas correcta similar (88%).
Tabla 15, Tasas de llamadas totales (%) para cada uno de los algoritmos en cada uno de los conjuntos independientes
SVM
LDA KNN Bayes Mejores 3 de 4
Conjunto 1
89 89 94 94 94
Conjunto 2
88 88 88 88 88
Conjunto 3
83 85 89 72 88
Conjunto 4
73 81 82 82 82
Promedio (%)
83 86 88 84 88
10 Un análisis adicional de las llamadas identificó si las tasas de llamadas correctas correspondían a la identificación de pacientes clínicamente sensibles o muestras de aquellos individuos que no respondían al tratamiento (Tabla 16).
Tabla 16. Tasas de llamadas (%) para cada uno de los grupos, clínicamente sensibles o que no responden, en cada uno de los conjuntos independientes
SVM
LDA KNN Bayes
SENS
NO SENS NO SENS NO SENS NO
Conjunto 1
94 0* 94 0* 100 0* 100 0*
Conjunto 2
100 0* 100 0* 100 0* 100 0*
Conjunto 3
91 73 94 80 97 73 75 67
Conjunto 4
83 83 82 77 90 50 96 39
Promedio (%)
92 78 90 79 97 62 93 53
* = excluido del análisis ya que solo dos de los cuatro pacientes se clasificaron como "que no responden al tratamiento" en cada uno de los dos conjuntos
15 La mayoría de llamadas correctas consistentes para "los que responden al tratamiento" se identificaron con el algoritmo KNN (~97%). Las tasas de llamadas correctas más altas para los "que no responden al tratamiento" fueron los algoritmos SVM y LDA (~ 80%),
Las sensibilidades, especificidades, valores predictivos positivos y valores predictivos negativos calculados para cada uno de los algoritmos en los 3 conjuntos independientes se incluyen en la Tabla 17.
20 Tabla 17, Medidas de desempeño para cada uno de los algoritmos en cada uno de los conjuntos independientes
SVM
LDA KNN Bayes
A
B C D A B C D A B C D A B C D
Conjunto 1
97 0 97 0 97 0 97 0 100 0 100 0 100 0 100 0
Conjunto 2
88 * 100 0 88 * 100 0 88 * 100 0 88 * 100 0
Conjunto 3
100 62 86 100 96 86 94 92 97 85 94 92 89 55 76 77
Conjunto 4
95 56 83 83 94 52 82 77 88 56 90 50 85 88 98 39
(continuación)
SVM
LDA KNN Bayes
A
B C D A B C D A B C D
A
Promedio
95 39 92 46 94 46 93 42 93 47 96 36 90 48 94 29
SENS = sensibilidad SPEC = especificidad, PPV = valor predictivo positivo, NPV = valor negativo predictivo, * sin valor (no pudo ser calculado)
Los algoritmos SVM, LDA y KNN se comportaron mejor para detectar pacientes que se consideraron en remisión completa o que mostraban una enfermedad estable (sensibilidad = 93-95%). El algoritmo SVM también fue el algoritmo más sensible para detectar individuos con enfermedad no tratada o progresiva (80%). La combinación, mejor "3 de 4", dio como resultado una tasa promedio de llamadas del 99% para determinar la remisión/estabilidad de la enfermedad y el 75% para detectar enfermedad no tratada o progresiva.
Los mejores algoritmos para diferenciar muestras sensibles al tratamiento de aquellos clasificados como que no responden al tratamiento fueron LDA y KNN con PPV de ~98% y NVP de ~92%.
A continuación, se examinó la asociación entre descripción clínica y puntajes basados en PCR. Para delinear grupos individuales, se usaron los siguientes descriptores:
"Remisión completa" = todas las investigaciones negativas;
"Enfermedad estable después de cirugía" = investigaciones anormales pero sin cambio en la evaluación serial; y
"Enfermedad estable después de cirugía + LAR" = investigaciones anormales pero sin cambio en la evaluación serial,
Análisis por criterios clínicos (examen, bioquímica, exploración) de todas las muestras tratadas en los 4 conjuntos independientes como grupo identificado:
1) Pacientes considerados en remisión completa (es decir, después de la cirugía para la extirpación de un tumor apendicular (n = 3) o una hemicolectomía para una NEN ileocecal <1,5 cm sin metástasis a ganglios linfáticos (n = 8)
o metástasis a menos de dos ganglios linfáticos (n = 2) fueron identificados correctamente en 100% de los casos mediante los algoritmos (FIG. 35). Las 13 muestras fueron llamadas "normales" por el algoritmo.
2) Pacientes considerados como de enfermedad estable (después de cirugía para la extirpación del tumor (hemicolectomía: n = 24, gastrectomía: n = 1, apendicectomía: n = 3, hemicolectomía y resección hepática: n = 7, resección ileal/colónica: n = 3, hemicolectomía, resección hepática y disección del ganglio linfático: n = 2, embolización: n = 2) fueron correctamente llamados (llamado tumor "tratado" por los algoritmos matemáticos) en el 95% de los casos (40/42) (FIG, 35).
3) Pacientes considerados como con enfermedad estable después de la terapia con fármacos (análogo de somatostatina de acción prolongada (NEN de SI = 72, PNEN = 13, NEN rectal = 2, NEN gástrico = 2), Pasireotida (NEN de SI = 1) o RAD001 (NEN de SI = 4) fueron correctamente llamados en el 90% de los casos (70/78) (FIG, 35).
Ejemplo 7: Uso de un subconjunto de un panel de genes de un panel de 13 marcadores para evaluar las respuestas a la enfermedad
Se evaluó un subconjunto de genes que estaban altamente correlacionados con la enfermedad progresiva no tratada para determinar si podían usarse para definir más a los grupos de pacientes y usarse para proporcionar información adicional con respecto a la respuesta al tratamiento, particularmente en pacientes sometidos a tratamiento pero considerados como "progresivos".
Un análisis de muestras clínicas en el conjunto de prueba identificó 13 genes sobreexpresados selectivamente en el
grupo progresivo no tratado en comparación con los que se considera que exhiben una enfermedad estable. Los genes identificados fueron: AKAP8L, BRAF, CD59, COMMD9, Ki67, MORF4L2, OAZ2, RAF1, SST1, SST3, TECPR2, ZFHX3 y ZXDC. La inclusión de estos genes en un algoritmo dio como resultado tasas de llamadas correctas para diferenciar la enfermedad estable de la progresiva en ~ 73% de los casos en el conjunto de prueba (FIG, 36).
Un análisis de este panel de genes en los conjuntos independientes 1-4 (como grupo; enfermedad progresiva, independientemente del tratamiento: n = 26 [50% de los pacientes en tratamiento, 50% de tratamiento detenido porque se considera intratable]; enfermedad estable: n = 143) identificó que la tasa de llamada correcta para muestras de pacientes que se considera que presentan enfermedad "progresiva" fue del 65% (KNN). Las sensibilidades, especificidades, PPV y NPV para los cuatro algoritmos diferentes en este grupo fueron 34-65%, 96100%, 64-100% y 89-94%, respectivamente. El mejor algoritmo para detectar una enfermedad "progresiva" fue KNN; el mejor algoritmo para detectar una enfermedad "estable" fue SVM. Esto indica que un subconjunto de un panel de 13 marcadores es útil como un complemento al panel de 51 marcadores, particularmente para identificar GEP-NEN que no responden a la terapia y se consideran clínicamente "progresivos".
Estos enfoques demuestran que la capacidad de respuesta del tratamiento puede definirse con precisión mediante el panel de 51 marcadores en un 90-100%. Las muestras que se consideran clínicamente progresivas y, por lo tanto, no responden a la terapia (por ejemplo, LAR o everolimus) pueden identificarse en un 65-80%.
Ejemplo 8: Comparación del panel de genes de 51 marcadores con niveles de cromogranina A en plasma para la predicción de la enfermedad
La utilidad del enfoque basado en PCR se comparó con los niveles de cromogranina A medidos en plasma para identificar los GEP-NEN y diferenciar entre muestras tratadas y no tratadas.
CgA es ampliamente utilizado como un marcador NEN generalizado y niveles elevados generalmente se consideran sensibles, ~70-90% de precisión como marcador para GEP-NEN. Las mediciones de este péptido, sin embargo, son inespecíficas (10-35% de especificidad) ya que también se encuentran elevadas en otras neoplasias, por ejemplo, neoplasias pancreáticas y de pulmón de células pequeñas y carcinomas de próstata, así como en una variedad de enfermedades cardíacas e inflamatorias, mediante el uso de inhibidores de la bomba de protones y en insuficiencia renal. CgA es un componente de la secreción de células neuroendocrinas, no de proliferación, y por lo tanto su uso como un sustituto para el crecimiento tumoral tiene limitaciones significativas evidentes. En general, la sensibilidad de este biomarcador para predecir GEP-NEN depende del grado de diferenciación del tumor, la ubicación del tumor y si es metastásico o no. A pesar de las correlaciones moderadas entre los niveles de CgA y la carga tumoral hepática, la baja sensibilidad (<60%) para detectar metástasis, la ausencia de una estandarización de la medición en los EE. UU., así como aquella de la FDA no acepta CgA como un biomarcador compatible, es actualmente el único marcador "rutinariamente" utilizado para evaluar la eficacia del tratamiento (cirugía, trasplante de hígado, bio/quimioterapia, quimio/embolización, ablación por radiofrecuencia), los niveles de CgA fueron por lo tanto usados como el mejor equivalente disponible de un "estándar dorado" contra el cual evaluar la prueba basada en PCR.
Los valores de CgA se midieron usando el kit ELISA DAKO en el conjunto de prueba inicial de 130 muestras (controles: n = 67, GEP-NEN: n = 63 [enfermedad no tratada, n = 28, tratada, n = 35]) usado para desarrollar el panel de genes de 51 marcadores. El kit DAKO es reconocido en la técnica para detectar CgA en muestras de plasma de GEP-NEN.
Los niveles de CgA se evaluaron (p <0,05) tanto en GEP-NEN sin tratar (63%) como tratados (32%) usando ya sea la prueba t de Student (FIG. 37A) o pruebas no paramétricas (Fig. 37B).
La eficacia de CgA para identificar GEP-NEN en comparación con los controles identificó una tasa de llamadas correcta del 74% (Tabla 18). La eficacia para identificar correctamente un GEP-NEN, independientemente del tratamiento, fue menor a ~ 45%.
Tabla 18: Capacidad de diagnóstico de los niveles de CgA para discriminar los controles de todos los GEP-NEN (tratados y no tratados),
Normal (Verdadero)
GEP-NEN (Verdaderos)
Normal (Predicho)
65 30
GEP-NEN (Predichos)
2 26
93%,
DAKO usa un corte de 19 Unidades/L como el límite superior de la normalidad. Utilizando este valor, se consideraron positivos un total de 25 (45%) de 56 GEP-NEN en comparación con 1 (1,4%) de 67 controles para la medición del desempeño de Sensibilidad = 45%, Especificidad = 98%, PPV = 96% y NPV = 68% (FIG. 38). La tasa de llamadas correcta para este corte fue del 70%.
Utilizando niveles de CgA con la expresión del transcrito de PCR (panel de 51 marcadores) se evaluó a continuación por la capacidad para proporcionar un valor adicional a las predicciones. La inclusión de los niveles de CgA no aumentó la capacidad de predicción de los genes marcadores, y redujo la eficacia, particularmente del clasificador KNN (FIG. 39A-B). Se concluyó que la inclusión de los niveles de CgA no mejora la calidad del panel de genes de marcadores candidatos.
Estos resultados demuestran que la cuantificación de una firma molecular de múltiples transcritos circulantes (transcritos de tumores) es más sensible que la medición de una sola proteína circulante (CgA). La inclusión de la medición de CgA en la huella digital molecular no proporciona ningún valor predictivo "añadido".
Ejemplo 9: Comparación del panel de genes de 51 marcadores con niveles de cromogranina A en plasma para la evaluación de la eficacia de la enfermedad
La utilidad del enfoque basado en PCR se comparó directamente con los niveles de CgA medidos en plasma para identificar GEP-NEN y diferenciar entre muestras tratadas y no tratadas. Los análisis de la eficacia de CgA para diferenciar entre los GEP-NEN tratado y no tratados identificaron que la tasa de llamadas correctas fue del 66% (Tabla 19). Las medidas de desempeño fueron: Sensibilidad = 69%, Especificidad = 63%, PPV = 67% y NPV = 65%.
Tabla 19: Capacidad de diagnóstico de los niveles de CgA para discriminar entre muestras de GEP-NEN no tratadas y tratadas
Tratadas (Verdaderas)
No tratadas (verdaderas)
Tratadas (Predichas)
20 10
No tratadas (Predichas)
9 17
Casos ilustrativos
Para facilitar el uso clínico, se desarrolló un sistema de puntuación basado en las llamadas del algoritmo matemático. Esta es una puntuación de "Distancia" que mide la distancia euclidiana de una muestra desconocida a los perfiles de expresión génica de las diferentes llamadas "Normal" versus "Tumor" y "Tratada" versus "No tratada". Un puntaje bajo: 0-25 convierte a "normal", 26-50 es "tumor tratado" (o estable) y 51-100 es "tumor no tratado". Esto proporciona una visualización amigable para el médico ya que está claro dónde cae el valor de un paciente individual en el espectro de la enfermedad (diagnóstico de "normal" frente a "tumor" y la interpretación clínica de "tratado" frente a "no tratado"). También brinda la oportunidad de graficar cómo el tratamiento influye en el índice de transcritos de la enfermedad. Se proporciona un ejemplo en la FIG. 40. Estos términos y puntajes se usan para los casos ilustrativos individuales que se proporcionan a continuación.
Caso índice 1: NEN apendicular identificado incidentalmente, con desarrollo posterior de una metástasis mesentérica
JPP (hombre de 45 años con hipertensión y esplenectomía previa [1998]), se sometió a hemicolectomía izquierda por un absceso y perforación [12/2009]. En la cirugía, se identificó un NEN de 0,8 cm bien diferenciada con invasión linfática y extensión al mesoapéndice [T? N1M1]. El tumor exhibió una baja capacidad proliferativa: Ki67 <2% y recuento mitótico <1/10HPF). Una resonancia magnética (1/2010) identificó implantes mesentéricos residuales y cirugía repetida (4/2010) para el cierre de la colostomía. En ese momento, se eliminó una metástasis de ganglio linfático mesentérico (<1 cm) (Ki67 <2%).
La prueba de PCR es más sensible que CgA para identificar enfermedad residual (no tratada) (diagnóstico = "tumor", interpretación = "no tratada", puntaje PCR 68) y para demostrar la extirpación quirúrgica de la metástasis (diagnóstico = "tumor", interpretación = "tratado", puntaje PCR 40). La identificación de que la prueba PCR en sangre no revertió hasta una llamada de "Normal" después de la escisión quirúrgica indica la presencia de enfermedad
5 metastásica residual (la puntuación de PCR permanece por encima de lo normal: ~40), ya que el valor de PCR no ha cambiado entre 2010 y 2011 para un fenotipo "no tratado" es probable que la enfermedad sea clínicamente "estable".
Caso índice 2: NEN de SI, resección quirúrgica,
BA (mujer de 65 años, antecedentes de enfermedad arterial coronaria, diabetes tipo II y glaucoma exhibidos con
10 anemia en 1996 y 2006, la colonoscopia y tomografía computarizada identificaron un NEN ileal terminal [5/2009], se sometió a una hemicolectomía derecha (2)/2010) para la remoción de un NEN de SI de 1 cm que mostró invasión linfática pero no hubo ganglios positivos [T1N0M0]. El tumor exhibió un índice proliferativo bajo: Ki67 = 2% y recuento mitótico <2/10HPF).
Tabla 21
Mayo 09
Noviembre 09 Cirugía Febrero 10 Marzo 10
Prueba PCR
Puntaje 61 30 26
Diagnóstico
TUMOR TUMOR TUMOR
Interpretación
Sin tratar Tratada Tratada
ELISA de CgA
Valor 15,5U/L 7,8U/L 17U/L
Llamada
NML NML ABNML
PROCEDIMIENTO
Endoscopia & Tomografía computarizada: NEN ILEAL Hemicolectomía derecha de lesión bien diferenciada de 1 cm, Ki67<2%
Puntaje PCR: 0-100 (0-25=normal, 26-50=tratado; 51-100=enfermedad no tratada); Diagnóstico = interpretación = tratado versus no tratado. Valores de CgA: Unidades/litro (U/L) (DAKO ELISA) ABNML = anormal (elevado); NML = intervalo normal
normal o tumor.
La prueba PCR identifica una masa pequeña, NEN de intestino delgado de baja proliferación (diagnóstico = "tumor", interpretación = "no tratada", puntaje PCR 61). La identificación de que la prueba PCR en sangre no revertió a una llamada de "Normal" después de la escisión quirúrgica indica la presencia de enfermedad residual (puntaje PCR 2630) lo que sugiere una resección incompleta (no R0).
20 Caso índice 3: NEN rectal metastásico (extirpación endoscópica), metástasis hepática pan-segmentaria, tratada con LAR
AJ (hombre de 47 años, con NEN rectal incidentalmente identificado (en endoscopia-5/2010)), se observaron metástasis hepáticas pansegmentarias extensas en el seguimiento (CT/MRI 6/2010), se inició con Sandostatina [7/2011]. Se realizó una resección quirúrgica para enfermedad residual (metástasis primaria y en ganglios linfáticos
25 rectales) con eliminación de 2 metástasis hepáticas [10/2010], se identificó, metástasis en ganglios linfáticos rectales de 1,5 cm, con Ki67 <15%. Las metástasis hepáticas tenían un Ki67 ~3% (T2N1M1). Se realizó una cirugía posterior [2/2011] para cerrar la ileostomía y eliminar las metástasis hepáticas adicionales. Las imágenes seriales de MRI no mostraron cambios en la carga hepática. Se continuó con Sandostatina.
La prueba de PCR identifica metástasis hepáticas así como enfermedad residual de una lesión no funcional (no secretora) (diagnóstico = "tumor", interpretación = "sin tratar", puntaje PCR 78). La prueba de PCR es más efectiva que la CgA tanto para identificar la enfermedad como para controlar la respuesta al tratamiento. El fracaso de la prueba de PCR para revertir a una llamada de "Normal" es consistente con la presencia de metástasis hepáticas.
5 Los valores no han cambiado entre 2010 y 2011 a un fenotipo "no tratado" lo que sugiere que la enfermedad es "estable". Este hallazgo (puntaje PCR: 26-44) es consistente con los protocolos de imagenología actuales que demuestran una enfermedad estable no progresiva.
Caso índice 4: NEN metastásico de SI, metástasis hepáticas pansegmentarias, tratadas con hemicolectomía, disección de ganglios linfáticos y resección hepática y LAR
10 BG (mujer de 71 años, inicialmente identificada con nódulos hepáticos y masa mesentérica de ~4 cm (positiva para octreoscan) confirmó ser un carcinoma neuroendocrino bien diferenciado (por biopsia hepática) [9/2008]. Se sometió a resecciones de cuña ileal y hepática [12/2008]. Se eliminó un nódulo mesentérico de 8 cm que era un NEN de 1,5 cm, mientras que 6/9 ganglios linfáticos fueron positivos para metástasis. El tumor tenía una capacidad proliferativa baja, conteo mitótico = 2/10hpf, Ki67 <2 % (T2N1M1). El Octreótido se inició en 2/2009 con cierto control de los
15 síntomas, pero se observó un aumento de la incomodidad en el cuadrante superior derecho. Octreoscan [4/2010] identificó varias lesiones hepáticas pequeñas con lesiones adicionales confirmadas en 2/2011 (Octreoscan), se sometió a ERCP y esfinterotomía [4/2011] y colecistectomía [6/2011].
La prueba de PCR identifica una enfermedad extensa (diagnóstico = "tumor", interpretación = "no tratada", puntuación de PCR 70). Dado que la prueba de PCR en sangre (puntaje de PCR 27-35) no revertió a "Normal" después de la cirugía, el resultado es consistente con metástasis residuales. los resultados de CgA fueron menos efectivos que la prueba de PCR tanto para identificar la enfermedad como para controlar la respuesta al tratamiento.
5 Caso índice 5: Metástasis hepática recurrente (después de la hepatectomía), tratada con LAR y embolización
SK (hombre de 64 años, con antecedentes de fibrilación auricular, hiperlipidemia y cálculos renales). NEN de SI diagnosticado [12/2001] después de desarrollar rubor. Se sometió a una resección del tumor ileal y de metástasis hepática. Cirugías posteriores incluidas nueva resección de una masa ganglionar mesentérica [3/2005] y ganglios linfáticos [9/2006]. En [12/2008] crioablación para una metástasis de hígado. La tomografía PET [4/2009] identificó
10 pequeños nódulos hepáticos y una lesión ósea. Comenzó la Sandostatina [6/2009], repetición de tomografías [PET y MRI] no identifican nuevas lesiones.
La prueba de PCR identificó recurrencia de la enfermedad (diagnóstico = "tumor", interpretación = "no tratada", puntaje PCR 63), demostró eficacia de la crioablación y detectó enfermedad residual. Debido a que la prueba de PCR en sangre no revertió a una llamada de "Normal", este resultado se consideró evidencia de metástasis que fueron identificadas por 13C-PET (puntaje PCR 49). Los resultados de CgA fueron menos efectivos que la prueba de PCR tanto para identificar la enfermedad como controlar la respuesta al tratamiento.
Ejemplo 10: Utilidad de la firma molecular para diferenciar subtipos de GEP-NEN de (NEN de intestino delgado versus pancreáticos)
El panel de genes de 51 marcadores se usó para examinar la capacidad para distinguir GEP-NEN de los controles y para diferenciar si una muestra es de un paciente que responde al tratamiento en comparación con un individuo que no responde o que no ha recibido tratamiento previamente. El panel marcador fue desarrollado en torno a la información derivada de microarreglos de sangre y tejido NEN del intestino delgado. Aunque las medidas de desempeño son significativamente mejores que para ELISA de CgA, fue un objetivo de este trabajo establecer si la prueba podría diferenciar entre GEP-NEN de dos sitios diferentes, es decir, intestino delgado y páncreas. Esto es relevante en el caso de un tumor de ubicación primaria desconocida y también relevante ya que los tumores muestran pronósticos significativamente diferentes dependiendo de su sitio de origen. La supervivencia de 5 años de un NEN de SI es ~ 80% y ~ 50% de la mortalidad no es específica de la enfermedad, por el contrario, la supervivencia a 5 años de un PNEN es ~ 40% y ~ 95% de los pacientes que murieron a causa de la enfermedad. La determinación de la ubicación de un NEN primario conocido puede por lo tanto ser una variable importante en la determinación de la terapia; los análogos de somatostatina han demostrado utilidad en 9 NEN de SI mientras que sunitinib y everolimus tienen eficacia en PNEN_ENREF_10,
El examen del panel de genes de 51 marcador identificó que exhibía una varianza de expresión mucho más grande (0,54 ± 0,4 frente a 0,38 ± 0,14 en NEN de SI) lo que indica que los genes seleccionados en el panel no eran tan específicos para PNEN como para NEN de SI, el mapeo de la expresión identificó que los tumores estaban espacialmente separados (FIG, 41A).
Además, la expresión en el panel podría diferenciarse con un 92% de precisión entre los dos sitios tumorales (FIG. 41B). La prueba puede diferenciar con precisión entre un tumor de páncreas y uno de intestino delgado.
Ejemplo 11: Capacidad del panel de genes de 51 marcadores para discriminar entre GEP-NEN y Cánceres GI
Para evaluar adicionalmente la utilidad de este enfoque basado en PCR, se examinó la huella digital molecular en adenocarcinomas gastrointestinales, tales como cánceres gástricos y hepáticos (esofágico: n = 2, pancreático: n = 11, vesícula biliar: n = 3, colon: n = 10, rectal: n = 7). Esto se hizo para evaluar si algunos genes, por ejemplo, KRAS, BRAF, Ki67 sobreexpresados en adenocarcinoma GI e incluidos en el panel, podrían perturbar la precisión.
El examen del panel de genes de 51 marcadores identificó que exhibía una mayor varianza de la expresión (0,5 ± 0,25 frente a 0,44 ± 0,17 en GEP-NEN) lo que indica que los genes específicos de NEN seleccionados en el panel fueron menos específicos para cánceres GI que para GEP-NEN. PCA identificó que los tumores estaban espacialmente separados (FIG. 42A) y que el panel de NEN podía diferenciarse con un 83% de precisión entre GEP-NEN y cánceres GI (FIG. 42B).
La prueba tiene por lo tanto, el poder de diferenciar entre GEP-NEN y cánceres GI y la firma molecular circulante de los NEN es diferente a aquella de los adenocarcinomas GI. La superposición menor es consistente con la observación de que ~ 40% de los adenocarcinomas GI exhiben elementos neuroendocrinos.
Una comparación directa de la prueba molecular y ELISA de CgA identificó que el método basado en PCR tenía una tasa de llamada significativamente más precisa en comparación con la medición de los niveles de CgA (χ2 = 12,3, p <0,0005) (FIG. 43 )
Las sensibilidades fueron similares para detectar un GEP-NEN (94% versus 97%) pero la especificidad de la prueba de PCR fue mayor que CgA (85% versus 46%). Para diferenciar las muestras tratadas frente a las no tratadas, la prueba basada en PCR exhibió medidas de desempeño más altas (85% versus ~ 65%).
CgA es menos útil que la huella molecular circulante para definir el "tratamiento" en GEP-NEN. Esto refleja el hecho de que la proteína (CgA) es un producto secretor constitutivo de todas las células neuroendocrinas y no tiene una relación biológica específica con los tumores neuroendocrinos, su tasa de proliferación o su metástasis.
A lo largo de esta solicitud, se hace referencia a varios contenidos de sitios web, publicaciones, solicitudes de patente y patentes. (Los sitios web son referenciados por su localizador uniforme de recursos o URL o direcciones en la Web).
Diversas modificaciones a los modelos y métodos de la invención, además de aquellas descritas en este documento,
serán evidentes para los expertos en la materia a partir de la descripción y las enseñanzas anteriores, y se pretende que entren de manera similar dentro del alcance de la invención dentro de los límites definidos por el texto de las reivindicaciones.
Listado de secuencias
5 <110> YALE UNIVERSITY MODLIN, Irvin M.
<120> PREDICCION DE NEOPLASMAS NEUROENDOCRINOS GASTROENTEROPANCREATICOS (GEP-NEN)
<130> 669102000140
<140> Aún no asignado 10 <141> Concurrentemente adjunto
<150> US 61/448,137
<151> 2011-03-01
<160> 252
<170> FastSEQ para Windows Version 4.0 15 <210> 1
<211> 3827
<212> ADN
<213> Homo sapiens
<400> 1
<210> 2
<211> 2503
<212> ADN
<213> Homo sapiens
<400> 2
<210> 3
<211> 2949
<212> ADN
<213> Homo sapiens
<400> 3
<210> 4
<211> 7796
<212> ADN
<213> Homo sapiens
<400> 4
<210> 5
<211> 1885
<212> ADN
<213> Homo sapiens
<400> 5
<210> 6
<211> 2358 10 <212> ADN
<213> Homo sapiens
<400> 6
<210> 7
<211> 1989
<212> ADN
<213> Homo sapiens
<400> 7
<210> 8
<211> 3851
<212> ADN
<213> Homo sapiens
<400> 8
<210> 9
<211> 5755
<212> ADN
<213> Homo sapiens
<400> 9
<210> 10
<211> 1681
<212> ADN
<213> Homo sapiens
<400> 10
<210> 11
<211> 12507
<212> ADN
<213> Homo sapiens 10 <400> 11
<210> 12
<211> 731
<212> ADN
<213> Homo sapiens
<400> 12
<210> 13
<211> 5436
<212> ADN 10 <213> Homo sapiens
<400> 13
<210> 14
<211> 2080
<212> ADN
<213> Homo sapiens
<400> 14
<210> 15
<211> 2856
<212> ADN
<213> Homo sapiens
<400> 15
<210> 16
<211> 4451
<212> ADN
<213> Homo sapiens
<400> 16
<210> 17
<211> 2117
<212> ADN
<213> Homo sapiens
<400> 17
<210> 18
<211> 6671
<212> ADN
<213> Homo sapiens
<400> 18
<210> 19
<211> 3130
<212> ADN
<213> Homo sapiens
<400> 19
<210> 20
<211> 4846
<212> ADN
<213> Homo sapiens
<400> 20
<210> 21
<211> 4842
<212> ADN
<213> Homo sapiens
<400> 21
<210> 22
<211> 3291
<212> ADN
<213> Homo sapiens
<400> 22
<210> 23
<211> 1244
<212> ADN
<213> Homo sapiens
<400> 23
<210> 24
<211> 4841 10 <212> ADN
<213> Homo sapiens
<400> 24
<210> 25
<211> 2655
<212> ADN
<213> Homo sapiens
<400> 25
<210> 26
<211> 1814
<212> ADN
<213> Homo sapiens
<400> 26
<210> 27
<211> 2974
<212> ADN
<213> Homo sapiens
<400> 27
<210> 28
<211> 1894
<212> ADN
<213> Homo sapiens
<400> 28
<210> 29
<211> 2467
<212> ADN
<213> Homo sapiens
<400> 29
<210> 30
<211> 20
<212> ADN
10
<213> Secuencia Artificial
<220>
<223> cebador
<400> 30
tacctggttg atcctgccag
20
15
<210> 31
<211> 20
<212> ADN
<213> Secuencia Artificial
<220>
<223> cebador
5
<400> 31
cgcccgtcgg catgtattag
20
<210> 32
<211> 20
<212> ADN
10
<213> Secuencia Artificial
<220>
<223> cebador
<400> 32
atttggtcgt attgggcgcc
20
15
<210> 33
<211> 20
<212> ADN
<213> Secuencia Artificial
<220>
20
<223> cebador
<400> 33
gaatcatatt ggaacatgta
20
<210> 34
<211> 429
25
<212> ADN
<213> Homo sapiens
<400> 34
<210> 35 30 <211> 6158
<212> ADN
<213> Homo sapiens
<400> 35
<210> 36
<211> 3715
<212> ADN
<213> Homo sapiens
<400> 36
<210> 37
<211> 2207
<212> ADN
<213> Homo sapiens
<400> 37
<210> 38
<211> 1310
<212> ADN
<213> Homo sapiens
<400> 38
<210> 39
<211> 1869 10 <212> ADN
<213> Homo sapiens
<400> 39
<210> 40
<211> 1435
<212> ADN
<213> Homo sapiens
<400> 40
<210> 41
<211> 20 10 <212> ADN
<213> Secuencia Artificial
<220>
<223> cebador
<400> 41 cggtgccgaa gagaaagtga 20
<210> 42 5 <211> 20
<212> ADN
<213> Secuencia Artificial
<220>
<223> cebador
10 <400> 42 ctctctcggc attgaaaatc 20
<210> 43
<211> 20
<212> ADN 15 <213> Secuencia Artificial
<220>
<223> cebador
<400> 43
ctcatcgacg tggcccggca 20 20 <210> 44
<211> 20
<212> ADN
<213> Secuencia Artificial
<220> 25 <223> cebador
<400> 44 gtggatgatg ttcttggcat 20
<210> 45
<211> 20 30 <212> ADN
<213> Secuencia Artificial
<220>
<223> cebador
<400> 45 35 cctcttcggc tgcggaccct 20
<210> 46
<211> 20
<212> ADN
<213> Secuencia Artificial
<220>
<223> cebador
5 <400> 46 gtgtcaactt aatcatttgt 20
<210> 47
<211> 20
<212> ADN 10 <213> Secuencia Artificial
<220>
<223> cebador
<400> 47
ggctgctgct cgtcctggct 20 15 <210> 48
<211> 20
<212> ADN
<213> Secuencia Artificial
<220> 20 <223> cebador
<400> 48 ttgggttagg acagttgtag 20
<210> 49
<211> 20 25 <212> ADN
<213> Secuencia Artificial
<220>
<223> cebador
<400> 49 30 aacggatcct ttccattctg 20
<210> 50
<211> 20
<212> ADN
<213> Secuencia Artificial 35 <220>
<223> cebador
<400> 50
ctgagagttc atcttcaaaa 20
<210> 51
<211> 20
<212> ADN 5 <213> Secuencia Artificial
<220>
<223> cebador
<400> 51
tgcgaagctg acctggaaga 20 10 <210> 52
<211> 20
<212> ADN
<213> Secuencia Artificial
<220> 15 <223> cebador
<400> 52 ttttgggagt acggatgcac 20
<210> 53
<211> 20 20 <212> ADN
<213> Secuencia Artificial
<220>
<223> cebador
<400> 53 25 aagcgcttca tcaagtggta 20
<210> 54
<211> 20
<212> ADN
<213> Secuencia Artificial 30 <220>
<223> cebador
<400> 54 tgaggttttt caccctattc 20
<210> 55 35 <211> 20
<212> ADN
<213> Secuencia Artificial
<220>
<223> cebador
<400> 55
gatgcgggac cccggcgcgg
20
5
<210> 56
<211> 20
<212> ADN
<213> Secuencia Artificial
<220>
10
<223> cebador
<400> 56
cagcagcgcc agcaccaggg
20
<210> 57
<211> 20
15
<212> ADN
<213> Secuencia Artificial
<220>
<223> cebador
<400> 57
20
aagtttgcat acctctatga
20
<210> 58
<211> 21
<212> ADN
<213> Secuencia Artificial
25
<220>
<223> cebador
<400> 58
tttcagcagc agaatccagc a
21
<210> 59
30
<211> 20
<212> ADN
<213> Secuencia Artificial
<220>
<223> cebador
35
<400> 59
ccagatttac ccctggatgc
20
<210> 60
<211> 20
<212> ADN
<213> Secuencia Artificial
<220>
5
<223> cebador
<400> 60
cgagtagatc tggcggccgc
20
<210> 61
<211> 20
10
<212> ADN
<213> Secuencia Artificial
<220>
<223> cebador
<400> 61
15
gcacgtcgtg tctcaagatc 20
<210> 62
<211> 20
<212> ADN
<213> Secuencia Artificial
20
<220>
<223> cebador
<400> 62
gacacacgcc ttcttttcaa
20
<210> 63
25
<211> 20
<212> ADN
<213> Secuencia Artificial
<220>
<223> cebador
30
<400> 63
gtggcctctg tggggaattc
20
<210> 64
<211> 20
<212> ADN
35
<213> Secuencia Artificial
<220>
<223> cebador
<400> 64
ctccccgggg gccaggaggc
20
<210> 65
<211> 20
5
<212> ADN
<213> Secuencia Artificial
<220>
<223> cebador
<400> 65
10
tcaggactta gcaagaagtt 20
<210> 66
<211> 20
<212> ADN
<213> Secuencia Artificial
15
<220>
<223> cebador
<400> 66
tcatcttttc tttatgtttt 20
<210> 67
20
<211> 20
<212> ADN
<213> Secuencia Artificial
<220>
<223> cebador
25
<400> 67
gaatcaggat actcggccca
20
<210> 68
<211> 20
<212> ADN
30
<213> Secuencia Artificial
<220>
<223> cebador
<400> 68
actctgatca ctgctgccat
20
35
<210> 69
<211> 20
<212> ADN
<213> Secuencia Artificial
<220>
<223> cebador
<400> 69 5 ggcggtacgc aagccgctgg 20
<210> 70
<211> 21
<212> ADN
<213> Secuencia Artificial 10 <220>
<223> cebador
<400> 70 ggacacgctt ttcacggggt c 21
<210> 71 15 <211> 20
<212> ADN
<213> Secuencia Artificial
<220>
<223> cebador
20 <400> 71 ggtctacctt ctgcttccct 20
<210> 72
<211> 20
<212> ADN 25 <213> Secuencia Artificial
<220>
<223> cebador
<400> 72
tcttgtaaga actaaaattg 20 30 <210> 73
<211> 20
<212> ADN
<213> Secuencia Artificial
<220> 35 <223> cebador
<400> 73 aaggaacatg aagaggagcc 20
<210> 74
<211> 21
<212> ADN
<213> Secuencia Artificial
5
<220>
<223> cebador
<400> 74
ccgccttgca gtctccggcc g
21
<210> 75
10
<211> 21
<212> ADN
<213> Secuencia Artificial
<220>
<223> cebador
15
<400> 75
agccctctac ttttcaagac a
21
<210> 76
<211> 21
<212> ADN
20
<213> Secuencia Artificial
<220>
<223> cebador
<400> 76
agccagcatc tttggaattc a
21
25
<210> 77
<211> 21
<212> ADN
<213> Secuencia Artificial
<220>
30
<223> cebador
<400> 77
ctggaggaag actggacaaa g
21
<210> 78
<211> 21
35
<212> ADN
<213> Secuencia Artificial
<220>
<223> cebador
<400> 78
caccatcatg aagaagctga a
21
<210> 79
5
<211> 20
<212> ADN
<213> Secuencia Artificial
<220>
<223> cebador
10
<400> 79
gggtccaagc cgccctgctg
20
<210> 80
<211> 20
<212> ADN
15
<213> Secuencia Artificial
<220>
<223> cebador
<400> 80
ccttccactc tgggacccag
20
20
<210> 81
<211> 20
<212> ADN
<213> Secuencia Artificial
<220>
25
<223> cebador
<400> 81
gcagcgcctg cgcgtggcgt
20
<210> 82
<211> 20
30
<212> ADN
<213> Secuencia Artificial
<220>
<223> cebador
<400> 82
35
tcacatactg agtatagtca 20
<210> 83
<211> 21
<212> ADN
<213> Secuencia Artificial
<220>
<223> cebador
5 <400> 83 gacatccaca cctaatgtcc a 21
<210> 84
<211> 21
<212> ADN 10 <213> Secuencia Artificial
<220>
<223> cebador
<400> 84
ctgattcgct gtgacttcga a 21 15 <210> 85
<211> 20
<212> ADN
<213> Secuencia Artificial
<220> 20 <223> cebador
<400> 85 ctcctttacg agaagatgaa 20
<210> 86
<211> 20 25 <212> ADN
<213> Secuencia Artificial
<220>
<223> cebador
<400> 86 30 acattatcca gtctctgtcc 20
<210> 87
<211> 20
<212> ADN
<213> Secuencia Artificial 35 <220>
<223> cebador
<400> 87
cctgtgtgtc agccgcaagc 20
<210> 88
<211> 20
<212> ADN 5 <213> Secuencia Artificial
<220>
<223> cebador
<400> 88
gtgtttctgg gccacgttcc 20 10 <210> 89
<211> 21
<212> ADN
<213> Secuencia Artificial
<220> 15 <223> cebador
<400> 89 ctggactttc ctccaggagt t 21
<210> 90
<211> 20 20 <212> ADN
<213> Secuencia Artificial
<220>
<223> cebador
<400> 90 25 ccgcagtttc ctcaaattct 20
<210> 91
<211> 22
<212> ADN
<213> Secuencia Artificial 30 <220>
<223> cebador
<400> 91 gaagagcaag tctcattttt tc 22
<210> 92 35 <211> 20
<212> ADN
<213> Secuencia Artificial
<220>
<223> cebador
<400> 92
aacaaaaatc tcaaattctg
20
5
<210> 93
<211> 21
<212> ADN
<213> Secuencia Artificial
<220>
10
<223> cebador
<400> 93
ctaacagctg ccaatacctc a
21
<210> 94
<211> 21
15
<212> ADN
<213> Secuencia Artificial
<220>
<223> cebador
<400> 94
20
ctgcagcctt tatggaagag g 21
<210> 95
<211> 20
<212> ADN
<213> Secuencia Artificial
25
<220>
<223> cebador
<400> 95
ctgaaggacc cgtacatcct
20
<210> 96
30
<211> 21
<212> ADN
<213> Secuencia Artificial
<220>
<223> cebador
35
<400> 96
gcgatgccca tgtttgcaaa g
21
<210> 97
<211> 20
<212> ADN
<213> Secuencia Artificial
<220> 5 <223> cebador
<400> 97 gtgaactctc agctactgga 20
<210> 98
<211> 20 10 <212> ADN
<213> Secuencia Artificial
<220>
<223> cebador
<400> 98 15 tgcccctttc atcaacttca 20
<210> 99
<211> 20
<212> ADN
<213> Secuencia Artificial 20 <220>
<223> cebador
<400> 99 tttgtgagct gtatttgtga 20
<210> 100 25 <211> 20
<212> ADN
<213> Secuencia Artificial
<220>
<223> cebador
30 <400> 100 caacccaaac ttcttgcaca 20
<210> 101
<211> 21
<212> ADN 35 <213> Secuencia Artificial
<220>
<223> cebador
<400> 101
aatctgtggc cctgcagatg g
21
<210> 102
<211> 21
5
<212> ADN
<213> Secuencia Artificial
<220>
<223> cebador
<400> 102
10
gattcctgac aaacataaat g 21
<210> 103
<211> 20
<212> ADN
<213> Secuencia Artificial
15
<220>
<223> cebador
<400> 103
cgttcctttg ctgagtattc 20
<210> 104
20
<211> 22
<212> ADN
<213> Secuencia Artificial
<220>
<223> cebador
25
<400> 104
ccactctgag agaaggtctt cc
22
<210> 105
<211> 2122
<212> ADN
30
<213> Homo sapiens
<400> 105
<210> 106
<211> 20
<212> ADN
5
<213> Secuencia Artificial
<220>
<223> cebador
<400> 106
gaagcatctg aagaccatgg
20
10
<210> 107
<211> 20
<212> ADN
<213> Secuencia Artificial
<220>
15
<223> cebador
<400> 107
atgagggagg acttcttgga
20
<210> 108
<211> 20
<212> ADN
<213> Secuencia Artificial
<220>
<223> cebador
5
<400> 108
caggtccgct ataatgctct
20
<210> 109
<211> 20
<212> ADN
10
<213> Secuencia Artificial
<220>
<223> cebador
<400> 109
ggcagcggtc tggggctgct
20
15
<210> 110
<211> 20
<212> ADN
<213> Secuencia Artificial
<220>
20
<223> cebador
<400> 110
cagagtagtt ccagaggcag
20
<210> 111
<211> 21
25
<212> ADN
<213> Secuencia Artificial
<220>
<223> cebador
<400> 111
30
aaacatgatc tgcccatctt c 21
<210> 112
<211> 20
<212> ADN
<213> Secuencia Artificial
35
<220>
<223> cebador
<400> 112
attactgtgc ccgtggaaat
20
<210> 113
<211> 20
<212> ADN
5
<213> Secuencia Artificial
<220>
<223> cebador
<400> 113
gaaagaccaa aggaatggag
20
10
<210> 114
<211> 20
<212> ADN
<213> Secuencia Artificial
<220>
15
<223> cebador
<400> 114
ctcaaaaacc tgctgacaaa
20
<210> 115
<211> 20
20
<212> ADN
<213> Secuencia Artificial
<220>
<223> cebador
<400> 115
25
gtggcagaga gatctgattt 20
<210> 116
<211> 21
<212> ADN
<213> Secuencia Artificial
30
<220>
<223> cebador
<400> 116
gctggacaat tgtgctaaat g
21
<210> 117
35
<211> 20
<212> ADN
<213> Secuencia Artificial
<220>
<223> cebador
<400> 117
aaatggatgc atactaggca
20
5
<210> 118
<211> 20
<212> ADN
<213> Secuencia Artificial
<220>
10
<223> cebador
<400> 118
tcagcgaggg cgaacaagag
20
<210> 119
<211> 20
15
<212> ADN
<213> Secuencia Artificial
<220>
<223> cebador
<400> 119
20
tccgcgatgg caaactgctc
20
<210> 120
<211> 20
<212> ADN
<213> Secuencia Artificial
25
<220>
<223> cebador
<400> 120
acacaaactg gagaatggtc
20
<210> 121
30
<211> 20
<212> ADN
<213> Secuencia Artificial
<220>
<223> cebador
35
<400> 121
tgttccagag gctgctgcag
20
<210> 122
<211> 20
<212> ADN
<213> Secuencia Artificial
<220> 5 <223> cebador
<400> 122 aacttcctca gcttgagcag 20
<210> 123
<211> 20 10 <212> ADN
<213> Secuencia Artificial
<220>
<223> cebador
<400> 123 15 atttgggaca aagtctatag 20
<210> 124
<211> 20
<212> ADN
<213> Secuencia Artificial 20 <220>
<223> cebador
<400> 124 gcagaagcaa taccagcagc 20
<210> 125 25 <211> 20
<212> ADN
<213> Secuencia Artificial
<220>
<223> cebador
30 <400> 125 tgcttcagtt gttcaataga 20
<210> 126
<211> 20
<212> ADN 35 <213> Secuencia Artificial
<220>
<223> cebador
<400> 126 aggaagacaa tttagcatag 20
<210> 127
<211> 20 5 <212> ADN
<213> Secuencia Artificial
<220>
<223> cebador
<400> 127 10 gatgtaatct gtgggattca 20
<210> 128
<211> 20
<212> ADN
<213> Secuencia Artificial 15 <220>
<223> cebador
<400> 128 ggaaggcgag gagtccatca 20
<210> 129 20 <211> 20
<212> ADN
<213> Secuencia Artificial
<220>
<223> cebador
25 <400> 129 gagctttatc ttcttctgat 20
<210> 130
<211> 20
<212> ADN 30 <213> Secuencia Artificial
<220>
<223> cebador
<400> 130
gcaaagaatt ctgcatctct 20 35 <210> 131
<211> 20
<212> ADN
<213> Secuencia Artificial
<220>
<223> cebador
<400> 131
5
aattttacaa gaaaaagact 20
<210> 132
<211> 20
<212> ADN
<213> Secuencia Artificial
10
<220>
<223> cebador
<400> 132
ccgtgttggc ctccaggtcc
20
<210> 133
15
<211> 20
<212> ADN
<213> Secuencia Artificial
<220>
<223> cebador
20
<400> 133
ggcgtttccg ctcgcggtcg
20
<210> 134
<211> 20
<212> ADN
25
<213> Secuencia Artificial
<220>
<223> cebador
<400> 134
tggcagcagt tcgtgaagtc
20
30
<210> 135
<211> 20
<212> ADN
<213> Secuencia Artificial
<220>
35
<223> cebador
<400> 135
aactaatctt cccaatgtcc
20
<210> 136
<211> 20
<212> ADN
<213> Secuencia Artificial 5 <220>
<223> cebador
<400> 136 ctcccaccct gagcagagcc 20
<210> 137 10 <211> 18
<212> ADN
<213> Secuencia Artificial
<220>
<223> cebador
15 <400> 137 gtgcctgcag cactggag 18
<210> 138
<211> 20
<212> ADN 20 <213> Secuencia Artificial
<220>
<223> cebador
<400> 138
agtacgagat atttatggag 20 25 <210> 139
<211> 20
<212> ADN
<213> Secuencia Artificial
<220> 30 <223> cebador
<400> 139 ctggccaggt cctctttact 20
<210> 140
<211> 20 35 <212> ADN
<213> Secuencia Artificial
<220>
<223> cebador
<400> 140
ggaagaagca attccatggc
20
<210> 141
5
<211> 20
<212> ADN
<213> Secuencia Artificial
<220>
<223> cebador
10
<400> 141
ttgtcgttct tgttttaaat 20
<210> 142
<211> 20
<212> ADN
15
<213> Secuencia Artificial
<220>
<223> cebador
<400> 142
agcctgaccg tgtggaaggc
20
20
<210> 143
<211> 20
<212> ADN
<213> Secuencia Artificial
<220>
25
<223> cebador
<400> 143
gccttgcagg acacacactc
20
<210> 144
<211> 20
30
<212> ADN
<213> Secuencia Artificial
<220>
<223> cebador
<400> 144
35
accctcacca acaatgacac 20
<210> 145
<211> 16
<212> ADN
<213> Secuencia Artificial
<220>
<223> cebador
5 <400> 145 cggacgttca cgccct 16
<210> 146
<211> 20
<212> ADN 10 <213> Secuencia Artificial
<220>
<223> cebador
<400> 146
caagagaggc atcctcaaac 20 15 <210> 147
<211> 20
<212> ADN
<213> Secuencia Artificial
<220> 20 <223> cebador
<400> 147 cgtcatagtc ctcggcaatg 20
<210> 148
<211> 20 25 <212> ADN
<213> Secuencia Artificial
<220>
<223> cebador
<400> 148 30 gaacagggaa cctgcccccc 20
<210> 149
<211> 20
<212> ADN
<213> Secuencia Artificial 35 <220>
<223> cebador
<400> 149
gttacatcat accccatgtc 20
<210> 150
<211> 20
<212> ADN 5 <213> Secuencia Artificial
<220>
<223> cebador
<400> 150
aaaaatgtgg ccttccaaac 20 10 <210> 151
<211> 16
<212> ADN
<213> Secuencia Artificial
<220> 15 <223> cebador
<400> 151 cactatcgca agagtc 16
<210> 152
<211> 20 20 <212> ADN
<213> Secuencia Artificial
<220>
<223> cebador
<400> 152 25 gtgattggtc tattcaccat 20
<210> 153
<211> 22
<212> ADN
<213> Secuencia Artificial 30 <220>
<223> cebador
<400> 153 aactgattgg ttcaccaacc cc 22
<210> 154 35 <211> 20
<212> ADN
<213> Secuencia Artificial
<220>
<223> cebador
<400> 154
gctgcaggac tcccatgaca
20
5
<210> 155
<211> 20
<212> ADN
<213> Secuencia Artificial
<220>
10
<223> cebador
<400> 155
ggctgtgagg cgctggggaa
20
<210> 156
<211> 20
15
<212> ADN
<213> Secuencia Artificial
<220>
<223> cebador
<400> 156
20
tgcaagagga ctaagcatgg
20
<210> 157
<211> 20
<212> ADN
<213> Secuencia Artificial
25
<220>
<223> cebador
<400> 157
aaataggcac ggtggaccat
20
<210> 158
30
<211> 20
<212> ADN
<213> Secuencia Artificial
<220>
<223> cebador
35
<400> 158
acggcatgga ggagccaggg
20
<210> 159
<211> 20
<212> ADN
<213> Secuencia Artificial
<220>
5
<223> cebador
<400> 159
atgaaagaga tcaggatggc
20
<210> 160
<211> 20
10
<212> ADN
<213> Secuencia Artificial
<220>
<223> cebador
<400> 160
15
gcagggctgg ccgtcagtgg 20
<210> 161
<211> 20
<212> ADN
<213> Secuencia Artificial
20
<220>
<223> cebador
<400> 161
gaccagcgag ttacccagca
20
<210> 162
25
<211> 20
<212> ADN
<213> Secuencia Artificial
<220>
<223> cebador
30
<400> 162
cgggggcgag gaagggctgg
20
<210> 163
<211> 20
<212> ADN
35
<213> Secuencia Artificial
<220>
<223> cebador
<400> 163 cccgcgcgtc cccgggcccc 20
<210> 164
<211> 20 5 <212> ADN
<213> Secuencia Artificial
<220>
<223> cebador
<400> 164 10 cctctgggga gcgacttttc 20
<210> 165
<211> 20
<212> ADN
<213> Secuencia Artificial 15 <220>
<223> cebador
<400> 165 caagcgcttt cgggtgtctt 20
<210> 166 20 <211> 20
<212> ADN
<213> Secuencia Artificial
<220>
<223> cebador
25 <400> 166 aggcgagcag tggaagtgtg 20
<210> 167
<211> 20
<212> ADN 30 <213> Secuencia Artificial
<220>
<223> cebador
<400> 167
ttatgcagac gggttctaaa 20 35 <210> 168
<211> 22
<212> ADN
<213> Secuencia Artificial
<220>
<223> cebador
<400> 168
5
cttacccaca atctgctgag ct 22
<210> 169
<211> 20
<212> ADN
<213> Secuencia Artificial
10
<220>
<223> cebador
<400> 169
ggcagatacg gacctcggtg
20
<210> 170
15
<211> 20
<212> ADN
<213> Secuencia Artificial
<220>
<223> cebador
20
<400> 170
aagtttaagg gccaggttgt
20
<210> 171
<211> 20
<212> ADN
25
<213> Secuencia Artificial
<220>
<223> cebador
<400> 171
cagggaacat tgcacctggt
20
30
<210> 172
<211> 20
<212> ADN
<213> Secuencia Artificial
<220>
35
<223> cebador
<400> 172
aagtcctaga aatgcaggaa
20
<210> 173
<211> 20
<212> ADN
<213> Secuencia Artificial 5 <220>
<223> cebador
<400> 173 cttctgaatc actgctgtcc 20
<210> 174 10 <211> 20
<212> ADN
<213> Secuencia Artificial
<220>
<223> cebador
15 <400> 174 gaggagcttg ctaaggacca 20
<210> 175
<211> 20
<212> ADN 20 <213> Secuencia Artificial
<220>
<223> cebador
<400> 175
gaatctgtca gctccttctc 20 25 <210> 176
<211> 20
<212> ADN
<213> Secuencia Artificial
<220> 30 <223> cebador
<400> 176 gcgcccttac aagtgtgact 20
<210> 177
<211> 20 35 <212> ADN
<213> Secuencia Artificial
<220>
<223> cebador
<400> 177
gaaaacaggg cactcactgt
20
<210> 178
5
<211> 20
<212> ADN
<213> Secuencia Artificial
<220>
<223> cebador
10
<400> 178
gaaagtggat ttgtgcaaca
20
<210> 179
<211> 20
<212> ADN
15
<213> Secuencia Artificial
<220>
<223> cebador
<400> 179
tggatgggtt ctatgccaca
20
20
<210> 180
<211> 20
<212> ADN
<213> Secuencia Artificial
<220>
25
<223> cebador
<400> 180
accgccgaga ccgcgtccgc
20
<210> 181
<211> 20
30
<212> ADN
<213> Secuencia Artificial
<220>
<223> cebador
<400> 181
35
gcccgggggg catcgtcgcc 20
<210> 182
<211> 20
<212> ADN
<213> Secuencia Artificial
<220>
<223> cebador
5
<400> 182
ggagaccccg cctagcatag
20
<210> 183
<211> 20
<212> ADN
10
<213> Secuencia Artificial
<220>
<223> cebador
<400> 183
tgaccatgca gaattgatcg
20
15
<210> 184
<211> 20
<212> ADN
<213> Secuencia Artificial
<220>
20
<223> cebador
<400> 184
gagctccttg gcggtccaca
20
<210> 185
<211> 20
25
<212> ADN
<213> Secuencia Artificial
<220>
<223> cebador
<400> 185
30
ctgcaggaaa cgcagtggcg 20
<210> 186
<211> 20
<212> ADN
<213> Secuencia Artificial
35
<220>
<223> cebador
<400> 186
cacgttttgg atacactcat 20
<210> 187
<211> 20
<212> ADN 5 <213> Secuencia Artificial
<220>
<223> cebador
<400> 187
ttggtccgct gctgtgtgaa 20 10 <210> 188
<211> 20
<212> ADN
<213> Secuencia Artificial
<220> 15 <223> cebador
<400> 188 gtgctgtgag gtctgcgggc 20
<210> 189
<211> 20 20 <212> ADN
<213> Secuencia Artificial
<220>
<223> cebador
<400> 189 25 tcaggcactg ccagctctac 20
<210> 190
<211> 20
<212> ADN
<213> Secuencia Artificial 30 <220>
<223> cebador
<400> 190 gcacacaagg cgggagctag 20
<210> 191 35 <211> 20
<212> ADN
<213> Secuencia Artificial
<220>
<223> cebador
<400> 191
ctctgccttc ttcaggtttc 20 5 <210> 192
<211> 20
<212> ADN
<213> Secuencia Artificial
<220> 10 <223> cebador
<400> 192 ctggttattg gctctcttca 20
<210> 193
<211> 18 15 <212> ADN
<213> Secuencia Artificial
<220>
<223> cebador
<400> 193 20 catgcccatc ctgatact 18
<210> 194
<211> 20
<212> ADN
<213> Secuencia Artificial 25 <220>
<223> cebador
<400> 194 ctaggatgtc ttccagcctc 20
<210> 195 30 <211> 20
<212> ADN
<213> Secuencia Artificial
<220>
<223> cebador
35 <400> 195 gcaatatatt taaaactaag 20
<210> 196
<211> 20
<212> ADN
<213> Secuencia Artificial
<220>
5
<223> cebador
<400> 196
gaactcagta tagtgccaac
20
<210> 197
<211> 20
10
<212> ADN
<213> Secuencia Artificial
<220>
<223> cebador
<400> 197
15
gtgccacccc ctaggctcaa 20
<210> 198
<211> 20
<212> ADN
<213> Secuencia Artificial
20
<220>
<223> cebador
<400> 198
atggtcagta ggacagaagg
20
<210> 199
25
<211> 20
<212> ADN
<213> Secuencia Artificial
<220>
<223> cebador
30
<400> 199
atggttcatg acaatatcga
20
<210> 200
<211> 1852
<212> ADN
35
<213> Homo sapiens
<400> 200
<210> 201
<211> 2136
<212> ADN
<213> Homo sapiens
<400> 201
<210> 202
<211> 1986
<212> ADN
<213> Homo sapiens
<400> 202
<210> 203
<211> 2886
<212> ADN
<213> Homo sapiens
<400> 203
<210> 204
<211> 2165
<212> ADN
<213> Homo sapiens
<400> 204
<210> 205
<211> 3505
<212> ADN
<213> Homo sapiens 10 <400> 205
<210> 206
<211> 1997
<212> ADN
<213> Homo sapiens
<400> 206
<210> 207
<211> 2880
<212> ADN
<213> Homo sapiens
<400> 207
<210> 208
<211> 4697
<212> ADN
<213> Homo sapiens
<400> 208
<210> 209
<211> 2448
<212> ADN
<213> Homo sapiens
<400> 209
<210> 210
<211> 5458
<212> ADN
<213> Homo sapiens
<400> 210
<210> 211
<211> 2347
<212> ADN
<213> Homo sapiens
<400> 211
<210> 212
<211> 4463
<212> ADN
<213> Homo sapiens
<400> 212
<210> 213
<211> 2697
<212> ADN
<213> Homo sapiens
<400> 213
<210> 214
<211> 14734
<212> ADN
<213> Homo sapiens
<400> 214
<210> 215
<211> 2162
<212> ADN
<213> Homo sapiens
<400> 215
<210> 216
<211> 1852
<212> ADN
<213> Homo sapiens
<400> 216
<210> 217
<211> 2047
<212> ADN
<213> Homo sapiens
<400> 217
<210> 218
<211> 1496 10 <212> ADN
<213> Homo sapiens
<400> 218
<210> 219
<211> 2410
<212> ADN
<213> Homo sapiens
<400> 219
<210> 220
<211> 1936
<212> ADN
<213> Homo sapiens
<400> 220
<210> 221
<211> 1712 10 <212> ADN
<213> Homo sapiens
<400> 221
<210> 222
<211> 7332
<212> ADN
<213> Homo sapiens
<400> 222
<210> 223
<211> 14135
<212> ADN
<213> Homo sapiens
<400> 223
<210> 224
<211> 2200
<212> ADN
<213> Homo sapiens
<400> 224
<210> 225
<211> 1014
<212> ADN
<213> Homo sapiens
<400> 225
<210> 226
<211> 1926
<212> ADN
<213> Homo sapiens 10 <400> 226
<210> 227
<211> 5216
<212> ADN
<213> Homo sapiens
<400> 227
<210> 228
<211> 5138
<212> ADN
<213> Homo sapiens
<400> 228
<210> 229
<211> 2317
<212> ADN
<213> Homo sapiens
<400> 229
<210> 230
<211> 3181
<212> ADN
<213> Homo sapiens
<400> 230
<210> 231
<211> 2714
<212> ADN
<213> Homo sapiens
<400> 231
<210> 232
<211> 1700
<212> ADN
<213> Homo sapiens
<400> 232
<210> 233
<211> 1935
<212> ADN
<213> Homo sapiens
<400> 233
<210> 234
<211> 4343 10 <212> ADN
<213> Homo sapiens
<400> 234
<210> 235
<211> 2123
<212> ADN
<213> Homo sapiens
<400> 235
<210> 236
<211> 1258
<212> ADN
<213> Homo sapiens 10 <400> 236
<210> 237
<211> 2674
<212> ADN
<213> Homo sapiens
<400> 237
<210> 238
<211> 4427
<212> ADN
<213> Homo sapiens
<400> 238
<210> 239
<211> 4538
<212> ADN
<213> Homo sapiens
<400> 239
<210> 240
<211> 829
<212> ADN
<213> Homo sapiens
<400> 240
<210> 241 10 <211> 612
<212> ADN
<213> Homo sapiens
<400> 241
<210> 242
<211> 14607
<212> ADN
<213> Homo sapiens
<400> 242
<210> 243
<211> 14329
<212> ADN
<213> Homo sapiens
<400> 243
<210> 244
<211> 12778
<212> ADN
<213> Homo sapiens
<400> 244
<210> 245
<211> 12600
<212> ADN
<213> Homo sapiens
<400> 245
<210> 246
<211> 4344
<212> ADN
<213> Homo sapiens
<400> 246
<210> 247
<211> 1688
<212> ADN
<213> Homo sapiens
<400> 247
<210> 248
<211> 6994
<212> ADN
<213> Homo sapiens
<400> 248
<210> 249
<211> 2953
<212> ADN
<213> Homo sapiens
<400> 249
<210> 250
<211> 4454
<212> ADN
<213> Homo sapiens
<400> 250
<210> 251
<211> 2182
<212> ADN
<213> Homo sapiens
<400> 251
<210> 252 10 <211> 2123
<212> ADN
<213> Homo sapiens
<400> 252

Claims (6)

  1. Reivindicaciones
    1. Un método para evaluar la respuesta a la terapia de un neoplasma neuroendocrino gastroenteropancreático (GEP-NEN) o una célula de GEP-NEN, que comprende:
    (a)
    poner en contacto una muestra de prueba biológica del sujeto con un conjunto de polinucleótidos que hibridan específicamente o se unen a los biomarcadores GEP-NEN AKAP8L, BRAF, CD59, COMMD9, Ki67, MORF4L2, OAZ2, RAF1, SST1, SST3, TECPR2, ZFHX3 y ZXDC, en donde la muestra de prueba biológica es un tejido, una muestra de sangre o plasma;
    (b)
    detectar la unión de biomarcadores de GEP-NEN al conjunto de polinucleótidos, detectando de ese modo los niveles de expresión o el perfil de expresión de los biomarcadores de GEP-NEN en la muestra de prueba del sujeto;
    (c)
    comparar los niveles de expresión o el perfil de expresión de los biomarcadores de GEP-NEN detectados con un nivel de referencia o un perfil de referencia de los biomarcadores en una muestra de referencia del mismo sujeto antes del tratamiento; y
    (d)
    con base en las diferencias entre los niveles de expresión o el perfil de expresión de los niveles de los biomarcadores de GEP-NEN detectados y el nivel de referencia o el perfil de referencia de los biomarcadores que determinan la respuesta al tratamiento o determinan si el sujeto se ha vuelto clínicamente estable después de intervención quirúrgica o terapia con análogos de somatostatina para GEP-NEN, con al menos 90% de precisión.
  2. 2.
    El método de la reivindicación 1, que comprende además poner en contacto la muestra de prueba biológica del sujeto con un conjunto de polinucleótidos que hibridan específicamente o se unen a biomarcadores de GEP-NEN para APLP2, ARAF1, ATP6V1H, BNIP3L, C21orf7, CTGF, ENPP4, FAM131A, FLJ10357, FZD7, GLT8D1, HDAC9, HSF2, KRAS, LEO1, NAP1L1, NOL3, NUDT3, PANK2, PHF21A, PKD1, PLD3, PNMA2, PQBP1, RNF41, RSF1, RTN2, SMARCD3, SPATA7, SST4, SST5, TPH1, TRMT112, VMAT1, VMAT2, VPS13C, WDFY3 y ZZZ3.
  3. 3.
    El método de la reivindicación 1, en el que la muestra de prueba biológica es una muestra de sangre y el método detecta tan solo tres células de GEP-NEN por mililitro (mL) de sangre completa.
  4. 4.
    El método de la reivindicación 1, en el que el conjunto de polinucleótidos comprende cebadores sentido y antisentido, y donde el método comprende además (i) producir ADN complementario (ADNc) para cada uno de los biomarcadores de GEP-NEN mediante transcripción inversa, (ii) amplificar el ADNc así producido con pares de cebadores sentido y antisentido, que se hibridizan específicamente con los biomarcadores de GEP-NEN, y (iii) detectar productos de la amplificación.
  5. 5.
    El método de la reivindicación 1 o la reivindicación 2, que comprende además proporcionar una recomendación de tratamiento que comprende iniciar, interrumpir o modificar un tratamiento de GEP-NEN del sujeto basándose en los niveles de expresión o el perfil de expresión de los biomarcadores de GEP-NEN así detectados.
  6. 6.
    El método de la reivindicación 1 o la reivindicación 2, que comprende además analizar datos obtenidos por el método utilizando un algoritmo predictivo, en el que el algoritmo predictivo se selecciona de máquinas de vectores de soporte (SVM), análisis discriminante lineal (LDA), vecino más cercano a K (KNN), Bayes sin procesar (NB), árbol de decisión, análisis discriminante regularizado (RDA) y Perceptron.
ES12709436.5T 2011-03-01 2012-03-01 Evaluación de la respuesta a la terapia de neoplasmas neuroendocrinos gastroenteropancreáticas (GEP-NEN) Active ES2656487T3 (es)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US201161448137P 2011-03-01 2011-03-01
US201161448137P 2011-03-01
PCT/US2012/027351 WO2012119013A1 (en) 2011-03-01 2012-03-01 PREDICTING GASTROENTEROPANCREATIC NEUROENDOCRINE NEOPLASMS (GEP-NENs)

Publications (1)

Publication Number Publication Date
ES2656487T3 true ES2656487T3 (es) 2018-02-27

Family

ID=45852725

Family Applications (1)

Application Number Title Priority Date Filing Date
ES12709436.5T Active ES2656487T3 (es) 2011-03-01 2012-03-01 Evaluación de la respuesta a la terapia de neoplasmas neuroendocrinos gastroenteropancreáticas (GEP-NEN)

Country Status (14)

Country Link
US (1) US9988684B2 (es)
EP (1) EP2681333B1 (es)
JP (2) JP6159662B2 (es)
KR (2) KR102114412B1 (es)
CN (1) CN103502473B (es)
AU (2) AU2012223288B2 (es)
CA (1) CA2828878C (es)
DK (1) DK2681333T3 (es)
ES (1) ES2656487T3 (es)
IL (1) IL228224A (es)
MX (1) MX351779B (es)
PL (1) PL2681333T3 (es)
WO (1) WO2012119013A1 (es)
ZA (1) ZA201306686B (es)

Families Citing this family (27)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11183269B2 (en) 2012-10-09 2021-11-23 Five3 Genomics, Llc Systems and methods for tumor clonality analysis
PL3194618T3 (pl) 2014-09-15 2021-12-13 Clifton Life Sciences LLC Kompozycje, sposoby i zestawy do diagnozy nowotworu neuroendokrynnego żołądkowo- jelitowo-trzustkowego
CN107194137B (zh) * 2016-01-31 2023-05-23 北京万灵盘古科技有限公司 一种基于医疗数据建模的坏死性小肠结肠炎分类预测方法
CN105938521A (zh) * 2016-07-04 2016-09-14 苏州大学附属儿童医院 一种强直性脊柱炎预警模型建立方法及装置
US20200017913A1 (en) * 2017-03-02 2020-01-16 President And Fellows Of Harvard College Methods and systems for predicting treatment responses in subjects
WO2018214249A1 (zh) * 2017-05-22 2018-11-29 立森印迹诊断技术(无锡)有限公司 一种印记基因分级模型及其组成的系统和应用
JP7344871B2 (ja) * 2017-11-30 2023-09-14 リキッド バイオプシー リサーチ リミティド ライアビリティ カンパニー 遺伝子発現アッセイを使った予測ペプチド受容体放射性核種療法
JP7495878B2 (ja) * 2017-12-19 2024-06-05 チェイス セラピューティクス コーポレイション 神経変性状態を処置するための医薬を開発するための方法
CN108048564B (zh) * 2018-02-09 2021-03-05 中国科学院昆明动物研究所 人glt8d1基因的新用途
JP7061768B2 (ja) * 2018-03-09 2022-05-02 国立大学法人 東京大学 生物応答の解析方法、解析プログラム、及び解析装置
CA3003032A1 (en) * 2018-04-27 2019-10-27 Nanostics Inc. Methods of diagnosing disease using microflow cytometry
KR102141246B1 (ko) * 2018-05-25 2020-08-04 주식회사 엠디헬스케어 qPCR 분석을 통한 대장암 진단방법
WO2019226035A1 (ko) * 2018-05-25 2019-11-28 주식회사 엠디헬스케어 Qpcr 분석을 통한 대장암 진단방법
JP7133411B2 (ja) * 2018-09-19 2022-09-08 テルモ株式会社 Ctc採取システム及びctc採取システムの作動方法
CN109190713A (zh) * 2018-09-29 2019-01-11 王海燕 基于血清质谱自适应稀疏特征选择的卵巢癌微创快检技术
JP2022516172A (ja) 2018-12-31 2022-02-24 テンパス・ラボズ・インコーポレイテッド 患者コホートの反応、増悪、および生存を予測し解析するための方法およびプロセス
US11875903B2 (en) 2018-12-31 2024-01-16 Tempus Labs, Inc. Method and process for predicting and analyzing patient cohort response, progression, and survival
CN109652550B (zh) * 2019-01-21 2022-08-02 首都医科大学附属北京朝阳医院 circ-HUWE1作为胃癌和结直肠癌诊断生物标志物和治疗靶点的应用
CN109949268A (zh) * 2019-01-24 2019-06-28 郑州大学第一附属医院 一种基于机器学习的肝细胞癌分化水平分级方法
SE543275C2 (en) * 2019-03-07 2020-11-10 Tx Medic Ab Treatment efficiency evaluation
US11995127B2 (en) * 2019-04-02 2024-05-28 Aspentech Corporation Validation of operating plans and schedules using machine learning
AU2020363786A1 (en) 2019-10-10 2022-05-12 Liquid Biopsy Research LLC Compositions, methods and kits for biological sample and RNA stabilization
US20230272390A1 (en) * 2020-07-29 2023-08-31 The Children's Hospital Of Philadelphia Compositions and methods for hemoglobin production
KR102519913B1 (ko) * 2021-06-15 2023-04-10 재단법인 아산사회복지재단 췌장 신경내분비 종양 진단용 바이오마커 조성물 및 이를 이용한 췌장 신경내분비 종양 진단에 필요한 정보를 제공하는 방법
KR102438608B1 (ko) * 2021-06-15 2022-08-31 재단법인 아산사회복지재단 췌장 신경내분비 종양 감별진단용 바이오마커 조성물 및 이를 이용한 췌장 신경내분비 종양 감별진단에 필요한 정보를 제공하는 방법
CN113637750A (zh) * 2021-07-16 2021-11-12 宁波市第一医院 急性髓系白血病的辅助诊断、预后诊断或危险度分层标记物及其应用
WO2024073652A1 (en) * 2022-09-30 2024-04-04 Liquid Biopsy Research LLC Methods for neuroendocrine cancer detection in saliva

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20060194265A1 (en) 2001-10-23 2006-08-31 Morris David W Novel therapeutic targets in cancer
WO2005020795A2 (en) * 2003-08-25 2005-03-10 The Johns Hopkins University Method of diagnosis and treatment of pancreatic endocrine neoplasms based on differntial gene expression analysis

Also Published As

Publication number Publication date
KR20140042793A (ko) 2014-04-07
MX351779B (es) 2017-10-27
IL228224A0 (en) 2013-12-31
US9988684B2 (en) 2018-06-05
JP2014512172A (ja) 2014-05-22
WO2012119013A1 (en) 2012-09-07
EP2681333A1 (en) 2014-01-08
KR102114412B1 (ko) 2020-06-18
CA2828878C (en) 2020-08-25
CN103502473B (zh) 2016-03-09
PL2681333T3 (pl) 2018-03-30
EP2681333B1 (en) 2017-11-15
CA2828878A1 (en) 2012-09-07
US20140066328A1 (en) 2014-03-06
JP2017104116A (ja) 2017-06-15
AU2017204086B2 (en) 2019-05-16
JP6321233B2 (ja) 2018-05-09
AU2012223288A1 (en) 2013-09-19
KR20180116483A (ko) 2018-10-24
MX2013010035A (es) 2014-08-27
AU2017204086A1 (en) 2017-07-06
JP6159662B2 (ja) 2017-07-05
KR102023584B1 (ko) 2019-09-24
CN103502473A (zh) 2014-01-08
IL228224A (en) 2017-11-30
ZA201306686B (en) 2015-03-25
DK2681333T3 (en) 2018-01-08
AU2012223288B2 (en) 2017-03-30

Similar Documents

Publication Publication Date Title
ES2656487T3 (es) Evaluación de la respuesta a la terapia de neoplasmas neuroendocrinos gastroenteropancreáticas (GEP-NEN)
JP7157788B2 (ja) 膵・消化管神経内分泌新生物の診断のための組成物、方法およびキット
ES2741745T3 (es) Método para usar la expresión génica para determinar el pronóstico de cáncer de próstata
US8338109B2 (en) Predicting cancer outcome
WO2015073949A1 (en) Method of subtyping high-grade bladder cancer and uses thereof
US20210010090A1 (en) Method and system for predicting recurrence and non-recurrence of melanoma using sentinel lymph node biomarkers
US20180230545A1 (en) Method for the prediction of progression of bladder cancer
CA2889276A1 (en) Method for identifying a target molecular profile associated with a target cell population
WO2016118670A1 (en) Multigene expression assay for patient stratification in resected colorectal liver metastases
CN117355616A (zh) 用于肝细胞癌的dna甲基化生物标志物
KR20200038659A (ko) 대식세포 특이적 바이오마커 패널 및 이의 용도
BR112017005279B1 (pt) Métodos para detectar um neoplasma neuroendócrino gastroenteropancreático (gep-nen), para diferenciar gep-nen estável de um gep-nen progressivo e para determinar uma resposta a uma terapia com radionucleotídeo para receptor de peptídeo de um gep-nen