ES2411833B1 - Método de pronóstico del carcinoma no microcítico de pulmón de estadio I o II. - Google Patents

Método de pronóstico del carcinoma no microcítico de pulmón de estadio I o II. Download PDF

Info

Publication number
ES2411833B1
ES2411833B1 ES201132151A ES201132151A ES2411833B1 ES 2411833 B1 ES2411833 B1 ES 2411833B1 ES 201132151 A ES201132151 A ES 201132151A ES 201132151 A ES201132151 A ES 201132151A ES 2411833 B1 ES2411833 B1 ES 2411833B1
Authority
ES
Spain
Prior art keywords
genes
prognosis
expression
group
stage
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
ES201132151A
Other languages
English (en)
Other versions
ES2411833R1 (es
ES2411833A2 (es
Inventor
Julián SANZ ORTEGA
Milagros FERRER ALDEA
Susana HERNÁNDEZ PRIETO
Alejandro ROMERA LÓPEZ
Beatriz PÉREZ-VILLAMIL SALGADO
Florentino HERNANDO TRANCHO
Ana María GÓMEZ MARTÍNEZ
Jose Ramón JARABO SARCEDA
Antonio José TORRES GARCÍA
Jose Antonio LÓPEZ GARCÍA-ASENJO
Jose Luis GONZÁLEZ LARRIBA
Javier PUENTE VÁZQUEZ
Eduardo DÍAZ-RUBIO GARCÍA
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fundacion para la Investigacion Biomedica del Hospital Clinico San Carlos
Original Assignee
Fundacion para la Investigacion Biomedica del Hospital Clinico San Carlos
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fundacion para la Investigacion Biomedica del Hospital Clinico San Carlos filed Critical Fundacion para la Investigacion Biomedica del Hospital Clinico San Carlos
Priority to ES201132151A priority Critical patent/ES2411833B1/es
Priority to PCT/ES2012/070919 priority patent/WO2013098457A1/es
Publication of ES2411833A2 publication Critical patent/ES2411833A2/es
Publication of ES2411833R1 publication Critical patent/ES2411833R1/es
Application granted granted Critical
Publication of ES2411833B1 publication Critical patent/ES2411833B1/es
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids

Landscapes

  • Chemical & Material Sciences (AREA)
  • Organic Chemistry (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Health & Medical Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Microbiology (AREA)
  • Immunology (AREA)
  • Physics & Mathematics (AREA)
  • Molecular Biology (AREA)
  • Biotechnology (AREA)
  • Biophysics (AREA)
  • Analytical Chemistry (AREA)
  • Biochemistry (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)

Abstract

Método de pronóstico del carcinoma no microcítico de pulmón de estadio I o II.#La presente invención se refiere a un método in vitro de obtención de datos Útiles para el pronóstico de cáncer de pulmón no microcítico de estadio I o II caracterizado por la detección y/o cuantificación de perfil de expresión génica de 50 biomarcadores. También se refiere a un método in vitro de pronóstico de cáncer de pulmón no microcítico de estadio I o II que comprende la detección y/o cuantificación de perfil de expresión génica de 50 biomarcadores. Además también se refiere al kit que comprende las sondas capaces de detectar dichos biomarcadores y su uso para la obtención de datos útiles para el pronóstico de cáncer de pulmón no microcítico de estadios I y II.

Description

Método de pronóstico del carcinoma no microcítico de pulmón de estadio I o 11 .
La presente invención se refiere a un método in vitro de pronóstico en carcinoma no microcílico de pulmón de estadios I
o 11 basado en la expresión diferencial de 50 genes. Mediante el mélodo de la invención se diferencian pacientes con buen pronóstico y pacientes con mal pronóstico. La presente invención también se refiere a un kit que comprende un conjunto de sondas que reconocen los 50 genes de la invención. Por tanto, la invención se podría encuadrar en el campo de la medicina
ESTADO DE LA TÉCNICA
El cáncer de pulmón es la primera causa de muerte por cáncer con una tasa anual de más de 1,1 millones de personas en lodo el mundo, y con una tasa de supervivencia a cinco años de sólo el 15%. Aproximadamente el 80% de los casos diagnosticados se clasifican como carcinoma no microcitioo de pulmón (CNMP) y el 20% restante corresponden a carcinoma microcítico de pulmón (CMP). En el CNMP, los tipos más frecuentes son el carcinoma epidermoide o escamoso y el adenocarcinoma
El sistema de estadiaje TNM (7a edición) basado en el tamaño del tumor (T), la afectación ganglionar (N) y la presencia de metástasis a distancia (M) es, en la actualidad, el factor pronóstico más utilizado en los pacientes con CNMP. En función de estos parámetros, los tumores se clasifican en: estadio I y estadio 11 (en ambos casos la enfermedad es localizada), estadio 111 (enfermedad localmente avanzada) y estadio IV (enfermedad metastasica) (Kligerman S. Amerian Journal of Roentgenology 2010. 194:562-573).
En estadios iniciales o tempranos (estadios I y 11), la cirugía con intención curativa es el tratamiento de elección encontrándose en continua discusión el beneficio de la quimioterapia adyuvante para disminuir la elevada tasa de recurrencia posterior a la resección quirúrgica que oscila entre un 30-35% de los pacientes. En concreto, en estadios 11, la quimioterapia adyuvante basada en platinos, como el cisplatino, ha demostrado mejorar la supervivencia de determinados subgrupos pero, por otro lado, existe un porcentaje de pacientes que a pesar de no recaer tras la cirugía reciben tratamiento adyuvante y que son por lo tanto pacientes tratados en exceso. Este sobretratamiento repercute en problemas en estos pacientes asociados a los efectos secundarios de dichos tratamientos. Respecto a los estadios I (que engloba a los subgrupos lA y lB), Y según la guía de consenso elaborada por el "Nalional Comprehensive Cancer Network" (NCCN) en 2011, en el subgrupo lA la quimioterapia adyuvante no está indicada, mientras que en los pacíentes del subgrupo lB, sólo esta recomendada en aquellos que cumplan factores de ríesgo como pobre grado de diferenciación, invasión vascular, resección en cuña y márgenes mínimos. Por lo tanto, debido a la falta de precisión de los métodos actuales para definir el pronóstico de los estadios tempranos del CNMP, en la actualidad existen pacientes que reciben un tratamiento adyuvante que no les beneficia y también pacientes que no reciben un tratamiento adyuvante y que sin embargo tienen una alta probabilidad de recurrencia del tumor
Actulamente, en el cáncer de pulmón no se conocen marcadores de probado valor pronóstico y predictivo que indiquen cúal será la progresión del paciente (Karapaniagiotou E, et al. Open Lung Cancer J 2009. 2: 24-30). En CNMP se han desarrollado estudios que utilizan plataformas de analisis masivo para la obtención de perfiles de expresión génica que puedan ser utilizadas como biomarcadores pronóstico. Los resultados obtenidos han sido dispares en cuanto a los genes a incluir en el biomarcador, quizás debido al uso de criterios diferentes en cuanto a la inclusión de pacientes en el estudio, la obtención de muestras, la elección de los estadios tumorales, la exclusión o no de subtipos histológicos de gran importancia en el CNMP, así como a la falta, en algunos casos, de validación independiente (Roepman P. et al Clin Cancer Res 2009. 15:284-290; Chen HY et al. New Engl J Med 2007. 356(1):11 -20); Raponi M et al. Cancer Res 200666:7466-7472; US20090062144; W02010007093; Raz DJ et al. Clin Cancer Res 2008 14(17):5565--5570)
Por lo tanto existe la necesidad de desarrollar una herramienta alternativa que pueda ser usada clínicamente, que sea mas efectiva que los factores de riesgo estandar en identificar aquellos pacientes completamente resecados y clasificados como estadio I que puedan beneficiarse de la quimioterapia adyuvante y que además pennita identificar aquellos pacientes clasificados como estadios 11 que tengan bajo riesgo de recurrencia y en los que la quimioterapia no seria necesaria. Se requiere por lo tanto un método robusto que sea capaz de estratificar pacientes con CNMP en grupos de buen y mal pronóstico
DESCRIPCiÓN DE LA INVENCiÓN
El problema técnico que resuelve la invención es el de proporcionar un método in vitro alternativo que determine el pronóstico del carcinoma no microcítico de pulmón (CNMP) en estadios iniciales para la obtención de un tratamiento personalizado del paciente.
En la presente invención se describe un método in vitro pa ra el pronóstico de CNMP tanto de estadio I como de estadio 11 que se ca racteriza por la detección y/o cuantificación de un producto de expresión del conjunto de 50 genes, que se muestran en la tabla 1 en la muestra biológica de un sujeto. La presente invención también se refiere al uso de los productos de expresión de dichos 50 genes como biomarcadores pronóstico de cáncer de CNMP de estadios I o 11.
ES 2 4 11 833 A2
El método de la invención proporciona un prediclor de 50 genes para estadios precoces de CNMP. La estrategia que se utilizó para la obtención de este prediclor, comenzó por una detección y/o cuantificación de la expresión génica global de tumores de CNMP en estadios tempranos (1 y 11). En base a la expresión génica se realizó una clasificación molecular y una asociación con recidiva; la relación de los grupos moleculares con las variables histológicas y clínicas más importantes; la obtención de un predictor que identifica los grupos moleculares generados; la obtención de un predictor que diferencia un grupo de pacientes con buen pronóstico frente a un grupo de pacientes con mal pronóstico; y validación de los prediclores con una serie externa. Finalmente, se observó que el método de la invención es útil para el pronóstico de CNMP. El predictor de la invención está constituido por 50 genes que se muestran en la tabla 1, de ahora en adelante, los denominados "50 genes de la invención"
El término "predictor" se refiere en esta memoria a un perfil de expresión diferencial de genes o perfil de expresión génica
Se entiende por "perfil de expresión génica" el perfil génico obtenido tras la cuantificación del producto de expresión de los genes de interés. Se entiende por ·producto de expresión", al ARN mensajero (ARNm), el ADN complementario (ADNc), el ARN complementario (ARNc) y/o la proteína producida por los genes de interés o biomarcadores, es decir, por los genes de la tabla 1, en una muestra biológica aislada
El perfil de expresión de los genes se realiza, preferiblemente, determinando el nivel de ARNm derivado de su transcripción, previa extracción del ARN 10tal presente en la muestra biológica aislada, lo cual puede realizarse mediante protocolos conocidos en el estado de la técnica. La determinación del nivel de ARNm derivado de la transcripción de los genes de la tabla 1 puede realizarse, por ejemplo, aunque sin limitarnos, mediante amplificación por reacción en cadena de la polimerasa (PCR), retrotranscripción en combinación con la reacción en cadena de la polimerasa (RT-PCR), RT-PCR cuantitativa, retrotranscripción en combinación con la reacción en cadena de la ligasa (RT-LCR), o cualquier otro método de amplificación de acidos nucleicos; analisis en serie de la expresión génica (SAGE, SuperSAGE); microarrays de ADN o de ARN elaborados con oligonucleótidos o sondas sintetizados in situ mediante fotol itografía o por cualqu ier otro mecanismo; hibridación in situ utilizando sondas específicas marcadas con cualquier método de marcaje; mediante geles de electroforesis; mediante transferencia a membrana e hibridación con una sonda especifica; mediante resonancia magnética nuclear o cualquier otra técnica de diagnóstico por imagen utilizando nanopartículas paramagnéticas o cualquier otro tipo de nanopartículas detectables funcionalizadas con anticuerpos o por cualquier otro medio. El perfil de expresión génica también podría obtenerse mediante la detección y/o cuantificación de las proteínas producto de la traducción del ARNm derivado de la transcripción de los genes de la tabla 1, mediante por ejemplo, pero sin limitarnos, inmunodetección por inmuno blotting, inmunohistoquímica, cromatografía o microarrays
La presente invención podría referirse también a un método in vitro para el pronostico de CNMP tanto de estadio I como de estadio 11 que se caracteriza por la detección del número de copias en el ADN de los 50 genes que se muestran en la tabla 1, así como de las alteraciones epigenéticas como la hipermetilación del promotor de los genes o como de la alteración de la estabilidad del ARNm debido entre otros factores a modificaciones transcripcionales que afectan por ejemplo a la cola de Poli Adeninas. La presente invención también se refiere al uso de estas alteraciones de los 50 genes como biomarcadores pronóstico de cáncer de CNMP de estadios I o 11.
Finalmente el perfil de expresión génica también podría obtenerse mediante la detección y/o cuantificación del número de copias de los genes presentes en la tabla 1, así como de los niveles de alteraciones epigenéticas como el nivel de metilación del promotor o de los niveles de estabilidad del mensajero de estos mismos genes. Esta detección podría llevarse a cabo, aunque sin limitarse mediante microarrays, CGH (Hibridación genómica comparada) o FISH (hibridación in situ fluorescente)
Esta invención también podría aplicarse para estadios avanzados (111 y IV)
Por lo aquí descrito, un primer aspecto de la invención se refiere a un método in vitro de obtención de datos útiles para el pronóstico de CNMP en estadio ' o 11 caracterizado por la detección y/o cuantificación del producto de expresión de los genes de la tabla 1 en la muestra biológica aislada de un sujeto. A partir de ahora nos referiremos a éste como al "método primero de la invención".
El término "in vitro" se refiere a que el método de la invención se realiza fuera del cuerpo del sujeto
El término "pronóstico" en la presente invención se refiere a la capacidad de detectar pacientes que presentan una alta o
baja probabilidad de recidiva tras la cirugía. Una alta probabilidad de recidiva se asocia a un mal pronóstico mientras que una baja probabilidad de recidiva se asocia a un buen pronóstico. Se entiende por "recidiva" la reaparición de la enfermedad, en este caso de un cáncer de pulmón. Las expresiones "probabilidad de no recidiva" y ·probabilidad de ILE (intervalo libre de enfermedad)" se usan indistintamente en la presente memoria
El término "cáncer de pulmón no microcítico", "carcinoma no microcítico de pulmón" (CNMP), "carcinoma de pulmón no microcítico" (CPNM), o cancer pulmonar de células no pequeñas (en inglés "non-small cell lung cancer", NSCLC) se
ES 2 4 11 833 A2
refiere a un tipo de caneer o tumor de pulmón según clasificación histológica que comprende el subtipo carcinoma escamoso o epidermoide, adenocarcinoma, adenoescamoso, carcinoma sarcomatoide, y carcinoma de células grandes
Se entiende por "estadio" la fase o la clasificación del cáncer de pulmón en base a la clasificación TNM. La clasificación TNM se refiere al tamaño dellumor (T), la afectación de ganglios linfaticos (N) y la afectación de otros órganos (M). El 5 estadio I se refiere a los subestadios lA o lB. El subesladio lA se refiere a los tumores de pulmón de clasificación T1NOMO. El subestadio lB incluye los tumores de pulmón de clasificación T2aNOMO. El estadio 11 se refiere a cualquiera de los subestadios IIA o liB. El subestadio IIA se refiere a los tumores de pulmón de clasificación T1N1MO, T2aN1MO y T2bNOMO. El subestadio IIB incluye los tumores de pulmón de clasificación T2bN1MO y T3NOMO. En la clasificación TNM, T1 se refiere a cuando el tumor :s 3 cm de dimensión maxima, está rodeado por tejido pulmonar o pleura visceral y 10 sin invasión proximal al bronquio lobar en fibrobroncoscopia. El T1a es un tumor :S 2cm y el T1b es un tumor" 2cm y :S 3cm. T2 se refiere a un tumor " 3 cm de dimensión máxima y :S 7 cm o un tumor con al menos una de las siguientes características: infiltrar el bronquio principal a 2 cm o menos de la carina, invadir pleura visceral o asociarse con atelectasias o neumonitis obstructiva. T2a es un tumor" 3 cm y :S 5 cm y T2b es un tumor" 5 Y :S 7 cm . T3 se refiere a un tumor" 7 cm o un tumor que afecta a la pared costal (incluidos los tumores de la cisura superior), diafragma, pleura 15 mediaslínica o pericardio; sin afectación del corazón, grandes vasos, traquea, esófago, cuerpos vertebrales; o un tumor del bronquio principal a menos de 2 cm de la carina, sin infiltración de la misma; donde la atelectasia afecta a todo un pulmón y puede existir derrame pleural no maligno. NO se refiere al tumor de pulmón sin afectación de los ganglios linfáticos. N1 se refiere al tumor que presenta afectación de los ganglios linfaticos peribronquiales o hiliares ipsilaterales
o ambos. MO se refiere al tumor de pulmón que no presenta metástasis a distancia.
20 En la presente invención los términos "estadios tempranos", "estadios iniciales" o "estadios precoces" se refieren a estadio I o 11 de CNMP
El término "genes de la tabla 1" se refiere a los genes descritos en la tabla 1 que se muestra a continuación.
Los términos "Identificador Entrez" o "ID Entrez· se refieren al número de referencia del gen en la base de datos de genes del NCBI (National Centre for Biotechnology Infonnation, U.S. National Ubrary of Medicine).
25 Tabla 1: listado de los 50 genes del predictor de la invención.
10 Entrez
51mbolo Descripción
270
AMP01 Adenosina monofosfato deaminasa
608
TNFRSF17 Miembro 17 de la superfamilia del receptor de necrosis tumoral
930
C019 C019
939
C027 C027
952
C038 C03a
973
C079A Molécula alfa asociada a inmunoglobulina
97.
C079B Molécula beta asociada a inmunoglobulina
3002
GZMB Granzima B
3493
IGHA1 Inmunoglobulina pesada constante alla 1
349.
IGHA2 Inmunoglobulina pesada constante alfa 2
3500
IGHG1 Inmunoglobulina pesada constante gamma 1
3512
IGJ Polipéptido J de inmunoglobulina
3535
IGL@ Locus lambda de inmunoglobulina
3543
IGLL1 Polipéptido 1 "Iike" inmunoglobulina lambda
3662
IRF4 Factor 4 regulador del interferón
3782
KCNN3 Miembro 3 subfamilia N de canales de potasio activados por calcio
3887
KRT81 Keratina 81
ES 2 4 11 833 A2
4283
CXCL9 Ligando 9 del motivo CXC de quimioquinas
5368
PNOC Preponocipeptina
5450
POU2AF1 Factor 1 asociado a POU clase 2
8419
BFSP2 Faquinina
9834
KIAA0125 K1AA0125
10563
CXCL13 Ligando 13 del motivo CXC de quimioquinas
11040
PIM2 Oncogén Pim2
26952
SMR3A Proteína 3A regulada por glándula submaxilar
28904
IGKV1D-B Cadena variable kappa 1D-8 de inmunoglobulina
51237
MZB1 Proteina especifica de las células 81 y B de la zona marginal
51303
FKBP11 Proteina 11 de unión a FK506
54900
L4Xl Adaptador 1 transmembrana de linfocitos
57699
CPNE5 Copina V
57823
SLAMF7 Miembro 7 de la familia SLAM
78986
DUSP26 Fosfalasa 26 especifica dual
79368
FCRL2 "Iike" receptor 2 Fe
80307
FER1L4 Pseudogen 4 "Iike" fer· 1
83416
FCRL5 Receptor Fe "Iike" 5
84824
FCRLA Receptor Fc "Iike" A
90925
IGHV5-78 Pseudogen región pesada variable de cadena pesada de inmunoglobulina 5-78
91319
DERL3 Miembro 3 de la familia de dominio parecido a Der-1
92154
MTSS1L "Iike" supresor metastasis 1
126306
JSRP1 Proteina 1 de reticulo sarcoplasmatico
140947
C50t120 Marco de lectura abierta 20 del cromosoma 5
150365
MEI1 Inhibidor de meiosis 1
221188
GPR114 Receptor 114 acoplado a proteína G
401847
LOC401847 Proteína hipotética LOC401847
642424
LOC642424 Región Walker "Iike" de la cadena kappa V-I de la inmunoglobulina
100132941
LOC100132941 Protelna hípotética LOC100132941
100133862
LOC100133862 Región V35 "Iike" de la cadena pesada V·I de la inmunoglobulina
100287723
LOC100287723 Región Walker "Iike" de la cadena kappa V-I de la inmunoglobulina
100290415
IGHV1 24 Inmunoglobulina pesada variable 1-24
100293440
LOC100293440 Similar a la cadena lambda de inmunoglobulina
ES 2 4 11 833 A2
A continuación se muestra una breve descripción de algunas de las funciones conocidas de los genes presentados en la tabla 1"
AMPD1: Cataliza la deaminación de la adenosina monofosfato (AMP) a ¡nasina monofosfato (IMP) en el músculo esquelético y liene un importante papel en el ciclo de las purinas
TNFRSF17: Este receptor se expresa en linfocitos B maduros y es importante para el desarrollo de las células B y en la respuesta autoinmune. Tiene como ligando al miembro 13b de la supertamilia del factor de necrosis tumoral y activa el factor nuclear del potenciador del gen polipetidico de la cadena ligera Kappa en células B (NF~kappaB) y la proteína kinasa activada por mitógeno 8 (MAPK8/JNK). También se une a otros ligandos y envía señales de supervivencia celular y proliferación.
CD19: Molécula que se une al receptor de antígenos de los linfocitos B para disminuir el umbral de estimulación de los linfocitos a través de la estimulación por antígeno.
CD27: Miembro de la superfamilia del receptor del factor de necrosis tumoral. El receptor tiene la función de generar y mantener durante largo tiempo la inmunidad de las células T. El ligando C070 se une a él y funciona en la activación de las células B y en la síntesis de inmunoglobulinas. Las proteínas adaptadoras denominadas Factor Asociado a Receptores de Factores de Necrosis Tumoral 2 y 5 (TRAF2 Y TRAF5) median en este proceso. La proteina de unión a C027 (SIVA) es una proteína proapoptótica que juega un importante papel en la apoptosis mediada por este receptor.
C0 3B: Es una ecloenzima mullifuncional que se expresa en multitud de células y tejidos especialmente en leucocitos C038 también tiene funciones en la adhesión celular, transducción de señales y señalización por calcio.
C079A y C079B: codifican para las proteinas Ig-alpha e Ig-beta que son componentes del receptor antigénico de linfocitos B. Las moléculas Ig-alfa e Ig-beta son necesarias para la expresión y función de este receptor.
GZMB: Los linfocitos T citolíticos (CTL) y las células "natural killer" (N K) tienen la habilidad de reconocer, unir y lisar células diana específicas. La GZMB es crucial para la rápida inducción de la apoptosis de las células diana a través de la respuesta inmune generada por los linfocitos T citolílicos
IGHA1 e IGHA2: Anticuerpo con una importante presencia en las secreciones mucosas y que representa la primera línea de defensa del organismo. Existen dos subclases Inmunoglobulina A1 (lgA1) e Inmunoglobulina (lgA2)
IGHG1: Este gen se encuentra traslocado en la leucemia linfocítica crónica de células B con el gen Ciclina 01 (CCN01) y en subclases de linfomas MALT (Tejido Linfoide Asociado a Mucosa) con los genes "UM homeobox 4" (LHX4) y "Forkhead box P1 " (FOXP1 )
IGJ: Su función es unir dos monómeros o bien de Inmunoglobulina M (lgM) o bien de Inmunoglobulina A (lgA). También tiene la función de unir estas inmunoglobulinas al componente secretor
IGL@: Cada molécula de inmunoglobulina tiene dos cadenas pesadas idénticas y dos cadenas ligeras idénticas. Hay dos clases de cadenas ligeras que son kappa y lambda. Este gen abarca el locus de la cadena ligera lambda que incluye el segmento V (variable), segmento J (unión) y segmento C (constante)
IGLL1: Es un gen de la superfamilia de las inmunoglobulinas que codifica para la cadena ligera sustitutiva del receptor de células preB. Mutaciones en este gen pueden producir deficiencia de células B o agammaglobulinemia
IRF4: Pertenece a la familia de faclores reguladores del inteJierán. Es específico de linfocitos y regula negativamente los receptores tipo Ton (o TLR), que es una molécula central en la activación de la respuesta inmune innata y adaptativa
KCNN3: Regula la excitabilidad neuronal
KRTB1: Es un miembro de la familia de keratinas.
CXCL9: Su función no esta bien definida pero parece que está implicado en el tráfico de células T
PNOC: Es un neuropéptido que actua como ligando endógeno del receptor "Opiate Receptor-Like 1" (ORL 1)
POU2AF1 : Es un coactivador específico de células B y su ausencia parece estar relacionada con defectos en el desarrollo de células B y con la falta de centros germinales
BFSP2: también denominada faquinina, es una proteína estructural de filamentos del citoesqueleto Junto a la filensina forma el BF ("beaded filament")
CXCL13: Promueve la migración de linfocitos B preferentemente frente a linfocitos T y macrófagos mediante estimulaci6n con calcio
PIM2: Es una serinflreoninfprotein kinasa. Previene apoptosis y promueve supervivencia celular.
ES 2 4 11 833 A2
SMR3A: Es un homólogo funcional del gen Vcsa1 ("Variable Coding Sequence A1") Se ha asociado como un marcador de la disfunción eréctil asociada con etiología lanlo diabética como no diabética
MZB1: Está asociada con las cadenas pesadas y ligeras de la inmunoglobulina tipo M (lgM), promoviendo el ensamblaje de la IgM y su secreción
FKBP1 1.-Pertenece a la familia FKBP las cuales catalizan el plegamiento de los polipéptidos que contienen prolina. Su función es inhibida por FK506 y por rapamicina
LAX1 : Un regulador negativo de la señalización de linfocitos.
CPNE5: Proteína de unión a membrana dependiente de calcio que parece estar implicada en la regulación de fenómenos moleculares en la interfase de la membrana celular y en el citoplasma.
SLAM7: Está implicada en la activación de células NK y en la regulación de la proliferación de linfocitos B durante la respuesta inmune
DUSP26: Está asociado con la inactivación de la Proteína Kinasa activada por mitógenos 1 y 3 (MAPK1 Y MAPK3), así como con la inhibición de la proliferación de células epiteliales, lo que podría sugerir un papel como gen supresor de tumores.
FCRL2: Forma parte de la superfamilia de receptores de inmunoglobulinas. Puede ser un marcador pronóstico de leucemia linfocítica crónica.
FCRL5: También es parte de la superfamilia de receptores de inmunoglobulinas. Está implicado en el desarrollo de células B y en la linfomagénesis.
FCRLA : Este receptor media la destrucción de los antígenos reconocidos por la Inmunoglobulina G (lgG). Es proteína selectiva de células B y puede estar implicada en su desarrollo.
DERL3: Proteína que se ubica en el reticulo endoplasmático con la función de degradar glicoproteinas mal plegadas
MTSS1L: Puede estar implicada en el empaquetamiento de la actina. Pertenece a la familia MTSS1 (Supresores de Metástasis Tipo 1 l.
JSRP1: El retículo sarco plasmático es un compartimento celular que controla la concentración de calcio intracelular y está implicado en las funciones de excitación-contracción de este compartimento celular. En ratones se ha visto que esta proteína interacciona con proteínas claves implicadas en estos procesos de excitaci6n-contracción.
C50rf20: Este gen se expresa en células dendríticas, que son potentes células presentadoras de antígenos implicadas en activar las células T nativas para iniciar la respuesta inmune específica de antígeno.
MEI1: Defectos en su expresión están relacionados con parada en meiosis y se asocia a fenómenos de azoospermia
GPR114: Proteína G asociada a receptores con un extremo N terminal que contiene regiones ricas en serinaltreonina. Se ha descrito su expresión en linfocitos citotóxicos.
IGHV5-78, FER1L4, IGKV1D-8, KIAA0125, LOC401847, LOC642424, LOC100132941, LOC100133862, LOC100287723, IGHV1-24 y LOC100293440: a dia de hoy, todavia no se conoce la función de estos genes
El término "muestra biológica" incluye, pero sin limitarnos, tejidos y/o fluidos biológicos de un individuo, obtenidos mediante cualquier método conocido por un experto en la materia que sirva para tal fin
El término "sujeto" se refiere a un individuo, preferentemente humano, que ha sido diagnosticado de CNMP.
Una realización preferida del primer aspecto de la invención se refiere a un método que además comprende la comparación de los datos útiles obtenidos de la muestra biológica aislada de un nuevo sujeto, con los valores de expresión de referencia para los genes de la labia 1 obtenidos de sujetos con CNMP estadio I o 11 en los que el pronóstico es conocido (muestra de referencia) La comparación permite la identificación del nuevo sujeto como un sujeto de buen pronóstico o de mal pronóstico. A partir de ahora, nos referiremos a este método como al "método segundo de la invención"
El término "muestras de referencia" tal como se entiende en la presente invención se refiere, por ejemplo, pero sin limitarse, a las muestras obtenidas de ind ividuos que presenten un perfil molecular conocido. Este perfil molecular puede ser de buen pronóstico o de mal pronóstico.
Un experto en la materia podria clasificar un nuevo paciente en el grupo de buen o en el grupo de mal pronóstico al comparar sus datos de expresión para los 50 genes de la invención con los datos de expresión para los 50 genes en las muestras de referencia. Estas muestras de referencia son un grupo de muestras de las que se conoce el perfil de
ES 2 4 11 833 A2
expresión de los 50 genes y la presencia o no de recidiva. Por ejemplo, pero sin limitarse, un nuevo sujeto cuyo pertil de expresión sea similar al grupo de referencia de buen pronóstico puede ser clasificado como perteneciente al grupo de buen pronóstico, el cual tiene una probabilidad media de ILE a los 3 años del 85% y{o a los 5 años del 79%_Por ejemplo, pero sin limitarse, un nuevo sujeto cuyo perfil de expresión sea similar al grupo de referencia de mal pronóstico puede ser clasificado como perteneciente al grupo de mal pronóstico, el cualliene una probabilidad media de ILE a los 3 años del 62% yfo a los 5 años del 48%
La determinación del pronóstico de nuevos pacientes diagnosticados con CNMP en estadios I o 11 implica la clasificación de esos pacientes en uno de los dos grupos de referencia previamente definidos: grupo de buen pronóstico o grupo de mal pronóstico. Estos grupos de referencia están constituidos por las muestras de referencia.
La comparación de los datos útiles obtenidos de la muestra biológica de un nuevo sujeto, con los valores de expresión de referencia para los genes de la tabla 1 obtenidos de sujetos con CNMP estadio I o 11 en los que el pronóstico es conocido (muestra de referencia), puede llevarse a cabo mediante cualquier método estadístico de predicción conocido en el estado de la técnica, como por ejemplo, pero sin limitarse, en cualquiera de los métodos descritos en Simon R. et al. J Clin Oncol 2005; 23:7332-41.
En una realización preferida del método segundo de la invención, la comparación se realiza mediante el método del centroide compacto mas cercano. En adelante, el "método tercero de la invención"
Se entiende como el "método del centroide compacto más cercano" ("nearest shrunken centroid method") el método de clasificación descrito en Tibshirani R. et al. PNAS. 2002, 99:6567-6572 y aplicado a través de la herramienta Predicción de Análisis por Microarrays ("Prediction analysis of microarrays" o PAM). La herramienta "PAM" fue desarrollada por la Universidad de Standford y es de libre acceso.
La determinación del pronóstico de CNMP de estadios I o 11 puede establecerse, aunque sin limitarse, mediante la determinación de un "valor de referencia" para el grupo de buen pronóstico (valor 1) Y de otro para el grupo de mal pronostico (valor 2). El pronóstico puede realizarse estimando la distancia entre los valores de expresión de la nueva muestra y los ' valores de referencia" de cada uno de los dos grupos. Si la distancia entre la nueva muestra y el valor 1 es menor que la distancia entre la nueva muestra y el valor 2, se podra determinar el pronóstico favorable. Por el contrario, si la distancia entre la nueva muestra y el valor 1 es mayor que la distancia entre la nueva muestra y valor 2, se podrá determinar el pronóstico desfavorable.
Los valores de referencía de cada grupo, se pueden calcular en base a los valores de expresíón de los 50 genes en las muestras de la matriz de referencia o "matriz de desarrollo" y vendrán expresados por tanto mediante un vector de 50 componentes. El calculo del valor de referencia de cada grupo (en nuestro caso el grupo de buen pronóstico y el grupo de mal pronóstico), se obtiene de sumar al valor promedio global de todas las muestras, un segundo factor definido como la distancia (estadístico "1") entre el valor promedio de expresión de los 50 genes de dicho grupo con respecto al valor promedio de expresión de los 50 genes de todas las muestras incluidas en la matriz de entrenamiento. Los datos del segundo factor serán estandarizados teniendo en cuenta, la variabilidad de expresión de cada uno de los 50 genes dentro del grupo analizado y teniendo en cuenta un valor de convergencia fi que permite evaluar el poder predictivo de cada uno de los genes. Se entiende como distancia entre dos muestras, grupos o subtipos, la cuantificación de sus diferencias de expresión.
Aunque el valor final de referencia o "shrunken centroid" obtenido para cada grupo se basa en los valores de expresión, su valor real es adimensional y no es directamente proporcional a los datos de fluorescencia inicialmente obtenidos en cada muestra. Dicho valor de referencia, en cada grupo, contiene 50 componentes, una por cada uno de los genes analizados
Una vez calculados los valores de referencia para cada grupo, el método del "nearest shrunken centroid", es capaz de asignar nuevas muestras (que en nuestro caso conforman la matriz de validación) a cada uno de los grupos definidos La distancia entre la nueva muestra y cada uno de los grupos es relativa a la diferencia entre los valores de expresión de los 50 genes en la muestra nueva con respecto a las componentes del centroide compacto ("shrunken centroid") que representan cada grupo. La cuantificación de las distancias podrían medirse, aunque sin limitarse, mediante la distancia euclidea (Tibshiran i R. Diagnosis of multiple cancer types by shrunken centroids of gene expression. PNAS 2002; 99(10):6567-72). Como se mencionó con anterioridad, la nueva muestra será asignada al grupo del que se encuentre a una menor distancia.
Por todo lo aqui descrito, un segundo aspecto de la invención se refiere a un método in vitro para el pronóstico del CNMP de estadio I o 11 caracterizado por-
a.
la detección y cuantificación del producto de expresión de los genes de la tabla 1 en una muestra de referencia;
b.
el cálculo de un valor de referencia (valor 1) para cada producto de expresión de los genes de la tabla 1 en las muestras de referencia de pronóstico favorable (grupo de buen pronóstico) y el calculo de un
ES 2 4 11 833 A2
valor de referencia (valor 2) en las muestras de referencia de pronóstico desfavorable (grupo de mal pronóstico) mediante el uso del mélodo del centroide mas cercano;
c.
la detección y cuantificación del producto de expresión de los genes de la labia 1 en la muestra biológica de un nuevo sujeto en el que el pronóstico es desconocido (muestra de estudio);
d.
la comparación mediante el uso del método de clasificación del cenlroide compacto más cercano de los valores obtenidos en la detección y cuantificación del producto de expresión de los genes de la tabla 1 en la muestra de estudio con los valores de referencia obtenidos en los grupos de buen y mal pronóstico.
e.
la asociación de la muestra de estudio al grupo de buen pronóstico o al grupo de mal pronóstico según lo establecido en el método del centroide compacto más cercano.
En adelante este método se denominará -método cuarto de la invención".
Una realización preferida del método cuarto de la invención se refiere al método donde el método del centroide compacto más cercano se lleva a cabo a través de la aplicación de Predicción de Análisis de Microarrays (PAM).
Una realización preferida del primer y del segundo aspecto de la invención, se refiere al método donde la muestra de referencia y las muestras de estudio han sido previamente normalizadas antes de la comparación.
Se entiende por "normalización" la utilización de una muestra control que sirva para eliminar variaciones experimentales entre las distintas muestras.
Otra realización preferida del primer y del segundo aspecto de la invención, se refiere al método que además comprende la detección yfo cuantificación de al menos un producto de expresión de los genes descritos en la tabla 2.
Otra realización preferida del primer y del segundo aspecto de la invención, se refiere al método donde el producto de expresión es ARN mensajero. Una realización aún más preferida se refiere al método donde la detección yfo cuantificación del ARN mensajero se realiza mediante microarrays. Una realización también más preferida se refiere al método donde la detección yfo cuantificación del ARN mensajero se realiza mediante RT -PCR.
Otra realización preferida del primer y del segundo aspecto de la invención, se refiere al método donde el producto de expresión es una proteína. Una realización aún más preferida se refiere al método donde la detección y/o cuantificación de la proteína se realiza mediante inmuno blotting, inmunohistoquímica, cromatografia o microarrays
La detección y cuantificación del producto de expresión (ARNm, ARN complementario obtenido a partir de AONc, ADN complementario o proteina) se puede realizar utilizando los métodos conocidos por el experto en la materia. Por ejemplo, detenninando el nivel de ARNm derivado de su transcripción, previa extracción del ARN total presente en la muestra biológica aislada, lo cual puede realizarse mediante protocolos conocidos en el estado de la técnica. Para ello la muestra biológica aislada puede tratarse física o mecánicamente para romper el tejido o las estructuras celulares y liberar los componentes intracelulares a una solución acuosa u orgánica para preparar los ácidos nucleicos para un posterior analisis. Los ácidos nucleicos se extraen de la muestra por procedimientos conocidos por el experto en la materia y comercialmente disponibles. La detenninación del nivel de ARNm derivado de la transcripción de los genes de la tabla 1 puede realizarse, por ejemplo, aunque sin limitamos, mediante amplificaCión por reacción en cadena de la polimerasa (PCR), retrotranscripción en combinación con la reacción en cadena de la polimerasa (RT-PCR), RT-PCR cuantitativa, retrotranscripción en combinación con la reacción en cadena de la ligasa (RT-LCR), o cualquier otro método de amplificación de ácidos nucleicos; análisis en serie de la expresión génica (SAGE, SuperSAGE); microarrays, micromatrices o chips de AON elaborados con oligonuc1eótidos depositados por cualquier mecanismo o elaborados con oligonucleótidos sintetizados in situ mediante fotolitografía o por cualquier otro mecanismo; hibridación in situ utilizando sondas especificas marcadas con cualquier método de marcaje; mediante geles de electroforesis; mediante transferencia a membrana e hibridación con una sonda especifica; mediante resonancia magnética nuclear o cualquier otra técnica de diagnóstico por imagen utilizando nanopartículas paramagnéticas o cualquier otro tipo de nanoparticulas detectables funcional izadas con anticuerpos o por cualquier otro medio
En la presente invención se demuestra que la detección y cuantificación del ARNm total de una muestra biológica de un sujeto con CNMP de estadios I o 11 es útil para el pronóstico de dicha enfermedad. Por todo ello en una realización preferida de este aspecto de la invención el producto de expresión detectado y cuantificado es ARNm.
Por ello, otra realización preferida del primer aspecto de la invención se refiere a un método donde el producto de expresión es ARNm
Se entiende por "microarray" (microarray de expresión, chip o micromatriz) al conjunto de sondas (oligonucleótidos o ADNc) dispuestas de manera ordenada sobre una superficie sólida, que permite analizar simultáneamente la expresión del genoma completo de un organismo. Cada una de las sondas representa especificamente un gen determinado al poseer una secuencia complementaria al ARNm transcrito por dicho gen, posibilitando así, la medición de los niveles de expresión de todos los genes que conforman el genoma al mismo tiempo y en un único experimento. Para la utilización
ES 2 411 833 A2
de microarrays y obtención de datos a partir de ellos, la fase experimental de los microarrays puede constar de los pasos que se describen a continuación. En primer lugar, el ARN tolal se relrolranscribe usando como cebador un cebador específico para mensajero (PolidT) y una enzima relrolranscriptasa. Utilizando como molde el ADNc de doble cadena obtenido anteriormente, se sintetizó el ARNc, a la vez que se llevaba a cabo el proceso de amplificación y marcaje de la muestra. El ARNc marcado obtenido se purificó mediante columnas. El ARNc es fragmentado en secuencias mas pequeñas e hibridado al microarray_ Dicho proceso de hibridación se lleva a cabo en un horno de hibridación durante un periodo largo de tiempo. En este proceso el ARNc marcado se une de manera específica a los oligonucleótidos sintetizados en el microarrays. Posteriormente el microarray es lavado para eliminar todo el ARNc excedente no unido a los oligonucleótidos
De acuerdo con la presente invención el producto de expresión, preferiblemente ARNm o ADNc o ARN complementario (ARNc) obtenido a partir de ADNc, puede ser marcado o etiquetado mediante técnicas bien conocidas en el estado de la técnica. Etiquetas detectables incluyen, por ejemplo, isótopos radiactivos, etiquetas fluorescentes, etiquetas quimioluminiscentes, etiquetas bioluminiscentes o etiquetas enzimáticas. Las etiquetas fluorescentes pueden ser distintas en el caso del marcaje del producto de expresión de la muestra biológica y del producto expresión de la muestra control.
Por otra parte, la detección y cuantificación también se pueden realizar mediante RT-PCR, por lo que otra realización preferida del primer aspecto de la invención se refiere a un método según la reivindicación 7 donde la detección y/o cuantificación del ARNm se realiza mediante RT-PCR o preferiblemente mediante RT-PCR a tiempo real. El proceso de RT-PCR se puede nevar a cabo en dos fases:
Retrotranscripción: se produce la unión entre un cebador y el ARNm mediante un proceso de incubación conjunta de ambos productos. Seguidamente se produce la retrotranscripción propiamente dicha utilizando enzimas de transcripción inversa.
PCR posterior: se produce la amplificación del ADNc obtenido en la fase anterior mediante la técnica de reacción en cadena de la polimerasa (PCR). Para cada muestra y para cada transcrito de los genes analizados se llevará a cabo la reacción de PCR de manera individualizada. Este proceso implica la repetición cíclica de 3 fases: fase de desnaturalización del ADNc, fase de unión especifica del oligonucleótido del gen en estudio a la hebra del ADNc desnaturalizado y fase de elongación a partir del oligonucleótido unido mediante la que se sintetizará una hebra nueva de ADNc. Al tratarse de un proceso que se mide en tiempo real, es necesario usar una molécula fluorescente para monitorizar lo que sucede a lo largo del proceso
La cuantificación por otro lado también se puede realizar determinando el nivel de proteína derivado de la traducción de los ARNm transcritos a partir de los 50 genes de la invención. Esta cuantificación proteica se puede realizar mediante cualquier método conocido por un experto en la materia que sirva para tal fin, como por ejemplo, pero sin limitarnos, métodos de inmunodetección (como western blot, ELlSA, inmunohistoquímica, inmunocitoquímica, inmunofluorescencia), métodos basados en marcajes isobaricos (como ilRAQ -isobaric Tag for Relative and Absolute Quantitation-, o ICAl -Isotope-Coded Affinity Tag-) o en marcajes isotópicos (como SILAC -Stable Isolopes Labeling by Amino Acids in Cell Culture-) o basados en marcajes fluorescentes (como 2D-DIGE -Difference in Gel Electrophoresis-), así como métodos basados en espectrometría de masas (MRM, -Multiple Reaction Monitoring-) Por lodo ello en otra realización preferida de este aspecto de la invención es el método donde el producto de expresión es una proteína.
Otra realización preferida del primer y segundo aspecto de la presente invención se refiere al método donde la detección ylo cuantificación de la proteína se realiza mediante inmuno blotling, inmunohistoquimica, cromatografía o arrays de expresión de proteínas.
Los términos "secuencia de aminoácidos· o "proteína" se usan aquí de manera intercambiable, y se refieren a una forma polimérica de aminoácidos de cualquier longitud, que pueden estar, o no, química o bioquímica mente modificados. El término "residuo" corresponde a un aminoácido
Otra realización preferida del primer y segundo aspectos de la presente invención se refiere al método donde la muestra biológica se selecciona de la lista que comprende: tejido, sangre, plasma, suero, linfa, lavado broncoalveolar o fluido ascítico
Otra realización también preferida del primer y segundo aspectos de la presente invención se refiere al método donde la muestra biológica es fresca, congelada, fijada o fijada y embebida en parafina
Otra realización preferida del primer y segundo aspectos de la invención se refiere a un método donde el sujeto es un humano.
Un tercer aspecto de la invención se refiere al uso in vitre de los productos de expresión de los genes de la tabla 1 como marcador pronóstico de cáncer de pulmón no microcítico de estadio I o 11.
Un cuarto aspecto de la invención se refiere a un kit que comprende las sondas que reconocen el ARN mensajero, producto de la expresión de los genes de la tabla 1, o el ARNc o ADNc a dicho ARNm, o anticuerpos que reconocen una
ES 2 4 11 833 A2
proteína producto de expresión de los genes de la labia 1 La cuantía de sondas utilizadas para cada gen puede variar en número. Preferiblemente el kit comprende sondas, que consisten en las sondas que reconocen el ARN mensajero producto de la expresión de los genes de la labia 1 Más preferiblemente las sondas son las secuencias descritas como SEO ID NO: 1 a SEO ID NO: 66 y que reconocen específicamente los 50 genes de la labia 1. En adelante nos referiremos a este kit como al "kit primero de la invención"
Una realización preferida del cuarto aspecto de la invención se refiere al kit que además comprende al menos una sonda o un anticuerpo que reconoce un producto de expresión de los genes de la labia 2. En adelante nos referiremos a este kit como al "kit segundo de la invención"
Otra realización preferida del cuarto aspecto de la invención se refiere a que el kit puede comprender al menos una retrotransciptasa, o una ARN polimerasa o un f1uoróforo. Por lo que una realización preferida del tercer aspecto de la invención se refiere a un kit que además comprende al menos unos de los reactivos seleccionados de la lista que comprende: retrotranscriptasa, una ARN polimerasa o un f1uoróforo. Ademas el kit puede comprender una mezcla de deoxinucleótidos tri-fosfato (dNTPs), una mezcla de nucleótidos tri-fosfato (NTPs), deoxiribonucleasa (ONasa), inhibidores de la ribonucleasa (RNasa), Oithiothreitol (OTI), pirofosfatasa inorgánica (PPi) y los tampones necesarios para las enzimas proporcionadas en el kit
Además, la presente invención también se refiere al kit donde las sondas o los anticuerpos estan preferiblemente situados en un soporte sólido, por ejemplo, pero sin limitarse, cristal, plástico, tubos, placas mullipocillo, membranas, o cualquier otro soporte conocido. Por lo que una realización preferida del cuarto aspecto de la invención se refiere a un kit donde las sondas o los anticuerpos están preferiblemente situadas en un soporte sólido
Un quinto aspecto de la invención se refiere al uso del kit del cuarto aspecto de la invención para la obtención de datos útiles para el pronóstico de CNMP estadios I o 11. Además, la obtención de datos puede ser útil para la administración de tratamiento adyuvante, por ejemplo quimioterapia. Por lo que también se refiere al uso del kit primero de la invención para la evaluación de la necesidad de suministrar dicho trata miento
A lo largo de la descripción y las reivindicaciones la palabra "comprende" y sus variantes no pretenden excluir otras caracteristicas técnicas, aditivos, componentes o pasos. Para los expertos en la materia, otros objetos, ventajas y características de la invención se desprenderán en parte de la descripción y en parte de la práctica de la invención. Los sigu ientes ejemplos y figuras se proporcionan a modo de ilustración, y no se pretende que sean limitativos de la presente invención
DESCRIPCION DE LAS FIGURAS
FIG. 1. Muestra la probabilidad de ILE en los dos subtipos histológicos principales de CNMP. Curva de KaplanMeier que muestra la probabilidad de ILE de los dos subtipos histológicos principales del CNMP, adenocarcinoma y carcinoma escamoso en la matriz de desarrollo. ILE, intervalo libre de enfermedad; p, es la probabilidad asociada a que las diferencias encontradas en ellLE entre los subgrupos analizados sean debidas al azar.
FIG. 2. Muestra la probabilidad de intervalo libre de enfennedad en estadios I y 11. . Curva de Kaplan-Meier que muestra la probabilidad de ILE para estadios I y 11 de CNMP en la matriz de desarrollo. ILE, intervalo libre de enfermedad; p, es la probabilidad asociada a Que las diferencias encontradas en el ILE entre los subgrupos analizados sean debidas al azar
FIG. 3. Muestra la agrupación jerárquica de las muestras de la matriz de desarrollo analizadas en función de su perfil molecular con 3.232 genes. Se muestra la agrupación ("clustering") jerárquica de 84 muestras con 3.232 genes (ver filtrado 3 del ejemplo 1) según el método descrito en Quackenbush J. Nat Rev Gene!. 2001 ;2(6):418-27. Las muestras están diferenciadas en función del subtipo histológico: linea continua, subtipo adenocarcinoma; línea rayada, subtipo escamoso; linea continua terminada en ., otros subtipos de CNMP. Se define "perfil molecular": como el conjunto de datos genómicos (en nuestro casos niveles de expresión del ARNm) capaz de caracterizar e identificar un sujeto o muestra. Los subtipos moleculares encontrados muestran una clara asociación con los subtipos histológicos de los tumores.
FIG. 4. Muestra la probabi lidad de ILE en función de los grupos moleculares obtenidos en la matriz de desarrollo a partir de 3.232 genes. Curva de Kaplan-Meier que muestra la probabilidad de ILE de los dos subtipos moleculares principales del CNMP encontrados en la matriz de desarrollo. ILE, intervalo libre de enfermedad; p, es la probabilidad asociada a que las diferencias encontradas en el ILE entre los subgrupos analizados sean debidas al azar.
FIG. 5. Muestra la agrupación jerárquica de las muestras de la matriz de desarrollo analizadas en función de su perfil molecular con 2.160 genes. Análisis del patrón de expresión génica global de los tumores de la matriz de desarrollo para la obtención de grupos moleculares utilizando el listado de 2.160 genes (ver filtrado 4 del ejemplo 1). A. se muestra la agrupación molecular ("clustering") jerárquica de 84 muestras con 2.160 genes. B, agrupación perfeccionada por el método de "k-means" descrito en Quackenbush J. Nat Rev Gene!. 2001;2(6):418-27. En ambos casos resulta en tres grupos moleculares (Grupo 1, 2 Y 3) o "clusters"
ES 2 411 833 A2
FIG. 6. Muestra la probabilidad de ILE en los tres grupos moleculares obtenidos en función de su perfil
molecular con 2.160 genes en la matriz de desarrollo. Curva de Kaplan-Meier que muestra la probabilidad de ILE de los tres grupos moleculares obtenidos utilizando el lisiado de 2.160 genes 'i la técnica de "k-means" ILE, intervalo libre de enfermedad; p, es la probabilidad asociada a que las diferencias encontradas en el ILE entre los subgrupos analizados sean debidas al azar. (x), indica el número de muestras que hay en cada uno de los grupos analizados
FIG. 7. Muestra la probabilidad de ILE en las muestras de la matriz de validación de acuerdo a la clasificación de 3 grupos moleculares. Curva de Kaplan-Meier que muestra la probabilidad de ILE para las muestras de la matriz de validación (serie externa, Roepman et al.) agrupadas en función de los perfiles moleculares (Grupo 1, Grupo 2 y Grupo 3) previamente observados en la matriz de desarrollo y definidos a través de un predictor de 1.000 genes generado con la aplicación "PAMO ILE, intervalo libre de enfermedad; p, es la probabilidad asociada a que las diferencias encontradas en el ILE entre los subgrupos analizados sean debidas al azar. (x), indica el número de muestras que hay que hay en cada uno de los grupos analizados.
FIG. 8. Muestra la probabilidad de ILE en las muestras de la matriz de validación de acuerdo a la clasificación establecida mediante el predictor de 50 genes. Curva de Kaplan-Meier que muestra la probabilidad de ILE de los dos grupos moleculares obtenidos en la matriz de validación utilizando el predictor de 50 genes. ILE, intervalo libre de enfermedad; p, es la probabilidad asociada a que las diferencias encontradas en el ILE entre los subgrupos analizados son debidas al azar. (x) indica el número de muestras que hay en cada una de las ramas de la curva de Kaplan-Meier
FIG. 9. Probabilidad de ILE en las muestras de la matriz de validación de acuerdo a la clasificación establecida mediante el predictor de 50 genes de manera independiente para estadios I y 11. Curva de Kaplan-Meier que muestra la probabilidad de ILE de los dos grupos moleculares obtenidos en la matriz de validación con el predictor de 50 genes generado con la aplicación "PAM " para: A, el estadio 1, y B, estadio 11. ILE, intervalo libre de enfermedad; p, es la probabilidad asociada a que las diferencias encontradas en el ILE entre los subgrupos analizados son debidas al azar.
(x) indica el número de muestras que hay en cada una de las ramas de la curva de Kaplan-Meier.
EJEMPLOS
Los siguientes ejemplos específicos que se proporcionan en este documento de patente sirven para ilustrar la naturaleza de la presente invención. Estos ejemplos se incluyen solamente con fines ilustrativos y no han de ser interpretados como limitaciones a la invención que aquí se reivindica. Por tanto, los ejemplos descritos más adelante ilustran la invención sin limitar el campo de aplicación de la misma
Ejemplo 1: Obtención del predictor de 50 genes
1.1 .-Materiales y métodos 1.1.1 Selección de pacientes
En este estudio se han incluido 84 pacientes (12 mujeres y 72 varones con media de edad de 66,5 -rango de 36-82 años-) diagnosticados en estadios iniciales (60 pacientes estadio I y 24 pacientes estadio 11) de CNMP durante los años 2001 a 2008 en el Hospital Clinico San Carlos (HCSC) de Madrid. Todos los pacientes cumplieron los siguientes criterios de inclusión: pacientes con tumores completamente resecados, sin afectación de ganglios mediastinicos, sin tratamiento quimioterapico y de los cuales existiera material tumoral congelado en el biobanco del HCSC perteneciente al subprograma RETICS del Instituto de Salud Carlos 111 (número de expediente R0090076f0102). Los datos recogidos para el estudio se dividen en datos clínicos del paciente (edad de diagnóstico, sexo y habito tabáquico) y datos histológicos del tumor (subtipo histológico, tamaño tumor, estadio tumoral _7a Clasificación TNM (Kligerman S. American Journal of Roentgenology 2010. 194:562-573}-, grado de diferenciación, queratinización, presencia de linfocitos polimorfonucleares -PMN-, afectación ganglionar, mutaciones de k-ras, necrosis, estroma tumoral, inflamación crónica, presencia de linfocitos intratumorales -TIL-, localización por lóbulos pulmonares y tipo de recid iva -loco regional o a distancia-)
1.1.2. Muestras tumorales. Extracción y purificación del ARN
Siguiendo el protocolo de congelación de las muestras incluidas en el biobanco del HCSC, los tumores de CNMP se recogieron inmediatamente después de la cirugía y se congelaron y almacenaron a -80"C. Se llevó a cabo la revisión histopatológica de los tumores congelados con el fin de que todos los pacientes incluidos en el estudio tuvieran una representación tumoral como mínimo del 70% en la muestra utilizada. Paralelamente, se recogieron de estos mismos pacientes, muestras de parénquima pulmonar no tumoral que también fueron congeladas siguiendo el mismo protocolo. El ARN proveniente de estas últimas muestras se utilizó para crear la muestra control (un pool de ARN de tejidos normales). En todos los casos, el ácido ribonucleico (ARN o RNA) total fue extraído directamente de las muestras congeladas utilizando Trizol® y un homogeneizador de tejidos. Posteriormente fue tratado con ONAsa y cuantificado en el espectofotómetro NanoOrop NO-1000®. La calidad del ARN extraído se midió en Bioanalyzer 2100® mediante el RIN (o Número de Integridad del ARN) y únicamente las muestras con una buena calidad de ARN (RIN ,. 7,5), fueron incluidas para el estudio
ES 2 4 11 833 A2
1_1_3. Perfil de expresión por microarrays
El perfil de expresión de los 84 tumores se determinó utilizando microarrays de oligonucle61idos de genoma completo de Agilent® (G4112F) siguiendo el protocolo suministrado por el fabricante. Brevemente, se utilizó doble marcaje, con cianina-S (Cy5) para cada uno de los 84 tumores incluidos en el estudio y con cianina-3 (Cy3) para la muestra control, compuesta por un "pool" de 42 muestras de parénquima no tumoral de pulmón. Esta muestra control se introdujo en cada uno de los experimentos (la misma en lodos ellos) para poder identificar y corregir las variaciones técnicas introducidas durante la fase experimental del análisis. Tras esta corrección (denominada normalización) el dato generado es el ratio entre la fluorescencia del tumor y la muestra control
Durante las etapas de marcaje e hibridación se incluyeron los "Spikelns·, que son 10 transcritos control sintetizados in vitro que derivan del transCfiptoma del Adenovirus E1A, que no interaccionan con el ARNm humano y cuya concentración inicial es conocida. El conocimiento "a priori" de la concentración inicial de cada uno de los "Spikelns·, nos permite predecir a qué nivel de fluorescencia deberían emitir estos transcritos una vez hibridados en el microarray y por tanto poder utilizarlos como control de calidad de la fase experimental.
Los microarrays fueron escaneados y cuantificados usando el escáner de Agilent® y el programa Feature Extraction®
(10.7.3) respectivamente. Para la normalización de los datos extraídos se utilizó la técnica Lowess o "Locally Weighted Scatterplot Smoothing· (C/eve/and WS: Journal of the American statisticar Association 1979, 74:829-836; Cleveland WS, et al. Joumal ofthe American StatisticaJ Association 1988, 83:596-610.)
1.1.4. Análisis de datos
Para la obtención del método de la invención, se partió de un listado inicial de 41.000 sondas presentes en el microarrays de oligonucleótidos de genoma completo de Agilent®. A partir de un proceso de fillrado se llegó hasta una clasificación molecular que finalmente derivó en la creación del predictor de la invención compuesto por sólo 50 genes El método se desarrolló siguiendo los siguientes pasos de filtrado '
1.-Filtrado por "fIags": exclusión de sondas con baja nuorescencia o con problemas durante el proceso de hibridación en más de un 10% de las muestras. El nuevo listado incluia 24.617 sondas
2.-Promedio de las sondas con el mismo identificador con el objetivo de trabajar con valores de expresión únicos para cada gen. El nuevo listado incluia 17.881 genes
3.-Filtrado por expresión: selección de genes con una variación de expresión al menos de 3 veces respecto a la mediana de ese gen en al menos el 10% de las muestras. El nuevo listado incluyó un total de 3.232 genes (Fig. 3). Una vez generados los grupos moleculares a partir de este listado de 3.232 genes, se evaluó la clasificación molecular obtenida para conocer si existía o no asociación con el intervalo libre de enfermedad (ILE) (F19 4)
4.-Filtrado histológico: se eliminaron los genes que caracterizan las diferencias histológicas entre los principales subtipos histológicos del CNMP (adenocarcinoma y carcinoma escamoso). Para ello, se seleccionaron los genes diferencialmente expresados (p-valor < 0,01 Y diferencia de expresión> 1,5) Y el listado generado (1.072 genes) se excluyó del listado in icial (3 .232 genes). Se genera por tanto un listado de
2.160 genes que se utilizan para la clasificación molecular final de los 84 tumores
La estrategia utilizada para el descubrimiento de los grupos moleculares consistió en aplicar en primer lugar un método de análisis no supervisado, agrupamiento o "clustering" jerárquico (Fig. 5A), ya continuación un perfeccionamiento de los grupos moleculares obtenidos mediante un segundo método, método de k-Means (Fig. 5B), el cual permite disminuir la heterogeneidad intra-grupo y aumentar la variabilidad inter-grupo. El listado de 2.160 genes se usa para construir inicialmente la clasificación molecular (que tiene 3 grupos). Una vez generados estos grupos moleculares, se evaluó la clasificación molecular obtenida para conocer si existía o no asociación con el intervalo libre de enfermedad (ILE) (Fig 6). El ILE se define como el tiempo que transcurre desde la fecha de la cirugía hasta que se confirma la recid iva del paciente
En el análisis estadístico se han utilizado curvas de Kaplan-Meier y el test log-rank para evaluar la probabilidad de cada subtipo molecular respecto a la recidiva (Clark TG. British Joumal of Cancer 2003. 89: 232-238). Además, con el método de regresión proporcional de Cox se calcula el "hazard ratio· para los grupos moleculares
Asimismo, se realizó un análisis de las vías moleculares que se encuentran alteradas de manera significativa entre los grupos moleculares obtenidos. Se llevó a cabo utilizando la herramienta GSEA ("Gene Set Enrichment Análisis" o análisis de enriquecimiento de conjuntos de genes) (Subramanian A et al. PNAS 2005102 (43) 15545-15550 Y Mootha VK et al. Nat Gen 2003). Sólo se evaluaron las vias moleculares con una representación minima de más de 15 genes y se utilizaron 100.000 permutaciones para asegurar los resultados. Para obtener los resultados de GSEA se partiÓ del listado original de 17.881 genes ya que cuando se analizan vías moleculares conviene incluir todos los genes disponibles que cumplan los controles de calidad (17.881 genes), ya que diferencias no significativas de expresión en un
ES 2 4 11 833 A2
grupo de genes pueden sin embargo ser claves, para definir qué caminos de señalización ("palhways") estan alterados entre los grupos
1.1.5. Validación de los 3 grupos moleculares en una serie externa.
Para la validación de la clasificación molecular obtenida, se utilizó la matriz de datos publicada por el grupo de Roepman y colaboradores (Roepman P el al. Glin Caneer Res 2009. 15:284-290). La matriz de validación incluye los datos de expresión de 162 pacientes diagnosticados de los mismos subtipos histológicos que los de la invención
El lermino "matriz de entrenamiento" o "matriz de desarrollo" se refiere a las muestras del biobanco del HCSC (n= 84). El término "matriz de validación" se refiere al conjunto de muestras publicado por Roepman et al utilizado para la validación de la clasificación molecular. Por "matriz" se entiende el conjunto de datos de expresión obtenidos en una serie de pacientes mediante microarrays.
Para la validación se ha generado una matriz de datos común que incluye 246 muestras (84 de la matriz de desarrollo + 162 de la matriz de validación) cada una de ellas con 17.881 genes. Con la matriz de desarrollo se obtuvo un prediclor, mediante la aplicación PAM (Análisis de Predicción de Microarray) (Tibshirani R. el al. PNAS 2002; 99(1 0):6567-72) que fue evaluado en la matriz de validación estudiando su asociación, mediante la curva de Kaplan-Meier, con el ILE. El modelo de regresión proporcional Cox se utilizó para confinnar el poder pronóstico de nuestro prediclor
1.1.6. Obtención y validación del Prediclor de 50 genes
Los 3 grupos moleculares generados mediante el filtrado histológico, se agruparon en 2 grupos, grupo de buen pronóstico o grupo 3 y grupo de mal pronostico o grupo 1+2, debido a la similitud pronóstica de ambos grupos moleculares. Asi, con dos grupos y partiendo de 2.160 genes se seleccionan, mediante la aplicación de PAM, 50 genes (los genes de la invención que se muestran en la tabla 1) capaces de clasificar nuevas muestras en base a estos dos grupos pronóstico en CNMP de estadios I o 11. En base a este predictor de 50 genes, las muestras de la matriz de validación fueron clasificadas en el grupo de buen pronóstico o en el de mal pronóstico. Las curvas de Kaplan-Meier y el modelo de regresión proporcional de Cox se utilizaron para validar el poder pronóstico de nuestro prediclor (Figs.8, 9A y 9B)
1.1.7. Explicación del análisis con PAM (Tibshirani R. et al. PNAS. 2002, 99:6567-6572).
Para ejemplificar esta descripción, utilizaremos como ejemplo la creación del predictor de 50 genes para dos grupos moleculares (buen y mal pronóstico) mencionados en el apartado anterior. Así pues, usando como herramienta de clasificación la aplicación PAM, el proceso de clasificación pronóstica, requiere como punto de partida el cálculo de un uvalor de referencia" para cada uno de los dos grupos. Estos "valores de referencia" se obtienen a partir de las muestras de los pacientes que conforman la denominada "matriz de entrenamiento" o "matriz de desarrollo" y de los que "a priori" se conoce su clasificación (pues fueron con ellas con las que se definió lo que era el grupo de buen y mal pronóstico). A partir de los pacientes del grupo de buen pronóstico obtendremos el "valor 1 de referencia" y a partir de los pacientes del grupo de mal pronóstico obtendremos el "valor 2 de referencia" Cada uno de los valores de referencia vendrá expresado como un vector de 50 componentes (una por cada uno de los genes de la invención) y se calculara como la suma de dos subvectores cada uno de ellos expresados también con 50 componentes. El primer subvector es común para los dos valores de referencia mientras que el segundo es especifico para cada uno de los dos valores de referencia que se quieren calcular. El primer subvector consta de 50 componentes, cada una de las cuales corresponde al valor medio de expresión de uno de los 50 genes a lo largo de todas las muestras que conforman la matriz de entrenamiento
o desarrollo independientemente del grupo en el que se encuentren clasificadas (es decir los 84 tumores de nuestra matriz). El segundo subvector también vendrá definido por 50 componentes (cada una de las cuales representa un gen) que vendrán definidas por un estadistico "t~ que compara para dicho gen las diferencias entre el primer subvector y el valor medio de expresión de ese gen en las muestras incluidas en el grupo para el que se quiere calcular el valor de referencia (o bien el grupo de buen pronostico (29 muestras) o bien el grupo de mal pronóstico (55 muestras)). Los datos del segundo subvector serán estandarizados teniendo en cuenta, la variabilidad de expresión de cada uno de los 50 genes dentro del grupo analizado y teniendo en cuenta un valor de convergencia /::,. que permite evaluar el poder predictivo de cada uno de los genes. Las transformaciones mencionadas harán que aunque el "valor de referencia" o "shrunken centroid" obtenido para cada grupo se basa en valores de expresión, su valor real sea adimensional y no sea un reflejo de los datos de fluorescencia iniciales de cada muestra. Una vez calculado el "valor de referencia" o "shrunken centroid" para cada grupo, el PAM es capaz de asignar las nuevas muestras, que en este ejemplo conformaron la matriz de validación (162 muestras), a cada uno de los grupos previamente definidos. La aplicación de esta invención para conocer el pronóstico de los nuevos pacientes se realiza calculando la distancia entre los valores de expreSión de los 50 genes de la nueva muestra con respecto a las 50 componentes del "valor de referencia" o "shrunken centroid" de cada grupo. Si la distancia entre la nueva muestra y el ' valor 1 de referencia" es menor que la distancia entre la nueva muestra y el "valor 2 de referencia", se podrá determinar el pronóstico favorable para el nuevo paciente. Por el contrario, si la distancia entre la nueva muestra y el "valor 1 de referencia" es mayor que la distancia entre la nueva muestra y "valor 2 de referencia", se podrá determinar el pronóstico desfavorable para el nuevo paciente. Durante estos últimos cálculos también se introducen faclores que corrigen el resultado teniendo en cuenta la va riabilidad de expresión dentro de los grupos y la probabilidad de pertenecer a un determinado grupo teniendo en cuenta su tamaño muestral con respecto al de la población analizada La cuantificación de las distancias se mide utilizando la distancia euclidea
ES 2 4 11 833 A2
1.2.-RESULTADOS
1.2.1 Análisis de asociación del lLE con las variables clínicas e hislopatológicas
Se llevó a cabo un primer análisis estadístico para comprobar si existía una asociación entre las variables histopalológicas más importantes en el manejo rutinario del CNMP (la clasificación histológica del tumor, el estadio, elc.), con el ILE. Las curvas de Kaplan-Meier obtenidas no mostraron una asociación estadísticamente significativa del ILE con el tipo hislopatológico (Fig. 1), el estadio (Fig. 2) o con cualquier otra va riable analizada (datos no mostrados). Solamente la presencia de mutaciones en el gen K-Ras mostró una tendencia hacia la asociación con un peor pronóstico (p=O,07)
1.2.2. Grupos moleculares a partir de 3.232 genes
Mediante el método de clustering jerárquico (centrado de Pearson y Average linkage (Quackenbush J. Nat Rev Genet 2001;2(6):418-27) se identifican dos subtipos moleculares principales que muestran una clara asociación con los subtipos histológicos más representados en nuestra serie, separando molecularmente, los tumores del subtipo adenocarcinoma de los tumores del subtipo escamoso (Fig. 3). Estos 2 subtipos moleculares no muestran diferencias estadísticamente significativas con el lLE (p == 0,350) (Fig. 4)
A la vista de estos resultados, concluimos que los grupos moleculares obtenidos utilizando el listado de 3.232 genes (que son los genes que varian su expresión al menos de 3 veces respecto a la mediana de ese gen en al menos el 10% de las muestras; paso 3 del filtrado anteriormente explicado) se encuentran condicionados por la histología de los tumores. Es importante destacar que no existen diferencias estadísticamente Significativas en el tiempo de recidiva cuando se comparan ambos grupos moleculares y recordar que tampoco existían cuando se comparaban ambos grupos clasificados según criterios histológicos.
Teniendo en cuenta que el criterio oncol6gico para el manejo de los pacientes de eNMP nos indica que la histología de los tumores sólo es importante en la enfermedad metastásica (estadio IV) y sólo en relación con el tratamiento indicado, excluimos del listado inicial de 3.232 genes aquellos que caracterizan las diferencias histológicas de los 84 tumores mediante un filtrado que incluía: T-Test a pc:0,01 con corrección para comparaciones múltiples de 8enjamini and Hochberg (8&H) (8enjamini Y and Hochberg Y. Journal of the Royal Statistical Society. 1995) y una diferencia de expresión de más de 1,5 veces. Los genes que cumplieron estos criterios de filtrado fueron excluidos, resultado un listado de 2.160 genes que se utilizaron para la obtención de la clasificación molecular y que son los genes incluidos en las tablas 1 y 2.
1.2.3. Grupos moleculares con 2.160 genes. Asociación con ILE.
Tras la agrupación de los 84 pacientes segun el perfil de expresión génica utilizando el listado de 2.160 genes y el método de clustering jerárquico (Fig. 5Al posteriormente perfeccionado por el método de k-means, se obtuvieron 3 grupos moleculares que se denominaron como Grupo 1, Grupo 2 y Grupo 3 (Fíg. 58).
Estos tres grupos se asociaron de manera estadísticamente Significativa con ellLE (Iog-rank p==0,004), mostrando en la curva de Kaplan-Meier, 2 grupos moleculares de mal pronóstico respecto a la recidiva (Grupo 1 y Grupo 2) y un grupo molecular de buen pronóstico (Grupo 3) (Fig. 6). El "Hazard ratio" (HR, es decir, el riesgo o probabilidad de recaída que tiene un grupo con respecto a otro) de los grupos de mal pronóstico frente al grupo de buen pronóstico es de 6,4 para el Grupo 1 (le 95%: 1,8-22,3; p == 0,004) Y de 4,9 para el Grupo 2 (le 95%: 1,4-17,8; p = 0,014) No existe diferencia estadísticamente significativa para el riesgo entre el Grupo 1 y el Grupo 2 (p=0,526).
a)-Análisis multiva riante
En este análisis se incluyeron las mutaciones para k-ras por presentar tendencia (p:::0,07) para la asociación con el ILE y la clasificación por Estadio ya que es el principal factor pronóstico para el eNMP.
Después de ajustar por Estadio y por el estatus de K-ras, el modelo multivariante de riesgos proporcionales de eox confirmó la clasificación molecular como factor pronóstico independiente para evaluar el riesgo de recidiva (HR Grupo 1 vs. 3 = 11.170; 95% el: 2,9 a 43,4; p == 4,9E-04; HR Grupo 2 vs. 3 = 7,521; 95% el: 2,0 a 28,8; p = 0,003); HR Grupo 1 vs. 2-= no significativo)
b)-. Estudio de vías moleculares.
Se observó que la clasificación molecular en 3 grupos estaba relacionada con la implicación de vías moleculares relacionadas con sistema inmune como la vía de Células T, Células 8, Inflamación y respuesta Th1 que diferencian el Grupo 3 del Grupo 2 y especialmente el Grupo 3 del Grupo 1 Por otro lado, la alteración de genes implicados en vias
ES 2 4 11 833 A2
de ciclo celular y mecanismos de reparación del ADN confiere las principales diferencias biológicas entre el Grupo 2 y el Grupo 1_
c)-Análisis estadístico de las variables clínicas e histológicas incluidas en el estudio.
Respecto a las variables clínicas de los pacientes incluidas en el estudio, el hábito tabáquico se asoció de manera estadísticamente significativa con la clasificación molecular obtenida (p=O,002). En el caso de las variables histológicas dellumor, la afectación ganglionar (p=O,041), a pesar de tener solamente 3 pacientes diagnosticados con N1, y la inflamación crónica (p=O,001 ) también se asocian de manera estadísticamente significativa con los subtipos moleculares.
d}-Validación en serie externa y obtención de predictor para 3 grupos moleculares
Utilizando la matriz de desarrollo (84 tumores) se obtuvo, mediante el uso de PAM, un primer predictor de 1.000 genes que identificaba los pacientes en los 3 grupos moleculares, dos de mal pronóstico (grupo 1 y grupo 2) y uno de buen pronóstico (grupo 3). Para la evaluación del poder pronóstico de dicho predictor, se utilizaron los datos de los 162 tumores de la matriz de validación. Estas muestras fueron clasificadas en los 3 grupos moleculares utilizando dicho predictor (1 .000 genes). La curva de Kaplan-Meier para las muestras de la matriz de validación reveló una asociación estadistica mente significativa de estos tres grupos moleculares con ellLE (Iog-rank p=O,022) (Fig. 7). El "Hazard Ratio" (HR) de los grupos de mal pronóstico frente al de buen pronóstico es de 2,4 veces para el Grupo 1 (p=0,012) Y de 2,5 veces para el Grupo 2 (p=0,019)
1.2.4. Obtención del predictor de 50 genes.
Como se observó con anterioridad en los resultados obtenidos en la matriz de desarrollo, de los tres grupos obtenidos mediante análisis de expresión génica, el comportamiento del Grupo 1 y el Grupo 2 es similar respecto a la recidiva, no existiendo diferencia estadlstica significativa para el riesgo entre estos dos grupos (p=0,526). Por ello, ambos grupos se englobaron en uno sólo y se generó un segundo predictor de 50 genes, mediante PAM, para diferenciar pacientes de mal pronóstico (Grupo 1 y 2) Y pacientes de buen pronóstico (Grupo 3). En la tabla 3 se incluye el valor del centroide compacto r shrunken centroid") para los grupos de buen y mal pronóstico obtenidos con las muestras de la matriz de desarrollo. Este segundo predictor engloba los denominados "50 genes de la invención" (ver tabla 1) y la evaluación del poder pronóstico del mismo se llevó a cabo de nuevo en la matriz de validación, obteniendo las curvas de Kaplan-Meier que muestran una asociación estadísticamente significativa de los dos grupos obtenidos con ellLE (Iog-rank p=0,001 ) (Fíg. 8). El HR para el Grupo de mal pronóstíco es de 3,4 frente al de buen pronóstico (IC 95%: 1,6-7,3; p=0,001)
Tabla 3. Muestra los valores de referencia de los 50 genes obtenidos con las muestras de la matriz de desarrollo para cada uno de los grupos Estos valores serán utilizados para clasificar las nuevas muestras en grupo de buen o mal pronóstico.
10 Entrez
Símbolo Buen Pronóstico ("Shrunken centroíd" ) Mal Pronóstico ("Shrunken centro íd")
3493
IGHA 1 0,549 -0,29
100287723
LOC100287723 0,539 0,284
642424
LOC642424 0,536 0,282
100132941
LOC100132941 0,52 0,274
401847
LOC401847 0,517 0,273
3500
IGHG1 0,504 -0,266
90925
LOC90925 0,487 -0,257
3543
IGLL1 0,481 -0,254
973
CD79A 0,443 -0,234
100290415
LOC100290415 0,44 -0,232
100133862
LOC100133862 0,436 -0,23
608
TNFRSF17 0,433 0,228
26952
SMR3A 0,428 -0,226
3535
IGL@ 0,428 -0,226
51237
MGC29506 0,428 -0,226
100293440
LOC100293440 0,427 0,225
3887
KRT81 0,417 -0,22
28904
IGKV1D 8 0,407 0,214
57823
SLAMF7 0,403 -0,212
91319
DERL3 0,386 -0,204
57699
CPNE5 0,381 -0,201
54900
LAX1 0,379 -0,2
150365
ME/1 0,378 -0,199
9834
KlAA0125 0,372 -0,196
5450
POU2AF1 0,364 -0,192
84824
FeRLA 0,346 -0,183
83416
FCRL5 0,344 -0,181
92154
MTSS1L 0,344 0,181
3662
IRF4 0,333 -0,176
3782
KCNN3 0,333 -0,176
11040
PIM2 0,326 -0,172
939
C027 0,322 -0, 17
349.
IGHA2 0,32 -0,169
5368
PNOC 0,316 -0,166
79368
FCRL2 0,312 -0,164
51303
FKBP11 0,294 -0,155
8419
BFSP2 0,291 -0,153
270
AMP01 0,289 -0,152
10563
CXCL 13 0,286 -0,151
97.
C079B 0,281 0,148
930
C019 0,28 -0,148
3512
IGJ 0,279 0,147
952
C038 0,265 -0, 14
78986
DUSP26 0,242 0,128
4283
CXCL9 0,23 -0,121
80307
FER1L4 0,228 -0, 12
221188
GPR114 0,228 -0, 12
126306
JSRP1 0,22 -0,116
ES 2 4 11 833 A2
140947
C5orf20 0,215 -0,113
3002
GZMB 0,208 -0,11
1.2.5. Utilidad del predictor de 50 genes en CNMP separados por estadio.
Una de las principales críticas aparecidas en el estado del arte (Subramanian J el al. J Natl Caneer Insl 2010;102:111 ) respecto a la utilidad de los prediclores generados para el CNMP es que es necesario demostrar su utilidad para predecir el pronóstico de los pacientes de manera independiente del estadio en el que se clasificaron. Para ello, separamos los 162 pacientes de la matriz de validación en pacientes clasificados en estadio I (110 pacientes) y clasificados como estadio 1I (52 pacientes). Se utilizó el prediclor de 50 genes para obtener los grupos moleculares de a1l0 y bajo riesgo (es decir, de mal y buen pronóstico, respectivamente) y se estudió su asociación con ellLE mediante las curvas de Kaplan-Meier. Tanto en estadios I por separado (Fig. 9 A) como en estadios 11 (Fig. 9 B) se observó una
10 asociación estadísticamente significativa de los grupos con ellLE (p=0,013 y p=0,029 respectivamente) y los HR del grupo de mal pronóstico respecto del de buen pronóstico fueron en el estadio I de 3,2 (IC 95%:1,2-8,3; p=0,018) y en el estadio 11 de 3,5 (IC 95%:1,1-12; p=0,041).
1.2.6. Sensibilidad y especificidad del predictor de 50 genes.
Los valores de sensibilidad y especificidad del predictor para la clasificación de las muestras en los grupos moleculares 15 identificados se muestran en la tabla 4.
Tabla 4. Sensibilidad, Especificidad, Valor Predictivo Positivo (VPP) y Valor Predictivo Negativo (VPN) para la clasificación molecular con el predictor de 50 genes.
Grupos mo leculares
Sensibilidad Especificidad VPP VPN
Grupo buen pronóstico
0,966 0,891 0,824 0,98
Grupo mal pronóstico
0,891 0,966 0,98 0,824
Por lo tanto, y en base a los resultados mostrados, la presente invención demuestra la utilidad del método de la 20 invención, así como del uso de los 50 genes descritos en la tabla 1 como marcadores pronóstico del CNMP de estadios
A continuación se muestra la tabla 2 a la que se ha hecho referencia previamente. Cuando el "ID Entrez· no está indicado o es "-" 0 "--" se trata de genes de los que no hay información en la base de datos NCBI. En el símbolo del gen se ha indicado el nombre de la sonda del array utilizado.
ID Entrez
Simbolo ID Entrez 51mbolo ID Enlrez Simbo lo
2
A2M 586 BCAT1 1004 COH6
12
SERPINA3 590 BCHE 1028 COKN1C
13
AAOAC 595 CCN01 1029 COKN2A
49
ACR 623 BOKRB1 1030 COKN2B
55
ACPP 624 BOKRB2 1033 COKN3
58
ACTA1 640 BLK 1036 COO1
59
ACTA2 641 BLM 1047 CLGN
72
ACTG2 643 CXCR5 1066 CES1
104
AOARB1 650 BMP2 1073 CFL2
124
AOH1A 654 BMP6 1080 CFTR
126
ADH1C 658 BMPR1B 1111 CHEK1
136
ADORA2B 660 BMX 1117 CHf3L2
152
ADRA2C 687 KLF9 1118 CHfT1
154
ADRB2 699 BUB1 1138 CHRNA5
176
AGAN 718 C3 1160 CKMT2
216
ALOH1A1 721 C4B 1191 CLU
220
ALDH1A3 730 C7 1236 CCR7
231
AKR1B1 760 CA2 1264 CNN1
241
ALOX5AP 762 CM 1268 CNR1
249
ALPL 767 CA8 1277 GOL1A1
275
AMT 820 CAMP 1278 GOL1A2
284
ANGPT1 828 CAPS 1281 eOLJA1
290
ANPEP 857 CAV1 1289 COL5A1
301
ANXA1 858 CAV2 1290 COL5A2
306
ANXA3 862 RUNX1T1 1291 COL6A1
348
APOE 863 CBFA2T3 1292 GOL6A2
356
FASLG 873 CBR1 1295 COLBA1
360
AQP3 874 GBR3 1296 COLBA2
362
AQP5 890 ceNA2 1299 COL9A3
367
AR 891 ceNB1 1300 COL10A1
374
AREG 898 ceNE1 1302 COU1A2
38.
ARG2 909 C01A 1305 COL13A1
395
ARHGAP6 911 C01e 1306 COL15A1
430
ASCL2 925 COBA 1307 COL16A1
443
ASPA 948 CD36 1311 COMP
44'
ASPH 956 ENTPD3 1356 CP
445
ASS1 969 C069 1359 ePA3
463
ZFHX3 970 C070 1363 CPE
467
ATF3 971 C072 1380 CR2
482
A TP1B2 978 COA 1381 eRABP1
501
ALDH7A1 991 CDC20 1382 eRABP2
563
AZGP1 1000 CDH2 1400 CRMP1
ID Entrez
51mbolo ID Entrez 5 1mbolo ID Enlrez 51mbolo
1404
HAPLN1 1946 EFNA5 2346 FOLH1
ES 2 4 11 833 A2
1415
CRYBB2 1948 EFNB2 2352 FOLR3
1468
SLC25A10 1958 EGR1 2353 FOS
1490
CTGF 1960 EGR3 2354 FOSa
1501
CTNND2 1969 EPHA2 2358 FPR2
1511
CTSG 1999 ELF3 2444 FRK
1513
CTSK 2006 ELN 2525 FUT3
1524
CX3CR1 2009 EML1 2537 IF/6
1571
CYP2E1 2026 EN02 2539 G6PD
1573
CYP2J2 2034 EPAS 1 2568 GABRP
1594
CYP27B1 2041 EPHA1 2571 GAD1
1602
DACH1 2042 EPHA3 2579 GAGE7
1608
DGKG 2043 EPHA4 2591 GALNT3
1634
DeN 2059 EPSB 2619 GAS1
1668
DEFA3 2114 ETS2 2621 GAS6
1673
DEFB4A 2115 ETV1 2627 GATA6
1674
DES 2122 MECOM 2628 GATM
1690
COCH 2152 F3 2633 GBP1
1728
NQ01 2153 F5 2635 GBP3
1734
0102 2160 Fl1 2668 GDNF
1735
0103 2162 F13A1 2669 GEM
1740
DLG2 2172 FABP6 2681 GGTA1
1748
DLX4 2191 FAP 2719 GPC3
1755
DMBTt 2192 FBLN1 2731 GLDC
1756
DMD 2194 FASN 2735 GL/1
1763
ONA2 2202 EFEMP1 2736 GL/2
1776
ONASE1L3 2205 FCER1A 2781 GNAZ
1789
DNMT3B 2206 MS4A2 2786 GNG4
1805
DPT 2237 FEN1 2791 GNG11
1809
DPYSL3 2239 GPC4 2841 GPR18
1837
DTNA 2246 FGF1 2842 GPR19
1842
ECM2 2247 FGF2 2843 GPR20
1843
DUSP1 2254 FGF9 2850 GPR27
1848
DUSP6 2258 FGF13 2852 GPER
1852
DUSP9 2273 FHL1 2857 GPR34
1869
E2F1 2274 FHL2 2869 GRK5
20
ES 2 4 11 833 A2
1870
E2F2 2277 F/GF 2905 GRIN2C
1879
EBF1 2294 FOXF1 2920 CXCL2
1896
EDA 2295 FOXF2 2921 CXCL3
1906
EDN1 2327 FM02 2922 GRP
1907
EDN2 2328 FM03 2936 GSR
1945
EFNA4 2335 FN1 2939 GSTA2
ID Entrez
Simbolo ID Entrez 51mbolo ID Entrez Simbolo
2944
GSTM1 3400 104 3824 KLRD1
2952
GSTT1 3429 IFI27 3833 KIFC1
2953
GSTT2 3434 IFln 3834 KIF25
2999
GZMH 3437 IFtT3 3851 KRT4
3001
GlMA 3455 IFNAR2 3880 KRT19
3003
GZMK 3458 IFNG 3892 KRT86
3005
H1FO 3479 IGF1 3898 LAD1
3006
HIST1H1C 3481 IGF2 3902 LAG3
3007
HIST1H1D 3486 IGFBP3 3908 LAMA2
3008
HIST1H1E 3488 IGFBP5 3914 LAMB3
3013
HIST1H2AD 3489 IGFBP6 3925 STMN1
3024
HIST1H1A 3559 IL2RA 3934 LeN2
3042
HBM 3569 IL6 3945 LDHB
3043
HBB 3577 CXCR1 3953 LEPR
3045
HBO 3579 CXCR2 3957 LGALS2
3049
HBQ1 3598 IL13RA2 3998 LMAN1
3053
SERPIND1 3604 TNFRSF9 4015 LOX
3067
HDC 3620 1001 4017 LOXL2
3117
HLA DQA1 3624 INHBA 4023 LPL
3131
HLF 3625 INHBB 4033 LRMP
3149
HMGB3 3627 CXCL10 4045 LSAMP
3161
HMMR 3640 INSL3 4057 LTF
3164
NR4A1 3653 IPW 4062 LY6H
3169
FOXA1 3663 IRF5 4068 SH201A
3199
HOXA2 3667 IRS1 4 069 LVZ
3201
HOXA4 3679 ITGA7 4071 TM4SF1
3204
HOXA7 3690 ITGB3 4093 SMAD9
3212
HOXB2 3694 ITGB6 4105 MAGEA6
3216
HOXB6 3699 ITIH3 4117 MAK
3225
HOXC9 3706 ITPKA 4118 MA L
3235
HOXD9 3730 KALt 4128 MAOA
3240
HP 3751 KCND2 4129 MAoa
3250
HPR 3768 KCNJ12 4131 MAP1B
3270
HRC 3772 KCNJ15 4133 MAP2
3292
HSD17B1 3775 KCNK1 4137 MAPT
3294
HSD17B2 3777 KCNK3 4151 MB
3303
HSPA1A 3778 KCNMA1 4166 CHST6
3316
HSPB2 3783 KCNN4 4199 ME1
3357
HTR2B 3800 KIF5C 4223 MEOX2
3371
TNC 3816 KLK1 4233 MET
3373
HYAL1 3821 KLRC1 4239 MFAP4
3397
101 3822 KLRC2 4241 MFf2
ID Entrez
51mbolo ID Entrez 51mbolo ID Enlrez 51mbolo
4248
MGAT3 4929 NR4A2 5563 PRKAA2
4256
MGP 4935 GPR143 5569 PKIA
4311
MME 4953 ODC1 5570 PKIB
4316
MMP! 5021 OXTR 5577 PRKAR28
4318
MMP9 5023 P2RX1 5578 PRKGA
4325
MMP16 5029 P2RY2 5602 MAPK10
4332
MNDA 5046 PCSK6 5625 PRODH
4356
MPP3 5050 PAFAH1B3 5627 PROS1
4477
MSMB 5054 SERPINE1 5630 PRPH
4481
MSR1 5064 PALM 5655 KLK10
4490
MT1B 5087 PBX1 5727 PTCH1
4495
MT1G 5099 PCDH7 5730 PTGDS
4499
MT1M 5122 PCSK1 5740 PTGIS
4502
MT2A 5125 PCSK5 5743 PTGS2
4585
MUC4 5144 PDE4D 5753 PTK6
4599
MX1 5152 PDE9A 5783 PTPN13
4602
MYB 5154 PDGFA 5787 PTPRB
4605
MYBL2 5157 PDGFRL 5789 PTPRD
4606
MYBPC2 5167 ENPP1 5794 PTPRH
4629
MYH11 5172 SLC26A4 5801 PTPRR
4653
MYOC 5187 PER1 5806 PTX3
4674
NAP1L2 5196 PF4 5816 PVALB
4703
NEB 5225 PGC 5874 RAB27B
4739
NEDD9 5226 PGD 5909 RAP1GAP
4744
NEFH 5272 SERPINB9 5918 RARRES1
4751
NEK2 5324 PLAG1 5961 PRPH2
4774
NFlA 5327 PLAT 5990 RFX2
4792
NFKBIA 5328 PLAU 5996 RGS1
4810
NHS 5339 PLEC 5999 RGS4
4811
N/01 5347 PLK1 6019 RLN2
4824
NKX3-1 5348 FXYD1 6036 RNASE2
4837
NNMT 5350 PLN 6098 ROS1
4851
NOTCH1 5376 PMP22 6192 RPS4Y1
4856
NOV 5396 PRRX1 6236 RRAD
4857
NOVA 1 5427 POLE2 6275 S100A4
4862
NPAS2 5460 POU5F1 6285 8100B
4881
NPR1 5468 PPARG 6286 S100P
4883
NPR3 5471 PPAT 6288 SAA1
4884
NPTX1 5502 PPP1R1A 6289 SAA2
4885
NPTX2 5507 PPP1R3C 6300 MAPK12
4902
NRTN 5521 PPP2R28 6327 SGN28
4907
NT5E 5549 PRELP 6335 SGN9A
ID Entrez
5 1mbolo ID Entrez 5 imbolo ID Entrez Simbolo
6339
SGNN1D 6820 SULT2B1 7472 WNT2
6343
SCT 6941 TGF19 7475 WNT6
6354
GGL! 6999 TD02 7481 WNT11
6355
CCL8 7010 TEK 7504 XK
6356
GGL11 7015 TERT 7538 ZFP36
6357
GGL13 7018 TF 7691 ZNF132
6358
GGL14 7022 TFAP2G 7694 ZNF135
ES 2 4 11 833 A2
6361
GeL17 7025 NR2F1 7704 lBTB16
6362
ceL1a 7031 TFF1 7762 ZNF215
6363
CCL19 7033 TFF3 7781 SLC30A3
6364
CCL20 7035 TFPI 7837 PXON
6366
GeL21 7039 TGFA 7849 PAXB
6373
CXCL11 7042 TGFB2 7850 IL1R2
6374
CXCL5 7045 TGFBI 7941 PLA2G7
6376
CX3CL1 7048 TGFBR2 7976 FlD3
6387
CXCL12 7056 THBO 7991 Tuse3
6401
SELE 7058 THBS2 8000 PSCA
6403
SELP 7076 TlMP1 8013 NR4A3
8414
SEPP1 7078 TlMP3 8038 ADAM12
8423
SFRP2 7083 TK1 8076 MFAP5
8424
SFRP4 7093 TLL2 8111 GPR68
6440
SFTPC 7102 TSPAN7 8115 TGUA
8442
SGCA 7122 CLDN5 8140 SLC7A5
6447
SGG5 7137 TNN!3 8190 M/A
6495
SIX1 7138 TNNT1 8208 CHAF1B
6505
SLC1A1 7139 TNNT2 8277 TKTL1
6518
SLC2A5 7153 TOP2A 8284 KDM5D
6540
SLC6A13 7177 TPSAB1 8302 KLRC4
6583
SLC22A4 7216 TRO 8313 AXIN2
6588
SLN 7262 PHLDA2 8322 FZD4
6590
SLPI 7296 TXNRD1 8325 FlD8
6615
SNA/1 7345 UCHL1 8326 FlD9
6623
SNCG 7356 SCGB1A1 8335 H/ST1H2AB
6652
SORO 7365 UGT2B10 8339 H/ST1H2BG
6662
SOX9 7367 UGT2B17 8357 H/ST1H3H
6678
SPARC 7368 UGTB 8360 H/ST1H4D
6689
SPIB 7373 COL14A1 8364 H/ST1H4C
6691
SPINK2 7379 UPK2 8365 H/ST1H4H
6695
SPOCK1 7391 USF1 8366 H/ST1H4B
6696
SPP1 7422 VEGFA 8368 H/ST1H4L
6769
STAC 7431 V/M 8395 P/P5K1B
6790
AURKA 7450 VWF 8404 SPARCL1
10 Entrez
51mbolo ID Entrez 5 1mbolo ID Entrez 51mbolo
8406
SRPX 9077 O/RAS3 9833 MELK
8434
RECK 9084 vey 9890 LPPR4
8436
SDPR 9086 EIF1AY 9899 SV2B
8437
RASAL1 9088 PKMYT1 9914 ATP2C2
8464
SUPT3H 9118 INA 9915 ARNT2
8483
GILP 9148 NEURL 9934 P2RY14
8490
RGS5 9156 EX01 9940 OLEe1
8492
PRSS12 9172 MYOM2 9956 HS3ST2
8503
PIK3R3 9200 PTPLA 9957 HS3ST1
8516
ITGAS 9201 DCLK1 10024 TROAP
8528
DDO 9284 NPIP 10076 PTPRU
8537
BeAS1 9289 GPR56 10082 GPC6
8547
FCN3 9369 NRXN3 10085 EDIL3
8612
PPAP2C 9388 LlPG 10100 TSPAN2
8622
PDE88 9401 RECQL4 10103 TSPAN1
8638
OASL 9420 CYP781 10112 KIF20A
8639
AOC3 9429 ABCG2 10135 NAMPT
8644
AKR1C3 9447 AIM2 10158 PDZK1/P1
8653
DDX3Y 9452 ITM2A 10164 CHST4
8660
IRS2 9455 HOMER2 10170 DHRS9
8685
MARCO 9481 SLC25A27 10186 LHFP
8693
GALNT4 9486 CHST10 10202 DHRS2
8727
CTNNAL1 9508 ADAMTS3 10203 CALCRL
8786
RGS11 9547 CXCL14 10231 RCAN2
8792
TNFRSF11A 9586 CREB5 10234 LRRC17
8835
SOCS2 9590 AKAP12 10253 SPRY2
8840
W/SP1 9610 R/N1 10265 /RX5
8847
DLEU2 9612 NCOR2 10290 SPEG
8857
FCGBP 9625 AATK 10309 CCNO
8876
VNN1 9633 MTL5 10319 LAMC3
8908
GYG2 9636 /SG15 10332 CLEC4M
8914
TlMELESS 9639 ARHGEF10 10335 MRV/1
8938
BAIAP3 9700 ESPL1 10351 ABeA8
8942
KYNU 9718 ECE2 10361 NPM2
8968
HIST1H3F 9720 CCDC144A 10365 KLF2
8970
HIST1H2BJ 9721 GPRIN2 10371 SEMA3A
9033
PKD2L1 9732 DOCK4 10417 SPON2
9037
SEMA5A 9735 KNTC1 10418 SPON1
9038
TAAR5 9737 GPRASP1 10439 OLFM1
9060
PAPSS2 9770 RASSF2 10446 LRRN2
9068
ANGPTL1 9787 DLGAPS 10457 GPNMB
9071
CLDN10 9832 JAKMIP2 10462 CLEC10A
ID Entrez
Simbolo ID Entrez 51mbolo ID Entrez Simbolo
10512
SEMA3C 22983 MAST1 26108 PYG01
10529
NEBL 23037 POZ02 26150 RIBC2
10537
UBO 23066 CAN02 26153 KIF26A
10570
DPYSL4 23089 PEG10 26166 RGS22
10578
GNLY 23194 FBXL7 26172 LOC26172
10579
TAce2 23209 MLC1 26206 SPAGB
10580
SORBS1 23213 SULF1 26232 FBX02
10606
PAICS 23236 PLCB1 26253 CLEC4E
10615
SPAG5 23242 GOBL 26256 CABYR
10631
POSTN 23314 SATB2 26271 FBX05
10643
IGF2BP3 23327 NEDD4L 26298 EHF
10656
KHDRBS3 23373 CRTC1 26353 HSPB8
10669
CGREF1 23414 ZFPM2 26470 SEZ6L2
10733
PLK4 23460 ABCA6 26577 PCOLCE2
10742
RAI2 23475 QPRT 26579 MYEOV
10744
PTTG2 23541 SEC14L2 26585 GREM1
10874
NMU 23562 CLDN14 26872 STEAP1
10875
FGL2 23587 C17ort81 26960 NBEA
10878
CFHR3 23657 SLC7A11 26974 ZNF285A
10891
PPARGC1A 23704 KCNE4 27074 LAMP3
10894
LYVE1 23743 BHMT2 27111 SDCBP2
10942
PRSS21 23767 FLRT3 27112 FAM155B
10964
IF/44L 23768 FLRT2 27122 OKK3
10974
C10orf116 24137 KIF4A 27123 OKK2
10984
KCNQ1OT1 24141 C20orf103 27129 HSPB7
11005
SPINK5 25791 NGEF 27145 FILfP1
11012
KLK11 25805 BAMBI 27147 DENND2A
11013
TMSB15A 25817 FAM19A5 27151 CPAMDB
11015
KDELR3 25833 POU2F3 27156 RTDR1
11065
UBE2C 25840 METTL7A 27165 GLS2
11082
ESM1 25878 MXRA5 27237 ARHGEF16
11096
ADAMTS5 25884 CHRDL2 27285 TEKT2
11130
ZWINT 25890 ABI3BP 27286 SRPX2
11169
WDHD1 25891 PAMR1 27299 ADAMDEC1
11197
WIF1 25894 PLEKHG4 27303 RBMS3
11226
GALNT6 25945 PVRL3 27306 HPGDS
11227
GALNT5 26002 MOXD1 27344 PCSK1N
11254
SLC6A14 26027 ACOT11 27345 KCNMB4
22801
ITGA 11 26040 SETBP1 27443 CECR2
22885
ABLlM3 26049 FAM169A 28231 SLC04A1
22915
MMRN1 26053 AUTS2 28999 KLF15
22949
PTGR1 26074 C20orf26 29070 CCDC113
ID Entrez
51mbolo ID Entrez Simbolo ID Entrez Simbolo
29089
UBE2T 51678 MPP6 55086 CXorf57
29091
STXBP6 51705 EMCN 55107 AN01
29126
C0274 51744 CD244 55118 CRTAC1
29128
UHRF1 51751 HIGD1B 55137 FIGN
29775
CAR010 51761 A TPBA2 55138 FAM90A1
29798
C2orf27A 51804 SIX4 55143 COCAB
29802
VPREB3 53342 IU70 55165 CEP55
29931
LOH3CR2A 53358 SHC3 55203 LGI2
29948
OSGINI 53616 ADAM22 55228 PNMALt
29993
PACSIN1 53832 IL20RA 55231 CCDCB7
30001
ER01L 54206 ERRFI1 55258 THNSL2
30846
EHD2 54360 CYTL1 55273 TMEM100
50486
GOS2 54361 WNT4 55286 C4orf19
50487
PLA2G3 54437 SEMA5B 55304 SPTLC3
50507
NOX4 54463 FAM134B 55344 PLexo1
50509
COL5A3 54478 FAM64A 55351 STK32B
50617
A TP6VOA4 54551 MAGEL2 55353 LAPTM4B
50636
ANOl 54596 L1TD1 55359 STYK1
50863
NTM 54621 VSIG10 55366 LGR4
51083
GAL 54674 LRRN3 55388 MCM10
51087
YBX2 54682 MANSC1 55450 CAMK2N1
51090
PLLP 54739 XAF1 55510 DDX43
51129
ANGPTL4 54756 IL17RD 55521 TRIM36
51162
EGFL7 54829 ASPN 55545 MSX2P1
51196
PLCE1 54830 NUP62CL 55576 STAB2
51208
CLDN18 54847 SIDT1 55698 RADIL
51284
TLR7 54852 PAQR5 55714 OOZ3
51297
PLUNC 54855 FAM46C 55765 C1orf106
51299
NRN1 54869 EPSBL1 55786 ZNF415
51302
CYP39A1 54894 RNF43 55789 DEPDC1B
51308
REEP2 54906 C10orf18 55799 CACNA2D3
51311
TLRB 54922 RASIP1 55872 PBK
51316
PLAC8 54933 RHBDL2 55966 AJAP1
51348
KLRF1 54959 ODAM 56000 NXF3
51364
ZMYND10 54979 HRASLS2 56121 PCDHB15
51450
PRRX2 55034 MOCOS 56122 PCDHB14
51454
GULP1 55040 EPN3 56126 PCDHB10
51554
CCRL1 55061 SUSD4 56127 PCDHB9
51560
RAB6B 55064 C9otf68 56128 PCDHBB
51561
IL23A 55065 GPR172B 56129 PCDHB7
51659
GINS2 55083 KIF26B 56131 PCDHB4
51673
TPPP3 55084 SOBP 56143 PCDHA5
ID Entrez
Simbolo ID Entrez Simbolo ID Enlrez Simbolo
56147
PCDHA1 57758 SCUBE2 79071 ELOVL6
56164
STK31 57817 HAMP 79092 CARD14
56253
CRTAM 58189 WFDC1 79148 MMP28
56256
SERTAD4 58494 JAM2 79153 GDPD3
56477
CCL28 59269 HIVEP3 79173 C19orl57
56603
CYP26B1 59271 C21orf63 79191 IRX3
56649
TMPRSS4 59272 ACE2 79258 MMEL1
56673
C1'orf16 59277 NTN4 79365 BHLHE41
56675
NRIP3 59285 CACNG6 79370 BCL2L14
56937
PMEPA1 59353 TMEM35 79413 lBED2
56944
OLFML3 60437 CDH26 79589 RNF128
56967
C14orl132 63027 SLC22A23 79611 ACSS3
56977
STOX2 63876 PKNOX2 79614 C5ot123
56992
KIF15 63951 DMRTA1 79618 HMBOX1
57101
AN02 64072 CDH23 79623 GALNT14
57110
HRASLS 64073 C19orf33 79633 FAT4
57188
ADAMTSLJ 64093 SMOC1 79642 ARSJ
57194
ATP10A 64094 SMOC2 79645 EFCAB1
57210
SLG45A4 64108 RTP4 79682 MLF1fP
57214
KIAA1199 64131 XYLT1 79692 ZNF322A
57235
KIAA0485 64167 ERAP2 79723 SUV39H2
57335
ZNF286A 64220 STRA6 79739 TTLLl
57348
TTYH1 64283 RGNEF 79772 MCTP1
57393
TMEM27 64288 ZNF323 79774 GRTP1
57402
S100A14 64332 NFKBIZ 79801 SHCBP1
57452
GALNTL1 64344 HIF3A 79819 WDR78
57460
PPM1H 64377 CHST8 79825 CCDC48
57482
KIAA1211 64388 GREM2 79841 AGBL2
57484
RNF150 64399 HHIP 79844 ZDHHC11
57493
HEG1 64506 CPEB1 79852 EPHX3
57501
KIAA1257 64699 TMPRSS3 79875 THSD4
57514
ARHGAP31 64757 MOSC1 79901 CYBRD1
57535
KIAA1324 64849 SLC13A3 79919 C2ot154
57537
SORCS2 64866 CDCP1 79931 TNIP3
57608
KIAA1462 64919 BCL11B 79953 TMEM90B
57616
TSHZ3 65243 ZNF643 79957 PAQR6
57631
LRCH2 65997 RASL11B 79974 C7ot158
57633
LRRN1 66000 TMEM108 79977 GRHL2
57670
KIAA1549 78989 COLEC11 79987 SVEP1
57683
lDBF2 78995 C17ort53 79992 C6ot159
57705
WDFY4 79006 METRN 79993 ELOVL7
57717
PCDHB16 79019 CENPM 80034 CSRNP3
ID Entrez
Simbolo ID Entrez 51mbolo ID Entrez Simbolo
80054
LOCBOO54 83988 NeALO 85004 RERG
80144
FRAS1 83992 CTTNBP2 85016 C11orl70
80150
ASRGL1 84000 TMPRSS13 85453 TSPYL5
80178
C16orf59 84057 MND1 85455 DISP2
80206
FHOD3 84059 GPR9B 85462 FHDC1
80235
PIGZ 84069 PLEKHN1 89765 RSPH1
80237
ELL3 84073 MYCBPAP 89795 NAV3
80258
EFHC2 84152 PPP1R18 89796 NAV1
80303
EFHD1 84171 LOXL4 89822 KCNK17
80310
PDGFO 84189 SLlTRK6 89872 AQP10
80326
WNT10A 84206 MEX38 89958 C9orf140
80705
TSGA10 84215 ZNF541 90050 FAM181A
80723
TMEM22 84258 SYT3 90362 FAM110B
80726
KIAA1683 84417 C2orf40 90865 IL33
80759
KHOC1 84419 C15orf48 91057 CCDC34
80760
ITIH5 84448 ABLlM2 91120 ZNF682
81029
WNT5B 84553 C6orf168 91133 L3MBTL4
81035
COLEC12 84623 KIRREL3 91543 RSAD2
81501
TM7SF4 84624 FNDC1 91614 OEPDC7
81557
MAGE04B 84627 ZNF469 91683 SYT12
81575
APOL01 84632 AFAP1L2 91687 CENPL
81578
COL21A1 84649 DGAT2 91851 CHRDL1
81831
NET02 84667 HES7 91977 MYOZ3
81931
ZNF93 84676 TRIM63 92291 CAPN13
83439
TCF7L1 84688 C9orf24 92304 SCGB3A1
83461
CDCA3 84696 ABH01 92312 MEX3A
83481
EPPK1 84706 GPT2 92340 C17orf72
83540
NUF2 84707 BEX2 92747 C20orf114
83543
AIF1L 84708 LNX1 92949 ADAMTSL1
83604
TMEM47 84709 C4otf49 93082 NEURL3
83648
FAM167A 84803 AGPA T9 93099 DMKN
83657
DYNLRB2 84830 C6otf105 93273 LEM01
83661
MS4ABB 84842 HPDL 93517 SDR42E1
83690
CRISPLD1 84848 MGC16121 93986 FaXP2
83849
SYT15 84870 RSP03 94274 PPP1R14A
83853
ROPN1L 84900 RNFT2 96626 LlMS3
83869
TTTY14 84935 C13orf33 112476 PRRT2
83872
HMCN1 84952 CGNL1 113115 FAM54A
83879
COCA! 84953 MICALCL 113130 COCAS
83888
FGFBP2 84962 Jua 113146 AHNAK2
83903
GSG2 84966 IGSF21 113278 C20orf54
83959
SLC4A 11 84969 TOX2 113730 KLHOC7B
ID Entrez
51mbolo ID Entrez 51mbolo ID Enlrez 51mbolo
114569
MAL2 126129 CPT1C 142683 ITLN2
114787
GPRIN1 126567 C2CD4C 143662 MUC15
114800
CCDC85A 127495 LRRC39 144193 AMDHD1
114818
KLHL29 127602 DNAH14 144347 FAM101A
114827
FHAD1 128153 SPATA17 144406 WDR66
114880
OSBPL6 128229 C1otf182 144501 KRT80
114899
C1QTNF3 128602 C20ort85 145258 GSC
114905
C1QTNF7 128611 ZNF831 145773 FAM81A
114907
FBX032 128872 HMGB3L1 146212 KCTD19
115361
G8P4 129790 C7otf13 146330 F8XL16
115362
GBP5 130271 PLEKHH2 146434 ZNF597
115572
FAM468 130367 SGPP2 146760 RTN4RL1
115908
CTHRC1 130733 TMEM178 146845 WDR16
116028
C16orf75 131177 FAM3D 147166 TRIM16L
116039
OSR2 131450 CD200R1 147372 CCBE1
116159
CYYR1 131578 LRRC15 147463 ANKRD29
116211
TM4SF19 131873 COL6A6 147525 C18ort18
116328
CSOrf34 132671 SPATA18 147645 VSIG10L
116372
LYPD1 132864 CPEB2 147744 TMEM190
116442
RAB39B 133022 TRAM1L1 147906 DACT3
116832
RPL39L 133690 CAPSL 147920 IGFL2
116969
ART5 134147 CMBL 147968 CAPN12
117156
SCGB3A2 134265 AFAP1L1 148229 ArPBB3
117157
SH2D1B 134466 LOC134466 148252 O/RAS1
117166
WFIKKN1 135112 NeOA7 148418 SAMD13
117247
SLC16A10 135398 C6otf141 148641 SLC35F3
117248
GALNTL2 135932 TMEM139 149111 CNfH3
118491
TTC18 136306 SVOPL 149351 LOC149351
118663
BTBD16 137872 ADHFE1 149483 ceDe17
118932
ANKRD22 137902 PXDNL 150248 C22orf15
119391
GST02 137994 LETM2 150378 FLJ30901
119587
CPXM2 139065 SLlTRK4 150696 PROM2
120071
GYLTL18 139324 HOX 150763 GPAT2
120376
G11orf93 139886 SPIN4 151174 LOC151174
120892
LRRK2 140032 RPS4Y2 151176 FAM132B
122402
TDRD9 140578 CHODL 151242 PPP1R1C
122622
ADSSL1 140597 TCEAL2 151246 SGOL2
124093
CCDC78 140706 C20ort160 151473 SLC16A14
124220
lG168 140733 MACROD2 151507 MSL3L2
124602
KIF19 140766 ADAMTS14 151827 LRRC34
124739
USP43 140809 SRXN1 151887 CCDC80
124976
SPNS2 140862 18M1 151888 BTLA
ID Entrez
5 1mbolo ID Entrez 5 imbolo ID Entrez 5 imbolo
152078
C30rt55 200634 KRTCAP3 256076 COL29A1
153478
PLEKHG4B 200810 ALG1L 256435 8T6GALNAC3
153572
fRX2 200958 MUC20 256691 MAMDC2
153579
BTNL9 201161 CENPV 259173 ALS2CL
154313
C60rt165 201456 FBX015 259266 ASPM
154796
AMOT 201799 TMEM154 259307 fL4f1
155368
WB8CR27 202333 CMYA5 260293 CYP4X1
157310
PEBP4 202915 TMEM184A 260436 C40rfl
157313
COCA2 203111 C8orf47 266977 GPR110
157506
RDH10 219348 PLAC9 282679 AQP11
157570
ESC02 219595 FOLH1B 283120 H19
157773
CSOt148 219736 STOX1 283208 P4HA3
157869
CSOrf84 219790 RTKN2 283358 B4GALNT3
157927
C90t162 220136 ceDe11 283481 LOC283481
158295
MGC24103 220164 DOK6 283518 KCNRG
158326
FREM1 220359 TlGD3 283663 LOC283663
158511
CSAG1 220594 LOC220594 284013 VM01
159371
TMEM20 220963 SLC16A9 284047 CCDC144B
160364
CLEC12A 221002 RASGEF1A 284119 PTRF
160365
CLECL1 221150 SKA3 284307 l/K1
160622
GRASP 221303 FAM1628 284339 TMEM145
161725
OTUD7A 221357 GSTA5 284367 SIGLECP3
162632
LOC162632 221424 C6orf154 284654 RSP01
162963
ZNF610 221 476 PI16 284716 RIMKLA
163255
ZNF540 221687 RNF182 284889 LOC284889
163782
KANK4 221806 VWDE 284904 SEC14L4
164832
LONRF2 221914 GPC2 284992 CCDC150
165055
CCDC138 221935 SDK1 285016 FAM150B
167359
MGC42105 221981 THSD7A 285141 LOC285141
167465
ZNF366 222171 PRR15 285489 DOK7
168002
DACT2 222235 FBXL13 285755 PPILB
169792
GUS3 245972 ATP6VOD2 286046 XKRB
170679
PSORS1C1 246100 CTAG1A 286527 TMSB15B
171024
SYNP02 252995 FNDC5 286749 STON1 GTF2A1L
196740
C10orf72 253152 EPHX4 286827 TRIM59
198437
C20orf201 253264 LOC253264 338339 CLEC4D
199675
C19orf59 253650 ANKRD18A 338382 RAB7B
199713
NLRP7 253982 ASPHD1 339145 FAM92B
199786
FAM129C 254910 LCE5A 339184 CCDC144NL
200162
SPAG17 255480 LOC255480 339390 CLEC4G
200172
SLFNL1 255631 COL24A1 339524 LOC339524
200315
APOBEC3A 255743 NPNT 339768 ESPNL
10 Entrez
51mbolo ID Entrez 5 1mbolo ID Entrez 51mbolo
339778
C2orflO 401233 LOC401233 728882 FAM1828
339804
C2orfl4 401237 FLJ22536 729085 FAM198A
340286
FAM1838 401474 SAMD12 729680 LOC729680
340542
BEX5 402483 tcagl.907 729983 LOC729983
340719
NANOS1 439949 LOC439949 100113384 SNORD123
342035
GLDN 440068 CAR01! 100128511 LOC1D0128511
342979
PALM3 440461 LOC440461 100130967 LOC1D0130967
344148
NCKAP5 440556 FLJ42875 100131170 LOC100131170
346689
KLRG2 440585 FAM183A 100131541 UNQ6228
347744
C60t152 440712 C1ot1186 100131564 LOC100131564
347902
AMIG02 440792 LOC440792 100131733 LOC10D131!33
348751
LOC348751 440823 MIAT 100131997 FAM27E3
352961
HCG26 441027 TMEM150C 100132247 LOC100132247
353189
SLC04C1 441168 FAM26F 100132885 LOC100132885
374569
ASPG 441208 LOC441208 100133161 LOC100133161
387066
SNHG5 441295 OR2A9P 100133941 CD24
387328
ZNF3228 441317 FAM90A7 100134018 hCG_ '774568
387758
FIBIN 441376 C8otf85 100271835 LlMS3-LOC440895
387763
AG2 441631 TSPAN11 100288985 LOC100288985
387885
CCDC428 441795 LOC441795 100289058 LOC100289058
387914
SHISA2 445328 ARHGEF5L 100293193 LOC100293193
388115
C15otf52 474354 LRRC18 A_32_P149011
388125
C2CD48 619279 ZNFlO4 A_32_P208200
388135
C15orl59 642236 LOC642236 A 24 P315862
388242
LOC388242 642477 FLJ39632 A_23_P121234
388585
HES5 642521 LOC642521 A_32_P148122
388630
LOC388630 644186 C22orl41 A_32_P115277
388815
C21orl34 644246 LOC644246 A_32_P33213
389136
VGLL3 645027 EVPLL A_32_P124773
389432
SAMD5 645277 LOC645277 A_32_P105465
389458
LOC389458 645722 LOC645722 - A_24_P5994
389493
LOC389493 650655 A8CA17P A_23_P28307
A_24_P890995
LOC389831
C2orf84
-
A_32_P210106
LOC389834
SFTPA1
-
C21orf81
LOC654433
A_24_P298228
A_24_P702749
NCRNAOOO86
PCP4L1
LOC399744
HIST2H2AA4
A_24_P307375
A_24_P930088
GOLGA6L6
C1'orf92
A_24_P659980
LOC399959
LOC727916
LOC400043
FAM155A
A_32_P115749
LOC4D0456
XAGE2B
A_32_P181826
C17orf97
LOC728613
A_32_P172578
ID Entrez
Simbolo ID Entrez 51mbolo ID Entrez Simbolo
A_32_P2381O
A_23_P211468 A_24_P82709S
A_32_ P164917
A_32_ P50973 A_32_P132194
A_24_P233560
A_24_P936252 A_32_P186865
Aj3_P159435
A_32_P4061 42 A_24_P92174
A_32_P96752
A_32_P15288 A_23_P21907
A_24_P67494
A_24_P204727 A_32_P73991
A_32_P72351
A_32_P146844 A_24_P221903
A_24_P683861
A_32_P157504 A_32_P108033
-
A_24_P643776 - A_32_P227921 - A_32_P88587
A_32_P162862
A_24_P263786 A_24_P64442
A_24_P170136
A_32_P17343 A_32_P61298
A_23_P170719
A_24_P110487 A_32_P226941
A_24_P590547
A_24_P490109 A_32_P226356
A_24_P213134
A 32 P125402 A 24 P822869
A_32_P194563
A_32_P35486 A_32_P99533
A_24_P247074
A_32_P198295 A_24_P101742
A_24_P395415
A_23_P43649 A_32_P100947
A_32_P32463
A_32_P227496 A_23_P250516
A_32_P59277
A_24_P494425 A_32_P212258
A_24_P110618
A_24_P604784 A_32_P132748
-
A_32_P5205 - A_32_P126259 - A_24_P558135
A_32_P90812
A_32_P32043 A_23_P135123
ES 2 4 11 833 A2
A_24_P212024
A_32_P122715
A_32_P229818
-
-
-
-
A_32_P155512
-
A_32_P118657
-
A_24_P517918
A_24_P538459
A_24_P1S388
A_23_P116195
A_24_P144346
A_24_P204374
A_32_P112100
A_24_P178444
A_24_P92683
A_24_P47S940
A_24_P589028
A_24_P177844
A_32_P214395
A_24_P241996
A_23_P44053
A_32_P117322
A_24_P929818
A_32_P152255
A_32_P117186
A_23_P21260
A_32_P151747
A_32_P233799
A_24_P707102
A_32_P101623
A_32_P109078
A_32_P18S921
A_24_P484699
A_23_P32793
A_32_P164971
A_24_P358474
A_32_P43664
A_24_P795230
A_24_P608268
A_32_P42224
A_24_P267814
A_24_P24371
A_24_P100684
A_32_P103678
A_23_P111525
A_32_P164477
A_24_P333306
A_32_P214565
A_32_P110485
A_32_P215556
A_32_P1166
A_24_P460763
A_23_P72252
A_32_P153361
A_32_P39944
A_24_P497843
A_24_P315941
A_24_P845631
A_24_P916853
A_23_P158868
A_32_P166733
ID Entrez
51mbolo ID Entrez Simbolo ID Entrez Simbolo
A_32_P157465
A_24_P927205 A_32_P39440
A_32_P115122
A_32_P196918 A_23_P166508
A_24_P203418
A_24_P315854 A_32_P35303
A_23_P21249
A 23 P435390 A 32 P33802
A_24_P203886
A_32_P182458 A_32_P173922
A_32_P30874
A_32_P155984 A_23_P87421
A_32_P108516
A_24_P478556 A_32_P40673
A_32_P106615
A_32_P21459 A_32_P164916
A_24_P626951
A_32_P161755 A_24_P745352
A_24_P306814
A_24_P8257 A_32_P139163
-
A_24_P940469 - A_32_P189034 - A_23_P390206
A_24_P592060
A_32_P122951 A_32_P68055
-
A_24_P424S3 - A_24_P565110 - A_24_P82S9S9
-
A_24_P914479 - A_32_P226768 - A_24_P816844
A_24_P401124
A_32_P157927 A_32_P142602
A_24_P372189
A_32_P114918 A_23_P170713
A_32_P46456
A_23_P140884 A_24_P418744
A_24_P592591
A_23_P9997 A_32_P43959
A_24_P384119
A_32_P330691 A_24_P16214
A_24_P923271
A_23_P98671 A_32_P77102
A_32_P49552
A_24_P813550 A_24_P246825
A_32_P108748
A_32_P47166 A_23_P84791
A_24_P16337
A_24_P213325 A_32_P55414
A_24_P73330B
A_24_P871940 A_32_P15081
A_24_P76868
A_24_P677559 A_24_P930327
A_24_P878419
A_23_P217187 A_32_P188993
A_24_P934162
A_23_P56868 A_23_P361654
A_24_P592871
A_24_P932887 A_32_P229493
A_23_P96191
A_32_P177595 A_24_P333357
A_32_P169550
A_23_P170830 A_23_P35546
A_24_P484904
A_32_P68076 A_32_P12372
A_24_P639701
A_32_P212406 A_24_P24053
A_32_P165990
A_32_P877 A_23_P112957
-
A_23_P20328 - A_32_P121537 - A_24_P341546
A_32_P214054
A_23_P21393 A_32_P43914
A_24_P932388
A_32_P226073 A_24_P621701
A_32_P106864
A_32_P224586 A_24_P75994
A_32_P45375
A_24_P152345 A_24_P665185
A_24_P376139
A_24_P127462 A_32_P44099
A_24_P361816
A_32_P38313 A_32_P30004
A_24_P919283
A_24_P519504 A_24_P916965
A_24_P844100
A_24_P229447 A_23_P8812
ID Entrez
Simbolo ID Entrez Simbolo ID Enlrez Simbolo
-
A_32_P202066 - A_24_P904845 - A_24_P514678
A_32_P221641
A_32_P228886 A_24_P750327
ES 2 4 11 833 A2
-
A_32_P9924 - A_23_P21 0158 - A_24_P358321
-
A_23_P408363 - A_23_P136753 - A_32_P72541
A_24_P57644S
A_32_P213678 A_32_P213418
A_32_P97513
A_32_P30075 A_32_P214969
A_32_P74814
A_24_P7750 A_23_P1S9163
A_24_P195974
A_24_P135841 A_24_PS04939
A_32_P722809
A_24_P169713 A_24_P862083
A_24_P318990
A_24_P341126 A_32_P199824
A_32_P52227
A_32_P194704 A_32_P115518
A_32_P42S9S
A_24_P161764 A_24_P16004
A_32_P224345
A_32_P102581 A_32_P82179
A_32_P22620S
A_23_P124313 A_23_P21800
A_32_P36552
A_32_P193240 A_32_P79041
A_32_P133038
A_32_P131998 A_24_P29880S
A_32_P157671
A_32_P174214 A_24_P925422
A_32_P76602
A_32_P1291 A_32_P227657
A_32_P46171
A_23_P11980 A_32_P53603
A_24_P33341
A_32_P209582 A_32_P117185
A_32_P104448
A_32_P127019 A_32_P29149
A_32_P144852
A_32_P197720 A_24_P357847
A_32_P48149
A_24_P375691 A_32_P201434
-
A_24_P195454 - A_24_P927639 - A_32_P134634
A_24_P384604
A_32_P207885 A_32_P230253
A_32_P224888
A_32_P121234 A_32_P171253
A_32_P130536
A_24_P264143 A_32_P185766
A_32_P15829
A_24_P451992 A_32_P71858
A_32_P2883
A_32_P509964 A_32_P132766
A_23_P3083
A_23_P58137 A_32_P8732
A_24_P703642
A_24_P867201 A_24_P671115
A_24_P417352
A_32_P215143 A_32_P75867
A_24_P109921
A_32_P35575 A_24_P139761
A_32_P3932
A_32_P216888 A_32_P72611
A_23_P32583
A_24_P101226 A_32_P226525
-
A_32_P49959 - A_32_P105940 - A_32_P61522
A_23_P149441
A_32_P93352 A_32_P179686
ES 2 4 11 833 A2
-
A_24_P465799 - A_32_P13823 - A_23_P350782
-
A_24_P472081 - A_32_P89480 - A_32_P429876
A_32_P184268
A_24_P71640S A_32_P167111
A_24_P173566
A_24_P928306 A_32_P133090
A_32_P12703
A_32_P51988 A_23_P357504
ID Entrez
Simbolo ID Entrez 51mbolo ID Entrez Simbolo
A_32_P47285
A_23_P136026 A_32_P71476
A_32_P76137
A_24_P15550 A_24_P767725
A_24_P379629
A_24_P185516 A_24_P272146
A_24_P358606
A_24_P28160S A_24_P128361
A_32_P1S9192
A_32_P65589 A_32_P200144
A_32_P42329
A_24_P659202 A_32_P1110n
A_24_P23327
A_24_P649327 A_24_P323298
A_32_P194423
A_24_P110242 A_32_P177843
A_32_P12065
A_32_PB5593 A_23_P417363
A_24_P741023
A_32_P94685 A_24_P67063
A_23_P147224
A_32_P232413
-
A_32_P232682 - A_24_P178834
A_32_P214860
A_32_P65022
A_24_P367100
A_32_P88163
A_23_P1 47578
A_24_P475753
A_24_P488083
A_32_P4421O
A_24_P923854
A_32_P215866
A_24_P33055
A_32_P176036
A_23_P259763
A_24_P918044
A_24_P900555
A_23_P339954
A_24_P326084
A_32_P13337
A_24_P68008
A_32_P91186
A_23_P251002
A_24_P255415
-
A_23_P113056 - A_24_P306905
A_24_P524452
A_32_P74477
A_24_P288915
A_32_P159289
A_32_P184039
A_32_P168727
ES 2 4 11 833 A2
-
A_32_P35947 - A_32_P209104
-
A_24_P845223 - A_32_P134679
A_32_P78488
A_23_P388146
A_32_P121978
A_24_P204574
A_32_P212373
A_32_P154445
A_32_P116488
A_32_P20630a
A_32_P144281
A_24_P179107
A_24_P895836
A_24_P398370
A_24_P418216
A_32_P219581
A_32_P35668
A_32_P175557
A_23_P73328
A_32_P30434
A_32_P77742
A_32_P327750
A_32_P191895
A_32_P109835
A_32_P101653
A_32_P185530
A_24_P315594
A_32_P23731
ES 2 4 11 833 A2

Claims (3)

  1. REIVINDICACIONES
    1. Método in vitro de obtención de dalos útiles para el pronóstico de cáncer de pulmón no microcitico de estadio I o 11 caracterizado por la detección yfo cuantificación del producto de expresión de los genes de la labia 1 en la muestra biológica aislada de un sujeto
    5 2. Método según la reivindicación 1 que además comprende la comparación de los dalos útiles con valores de
    expresión de referencia para el producto de expresión de los genes de la tabla 1 en cáncer de pulmón no
    microcítico de estadio I o 11 obtenidos de sujetos en los que el pronóstico es oonocido (muestra de referencia)
    para identificación del sujeto como un sujeto de buen pronóstico o de mal pronóstico.
    3
    Método según las reivindicaciones 1 o 2 donde la comparación se reatiza mediante el método del centroide
    10
    compacto más cercano.
    4
    Método in vitro para el pronóstico de cáncer de pulmón no microcitico de estadio I o II caracterizado por:
    a. la detección y cuantificación del producto de expresión de los genes de la tabla 1 en una muestra de
    referencia;
    b. el cálculo de un valor de referencia (valor 1) para cada producto de expresión de los genes de la tabla
    15
    1 en las muestras de referencia de pronóstico favorable (grupo de buen pronóstico) y el cálculo de un
    valor de referencia (valor 2) en las muestras de referencia de pronóstico desfavorable (grupo de mal
    pronóstico) mediante el uso del método del centroide más cercano;
    c. la detección y cuantificación del producto de expresión de los genes de la tabla 1 en la muestra
    biológica de un nuevo sujeto en el que el pronóstico es desconocido (muestra de estudio);
    20
    d. la comparación mediante el uso del método de clasificación del centroide compacto más cercano de
    los valores obtenidos en la detección y cuantificación del producto de expresión de los genes de la
    tabla 1 en la muestra de estudio con los valores de referencia obtenidos en los grupos de buen y mal
    pronóstico.
    25
    e la asociación de la muestra de estudio al grupo de buen pronóstico o al grupo de mal pronóstico según lo establecido en el método del centroide compacto más cercano.
    5
    Método según la reivindicación 4 donde el método del centroide más cercano se lleva a cabo a través de la
    aplicación de Predicción de Análisis de Microarrays (PAM)
    6
    Método según cualquiera de las reivindicaciones 1 a 5 donde la muestra de referencia y las muestras de estudio
    han sido previamente nonnalizadas antes de la comparación
    30
    7 Método según cualquiera de las reivindicaciones 1 a 6 que ademas comprende la detección y/o cuantificación de
    al menos un producto de expresión de los genes descritos en la tabla 2.
    8
    Método según cualquiera de las reivindicaciones 1 a 7 donde el producto de expresión es ARN mensajero
    9
    Método según la reivindicación 8 donde la detección y/o cuantificación del ARN mensajero se realiza mediante
    microarrays. 35 10. Método según la reivindicación 8 donde la detección y/o cuantificación del ARN mensajero se realiza mediante
    RT-PCR.
    11 Método según cualquiera de las reivindicaciones 1 a 7 donde el producto de expresión es una proteína
    12 Método según la reivindicación 11 donde la detección y/o cuantificación de la proteina se realiza mediante
    inmuno blotling, inmunohistoquimica, cromatografia o microarrays 40 13 Método según cualquiera de las reivindicaciones 1 a 12 donde la muestra biológica se selecciona de la lista que comprende: tejido, sangre, plasma, suero, linfa, lavado broncoalveolar o fluido ascítico. 14 Método según cualquiera de las reivindicaciones 1 a 13 donde la muestra biológica es fresca, congelada, fijada o fijada y embebida en parafina. 15 Método según cualquiera de las reivindicaciones 1 a 14 donde el sujeto es un humano 45 16. Uso in vitro de los productos de expresión de los genes de la tabla 1 como marcador pronóstico de cancer de pulmón no microcítico de estadio I o II
    ES 2 4 11 833 A2
    17
    Kit que comprende sondas que consisten en las sondas que reconocen el ARN mensajero, producto de la
    expresión de los genes de la labia 1, o el ADN complementario o ARN complementario a dicho ARN mensajero, o
    anticuerpos que reconocen una proteína producto de expresión de los genes de la labia 1
    18
    Kit según la reivindicación 17 que comprende sondas, que consisten en las sondas que reconocen el ARN
    5
    mensajero producto de la expresión de los genes de la labia 1
    19
    Kit según la reivindicación 15 donde las sondas son las secuencias SEQ ID NO· 1 a SEQ IDNO: 66
  2. 20.
    Kit según cualquiera de las reivindicaciones 17 a 19 que además comprende al menos una sonda o un anticuerpo
    Que reconoce un producto de expresión de los genes de la labia 2.
  3. 21 .
    Kit según la reivindicación 20 que comprende al menos una sonda que reconoce un producto de expresión de los
    10
    genes de la tabla 2.
    22
    Kit según cualquiera de las reivindicaciones 17 a 21 que además comprende al menos unos de los reactivos
    seleccionados de la lista que comprende: una retrotranscriptasa, una ARN polimerasa o un fluoróforo .
    23
    Kit según cualquiera de las reivindicaciones 17 a 22 donde las sondas están situadas en un soporte sólido
    24
    Uso del kit según las reivindicaciones 17 a 23 para la obtención de datos útiles para el pronóstico del carcinoma
    15
    de pulmón no microcítico de estadios I o 11
    42
ES201132151A 2011-12-30 2011-12-30 Método de pronóstico del carcinoma no microcítico de pulmón de estadio I o II. Expired - Fee Related ES2411833B1 (es)

Priority Applications (2)

Application Number Priority Date Filing Date Title
ES201132151A ES2411833B1 (es) 2011-12-30 2011-12-30 Método de pronóstico del carcinoma no microcítico de pulmón de estadio I o II.
PCT/ES2012/070919 WO2013098457A1 (es) 2011-12-30 2012-12-28 Método de clasificación del carcinoma no microcítico de pulmón basado en la identificación de una respuesta inmune intratumoral

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
ES201132151A ES2411833B1 (es) 2011-12-30 2011-12-30 Método de pronóstico del carcinoma no microcítico de pulmón de estadio I o II.

Publications (3)

Publication Number Publication Date
ES2411833A2 ES2411833A2 (es) 2013-07-08
ES2411833R1 ES2411833R1 (es) 2013-09-20
ES2411833B1 true ES2411833B1 (es) 2014-07-15

Family

ID=48652410

Family Applications (1)

Application Number Title Priority Date Filing Date
ES201132151A Expired - Fee Related ES2411833B1 (es) 2011-12-30 2011-12-30 Método de pronóstico del carcinoma no microcítico de pulmón de estadio I o II.

Country Status (1)

Country Link
ES (1) ES2411833B1 (es)

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8969000B2 (en) * 2007-06-01 2015-03-03 Agendia B.V. Prognostic gene expression signature for non small cell lung cancer patients
EP2145964A1 (en) * 2008-07-17 2010-01-20 Universität Zu Köln A method for lung cancer early detection and prognosis
WO2011094483A2 (en) * 2010-01-29 2011-08-04 H. Lee Moffitt Cancer Center And Research Institute, Inc. Immune gene signatures in cancer

Also Published As

Publication number Publication date
ES2411833R1 (es) 2013-09-20
ES2411833A2 (es) 2013-07-08

Similar Documents

Publication Publication Date Title
EP3430171B1 (en) Detection and treatment of anti-pd-1 therapy resistant metastatic melanomas
EP3458612B1 (en) Methods for subtyping of lung adenocarcinoma
ES2537403T3 (es) Método para usar la expresión génica para determinar el pronóstico de cáncer de próstata
US20210340631A1 (en) Methods for subtyping of lung squamous cell carcinoma
WO2010064702A1 (ja) 癌の予後を予測するためのバイオマーカー
KR101794328B1 (ko) 794개 유전자 세트를 포함하는 간내담도암 예후 예측용 바이오마커 조성물
US20110064739A1 (en) Medicament, compositions, and substances for treating and identifying adenocarcinoma of the lung
US20230395263A1 (en) Gene expression subtype analysis of head and neck squamous cell carcinoma for treatment management
KR102029775B1 (ko) 비근침윤성 방광암 진단용 바이오마커 및 이의 용도
US20150354009A1 (en) Colorectal cancer classification with differential prognosis and personalized therapeutic responses
WO2012093821A2 (ko) 초기유방암의 예후 예측용 유전자 및 이를 이용한 초기유방암의 예후예측 방법
KR20180126085A (ko) 체크포인트 부전 및 그 방법(checkpoint failure and methods therefor)
Tao et al. Identification of distinct gene expression profiles between esophageal squamous cell carcinoma and adjacent normal epithelial tissues
CA2695814A1 (en) Methods and tools for prognosis of cancer in her2+ patients
US20110183859A1 (en) Inflammatory genes and microrna-21 as biomarkers for colon cancer prognosis
US20210054464A1 (en) Methods for subtyping of bladder cancer
ES2411833B1 (es) Método de pronóstico del carcinoma no microcítico de pulmón de estadio I o II.
US20240182984A1 (en) Methods for assessing proliferation and anti-folate therapeutic response
KR102626616B1 (ko) 전립선암의 아형 분류 방법 및 분류 장치
US12006554B2 (en) Methods for subtyping of head and neck squamous cell carcinoma
ES2420079B1 (es) Método de clasificación del carcinoma no microcítico de pulmón basado en la identificación de una respuesta inmune intratumoral.
WO2013098457A1 (es) Método de clasificación del carcinoma no microcítico de pulmón basado en la identificación de una respuesta inmune intratumoral
KR101416502B1 (ko) 인간의 장암 진단용 키트
KR101416504B1 (ko) 인간의 장암 진단용 키트
KR101416503B1 (ko) 인간의 장암 진단용 키트

Legal Events

Date Code Title Description
FG2A Definitive protection

Ref document number: 2411833

Country of ref document: ES

Kind code of ref document: B1

Effective date: 20140715

FD2A Announcement of lapse in spain

Effective date: 20211004