HUELLA GENÓMICA DE CÁNCER DE MAMA
CAMPO DE LA INVENCIÓN
La presente invención se relaciona con métodos in vitro para determinar el pronóstico de un sujeto diagnosticado de cáncer de mama a desarrollar metástasis o para seleccionar el tratamiento adecuado para dicho sujeto.
ANTECEDENTES DE LA INVENCIÓN
Mundialmente, el cáncer de mama es el segundo tipo más común de cáncer (10.4%; tras el cáncer de pulmón) y la quinta causa más común de muerte por cáncer (tras el cáncer de pulmón, cáncer de estómago, cáncer de hígado, y cáncer de colon). Entre las mujeres en el mundo, el cáncer de mama es la causa más común de muerte por cáncer. En 2005, el cáncer de mama produjo 502.000 muertes en el mundo (el 7% de las muertes por cáncer; casi el 1% de todas las muertes). El número de casos mundiales ha aumentado significativamente desde la década de 1970, un fenómeno del que se echa la culpa parcialmente a los estilos de vida modernos en el mundo occidental. Las mujeres de
Norteamérica tienen la mayor incidencia de cáncer de mama en el mundo.
Debido a que la mama está compuesta de tejidos idénticos en hombres y mujeres, el cáncer de mama también se da en hombres. Las incidencias de cáncer de mama en hombres son aproximadamente 100 veces menores que en mujeres, pero se considera que los hombres con cáncer de mama tienen estadísticamente las mismas tasas de supervivencia que las mujeres.
El cáncer de mama se clasifica en fases según el sistema TNM. El pronóstico esta íntimamente unido a los resultados de la clasificación en fases, y la clasificación en fases también se usa para asignar pacientes a tratamientos tanto en ensayos clínicos como en la práctica médica. La información para clasificar en fases es como sigue:
• TX: El tumor primario no se puede evaluar. TO: No hay evidencia de tumor. Tis: Carcinoma in situ, no invasión. Tl : El tumor es de 2 cm o menos. T2: El tumor es de más de 2 cm pero de menos de 5 cm. T3: El tumor es de más de 5 cm. T4:
Tumor de cualquier tamaño que crece en la pared del pecho o piel, o cáncer de mama inflamatorio.
• NX: Los ganglios linfáticos cercanos no se pueden evaluar. NO: El cáncer no se ha extendido a los ganglios linfáticos regionales. Nl : El cáncer se ha extendido a 1 a 3 ganglios linfáticos de la axila o a uno mamario interno. N2: El cáncer se ha extendido a 4 a 9 ganglios linfáticos de la axila o a múltiples ganglios mamarios internos. N3: Aplica uno de los siguientes:
- El cáncer se ha extendido a 10 ó más ganglios linfáticos de la axila, o el cáncer se ha extendido a los ganglios linfáticos bajo la clavícula, o el cáncer se ha extendido a los ganglios linfáticos por encima de la clavícula o el cáncer afecta a los ganglios linfáticos de la axila y se ha extendido a los ganglios linfáticos mamarios internos, o el cáncer afecta a 4 ó más ganglios linfáticos de la axila, y se encuentran cantidades mínimas de cáncer en los ganglios mamarios internos o en biopsia de ganglios linfáticos centinelas.
• MX: La presencia de extensión distante (metástasis) no se puede evaluar. MO: No hay extensión distante. Ml : Se ha producido la extensión a órganos distantes, que no incluyen el ganglio linfático supraclavicular.
El pilar principal del tratamiento de cáncer de mama es la cirugía cuando el tumor está localizado, con posible terapia adyuvante hormonal (con tamoxifeno o un inhibidor de aromatasa), quimioterapia, y/o radioterapia. En la actualidad, las recomendaciones de tratamiento después de la cirugía (terapia adyuvante) siguen un patrón. Este patrón está sujeto a cambio, ya que cada dos años, tiene lugar una conferencia mundial en St. Gallen, Suiza, para discutir los resultados reales de los estudios multicentros mundiales. Asimismo, dicho patrón también se revisa según el criterio consenso del National Institute of Health (NIH). Basándose en estos criterios, más del 85-90% de los pacientes que no presentan metástasis en nodulos linfáticos serían candidatos para recibir terapia sistémica adyuvante.
En la actualidad, no se ha identificado un set de predictores de prognosis satisfactorio basado únicamente en información clínica. Durante los últimos 30 años los oncólogos
se han centrado en optimizar el desenlace de los pacientes de cáncer y es solo ahora que las nuevas tecnologías disponibles permiten investigar polimorfismos, niveles de expresión de genes y mutaciones de genes con el propósito de predecir el impacto de una terapia determinada en diferentes grupos de pacientes de cáncer para hacer quimioterapias a medida. Ensayos de PCR como Oncotype DX o ensayos de microarrays como MammaPrint pueden predecir el riesgo de recaída del cáncer de mama basada en la expresión de genes. En febrero de 2007, el ensayo MammaPrint se convirtió en el primer indicador de cáncer de mama en conseguir autorización oficial de la Food and Drug Administration.
Así, el documento WO02103320 describe un método para predecir el pronóstico de pacientes de cáncer de mama mediante el análisis de la expresión de un grupo de marcadores genéticos, en particular de 70 genes (Tabla 6, página 89). Dl también describe un microarray para determinar el pronóstico de cáncer de mama a partir de una muestra de un paciente que comprende sondas para la detección de la expresión génica de dichos genes.
Por otra parte, el documento WO2005/083429 describe un método para la selección de una firma de marcadores genéticos para el pronóstico de cáncer de mama. Asimismo, dicho documento describe un método para determinar el pronóstico de pacientes con cáncer de mama mediante el análisis de la expresión de un grupo de genes seleccionados a partir de dicho método. En concreto, dicho documento se relaciona con el uso de marcadores genéticos para la predicción del pronóstico de cáncer de mama a partir de una firma característica formada por 76 marcadores genéticos. Dicho documento también describe un kit, tal como un microarray, para determinar el pronóstico de cáncer de mama a partir de una muestra de un paciente que comprende sondas para la detección de la expresión génica de dichos 76 genes.
Por tanto, existe la necesidad de desarrollar nuevos métodos que permitan identificar los genes más relevantes implicados en metástasis de forma que se puedan obtener firmas más fiables y basadas en un menor número de genes. Dichas firmas permitirán la predicción del pronóstico de un paciente que sufre cáncer de mama de forma más eficaz
que los métodos descritos en el estado de la técnica. La identificación de nuevos factores de pronóstico servirá para guiar en la selección de los tratamientos más adecuados.
COMPENDIO DE LA INVENCIÓN
En un primer aspecto, la presente invención se refiere a un método in vitro para determinar el pronóstico de un sujeto diagnosticado con cáncer de mama o para seleccionar el tratamiento de un sujeto diagnosticado con cáncer de mama que comprende determinar los niveles de expresión de los genes identificados en la Tabla 1 y en la Tabla 2 en una muestra de tejido tumoral procedente de dicho sujeto, en donde un aumento de la expresión de los genes identificados en la Tabla 1 y una disminución de la expresión de los genes identificados en la Tabla 2 con respecto a un valor de referencia es indicativo de un peor pronóstico o de que dicho sujeto tiene que ser tratado con quimioterapia.
En un segundo aspecto, la invención se refiere a un reactivo capaz de detectar los niveles de expresión de los genes de las Tablas 1 y 2.
En otro aspecto, la invención se refiere a un kit que comprende al menos un reactivo según la invención.
En otro aspecto, la invención se relaciona con el uso de un kit según la invención para el pronóstico de pacientes diagnosticados con cáncer de mama o para seleccionar el tratamiento de un sujeto diagnosticado con cáncer de mama.
Asimismo, la invención se refiere en otro aspecto, a un método para seleccionar marcadores genéticos para predecir la propensión a desarrollar metástasis de un tumor primario que comprende las siguientes etapas: i) determinar los genes cuya expresión se encuentra alterada respecto a un valor de referencia en una muestra de tumor de un animal no humano genéticamente modificado que muestra propensión a desarrollar tumores de forma espontánea;
ii) identificar los genes homólogos en humanos correspondientes a los genes identificados en la etapa i); y iii) seleccionar aquellos genes identificados en la etapa ii) cuya expresión en muestras de tumores primarios de pacientes que desarrollan metástasis a partir de dicho tumor primario está alterada con respecto a la expresión de dichos genes en tumores primarios de pacientes que no desarrollan metástasis.
BREVE DESCRIPCIÓN DE LAS FIGURAS
La Figura 1 muestra unas Curvas Operador Receptor (COR) de la predicción de la firma genética de la invención, en el dataset Loi completo (n=191), o en el dataset Loi que excluye muestras RE- de grado 3 (n=142). Los paneles A y C muestran predicción de metástasis distal (MD) a 5 años, y el panel E muestra predicción de supervivencia global a 5 años. Los paneles B y D muestran predicción de metástasis distal (MD) a 10 años, y el panel E muestra predicción de supervivencia global a 10 años. El VR del punto de máxima Especificidad (40,1%) y Sensibilidad (100%) del panel A fue elegido como umbral para segregación en muestras de pronóstico bueno o malo (VR=-39,2) (círculo).
La Figura 2 muestra unas curvas de supervivencia o predicción de pronóstico de pacientes no tratados con tamoxifeno, y N- dentro del dataset Loi (86 tumores, diámetro
< 5 cm).
La Figura 3 muestra unas curvas de supervivencia o predicción de pronóstico de pacientes tratados con tamoxifeno, y N+ dentro del dataset Loi (108 tumores, diámetro
< 5 cm).
Figura 4. Firma genética de la invención en el dataset Desmedt. El panel izquierdo muestra un mapa de expresión de los genes cuyas secuencias hibridan con las sondas de la firma de la invención en los tumores de Desmedt, excluyendo los RE- de grado 3
(142 muestras). Las columnas representan genes, y las filas, muestras. Los genes están ordenados desde la izquierda a la derecha según valores decrecientes del valor estadístico de WaId según Tabla 2. Los valores de expresión se muestran como log2 (media=0, desviación estándar=l). El panel derecho muestra los resultados de predicción usando la firma de genes de la invención, o usando los criterios de St. Gallen (SG), NIH, Nottingham Prognostic Index (NPI), Adjuvant Online (AOL), y la firma genómica 76-gene de Veridex. Muestras en color gris claro, buen pronóstico; muestras en color gris oscuro, mal pronóstico. Nótese la presencia de 37 sondas cuya expresión es mayor en las muestras de mal pronóstico. Se muestra el estado del RE (RE+ en negro, RE- en blanco), así como la existencia de MD a 5 o 10 años (presencia de metástasis en blanco, ausencia en negro). Los genes son representados tanto por los identificadores de sonda de Affymetrix, como por los símbolos de gen del NCBI.
Figura 5. Firma genética de la invención en el dataset Loi. A)El panel izquierdo muestra un mapa de expresión de los genes cuyas secuencias hibridan con las sondas en los tumores de Loi, que fueron N- y no se trataron con tamoxifeno, excluyendo los RE- de grado 3 (86 muestras). Las columnas representan genes, y las filas, muestras. Los genes están ordenados desde la izquierda a la derecha según valores decrecientes del valor estadístico de WaId según Tabla 2. Los valores de expresión se muestran como Iog2 (media=0, desviación estándar=l).
El panel derecho muestra los resultados de predicción usando la firma de genes de la invención, o los criterios de St. Gallen (SG), y NIH. Muestras en color gris claro, buen pronóstico; muestras en color gris oscuro, mal pronóstico. Nótese la presencia de 37 sondas cuya expresión es mayor en las muestras de mal pronóstico. Se muestra el estado del RE (RE+ en negro, RE- en blanco), así como la existencia de MD a 5 o 10 años (presencia de metástasis en blanco, ausencia en negro). Los genes son representados tanto por los identificadores de sonda de Affymetrix, como por los símbolos de gen del NCBI. B) Similar al panel A, pero para el grupo de 108 pacientes del dataset Loi que fueron N+ y recibieron terapia hormonal.
Figura 6. Ranking de los genes seleccionados en la comparación entre tumores murinos p53- y p53-;pRb- y piel normal. Genes sobreexpresados en los tumores de ratón ordenados según la magnitud del cambio relativo de expresión génica (desde 80,3 hasta 1,2 veces, panel A), u ordenados por el valor P (panel C), computado según el Test de la T de Student. El color negro de la columna izquierda indica genes aumentados más de 2 veces. Color gris oscuro de la columna central indica genes que también cumplieron los criterios de expresión diferencial del test SAM. Se indica en la columna derecha la posición dentro del rango de los genes equivalentes de ratón de la firma de genes de la invención en humanos. Los genes cuyo nombre aparece en gris oscuro están sobreexpresados en tumores humanos malignos de mama; genes en gris claro, están disminuidos en tumores malignos
Genes de expresión disminuida en los tumores de ratón ordenados según la magnitud del cambio relativo de expresión génica (desde 375,8 hasta 1 ,2 veces, panel B), u ordenados por el valor P (panel D), computado según el Test de la T de Student. El color negro de la columna izquierda indica genes regulados negativamente más de 2 veces. Color gris oscuro de la columna central indica genes que también cumplieron los criterios de expresión diferencial del test SAM. Se indica en la columna derecha la posición dentro del rango de los genes equivalentes de ratón de la firma de genes en humanos. Genes cuyo nombre aparece en gris oscuro están sobreexpresados en tumores humanos malignos de mama; genes en gris claro, están disminuidos en tumores malignos.
DESCRIPCIÓN DETALLADA DE LA INVENCIÓN
Los autores de la presente invención han seleccionado una firma de genes que hibridan con unas sondas y cuya expresión está correlacionada con el pronóstico de un sujeto que ha sido diagnosticado de cáncer de mama. Asimismo, dicha firma puede emplearse para seleccionar el tratamiento más adecuado para dicho sujeto diagnosticado con cáncer de mama.
Como se ha comentado anteriormente, los criterios de St. Gallen y del NIH clasifican los pacientes como de alto riesgo o bajo riesgo en base a varias características histológicas y clínicas. Los autores de la presente invención han demostrado que dicha
firma pronostica de la invención asigna más pacientes al grupo de bajo riesgo (o buen pronóstico) que hacen los métodos tradicionales. De hecho, los inventores han mostrado que dichos criterios clínicos, clasifican erróneamente un número clínicamente significativo de pacientes en el grupo de mal pronóstico, por lo que en la práctica clínica actual muchos pacientes están recibiendo quimioterapia de forma innecesaria.
Por tanto, en un primer aspecto, la invención se refiere a un método in vitro para determinar el pronóstico de un sujeto diagnosticado con cáncer de mama o para seleccionar el tratamiento de un sujeto diagnosticado con cáncer de mama que comprende determinar los niveles de expresión de los genes identificados en la Tabla 1 y en la Tabla 2 en una muestra de tejido tumoral procedente de dicho sujeto, en donde un aumento de la expresión de los genes identificados en la Tabla 1 y una disminución de la expresión de los genes identificados en la Tabla 2 con respecto a un valor de referencia es indicativo de un peor pronóstico o de que dicho sujeto tiene que ser tratado con quimioterapia. En una realización particular de la invención, dicha muestra de tejido tumoral es una muestra de un tumor primario, en particular, dicho tumor es cáncer de mama. Así, a modo ilustrativo dicha muestra de tejido tumoral, puede ser una muestra de biopsia obtenida, por ejemplo, por resección quirúrgica.
En una realización particular del método de la invención, dichos genes son los genes cuyas secuencias de nucleótidos hibridan con las sondas identificadas en la Tabla 1 y la Tabla 2.
Tabla 1 Tabla 2
Símbolo gen Símbolo gen
TOP2A ELOVL5
TOMM70A PARP3
PLK1 CBX7
CCNB2
UBEC2C
SPAG5
CDC2
MAD2L1
BUB1B
TRIP13
AURKA
KIF11
BRCA1
HMMR
CIAPIN1
LRP8
AURKB
CDKN3
HSP90AA1
NUSAP1
ERO1L
MLF1IP
DCC1
C21orf45
PBK
ATAD5
MCM10
CDCA3
RACGAP1
Tabla 3
La cuantificación de los niveles de expresión de los genes identificados en la Tabla 1 y en la Tabla 2 puede realizarse a partir del ARN resultante de la transcripción de dichos genes (ARNm) o, alternativamente, a partir del ADN complementario (ADNc) de dichos genes. Por tanto, en una realización particular, la cuantificación de los niveles de expresión de los genes identificados en la Tabla 1 y en la Tabla 2 comprende la cuantificación del ARN mensajero (ARNm) de dichos genes, o un fragmento de dicho ARNm, el ADN complementario (ADNc) de dichos genes, o un fragmento de dicho ADNc, o sus mezclas.
Adicionalmente, el método de la invención puede incluir la realización de una etapa de extracción con el fin de obtener el ARN total, lo que puede realizarse mediante técnicas convencionales (Chomczynski y cois., Anal. Biochem., 1987, 162:156; Chomczynski P., Biotechniques, 1993, 15:532).
Prácticamente cualquier método convencional puede ser utilizado dentro del marco de la invención para detectar y cuantificar los niveles de ARNm codificados por los genes cuyas secuencias de nucleótidos hibridan con las sondas de las Tablas 1 y 2 o de su
ADNc correspondiente. A modo ilustrativo, no limitativo, los niveles de ARNm codificados por dichos genes pueden ser cuantificados mediante el empleo de métodos convencionales, por ejemplo, métodos que comprenden la amplificación del ARNm y la cuantificación del producto de la amplificación de dicho ARNm, tales como electroforesis y tinción, o alternativamente, mediante Northern blot y empleo de sondas
apropiadas, northern blot y empleo de sondas específicas del ARNm de los genes de interés o de su ADNc correspondiente, mapeo con la nucleasa S 1 , RT-PCR, hibridación, microarrays, etc. Análogamente, los niveles del ADNc correspondiente a dichos ARNm codificados por los genes de la Tablas 1 y 2 también puede ser cuantificado mediante el empleo de técnicas convencionales; en este caso, el método de la invención incluye una etapa de síntesis del correspondiente ADNc mediante transcripción inversa (RT) del ARNm correspondiente seguida de amplificación y cuantificación del producto de la amplificación de dicho ADNc. Métodos convencionales de cuantificar los niveles de expresión pueden encontrarse, por ejemplo, en Sambrook y cois., 2001 "Molecular cloning: a Laboratory Manual", 3rd ed., CoId Spring Harbor Laboratory Press, N. Y., VoI. 1-3.
En una realización particular de la invención, la cuantificación de los niveles de expresión de los genes identificados en las Tablas 1 y 2 se realiza mediante una reacción en cadena de la polimerasa (PCR) cuantitativa multiplex o un array de ADN o ARN.
En otra realización particular de la invención, la determinación de los niveles de expresión de los genes identificados en la Tabla 1 y la Tabla 2 se realiza mediante un array de ADN que comprende las sondas identificadas en las Tablas 3 y 4. En una realización más particular de la invención, dicho array comprende, al menos, un conjunto de 11 sondas para determinar los niveles de expresión de cada uno de los genes de las Tablas 1 y 2. Así, para la determinación de los niveles de expresión de cada uno de dichos genes, se realiza una media de la señal de dichas 11 sondas empleadas para la detección de la expresión de dicho gen.
Así, dicho método comprende la determinación de los niveles de expresión de dichos genes de las Tablas 1 y 2 con respecto a un valor de referencia. En una realización particular de la invención, dicho valor de referencia es el valor de expresión génica de dichos genes de las Tablas 1 y 2 en una muestra de tumores primarios de pacientes que no desarrollan metástasis. Preferiblemente, se considerará que los genes presentan una expresión aumentada cuando la relación de expresión de un gen es de al menos 1 ,5 veces con respecto a un valor de referencia, preferiblemente superior a 2 veces, más
preferiblemente superior a, 3, 4, 5 y 10 veces. De igual modo, en una realización particular de la invención, se considerará que los genes presentan una expresión disminuida con respecto a un valor de referencia, cuando la relación de expresión de un gen es de al menos 1 ,5 veces inferior con respecto al valor de referencia.
En una realización particular de la invención, el método para la determinación del mejor o peor pronóstico de un sujeto que ha sido diagnosticado de cáncer de mama, comprende la realización de un análisis de regresión de riesgos proporcionales en función de dichos valores de expresión de los genes identificados en las Tablas 1 y 2. Según los datos mostrados en el Ejemplo 2, los autores han demostrado que, de esta forma, dicho pronóstico se realiza con una efectividad que, según las curvas COR, tendría una sensibilidad de un 100% así como un máximo de especificidad. Por tanto, en una realización particular de la invención, la determinación de dicho pronóstico comprende un análisis de regresión de riesgos proporcionales de dicho pronóstico en función de los niveles de expresión de los genes identificados en la Tabla 1 y en la Tabla 2.
Tal como se describe en el Ejemplo 2 que acompaña la presente descripción, los inventores han empleado un análisis de regresión de riesgos proporcionales de tipo Cox para la determinación del pronóstico de un sujeto diagnosticado con cáncer de mama. Dicho análisis de Cox asigna un coeficiente de regresión para cada gen, de tal forma que el gen cuya expresión esté directamente correlacionada con la variable pronóstico, por ejemplo con aparición de metástasis, es > 0, y si su expresión está relacionada inversamente con dicha variable es < 0. Por tanto, en una realización particular de la invención, dicho análisis de regresión de riesgos proporcionales es un análisis de tipo Cox. En una realización más particular, en dicho análisis de tipo Cox se establece metástasis distal como variable pronóstico. En una realización preferida, dicha metástasis distal es metástasis distal a 5 ó 10 años.
Los inventores han demostrado que mediante el método de la invención es posible determinar el pronóstico de un paciente con una alta sensibilidad y especificidad. Así, a partir de los valores de expresión génica de los genes de las Tablas 1 y 2 según se ha
descrito anteriormente, y del valor del estadístico de WaId del análisis de regresión de riesgos proporcionales, los inventores han demostrado que es posible determinar dicho pronóstico aplicando la siguiente fórmula:
40 X S1-X1 + 39,2 i=l donde X1 es el valor del nivel de expresión en Iog2 de cada uno de dichos genes identificados en las Tablas 1 y 2; y S1 es el valor del estadístico de WaId del análisis de regresión de tipo Cox para cada uno de dichos genes identificados en las Tablas 1 y 2,
en donde si el valor obtenido es mayor que cero entonces es indicativo de que dicho paciente presenta un peor pronóstico o de que dicho paciente tiene que ser tratado con quimioterapia y donde si dicho valor es menor que cero es indicativo de que dicho paciente presenta un buen pronóstico o de que dicho paciente no tiene que ser tratado con quimioterapia.
El valor del estadístico de WaId es un valor empleado comúnmente por el experto en la materia para saber si las variables que se introducen en el análisis estadístico son o no relevantes. Dicho valor se puede calcular según se describe en WaId A. (1943) (Transactions of the American Mathematical Society. 1943; 54:426-482) y Silvey (1959) (Silvey SD. Annals of Mathematical Statistics. 1959; 30:389-407).
Por otro lado, para la puesta en práctica de la invención, a parte de cuantificar los niveles de expresión de los genes identificados en las Tablas 1 y 2, también se puede cuantificar el nivel de expresión de las proteínas codificadas por dichos genes. Así, en una realización particular, la cuantificación de los niveles de las proteínas codificadas por los genes identificados en las Tablas 1 y 2 comprende la cuantificación de dichas proteínas o variables de las mismas.
El término "proteína", tal como aquí se utiliza, se refiere a una cadena molecular de aminoácidos, unidos por enlaces covalentes o no covalentes. El término incluye,
además, todas las formas de modificaciones químicas post-traduccionales, relevantes fisiológicamente, por ejemplo, glicosilación, fosforilación o acetilación, etc.
En la presente invención se entiende por "variante", una proteína cuya secuencia de aminoácidos es sustancialmente homologa a la secuencia de aminoácidos de una proteína concreta. Una secuencia de aminoácidos es sustancialmente homologa a una secuencia de aminoácidos determinada cuando presenta un grado de identidad de, al menos, un 70%, ventajosamente de, al menos, un 75%, típicamente de, al menos, un 80%, preferentemente de, al menos, un 85%, más preferentemente de, al menos, un 90%, aún más preferentemente de, al menos, un 95%, 97%, 98% ó 99%, respecto a dicha secuencia de aminoácidos determinada. El grado de identidad entre dos secuencias de aminoácidos puede determinarse por métodos convencionales, por ejemplo, mediante algoritmos estándar de alineamiento de secuencias conocidos en el estado de la técnica, tales como, por ejemplo BLAST [Altschul S. F. et al. Basic local alignment search tool. J Mol Biol. 1990 Oct 5; 215(3):403-10].
El experto en la materia entiende que, las mutaciones en la secuencia de nucleótidos de los genes que dan lugar a sustituciones conservativas de aminoácidos en posiciones no críticas para la funcionalidad de la proteína, son mutaciones evolutivamente neutras que no afectan a su estructura global ni a su funcionalidad. Dichas variantes caen dentro del ámbito de la presente invención.
Por tanto, tal como aquí se utiliza, el término "variante" también incluye cualquier fragmento de una de las proteínas descritas en la presente invención. El término "fragmento" se refiere a un péptido que comprende una porción de una proteína.
El nivel de expresión de las proteínas codificadas por los genes identificados en las Tablas 1 y 2 puede ser cuantificado mediante cualquier método convencional que permita detectar y cuantificar dichas proteínas en una muestra de un sujeto. A modo ilustrativo, no limitativo, los niveles de dichas proteínas pueden cuantificarse, por ejemplo, mediante el empleo de anticuerpos con capacidad de unirse a dichas proteínas (o a fragmentos de las mismas que contenga un determinante antigénico) y la posterior
cuantificación de los complejos formados. Los anticuerpos que se emplean en estos ensayos pueden estar marcados o no. Ejemplos ilustrativos de marcadores que se pueden utilizar incluyen isótopos radiactivos, enzimas, fluoróforos, reactivos quimio luminiscentes, sustratos enzimáticos o cofactores, inhibidores enzimáticos, partículas, colorantes, etc. Existe una amplia variedad de ensayos conocidos que se pueden utilizar en la presente invención, que utilizan anticuerpos no marcados (anticuerpo primario) y anticuerpos marcados (anticuerpo secundario); entre estas técnicas se incluyen el Western-blot o transferencia Western, ELISA (ensayo inmuno absorbente ligado a enzima), RIA (radioinmunoensayo), EIA competitivo (inmunoensayo enzimático competitivo), DAS-ELISA (ELISA sandwich con doble anticuerpo), técnicas inmuno cito químicas e inmunohistoquímicas, técnicas basadas en el empleo de biochips o microarrays de proteínas que incluyan anticuerpos específicos o ensayos basados en precipitación coloidal en formatos tales como dipsticks. Otras maneras para detectar y cuantificar dichas proteínas, incluyen técnicas de cromatografía de afinidad, ensayos de unión a ligando, etc.
En una realización particular, la cuantificación de los niveles de proteína codificada por los genes identificados en las Tablas 1 y 2 se realiza mediante western blot, ELISA, inmunohistoquímica o un array de proteínas.
Como se ha mencionado anteriormente, el método in vitro de la invención puede ser empleado para seleccionar el tratamiento de un sujeto diagnosticado con cáncer de mama, en donde un aumento de la expresión de los genes identificados en la Tabla 1 y una disminución de la expresión de los genes identificados en la Tabla 2 con respecto a un valor de referencia es indicativo de que dicho sujeto tiene que ser tratado con quimioterapia.
Los agentes quimioterápicos adecuados incluyen pero no se limitan a agentes alquilantes tales como, por ejemplo, ciclofosfamida, carmustina, daunorubicina, mecloretamina, clorambucilo, nimustina, melfalán y similares; antraciclinas, tales como, por ejemplo, daunorubicina, doxorubicina, epirubicina, idarubicina, mitoxantrona, valrubicina y similares; compuestos de taxano, tales como, por ejemplo, paclitaxel,
docetaxel y similares; inhibidores de la topoisomerasa tales como, por ejemplo, etopóxido, tenipóxido, irinotecán, tulipóxido y similares; análogos de nucleótidos tales como, por ejemplo, azacitidina, azatioprina, capecitabina, citarabina, doxifluridina, fluorouracilo, gemcitabina, mercaptopurina, metotrexato, tioguanina ftorafur y similares; agentes a base de platino tales como, por ejemplo, carboplatino, cisplatino, oxaliplatino y similares; agentes antineoplásicos tales como, por ejemplo, vincristina, leucovorina, lomustina, procarbazina y similares; moduladores hormonales tales como, por ejemplo, tamoxifeno, finasterida, inhibidores de la 5-α-reductasa y similares; alcaloides de la vinca tales como, por ejemplo, vinblastina, vincristina, vindesina, vinorelbina y similares. Los agentes quimioterápicos adecuados se describen con más detalle en la bibliografía, tal como en The Merck Index en CD-ROM, 13a edición.
En la presente invención se entiende por "agente antitumoral" aquel compuesto o agente químico, físico o biológico con propiedades antiproliferativas, antioncogénicas y/o carcinostáticas que puede emplearse para inhibir el crecimiento, la proliferación y/o el desarrollo de tumores. Ejemplos de agentes antitumorales que pueden emplearse en la presente invención son (i) antimetabolitos, tales como antifolatos y análogos de purina;
(ii) productos naturales, tales como antibióticos antitumorales e inhibidores mitóticos;
(iii) hormonas y antagonista de las mismas, tales como andrógenos y corticosteroides; y (iv) agentes biológicos, como vectores virales. Una relación de compuestos que pueden emplearse como agentes antitumorales se describe en la solicitud de patente
WO2005/112973.
En otro aspecto, la presente invención se relaciona con un reactivo, de aquí en adelante reactivo de la invención, capaz de detectar los niveles de expresión de los genes de las Tablas 1 y 2.
En una realización particular, dicho reactivo de la invención comprende
(i) un conjunto de ácidos nucleicos que comprende las secuencias de nucleótidos de las sondas identificadas en las Tablas 3 y 4 o los productos de su transcripción, o
(ii) un conjunto de anticuerpos, o un fragmento de los mismos capaz de detectar un antígeno, consistente en que cada anticuerpo o fragmento es
capaz de unirse específicamente a una de las proteínas codificadas por los genes identificados en las Tablas 1 y 2.
En una realización particular de la invención, dichos ácidos nucleicos son sondas y/o cebadores de ADN, ADNc o ARN. La obtención de dichos ácidos nucleicos puede realizarse por técnicas convencionales conocidas por el experto en la materia a partir de las secuencias de nucleótidos de los genes de las Tablas 1 y 2. En general, dichas sondas y/o cebadores se pueden obtener de casas comerciales por síntesis química. Por otro lado, dichas secuencias de los dichos genes están bien descritas en la literatura y, por tanto, son conocidas.
En otro aspecto, la presente invención se refiere a un kit que comprende al menos un reactivo según la invención. En una realización particular de la invención, dicho kit es un array de ADN o ARN que comprende un conjunto de ácidos nucleicos, en donde dicho conjunto de ácidos nucleicos comprende las secuencias de nucleótidos de las sondas de las Tablas 3 y 4, o un fragmento de los mismos, o los productos de su transcripción. En una realización más particular, dicho kit comprende, además, una molécula de ácido nucleico de uno o varios genes de expresión constitutiva.
En la presente invención se entiende por "genes que se expresan de forma constitutiva" o "genes de expresión constitutiva", a aquellos genes que siempre están activos o que se transcriben de manera constante. Ejemplos de genes que se expresan de forma constitutiva son 2-mioglobulina, ubiquitina, proteína ribosomal 18S, ciclofilina A, receptor de transferían, actina, GAPDH, proteína de activación de la tirosina 3- monooxigenasa/triptófano 5-monooxigenasa (YWHAZ), ubiquitina, beta-actina y β-2- microglobulina.
En otra realización particular de la invención, el kit de la invención comprende un conjunto de anticuerpos, en donde dicho conjunto de anticuerpos consiste en anticuerpos, o fragmentos de los mismos, capaces de unirse específicamente con las proteínas codificadas por los genes identificados en las Tablas 1 y 2 o cualquier variante de dichas proteínas. En una realización particular, dicho kit comprende, además,
anticuerpos, o fragmentos de los mismos, capaces de unirse específicamente con las proteínas codificadas por uno o varios genes de expresión constitutiva.
El término firma genética o firma de genes de la invención según aquí se utiliza se refiere a los genes identificados en las Tablas 1 y 2. Según los datos mostrados por los inventores (ver Ejemplo 4) la firma de genes o firma genética de la invención, asigna más pacientes al grupo de bajo riesgo (o buen pronóstico) que los métodos tradicionales. Así, los inventores han demostrado que los pacientes clasificados como de mal pronóstico según el método de la presente invención tienden a tener mayor proporción de metástasis que los pacientes de mal pronóstico según los criterios clínicos de St Gallen y NIH. Por tanto, en otro aspecto, la invención se refiere al uso de un kit según la invención para el pronóstico de pacientes diagnosticados con cáncer de mama o para seleccionar el tratamiento de un sujeto diagnosticado con cáncer de mama.
En otro aspecto, la invención se refiere a un método para seleccionar marcadores genéticos para predecir la propensión a desarrollar metástasis de un tumor primario que comprende las siguientes etapas: i) determinar los genes cuya expresión se encuentra alterada respecto a un valor de referencia en una muestra de tumor de un animal no humano genéticamente modificado que muestra propensión a desarrollar tumores de forma espontánea; ii) identificar los genes homólogos en humanos correspondientes a los genes identificados en la etapa i); y iii) seleccionar aquellos genes identificados en la etapa ii) cuya expresión en muestras de tumores primarios de pacientes que desarrollan metástasis a partir de dicho tumor primario está alterada con respecto a la expresión de dichos genes en tumores primarios de pacientes que no desarrollan metástasis.
Para la determinación de los genes cuya expresión se encuentra alterada según la etapa i) primeramente se obtiene una muestra de dicho animal, preferiblemente dicha muestra es una muestra de tejido tumoral. En el Ejemplo 1 que acompaña la presente invención
se describe un modo de realización particular del método de la invención. Así, en una realización particular, se extrae el ARN total de dicha muestra de tejido tumoral de dicho animal y dicho ARN se analiza para determinar los genes cuya expresión se encuentra alterada en dicha muestra de tumor con respecto a un valor de referencia. En una realización particular, dicho valor de referencia es el valor de la expresión génica en una muestra de tejido no tumoral procedente de dicho animal. Dicho valor de expresión se puede obtener, por ejemplo, a partir de los valores resultantes de la señal de expresión génica en un array de expresión génica de dicho modelo animal no humano según se explica en el Ejemplo 1 que acompaña la presente descripción. Así, dichos valores corresponden con los valores en los archivos tipo CEL (formato CEL) según el software GCOS (GeneChip® Operating Software) de Affymetrix.
En una realización particular del método para la selección de marcadores genéticos de la invención, dicho animal no humano es un animal en el que la expresión génica del gen Tp53 se encuentra inhibida. En otra realización particular, dicho animal presenta inhibida, además, la expresión génica del gen pRb. Los genes Tp53 y RbI codifican respectivamente los supresores tumorales p53 y pRb. Dichos modelos animales, deficientes para los genes p53 y pRb (p53- y pRb-), desarrollan espontáneamente carcinomas epidérmicos, altamente invasivos. Por tanto, en una realización particular, dicho animal es un animal no humano que desarrolla carcinomas epidérmicos de forma espontánea.
Para desarrollar la etapa ii) del método para seleccionar marcadores genéticos para predecir la propensión a desarrollar metástasis de un tumor primario, se identifican los genes homólogos en humanos correspondientes a los genes identificados en la etapa i). Para ello, se emplean técnicas convencionales de mapeo de genes homólogos conocidas por el experto en la materia. En particular, los inventores han mapeado los identificadores de sondas de Affymetrix del animal no humano con símbolos de genes humanos a través de la búsqueda de identificadores en U133plus 2.0 y U133A mediante el empleo de la utilidad web AILUM (Array Information Library Universal Navigator) (Chen R, et al. Nat Methods 2007;4(l 1):879).
En una última etapa de dicho método, se seleccionan aquellos genes identificados en la etapa ii) cuya expresión en muestras de tumores primarios de pacientes que desarrollan metástasis a partir de dicho tumor primario está alterada con respecto a la expresión de dichos genes en tumores primarios de pacientes que no desarrollan metástasis.
En una realización particular de la invención, la etapa iii) se lleva a cabo mediante un análisis de regresión de riesgos proporcionales según se ha comentado anteriormente. En una realización más particular, dicho análisis de regresión es un análisis de tipo Cox. En una realización preferida, dicho método de tipo Cox establece metástasis distal como variable pronóstico. En una realización aún más preferida de la invención, dicha metástasis distal es metástasis distal a 5 ó 10 años.
Además, los inventores han aplicado el test de WaId (WaId A. Transactions of the American Mathematical Society 1943;54:426-482; Silvey SD. Annals of Mathematical Statistics 1959; 30:389-407) para analizar la hipótesis nula de que el coeficiente sea 0 (no relacionado con la variable pronóstico), asignándose a cada gen un valor de estadístico de WaId, su correspondiente valor P, y valor P corregido por el método FDR (del inglés, false discovery rate) según se explica en el Ejemplo 2 que acompaña la presente descripción. El control FDR es un método estadístico conocido por el experto en la materia empleado en test de hipótesis múltiples para la corrección de comparaciones múltiples.
En una realización particular de la invención, dichos tumores primarios según la etapa iii) son tumores de cáncer de mama.
En una realización particular, la determinación de la expresión de dichos genes según la etapa iii) comprende la cuantificación del ARN mensajero (ARNm) de dichos genes, o un fragmento de dicho ARNm, el ADN complementario (ADNc), o un fragmento de dicho ADNc, o sus mezclas.
En una realización más particular, la cuantificación de los niveles de expresión de los genes según la etapa iii) se realiza mediante una reacción en cadena de la polimerasa (PCR) cuantitativa multiplex o un array de ADN o ARN.
En una realización particular, la cuantificación de los niveles de expresión de los genes según la etapa iii) comprende la cuantificación de los niveles de proteína codificada por dichos genes. En una realización más particular, la cuantificación de los niveles de proteína se realiza mediante western blot, ELISA o un array de proteínas.
El siguiente Ejemplo ilustra la invención y no debe ser considerado como limitativo del alcance de la misma.
EJEMPLO 1 Análisis de tumores epidérmicos de ratón
Los modelos animales utilizados en la presente invención son ratones K14Cre (expresan la recombinasa Cre en capa basal de epitelios estratificados) cruzados con ratones con exones esenciales flanqueados por secuencias loxP en los alelos de los genes Tp53 (modelo p53-), o en los alelos Tp53 y RbI simultáneamente (modelo p53-; pRb-) (Martinez-Cruz AB. et al. Cáncer Res 2008; 68(3):683-692). Tp53 y RbI codifican respectivamente los supresores tumorales p53 y pRb. Se trata pues de modelos de deleción génica en epitelios estratificados. Ambos modelos desarrollan espontáneamente carcinomas escamosos epidérmicos de tipo poco diferenciado o indiferenciado, altamente invasivos.
Se purificó ARN de carcinomas epidérmicos congelados que aparecieron en ratones deficientes en p53 (p53-) (7 tumores) y deficientes en p53 y pRb (p53-/pRb-) (8 tumores). Como controles, se obtuvo ARN de piel normal preservada en RNAlater de animales adultos (8 semanas edad, 5 muestras control). La integridad de las poblaciones de ARN se chequeó mediante el uso del sistema Bioanalyzer (Agilent). Todas las muestras de ARN pasaron los criterios de calidad para análisis de microarrays (número RIN (del inglés, RNA integrity number) por encima de 6). La hibridación al GeneChip
de Affymetrix Mouse Gene Expression MOE430 2.0 se realizó en el Servicio de Genómica del Centro de Investigación del Cáncer de Salamanca, utilizando los protocolos estándar de Affymetrix. Los valores de expresión se extrajeron de los archivos CEL (resultantes del escaneo de la fluorescencia según el software GCOS (del inglés, GeneChip® Operating Software) de Affymetrix, mediante el método RMA (del inglés, Robust Multichip Average) (Bolstad BM, et al. Bioinformatics 2003; 19(2):185- 193; Irizarry RA, et al. Biostatistics 2003; 4(2):249-264). Todas las hibridaciones pasaron los criterios de calidad incluidos en el programa informático RMAExpres, usando las gráficas RLE (del inglés, Relative Log Expression) y NUSE (del inglés, Normalized Unscaled Standard Error).
Se realizaron análisis de expresión génica diferencial de los tumores de ratón comparados con tejido normal mediante el Test de la T de Student (Ttest) y SAM (Significant Analysis of Microarrays) (Tusher VG, et al. Proc Nati Acad Sci U S A 2001; 98(9):5116-5121) en el software libre Multiexperiment Viewer 4.0 (MeV 4) (Saeed AI, et al. Biotechniques 2003; 34(2):374-378). Las sondas se seleccionaron si pasaban dos criterios: i) análisis Ttest con valor P de probabilidad, corregido por el método False Discovery Rate (Benjamini Y, Hochberg Y. Journal of the Royal Statistical Society B 1995; 57:289-300) o FDR < 3xlO"7; y ii) análisis SAM con FDR < IxIO"3. Un total de 682 sondas se seleccionaron como expresados diferencialmente, siendo 371 sobreexpresados y 311 regulados negativamente en los tumores frente a tejido normal. Los identificadores de Affymetrix del chip usado (MOE430 2.0) se mapearon al símbolo de gen homólogo de humano usando la utilidad web Ailun (Chen R, et al. Nat Methods 2007; 4(11):879), lo que resultó en un número de 427 genes humanos.
EJEMPLO 2
Extracción en dos pasos de un predictor de metástasis de cáncer de mama basado en una firma de p53.
2.1 Selección de genes de la firma de p53 relacionados con metástasis.
Los datos crudos de hibridación a microarrays de tumores primarios de mama humano y sus correspondientes datos clínicos, realizados con las versiones de los GeneChips de Affymetrix Human Gene Expression U133A ó U133Plus 2.0, se descargaron desde la página web de la base de datos Gene Expression Ómnibus (GEO) del NCBI, con los identificadores GSE7390 (Desmedí C. et al. Clin Cáncer Res 2007; 13(11):3207-3214). (estudio que se denomina de aquí en adelante dataset Desmedí) y GSE6532 (Loi S. et al. J Clin Oncol 2007;25(10): 1239-1246) (esíudio que se denomina de aquí en adelaníe dataset Loi). Los archivos CEL se tomaron para exíraer los valores de iníensidad de señal usando el programa RMAExpress. Las gráficas RLE y NUSE permitieron ideníificar algunos microarrays de íumores que no pasaban los criíerios de normalización óptima con RMA. Los correspondieníes archivos CEL fueron eliminados de análisis posíeriores.
El dataset Desmedí se utilizó como grupo de enírenamienío (training set), que iras retirar los arrays de baja calidad, coníenía 191 íumores con nodulos linfáticos sanos (N- ), incluyendo íanío muesíras que expresan receptor de esírógenos como muesíras que no (RE+ o RE-, respecíivameníe), procedeníe de pacieníes que no han recibido íerapia sisíémica adyuvaníe (Tabla 5).
Tabla 5: Características clínicas y patológicas de los pacientes del dataset Desmedt
Dataset Desmedt
(n=191 )
Edad (años)
Media 46 años
<45 78 (41 %)
45-65 113 (59%)
>65 0 (0%)
Tamaño (cm)
<1 8 (4%)
1-2 90 (47%)
<2-5 93 (49%)
Grado diferenciación tumor
Pobre 81 (42%)
Moderado 80 (42%)
Bueno 28 (15%)
Desconocido 2 (1 %)
Estado RE
Positivo 128 (67%}
Negativo 63 (33%)
Metástasis distal tras 5 años
Si 34 (18%)
No 149 (78%)
Censurado 8 (4%)
Los datos son números de pacientes, o porcentajes de pacientes. TM=tamoxifeno
Un análisis de regresión de riesgos proporcionales de Cox se realizó usando metástasis distal (MD) a 5 años para las 707 sondas de Ul 33 A (y presentes también en U133Plus 2.0) correspondientes a los 427 genes humanos mapeados del análisis de expresión diferencial de los tumores de ratón, usando la utilidad de supervivencia implementada en la página web GEPAS (www. gepas.org) (Vaquerizas JM. et al. Nucleic Acids Res 2005;33 (Web Server issue):W616-620).
Brevemente, el análisis de Cox asigna un coeficiente de regresión de Cox para cada sonda, de tal forma que una sonda cuya expresión esté directamente correlacionada con aparición de MD es > 0, y si su expresión está relacionada inversamente con MD es < 0.
Además, se aplica el test de WaId (WaId A. Transactions of the American Mathematical
Society 1943;54:426-482; Silvey SD. Annals of Mathematical Statistics 1959; 30:389-
407) para analizar la hipótesis nula de que el coeficiente sea 0 (no relacionado con MD), asignándose a cada sonda un valor de estadístico de WaId, su correspondiente valor P, y valor P corregido por el método FDR. Las sondas con valores del estadístico de WaId
>3 ó <-3 fueron elegidas para análisis posteriores. Estos análisis tienen como objetivo comprobar la capacidad de predicción de MD a 5 y 10 años de cáncer de mama humano.
2.2 Desarrollo de un modelo matemático de predicción de metástasis.
Se obtuvo una fórmula para calcular un "valor de riesgo" (VR) de cada tumor basado en los genes descritos:
40
Valor de riesgo (VR) = ∑ SfXi
donde si es el estadístico de WaId del análisis de regresión de tipo Cox; y xi es el valor de expresión en Iog2 de la sonda de Affymetrix (media=l; desviación estándar=l)
< W
Tabla 6 P_ o* ^- ldentificador Símbolo P
Estadístico Coeficiente sonda Valor P Gen Título Gen H WaId Cox P Affymetrix α> σ;
211851_x_at 3,96 0,58 7,63E-05 BRCA1 breasí cáncer 1 , early onset P* cyciin-dependent kinase ¡nhibitor 3 (CDK2-asεoc¡ated dual specificity ON
209714_s_at 3,93 0,68 8,61E-05 CDKN3 phosphatase} O
218883_s_at 3,90 0,80 9.59E-05 MLF1 IP MLF 1 interacting proíein B'
202705 at 3,86 0,62 1 .14E-04 CCN B2 cycíin B2 & o'
208968_s_at 3,78 0,57 1 .58E-04 CÍAPÍN1 cytokine iπduced apoptosis ¡πhíbítor 1 P
204531_s_at 3,76 0,55 1 .71 E-04 BRCA1 breasí cáncer 1 , early onset 5*
219004 s at 3,70 0,60 2.12E-04 C21 orf45 chromosorne 21 open reading frame 45
220223_at 3.68 0,53 2.33E-04 ATAD5 ATPase famsly, AAA domatn containing 5 O
211969 at 3,66 0,74 2,57E-04 HSP90AA1 heat shock protetn 9OkDa alpha (cytosolic). class A member 1 O
222077 s at 3,63 0.64 2.85E-04 RACGAP 1 Rae GTPase activatiπg protein 1 ce α-
203213_at 3,56 0.64 3J4E-04 CDC2 ceii división eyele 2, G1 to S and G2 to M o
204033 at 3,52 0.48 4.36E-04 TRIP13 thyroid hormone receptor interactor 13 P*
218498_s_at 3,51 0;36 4.45E-04 ERO1L ERO1 -!ike (S. cerevisiae) tí! K)
220651 s at 3,48 0,42 4,95E-04 MCM10 minichromosome rnaintenance complex component 10
P
201292 at 3,48 0,62 5,05E-04 TOP2A topoisomerase (DNA) Il alpha 17OkDa
202954_at 3,47 0,54 5.26E-04 UBE2C ubiquitin-conjugating enzyme E2C o
208424 s at 3,42 0,47 6.21 E-04 CIAPIN1 cytokine induced apoptosis ¡nhibitor 1 P*
209709 s at 3,36 0,49 7.73E-D4 HMMR hyaluronan-mediated motiltty receptor (RHAMM)
201291_s_at 3,35 0,60 7.95E-04 TOP2A topoisomerase (DNA) l¡ alpha 17OkDa < B'
218039 at 3,35 0,67 8,22E-04 NUSAP1 nucleolar and spindie associated protein 1 O
202240_at 3.29 0.37 1 ,00E-03 PLK1 polo-like kinase 1 (Drosophila) J S-S-
221436 s at 3,28 0,37 1 ,04E-03 CDCA3 ceíl división eyeíe associated 3
203755 at 3,25 0.53 1 ,14E-03 BUB1 B BUB1 budding υntnhibited by benzimidazoíes 1 homαiog beta (yeast) o
203362_s_at 3,24 0,50 1 ,19E-03 MAD2L1 MAD2 mitotic arresí defictení-like 1 (yeast)
214328 s at 3,24 0,56 1.19E-03 HSP90AA1 heat shock protein 9OkDa alpha (cytosolic), class A member 1 O
O
21021 1_s_at 3,24 0,76 1.21 E-03 HSP90AA1 heat shock protein 9OkDa alpha (cytosolic), class A member 1 o
207165 at 3,21 0,49 1 .31 E-03 HMMR hyaluronan-mediated motiltty receptor (RHAMM)
219148 at 3,18 0,48 1 .48E-03 PBK PDZ binding kinase O
209464_at 3,16 0,44 1.58E-03 AURKB aurora kinase B
219000_s_at 3.14 0,49 1.68E-03 DCC 1 detective in sister chromatíd cohesión homolog 1 (S. cerevisiae} S' o
Dicha fórmula asigna un valor numérico a cada muestra (VR), basado en la suma de los productos de los valores de expresión de cada gen y los valores del estadístico de WaId de cada gen según el modelo de Cox explicado anteriormente (ver Tabla 7).
Los valores VR de los 191 tumores del dataset Desmedí fueron obtenidos según la fórmula del VR descrita más arriba. Se computaron Curvas Operador Receptor (COR) para los VR usando como variable dependiente la variable de MD a 5 años, censurada. Como se muestra en la Figura 1, los VR basados en la firma de los genes identificados en la Tabla 1 y Tabla 2 permite predecir con un 100% de éxito la ausencia de eventos metastásicos a 5 años (100% sensibilidad) en un grupo de tumores (llamados a partir de ahora grupo de buen pronóstico), y con un 40,1% de éxito la presencia de metástasis (40,1% especificidad) en el resto de tumores (grupo que se llamará de mal pronóstico).
Un análisis detallado de las características de los tumores Desmedí mostró que los que eran RE- de grado 3 (46 muesíras) no eran predichos correcíameníe (daíos no mosírados). Curvas COR del resío de íumores mosíraron que la firma de genes de la invención, maníenía valores de sensibilidad del 100%, pero que mejoraba susíancialmeníe la especificidad hasía un 51,6% (Figura 1, Tabla 7).
Tabla 7: Parámetros del análisis curvas COR
ABC= Área bajo Ia curva COR
Los resulíados obíenidos demuesíran que la firma genética de la invención, podría ser utilizada como un predicíor óptimo de MD a 5 años en cáncer de mama humano.
Así, a partir de la fórmula descrita anteriormente, los inventores han conseguido determinar si un paciente pertenecería al grupo de buen pronóstico o al grupo de mal pronóstico. Este método está basado en la fórmula para el cálculo del valor de riesgo (VR), y en la curva COR de MD a 5 años del grupo de tumores Desmedí de 142 muestras (Figura 1, panel C). Según las curvas COR, el predictor tendría 100% de sensibilidad y un máximo de especificidad (VR= - 39,2).
40
Si ∑ S1-X1 + 39.2 > 0 Pronóstico malo i=l
40
Si E s1-X1+ 39.2 < 0 Pronóstico bueno i=l
EJEMPLO 3
Validación del predictor en un grupo de tumores externo
El grupo de tumores de Loi o dataset Loi se usó como un grupo de tumores externo para validación, ó grupo de testado (testing dataset). El dataset Loi contiene: i) tumores de pacientes tratados o no con tamoxifeno; ii) tumores de pacientes que tenían metástasis en nodulos linfáticos (N+) o no (N-) en el momento de la operación; y iii) tumores RE- o RE+. El grupo de tumores Loi contiene una colección más variada de muestras de cáncer de mama que el dataset Desmedí (sólo N-, y no traíados con íamoxifeno). El dataset Loi originalmeníe posee 327 muesíras analizadas usando íanío el GeneChip de Affymeírix Ul 33 A como el GeneChip U133B. También coníiene 87 íumores analizados con el chip U133Plus 2.0. Ya que la firma genómica de predicción coníiene sondas (Tabla 6) que esíán deníro del GeneChip Ul 33 A y no del U133B, se descariaron los análisis realizados con el GeneChip U133B. Sin embargo, las 87 muesíras analizadas con el chip U133Plus 2.0 serán procesadas, ya que ésíe chip contienen íodas las sondas de Ul 33 A. Tras normalización con RMA, un número de 400 íumores pasaron los criíerios de calidad explicados aníeriormeníe (gráficas NUSE y RLE).
Se extrajeron los valores de expresión en escala log2 para los genes de la firma de todos los tumores. Se calculó el valor de riesgo (VR) según la fórmula descrita anteriormente, tomándose los valores de expresión de los nuevos tumores y los valores de estadístico de WaId computados en el análisis de Cox del dataset Desmedí (Tabla 6). Los tumores para los cuales no existen datos de tratamiento hormonal, grado tumoral, presencia o ausencia de RE, presencia o no de metástasis distal con seguimiento temporal, o estado de nodulos linfáticos, fueron descartados (94 muestras). De los restantes 306 tumores se eliminaron aquellos para los que el predictor genómico no funcionó en el dataset Desmedí, es decir, tumores RE- de grado 3 (19 muesíras). En los 287 íumores resíaníes, se analizó la precisión del predicíor genómico por grupos de pacieníes de caracíerísíicas similares.
3.1. La firma genética de la invención es un predictor genómico de metástasis distal en pacientes de cáncer de mama con nodulos linfáticos sanos y que no recibieron terapia hormonal.
En primer lugar, se analizaron los íumores con similares caracíerísíicas a los de los íumores del esíudio de Desmedí, esío es, pacieníes no íraíados con íamoxifeno, nodulos N-, y diámeíro del íumor <5 cm, pero independieníemeníe de la edad del pacieníe (86 muesíras, ver Tabla 8 con caracíerísíicas clínicas).
Tabla 8: Características clínicas y patológicas de los pacientes del dataset Loi
Dataset Loi
N- N+
No TM (n=86) TM (n=108)
Edad (años)
Media 52 años 64 años
<45 19 (22%) 1 (1 %)
45-65 65 (76%) 62 (57%)
>65 2 (2%) 45 (42%)
Tamaño (cm)
<1 3 (4%) 1 (1 %)
1-2 51 (59%) 35 (32%)
<2-5 32 (37%) 72 (67%)
Grado diferenciación tumor
Pobre 12 (14%) 20 (19%)
Moderado 47 (55%) 65 (60%)
Bueno 27 (31 %) 23 (21 %)
Desconocido
Estado RE
Positivo 69 (80%) 107 (99%)
Negativo 17 (20%) 1 (1 %)
Metástasis distal tras 5 años
Si 15 (18%) 23 (21 %)
No 57 (66%) 71 (66%)
Censurado 14 (16%) 14 (13%)
Los datos son números de pacientes, o porcentajes de pacientes. TM=tamoxifeno
Basado en el cómputo del riesgo genómico según las reglas de las fórmulas para buen o mal pronóstico descritas anteriormente, la firma de genes de la invención es un buen predictor de MD a 5 y a 10 años. Para ello se calculó el riesgo relativo (RR) entre los pacientes con perfil de buen pronóstico frente a los de mal pronóstico, mediante análisis de riesgos proporcionales de Cox (Tabla 9).
Tabla 9: Análisis riesgos proporcionales de Cox univariante y multivariante en dataset Loi
Dataset Loi Dataset Loi
(86 tumores) 1 3 (108 tumores) 2 :
RR
RR 4 IC 95% 4 P 4 4 IC 95% 4 P 4
1 ,2 a 2,1 E-
MD Análisis univariable 19,9 2,6 a 154,4 4,0E-03 4,2 14,6 02 a 5 1 ,1 a 4,2E- años Análisis multivariable 14,9 1 ,8 a 123,7 1.2E-02 3,9 14,7 02
1 ,6 a 4,5E-
MD Análisis univariable 8,2 2,3 a 28.7 1.0E-03 4,7 13,5 03 a 10 1 ,3E- años Análisis multivariable 7,3 1 ,9 a 28,5 4,0E-03 4,2 1 ,3 a 13 02
1 Sólo tumores diámetro < 5 cm, sin tratamiento adjuvante, N-, RE+ (todos los grados) y RE- (grados 1 y 2)
2 Sólo tumores diámetro < 5 cm, con tratamiento adjuvante, N+
3 Estratificado por hospital
4 RR=riesgo relativo; IC=intervalo de confianza; P=probabilidad
Según el análisis univariante, el RR de desarrollar MD entre ambos grupos de pacientes es de 19,9 a 5 años (intervalo confianza IC 95% 2,6-154,4, P=0,004) o de 8,2 a 10 años
(IC 95% 2,3-28,7, P=0,001). Si el análisis de riesgo se hace multivariante, es decir, incluyendo en el modelo los datos clínicos (edad del paciente, tamaño del tumor, gradación del tumor, estado del RE) se obtiene un RR de 14,9 a 5 años (IC 95% 1,8-
123,7, P=0.012) y de 7,3 a 10 años (IC 95% 1,9-28,5, P=0,004). Es importante destacar que éstos RR son significativos estadísticamente en análisis multivariante, lo que demuestra que la firma de los genes identificados en las Tablas 1 y 2 es un predictor genómico independiente de otros parámetros clínicos (Tabla 9 y Tabla 10).
Tabla 10: Análisis multivariado de riesgos proporcionales, MD a 5 años en dataset Loi
N-, No Tamoxifeno (n=86) N+, Tamoxifeno (n=i 08)
RIESGO VALOR RIESGO VALOR
VARIABLE IC* 95% IC* 95% RELATIVO P RELATIVO P
Firma mal pronóstico 1 ,8 a 1 ,1 a
14 -,9 0,012 (vs buen pronóstico) 123,7 3; ,9 0; ,042 14,6
0,5 a
Edad (<45, 45 a 65, >65) 1 ,3 0.4 a 3.6 0,678 4. ,7 173 44,4 0: ,
Grado diferenciación tumor 1 ,0 0.4 a 2.6 0,962 1 ,3 0: ,6 a 3,1 0: ,499 Tamaño tumor (por cm) 2. ,0 1 ,0 a 4,0 0,063 1 ,0 0; ,5 a 2,0 0; ,918 Estado ER 0. ,9 0,3 a 3,0 0,881 1. ,2 0. ,7 a 1 ,9 0. ,548
* IC denota intervalo de confianza
Además, se calculó la probabilidad de supervivencia en ambos grupos de pacientes (Tabla 11). Así, el grupo de buen pronóstico tiene una probabilidad de supervivencia a 5 años del 96,1% (± 2,2), y del 92,3% (± 4,3) a 10 años. El grupo de mal pronóstico tiene una probabilidad del 70,1% (± 6,2) a 5 años, y del 49,2% (± 8.7) a 10 años. Las diferencias de supervivencia entre ambos grupos son grandes, del 26% a 5 años y del 43% a 10 años.
Tabla 11 : Probabilidades de supervivencia de subgrupos de pronóstico en dataset Loi
Probabilidad Probabilidad
Dataset Grupo genómico MD a 5 años MD a 10 años
Dataset Loi Buen pronóstico 96, 1 ± 2,2 92,3 ± 4,3 (86 tumores)1 Mal pronóstico 70, 1 ± 6,2 49,2 ± 8,7
Dataset Loi Buen pronóstico 94,2 ± 2,8 88,8 ± 5,3 (108 tumores)2 Mal pronóstico 76,3 ± 4 58,2 ± 6, 1
1 Sólo tumores diámetro < 5 cm, sin tratamiento adjuvante, N-, RE+ (todos los grados) y RE- (grados 1 y 2)
¿ Sólo tumores diámetro < 5 cm, con tratamiento adjuvante,
N+
3.2. La firma genética de la invención es un predictor genómico de metástasis distal en pacientes de cáncer de mama con metástasis en nodulos linfáticos y que recibieron terapia hormonal con tamoxifeno.
A continuación, se comprobó si la firma predictora de la invención era válida para pacientes que en el momento de la extracción del tumor tenían metástasis en nodulos linfáticos (N+), y recibieron terapia hormonal, con diámetro del tumor <5cm, pero
independientemente de la edad del paciente (108 muestras, ver Tabla 8 con características clínicas). De manera similar a la descrita en el apartado 3.1, se dividieron los pacientes en dos grupos de riesgo: mal pronóstico y buen pronóstico. Se hizo análisis de Cox univariante y multivariante, para comprobar los riesgos relativos de desarrollar MD a 5 o a 10 años entre ambos grupos (Tablas 9 y 10). Los resultados muestran que el RR es de 4,2 a 5 años (IC 95% 1,2-14,6, P=0,021), o de 4,7 a 10 años (IC 95% 1,6-13,5, P=O, 004) en análisis univariante. Cuando se incluyeron parámetros clínicos en el modelo de Cox (edad del paciente, tamaño del tumor, gradación del tumor), el predictor genómico demostró ser independiente de ellos, manteniendo el RR entre los dos grupos de prognóstico, siendo 3,9 a 5 años (IC 95% 1,1-14.7, P=O, 042), y 4,2 a 10 años (IC 95% 1,3-13, P=0,013) (Tablas 9 y 10).
También se calculó la probabilidad de supervivencia en ambos grupos de pacientes (Tabla 11). Así, el grupo de buen pronóstico tiene una probabilidad de supervivencia a 5 años del 94,2% (± 2,8) y del 88,8% (± 5,3) a 10 años. El grupo de mal pronóstico tiene una probabilidad del 76,3% (± 4) a 5 años, y del 58,2% (± 6.1) a 10 años. Las diferencias de supervivencia entre ambos grupos son del 17,9% a 5 años y de 30,6% a 10 años, también significativas.
Finalmente se analizó la capacidad de predicción de la firma genómica en el subgrupo de pacientes dentro del estudio de Loi que, no teniendo metástasis local en el momento de la extracción del tumor, fueron tratados con terapia hormonal, con tumores de diámetro <5cm, independientemente de la edad del paciente (89 muestras, todos RE+). Los resultados mostraron que los dos grupos definidos por el riesgo genómico, a pesar de que tenían RR en análisis univariante en torno a 2,5 a 5 años o 1,9 a 10 años, las diferencias no eran significativas estadísticamente (datos no mostrados).
Globalmente, los resultados muestran que la firma genética de la invención es un buen predictor de riesgo de MD a 5 y 10 años, en tumores menores de 5 cm, tumores RE+, tumores RE- (grado 1 y 2), en pacientes N- sin tratamiento hormonal, y en pacientes N+ tratados con tamoxifeno. Además, en estos pacientes, el predictor es independiente de la edad del paciente, estatus de RE, gradación del tumor, y tamaño del tumor.
EJEMPLO 4 Comparación de la firma genética de la invención con predictores clínicos
Mediante curvas de Kaplan-Meier, se compararon las supervivencias libre de MD de los grupos de pacientes de buen o mal pronóstico (Figura 2, 86 pacientes N- y no tratados con tamoxifeno; Figura 3, 108 pacientes N+ y tratados con tamoxifeno), según los criterios basados en la firma genética de la invención (Fig 2A y 3A), o según los criterios de predicción clínica consenso de St. Gallen (Goldhirsch A, et al. J Clin Oncol
2001;19(18):3817-3827) (Fig 2B y 3B), o del NIH (National Institutes of Health, USA) (Eifel P, et al. J Nati Cáncer Inst 2001;93(13):979-989) (Fig 2D y 3D) (ver Tabla 12).
Tabla 12: Criterios clínicos para recibir quimioterapia adyuvante
St. Gallen tumor > 2 cm RE- cualquiera de estos criterios
Grado 2 ó 3 paciente < 35 años
NIH tumor > 1 cm
Los criterios de St. Gallen y del NIH clasifican los pacientes como de alto riesgo o bajo riesgo en base a varias características histológicas y clínicas. Esta comparación muestra que la firma pronostica de la invención asigna más pacientes al grupo de bajo riesgo (o buen pronóstico) que hacen los métodos tradicionales (56%, comparado con 21% según criterios de St. Gallen y 13% según criterios del NIH para pacientes no tratados con tamoxifeno y N-; 32%, comparado con 10% según criterios de St. Gallen y 2% según criterios del NIH para pacientes tratados con tamoxifeno y N+). Los pacientes de mal pronóstico según la firma genómica tienden a tener mayor proporción de MD que los pacientes de mal pronóstico según los criterios clínicos de St Gallen y NIH. Este resultado indica que ambos grupos de criterios clínicos utilizados actualmente, clasifican erróneamente un número clínicamente significativo de pacientes en el grupo de mal pronóstico. Además, el grupo de mal pronóstico definido según criterios de St. Gallen incluye muchos pacientes que tuvieron una firma genómica de buen pronóstico y un buen resultado (Figura 2C y Figura 3C). Subgrupos similares fueron identificados dentro del grupo de alto riesgo identificado según criterios del NIH (Figura 2E y Figura 3E).
Dado que tanto los subgrupos de St. Gallen como de NIH contienen pacientes mal clasificados dentro del grupo de mal pronóstico entre los pacientes no tratados con tamoxifeno y N- (subgrupo de 86 pacientes), habría pacientes que serían sobretratados en la práctica clínica actual. Por otro lado, ya que todos los pacientes N+ recibieron terapia hormonal (subgrupo de 108 pacientes), no es posible determinar cómo de precisa sería la predicción genómica en ausencia de tratamiento hormonal. Sin embargo, los resultados muestran que la firma genética de la invención es un buen predictor de respuesta a tratamiento con tamoxifeno en pacientes con metástasis en nodulos linfáticos.