MXPA06009545A - Pronosticos del cancer de mama. - Google Patents

Pronosticos del cancer de mama.

Info

Publication number
MXPA06009545A
MXPA06009545A MXPA06009545A MXPA06009545A MXPA06009545A MX PA06009545 A MXPA06009545 A MX PA06009545A MX PA06009545 A MXPA06009545 A MX PA06009545A MX PA06009545 A MXPA06009545 A MX PA06009545A MX PA06009545 A MXPA06009545 A MX PA06009545A
Authority
MX
Mexico
Prior art keywords
further characterized
seq
nos
gene
expression
Prior art date
Application number
MXPA06009545A
Other languages
English (en)
Inventor
Yixin Wang
Original Assignee
Johnson & Johnson
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Priority claimed from US10/783,271 external-priority patent/US20050186577A1/en
Application filed by Johnson & Johnson filed Critical Johnson & Johnson
Publication of MXPA06009545A publication Critical patent/MXPA06009545A/es

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6876Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
    • C12Q1/6883Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material
    • C12Q1/6886Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material for cancer
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/106Pharmacogenomics, i.e. genetic variability in individual responses to drugs and drug metabolism
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/112Disease subtyping, staging or classification
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/118Prognosis of disease development
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/154Methylation markers
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/158Expression markers

Landscapes

  • Chemical & Material Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Organic Chemistry (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Engineering & Computer Science (AREA)
  • Immunology (AREA)
  • Pathology (AREA)
  • Analytical Chemistry (AREA)
  • Zoology (AREA)
  • Genetics & Genomics (AREA)
  • Wood Science & Technology (AREA)
  • Physics & Mathematics (AREA)
  • Biotechnology (AREA)
  • Microbiology (AREA)
  • Molecular Biology (AREA)
  • Hospice & Palliative Care (AREA)
  • Biophysics (AREA)
  • Oncology (AREA)
  • Biochemistry (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
  • Apparatus Associated With Microorganisms And Enzymes (AREA)

Abstract

Un metodo para proporcionar un pronostico de cancer de mama se lleva a cabo al analizar la expresion de un grupo de genes; se incluyen perfiles de expresion de gen en una variedad de medios como microdisposiciones, asi como equipos que los contienen.

Description

PRONÓSTICOS DEL CÁNCER DE MAMA CAMPO DE LA INVENCIÓN Esta invención se refiere a la prognosis del paciente con cáncer de mama basándose en los perfiles de expresión génica de muestras biológicas del paciente.
TÉCNICA ANTERIOR RELACIONADA Aproximadamente 60-70% de pacientes con cáncer de mama nodulo linfático negativos (LNN) se curan mediante el tratamiento local o regional solo. Lancet (1998a); y Lancet (1998b). Se han desarrollado las guías para ayudar a los médicos en la selección de pacientes que deben recibir terapia adyuvante. Las recomendaciones más ampliamente utilizadas son los criterios de St. Gallen (Goldhirsch et al. (2003)) los criterios consenso de the National Institutes of Health (NIH). Eifel et al. (2001). Estas guías indican que el 85%-90% de los pacientes con LNN son candidatos para terapia sistémica adjuvante. Existe una necesidad para identificar específicamente el riesgo de recurrencia de la enfermedad en un paciente para asegurar que ella reciba una terapia adecuada. Actualmente, existen pocas herramientas diagnósticas disponibles para identificar a los pacientes en riesgo. Los patrones de expresión del gen han sido utilizados para clasificar a los tumores de mama dentro de diferentes subtipos clínicamente relevantes. Perou et al. (2000); S0rlie et al. (2001 ); S0rlie et al. (2003); Gruvberger et al. (2001 ); van't Veer et al. (2002); van de Vijver et a!. (2002); Ahr et al. (2002); Huang et al. (2003); Sotiriou et al. (2003); Woelfle et al. (2003); Ma et al. (2003); Ramaswamy et al. (2003); Chang et al. (2003); Sotiriou et al. (2003); y Hedenfalk et al. (2001 ). Actualmente en los pacientes con LNN, la decisión de aplicar terapia adyuvante después de la remoción quirúrgica del tumor primario, y cuál tipo (endocrina- y/o quimioterapia), depende en gran parte de la edad del paciente, estado menopausal, tamaño tumoral, grado del tumor, y estado del receptor de la hormona esteroide. Estos factores se consideran en las guías tales como en los criterios de St. Gallen y en los criterios consenso de the National Institutes of Health (NIH). Basándose en estos criterios más del 85%-90% de los pacientes con LNN podrían ser candidatos para recibir la terapia sistémica adyuvante. Claramente existe una necesidad para identificar mejores factores pronósticos para guiar la selección de las elecciones para tratamiento.
BREVE DESCRIPCIÓN DE LA INVENCIÓN Reconociendo la complejidad del progreso de la enfermedad, los inventores reportan en la presente invención una evaluación que comprende un amplio genoma de la expresión del gen para identificar marcadores pronósticos ampliamente aplicables. Ntzani et al. (2003); y Wang et al. (2004). La presente invención comprende un método para evaluar el estado del cáncer de mama mediante la obtención de una muestra biológica a partir de un paciente con cáncer de mama; y la medición de los niveles de expresión en la muestra de genes seleccionados a partir de aquellos que codifican ARNm: que corresponden a SEQ ID NOs: 1-111 ; o el reconocimiento por las series de sondas seleccionadas a partir del grupo que consiste de psids que corresponden a SEQ ID NOs: 1-111 como se ilustra en el cuadro 10 en donde los niveles de expresión del gen por arriba o por debajo de los niveles límite pre-determinados son indicativos del estado de cáncer de mama. La presente invención comprende un método de clasificación en etapas del cáncer de mama mediante la obtención de una muestra biológica a partir de un paciente con cáncer de mama; y la medición de los niveles de expresión en la muestra de genes seleccionados a partir de aquellos que codifican ARNm: que corresponden a SEQ ID NOs: 1-111 ; o el reconocimiento por las series de sondas seleccionadas a partir del grupo que consiste de psids que corresponden a SEQ ID NOs: 1-111 como se ilustra en el cuadro 10 en donde los niveles de expresión del gen por arriba o por debajo de los niveles límite pre-determinados son indicativos de la etapa del cáncer de mama.
La presente invención comprende un método para la determinación del protocolo de tratamiento para el paciente con cáncer de mama mediante la obtención de una muestra biológica a partir de un paciente con cáncer de mama; y la medición de los niveles de expresión en la muestra de genes seleccionados a partir de aquellos que codifican ARNm: que corresponden a SEQ ID NOs: 1-111 ; o reconocidos por las series de sondas seleccionadas a partir de psids que corresponden a SEQ ID NOs: 1-11 1 como se ilustra en el cuadro 10 en donde los niveles de expresión del gen por arriba o por debajo de los niveles límite pre-determinados son indicativos adecuados del riesgo de recurrencia para permitir que un médico determine el grado y tipo de terapia recomendados para prevenir la recurrencia. La presente invención comprende un método para el tratamiento de un paciente con cáncer de mama mediante la obtención de una muestra biológica a partir de un paciente con cáncer de mama; y la medición de los niveles de expresión en la muestra de genes seleccionados a partir de aquellos que codifican ARNm: que corresponden a SEQ ID NOs: 1-111 ; o reconocidos por las series de sondas seleccionadas a partir de psids que corresponden a SEQ ID NOs: 1-111 como se ilustra en el cuadro 10 en donde los niveles de expresión del gen por arriba o por debajo de los niveles límite pre-determinados son indicativos de un alto riesgo de recurrencia y; del tratamiento del paciente con terapia adyuvante si éstos son pacientes con alto riesgo.
La presente invención comprende un método de validación cruzada de un perfil de expresión del gen pronóstico para pacientes con cáncer de mama mediante la obtención de los datos de expresión del gen a partir de un número estadísticamente significativo de muestras biológicas del paciente; el ordenamiento de la muestra al azar; desechando los datos de aproximadamente 10%-50% de las muestras; haciendo el cómputo, para las muestras remanentes, para el factor de interés en todas variables y la selección de las variables que alcanzan un límite del valor p (p); selección de las variables que se ajustan a un modelo de predicción utilizando una búsqueda hacia adelante y evaluación del error por entrenamiento hasta que encuentra una relación de error predeterminado; evaluando el modelo de predicción en remanente 10-50% de las muestras; repitiendo los pasos c)-g). con una nueva serie de muestras removidas; y continuando los pasos c) -g) hasta 100% de las muestras han sido evaluadas y se ha registrado su clasificación de desempeño. La presente invención comprende un método para validar independientemente un perfil de expresión del gen pronóstico para pacientes con cáncer de mama mediante la obtención de los datos de expresión del gen a partir de un número estadísticamente significativo de muestras biológicas del paciente; la normalización de las variabilidades de la fuente en los datos para expresión del gen; el cómputo para el factor de interés en todas las variables que se seleccionan previamente; y evaluado el modelo de predicción en la muestra y registrando la clasificación del desempeño.
La presente invención comprende un método para la generación de una Clasificación de Recidiva al Azar para permitir la prognosis de los pacientes con cáncer de mama mediante la obtención de los datos de expresión del gen a partir de un número estadísticamente significativo de muestras biológicas del paciente; aplicando el análisis de regresión univariable de Cox a los datos para obtener los genes seleccionados; aplicar los niveles de expresión evaluados a los genes seleccionados con los coeficientes estándares de Cox para obtener un modelo de predicción que se puede aplicar como una Clasificación de Recidiva al Azar. La presente invención comprende un método para la generación de un reporte pronóstico del paciente con cáncer de mama mediante la obtención de una muestra biológica a partir del paciente; midiendo la expresión del gen de la muestra; aplicando una Clasificación de Recidiva al Azar a los resultados del paso b.; y utilizando los resultados obtenidos en el paso c. para generar el reporte y los reportes del paciente así generados. La presente invención comprende una composición de al menos una serie de sondas seleccionadas a partir de: SEQ ID NOs: 1-111 ; o psids que corresponden a SEQ ID NOs: 1-111 como se ¡lustra en el cuadro 10. La presente invención comprende un equipo para la realización de un ensayo para determinar la prognosis del cáncer de mama en una muestra biológica que contiene: materiales para la detección de secuencias aisladas de ácido nucleico, sus complementos, o porciones de los mismos de una combinación de genes seleccionados a partir de aquellos que codifican ARNm: que corresponden a SEQ ID NOs: 1-111 ; o reconocidos por las series de sondas seleccionadas a partir de psids que corresponden a SEQ ID NOs: 1-111 como se ilustra en el cuadro 10. La presente invención comprende artículos para la evaluación del estado del cáncer de mama que contienen: materiales para la detección de secuencias aisladas de ácido nucleico, sus complementos, o porciones de los mismos de una combinación de genes seleccionados a partir de aquellos que codifican ARNm: que corresponden a SEQ ID NOs: 1-111 ; o reconocidos por las series de sondas seleccionadas a partir de psids que corresponden a SEQ ID NOs: 1-111 como se ilustra en el cuadro 10. La presente invención comprende un portafolio diagnóstico/pronóstico que contiene secuencias aisladas de ácido nucleico, sus complementos, o porciones de los mismos de una combinación de genes seleccionados a partir de aquellos que codifican ARNm: que corresponden a SEQ ID NOs: 1-111 ; o reconocidos por las series de sondas seleccionadas a partir de psids que corresponden a SEQ ID NOs: 1-111 como se ilustra en el cuadro 10 en donde la combinación es adecuada para caracterizar el estado del cáncer de mama o el riesgo de recidiva en una muestra biológica.
BREVE DESCRIPCIÓN DE LOS DIBUJOS Las figuras 1A y 1 B ilustra el perfil de selección de las muestras para análisis y análisis no supervisado del agrupamiento de los datos para la expresión del gen para 286 pacientes con cáncer de mama nodulo linfático negativos (LNN). (A). Diagrama de flujo para la selección de las muestras de pacientes para análisis. El estado ER se utilizó para identificar los subgrupos de pacientes. Posteriormente cada subgrupo se analizó separadamente con el objeto de seleccionar los marcadores. Los pacientes en un subgrupo se asignaron a una serie para entrenamiento o una serie para prueba. Los marcadores seleccionados a partir de cada subgrupo se combinaron para formar una marca particular para pronosticar la recurrencia tumoral para todos los pacientes en la serie de evaluación como un todo. (B). Análisis no supervisado del agrupamiento de los datos para expresión del gen de 286 pacientes con cáncer de mama LNN. El panel izquierdo es una vista de los 17,819 genes informativos. El color rojo indica una alta expresión relativa; el color verde indica una baja expresión relativa. Cada columna es una muestra y cada hilera es un gen. El panel derecho muestra vistas agrandadas de dos agrupamientos de genes dominantes identificados a partir de la vista izquierda que tuvieron una drástica expresión diferencial entre los dos subgrupos de pacientes. El agrupamiento del gen superior tiene un grupo de 282 genes sub-regulados en el subgrupo positivo a ER. El agrupamiento del gen inferior está representado por un grupo de 339 genes supra-regulados en el subgrupo positivo a ER. La barra de marca en la parte inferior de cada dendrograma indica el estado ER del paciente medido por ensayos de rutina. Figuras 2A - 2A' y 2B - 2B'. Establecimiento del perfil de 76 genes y análisis de Kaplan-Meier para libre de metástasis distantes (DMFS) y la supervivencia general (OS). A. selección de los genes para la marca de pronóstico. Los marcadores génicos para los grupos ER-positivos y ER-negativos se seleccionaron a partir de dos series para entrenamiento utilizando análisis ROC. Sesenta genes fueron a partir del grupo ER-positivo y 16 genes fueron a partir del grupo ER-negativo (izquierdo), y la curva ROC de la marca de 76 genes se derivó a partir del análisis de los 171 pacientes en la serie para evaluación (derecha). B. Análisis DMFS (izquierda) y análisis OS (derecha) en la serie de validación de los 171 pacientes con LNN. El riesgo de ataque para cada paciente se evaluó basándose en la marca de 76 genes y el umbral se determinó mediante la serie para entrenamiento. La prueba el intervalo logarítmico se utilizó para evaluar las diferencias. Figuras 3A - 3A\ 3B - 3B' y 3C - 3C Análisis de DMFS y OS en los subgrupos de los pacientes con LNN. DMFS (izquierda) y OS (derecha) en 84 pacientes premenopaúsicos (A), 87 pacientes postmenopaúsicos (B), y 79 pacientes con tumores de un tamaño que tiene un intervalo de 10-20 mm (C). Los resultados son a partir de los pacientes independientes en la serie para validación. Se evaluó el riesgo de recurrencia para cada paciente basándose en la marca de 76 genes y el umbral se determinó mediante la serie para entrenamiento. La prueba del intervalo logarítmico se utilizó para evaluar las diferencias. La figura 4 ¡lustra el agrupamiento jerárquico basándose en 5121 genes.
La figura 5 es una gráfica de barras que ¡lustra los niveles de expresión de los 21 genes control (cuadro 7). La figura 6 ¡lustra un circuito de producción del análisis de datos. La figura 7 ¡lustra un análisis PCA con series de genes filtrados. La figura 8 es una gráfica en rebanadas que ilustra el estado ER utilizado para asignar los subgrupos del paciente. Los genes expresados de manera diferencial entre sub-agrupamientos ER-positivos y ER-negativos en ambas muestras de tejido LCM y masa de tejido se definieron mediante la prueba T de Student. La figura 9 es una serie de gráficas de barras que ilustra los resultados de la ruta de análisis mediante Ontología del Gen para los genes exclusivamente asociados con ER en las muestras de LCM, exclusivamente en la masa de tejido, y para aquellos que son comunes a ambos tejidos LCM y masa de tejido. La figura 10 muestra los resultados de la validación independiente. El diagrama de flujo en la figura 10 muestra que los 132 pacientes se recolectaron en cuatro fuentes diferentes. Una clasificación de recidiva al azar se calculó para cada paciente basándose en los niveles de expresión de la marca de 76 genes. Los pacientes se clasificaron en grupos con un resultado bueno y malo. Las figuras 11A y 11 B ilustra A. Las características clínicas y patológicas de los pacientes y sus tumores para el estudio de validación y B. Una curva ROC de la marca de 76 genes en el estudio de validación.
Las figuras 12A y 12B ilustra los resultados de clasificación de los 132 pacientes en el estudio de validación. La curva de supervivencia Kaplan-Meier y la prueba de clasificación logarítmica en los grupos pronosticados para un resultado bueno y malo se muestran en la gráfica. Las figuras 13A y 13B ilustra los resultados de la ruta de análisis.
El diagrama de flujo en las figuras 13A y 13B muestra el método utilizado para la selección de muestras para análisis estadísticos. A. Los 286 pacientes se dividieron al azar en una serie para entrenamiento de 115 pacientes pacientes y una serie para evaluación. B. Los 286 pacientes se dividieron al azar en una serie para entrenamiento de 80% de los pacientes y una serie para evaluación de 20% de los pacientes. La serie para entrenamiento se utilizó para seleccionar marcadores del gen y para construir una marca de pronóstico. La serie para evaluación se utilizó para la validación. Ambos procedimientos se repitieron 10 veces. Las figuras 14A y 14B ilustra los resúmenes de los análisis de ontología GO. Cada barra representa una ruta significativamente sobre-representada en las series para entrenamiento de la marca de 76 genes (p < 0.05). La desviación estándar se calcula a partir de los resultados de las marcas alternativas. A. Resultados a partir de 10 marcas utilizando series para entrenamiento de 115 pacientes. B. Los resultados a partir de 10 marcas utilizando series para entrenamiento de 80% de los pacientes.
DESCRIPCIÓN DETALLADA DE LA INVENCIÓN La presente invención comprende un método para evaluar el estado del cáncer de mama mediante la obtención de una muestra biológica a partir de un paciente con cáncer de mama; y la medición de los niveles de expresión en la muestra de genes seleccionados a partir de aquellos que codifican ARNm: que corresponden a SEQ ID NOs: 1-111 ; o el reconocimiento por la serie de sondas seleccionadas a partir del grupo que consiste de psids que corresponden a SEQ ID NOs: 1-111 como se ilustra en el cuadro 10 en donde los niveles de expresión del gen por arriba o por debajo de los niveles límite pre-determinados son indicativos del estado de cáncer de mama. La presente invención comprende un método de clasificación en etapas del cáncer de mama mediante la obtención de una muestra biológica a partir de un paciente con cáncer de mama; y la medición de los niveles de expresión en la muestra de genes seleccionados a partir de aquellos que codifican ARNm: que corresponden a SEQ ID NOs: 1-111; o el reconocimiento por la serie de sondas seleccionadas a partir del grupo que consiste de psids que corresponden a SEQ ID NOs: 1-111 como se ilustra en el cuadro 10 en donde los niveles de expresión del gen por arriba o por debajo de los niveles límite pre-determinados son indicativos de la etapa del cáncer de mama. El método utiliza cualquier clasificación conocida en la técnica incluyendo el sistema TNM American Joint Committee on Cancer www.cancerstaging.org) y la comparación de las etapas que corresponden a pacientes con perfiles de expresión génica similares. La presente invención comprende un método para la determinación del protocolo de tratamiento para el paciente con cáncer de mama mediante la obtención de una muestra biológica a partir de un paciente con cáncer de mama; y la medición de los niveles de expresión en la muestra de genes seleccionados a partir de aquellos que codifican ARNm: que corresponden a SEQ ID NOs: 1-111 ; o reconocidos por las series de sondas seleccionadas a partir de psids que corresponden a SEQ ID NOs: 1-111 como se ¡lustra en el cuadro 10 en donde los niveles de expresión del gen por arriba o por debajo de los niveles límite pre-determinados son indicativos adecuados del riesgo de recurrencia para permitir que un médico determine el grado y tipo de terapia recomendados para prevenir la recurrencia. La presente invención comprende un método para el tratamiento de un paciente con cáncer de mama mediante la obtención de una muestra biológica a partir de un paciente con cáncer de mama; y la medición de los niveles de expresión en la muestra de genes seleccionados a partir de aquellos que codifican ARNm: que corresponden a SEQ ID NOs: 1-111 ; o reconocidos por las series de sondas seleccionadas a partir de psids que corresponden a SEQ ID NOs: 1-111 como se ilustra en el cuadro 10 en donde los niveles de expresión del gen por arriba o por debajo de los niveles límite pre-determinados son indicativos de un alto riesgo de recurrencia y; del tratamiento del paciente con terapia adyuvante si éstos son pacientes con alto riesgo. En cualesquiera de los métodos anteriormente mencionados las SEQ ID NOs. pueden ser 1-35, 36-95, 96-111 o 36-111. Preferiblemente, las SEQ ID NOs: son 36-95 para pacientes positivos al receptor de estrógeno (ER) y 96-111 para pacientes negativos a ER. La muestra se puede preparar mediante cualquier método conocido en la técnica incluyendo microdisección por captura láser de la preparación de la masa de tejidos. Las preparaciones de la masa de tejidos se pueden obtener a partir de una biopsia o de un espécimen quirúrgico. Los métodos anteriormente mencionados pueden incluir adicionalmente la medición del nivel de expresión de al menos un gen que codifica ARNm: que corresponden a SEQ ID NOs: 112-132; o reconocidos por las series de sondas seleccionadas a partir de psids que corresponden a SEQ ID NOs: 112-132 como se ilustra en el cuadro 10. Estos también pueden incluir la medición del nivel de expresión de al menos un gen constitutivamente expresado en la muestra. Los métodos anteriormente mencionados pueden incluir adicionalmente la determinación del estado del receptor receptor de estrógeno (ER) de la muestra. El estado del ER se puede medir mediante cualquier método conocido en la técnica incluyendo la medición del nivel de expresión de al menos un gen indicativo del estado del ER, midiendo la presencia del ER en la muestra y midiendo inmunohistoquímicamente.
Los métodos anteriormente mencionados se pueden utilizar con muestras a partir de cualquier fuente biológica. Preferiblemente, la muestra se obtiene a partir de un tumor primario. Los métodos anteriormente mencionados preferiblemente tienen una especificidad de al menos 40% y una sensibilidad de al menos 90%. Se pueden utilizar los métodos anteriormente mencionados en donde el patrón de expresión de los genes se compara con un patrón de expresión indicativo de un paciente con recidiva. La comparación puede ser mediante cualquier método conocido en la técnica incluyendo la comparación de los patrones de expresión que se lleva a cabo con métodos de reconocimiento del patrón. Los métodos de reconocimiento del patrón pueden ser cualesquiera conocidos en la técnica incluyendo un análisis proporcional al azar de Cox. Los métodos anteriormente mencionados se pueden utilizar en donde los niveles límite pre-determinados están al menos 1.5 veces por arriba o por debajo de la expresión en la muestra en relación con las células benignas o con el tejido normal. Preferiblemente, los niveles límite predeterminados tiene al menos una sobre-expresión del valor p estadísticamente significativa en la muestra que tiene células metastáticas en relación con las células benignas o con el tejido normal. Más preferiblemente, el valor p es menor de 0.05. Los métodos anteriormente mencionados se pueden utilizar en donde la expresión génica se mide en un microarreglo o fragmento génico.
Los fragmentos génicos y microarreglos adecuados para uso en la presente invención también se incluyen en la invención. El microarreglo puede ser un arreglo de ADNc o un arreglo de oligonucleótidos y puede contener adicionalmente uno o más reactivos para control interno. Los métodos anteriormente mencionados se pueden utilizar en donde la expresión génica se determina por la amplificación de ácidos nucleicos que se lleva a cabo por la reacción en cadena de la polimerasa (PCR) del ARN extraído a partir de la muestra. La PCR puede ser transcripción reversa de la reacción en cadena de la polimerasa (RT-PCR). La RT-PCR puede contener adicionalmente uno o más reactivos para control interno. Se pueden utilizar los métodos anteriormente mencionados en donde la expresión del gen se detecta por la medición o detección de una proteína codificada por el gen. Se puede utilizar cualquier método conocido en la técnica incluyendo la detección mediante un anticuerpo específico a la proteína y midiendo una característica del gen. Las características adecuadas incluyen, sin limitación, amplificación del ADN, metilación, mutación y variación alélica. La presente invención comprende un método de validación cruzada de un perfil de expresión del gen pronóstico para pacientes con cáncer de mama mediante la obtención de los datos de expresión del gen a partir de un número estadísticamente significativo de muestras biológicas del paciente; el ordenamiento de la muestra al azar; desechando los datos de aproximadamente 10%-50% de las muestras; haciendo el cómputo, para las muestras remanentes, para el factor de interés en todas las variables y selección de las variables que alcanzan un límite del valor p (p); seleccionar las variables que se ajustan a un modelo de predicción utilizando una búsqueda hacia adelante y evaluando el error por entrenamiento error hasta que se encuentra una relación de error predeterminado; evaluado el modelo de predicción en el remanente de 10-50% de las muestras; repitiendo los pasos c)-g). con una nueva serie de muestras removidas; y continuando los pasos c)-g) hasta 100% de las muestras han sido evaluadas y se ha registrado su clasificación de desempeño. Se puede utilizar el método de validación cruzada en donde los datos para expresión del gen obtenidos en el paso h. se representan por los genes seleccionados a partir de aquellos que codifican el ARNm: que corresponden a SEQ ID NOs: 3, 4, 10, 18, 37, 40, 42, 43, 45, 55, 58, 64, 67, 72-74, 76, 81 , 85-86, 89, 97, 100-101 , 110-1 1 1 , 125 y 132-442, o 2, 3, 5, 12, 20, 25, 36, 37, 39, 40, 41 , 42, 43, 45, 46, 51 , 52, 53, 54, 55, 57, 58, 59, 60, 61 , 62, 63, 64, 66, 67, 69, 70, 72, 73, 74, 76, 80, 81 , 83, 84, 85, 86, 87, 88, 89, 90, 94, 97, 98, 101 , 102, 104, 107, 110, 11 1 , 132, 139, 142, 150, 151 , 153, 154, 158, 161 , 163, 167, 170, 171 , 173, 175, 181 , 182, 183, 186, 188, 190, 192, 204, 206, 207, 212, 215, 218, 221 , 223, 225, 228, 231 , 232, 236, 238, 239, 240, 241 , 242, 243, 246, 248, 249, 255, 257, 267, 269, 270, 271 , 273, 280, 281 , 282, 288, 290, 291 , 299, 301 , 304, 306, 31 1 , 314, 315, 318, 327, 328, 338, 342, 346, 348, 354, 366, 368, 371 , 375, 385, 388, 391 , 395, 397, 402, 405, 409, 422, 424, 428, 429, 435, 436, 440, 651 y 443-650; o el reconocimiento por la serie de sondas seleccionadas a partir del grupo que consiste de psids que corresponden a SEQ ID NOs: 3, 4, 10, 18, 37, 40, 42, 43, 45, 55, 58, 64, 67, 72-74, 76, 81 , 85-86, 89, 97, 100-101 , 110-111 , 125 y 132-442, o 2, 3, 5, 12, 20, 25, 36, 37, 39, 40, 41 , 42, 43, 45, 46, 51 , 52, 53, 54, 55, 57, 58, 59, 60, 61 , 62, 63, 64, 66, 67, 69, 70, 72, 73, 74, 76, 80, 81 , 83, 84, 85, 86, 87, 88, 89, 90, 94, 97, 98, 101 , 102, 104, 107, 110, 111 , 132, 139, 142, 150, 151 , 153, 154, 158/161 , 163, 167, 170, 171 , 173, 175, 181, 182, 183, 186, 188, 190, 192, 204, 206, 207, 212, 215, 218, 221 , 223, 225, 228, 231 , 232, 236, 238, 239, 240, 241 , 242, 243, 246, 248, 249, 255, 257, 267, 269, 270, 271 , 273, 280, 281 , 282, 288, 290, 291 , 299, 301 , 304, 306, 31 , 314, 315, 318, 327, 328, 338, 342, 346, 348, 354, 366, 368, 371 , 375, 385, 388, 391 , 395, 397, 402, 405, 409, 422, 424, 428, 429, 435, 436, 440, 651 y 443-650 como se ilustra en el cuadro 10. La presente invención comprende un método para validar independientemente un perfil de expresión del gen pronóstico para pacientes con cáncer de mama mediante la obtención de los datos de expresión del gen a partir de un número estadísticamente significativo de muestras biológicas del paciente; normalizando las variabilidades de la fuente en los datos para expresión del gen; haciendo ei cómputo para el factor de interés en todas las variables que se seleccionan previamente; y evaluado el modelo de predicción en la muestra y registrando la clasificación del desempeño.
Se puede utilizar el método de validación independiente en donde los datos para expresión del gen obtenidos en el paso d. se representan por los genes seleccionados a partir de aquellos que codifican ARNm: que corresponden a SEQ ID NOs: 3, 4, 10, 18, 37, 40, 42, 43, 45, 55, 58, 64, 67, 72-74, 76, 81, 85-86, 89, 97, 100-101, 110-111, 125 y 132-442, o 2, 3, 5, 12, 20, 25, 36, 37, 39, 40, 41, 42, 43, 45, 46, 51, 52, 53, 54, 55, 57, 58, 59, 60, 61, 62, 63, 64, 66, 67, 69, 70, 72, 73, 74, 76, 80, 81, 83, 84, 85, 86, 87, 88, 89, 90, 94, 97, 98, 101, 102, 104, 107, 110, 111, 132, 139, 142, 150, 151, 153, 154, 158, 161, 163, 167, 170, 171, 173, 175, 181, 182, 183, 186, 188, 190, 192, 204, 206, 207, 212, 215, 218, 221, 223, 225, 228, 231, 232, 236, 238, 239, 240, 241, 242, 243, 246, 248, 249, 255, 257, 267, 269, 270, 271, 273, 280, 281, 282, 288, 290, 291, 299, 301, 304, 306, 311, 314, 315, 318, 327, 328, 338, 342, 346, 348, 354, 366, 368, 371, 375, 385, 388, 391, 395, 397, 402, 405, 409, 422, 424, 428, 429, 435, 436, 440, 651 y 443-650; o el reconocimiento por la serie de sondas seleccionadas a partir del grupo que consiste de psids que corresponden a SEQ ID NOs: 3, 4, 10, 18, 37, 40, 42, 43, 45, 55, 58, 64, 67, 72-74, 76, 81, 85-86, 89, 97, 100-101, 110-111, 125 y 132-442, o 2, 3, 5, 12, 20, 25, 36, 37, 39, 40, 41, 42, 43, 45, 46, 51, 52, 53, 54, 55, 57, 58, 59, 60, 61, 62, 63, 64, 66, 67, 69, 70, 72, 73, 74, 76, 80, 81, 83, 84, 85, 86, 87, 88, 89, 90, 94, 97, 98, 101, 102, 104, 107, 110, 111, 132, 139, 142, 150, 151, 153, 154, 158, 161, 163, 167, 170, 171, 173, 175, 181, 182, 183, 186, 188, 190, 192, 204, 206, 207, 212, 215, 218, 221, 223, 225, 228, 231, 232, 236, 238, 239, 240, 241, 242, 243, 246, 248, 249, 255, 257, 267, 269, 270, 271 , 273, 280, 281 , 282, 288, 290, 291 , 299, 301 , 304, 306, 31 1 , 314, 315, 318, 327, 328, 338, 342, 346, 348, 354, 366, 368, 371 , 375, 385, 388, 391 , 395, 397, 402, 405, 409, 422, 424, 428, 429, 435, 436, 440, 651 y 443-650 como se ilustra en el cuadro 10. La presente invención comprende un método para la generación de una Clasificación de Recidiva al Azar para permitir la prognosis de los pacientes con cáncer de mama mediante la obtención de los datos de expresión del gen a partir de un número estadísticamente significativo de muestras biológicas del paciente; aplicando el análisis de regresión univariable de Cox a los datos para obtener los genes seleccionados; aplicando los niveles de expresión evaluados a los genes seleccionados con el coeficiente estándar de los coeficientes de Cox para obtener un modelo de predicción que se puede aplicar como una Clasificación de Recidiva al Azar. La Clasificación de Recidiva al Azar se puede obtener mediante la fórmula: Evaluación (le recidiva (. - i)- w ;x • en donde f l Si el nivel del gen X > ]() J = 0 Si el nivel ilel gen X = Í0 A y B son constantes wi es el coeficiente de regresión de Cox estandarizado para el gen X + marcador xi es el valor de expresión de ER + el marcador en escala log2 wj es el coeficiente de regresión de Cox estandarizado para el gen X - marcador xj es el valor de expresión de ER-marcador en la escala log2 El gen X se selecciona a partir del grupo que consiste de aquellos que codifican ARNm: i. que corresponden a SEQ ID NOs: 1-111; o ii. que son reconocidos por la serie de sondas seleccionadas a partir del grupo que consiste de psids que corresponden a SEQ ID NOs: 1-111 como se ilustra en el cuadro 10. La presente invención comprende un método para la generación de un reporte pronóstico del paciente con cáncer de mama mediante la obtención de una muestra biológica a partir del paciente; midiendo la expresión del gen de la muestra; aplicando una Clasificación de Recidiva al Azar a los resultados del paso b.; y utilizando los resultados obtenidos en el paso c. para generar el reporte y los reportes del paciente así generados. El reporte puede contener una evaluación del resultado del paciente y/o probabilidad del riesgo en relación con la población del paciente. La presente invención comprende una composición de al menos una serie de sondas seleccionadas a partir de: SEQ ID NOs: 1-111 ; o psids que corresponden a SEQ ID NOs: 1-111 como se ilustra en el cuadro 10. La composición puede contener al menos una serie de sondas seleccionadas a partir de: SEQ ID NOs: 36-95; 96-111 ; o 36-111. La composición puede contener adicionalmente reactivos para llevar a cabo un análisis de microarreglo, y un medio a través del cual son ensayadas dichas secuencias de ácido nucleico, sus complementos, o porciones de las mismas. La presente invención comprende un equipo para la realización de un ensayo para determinar la prognosis del cáncer de mama en una muestra biológica que contiene: materiales para la detección de secuencias aisladas de ácido nucleico, sus complementos, o porciones de los mismos de una combinación de genes seleccionados a partir de aquellos que codifican ARNm: que corresponden a SEQ ID NOs: 1-111; o reconocidos por las series de sondas seleccionadas a partir de psids que corresponden a SEQ ID NOs: 1-111 como se ilustra en el cuadro 10. El equipo puede contener adicionalmente reactivos para llevar a cabo un análisis de microarreglo, y un medio a través del cual son ensayadas dichas secuencias de ácido nucleico, sus complementos, o porciones de las mismas. La presente invención comprende artículos para la evaluación del estado del cáncer de mama que contiene: materiales para la detección de secuencias aisladas de ácido nucleico, sus complementos, o porciones de los mismos de una combinación de genes seleccionados a partir de aquellos que codifican ARNm: que corresponden a SEQ ID NOs: 1-111 ; o reconocidos por las series de sondas seleccionadas a partir de psids que corresponden a SEQ ID NOs: 1-111 como se ilustra en el cuadro 10. Los artículos pueden contener adicionalmente reactivos para llevar a cabo un análisis de microarreglo, y un medio a través del son ensayadas cual dichas secuencias de ácido nucleico, sus complementos, o porciones de las mismas. Los microarreglos provistos en la presente invención pueden comprender secuencias aisladas de ácido nucleico, sus complementos, o porciones de los mismos de una combinación de genes seleccionados a partir de aquellos que codifican ARNm: que corresponden a SEQ ID NOs: 1 -111 ; o reconocidos por las series de sondas seleccionadas a partir de psids que corresponden a SEQ ID NOs: 1-111 como se ilustra en el cuadro 10 en donde la combinación es adecuada para caracterizar el estado del cáncer de mama o el riesgo de recidiva en una muestra biológica. La medición de microarreglo o caracterización está preferiblemente al menos 1.5 veces por arriba o por debajo de la expresión. El microarreglo puede detectar niveles límite predeterminados que están al menos 1.5 veces por arriba o por debajo de la expresión en la muestra en relación con las células benignas o con el tejido normal. Preferiblemente, los niveles límite pre-determinados tienen al menos una sobre-expresión del valor p estadísticamente significativa en la muestra que tiene células metastáticas en relación con las células benignas o con el tejido normal. Más preferiblemente, el valor p es menor de 0.05. La presente invención comprende un portafolio diagnóstico/pronóstico que contiene secuencias aisladas de ácido nucleico, sus complementos, o porciones de los mismos de una combinación de genes seleccionados a partir de aquellos que codifican ARNm: que corresponden a SEQ ID NOs: 1-111 ; o reconocidos por las series de sondas seleccionadas a partir de psids que corresponden a SEQ ID NOs: 1-111 como se ilustra en el cuadro 10 en donde la combinación es adecuada para caracterizar el estado del cáncer de mama o el riesgo de recidiva en una muestra biológica. El portafolio puede detectar niveles límite predeterminados que están al menos 1.5 veces por arriba o por debajo de la expresión en la muestra en relación con las células benignas o con el tejido normal. Preferiblemente, los niveles límite pre-determinados tiene al menos una sobre-expresión del valor p estadísticamente significativa en la muestra que tiene células metastáticas en relación con las células benignas o con el tejido normal. Más preferiblemente, el valor p es menor de 0.05. SEQ ID NOs: 1-650 se resumen en el cuadro 10. En cada SEQ ID NO: 1-650, el marcador se identifica por un psid o designación de fragmento génico Affymetrix y representa el gen que codifica cualquier variante, alelo etc. que corresponden a la SEQ ID NO dada. El marcador también se define como el gen que codifica ARNm reconocido por la sonda que corresponde al psid dado. Ciertos marcadores se describen con mayor detalle a continuación. M83, SEQ ID NO: 45, se menciona por las Solicitudes de Patente de E.U.A. Números de publicación 20020110547; 20040009491 ; y 20030236392, y Números de Publicación PCT WO0149716; WO0170979; WO03025138; WO03042661 ; WO03016475; WO2004063355; WO2004047728; y WO2004030615. ABLIM-s, SEQ ID NO: 43, se menciona por las Solicitudes de Patente de E.U.A. Números de publicación 20020131971 ; 20030087818; 20030166064; 20030236392; y 20040005560 y Números de Publicación PCT WO0036107; WO0159063; WO0160860; WO0174405; WO01 77288; WO02059271 ; WO0212328; WO0224956; WO0229086; WO03025138; WO2004024097; WO2004037996; WO2004039956; WO2004043361 ; y WO2004047728. ATAD2, SEQ ID NO: 54 se menciona por las Solicitudes de Patente de E.U.A. Números de publicación 20020064872; 20020085998; 20020150581 ; 20020156011 ; 20020192678; 20030069180; 20030073623; 20030104366; 20040005560; 20040013663; y 20040058340 y Números de Publicación PCT WO0060076; WO0142467; WO0155322; WO0160860; WO0170979; WO0179286; W0196388; WO02057414; WO02059377; WO02060317; WO02086443; WO0231198; WO0250279; WO03004989; WO03025138; WO03042661 ; WO03062379; WO2004047728; WO2004048938; WO2004048938; WO2004063355; y W09938972. C110RF9, SEQ ID NO: 48, se menciona por las Solicitudes de Patente de E.U.A. Números de publicación 20030065157; y 20030073623 y Números de Publicación PCT WO0056880; WO0058473; WO0159063; WO0174405; WO02059260; WO0229086; WO03101283; WO2004031413; y WO2004060270.
C3, SEQ ID NO: 46, se menciona por las Solicitudes de Patente de E.U.A. Números de publicación 20040005560; y 20040058340 y Números de Publicación PCT WO9101999; WO0055350; WO0160860; WO0175067; WO0188088; WO0224956; WO0294629; WO03078572; WO2004028479; WO2004030615; WO2004041170; y WO2004060270. CGI-41 , SEQ ID NO: 65, se menciona por las Solicitudes de Patente de E.U.A. Números de publicación 20030073623; y 20030096982 y Números de Publicación PCT W09514772; WO9940100; WO0154472; WO0157188; WO03046152; WO2004060270. CLN8, SEQ ID NO: 36, se menciona por EP 1 104 808 B1 , Patentes de E.U.A. Números 20030073623; y 20040009491 y Números de Publicación PCT W09845437; W09935158; WO0142451 ; WO0190304; WO02090526; WO02095010; WO02102993; WO02102994; WO03004622; WO04024892; y WO04041170. CNK1 , SEQ ID NO: 60, se menciona por la Solicitud de Patente de E.U.A. Número de Publicación 20040058340 y Números de Publicación PCT W09938972; y WO2004037996. DUSP4, SEQ ID NO: 57, se menciona por las Solicitudes de Patente de E.U.A. Números de Publicación 20030073623; 20030194704 20040058340; y 20040110194 y Números de Publicación PCT WO0100828 WO0204514; WO02059377; WO02103320; WO0224956; WO03004989 WO2004018641 ; WO2004023973; WO2004037996; WO2004039956 WO2004043361 ; WO2004047728; WO2004048938; y WO9423039.
FEN1 , SEQ ID NO: 62, se menciona por Patente de E.U.A.
Número 5874283, Solicitudes de Patente de E.U.A. Números de Publicación 20020156011 ; 20030069180; 20030073623; y 20030194704 y Números de Publicación PCT WO0196388; WO03016475; WO03016500; WO03072035; WO03101283; WO2004022059; WO2004030615; WO2004039956; WO2004043361 ; WO2004047728; WO2004048938; WO2004060270; y WO2004079014. FKBP2, SEQ ID NO: 63, se menciona por Solicitud de Patente de E.U.A. Números de Publicación 20030073623 y Números de Publicación PCT WO02059377; WO02070737; WO02081731 ; WO02083898; WO0224956; WO03016475; WO03054152; WO2004039956; WO2004043361 ; y W09219745. GP73, SEQ ID NO: 37, se menciona por las Solicitudes de Patente de E.U.A. Números de publicación 20030022239; 20030073623; 20030236392; 20040009478; 20040034196; y 20040058340 y Números de Publicación PCT WO0012708; WO0061610; WO0078961 ; W00140466; WO0160860; WO0177168; WO0194629; WO02059260; WO02083876; WO0224956; WO03004989; WO2004024892; WO2004031414; y WO2004053081. H4FH, SEQ ID NO: 61 , se menciona por Solicitud de Patente de E.U.A. Números de Publicación 20020151681 y Números de Publicación PCT WO0055174; WO0175067; WO0224956; WO03016476; WO2004039943.
IL-18, SEQ ID NO: 39, se menciona por Patente de E.U.A.
Número 6060283, Solicitud de Patente de E.U.A. Números de Publicación 20040115636 y Números de Publicación PCT WO0194629; WO02057414; WO0224956; WO0229086; WO03025138; WO03042661 ; y W09724441. KIAA0748, SEQ ID NO: 56, se menciona por los Números de Publicación PCT WO0021991 ; WO02094988; y WO2004003162. KPNA2, SEQ ID NO: 64, se menciona por las Solicitudes de Patente de E.U.A. Números de publicación 20020151681 ; 20020156011 ; 20030069180; y 20040058340 y Números de Publicación PCT W09712967; W09964576; WO0055174; WO0146697; WO0170979; WO0196388; WO02057414; WO02059377; WO02086443; WO02102235; WO0224956; WO03010336; WO03025138; WO03027285; WO03042661 ; WO2004024097; WO2004024892; WO2004028479; WO2004037996; WO2004039956; WO2004043361 ; WO2004047728; y WO2004063355. MGC11335, SEQ ID NO: 66, se menciona por las Solicitudes de Patente de E.U.A. Números de publicación 20030073623; 20030219744; y 20030236392 y Números de Publicación PCT WO0144448; WO0153312; WO0157182; WO0188088; y WO2004030615. OR12D2, SEQ ID NO: 52, se menciona por los Números de Publicación PCT WO0127158; WO02068652; WO02081498; WO02081517; WO030000735; y WO03091388. ORC3, SEQ ID NO: 53, se menciona por la Solicitud de Patente de E.U.A. Números de Publicación 20040013663 y Números de Publicación PCT WO9810067; W09958642; WO0060078; WO0175067; WO02059377; WO02070737; WO02102235; y WO03042661. PLK1 , SEQ ID NO: 59, se menciona por DE4329177, Solicitudes de Patente de E.U.A. Números de Publicación 20020081659; y 20020151681 y Números de Publicación PCT WO0055174; WO0055320; WO02070737; WO02086443; WO0224956; WO03003906; WO03016476; WO03O18807; WO03025138; WO03042661 ; WO2004030615; WO2004O37996; WO2004042022; WO2004047728; WO2004048938; WO2004063355; y WO2004070062. PPP1CC, SEQ ID NO: 42, se menciona por las Solicitudes de Patente de E.U.A. Números de publicación 20030073623; y 20040013663 y Números de Publicación PCT WO03016476; WO0063438; WO0170979; WO0202623; WO02036766; WO02074237; WO0228999; WO03016475; y WO2004030615. SMC4, SEQ ID NO: 55, se menciona por las Solicitudes de Patente de E.U.A. Números de publicación 20020123619; 20020168637; y 20040058340 y Números de Publicación PCT W09938972; W09964576; WO0175067; WO0190154; WO0204514; WO02059377; WO02074237; WO02086443; WO02102235; WO03003906; WO03016475; WO03025138; WO03042661 ; WO2003094848; WO2004024892; WO2004047728; WO2004048938; WO2004063355; y WO2004074301. TRDL-1 , SEQ ID NO: 44, se menciona por las Patentes de E.U.A. Números 6171787; y 6440694, Solicitudes de Patente de E.U.A.
Números de Publicación 20020055474; 20020072089; 20020081659; 20030065157; 20030073623; y 20030219767 y Números de Publicación PCT WO9733902; W09912965; W09926976; W09928462; WO9933980 WO9935170; WO9950416; WO9954460; WO0026244; WO0032776 WO0055320; WO0125256; WO0177291 ; WO2004020593; WO2004Ó24892 WO2004033637; y 04037996. Yiflp, SEQ ID NO: 38, se menciona por la Solicitud de Patente de E.U.A. Números de Publicación 20020131971 ; 20030166064; y 20040037842 y Números de Publicación PCT W09933981 WO9947540; WO0173027; WO02060317; WO02070737 WO02076488; WO02095010; WO0224956; WO03004622 WO03038063; WO03042661 ; WO03054152; WO03064589 WO2004024892; WO2004037996; WO2004047728; y WO2004048938. Con el uso de los fragmentos génicos de Affymetrix U133a de humano se analizó la expresión de 22,000 transcritos utilizando ARN total de muestras congeladas de tumor a partir de 286 pacientes con cáncer de mama nodulo linfático negativo (LNN) el cual no recibió el tratamiento sistémico con adyuvante. Los inventores encontraron que las mediciones en un amplio genoma de la expresión del gen pueden identificar patrones de actividad géníca que subclasifica a los tumores y provee medios mejorados para la evaluación del riesgo individual en pacientes con cáncer de mama nodulo linfático negativo.
En una serie para entrenamiento de 115 tumores los inventores identificaron una marca de 76 genes compuesta de 60 genes para pacientes positivos a ER y 16 genes para pacientes negativos a ER. Esta marca mostró una sensibilidad de 93% y 48% de especificidad en una serie subsecuente para la evaluación independiente de 171 pacientes con LNN. El perfil del gen fue altamente informativo en la identificación de los pacientes que desarrollan metástasis distantes dentro de los primeros 5 años (relación al azar, HR: 5.67, 95% de intervalo de confianza, Cl: 2.59-12.4), incluso cuando fueron corregidos para factores pronóstico tradicionales en análisis multivariable (HR: 5.55, Cl: 2. 46-12. 5). El perfil de 76 genes también representó un fuerte factor pronóstico para el desarrollo de metástasis en los subgrupos de 84 pacientes premenopaúsicos (HR: 9.60, p=1.6x104), 87 pacientes postmenopaúsicos (HR: 4.04, p=1.7x10"3) y 79 pacientes un tamaño de tumor que tenía un intervalo de 10 a 20 mm (HR: 14.1 , p=2.3x10"6), un grupo de pacientes para los cuales la prognosis de la enfermedad es particularmente difícil. En este estudio los inventores proveen resultados de un análisis de tumores primarios a partir de 286 pacientes con cáncer de mama LNN de grupos de todas las edades y tamaños tumorales. Los pacientes no recibieron terapia sistémica adyuvante haciendo a esta la primera evaluación multigen de la prognosis sin la contribución potencialmente que confunde mediante los factores predictivos relacionados con el tratamiento sistémico, adecuadamente validados por una serie de pruebas independientes, y no restringidos por el tamaño tumoral y la edad. El algoritmo basado en la expresión del gen descrito puede pronosticar, con una alta confianza en los pacientes con LNN, la probabilidad de desarrollar una recurrencia distante. La mera presencia o ausencia de secuencias particulares de ácidos nucleicos en una muestra del tejido solamente se ha encontrado de vez en cuando que tiene un valor diagnóstico o pronóstico. Por otra parte, la información acerca de la expresión de diversas proteínas, péptidos o ARNm, cada vez más se considera como importante. La mera presencia de las secuencias de ácido nucleico que tienen el potencial para expresar proteínas, péptidos, o ARNm (dichas secuencias referidas como "genes") dentro del genoma, por sí mismas no son determinantes de si una proteína, péptidos, o ARNm se expresa en una célula dada. Sí o no un gen dado es capaz de expresar proteínas, péptidos, o el ARNm lo hacey hasta qué grado se presenta dicha expresión, si es que se presenta, se determina por una variedad de factores complejos. Sin importar las dificultades en el entendimiento y la evaluación de estos factores, el ensayo de la expresión del gen puede proveer información útil acerca de la presencia de eventos importantes tales como la génesis tumoral, metástasis, apoptosis, y otros fenómenos clínicamente relevantes. Las indicaciones relativas al grado en el cual los genes son activos o inactivos se pueden encontrar en los perfiles de expresión del gen. Los perfiles de expresión del gen de esta invención se utilizan para proveer una prognosis y para tratar pacientes con cáncer de mama.
La preparación de la muestra requiere la recolección de las muestras de pacientes. Las muestras de pacientes utilizadas en los métodos de la invención son aquellas que se sospecha que contienen células enfermas tales como células epiteliales tomadas a partir del tumor primario en una muestra de mama. Las muestras tomadas a partir de los márgenes quirúrgicos también se prefieren. No obstante, más preferiblemente, la muestra se toma a partir de un nodulo linfático obtenido a partir de una cirugía de cáncer de mama. La tecnología de microdisección por captura láser (LCM) es una manera de seleccionar las células a ser estudiadas, minimizar la variabilidad ocasionada por la heterogeneidad del tipo celular. Consecuentemente, se pueden detectar fácilmente los cambios moderados o pequeños en la expresión del gen entre las células normales y cancerosas. Las muestras también pueden comprender células epiteliales en circulación extraídas a partir de la sangre periférica. Estas se pueden obtener de conformidad con numerosos métodos, pero el método más preferido es la técnica de separación magnética descrita en la Patente de E.U.A. 6,136,182. Una vez que se ha obtenido la muestra que contiene las células de interés, el ARN se extrae y se amplifica y se obtiene un perfil de expresión del gen, preferiblemente vía micro-arreglo, para los genes en los portafolios apropiados. Los métodos preferidos para el establecimiento de los perfiles de expresión del gen incluyen la determinación de la cantidad de ARN que se produce por un gen que puede codificar una proteina o un péptido. Esto se logra mediante transcriptasa reversa PCR (RT-PCR), RT-PCR competitiva, RT-PCR en tiempo real, RT-PCR por exhibición diferencial, análisis de Northern Blot y otras pruebas relacionadas. Aunque es posible llevar a cabo estas técnicas utilizando reacciones individuales de PCR, es mejor amplificar el ADN complementario (DNAc) o el ARN complementario (ARNc) producido a partir del ARNm y analizarlo vía microarreglo. Numerosas configuraciones de arreglos diferentes y métodos para su producción se conocen por aquellos expertos en la técnica y se describen en las Patentes de E.U.A. tales como: 5,445,934; 5,532,128; 5,556,752; 5,242,974; 5,384,261 ; 5,405,783; 5,412,087; 5,424,186; 5,429,807; 5,436,327; 5,472,672; 5,527,681 ; 5,529,756; 5,545,531 ; 5,554,501 ; 5,561 ,071 ; 5,571 ,639; 5,593,839; 5,599,695; 5,624,711 ; 5,658,734; y 5,700,637. La tecnología de microarreglo permite la medición del nivel del ARNm en estado estacionario de miles de genes de manera simultánea presentando así una herramienta poderosa para la identificación de efectos tales como el inicio, paro, o modulación de la proliferación no controlada de la célula. Actualmente se encuentran en uso dos tecnologías en microarreglo. La primera se refiere a arreglos de ADNc y la segunda se refiere a arreglos de oligonucleótidos. Aunque existen diferencias en la construcción de estos fragmentos, esencialmente todos los análisis de datos corriente abajo y resultados son los mismos. El producto de estos análisis típicamente son mediciones de la intensidad de la señal recibida a partir de una sonda marcada utilizada para detectar una secuencia de ADNc a partir de la muestra que hibrida con una secuencia de ácidos nucleicos en una ubicación conocida en el microarreglo. Típicamente, la intensidad de la señal es proporcional con la cantidad de ADNc, y por lo tanto del ARNm, expresado en la muestra de células. Está disponible un gran número de dichas técnicas y son útiles. Los métodos preferidos para la determinación de la expresión del gen se pueden encontrar en las Patentes de E.U.A. 6,271 ,002; 6,218,122; 6,218,114; y 6,004,755. El análisis de los niveles de expresión se lleva a cabo mediante la comparación de las intensidades de la señal. Esto se realiza de mejor manera al generar una matriz de relación de las intensidades de expresión de los genes en una muestra contra aquellas generadas a partir de una muestra control. Por ejemplo, las intensidades de expresión del gen a partir de un tejido enfermo se pueden comparar con las intensidades de expresión generadas a partir del tejido normal del mismo tipo (por ejemplo, muestra de tejido de mama enfermo contra muestra de tejido de mama normal). Una relación de estas intensidades de expresión indica el cambio en número de veces de la expresión del gen entre las muestras prueba y las muestras control. Los perfiles de expresión del gen también se pueden exhibir de numerosas formas. El método más común es disponer las intensidades de las fluorescencias sin modificar o una matriz de relación en un dendrograma gráfico en donde las columnas indican las muestras prueba y las hileras indican los genes. Los datos están dispuestos de manera que los genes que tienen perfiles de expresión similares están próximos entre sí. La relación de expresión para cada gen se visualiza como un color. Por ejemplo, una relación menor de uno (que indica una sub-regulación) puede aparecer en la porción azul del espectro mientras que una relación mayor de uno (que indica una sobre-regulación) puede aparecer como un color en la porción roja del espectro. Los programas de software para cómputo comercialmente disponibles están disponibles para exhibir dichos datos incluyendo GeneSpring a partir de Agilent Technologies and Partek Discover™ y software Partek Infer™ a partir de Partek®. Los genes modulados utilizados en los métodos de la invención se describen en los ejemplos. Los genes diferencialmente expresados están ya sea sobre- o sub-regulados en los pacientes con una recidiva del cáncer de mama en relación con aquellos sin una recidiva. La sobre-regulación y sub-regulación son términos relativos que significan una diferencia significativa (más allá de la contribución de ruido de fondo en el sistema utilizado para medirla) encontrada en la cantidad de expresión de los genes en relación con cierta línea basal. En este caso, la línea basal es la expresión medida del gen de un paciente sin recidiva. Los genes de interés en las células enfermas (a partir de los pacientes que presentan recidiva) se encuentran ya sea sobre-regulados o sub-regulados en relación con el nivel de la línea basal utilizando en el método de medición. Enfermo, en este contexto, se refiere a la alteración del estado de un cuerpo que interrumpe o altera, o que tiene el potencial para alterar, el desempeño adecuado de las funciones corporales como se presenta con la proliferación no controlada de células. Una persona es diagnosticada con una enfermedad cuando cierto aspecto del genotipo o fenotipo de esa persona es consistente con la presencia de la enfermedad. No obstante, el acto de llevar a cabo un diagnóstico o prognosis incluye la determinación de la enfermedad/estado del tejido tales como la determinación de la probabilidad de recidiva y el monitoreo de la terapia. En el monitoreo de la terapia, se llevan a cabo juicios clínicos con respecto al efecto de un curso dado de terapia mediante la comparación de la expresión de los genes durante el tiempo para determinar si los perfiles de expresión del gen han cambiado o están cambiando hacia patrones más consistentes con el tejido normal. Preferiblemente, los niveles de sobre-regulación y sub-regulación se distinguen basándose en los cambios en número de veces de las mediciones de intensidad de las sondas en microarreglo híbrido. Una diferencia de 2.0 veces se prefiere para la elaboración de dichas distinciones (o un valor p menor de 0.05). Es decir, antes de que se diga que un gen se expresa diferencialmente en células enfermas/con recidiva contra células normal/sin recidiva, se encuentra que la célula enferma produce al menos 2 veces más, o 2 veces menos intensidad que las células normales. A mayor diferencia en el número de veces, se prefieren más el uso del gen como una herramienta diagnóstica o de pronóstico. Los genes seleccionados para los perfiles de expresión del gen de la presente invención tienen niveles de expresión que resultan en la generación de una señal que es distinguible a partir de aquellas de los genes normales o no modulados en una cantidad que excede a la señal de fondo utilizando instrumentación clínica de laboratorio. Los valores estadísticos se pueden utilizar para distinguir de manera confiable los genes modulados de los genes no modulados y la señal de fondo Las pruebas estadísticas encontraron los genes más significativamente diferentes entre los diversos grupos de las muestras. La prueba T de Student es un ejemplo de una prueba estadística fuerte que se puede utilizar para encontrar diferencias significativas entre dos grupos. Mientras más pequeño sea el valor p, es más precisa la evidencia de que ese gen muestra una diferencia entre los diferentes grupos. No obstante, puesto que los microarreglos miden más de un gen al mismo tiempo, se pueden llevar a cabo decenas de miles de pruebas estadísticas al mismo tiempo. Debido a esto, es poco probable observar valores p pequeños por desigualdad y se pueden elaborar los ajustes para estos utilizando una corrección de Sidak así como un experimento de aleatoriedad/permutación. Un valor p menor de 0.05 por la prueba T es evidencia de que el gen es significativamente diferente. La evidencia más precisa es un valor p menor de 0.05 después de que la corrección de Sidak se factoriza. Para un gran número de muestras en cada grupo, un valor p menor de 0.05 después de la prueba de aleatoriedad/permutación es la evidencia más precisa de una diferencia significativa. Otro parámetro que se puede utilizar para seleccionar los genes que generan una señal que es mayor que aquella del gen no modulado o ruido de fondo es el uso de una medición de la diferencia absoluta de la señal. Preferiblemente, la señal generada por la expresión del gen modulado es al menos 20% diferente en comparación con aquella del gen normal o no modulado (en una base absoluta). Incluso se prefiere más que dichos genes produzcan patrones de expresión que son al menos 30% diferentes en comparación con aquellos de los genes normales o no modulados. Los genes se pueden agrupar de manera que la información obtenida acerca de la serie de genes en el grupo proveea una base segura para la realización de un juicio clínicamente relevante tales como un diagnosis, prognosis, tratamiento de elección. Esta serie de genes elaboran el portafolios de la invención. En este caso, los juicios apoyados por los portafolios incluyen el cáncer de mama y su posibilidad de recurrencia. Como se observa con la mayoría de los marcadores diagnósticos, frecuentemente es deseable utilizar el menor número de marcadores adecuados para realizar un juicio médico correcto. Esto previene un retraso en el análisis adicional del tratamiento pendiente así como el uso ¡napropiado de tiempo y de recursos. Preferiblemente, los portafolios se establecen de manera que la combinación de genes en el portafolio exhibe una sensibilidad y especificidad mejorada en relación con los genes individuales o combinaciones de genes seleccionados al azar. En el contexto de la presente invención, la sensibilidad del portafolio se puede reflejar en el número de veces de diferencia exhibidos por la expresión de un gen en el estado de enfermedad en relación con el estado normal. La especificidad se puede reflejar en las mediciones estadísticas de la correlación de la señalización de la expresión del gen con la condición de interés. Por ejemplo, la desviación estándar se puede utilizar como dicha medición. En la consideración de un grupo de genes para inclusión en un portafolio, una desviación estándar pequeña en las mediciones de expresión correlaciona con una mayor especificidad. También se pueden utilizar otras mediciones de la variación tales como los coeficientes de correlación. Un método para el establecimiento de los portafolios de expresión del gen es a través del uso de algoritmos para optimización tal como el algoritmo de varianza media ampliamente utilizado en el establecimiento de los grupos para portafolios. Este método se describe con detalle en la Patente de E.U.A. número de publicación 20030194734. Esencialmente, el método requiere el establecimiento de una serie de ingresos (capitales en aplicaciones financieras, expresión que se mide mediante la intensidad en la presente invención) que optimizarán la utilidad (por ejemplo, señal que se genera) por el uso de ésta a la vez que se minimiza la variabilidad de la utilidad. Están disponibles muchos programas de software comerciales para llevar a cabo dichas operaciones. Se prefiere la "Wagner Associates Mean-Variance Optimization Application", referido como "Wagner Software" a lo largo de esta especificación. Este software utiliza funciones a partir de la "Wagner Associates Mean-Variance Optimization Library" para determinar un portafolio preferido con un límite eficiente y óptimo en el sentido de Markowitz. Ei uso de este tipo de software requiere que los datos del microarreglo sean transformados de manera que puedan ser tratados como un ingreso en el sentido de mediciones de la utilidad y las mediciones de riesgo se utilizan cuando el software se utiliza para sus propósitos de análisis financiero. El proceso de selección de un portafolio también puede incluir la aplicación de reglas heurísticas. Preferiblemente, dichas reglas se formulan basándose en la biología y en el entendimiento de la tecnología utilizada para producir resultados clínicos. Más preferiblemente, éstas se aplican al resultado a partir del método de optimización. Por ejemplo, el método de varianza media del portafolio de selección se puede aplicar a los datos de microarreglo para numerosos genes que se expresan diferencialmente en sujetos con cáncer de mama. El resultado a partir del método podria ser una serie de genes optimizados que podrían incluir algunos genes que se expresan en la sangre periférica así como en el tejido enfermo. Si las muestras utilizadas en el método de prueba se obtienen a partir de la sangre periférica y ciertos genes que se expresan diferencialmente en los casos del cáncer de mama se encuentran diferencialmente expresados en la sangre periférica, entonces se puede aplicar una regla heurística en la cual se selecciona un portafolio a partir del límite eficiente excluyendo aquellos que se expresan diferencialmente en la sangre periférica. Evidentemente, la regla se puede aplicar antes de la formación del límite eficiente mediante, por ejemplo, la aplicación de la regla durante la preselección de los datos.
Se pueden aplicar otras reglas heurísticas que no necesariamente están relacionadas a la biología en cuestión. Por ejemplo, uno puede aplicar una regla que puede representar solamente un porcentaje prescrito del portafolio por un gen particular o grupo de genes. El software comercialmente disponible tal como el software Wagner fácilmente incluye estos tipos de heurísticos. Esto puede ser útil, por ejemplo, cuando otros factores diferentes a la exactitud y precisión (por ejemplo, cargos por licencia anticipada) tienen un impacto sobre el deseo de incluir uno o más genes. Un método de la invención incluye la comparación de los perfiles de expresión del gen para diversos genes (o portafolios) para atribuir la prognosis. Los perfiles de expresión del gen de cada uno de los genes que comprenden el portafolio se fijan en un medio tal como un medio que se puede leer por una computadora. Este puede tomar numerosas formas. Por ejemplo, se puede establecer un cuadro dentro del cual se ingresa ei intervalo de señales (por ejemplo, mediciones de intensidad) indicativo de la enfermedad. Posteriormente se pueden comparar los datos reales del paciente en comparación con los valores en el cuadro para determinar si las muestras del paciente son normales o están enfermas. En una modalidad más sofisticada, los patrones de las señales de expresión (por ejemplo, intensidad de la fluorescencia) se registran digitalmente o gráficamente. Los patrones de expresión del gen a partir de portafolios de genes utilizados en conjunción con las muestras del paciente se comparan entonces con los patrones de expresión. El software para comparación de patrones se puede utilizar entonces para determinar sí las muestras del paciente tienen un patrón indicativo de la recurrencia de la enfermedad. Evidentemente, estas comparaciones también se pueden utilizar para determinar si el paciente tiene pocas probabilidades de experimentar recurrencia de la enfermedad. Los perfiles de expresión de las muestras se comparan entonces con el portafolio de una célula control. Si los patrones de expresión de la muestra son consistentes con el patrón de expresión para la recurrencia de un cáncer de mama entonces (en la ausencia de consideraciones médicas de contrapeso) el paciente es tratado como uno podría tratar a paciente con recidiva. Si los patrones de expresión de la muestra son consistentes con el patrón de expresión a partir de la célula normal/control entonces el paciente se diagnostica negativo para cáncer de mama. Los perfiles preferidos de este invención son el portafolio de 35 genes elaborado a partir de los genes de SEQ ID NOs: 1-35, el portafolio de 60 genes elaborado a partir de los genes de SEQ ID NOs: 36-95 el cual se utiliza de mejor manera para pronosticar a los pacientes positivos a ER, y el portafolios de 16 genes elaborado a partir de los genes de SEQ ID NOs: 96-11 1 el cual se utiliza de mejor manera para pronosticar a los pacientes negativos a ER. Más preferiblemente, el portafolio se elabora a partir de los genes de SEQ ID NOs: 36-111. Este portafolio más preferido se segrega de mejor manera a los pacientes con cáncer de mama sin importar el estado ER con un alto riesgo de recidiva en comparación con aquellos que no están en riesgo. Una vez que se identifican los pacientes con alto riesgo, éstos pueden ser tratados con terapia adyuvante. En esta invención, el método más preferido para el análisis del patrón de expresión de genes de un paciente para determinar la prognosis del cáncer de mama es a través del uso del programa de análisis al azar de Cox. Más preferiblemente, el análisis se lleva a cabo utilizando el software S-Plus (comercialmente disponible a partir de Insightful Corporation). Utilizando dichos métodos, se compara un perfil de expresión del gen con aquel perfil que representa recidiva de manera segura (por ejemplo, los niveles de expresión para la combinación de genes en el perfil es indicativa de recidiva). El modelo al azar de Cox con el umbral establecido se utiliza para comparar la similitud de los dos perfiles (recidiva conocida contra paciente) y luego se determina si el perfil del paciente excede el umbral. Si lo hace, entonces el paciente se clasifica como uno que producirá recidiva y se acuerda el tratamiento tal como terapia adyuvante. Si el perfil del paciente no excede el umbral entonces éste se clasifica como paciente sin recidiva. También se pueden utilizar otras herramientas analíticas para responder la misma pregunta tales como, los métodos de análisis discriminatorio lineal, regresión logística y red neural. Están disponibles muchos otros métodos bien conocidos para reconocimiento del patrón. Las siguientes referencias proveen ciertos ejemplos: Votación evaluada: Golub et al. (1999).
Máquinas de apoyo del vector: Su et al. (2001); y Ramaswamy et al. (2001 ). Vecinos más cercanos a K: Ramaswamy (2001). Coeficientes de correlación: van't Veer et al. (2002). Los perfiles de expresión del gen de esta invención también se pueden utilizar en conjunción con otros métodos diagnósticos no genéticos útiles en el diagnosis, prognosis, o monitoreo de! tratamiento del cáncer. Por ejemplo, en ciertos casos es benéfico combinar el poder diagnóstico de los métodos basados en la expresión de gen anteriormente descritos con los datos a partir de marcadores convencionales tales como marcadores proteicos del suero (por ejemplo, el antígeno del cáncer 27.29 ("CA 27.29")). Existe un intervalo de dichos marcadores incluyendo dichos analitos tal como CA 27.29. En un método, la sangre se toma periódicamente a partir de un paciente tratado y luego se somete a un inmunoensayo enzimático para uno de los marcadores de suero anteriormente descritos. Cuando la concentración del marcador sugiere el regreso de los tumores o la falla en la terapia, se toma una muestra fuente en la que se puede realizar el análisis de expresión del gen. Cuando existe una masa sospechosa, se toma un aspirado con una aguja fina (FNA) y se analizan los perfiles de expresión del gen de las células tomadas a partir de la masa como se describió anteriormente. Alternativamente, las muestras de tejido se pueden tomar a partir de áreas adyacentes al tejido a partir de las cuales se removió un tumor previamente.
Este método puede ser particularmente útil cuando otros procedimientos de prueba resultan ambiguos. Los artículos de esta invención incluyen representaciones de los perfiles de expresión del gen útiles para el tratamiento, diagnóstico, pronóstico, y otros tipos de evaluaciones de la enfermedad. Estas representaciones del perfil se reducen a un medio que puede ser automáticamente leído por una máquina tal como un medio que se puede leer en una computadora (magnético, óptico, y los similares). Los artículos también pueden incluir instrucciones para la evaluación de los perfiles de expresión de! gen en dicho medio. Por ejemplo, los artículos pueden comprender un CD ROM que tiene instrucciones de computadora para la comparación de los perfiles de expresión del gen de los portafolios de genes anteriormente descritos. Los artículos también pueden tenerlos perfiles de expresión del gen digitalmente registrados en éstos de manera que se pueden comparar con los datos de expresión de genes a partir de las muestras del paciente. Alternativamente, los perfiles se pueden registrar en diferentes formatos para representación. Un registro gráfico es uno de dichos formatos. Los algoritmos para agrupamiento tales como aquellos incorporados en Partek Discover™ y software Partek Infer™ a partir de Partek® anteriormente mencionados pueden ayudar en la visualización de dichos datos. Los diferentes tipos de artículos de elaboración de conformidad con la invención son medios o ensayos en formato utilizados para revelar los perfiles de expresión del gen. Estos pueden comprender, por ejemplo, microarreglos en los cuales los complementos de secuencia o sondas se fijan a una matriz a la cual se combinan las secuencias indicativas de los genes de interés creando un determinante de su presencia que se puede leer.
Alternativamente, los artículos de conformidad con la invención pueden ser modelados hacia equipos reactivos para llevar a cabo la hibridización, amplificación, y generación de la señal indicativa del nivel de expresión de los genes de interés para detectar el cáncer de mama. Los equipos elaborados de conformidad con la invención incluyen ensayos en formato para la determinación de los perfiles de expresión del gen. Estos' pueden incluir todos o algunos de los materiales necesarios para llevar a cabo los ensayos tales como reactivos e instrucciones. La invención se ilustra adicionalmente por los siguientes ejemplos no limitantes. Todas las referencias citadas en la presente invención se incorporan aquí como referencias.
EJEMPLOS Los genes analizados de conformidad con esta invención típicamente están relacionados con las secuencias de ácidos nucleicos de longitud total que codifican para la producción de una proteína o péptido. Un experto en la técnica reconocerá que la identificación de las secuencias de longitud total no es necesaria desde un punto de vista analítico. Es decir, las porciones de las secuencias o ESTs se pueden seleccionar de conformidad con principios bien conocidos para los cuales se diseñan sondas para evaluar la expresión del gen para el gen correspondiente.
EJEMPL0 1 Manejo de la muestra y trabajo con microarreglo Los especímenes tumorales congelados a partir de los pacientes con LNN tratados durante 1980-1995, pero no tratados con la terapia sistémica neoadyuvante, se seleccionaron a partir de un banco tumoral de los inventores en the Erasmus Medical Center (Rotterdam, Países bajos). Todas las muestras tumorales se sometieron al laboratorio de referencia de los inventores a partir de 25 hospitales regionales para las mediciones del receptor de hormona esteroide. Las guías para el tratamiento primario fueron similares para todos los hospitales. Los tumores fueron seleccionados de manera que se evitaran ciertos sesgos. Suponiendo una pérdida sustancial del 25-30% de los tumores en 5 años debido a razones de control de calidad, se procesaron 436 muestras de tumor invasivo. Los pacientes con un resultado clínico malo, intermedio, y bueno fueron incluidos. Las muestras fueron rechazadas basándose en un contenido insuficiente de tumor (53), mala calidad del ARN (77) o mala calidad del fragmento (20) dejando 286 muestras elegibles para análisis adicional.
El protocolo de estudio se aprobó por el comité de ética médica institucional (MEC no. 02.953). Los pacientes de edad media en el momento de la cirugía (cirugía para conservación de glándula mamaria: 219 pacientes; mastectomía radical modificada: 67 pacientes) tuvieron 52 años (intervalo, 26-83 años). Se proporcionó radioterapia a 248 pacientes (87%) de conformidad con el protocolo institucional de los inventores. Las proporciones de pacientes que se sometieron la terapia para conservación de glándula mamaria y radioterapia son normales para la enfermedad LNN. Los pacientes se incluyeron sin importar el estado de la radioterapia, puesto que este estudio no pretendía investigar los efectos potenciales de un tipo específico de cirugía o radioterapia adyuvante. Además, los estudios han mostrado que la radioterapia no tiene un efecto claro sobre la recurrencia distante de la enfermedad. Ensayistas del cáncer de mama temprano (1995). La negatívidad en el nodulo linfático se basó en un examen patológico realizado por patólogos regionales. Foekens et al. (1989a). Antes de la inclusión, se confirmó que todas las 286 muestras tumorales tenían suficiente tumor (> 70%) y una participación uniforme del tumor en secciones congeladas de 5 µm teñidas con H & E. Los niveles de ER (y PgR) se midieron mediante ensayo de unión al ligando o inmunoensayo enzimático (EIA) (Foekens et al. (1989b)) o mediante inmunohistoquímica (en 9 tumores). Los valores límites utilizados para clasificar a los pacientes como positivos o negativos para ER y PR fueron 10 fmol/mg de proteína o 10% de células tumorales positivas.
El seguimiento postoperatorio implicó el examen cada 3 meses durante los primeros 2 años, cada 6 meses por 3 a 5 años, y cada 12 meses a partir del año 5. Los datos de diagnóstico de las metástasis se definieron como los datos de confirmación de la metástasis después de la presencia de síntomas reportados por el paciente, la detección de los signos clínicos, o en un seguimiento regular. El período de seguimiento medio de los pacientes sobrevivientes (n=198) fue de 101 meses (intervalo, 20-171). De los 286 pacientes incluidos, 93 (33%) mostró evidencia de metástasis distante dentro de los primeros 5 años y fueron contados como errores en el análisis de la supervivencia libre de metástasis distante (DMFS). Cinco pacientes (2%) murieron sin evidencia de enfermedad y fueron censados hasta su último seguimiento. Ochenta y tres pacientes (29%) murieron después de una recidiva previa. Por lo tanto, un total de 88 pacientes (31 %) fueron omitidos en el análisis de sobrevivencia general (OS).
EJEMPLO 2 Análisis de expresión génica de los datos obtenidos en el ejemplo 1 El ARN total se aisló a partir de 20 a 40 secciones de criostato de 30 µm de grosor (50-100 mg) con RNAzol B (Campro Scientific, Veenendaal, Países bajos). Los blancos biotinilados se prepararon utilizando métodos publicados (Affymetrix, CA, Lipshutz et ai. (1999)) y se hibridaron con el fragmento génico U133a del microarreglo de oligonucleótidos Affymetrix.
Los arreglos se seleccionaron utilizando protocolos estándares de Affymetrix. Cada serie de sondas se trató como un gene separado. Los valores de expresión se calcularon utilizando el software para análisis Affymetrix GeneChip MAS 5.0. Los fragmentos se rechazaron si su intensidad media era <40 o sí la señal de fondo era >100. Para normalizar las señales del fragmento, la serie de sondas fueron escaladas hasta una intensidad blanco de 600, y no se seleccionaron archivos con escala oculta.
EJEMPLO 3 Análisis estadístico de los genes identificados en el ejemplo 2 Los datos para expresión del gen se filtraron para incluir los genes denominados "presentes" en dos o más muestras. 17,819 genes pasaron este filtro y se utilizaron para agrupamiento jerárquico. Antes del agrupamiento, el nivel de expresión de cada gen se dividió por su nivel de expresión medio en los pacientes. Este paso de estandarización limitó el efecto de la magnitud de la expresión de los genes, y agrupó a los genes con patrones de expresión similares en el análisis de agrupamiento. Para identificar los subgrupos de pacientes, los inventores llevaron a cabo un agrupamiento jerárquico promedio de unión en ambos genes y en las muestras utilizando GeneSpring 60. Para identificar los genes que discriminan los pacientes que desarrollaron metástasis distante a partir de aquellos que permanecieron libres de metástasis por 5 años, los inventores utilizaron dos métodos supervisados de predicción de clase. En el primer método, se asignaron 286 pacientes al azar en poblaciones de entrenamiento y de prueba de 80 y 206 pacientes, respectivamente. Las curvas de supervivencia de Kaplan-Meier (Kaplan et al. (1958)) para las dos subpoblaciones se examinaron para asegurar que no había una diferencia significativa y que no se había introducido un sesgo por la selección al azar de las poblaciones de entrenamiento y de prueba. En el segundo método, los pacientes fueron asignados a uno de los grupos estratificados por el estado de ER (figuras 1A y 1 B). Se analizó cada subgrupo de pacientes separadamente con el objeto de seleccionar los marcadores. Los pacientes en el subgrupo positivo a ER fueron asignados al azar dentro de poblaciones de entrenamiento y de prueba de 80 y 129 pacientes, respectivamente. Los pacientes en el subgrupo negativo a ER se dividieron al azar en poblaciones de entrenamiento y de prueba de 35 y 42 pacientes, respectivamente. Los marcadores seleccionados a partir de cada subgrupo de la población de entrenamiento se combinaron para formar una marca particular para pronosticar la metástasis tumoral tanto para pacientes positivos a ER como para pacientes negativos a ER en una validación independiente subsecuente. El tamaño de la muestra de la población de entrenamiento se determinó mediante un método de re-muestreo para asegurar su nivel estadístico de confianza. Brevemente, el número de pacientes en la población de entrenamiento inició con 15 pacientes y se incrementó en pasos de 5. Para un tamaño de muestra dado, se realizaron 10 poblaciones de entrenamiento con pacientes seleccionados al azar. Una marca del gen se construyó a partir de cada una de las poblaciones de entrenamiento y posteriormente se evaluaron en una población diseñada para prueba de pacientes mediante análisis de curva de características de operación del receptor (ROC) con metástasis distante dentro de los primeros 5 años como el punto de definición. Se calcularon la media y el coeficiente de variación (CV) del área bajo la curva (AUC) para un tamaño de muestra dado. Un número mínimo de pacientes requerido para la población para entrenamiento se eligieron en el punto en que la AUC promedio alcanzó una meseta y el CV del 10 AUC estuvo por debajo de 5%. Los genes se seleccionaron como sigue. Primero, se utilizó regresión al azar proporcional univariada de Cox para identificar los genes a partir de los cuales se correlacionó la expresión (en esacala log2) con la longitud de DMFS. Para reducir el efecto de la evaluación múltiple y para evaluar la fuerza de los genes seleccionados, el modelo de Cox se elaboró con el registro de los pacientes en la población de entrenamiento. Efron et al. (1981). Brevemente, se llevaron a cabo 400 muestras de registro de la población de entrenamiento, cada una con 80 pacientes elegidos al azar con reemplazo. Se realizó un modelo de Cox en cada una de las muestras de registro. Se creó una evaluación de registro para cada gen mediante la remoción de 5% de la parte superior e inferior de los valores p y luego promediando las inversas de los valores de registro remanentes. Esta evaluación se utilizó para clasificar los genes. Para elaborar una marca de múltiples genes, se evaluaron las combinaciones de marcadores del gen mediante la adición de un gen en un momento de conformidad con el orden de clasificación. Se llevó a cabo el análisis ROC utilizando metástasis distante dentro de los primeros 5 años como el punto de definición para calcular el área bajo AUC para cada marca con números en incremento de genes hasta que se alcanzó un valor AUC máximo. Se utilizó la evaluación de recidiva (RS) para calcular el riesgo de cada paciente de metástasis distante. La evaluación se definió como la combinación lineal de las señales de expresión evaluadas con el coeficiente de regresión estandarizado de Cox como la base.
Evaluación d e re cidiva = A - 1 -+ Y".] - w; x . + B - ( 1 ~ f) + Y^ (l — ]) - . x . en donde Í ] Si el nivel d&l (jen X > 1 Q 0 Si el nivel del yen X = 10 A y B son constantes wi es el coeficiente de regresión de Cox estandarizado para el gen X + marcador xi es el valor de expresión de ER + el marcador en escala log2 wj es el coeficiente de regresión de Cox estandarizado para el gen X - marcador xj es el valor de expresión de ER-marcador en la escala log2 El umbral se determinó a partir de la curva ROC de la población de entrenamiento para asegurar el 100% de sensibilidad y la mayor especificidad. Los valores de las constantes A de 313.5 y B de 280 se eligieron para centrar el umbral de RS a cero tanto para ambos pacientes ER-positivos como para pacientes ER-negativos. Los pacientes con evaluaciones positivas a RS se clasificaron dentro del grupo de prognosis mala y los pacientes con evaluaciones negativas a RS se clasificaron dentro del grupo de prognosis buena. La marca del gen y el limite se validaron en la población para prueba. Las gráficas de supervivencia de Kaplan-Meier y las pruebas de clasificación log se utilizaron para evaluar las diferencias en el momento de la metástasis distante de los grupos pronosticados con alto y bajo riesgo. Se calcularon las relaciones por desigualdad (OR), la relación de las desigualdades de metástasis distante entre los pacientes pronosticados para recidiva y aquellos pronosticados para permanecer libres de recidiva. Los análisis univariables y multivariables con la regresión al azar proporcional de Cox se llevaron a cabo en las variables clínicas individuales con y sin la marca del gen. La HR y su intervalo de confianza de 95% (Cl) se derivaron a partir de estos resultados. Todos los análisis estadísticos se llevaron a cabo utilizando el software S-Plus 6.1 (Insightful, VA).
EJEMPLO 4 Análisis de la ruta de los genes identificados en el ejemplo 3 Se asignó una clase funcional a cada uno de los genes en el gen de marca para pronóstico. El análisis de la ruta se realizó con el software Ingenuity 1.0 (Ingenuity Systems, CA). Las sondas Affymetrix se utilizaron como la base para la búsqueda de redes biológicas elaboradas por el software. Las redes biológicas identificadas por el programa se evaluaron en el contexto de las clases funcionales generales mediante clasificación de ontología GO. Se seleccionaron y evaluaron las rutas con dos o más genes en la marca para pronóstico.
EJEMPLO 5 Resultados para los ejemplos 1-4 Pacientes y características del tumor Las características clínicas y patológicas de los 286 pacientes se resumen en el cuadro 1.
CUADRO 1 Características clínicas y patológicas de los pacientes y sus tumores *ER-positivo y PgR positivo: > 10 fmol/mg protein o > 10% de células tumorales positivas. No se encuentran diferencias en la edad o en el estado menopáusico. El grupo de entrenamiento negativo a ER tiene una proporción ligeramente mayor de tumores más grandes y, como se espera, más tumores grado malo que el grupo de entrenamiento positivo a ER. El grupo de validación de 171 pacientes (129 ER-positívo, 42 ER-negativo) no difiere del grupo total de 286 pacientes con respecto a cualesquiera de los pacientes o características del tumor. utilizaron dos métodos para identificar a los marcadores de pronóstico de la recidiva de la enfermedad. Primero, los inventores dividieron a todos los 286 pacientes (ER-positivo y ER-negativo combinados) en una población de entrenamiento y una población de prueba. Se seleccionaron treinta y cinco a partir de 80 pacientes en la población para entrenamiento y se realizó un modelo de Cox para pronosticar la urgencia de metástasis distante. Se observó un valor pronóstico moderado. Cuadro 2. El análisis de agrupamiento no supervisado mostró dos subgrupos distintos altamente correlacionados con el estado del tumor ER (prueba de chi cuadrada p < 0.0001 ). La figura 1 B, la cual apoyó el segundo método en el cual los pacientes se colocaron inicialmente dentro de subgrupos basándose en el estado ER.
CUADRO 2 Cada subgrupo se analizó con el objeto de seleccionar los marcadores. Se seleccionaron setenta y seis genes a partir de los pacientes en las poblaciones para entrenamiento (60 para el grupo positivo a ER, 16 para el grupo negativo a ER) (figura 2A, izquierda). Tomando juntos los genes seleccionados y el estado ER, se elaboró un modelo de Cox para pronosticar la recurrencia del cáncer para todos los pacientes con LNN. La validación de los 76 genes pronóstico en la población de los 171 pacientes para prueba produjo una ROC con un valor AUC de 0.694, sensibilidad de 93% (52/56), y especificidad de 48% (55/115) (figura 2A, derecha). Los pacientes con una evaluación de recidiva por arriba del umbral de la marca de pronóstico tienen un OR DE 119 veces (95% Cl: 4.04-35.1 ; p<0.0001) para desarrollar metástasis distante dentro de los primeros 5 años. Como un control, se generaron poblaciones de 76 genes seleccionados al azar. Esto produjo ROC con un valor AUC promedio de 0.515, sensibilidad de 91 %, y especificidad de 12% en el grupo para prueba. Los pacientes que se estratificaron mediante dicha población de genes podrían tener una relación por desigualdad de 1.3 (0.50-3. 90; p=0.8) para el desarrollo de metástasis, indicando una clasificación al azar. Además, el análisis de Kaplan-Meier para la supervivencia libre de metástasis distante (DMFS) y la supervivencia general (OS) como una función de la marca de 76 genes mostraron diferencias altamente significativas en ei tiempo para la formación de metástasis entre los grupos que se pronostica que tendrán una buena prognosis y, una mala prognosis (figuras 2A - 2A' y 2B - 2B'). A los 60 y 80 meses, las diferencias absolutas respectivas en DMFS entre los grupos que se pronostican con buena y mala prognosis fueron de 40% (93% contra 53%) y 39% (88% contra 49%) y aquellas en OS fueron de 27% (97% contra 70%) y 32% (95% contra 63%), respectivamente. El perfil de 76 genes también representó un factor pronóstico fuerte para ei desarrollo de la metástasis distante en los subgrupos de 84 pacientes premenopaúsicos (HR: 9.60), 87 pacientes postmenopaúsicos (HR: 4.04) y 79 pacientes con tamaños tumorales de 10 a 20 mm (HR: 14.1) (figuras 3A - 3A", 3B - 3B' y 3C - 3C). Los análisis univariables y multivariables de regresión de Cox se resumen en el cuadro 3.
CUADRO 3 Análisis Uni- y multivariable para DMFS en el grupo para evaluación de 171 pacientes con LNN *el modelo multivariable incluyó 162 pacientes, debido a la ausencia de valores en 9 pacientes t relación al azar y 95% de intervalo de confianza íedad es <40 años, edad2 es 41 a 55 años, edad3 es 56 a 70 años, edad4 es > 70 años §Post-menopáusica contra pre-menopáusica || Stage: II & lll contra I IpGrado: moderado/bueno contra malo, grado desconocido se incluyó como un grupo separado **tamaño tumoral: > 20 mm contra < 20 mm ttpositivo contra negativo De manera diferente a la marca de 76 genes, solamente el grado fue importante en ei análisis univariables y la diferenciación moderada/buena se asoció con DMFS favorable. La estimación de la regresión multivariable de HR para la recurrencia de la metástasis tumoral dentro de los primeros 5 años fue de 5.55 (p < 0.0001 ), indicando que la población de 76 genes representa una marca para pronóstico independiente fuertemente asociada con un mayor riesgo de formación de metástasis tumoral. Los análisis univariables y multivariable también se realizaron separadamente para los pacientes positivos a ER y los pacientes negativos a ER pacientes. La marca de 76 genes también fue una variable para pronóstico independiente en los subgrupos estratificados por el estado ER.
La función de los 76 genes (cuadro 4) en la marca para pronóstico se analizó para relacionar los genes con las rutas biológicas. CUADRO 4 Aunque 18 de los 76 genes tiene una función desconocida, se identificaron varias rutas o actividades bioquímicas que estaban bien representadas tales como la muerte celular, el ciclo celular y la proliferación, la replicación de ADN y ia reparación y la respuesta inmune (cuadro 5).
CUADRO 5 Ruta de análisis de los 76 genes a partir de la marca de pronóstico Se encontraron los genes implicados en el progreso de la enfermedad incluyendo calpain2, la proteína de reconocimiento del origen, las fosfatasas con especificidad dual, el inhibidor de la disociación Rho-GDP, la proteína de la superfamilia TNF, el componente del complemento 3, la proteína asociada a microtúbulos, la proteína fosfatasa 1 y el regulador de la apoptosis BCL-G. Además, los genes pronósticos previamente caracterizados tales como ciclina E2 (Keyomarsi et al. (2002)) y CD44 (Herrera-Gayol et al. (1999)) estuvieron en la marca de genes.
EJEMPLO 6 Discusión para los ejemplos 1-5 Los inventores proveen los resultados de un análisis de tumores primarios para 286 pacientes con cáncer de mama negativo a nodulo linfático para grupos de todas las edades y de todos los tamaños tumorales. Los pacientes no recibieron terapia sistémica adyuvante, de manera que la evaluación para múltiples genes de la prognosis no se sometió a complicaciones que potencialmente podrían confundir por los factores para pronóstico relacionados con el tratamiento sistémico. El estudio reveló una marca de 76 genes que pronostica de manera precisa la recurrencia del tumor distante. Esta marca es aplicable a todos los pacientes con cáncer de mama LNN independientemente de la edad, tamaño del tumor y grado de estado ER. En el análisis multivariable de Cox para DMFS la marca de 76 genes fue la única variable significativa, sustituyendo las variables clínicas, incluyendo el grado. Después de 5 años, las diferencias absolutas en DMFS y OS entre los pacientes con las marcas de 76 genes buenas y malas fueron 40% y 27%, respectivamente. De los pacientes con buenas marcas de pronóstico, 7% desarrolló metástasis distante y 3% murió dentro de los siguientes 5 años. Su se validaba adicionalmente, esta marca de pronóstico producía un valor de pronóstico positivo de 37% y un valor de pronóstico negativo de 95%, suponiendo una relación de 25% de la recurrencia del enfermedad en los pacientes con LNN. En particular, la marca puede ser valiosa para definir el riesgo de recurrencia para la proporción en incremento de tumores T1 (< 2cm). La comparación con las guías de St Gallen y NIH fue ilustrativa. Aunque se asegura que el mismo número de pacientes con alto riesgo podría recibir el tratamiento necesario, la marca de 76 genes de los inventores podría recomendar una quimioterapia adyuvante sistémica a solamente 52% de los pacientes con bajo riesgo, en comparación con 90% y 89% en comparación con las guías de St Gallen y NIH, respectivamente (cuadro 6).
CUADRO 6 Comparación de la marca de 76 genes y la marca consenso convencional actual sobre el tratamiento del cáncer de mama Los criterios convencionales consenso. St. Gallen: tumor > 2cm, ER-negativo, grado 2-3, paciente < 35 años (cualquiera de estos criterios); NIH: tumor > 1 cm. La marca de 76 genes puede resultar así en una reducción dei número de pacientes con bajo riesgo con LNN acerca de los cuales se podría recomendar que no se sometieran necesariamente a terapia sistémica adyuvante. Los 76 genes en la marca pronóstico que pertenece a muchas clases funcionales, sugiere que diferentes rutas pueden llevar al progreso de la enfermedad. La marca incluyó genes bien caracterizados y 18 genes desconocidos. Este hallazgo podría explicar el desempeño superior de esta marca en comparación con otros factores pronósticos. Aunque los genes implicados en la muerte celular, proliferación celular, y regulación transcripcional se encontraron en ambos grupos de pacientes estratificados por el estado ER, los 60 genes seleccionados para el positivo a ER y los 16 genes seleccionados para el grupo negativo a ER no se superpusieron. Este resultado apoya la idea de que el grado de heterogeneidad y los mecanismos subyacentes para la progresión de la enfermedad podrían diferir en los subgrupos basados en ER de los pacientes con cáncer de mama. La comparación de los resultados obtenidos por los inventores con aquellos resultados obtenidos en el estudio realizado por van de Vijver et al. (2002) es difícil debido a las diferencias en los pacientes, técnicas y materiales utilizados, van de Vijver et al. incluyeron tanto pacientes nodulo negativos como nodulo positivos, los cuales habían recibido o no terapia sistémica adyuvante, y solamente mujeres menores de 53 años. Además, las plataformas de los microarreglos utilizadas en los estudios son diferentes, Affymetrix contra Agilent. De los 70 genes del estudio de van't Veer (2002), solamente 48 están presentes en el arreglo Affymetrix U133a, mientras que de los 76 genes de los inventores solamente 38 están presentes en el arreglo Agilent. Existe una superposición de 3 genes entre las dos marcas (ciclina E2, complejo de reconocimiento del origen, y proteína de la superfamilia TNF). Sin importar la diferencia aparente, ambas marcas incluyeron genes que identificaron varias rutas comunes que pueden participar en una recurrencia del tumor. Este hallazgo apoya la idea de que aunque puede haber una redundancia en los genes miembros, se podrían requerir marcas efectivas para incluir la representación de rutas específicas. Las fortalezas del estudio realizado por los inventores en comparación con el estudio de van de Vijver et al. (2002) son el mayor número de pacientes no tratados con LNN (286 contra 141 ), y la independencia de la marca de 76 genes con respecto a la edad, estado menopáusico, y tamaño del tumor. La población de pacientes para validación no se superpone con la población de entrenamiento en contraste con 90% de otros reportes. Ransohoff (2004). En conclusión, puesto que solamente aproximadamente 30-40% de los pacientes no tratados con LNN desarrollaron recurrencia tumoral, la marca de pronóstico podría proveer una herramienta poderosa para identificar a aquéllos pacientes con bajo riesgo para prevenir el sobre tratamiento en un número sustancial de pacientes. La recomendación de terapia sistémica adyuvante en pacientes con cáncer de mama primario podría ser guiada en el futuro por esta marca de pronóstico. El valor predictivo de la marca de genes de los inventores con respecto a la eficiencia de los diferentes modos de terapia sistémica podria ser evaluado en la población para uso de adyuvante o en pacientes con enfermedad metastásica.
EJEMPLO 7 Comparación del perfil de genes para el tumor de mama generado a partir de microdisección por captura láser y masa del tejido en el cáncer de mama en etapa l/ll El perfilamiento de la expresión de genes se ha mostrado que es una herramienta diagnóstica y pronostica poderosa para una variedad de tipos de cáncer. Casi exclusivamente en todos los casos se utilizó el ARN de la masa tumoral para la hibridación sobre el fragmento. Los estrógenos desempeñan papeles importantes en el desarrollo y crecimiento de los tumores dependientes de hormonas. Alrededor del 75% de los cánceres de mama expresan el receptor de estrógeno (ER), el cual es un indicador para el tratamiento con tamoxifén (adjuvante) y se asocia con los resultados del paciente. Para tratar de descubrir los mecanismos activados por el estrógeno en las células epitelial de la mama y su asociación con la tumorigénesis, se utilizó la microdisección por captura láser (LCM) para procurar poblaciones histológicamente homogéneas de células tumorales a partir de 29 tumores de mama primarios en etapa temprana, en combinación con el análisis de expresión en GeneChip. De estos 29 pacientes, 11 fueron ER-negativos y 17 fueron ER-positivos basándose en la unión cuantitativa al ligando o los inmunoensayos enzimáticos sobre los citosoles tumorales. La comparación, perfilamiento de la expresión de gen también se obtuvo utilizando ARN de la masa del tejido aislado a partir del mismo grupo de 29 pacientes. Las muestras recientemente obtenidas del tejido congelado se recolectaron a partir de 29 pacientes con cáncer de mama nodulo linfático negativos (para características del tumor, cuadro 2) los cuales habían sido quirúrgicamente tratados para un cáncer de mama y no habían recibido terapia sistémica neoadyuvante. Para cada muestra de tejido del paciente, los inventores inicialmente utilizaron la tinción de las secciones con H & E para evaluar la morfología celular. El ARN se aisló a partir de ambas células tumorales obtenidas mediante LCM (PALM) que se llevó a cabo sobre secciones obtenidas por el criostato y a partir de secciones completas obtenidas por el criostato, por ejemplo, masa de tejido del mismo tumor. Se analiza la calidad de la muestra de ARN mediante un Agilent BioAnalyzer. Las muestras de ARN se hibridaron a un fragmento U133A Affymetrix de humano que contenía aproximadamente 22,000 series de sondas. Se cuantificó la fluorescencia y las intensidades fueron normalizadas. El análisis por agrupamiento y el análisis de componentes principales se utilizaron para agrupar a los pacientes con perfiles de expresión génica similares. Se seleccionaron los genes que se expresan de manera diferencial entre las muestras ER-positivas y ER-negativas. El ARN total aislado a partir de LCM produjo células de cáncer de mama que se sometieron a dos rondas de amplificación basada en T7 en la preparación del blanco, contra una ronda de amplificación con el ARN de la masa de tejido. Se compararon los niveles de expresión de 21 genes control (cuadro 7) entre la serie de datos LCM y la serie de masa de tejido para demostrar la fidelidad de la amplificación lineal.
CUADRO 7 Lista de genes de control Los resultados obtenidos se ilustran en el cuadro 8 y en las figuras 4-9.
CUADRO 8 Características clínicas de los pacientes La figura 4 es un agrupamiento jerárquico basado en 5121 genes y muestra que LCM y las muestras de masa de tejido están completamente separadas basándose en los perfiles de expresión global del ARN. La figura 5 es una gráfica de barras que ilustra los niveles de expresión de los 21 genes control (cuadro 6) en aislados de ARN a partir de las muestras LCM y de la masa de tejidos y muestra que una ronda adicional de amplificación lineal utilizada para el ARN obtenidas mediante LCM no ocasiona una expresión diferencial de los genes control. La figura 6 es una ruta de análisis de datos y la figura 7 muestra el análisis PCA con series de genes para filtración. La figura 8 es una gráfica en rebanadas en donde el estado ER se utilizó para asignar los subgrupos del paciente. Los genes expresados de manera diferencial entre sub-agrupamientos ER-positivos y ER-negativos en ambas muestras LCM y de masa de tejido se definieron mediante la prueba T de Student. La figura 9 es una serie de gráficas de barras que muestran los resultados de la ruta de análisis mediante la ontología del gen para los genes exclusivamente asociados con ER en las muestras de LCM, exclusivamente en la masa de tejido, y para aquellos que son comunes en ambos LCM y masa de tejido. En resumen, los resultados obtenidos muestran varias conclusiones importantes. Primero, se observó que los genes relacionados con la proliferación celular y el metabolismo energéticos se expresaban de manera diferencial en pacientes ER-/ER+ tanto en la serie de datos de masa de tejido como en la serie de datos LCM. Segundo, debido al enriquecimiento de células del cáncer de mama vía LCM, se encontró que los genes implicados en la transducción de la señal asociada al receptor de superficie celular, transducción de la señal RAS, transducción de la señal JAK-STAT y apoptosis se asocian con el estado ER. Estos genes no se identificaron en la serie de datos en masa. En tercer lugar, la microdisección provee un método sensible para el estudio de las células tumorales epiteliales y una mejor comprensión hacia la ruta de señalización asociada con los receptores de estrógeno. Por lo tanto, es evidente que la aplicación de perfil de expresión del gen descrito en la presente invención para las células tumorales aisladas LCM es igual a los resultados obtenidos en la masa de tejido heterogéneo.
EJEMPLO 8 Validación y ruta de análisis de la marca para pronóstico de 76 genes en el cáncer de mama Este ejemplo reporta los resultados de un estudio de validación en el cual la marca de 76 genes se utilizó para pronosticar los resultados de 132 pacientes obtenidos a partir de 4 fuentes independientes. Además, con el objeto de evaluar las fortalezas de esta marca de genes, este ejemplo provee adicionalmente la identificación de componentes sustituibles de la marca y describe cómo las sustituciones llevan a la identificación de las rutas clave en una marca efectiva. Las muestras recientemente obtenidas de tejido congelado se recolectaron a partir de 132 pacientes los cuales habían sido tratados quirúrgicamente para un tumor de mama y no habían recibido terapia sistémica adyuvante. Las muestras utilizadas de los pacientes fueron recolectadas entre 1980 y 1996 (figura 10). Para cada muestra de tejido del paciente, se utilizó una sección teñida con H & E para evaluar la morfología celular. Luego se prepararon muestras de ARN total y la calidad de la muestra se realizó mediante Agilent BioAnalyzer. Las muestras de ARN se analizaron mediante análisis de microarreglo. La fluorescencia se cuantificó y las intensidades se normalizaron. Se calculó una evaluación al azar de recidiva para cada paciente basándose en los niveles de expresión de la marca de 76 genes. Los pacientes se clasificaron en grupos con resultados buenos y malos. Figuras 11 y 12. Con el objeto de evaluar la fortaleza de esta marca de genes, se diseñaron y utilizaron dos análisis estadísticos. Las figuras 13A y 13B. Primero, se repitieron los procedimientos de selección de genes y construcción de la marca que se utilizaron para descubrir la marca de 76 genes. Como se muestra en el cuadro 8, diez poblaciones para entrenamiento de 115 pacientes cada una se seleccionaron al azar a partir del total de 286 pacientes. Los pacientes remanentes fueron colocados en la población para evaluación. En segundo lugar, el número de pacientes en la población para entrenamiento se incrementó a 80% de los 286 pacientes y se utilizó el remanente 20% de los pacientes como la población para evaluación. Este procedimiento de selección también se repitió 10 veces. En ambos procedimientos, se utilizaron las curvas de supervivencia de Kaplan-Meier para asegurar que no se presentaban diferencias significativas en la supervivencia libre de enfermedad entre los pares para entrenamiento y para prueba. Se seleccionaron los genes y se construyó una marca a partir de cada una de las poblaciones para entrenamiento utilizando la regresión al azar proporcional de Cox. Cada marca se validó en la población de evaluación correspondiente. Además, la marca para pronóstico de 76 genes se asignó en grupos funcionales utilizando la clasificación de ontología GO. Se seleccionaron las rutas que abarcan números significativos de genes en la marca (valor p < 0.05 y > 2 coincidencias). Las rutas seleccionadas también fueron evaluadas en todas las marcas para pronóstico derivadas a partir de diferentes poblaciones para entrenamiento. En el cuadro 9, A. contiene los resultados a partir de las 10 marcas utilizando series para entrenamiento de 115 pacientes y B. contiene los resultados a partir de 10 marcas utilizando series para entrenamiento de 80% de los pacientes.
Los resultados obtenidos en este ejemplo muestran que: • La marca de 76 genes se validó de manera exitosa en 132 pacientes independientes, produciendo valor AUC de 0.757 en los 132 pacientes con cáncer de mama LNN a partir de 4 fuentes independientes. La marca muestra un 88% de sensibilidad y un 41% de especificidad. • La AUC promedio para las marcas sustituías es de 0.64 (95% Cl: 0.53-0. 72). Este resultado es consistente con aquel obtenido a partir del pronóstico de 76 genes (AUC de 0.69). También se encontraron veintiún rutas sobre-representadas en la marca de 76 genes en todas las otras marcas de pronóstico, sugiriendo que rutas biológicas comunes están implicadas en la recurrencia del tumor. • Estos resultados sugieren que los perfiles de expresión del gen proveen un método poderoso para llevar a cabo la evaluación de riesgo del resultado del paciente. Los datos destacan la posibilidad de un ensayo pronóstico molecular que provee a los pacientes con una medición cuantitativa de recidiva del tumor. Aunque se ha descrito la invención precedente con cierto detalle a manera de ilustración y ejemplo para propósitos de claridad en el entendimiento, las descripciones y ejemplos no deben considerarse como limitantes del alcance de la invención.
CUADRO 10 Identificación de la secuencia co o 00 oo t oo 00 oo Ul oo 00 oo oo o o o VO vo O VO t vo ON VO VO OO vo VO o o o o o o o ON o o oo o VO ? ON o VO o Referencias citadas Ahr et al. (2002) "Identification of high risk breast-cancer patients by gene-expression profiling" Lancet 359: 131-132 Chang et al. (2003) "Gene expressíon profiling for the prediction of therapeutic response to docetaxel in patients with breast cáncer" Lancet 362: 362-9 Early Breast Cáncer Trialists' Collaborative Group (1995) "Effects of radiotherapy and surgery ¡n early breast cáncer. An overview of the randomized triáis" N Engl J Med 333: 1444-1455 Early Breast Cáncer Trialists' Collaborative Group (1998a) "Polychemotherapy for early breast cáncer: an overview of the randomized triáis" Lancet 352: 930-942 Early Breast Cáncer Trialists' Collaborative Group (1998b) "Tamoxifen for early breast cáncer: an overview of randomized triáis" Lancet 351 : 1451-1467 Efron (1981 ) "Censored data and the bootstrap" J Am Stat Assoc 76: 312-319 Eifel et al. (2001) "National Institutes of Health Consensus Development Conference Statement: adjuvant therapy for breast cáncer, November 1-3, 2000" J Nati Cáncer Inst 93: 979-989 Foekens et al. (1989b) "Prognostic valué of estrogen and progesterone receptors measured by enzyme immunoassays in human breast tumor cytosols" Cáncer Res 49: 5823-5828 Foekens et al. (1989a) "Prognostic valué of receptors for insulin-like growth factor 1 , somatostatin, and epidermal growth factor in human breast cáncer" Cáncer Res 49: 7002-7009 Goldhirsch et al. (2003) "Meeting highllghts: Updated International Expert Consensus on the Primary Therapy of Early Breast Cáncer" J Clin Oncol 21 : 3357-3365 Golub et al. (1999) "Molecular classification of cáncer: class discovery and class prediction by gene expression monitoring" Science 286: 531-537 Gruvberger et al. (2001 ) "Estrogen receptor status in breast cáncer is associated with remarkably distinct gene expression patterns" Cáncer Res 61 : 5979-5984 Hedenfalk et al. (2001 ) "Gene-expression profiles ¡n hereditary breast cáncer" N Engl J Med 344: 539-548 Herrera-Gayol et al. (1999) "Adhesión proteins in the biology of breast cáncer: contribution of CD44" Exp Mol Pathol 66: 149-156 Huang et al. (2003) "Gene expression predictors of breast cáncer outcomes" Lancet 361 : 1590-1596 Kaplan et al. (1958) "Non-parametric estimation of incomplete observations" J Am Stat Assoc 53: 457-481 Keyomarsi et al. (2002) "Cyclin E and survival in patients with breast cáncer" N Engl J Med 347: 1566-1575 Lipshutz et al. (1999) "High density synthetic oligonucleotide arrays" Nat Genet 21 : 20-24 Ma et al. (2003) "Gene expression profiles of human breast cáncer progression" Proc Nati Acad Sci USA 100: 5974-5979 Ntzaní et al. (2003) "Predictive ability of DNA microarrays for cáncer outcomes and correlates: an empirical assessment" Lancet 362: 1439-1444 Perou et al. (2000) "Molecular portraits of human breast tumors" Nature 406: 747-752 Ramaswamy et al. (2001 ) "Multiclass cáncer diagnosis using tumor gene expression signatures" Proc Nati Acad Sci USA 98: 15149-15154 Ramaswamy et al. (2003) "A molecular signature of metástasis in primary solid tumors" Nat Genet 33: 1-6 Ransohoff (2004) "Rules of evidence for cáncer molecular-marker discovery and validation" Nat Rev Cáncer 4: 309-314 S0rlie et al. (2001 ) "Gene expression patterns of breast carcinomas distinguish tumor subclasses with clinicalimplications" Proc Nati Acad Sci USA 98: 10869-10874 S0rlie et al. (2003) "Repeated observation of breast tumor subtypes in independent gene expression data sets" Proc Nati Acad Sci USA 100: 8418-8423 Sotiriou et al. (2003) "Gene expression profiles derived from fine needle aspiration correlate with response to systemic chemotherapy in breast cáncer" Breast Cáncer Res 4: R3 Sotiriou et al. (2003) "Breast cáncer classification and prognosis based on gene expression profiles from a population-based study" Proc Nati Acad Sci USA 100: 10393-10398 Su et al. (2001) "Molecular classification of human carcinomas by use of gene expression signatures" Cáncer Res 61 : 7388-7393 van de Vijver et al. (2002) "A gene expression signature as a predictor of survival in breast cáncer" N Engl J Med 347: 1999-2009 van't Veer et al. (2002) "Gene expression profiling predicts clinical outcome of breast cáncer" Nature 415: 530-536 Wang et al. (2004) "Gene expression profiles and molecular markers to predict recurrence of Dukes' B colon cáncer" J Clin Oncol 22: 1564-1571 Woelfle et al. (2003) "Molecular signature associated with bone marrow micrometastasis in human breast cáncer" Cáncer Res 63: 5679-5684

Claims (73)

NOVEDAD DE LA INVENCIÓN REIVINDICACIONES
1.- Un método para la evaluación del estado del cáncer de mama que comprende los pasos de a. obtención de una muestra biológica a partir de un paciente con cáncer de mama; y b. medir los niveles de expresión en la muestra de genes seleccionados a partir del grupo que consiste de aquellos que codifican ARNm: i. que corresponden a SEQ ID NOs: 1-111 ; o ii. reconocidos por la serie de sondas seleccionadas a partir del grupo que consiste de psids que corresponden a SEQ ID NOs: 1-111 como se ilustra en el cuadro 10 en donde los niveles de expresión del gen por arriba o por debajo de los niveles límite pre-determinados son indicativos del estado de cáncer de mama.
2.- Un método para clasificar en etapas a los pacientes con cáncer de mama que comprende los pasos de a. obtención de una muestra biológica a partir de un paciente con cáncer de mama; y b. medir los niveles de expresión en la muestra de genes seleccionados a partir del grupo que consiste de aquellos que codifican ARNm: i. que corresponden a SEQ ID NOs: 1-111 ; o ii. reconocidos por la serie de sondas seleccionadas a partir del grupo que consiste de psids que corresponden a SEQ ID NOs: 1-111 como se ilustra en el cuadro 10 en donde los niveles de expresión del gen por arriba o por debajo de los niveles límite pre-determinados son indicativos de la etapa del cáncer de mama.
3.- El método de conformidad con la reivindicación 2, caracterizado además porque la etapa corresponde a la clasificación por el sistema TNM.
4.- El método de conformidad con la reivindicación 2, caracterizado además porque la etapa corresponde a pacientes con perfiles de expresión del gen similares.
5.- Un método para la determinación del protocolo de tratamiento para el paciente con cáncer de mama que comprende los pasos de a. obtención de una muestra biológica a partir de un paciente con cáncer de mama; y b. medir los niveles de expresión en la muestra de genes seleccionados a partir del grupo que consiste de aquellos que codifican ARNm: i. que corresponden a SEQ ID NOs: 1-111 ; o ¡i. reconocidos por la serie de sondas seleccionadas a partir del grupo que consiste de psids que corresponden a SEQ ID NOs: 1-111 como se ilustra en el cuadro 10 en donde los niveles de expresión del gen por arriba o por debajo de los niveles límite pre-determinados son indicativos adecuados del riesgo de recurrencla para permitir que un médico determine el grado y tipo de terapia recomendados para prevenir la recurrencia.
6.- Un método para el tratamiento de un paciente con cáncer de mama que comprende los pasos de: a. obtención de una muestra biológica a partir de un paciente con cáncer de mama; y b. medir los niveles de expresión en la muestra de genes seleccionados a partir del grupo que consiste de aquellos que codifican ARNm: i. que corresponden a SEQ ID NOs: 1-1 11 ; o ¡i. reconocidos por la serie de sondas seleccionadas a partir del grupo que consiste de psids que corresponden a SEQ ID NOs: 1-111 como se ¡lustra en el cuadro 10 en donde los niveles de expresión del gen por arriba o por debajo de los niveles límite pre-determinados son indicativos de un alto riesgo de recurrencia y; c. del tratamiento del paciente con terapia adyuvante si éstos son pacientes con alto riesgo.
7.- El método de conformidad con la reivindicación 1 , 2, 5 ó 6, caracterizado además porque las SEQ ID NOs. son 1-35.
8.- El método de conformidad con la reivindicación 1 , 2, 5 ó 6, caracterizado además porque las SEQ ID NOs. son 36-95.
9.- El método de conformidad con la reivindicación 8, caracterizado además porque se utiliza para proveer una prognosis para pacientes positivos a ER.
10.- El método de conformidad con la reivindicación 1 , 2, 5 ó 6, caracterizado además porque las SEQ ID NOs. son 96-111.
11.- El método de conformidad con la reivindicación 10, caracterizado además porque se utiliza para proveer una prognosis para pacientes negativos a ER.
12.- El método de conformidad con la reivindicación 1 , 2, 5 ó 6, caracterizado además porque las SEQ ID NOs. son 36-111.
13.- El método de conformidad con la reivindicación 1 , 2, 5 ó 6, caracterizado además porque la muestra se prepara mediante un método seleccionado a partir del grupo que consiste de preparación de masa de tejido y microdisección por captura láser.
14.- El método de conformidad con la reivindicación 13, caracterizado además porque la preparación de masa de tejido se obtiene a partir de una biopsia o de un espécimen quirúrgico.
15.- El método de conformidad con la reivindicación 1 , 2, 5 ó 6, caracterizado además porque comprende adicionalmente la medición del nivel de expresión de al menos un gen que codifica ARNm: i. que corresponden a SEQ ID NOs: 112-132; o ii. reconocidos por la serie de sondas seleccionadas a partir del grupo que consiste de psids que corresponden a SEQ ID NOs: 112-132 como se ilustra en el cuadro 10.
16.- El método de conformidad con la reivindicación 1 , 2, 5 ó 6, caracterizado además porque comprende adicionalmente la medición del nivel de expresión de al menos un gen constitutivamente expresado en la muestra.
17.- El método de conformidad con la reivindicación 1 , 2, 5 ó 6, caracterizado además porque comprende adicionalmente la determinación del estado del receptor de estrógeno (ER) de la muestra.
18.- El método de conformidad con la reivindicación 17, caracterizado además porque el estado del ER se determina mediante la medición del nivel de expresión de al menos un gen indicativo del estado del ER.
19.- El método de conformidad con la reivindicación 17, caracterizado además porque el estado del ER se determina mediante la medición de la presencia del ER en la muestra.
20.- El método de conformidad con la reivindicación 19, caracterizado además porque la presencia del ER se mide inmunohistoquímicamente.
21.- El método de conformidad con la reivindicación 1 , 2, 5 ó 6, caracterizado además porque la muestra se obtiene a partir de un tumor primario.
22.- El método de conformidad con la reivindicación 1 , 2, 5 ó 6, caracterizado además porque la especificidad es de al menos aproximadamente 40%.
23.- El método de conformidad con la reivindicación 1 , 2, 5 ó 6, caracterizado además porque la sensibilidad es de al menos aproximadamente 90%.
24.- El método de conformidad con la reivindicación 1 , 2, 5 ó 6, caracterizado además porque el patrón de expresión de los genes se compara con un patrón de expresión indicativo de un paciente con recidiva.
25.- El método de conformidad con la reivindicación 24, caracterizado además porque la comparación de los patrones de expresión se lleva a cabo con métodos de reconocimiento del patrón.
26.- El método de conformidad con la reivindicación 25, caracterizado además porque los métodos de reconocimiento del patrón incluyen el uso de un análisis proportional al azar de Cox.
27.- El método de conformidad con la reivindicación 1 , 2, 5 ó 6, caracterizado además porque los niveles límite pre-determinados están al menos 1.5 veces por arriba o por debajo de la expresión en la muestra en relación con las células benignas o con el tejido normal.
28.- El método de conformidad con la reivindicación 1 , 2, 5 ó 6, caracterizado además porque los niveles límite pre-determinados tienen al menos una sobre-expresión del valor p estadísticamente significativa en la muestra que tiene células metastáticas en relación con las células benignas o con el tejido normal.
29.- El método de conformidad con la reivindicación 28, caracterizado además porque el valor p es menor de 0.05.
30.- El método de conformidad con la reivindicación 1 , 2, 5 ó 6, caracterizado además porque la expresión génica se mide en un microarreglo o fragmento génico.
31.- El método de conformidad con la reivindicación 21 , caracterizado además porque el microarreglo es un arreglo de ADNc o un arreglo de oligonucleótidos.
32.- El método de conformidad con la reivindicación 21 , caracterizado además porque el microarreglo o fragmento génico comprende adicionalmente uno o más reactivos control internos.
33.- El método de conformidad con la reivindicación 1 , 2, 5 ó 6, caracterizado además porque la expresión génica se determina por la amplificación de ácidos nucleicos que se lleva a cabo por la reacción en cadena de la polimerasa (PCR) del ARN extraído a partir de la muestra.
34.- El método de conformidad con la reivindicación 33, caracterizado además porque dicha PCR es la transcripción reversa de la reacción en cadena de la polimerasa (RT-PCR).
35.- El método de conformidad con la reivindicación 34, caracterizado además porque la RT-PCR comprende adicionalmente uno o más reactivos control internos.
36.- El método de conformidad con la reivindicación 1 , 2, 5 ó 6, caracterizado además porque la expresión del gen se detecta por la medición o detección de una proteína codificada por el gen.
37.- El método de conformidad con la reivindicación 36, caracterizado además porque la proteína se detecta por un anticuerpo específico a la proteína.
38.- El método de conformidad con la reivindicación 1 , 2, 5 ó 6, caracterizado además porque la expresión del gen se detecta por la medición de una característica del gen.
39.- El método de conformidad con la reivindicación 38, caracterizado además porque la característica medida se selecciona a partir del grupo que consiste de amplificación del ADN, metilación, mutación y variación alélica.
40.- Un método de validación cruzada de un perfil de expresión del gen pronóstico para pacientes con cáncer de mama que comprende los pasos de: a. obtener lo datos de expresión del gen a partir de un número estadísticamente significativo de muestras biológicas del paciente; b. el ordenamiento de la muestra al azar; c. desechando los datos de aproximadamente 10%-50% de las muestras; d. hacer el cómputo, para las muestras remanentes, para el factor de interés en todas las variables y selección de las variables que alcanzan un límite del valor p (p); e. selección de las variables que se ajustan a un modelo de predicción utilizando una búsqueda hacia adelante y evaluar el por entrenamiento error hasta que se encuentra una relación de error predeterminado; f. evaluado el modelo de predicción en el remanente 10-50% de las muestras; g. repitiendo los pasos c)-g) con una nueva serie de muestras removidas; y h. continuar los pasos c)-g) hasta que 100% de las muestras han sido evaluadas y se ha registrado su clasificación de desempeño.
41.- El método de conformidad con la reivindicación 40, caracterizado además porque los datos para expresión del gen obtenidos en el paso h. se representa por los genes seleccionados a partir del grupo que consiste de aquellos que codifican ARNm: i. que corresponden a SEQ ID NOs: 3, 4, 10, 18, 37, 40, 42, 43, 45, 55, 58, 64, 67, 72-74, 76, 81 , 85-86, 89, 97, 100-101 , 110-111 , 125 y 132-442, o 2, 3, 5, 12, 20, 25, 36, 37, 39, 40, 41 , 42, 43, 45, 46, 51 , 52, 53, 54, 55, 57, 58, 59, 60, 61 , 62, 63, 64, 66, 67, 69, 70, 72, 73, 74, 76, 80, 81 , 83, 84, 85, 86, 87, 88, 89, 90, 94, 97, 98, 101 , 102, 104, 107, 110, 111, 132, 139, 142, 150, 151, 153, 154, 158, 161, 163, 167, 170, 171, 173, 175, 181, 182, 183, 186, 188, 190, 192, 204, 206, 207, 212, 215, 218, 221, 223, 225, 228, 231, 232, 236, 238, 239, 240, 241, 242, 243, 246, 248, 249, 255, 257, 267, 269, 270, 271, 273, 280, 281, 282, 288, 290, 291, 299, 301, 304, 306, 311, 314, 315, 318, 327, 328, 338, 342, 346, 348, 354, 366, 368, 371, 375, 385, 388, 391, 395, 397, 402, 405, 409, 422, 424, 428, 429, 435, 436, 440, 651 y 443-650; o ii. reconocidos por la serie de sondas seleccionadas a partir del grupo que consiste de psids que corresponden a SEQ ID NOs: 3, 4, 10, 18, 37, 40, 42, 43, 45, 55, 58, 64, 67, 72-74, 76, 81, 85-86, 89, 97, 100-101, 110-111, 125 y 132-442, o 2, 3, 5, 12, 20, 25, 36, 37, 39, 40, 41, 42, 43, 45, 46, 51, 52, 53, 54, 55, 57, 58, 59, 60, 61, 62, 63, 64, 66, 67, 69, 70, 72, 73, 74, 76, 80, 81, 83, 84, 85, 86, 87, 88, 89, 90, 94, 97, 98, 101, 102, 104, 107, 110, 111, 132, 139, 142, 150, 151, 153, 154, 158, 161, 163, 167, 170, 171, 173, 175, 181, 182, 183, 186, 188, 190, 192, 204, 206, 207, 212, 215, 218, 221, 223, 225, 228, 231, 232, 236, 238, 239, 240, 241, 242, 243, 246, 248, 249, 255, 257, 267, 269, 270, 271, 273, 280, 281, 282, 288, 290, 291, 299, 301, 304, 306, 311, 314, 315, 318, 327, 328, 338, 342, 346, 348, 354, 366, 368, 371, 375, 385, 388, 391, 395, 397, 402, 405, 409, 422, 424, 428, 429, 435, 436, 440, 651 y 443-650 como se ilustra en el cuadro 10.
42.- Un método para validar independientemente un perfil de expresión del gen pronóstico para pacientes con cáncer de mama que comprende los pasos de: a. obtener lo datos de expresión del gen a partir de un número estadísticamente significativo de muestras biológicas del paciente; b. normalizando las variabilidades de la fuente en los datos para expresión del gen; c. haciendo el cómputo para el factor de interés en todas variables que se seleccionaron previamente; y d. evaluar el modelo de predicción en la muestra y registrar la clasificación del desempeño.
43.- El método de conformidad con la reivindicación 42, caracterizado además porque los datos para expresión del gen obtenidos en el paso d. se representa por los genes seleccionados a partir del grupo que consiste de aquellos que codifican ARNm: i. que corresponden a SEQ ID NOs: 3, 4, 10, 18, 37, 40, 42, 43, 45, 55, 58, 64, 67, 72-74, 76, 81 , 85-86, 89, 97, 100-101 , 110-111 , 125 y 132-442, o 2, 3, 5, 12, 20, 25, 36, 37, 39, 40, 41 , 42, 43, 45, 46, 51 , 52, 53, 54, 55, 57, 58, 59, 60, 61 , 62, 63, 64, 66, 67, 69, 70, 72, 73, 74, 76, 80, 81 , 83, 84, 85, 86, 87, 88, 89, 90, 94, 97, 98, 101 , 102, 104, 107, 110, 111 , 132, 139, 142, 150, 151 , 153, 154, 158, 161 , 163, 167, 170, 171 , 173, 175, 181 , 182, 183, 186, 188, 190, 192, 204, 206, 207, 212, 215, 218, 221 , 223, 225, 228, 231 , 232, 236, 238, 239, 240, 241 , 242, 243, 246, 248, 249, 255, 257, 267, 269, 270, 271 , 273, 280, 281 , 282, 288, 290, 291 , 299, 301 , 304, 306, 311 , 314, 315, 318, 327, 328, 338, 342, 346, 348, 354, 366, 368, 371 , 375, 385, 388, 391 , 395, 397, 402, 405, 409, 422, 424, 428, 429, 435, 436, 440, 651 y 443-650; o ii. reconocidos por la serie de sondas seleccionadas a partir del grupo que consiste de psids que corresponden a SEQ ID NOs: 3, 4, 10, 18, 37, 40, 42, 43, 45, 55, 58, 64, 67, 72-74, 76, 81 , 85-86, 89, 97, 100-101 , 110-111 , 125 y 132-442, o 2, 3, 5, 12, 20, 25, 36, 37, 39, 40, 41 , 42, 43, 45, 46, 51 , 52, 53, 54, 55, 57, 58, 59, 60, 61 , 62, 63, 64, 66, 67, 69, 70, 72, 73, 74, 76, 80, 81 , 83, 84, 85, 86, 87, 88, 89, 90, 94, 97, 98, 101 , 102, 104, 107, 110, 111 , 132, 139, 142, 150, 151 , 153, 154, 158, 161 , 163, 167, 170, 171 , 173, 175, 181 , 182, 183, 186, 188, 190, 192, 204, 206, 207, 212, 215, 218, 221 , 223, 225, 228, 231 , 232, 236, 238, 239, 240, 241 , 242, 243, 246, 248, 249, 255, 257, 267, 269, 270, 271 , 273, 280, 281 , 282, 288, 290, 291 , 299, 301 , 304, 306, 311 , 314, 315, 318, 327, 328, 338, 342, 346, 348, 354, 366, 368, 371 , 375, 385, 388, 391 , 395, 397, 402, 405, 409, 422, 424, 428, 429, 435, 436, 440, 651 y 443-650 como se ilustra en el cuadro 10.
44.- Un perfil génico obtenido mediante el método de conformidad con la reivindicación 42 ó 43.
45.- Un método para la generación de una Clasificación de Recidiva al Azar para permitir la prognosis de los pacientes con cáncer de mama que comprende los pasos de: a. obtener lo datos de expresión del gen a partir de un número estadísticamente significativo de muestras biológicas del paciente; b. aplicando el análisis de regresión univariable de Cox a los datos para obtener los genes seleccionados; c. aplicando los niveles de expresión evaluados a los genes seleccionados con los coeficientes estándares de Cox para obtener un modelo de predicción que se puede aplicar como una Clasificación de Recidiva al Azar.
46.- El método de conformidad con la reivindicación 38, caracterizado además porque la Clasificación de Recidiva al Azar se obtiene mediante la fórmula: 60 16 Evaluación de recidiva = A. - 1 + y ? - ;?. + B - (1 - í) -r V (l - 1)« -X . en donae f 1 Si el nivel del gen X > ] 0 I - [0 Si el nivel del (jen X = 10 A y B son constantes; wi es el coeficiente de regresión de Cox estandarizado para el gen X + marcador; xi es el valor de expresión de ER + el marcador en escala log2; wj es el coeficiente de regresión de Cox estandarizado para el gen X - marcador; xj es el valor de expresión de ER-marcador en la escala log2; el gen X se selecciona a partir del grupo que consiste de aquellos que codifican ARNm: i. que corresponden a SEQ ID NOs: 1-111 ; o ii. que son reconocidos por la serie de sondas seleccionadas a partir del grupo que consiste de psids que corresponden a SEQ ID NOs: 1-111 como se ilustra en el cuadro 10.
47.- Un método para la generación de un reporte pronóstico del paciente con cáncer de mama que comprende los pasos de: a. obtención de una muestra biológica a partir del paciente; b. medir la expresión del gen de la muestra; c. aplicar una Clasificación de Recidiva al Azar a los resultados del paso b.; y d. utilizar los resultados obtenidos en el paso c. para generar el reporte.
48.- El método de conformidad con la reivindicación 47, caracterizado además porque el reporte contiene una evaluación del resultado de! paciente y/o probabilidad del riesgo en relación con la población del paciente.
49.- Un reporte del paciente generado por el método de conformidad con la reivindicación 47.
50.- Una composición que comprende al menos una serie de sondas seleccionada a partir del grupo que consiste de: SEQ ID NOs: 1 -111 ; o psids que corresponden a las SEQ ID NOs: 1-111 como se ilustra en el cuadro 10.
51.- Un equipo para la realización de un ensayo para determinar la prognosis del cáncer de mama en una muestra biológica que comprende: materiales para la detección de secuencias aisladas de ácido nucleico, sus complementos, o porciones de los mismos de una combinación de genes seleccionados a partir del grupo que consiste de aquellos que codifican ARNm: i. que corresponden a SEQ ID NOs: 1-111 ; o ii. reconocidos por la serie de sondas seleccionadas a partir del grupo que consiste de psids que corresponden a SEQ ID NOs: 1-111 como se ¡lustra en el cuadro 10.
52.- El equipo de conformidad con la reivindicación 51 , caracterizado además porque las SEQ ID NOs. son 36-95.
53.- El equipo de conformidad con la reivindicación 51 , caracterizado además porque los SEQ ID NOs. son 96-111.
54.- El equipo de conformidad con ia reivindicación 51 , caracterizado además porque las SEQ ID NOs. son 36-111.
55.- El equipo de conformidad con la reivindicación 51 , caracterizado además porque comprende adicionalmente los reactivos para llevar a cabo un análisis de microarreglo.
56.- El equipo de conformidad con la reivindicación 51 , caracterizado además porque comprende adicionalmente un medio a través del cual dichas secuencias de ácido nucleico, sus complementos, o porciones de las mismas son ensayadas.
57.- Artículos para la evaluación del estado del cáncer de mama que comprende: materiales para la detección de secuencias aisladas de ácido nucleico, sus complementos, o porciones de los mismos de una combinación de genes seleccionados a partir del grupo que consiste de aquellos Que codifican ARNm: i. que corresponden a SEQ ID NOs: 1-111 ; o ii. reconocidos por la serie de sondas seleccionadas a partir del grupo que consiste de psids que corresponden a SEQ ID NOs: 1-111 como se ilustra en el cuadro 10.
58.- Los artículos de conformidad con la reivindicación 57, caracterizados además porque las SEQ ID NOs. son 36-95.
59.- Los artículos de conformidad con la reivindicación 57, caracterizados además porque las SEQ ID NOs. son 96-111.
60.- Los artículos de conformidad con la reivindicación 57, caracterizados además porque las SEQ ID NOs. son 36-111.
61.- Los artículos de conformidad con la reivindicación 57, caracterizados además porque comprenden adicionalmente los reactivos para llevar a cabo un análisis de microarreglo.
62.- Los artículos de conformidad con la reivindicación 57, caracterizados además porque comprenden adicionalmente un medio a través del cual dichas secuencias de ácido nucleico, sus complementos, o porciones de las mismas son ensayadas.
63.- Un microarreglo o fragmento génico para llevar a cabo el método de conformidad con la reivindicación 1 , 2, 5, ó 6.
64.- El microarreglo de conformidad con la reivindicación 63, caracterizado además porque comprende secuencias aisladas de ácido nucleico, sus complementos, o porciones de los mismos de una combinación de genes seleccionados a partir del grupo que consiste de aquellos que codifican ARNm: i. que corresponden a SEQ ID NOs: 1-111 ; o ii. reconocidos por la serie de sondas seleccionadas a partir del grupo que consiste de psids que corresponden a SEQ ID NOs: 1-111 como se ilustra en el cuadro 10 en donde la combinación es adecuada para caracterizar el estado del cáncer de mama o el riesgo de recidiva en una muestra biológica.
65.- El microarreglo de conformidad con la reivindicación 63, caracterizado además porque la medición o caracterización es al menos 1.5 veces sobre o sub-expresión.
66.- El microarreglo de conformidad con la reivindicación 63, caracterizado además porque la medición provee un valor p estadísticamente significativo sobre o sub-expresión.
67.- El microarreglo de conformidad con la reivindicación 63, caracterizado además porque el valor p es menor de 0.05.
68.- El microarreglo de conformidad con la reivindicación 63, caracterizado además porque que comprende un arreglo de ADNc o un arreglo de oligonucleótidos.
69.- El microarreglo de conformidad con la reivindicación 63, caracterizado además porque comprende adicionalmente uno o más reactivos para control interno.
70.- Un portafolio diagnóstico/pronóstico que comprende secuencias aisladas de ácido nucleico, sus complementos, o porciones de los mismos de una combinación de genes seleccionados a partir del grupo que consiste de aquellos que codifican ARNm: i. que corresponden a SEQ ID NOs: 1-111 ; o ii. reconocidos por la serie de sondas seleccionadas a partir del grupo que consiste de psids que corresponden a SEQ ID NOs: 1-111 como se ilustra en el cuadro 10 en donde la combinación es adecuada para caracterizar el estado del cáncer de mama o el riesgo de recidiva en una muestra biológica.
71.- El portafolio de conformidad con la reivindicación 70, caracterizado además porque la medición o caracterización es al menos 1. 5-veces por arriba o por debajo de la expresión.
72.- El portafolio de conformidad con la reivindicación 70, caracterizado además porque la medición provee un valor p estadísticamente significativo por arriba o por debajo de la expresión.
73.- El portafolio de conformidad con la reivindicación 70, caracterizado además porque el valor p es menor de 0.05.
MXPA06009545A 2004-02-20 2005-02-18 Pronosticos del cancer de mama. MXPA06009545A (es)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US10/783,271 US20050186577A1 (en) 2004-02-20 2004-02-20 Breast cancer prognostics
US63443004P 2004-12-08 2004-12-08
PCT/US2005/005711 WO2005083429A2 (en) 2004-02-20 2005-02-18 Breast cancer prognostics

Publications (1)

Publication Number Publication Date
MXPA06009545A true MXPA06009545A (es) 2007-03-07

Family

ID=34915750

Family Applications (1)

Application Number Title Priority Date Filing Date
MXPA06009545A MXPA06009545A (es) 2004-02-20 2005-02-18 Pronosticos del cancer de mama.

Country Status (6)

Country Link
EP (1) EP1721159B1 (es)
JP (1) JP5089993B2 (es)
CA (1) CA2556890C (es)
ES (1) ES2504242T3 (es)
MX (1) MXPA06009545A (es)
WO (1) WO2005083429A2 (es)

Families Citing this family (19)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
IL177006A0 (en) 2005-08-02 2006-12-10 Veridex Llc Predicting bone relapse of breast cancer
GB0526498D0 (en) * 2005-12-28 2006-02-08 Randox Lab Ltd Method
WO2007084992A2 (en) * 2006-01-19 2007-07-26 The University Of Chicago Prognosis and therapy predictive markers and methods of use
CA2664356A1 (en) * 2006-10-05 2008-04-10 Banyu Pharmaceutical Co., Ltd. Gene/protein marker for prediction or diagnosis of pharmacological efficacy of aurora a inhibitor
US20100234292A1 (en) * 2007-04-16 2010-09-16 Ipsogen Methods of assessing a propensity of clinical outcome for a female mammal suffering from breast cancer
EP2048241B1 (en) * 2007-10-08 2012-07-25 Sividon Diagnostics GmbH Method employing GAPDH as molecular markers for cancer prognosis
WO2009138130A1 (en) 2008-05-16 2009-11-19 Atlas Antibodies Ab Breast cancer prognostics
ES2338843B1 (es) 2008-07-02 2011-01-24 Centro De Investigaciones Energeticas, Medioambientales Y Tecnologicas Huella genomica de cancer de mama.
JP5461959B2 (ja) * 2008-10-31 2014-04-02 株式会社Dnaチップ研究所 神経膠腫予後予測方法、およびそれに用いるキット
PT2553118E (pt) * 2010-03-31 2014-12-17 Sividon Diagnostics Gmbh Método para previsão da recorrência de cancro da mama em tratamento endócrino
JP5725274B2 (ja) 2010-04-22 2015-05-27 国立大学法人大阪大学 乳癌の予後の検査方法
ITPD20110201A1 (it) * 2011-06-16 2012-12-17 Univ Degli Studi Trieste Metodo per la prognosi di tumori al seno basata sull'espressione dell'enzima prolil isomerarasi pin1 in combinazione con mutazioni del gene tp53
BR112016020897A2 (pt) * 2014-03-11 2018-01-23 Council Queensland Inst Medical Res ?determinação da agressividade de câncer, prognóstico e capacidade de reação a tratamento?
US20170209272A1 (en) * 2014-06-09 2017-07-27 Biomark Technologies Inc. Method Of Detecting Cancer Based On Spermine/Spermidine N'-Acetyltransferase Gene Expression
WO2016090323A1 (en) 2014-12-05 2016-06-09 Prelude, Inc. Dcis recurrence and invasive breast cancer
IT201700109459A1 (it) * 2017-09-29 2019-03-29 Univ Degli Studi Di Perugia Metodo per effettuare prognosi del cancro della mammella, kit ed uso di questi
EP3850368A4 (en) 2018-09-14 2022-11-23 Prelude Corporation PROCEDURE FOR SELECTING THE TREATMENT OF SUBJECTS AT RISK FOR INVASIVE BREAST CANCER
CN113425843B (zh) * 2020-03-08 2022-08-02 北京舜景生物医药技术有限公司 一种gp73抑制剂在制备治疗糖尿病的药物中的应用
CN114974579B (zh) * 2022-04-20 2024-02-27 山东大学齐鲁医院 消化道粘膜下肿瘤内镜治疗预后的辅助判定系统及设备

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20030176672A1 (en) * 2001-02-13 2003-09-18 Susana Salceda Compositions and methods relating to breast specific genes and proteins
WO2002099421A2 (en) * 2001-05-18 2002-12-12 Thomas Jefferson University Specific microarrays for breast cancer screening
EP1410011B1 (en) * 2001-06-18 2011-03-23 Rosetta Inpharmatics LLC Diagnosis and prognosis of breast cancer patients
US7473526B2 (en) * 2002-03-29 2009-01-06 Veridex, Llc Breast cancer prognostic portfolio
JP2006524502A (ja) * 2003-02-28 2006-11-02 バイエル・フアーマシユーチカルズ・コーポレーシヨン 乳癌の発現プロファイル及び使用法

Also Published As

Publication number Publication date
CA2556890A1 (en) 2005-09-09
EP1721159B1 (en) 2014-12-10
WO2005083429A3 (en) 2006-07-13
ES2504242T3 (es) 2014-10-08
WO2005083429A8 (en) 2013-07-11
JP5089993B2 (ja) 2012-12-05
CA2556890C (en) 2017-04-25
EP1721159A2 (en) 2006-11-15
WO2005083429A2 (en) 2005-09-09
JP2007528218A (ja) 2007-10-11

Similar Documents

Publication Publication Date Title
MXPA06009545A (es) Pronosticos del cancer de mama.
US20220213563A1 (en) Gene expression profiles to predict breast cancer outcomes
JP2007049991A (ja) 乳癌の骨への再発の予測
AU2013266419B2 (en) NANO46 genes and methods to predict breast cancer outcome
US8183353B2 (en) Breast cancer prognostics
EP2333112B1 (en) Breast cancer prognostics
JP2008521412A (ja) 肺癌予後判定手段
WO2008070301A9 (en) Predicting lung cancer survival using gene expression
AU2008203226B2 (en) Colorectal cancer prognostics
JP2010502227A (ja) 生物学的経路の遺伝子発現分析を用いたリンパ節陰性の原発性乳がんの遠隔転移を予測する方法
JP2004329211A (ja) 結腸直腸癌の予後
JP2011509689A (ja) Ii及びiii期結腸癌の分子病期分類並びに予後診断
JP2008538284A (ja) 乳房の腫瘍のレーザーマイクロダイセクションおよびマイクロアレイ解析が、エストロゲン受容体に関係する遺伝子および経路を明らかにする
EP1512758B1 (en) Colorectal cancer prognostics
MXPA06008788A (es) Prediccion de la recaida osea del cancer de mama
AU2016228291A1 (en) Gene Expression Profiles to Predict Breast Cancer Outcomes

Legal Events

Date Code Title Description
FG Grant or registration