ES2457534T3 - Perfiles de expresión génica para predecir desenlaces en cáncer de mama - Google Patents

Perfiles de expresión génica para predecir desenlaces en cáncer de mama Download PDF

Info

Publication number
ES2457534T3
ES2457534T3 ES09770678.2T ES09770678T ES2457534T3 ES 2457534 T3 ES2457534 T3 ES 2457534T3 ES 09770678 T ES09770678 T ES 09770678T ES 2457534 T3 ES2457534 T3 ES 2457534T3
Authority
ES
Spain
Prior art keywords
breast cancer
intrinsic
risk
her2
subtype
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
ES09770678.2T
Other languages
English (en)
Inventor
Charles M. Perou
Joel S. Parker
James Stephen Marron
Andrew Nobel
Philip S. Bernard
Matthew Ellis
Elaine Mardis
Torsten O. Nielsen
Maggie Cheang
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
British Columbia Cancer Agency BCCA
University of Washington
University of North Carolina at Chapel Hill
University of Utah Research Foundation UURF
Washington University in St Louis WUSTL
University of North Carolina System
Original Assignee
British Columbia Cancer Agency BCCA
University of Washington
University of North Carolina at Chapel Hill
University of Utah Research Foundation UURF
Washington University in St Louis WUSTL
University of North Carolina System
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by British Columbia Cancer Agency BCCA, University of Washington, University of North Carolina at Chapel Hill, University of Utah Research Foundation UURF, Washington University in St Louis WUSTL, University of North Carolina System filed Critical British Columbia Cancer Agency BCCA
Application granted granted Critical
Publication of ES2457534T3 publication Critical patent/ES2457534T3/es
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6876Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
    • C12Q1/6883Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material
    • C12Q1/6886Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material for cancer
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B25/00ICT specially adapted for hybridisation; ICT specially adapted for gene or protein expression
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B25/00ICT specially adapted for hybridisation; ICT specially adapted for gene or protein expression
    • G16B25/10Gene or protein expression profiling; Expression-ratio estimation or normalisation
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B40/00ICT specially adapted for biostatistics; ICT specially adapted for bioinformatics-related machine learning or data mining, e.g. knowledge discovery or pattern finding
    • G16B40/20Supervised data analysis
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/106Pharmacogenomics, i.e. genetic variability in individual responses to drugs and drug metabolism
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/112Disease subtyping, staging or classification
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/158Expression markers
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B40/00ICT specially adapted for biostatistics; ICT specially adapted for bioinformatics-related machine learning or data mining, e.g. knowledge discovery or pattern finding

Landscapes

  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Chemical & Material Sciences (AREA)
  • Genetics & Genomics (AREA)
  • General Health & Medical Sciences (AREA)
  • Biophysics (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Biotechnology (AREA)
  • Medical Informatics (AREA)
  • Organic Chemistry (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Molecular Biology (AREA)
  • Evolutionary Biology (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Theoretical Computer Science (AREA)
  • Pathology (AREA)
  • Wood Science & Technology (AREA)
  • Analytical Chemistry (AREA)
  • Immunology (AREA)
  • Zoology (AREA)
  • Data Mining & Analysis (AREA)
  • General Engineering & Computer Science (AREA)
  • Hospice & Palliative Care (AREA)
  • Biochemistry (AREA)
  • Oncology (AREA)
  • Microbiology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Bioethics (AREA)
  • Artificial Intelligence (AREA)
  • Databases & Information Systems (AREA)
  • Epidemiology (AREA)
  • Evolutionary Computation (AREA)
  • Public Health (AREA)
  • Software Systems (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)

Abstract

Método de clasificación de un subtipo intrínseco de cáncer de mama en una muestra de prueba que comprende: a) obtener un perfil de expresión génica para cada una de una pluralidad de muestras de cáncer de mama de entrenamiento que se han clasificado según el subtipo intrínseco de cáncer de mama, en el que cada uno de los subtipos intrínsecos luminal A (LumA), luminal B (LumB), de tipo basal (basal), enriquecido en HER2 (HER2) y de tipo normal (normal) está representado en la pluralidad de muestras de cáncer de mama, y en el que el perfil de expresión génica se basa en la expresión de al menos 40 de 10 los genes intrínsecos enumerados en la tabla 1; b) usar un algoritmo para construir perfiles de expresión génica o "centroides" para cada uno de los subtipos intrínsecos de cáncer de mama en el conjunto de entrenamiento; c) obtener un perfil de expresión génica para dicha muestra de prueba, en el que el perfil de expresión génica se basa en la expresión de los mismos al menos 40 genes intrínsecos enumerados en la tabla 1 tal como se usan en la etapa a); d) comparar el perfil de expresión génica de la muestra de prueba con los centroides construidos en la etapa (b); e) calcular la distancia del perfil de expresión génica de la muestra de prueba a cada uno de los centroides; y, f) asignar la muestra de prueba a uno de los subtipos intrínsecos de cáncer de mama basándose en el centroide más cercano.

Description

Perfiles de expresion genica para predecir desenlaces en cancer de mama. CAMPO DE LA INVENCION La presente invencion se refiere a metodos para clasificar muestras de cancer de mama en subtipos y para evaluar el pronostico y la respuesta a la terapia para pacientes que padecen cancer de mama. ANTECEDENTES DE LA INVENCION El cancer de mama es el segundo cancer mas comun ente mujeres en los Estados Unidos, segundo solo tras el cancer de piel. Una mujer en los EE.UU. tiene una probabilidad de uno entre ocho de desarrollar cancer de mama durante su vida, y la Sociedad americana contra el cancer ("American Cancer Society") estima que se notificaran mas de 178.480 casos nuevos de cancer de mama invasivo en los Estados Unidos en 2007. El cancer de mama es la segunda causa principal de muertes por cancer en mujeres, con mas de 40.000 muertes al ano. Los metodos de deteccion mejorados, el cribado masivo y los avances en el tratamiento a lo largo de la ultima decada han mejorado significativamente las perspectivas para las mujeres diagnosticadas con cancer de mama. Hoy en dia, aproximadamente el 80% de los casos de cancer de mama se diagnostican en los estadios tempranos de la enfermedad cuando las tasas de supervivencia estan en su punto mas alto. Como resultado, aproximadamente el 85% de las pacientes con cancer de mama viven al menos cinco anos tras el diagnostico. A pesar de estos avances, aproximadamente el 20% de las mujeres diagnosticadas con cancer de mama en estadio temprano tienen un mal desenlace a diez anos y padeceran reaparicion de la enfermedad, metastasis o muerte dentro de este periodo de tiempo. Una investigacion significativa se ha centrado en la identificacion de metodos y factores para evaluar el pronostico de cancer de mama y predecir la respuesta terapeutica (vease en general, Ross y Hortobagyi, eds. (2005) Molecular Oncology of Breast Cancer (Jones y Bartlett Publishers, Boston, MA) y las referencias citadas en el mismo). Los indicadores de pronostico incluyen factores convencionales, tales como tamano del tumor, estado de los ganglios y grado histologico, asi como marcadores moleculares que proporcionan alguna informacion con respecto al pronostico y la respuesta probable a tratamientos particulares. Por ejemplo, la determinacion del estado del receptor de la hormona esteroidea estrogeno (ER) y progesterona (PgR) se ha convertido en un procedimiento de rutina en la evaluacion de pacientes con cancer de mama. Vease, por ejemplo, Fitzgibbons et al., Arch. Pathol. Lab. Med. 124:966-78, 2000. Es mas probable que los tumores que son positivos para el receptor de la hormona respondan a la terapia hormonal y tambien normalmente crecen de manera menos agresiva, dando como resultado asi un mejor pronostico para las pacientes con tumores ER+/PgR+. La sobreexpresion del receptor del factor de crecimiento epidermico humano 2 (HER-2/neu), una proteina receptora tirosina cinasa transmembrana, se ha correlacionado con mal pronostico de cancer de mama (vease, por ejemplo, Ross et al., The Oncologist 8:307-25, 2003), y los niveles de expresion de HER-2 en tumores de mama se usan para predecir la respuesta al anticuerpo monoclonal anti-HER2 terapeutico trastuzumab (Herceptin®, Genentech, South San Francisco, CA). SUMARIO DE LA INVENCION Se proporcionan metodos para clasificar y para evaluar el pronostico y el tratamiento de un sujeto con cancer de mama. Los metodos incluyen prediccion de subtipo de cancer de mama usando un algoritmo supervisado entrenado para estratificar sujetos basandose en el subtipo intrinseco de cancer de mama. El modelo de prediccion se basa en el perfil de expresion genica de los genes intrinsecos enumerados en la tabla 1. En algunas realizaciones, el algoritmo es un algoritmo del centroide mas cercano, similar al algoritmo del analisis de prediccion de micromatriz (PAM). El algoritmo puede entrenarse basandose en datos obtenidos a partir de los perfiles de expresion genica depositados como numero de registro GSE10886 en el National Center for Biotechnology Information Gene Expression Omnibus. Este modelo de prediccion, denominado en el presente documento modelo de clasificacion PAM50, puede usarse para predecir con precision el subtipo intrinseco de un sujeto diagnosticado con o que se sospecha que tiene cancer de mama. Ademas se proporcionan composiciones y metodos para predecir el desenlace o la respuesta a la terapia de un sujeto diagnosticado con o que se sospecha que tiene cancer de mama. Estos metodos son utiles para orientar o determinar las opciones de tratamiento para un sujeto que padece cancer de mama. Los metodos de la invencion incluyen ademas medios para evaluar perfiles de expresion genica, que incluyen micromatrices y ensayos de reaccion en cadena de la polimerasa cuantitativa, asi como kits que comprenden reactivos para poner en practica los metodos de la invencion. BREVE DESCRIPCION DE LOS DIBUJOS La figura 1 muestra desenlaces basandose en predicciones de subtipo usando el clasificador PAM50. La clasificacion PAM50 para LumA, LumB, enriquecido en HER-2, de tipo basal y de tipo normal muestra significacion pronostica para 1451 pacientes a lo largo de los 5 conjuntos de prueba combinados (A), en 376 pacientes a las que se administro solo terapia endocrina (B) y en 701 pacientes negativas para ganglios a las que no se administro terapia sistemica adyuvante (C).
La figura 2 muestra la clasificacion del riesgo para casos de prueba usando un modelo completo de subtipos intrinsecos y dos variables clinicas. (A) riesgo de puntuaciones de recidiva representado graficamente para cada subtipo de cancer de mama: puntuaciones de riesgo bajo < -0,1, puntuaciones de riesgo moderado entre -0,1 y 0,2, y puntuaciones de riesgo alto �0,2. (B) diagramas de Kaplan-Meier y significacion de la puntuacion de riesgo para las 1286 muestras de prueba, (C) 376 pacientes que recibieron solo terapia endocrina adyuvante y (D) 560 pacientes que eran negativas para ganglios y no recibieron terapia sistemica adyuvante.
La figura 3 muestra la puntuacion lineal para el pronostico usando el modelo clinico de subtipos para determinar el riesgo de recidiva en 5 anos. El ajuste lineal con intervalos de confianza del 95% calibra el riesgo de puntuacion de recidiva. El modelo de riesgo continuo con subtipo y variables clinicas (T y N) se calibro a partir de 657 pacientes con cancer de mama en estadio temprano positivo para ER (A) y en 1286 pacientes con enfermedad positiva para ER y negativa para ER y estadio 1-3 (B).
La figura 4 muestra la asociacion de subtipo intrinseco de PAM50, determinada mediante qPCR a partir de bloques de parafina, siendo (A) la supervivencia libre de recidiva y (B) la supervivencia especifica de la enfermedad entre 702 mujeres con carcinoma de mama invasivo tratado con tamoxifeno adyuvante.
La figura 5 muestra el analisis de Kaplan-Meier de supervivencia especifica de la enfermedad de cancer de mama para pacientes estratificadas en las categorias de riesgo bajo, medio y alto aplicando el algoritmo riesgo de recidiva a los datos de qPCR generados a partir de bloques de parafina. (A) ROR-S, (B) ROR-C.
La figura 6 muestra el analisis de Kaplan-Meier de supervivencia especifica de la enfermedad de cancer de mama para pacientes estratificadas en las categorias de riesgo bajo, medio y alto (tal como se definio anteriormente en el material independiente aplicando el algoritmo ROR-C a mujeres con (A) enfermedad negativa para ganglios y (B) enfermedad positiva para ganglios).
La figura 7 muestra el analisis de Kaplan-Meier de supervivencia especifica de la enfermedad de cancer de mama para pacientes estratificadas en las categorias negativo para ganglios o positivo para ganglios entre mujeres con un riesgo bajo de ROR-C (panel superior a la izquierda), mujeres con riesgo moderado de ROR-C (panel superior a la derecha); mujeres con riesgo alto de ROR-C (panel inferior a la izquierda). Para la comparacion directa, todas las curvas estan superpuestas en el panel inferior a la derecha. Entre las mujeres con ROR-C bajo, no hay diferencia significativa en el desenlace por estado de los ganglios.
La figura 8 muestra que un analisis del modelo ROR-C frente a la probabilidad de supervivencia, estratificado por el numero de ganglios linfaticos implicados, revela buenos desenlaces independientemente de la categoria del estado de los ganglios entre pacientes con valores de ROR-C menores de 25, que tienen intervalos de confianza del 95% solapantes (indicados mediante lineas discontinuas)
La figura 9 muestra los resultados de analisis de Kaplan-Meier que se realizo por separado en cada grupo de riesgo de adyuvante, y se sometieron a prueba las diferencias en la supervivencia entre los grupos de riesgo del 90-95% y del 95-100% usando la prueba de rangos logaritmicos.
La figura 10 muestra los resultados de analisis de Kaplan-Meier que se realizo por separado en cada grupo de riesgo de adyuvante, y diferencias en la supervivencia entre (A) BCSS predicha por adyuvante del 80-90%, ROR-S bajo frente a medio/alto; (B) BCSS predicha por adyuvante del 70-80%, ROR-S bajo frente a medio/alto; y, (C) BCSS predicha por adyuvante <70%, ROR-S bajo frente a medio/alto.
DESCRIPCION DETALLADA DE LA INVENCION
Vision general
A pesar de los recientes avances, el reto del tratamiento del cancer sigue siendo dirigir regimenes de tratamiento especificos a distintos tipos de tumor con diferente patogenia, y en ultima instancia personalizar el tratamiento tumoral con el fin de optimizar el desenlace. En particular, una vez se diagnostica a una paciente con cancer, tal como cancer de mama, existe una necesidad de metodos que permitan al medico predecir el transcurso esperado de la enfermedad, incluyendo la probabilidad de reaparicion del cancer, supervivencia a largo plazo de la paciente y similares y por consiguiente seleccionar las opciones de tratamiento mas apropiadas.
Para los fines de la presente invencion, "cancer de mama" incluye, por ejemplo, los estados clasificados mediante biopsia o histologia como patologia maligna. La descripcion clinica de diagnosticos de cancer de mama es bien conocida en la tecnica medica. Un experto en la tecnica apreciara que cancer de mama se refiere a cualquier tumor maligno del tejido de la mama, incluyendo, por ejemplo, carcinomas y sarcomas. Las realizaciones particulares de cancer de mama incluyen carcinoma ductal in situ (DCIS), carcinoma lobular in situ (LCIS) o carcinoma mucinoso.
Cancer de mama tambien se refiere a carcinoma ductal infiltrante (IDC) o lobular infiltrante (ILC). En la mayoria de las realizaciones de la invencion, el sujeto de interes es una paciente humana que se sospecha que padece o realmente diagnosticada con cancer de mama.
Cancer de mama es una enfermedad heterogenea con respecto a alteraciones moleculares y composicion celular. Esta diversidad crea un reto para los investigadores que tratan de desarrollar clasificaciones que son clinicamente significativas. La obtencion del perfil de expresion genica mediante micromatriz ha proporcionado comprension de la complejidad de los tumores de mama y puede usarse para proporcionar informacion de pronostico mas alla de parametros patologicos convencionales (1-7).
La obtencion de perfiles de expresion de cancer de mama identifica subtipos moleculares biologica y clinicamente distintos que pueden requerir diferentes enfoques de tratamiento [van't Veer 2005][Loi 2007][Cheang 2008a]. Los subtipos intrinsecos principales de cancer de mama denominados luminal A, luminal B, enriquecido en HER-2, de tipo basal tienen caracteristicas clinicas, riesgo de recidiva y respuesta a tratamiento distintos [Sorlie 2003]. Los subtipos "intrinsecos" conocidos como luminal A (LumA), luminal B (LumB), enriquecido en HER2, de tipo basal y de tipo normal se descubrieron usando agrupamientos jerarquicos no supervisados de datos de micromatriz (1,8). Los genes intrinsecos, tal como se describe en Perou et al. (2000) Nature 406:747-752, se eligen estadisticamente para que tengan variacion baja en la expresion entre repeticiones de muestras biologicas del mismo individuo y variacion alta en la expresion en muestras de diferentes individuos. Por tanto, los genes intrinsecos son los genes clasificadores para la clasificacion del cancer de mama. Aunque no se uso informacion clinica para derivar los subtipos intrinsecos de cancer de mama, esta clasificacion ha demostrado tener significacion pronostica (1, 6, 9, 10).
Los tumores de mama del subtipo "luminal" son positivos para ER y tienen un perfil de expresion de queratina similar a las celulas epiteliales que revisten la luz de los conductos de la mama (Tailor-Papadimitriou et al. (1989) J Cell Sci 94:403-413; Perou et al (2000) New Technologies for Life Sciences: A Trends Guide 67-76, cada uno de los cuales se incorpora en el presente documento como referencia en su totalidad). A la inversa, tumores negativos para ER pueden dividirse en dos subtipos principales, concretamente los que sobreexpresan (y estan amplificados para ADN) HER-2 y GRB7 (enriquecidos en HER-2) y tumores "de tipo basal" que tiene un perfil de expresion similar al epitelio basal y expresan queratina 5, 6B y 17. Estos dos subtipos de tumor son agresivos y normalmente mas mortales que los tumores luminales; sin embargo, existen subtipos de tumores luminales con diferentes desenlaces. Los tumores luminales con malos desenlaces comparten constantemente la caracteristica histopatologica de ser de un grado mas alto y la caracteristica molecular de expresar altamente genes de proliferacion.
La traduccion de los subtipos intrinsecos en un ensayo clinico ha sido ardua debido a que un agrupamiento no supervisado es mas adecuado para organizar grandes numeros de muestras y genes que clasificar muestras individuales usando conjuntos genicos pequenos.
Por tanto, en el presente documento se proporcionan metodos y composiciones mejorados para clasificar subtipos intrinsecos de cancer de mama. Los metodos utilizan un algoritmo supervisado para clasificar muestras del sujeto segun el subtipo intrinseco de cancer de mama. Este algoritmo, denominado en el presente documento el modelo de clasificacion PAM50, se basa en el perfil de expresion genica de un subconjunto definido de genes intrinsecos que se han identificado en el presente documento como superior para clasificar subtipos intrinsecos de cancer de mama, y para predecir el riesgo de recidiva y/o respuesta a la terapia en un sujeto diagnosticado con cancer de mama. El subconjunto de genes, junto con cebadores especificos para su deteccion, se proporcionan en la tabla 1.
En algunas realizaciones, se usan al menos aproximadamente 40 de los genes enumerados en la tabla 1 en el modelo de clasificacion PAM50. En otras realizaciones, se usan al menos 41, al menos 43, al menos 44, al menos 45, al menos 46, al menos 47, al menos 48, al menos 49 o los 50 genes intrinsecos enumerados en la tabla 1 en el modelo. Los metodos dados a conocer en el presente documento no se preven para su uso con uno o solo algunos de los genes enumerados en la tabla 1. De hecho, es la combinacion de sustancialmente todos los genes intrinsecos lo que permite la clasificacion del subtipo intrinseco y pronostico del desenlace o respuesta terapeutica al tratamiento mas precisos. Por tanto, en diversas realizaciones, los metodos dados a conocer en el presente documento abarcan la obtencion del perfil genetico de sustancialmente todos los genes enumerados en la tabla 1. "Sustancialmente todos" puede abarcar al menos 47, al menos 48, al menos 49 o los 50 genes enumerados en la tabla 1. A menos que se especifique lo contrario, "sustancialmente todos" se refiere a al menos 49 de los genes enumerados en la tabla 1. Un experto en la tecnica tambien entendera que puede usarse un subconjunto de los genes enumerados en la tabla 1 para entrenar un algoritmo para predecir el subtipo de cancer de mama o el desenlace, y que puede usarse otro subconjunto de los genes para caracterizar un sujeto individual. Preferiblemente, se usan los 50 genes para entrenar el algoritmo y se usan al menos 49 de los genes para caracterizar un sujeto.
Tabla 1. Lista de genes intrinsecos de PAM50
GEN
NÚMERO DE REGISTRO DE GENBANK REPRESENTATIVO CEBADOR DIRECTO SEQ ID NO: CEBADOR INVERSO SEQ ID NO:
ACTR3B
NM 0204451 NM 001040135 1 51
ANLN
NM 018685 2 52
BAG1
NM 004323 3 53
BCL2
NM 000633 4 54
BIRC5
NM 001012271 5 55
BLVRA
BX647539 6 56
CCNB1
NM 031966 7 57
CCNE1
BC035498 8 58
CDC20
BG256659 9 59
CDC6
NM 001254 10 60
CDCA1
NM 031423 11 61
CDH3
BC041846 12 62
CENPF
NM 016343 13 63
CEP55
AB091343 14 64
CXXC5
BC006428 15 65
EGFR
NM 005228 16 66
ERBB2
NM 001005862 17 67
ESR1
NM 001122742 18 68
EXO1
NM 130398 19 69
FGFR4
AB209631 20 70
FOXA1
NM 004496 21 71
FOXC1
NM 001453 22 72
GPR160
AJ249248 23 73
GRB7
NM 005310 24 74
HSPC150 (UBE2T)
NM 014176 25 75
KIF2C
NM 006845 26 76
KNTC2
NM 006101 27 77
KRT14
BC042437 28 78
KRT17
AK095281 29 79
KRT5
M21389 30 80
MAPT
NM 001123066 31 81
MDM2
M92424 32 82
MELK
NM 014791 33 83
MIA
BG765502 34 84
MKI67
NM 002417 35 85
MLPH
NM 024101 36 86
MMP11
NM 005940 37 87
MYBL2
BX647151 38 88
MYC
NM 002467 39 89
NAT1
BC013732 40 90
ORC6L
NM 014321 41 91
PGR
NM 000926 42 92
PHGDH
AK093306 43 93
PTTG1
BE904476 44 94
RRM2
AK123010 45 95
SFRP1
BC036503 46 96
SLC39A6
NM 012319 47 97
TMEM45 B
AK098106 48 98
TYMS
BQ056428 49 99
UBE2C
BC032677 50 100
"Expresion genica" tal como se usa en el presente documento se refiere a los niveles de expresion y/o al patron de expresion relativos de un gen. La expresion de un gen puede medirse a nivel de ADN, ADNc, ARN, ARNm, o combinaciones de los mismos. "Perfil de expresion genica" se refiere a los niveles de expresion de multiples genes 5 diferentes medidos para la misma muestra. Un perfil de expresion puede derivarse de una muestra biologica recogida de un sujeto en uno o mas puntos de tiempo antes de, durante, o tras el diagnostico, el tratamiento o la terapia contra el cancer de mama (o cualquier combinacion de los mismos), puede derivarse de una muestra biologica recogida de un sujeto en uno o mas puntos de tiempo durante los que no hay tratamiento o terapia contra el cancer de mama (por ejemplo, para monitorizar la progresion de la enfermedad o para evaluar el desarrollo de la
10 enfermedad en un sujeto en riesgo de cancer de mama), o puede recogerse de un sujeto sano. Pueden medirse perfiles de expresion genica en una muestra, tales como muestras que comprenden una variedad de tipos celulares, tejidos diferentes, organos diferentes o fluidos (por ejemplo, sangre, orina, liquido cefalorraquideo, sudor, saliva o suero) mediante diversos metodos que incluyen pero no se limitan a tecnologias de micromatriz y tecnicas de RT-PCR cuantitativa y semicuantitativa.
15 Variables clinicas
El modelo de clasificacion PAM50 descrito en el presente documento puede combinarse adicionalmente con informacion sobre variables clinicas para generar un factor pronostico de riesgo de recidiva (ROR) continuo. Tal
20 como se describe en el presente documento, en la tecnica se describen varios de factores de cancer de mama clinicos y pronosticos y se usan para predecir el desenlace del tratamiento y la probabilidad de reaparicion de la enfermedad. Tales factores incluyen, por ejemplo, implicacion de ganglios linfaticos, tamano del tumor, grado histologico, estado del receptor de la hormona estrogeno y progesterona, niveles de HER-2 y ploidia tumoral.
25 En una realizacion, se proporciona una puntuacion de riesgo de recidiva (ROR) para un sujeto diagnosticado con o que se sospecha que tiene cancer de mama. Esta puntuacion usa el modelo de clasificacion PAM50 en combinacion con factores clinicos de estado de los ganglios linfaticos (N) y tamano del tumor(T). La evaluacion de variables clinicas se basa en el sistema normalizado del American Joint Committee on Cancer (AJCC) para estadificar el cancer de mama. En este sistema, se clasifica el tamano del tumor primario en una escala de 0-4 (T0: sin evidencia
30 de tumor primario; T1: : 2 cm; T2: > 2 cm -: 5 cm; T3: > 5 cm; T4: tumor de cualquier tamano con extension directa a la piel o la pared toracica). El estado de los ganglios linfaticos se clasifica como N0-N3 (N0: los ganglios linfaticos regionales estan libres de metastasis; N1: metastasis no movil, ganglio(s) linfatico(s) axilar(es) del mismo lado; N2: metastasis al/a los ganglio(s) linfatico(s) del mismo lado fijado(s) entre si o a otras estructuras; N3: metastasis a ganglios linfaticos del mismo lado por debajo del esternon). Los metodos de identificacion de pacientes con cancer
35 de mama y estadificacion del estadio de la enfermedad se conocen bien y pueden incluir examen manual, biopsia, revision la historia de la paciente y/o la familia, y tecnicas de obtencion de imagenes, tales como mamografia, obtencion de imagenes por resonancia magnetica (MRI) y tomografia de emision de positrones (PET).
Usando los metodos de clasificacion PAM50 de la presente invencion, puede determinarse el pronostico de una
40 paciente con cancer de mama independientemente de o en combinacion con la evaluacion de estos factores clinicos. En algunas realizaciones, combinar los metodos de clasificacion del subtipo intrinseco de cancer de mama PAM50 dados a conocer en el presente documento con evaluacion de estos factores clinicos puede permitir una evaluacion del riesgo mas precisa. Los metodos de la invencion pueden acoplarse adicionalmente con analisis de, por ejemplo, el estado de receptor de estrogeno (ER) y receptor de progesterona (PgR), y/o niveles de expresion de
45 HER-2. Otros factores, tales como la historia clinica de la paciente, la historia familiar y el estado menopausico, tambien pueden considerarse cuando se evalua el pronostico de cancer de mama por medio de los metodos de la invencion.
Fuente de la muestra
En una realizacion de la presente invencion, se evalua el subtipo de cancer de mama a traves de la evaluacion de patrones, o perfiles, de expresion, de los genes intrinsecos enumerados en la tabla 1 en una o mas muestras del sujeto. Para fines de descripcion, el termino sujeto, o muestra de sujeto, se refiere a un individuo independientemente de su estado de salud y/o de enfermedad. Un sujeto puede ser un sujeto, un participante de estudio, un sujeto control, un sujeto de examen, o cualquier otra clase de individuo del que se obtiene una muestra y se evalua en el contexto de la invencion. Por consiguiente, un sujeto puede estar diagnosticado con cancer de mama, puede presentar uno o mas sintomas de cancer de mama, o un factor de predisposicion, tal como un factor de historia familiar (genetico) o medica (medico), para cancer de mama, puede estar sometiendose a tratamiento o terapia contra el cancer de mama, o similares. Alternativamente, un sujeto puede estar sano con respecto a cualquiera de los factores o criterios mencionados anteriormente. Se apreciara que el termino "sano" tal como se usa en el presente documento, se refiere a estado de cancer de mama, ya que no puede definirse que el termino "sano" para corresponder a cualquier evaluacion o estado absoluto. Por tanto, un individuo que se define como sano con referencia a cualquier enfermedad o criterio de enfermedad especificados, puede estar diagnosticado de hecho con otra cualquiera o mas enfermedades, o presentar cualquier otro o mas criterios de enfermedad, incluyendo uno o mas canceres distintos de cancer de mama. Sin embargo, los controles sanos estan libres preferiblemente de cualquier cancer.
En realizaciones particulares, los metodos para predecir subtipos intrinsecos de cancer de mama incluyen recoger una muestra biologica que comprende una celula o tejido canceroso, tal como una muestra de tejido de mama o una muestra de tejido de tumor de mama primario. Mediante "muestra biologica" se pretende decir cualquier toma de muestras de celulas, tejidos o fluidos corporales en los que puede detectarse la expresion de un gen intrinseco. Los ejemplos de tales muestras biologicas incluyen, pero no se limitan a, biopsias y frotis. Los fluidos corporales utiles en la presente invencion incluyen sangre, linfa, orina, saliva, aspirados de pezones, fluidos ginecologicos o cualquier otra secrecion corporal o derivado de la misma. La sangre puede incluir sangre completa, plasma, suero o cualquier hemoderivado. En algunas realizaciones, la muestra biologica incluye celulas de mama, particularmente tejido de mama de una biopsia, tal como una muestra de tejido de tumor de mama. Las muestras biologicas pueden obtenerse de un sujeto mediante una variedad de tecnicas que incluyen, por ejemplo, raspando o frotando un area, usando una aguja para aspirar celulas o fluidos corporales, o extrayendo una muestra de tejido (es decir, biopsia). En la tecnica se conocen bien los metodos para recoger diversas muestras biologicas. En algunas realizaciones, una muestra de tejido de mama se obtiene mediante, por ejemplo, biopsia por aspiracion con aguja fina, biopsia con aguja gruesa o biopsia por escision. Pueden aplicarse disoluciones de fijacion o de tincion a las celulas o tejidos para conservar la muestra y para facilitar el examen. Las muestras biologicas, particularmente muestras de tejido de mama, pueden transferirse a un portaobjetos de vidrio para observacion con aumentos. En una realizacion, la muestra biologica es una muestra de tejido de mama incrustada en parafina, fijada en formalina, particularmente una muestra de tumor de mama primario. En diversas realizaciones, la muestra de tejido se obtiene de una muestra de nucleo de tejido guiado por patologo tal como se describe en el ejemplo 4.
Obtencion del perfil de expresion
En diversas realizaciones, la presente invencion proporciona metodos para clasificar, pronosticar o monitorizar cancer de mama en sujetos. En esta realizacion, los datos obtenidos del analisis de la expresion de genes intrinsecos se evaluan usando uno o mas algoritmos de reconocimiento de patrones. Tales metodos de analisis pueden usarse para formar un modelo predictivo, que puede usarse para clasificar datos de prueba. Por ejemplo, un metodo de clasificacion conveniente y particularmente eficaz emplea la creacion de modelos de analisis estadisticos de multiples variables, en primer lugar para formar un modelo (un "modelo matematico predictivo") usando datos ("datos de creacion de modelo") de muestras de un subtipo conocido (por ejemplo, de sujetos que se sabe que tienen un subtipo intrinseco de cancer de mama particular: LumA, LumB, de tipo basal, enriquecido en HER-2, o de tipo normal), y en segundo lugar para clasificar una muestra desconocida (por ejemplo, "muestra de prueba") segun el subtipo.
Se han usado ampliamente metodos de reconocimiento de patrones para caracterizar muchos tipos diferentes de problemas que varian, por ejemplo, entre linguistica, toma de huellas dactilares, quimica y psicologia. En el contexto de los metodos descritos en el presente documento, el reconocimiento de patrones es el uso de datos estadisticos de multiples variables, tanto parametricos como no parametricos, para analizar datos, y por tanto para clasificar muestras y para predecir el valor de alguna variable dependiente basandose en una variedad de mediciones observadas. Existen dos enfoques principales. Un conjunto de metodos se denomina "no supervisado" y estos simplemente reducen la complejidad de los datos de una manera racional y tambien producen diagramas de representacion que pueden interpretarse por el ojo humano. Sin embargo, este tipo de enfoque puede no ser adecuado para desarrollar un ensayo clinico que puede usarse para clasificar muestras derivadas de sujetos independientes de la poblacion de muestra inicial usada para entrenar el algoritmo de prediccion.
El otro enfoque se denomina "supervisado" mediante lo cual se usa un conjunto entrenado de muestras con clase o desenlace conocidos para producir un modelo matematico que entonces se evalua con conjuntos de datos de validacion independientes. En este caso, se usa un "conjunto de entrenamiento" de datos de expresion de genes
intrinsecos para construir un modelo estadistico que predice correctamente el "subtipo" de cada muestra. Este conjunto entrenado se somete entonces a prueba con datos independientes (denominados conjunto de validacion o prueba) para determinar la robustez del modelo basado en ordenador. Estos modelos se denominan en ocasiones "sistemas expertos", pero pueden basarse en una variedad de diferentes procedimientos matematicos. Los metodos supervisados pueden usar un conjunto de datos con dimensionalidad reducida (por ejemplo, los primeros pocos componentes principales), pero normalmente usan datos no reducidos, con toda la dimensionalidad. En todos los casos, los metodos permiten la descripcion cuantitativa de los limites de multiples variables que caracterizan y separan cada subtipo en lo que se refiere a su perfil de expresion de genes intrinsecos. Tambien es posible obtener limites de confianza sobre cualquier prediccion, por ejemplo, a nivel de probabilidad para ubicarse en la bondad de ajuste (vease, por ejemplo, Kowalski et al., 1986). La robustez de los modelos predictivos tambien puede comprobarse usando validacion cruzada, dejando fuera muestras seleccionadas del analisis.
El modelo de clasificacion PAM50 descrito en el presente documento se basa en el perfil de expresion genica para una pluralidad de muestras del sujeto usando los genes intrinsecos enumerados en la tabla 1. La pluralidad de muestras incluye un numero suficiente de muestras derivadas de sujetos que pertenecen a cada clase de subtipo. Por "muestras suficientes" o "numero representativo" en este contexto se pretende decir una cantidad de muestras derivadas de cada subtipo que es suficiente para construir un modelo de clasificacion que puede distinguir de manera fiable cada subtipo de todos los demas en el grupo. Un algoritmo de prediccion supervisado se desarrolla basandose en los perfiles de muestras prototipo seleccionadas objetivamente para "entrenar" el algoritmo. Las muestras se seleccionan y se clasifican en subtipos usando un conjunto de genes intrinsecos expandido segun los metodos dados a conocer en la publicacion de patente internacional WO 2007/061876, que se incorpora en el presente documento como referencia en su totalidad. Alternativamente, las muestras pueden clasificarse en subtipos segun cualquier ensayo conocido para clasificar subtipos de cancer de mama. Tras estratificar las muestras de entrenamiento segun el subtipo, se usa un algoritmo de prediccion basado en centroides para construir centroides basandose en el perfil de expresion del conjunto de genes intrinsecos descritos en la tabla 1.
En una realizacion, el algoritmo de prediccion es la metodologia del centroide mas cercano relacionada con la descrita en Narashiman y Chu (2002) PNAS 99:6567-6572, que se incorpora en el presente documento como referencia en su totalidad. En la presente invencion, el metodo calcula un centroide normalizado para cada subtipo. Este centroide es la expresion genica promedio para cada gen en cada subtipo (o "clase") dividida entre la desviacion estandar dentro de la clase para ese gen. La clasificacion del centroide mas cercano toma el perfil de expresion genica de una nueva muestra, y la compara con cada uno de estos centroides de clase. La prediccion de subtipo se realiza calculando la correlacion de rangos de Spearman de cada caso de prueba para los cinco centroides, y asignando una muestra a un subtipo basandose en el centroide mas cercano.
Deteccion de expresion de genes intrinsecos
En el presente documento se abarca cualquier metodo disponible en la tecnica para detectar la expresion de los genes intrinsecos enumerados en la tabla 1. Por "detectar la expresion" se pretende determinar la cantidad o presencia de un transcrito de ARN o su producto de expresion de un gen intrinseco.
Los metodos para detectar la expresion de los genes intrinsecos de la invencion, es decir, obtencion de perfiles de expresion genica, incluyen metodos basados en analisis de hibridacion de polinucleotidos, metodos basados en la secuenciacion de polinucleotidos, metodos inmunohistoquimicos y metodos basados en analisis proteomicos. Los metodos detectan generalmente productos de expresion (por ejemplo, ARNm) de los genes intrinsecos enumerados en la tabla 1. En realizaciones preferidas, se usan metodos basados en PCR, tales como PCR de transcripcion inversa (RT-PCR) (Weis et al., TIG 8:263-64, 1992), y metodos basados en matrices tales como micromatriz (Schena et al., Science 270:467-70, 1995). Por "micromatriz" se pretende decir una disposicion ordenada de elementos de matriz que pueden hibridarse, tales como, por ejemplo, sondas de polinucleotido, sobre un sustrato. El termino "sonda" se refiere a cualquier molecula que puede unirse selectivamente a una biomolecula diana prevista especificamente, por ejemplo, un transcrito de nucleotido o una proteina codificada por o que corresponde a un gen intrinseco. Un experto en la tecnica puede sintetizar sondas, o pueden derivarse de preparaciones biologicas apropiadas. Pueden disenarse las sondas especificamente para marcarse. Los ejemplos de moleculas que pueden utilizarse como sondas incluyen, pero no se limitan a, ARN, ADN, proteinas, anticuerpos y moleculas organicas.
Muchos metodos de deteccion de la expresion usan ARN aislado. El material de partida es normalmente ARN total aislado de una muestra biologica, tal como un tumor o linea celular de tumor, y tejido o linea celular normales correspondientes, respectivamente. Si la fuente de ARN es un tumor primario, puede extraerse ARN (por ejemplo, ARNm), por ejemplo, de muestras de tejido congeladas o archivadas incrustadas en parafina y fijadas (por ejemplo, fijadas en formalina) (por ejemplo, muestras de nucleo de tejido guiado por patologo).
En la tecnica se conocen bien metodos generales para la extraccion de ARN y se dan a conocer en libros de texto convencionales de biologia molecular, que incluyen Ausubel et al., ed., Current Protocols in Molecular Biology, John Wiley & Sons, Nueva York 1987-1999. Se dan a conocer metodos para la extraccion de ARN a partir de tejidos incrustados en parafina, por ejemplo, en Rupp y Locker (Lab Invest. 56:A67, 1987) y De Andres et al. (Biotechniques 18:42-44, 1995). En particular, el aislamiento de ARN puede realizarse usando un kit de purificacion, un conjunto de
tampones y proteasa de fabricantes comerciales, tales como Qiagen (Valencia, CA), segun las instrucciones del fabricante. Por ejemplo, puede aislarse ARN total de celulas en cultivo usando mini-columnas RNeasy de Qiagen. Otros kits de aislamiento de ARN disponibles comercialmente incluyen kit de purificacion de ADN y ARN completo MASTERPURET (Epicentre, Madison, Wis.) y kit de aislamiento de ARN en bloque de parafina (Ambion, Austin, TX). Puede aislarse el ARN total de muestras de tejido, por ejemplo, usando ARN Stat-60 (Tel-Test, Friendswood, TX). Puede aislarse ARN preparado a partir de un tumor, por ejemplo, mediante centrifugacion en gradiente de densidad con cloruro de cesio. Adicionalmente, pueden procesarse facilmente grandes numeros de muestras de tejido usando tecnicas bien conocidas por los expertos en la tecnica, tales como, por ejemplo, el procedimiento de aislamiento de ARN de etapa individual de Chomczynski (patente estadounidense n.D 4.843.155).
Puede usarse ARN aislado en ensayos de hibridacion o amplificacion que incluyen, pero no se limitan a, analisis de PCR y matrices de sonda. Un metodo para la deteccion de niveles de ARN implica poner en contacto el ARN aislado con una molecula de acido nucleico (sonda) que puede hibridarse con el ARNm codificado por el gen que esta detectandose. La sonda de acido nucleico puede ser, por ejemplo, un ADNc de longitud completa, o una parte del mismo, tal como un oligonucleotido de al menos 7, 15, 30, 60, 100, 250 o 500 nucleotidos de longitud y suficiente para hibridarse especificamente en condiciones rigurosas con un gen intrinseco de la presente invencion, o cualquier ADN o ARN derivado. La hibridacion de un ARNm con la sonda indica que el gen intrinseco en cuestion se esta expresando.
En una realizacion, el ARNm se inmoviliza sobre una superficie solida y se pone en contacto con una sonda, por ejemplo haciendo correr el ARNm aislado en un gel de agarosa y transfiriendo el ARNm del gel a una membrana, tal como nitrocelulosa. En una realizacion alternativa, las sondas se inmovilizan sobre una superficie solida y el ARNm se pone en contacto con las sondas, por ejemplo, en una matriz de chip de genes de Agilent. Un experto en la tecnica puede adaptar facilmente metodos de deteccion de ARNm conocidos para su uso en la deteccion del nivel de expresion de los genes intrinsecos de la presente invencion.
Un metodo alternativo para determinar el nivel de producto de la expresion de genes intrinsecos en una muestra implica el procedimiento de amplificacion de acido nucleico, por ejemplo, mediante RT-PCR (patente estadounidense n.D 4.683.202), reaccion en cadena de la ligasa (Barany, Proc. Natl. Acad. Sci. USA 88:189-93, 1991), replicacion de secuencia autosostenida (Guatelli et al., Proc. Natl. Acad Sci. USA 87:1874-78, 1990), sistema de amplificacion transcripcional (Kwoh et al., Proc. Natl. Acad. Sci. USA 86:1173-77, 1989), replicasa Q-Beta (Lizardi et al., Bio/Technology 6:1197, 1988), replicacion en circulo rodante (patente estadounidense n.D 5.854.033), o cualquier otro metodo de amplificacion de acido nucleico, seguido por la deteccion de las moleculas amplificadas usando tecnicas bien conocidas por los expertos en la tecnica. Estos esquemas de deteccion son especialmente utiles para la deteccion de moleculas de acido nucleico si tales moleculas estan presentes en numeros muy bajos.
En aspectos particulares de la invencion, la expresion de genes intrinsecos se evalua mediante RT-PCR cuantitativa. En la tecnica se conocen numerosos protocolos de PCR o QPCR diferentes y se muestran a modo de ejemplo a continuacion en el presente documento y pueden aplicarse directamente o adaptarse para su uso usando las composiciones descritas actualmente para la deteccion y/o cuantificacion de los genes intrinsecos enumerados en la tabla 1. Generalmente, en la PCR, se amplifica una secuencia de polinucleotido diana mediante la reaccion con al menos un cebador oligonucleotidico o par de cebadores oligonucleotidicos. El/los cebador(es) se hibridan en una region complementaria del acido nucleico diana y una ADN polimerasa extiende el/los cebador(es) para amplificar la secuencia diana. En condiciones suficientes para proporcionar productos de la amplificacion de acido nucleico basados en polimerasa, un fragmento de acido nucleico de un tamano domina los productos de reaccion (la secuencia de polinucleotido diana que es el producto de amplificacion). Se repite el ciclo de amplificacion para aumentar la concentracion de la secuencia de polinucleotido diana individual. La reaccion puede realizarse en cualquier termociclador usado comunmente para PCR. Sin embargo, se prefieren cicladores con capacidades de medicion de fluorescencia en tiempo real, por ejemplo, SMARTCYCLER® (Cepheid, Sunnyvale, CA), ABI PRISM 7700® (Applied Biosystems, Foster City, Calif.), ROTOR-GENET (Corbett Research, Sydney, Australia), LIGHTCYCLER® (Roche Diagnostics Corp, Indianapolis, Ind.), ICYCLER® (Biorad Laboratories, Hercules, Calif.) y MX4000® (Stratagene, La Jolla, Calif.).
Se prefiere la PCR cuantitativa (QPCR) (tambien denominada PCR en tiempo real) en algunas circunstancias ya que no solo proporciona una medicion cuantitativa, sino que tambien tiempo y contaminacion reducidos. En algunos casos, la disponibilidad de tecnicas de obtencion de perfiles de expresion genica completa esta limitada debido a requisitos de tejido recien congelado y equipo de de laboratorio especializado, haciendo que el uso de rutina de tales tecnologias sea dificil en la practica clinica. Sin embargo, la medicion de genes de QPCR puede aplicarse a bloques de tumores clinicos incrustados en parafina, fijados en formalina convencionales, tales como los usados en bancos de tejido de archivo y muestras de patologia quirurgica de rutina (Cronin et al. (2007) Clin Chem 53:1084-91) [Mullins 2007][Paik 2004]. Tal como se usa en el presente documento, "PCR cuantitativa (o "QPCR en tiempo real") se refiere a la monitorizacion directa del progreso de amplificacion de PCR mientras se produce sin necesidad de tomar muestras repetidamente de los productos de reaccion. En la PCR cuantitativa, los productos de reaccion pueden monitorizarse por medio de un mecanismo de senalizacion (por ejemplo, fluorescencia) mientras se generan y se controlan despues de que la senal ascienda por encima de un nivel de fondo pero antes de que la reaccion alcance una meseta. El numero de ciclos requerido para lograr un nivel detectable o "umbral" de fluorescencia varia directamente con la concentracion de dianas amplificables al principio del procedimiento de PCR, permitiendo una medicion de la intensidad de senal para proporcionar una medida de la cantidad de acido nucleico diana en una muestra en tiempo real.
En otra realizacion de la invencion, se usan micromatrices para la obtencion del perfil de expresion. Las micromatrices son particularmente adecuadas para este fin debido a la reproducibilidad entre diferentes experimentos. Las micromatrices de ADN proporcionan un metodo para la medicion simultanea de los niveles de expresion de grandes numeros de genes. Cada matriz consiste en un patron reproducible de sondas de captura unidas a un soporte solido. El ARN o ADN marcado se hibrida con las sondas complementarias en la matriz y entonces se detectan mediante exploracion por laser. Se determinan las intensidades de hibridacion para cada sonda en la matriz y se convierten en un valor cuantitativo que representa niveles de expresion genica relativos. Veanse, por ejemplo, las patentes estadounidenses n. os 6.040.138, 5.800.992 y 6.020.135, 6.033.860 y 6.344.316. Las matrices de oligonucleotido de alta densidad son particularmente utiles para determinar el perfil de expresion genica para un gran numero de ARN en una muestra.
Tecnicas para la sintesis de estas matrices usando metodos de sintesis mecanica se describen en, por ejemplo, la patente estadounidense n. D 5.384.261. Aunque generalmente se usa una superficie de matriz plana, la matriz puede fabricarse sobre una superficie de practicamente cualquier forma o incluso una multiplicidad de superficies. Las matrices pueden ser acidos nucleicos (o peptidos) sobre perlas, geles, superficies polimericas, fibras (tal como fibra optica), vidrio, o cualquier otro sustrato apropiado. Veanse, por ejemplo, las patentes estadounidenses n. os 5.770.358, 5.789.162, 5.708.153, 6.040.193 y 5.800.992. Las matrices pueden envasarse de tal manera que se permita el diagnostico u otra manipulacion de un dispositivo todo incluido. Veanse, por ejemplo, las patentes estadounidenses n. os 5.856.174 y 5.922.591.
En una realizacion especifica de la tecnica de micromatriz, se aplican insertos amplificados por PCR de clones de ADNc a un sustrato en una matriz densa. Los genes sometidos a micromatriz, inmovilizados en el microchip, son adecuados para la hibridacion en condiciones rigurosas. Pueden generarse sondas de ADNc marcadas fluorescentemente a traves de la incorporacion de nucleotidos fluorescentes mediante transcripcion inversa de ARN extraido de tejidos de interes. Las sondas de ADNc marcadas aplicadas al chip se hibridan con especificidad a cada punto de ADN sobre la matriz. Tras lavado riguroso para eliminar sondas no unidas especificamente, se explora el chip mediante microscopia laser confocal o mediante otro metodo de deteccion, tal como una camara de CCD. La cuantificacion de hibridacion de cada elemento sometido a matriz permite la evaluacion de la abundancia de ARNm correspondiente.
Con fluorescencia de color doble, se hibridan por parejas a la matriz sondas de ADNc marcadas por separado generadas a partir de dos fuentes de ARN. Por tanto, la abundancia relativa de los transcritos de las dos fuentes que se corresponden con cada gen especificado se determina simultaneamente. La escala miniaturizada de la hibridacion proporciona una evaluacion conveniente y rapida del patron de expresion para grandes numeros de genes. Se ha mostrado que tales metodos tienen la sensibilidad requerida para detectar transcritos raros, que se expresan en algunas copias por celula, y para detectar reproduciblemente al menos aproximadamente diferencias de dos veces en los niveles de expresion (Schena et al., Proc. Natl. Acad. Sci. USA 93:106-49, 1996). Los analisis de micromatriz pueden realizarse mediante equipo disponible comercialmente, siguiendo los protocolos del fabricante, tales como usar la tecnologia GenChip de Affymetrix o tecnologia de micromatriz de inyeccion de tinta de Agilent. El desarrollo de metodos de micromatriz para analisis a gran escala de la expresion genica hace posible buscar de manera sistematica marcadores moleculares de clasificacion del cancer y prediccion de desenlace en una variedad de tipos de tumor.
Procesamiento de datos
A menudo es util procesar previamente los datos de expresion genica, por ejemplo, mediante tratamiento de datos que faltan, traduccion, ajuste a escala, normalizacion, ponderacion, etc. Los metodos de proyeccion de multiples variables, tales como analisis del componente principal (PCA) y analisis de minimos cuadrados parcial (PLS), son los denominados metodos sensibles de ajuste a escala. Usando el conocimiento y la experiencia anterior sobre el tipo de datos estudiados, la calidad de los datos antes de la obtencion del modelo de multiples variables puede potenciarse mediante el ajuste a escala y/o la ponderacion. El ajuste a escala y/o la ponderacion adecuados pueden revelar una variacion importante e interesante oculta en los datos, y por tanto hacen que la obtencion de modelo de multiples variables posterior sea mas eficaz. El ajuste a escala y la ponderacion pueden usarse para colocar los datos en la metrica correcta, basandose en el conocimiento y la experiencia del sistema estudiado, y por tanto revelar patrones ya presentes de manera inherente en los datos.
Si es posible, los datos que faltan, por ejemplo huecos en valores de columna, deberian evitarse. Sin embargo, si es necesario, tales datos que faltan pueden sustituirse o "imputarse" con, por ejemplo, el valor medio de una columna ("imputacion media"); un valor aleatorio ("imputacion aleatoria"); o un valor basado en un analisis de componente principal ("imputacion de componente principal").
La "traduccion" de los ejes de coordenadas del descriptor puede ser util. Los ejemplos de tales traducciones incluyen normalizacion y centrado en la media. La "normalizacion" puede usarse para eliminar variaciones de muestra a muestra. Para datos de micromatriz, el procedimiento de normalizacion busca eliminar errores sistematicos equilibrando las intensidades de fluorescencia de los dos colorantes de marcado. El sesgo del colorante puede proceder de diversas fuentes, incluyendo diferencias en la eficacia de marcado del colorante, sensibilidad al calor y a la luz, asi como parametros de exploracion para explorar dos canales. Algunos metodos usados comunmente para calcular el factor de normalizacion incluyen: (i) normalizacion global que usa todos los genes sobre la matriz; (ii) normalizacion de genes de mantenimiento que usa genes de mantenimiento/invariables que se expresan constantemente; y (iii) normalizacion de controles internos que usa una cantidad conocida de genes de control exogenos anadida durante la hibridacion (Quackenbush (2002) Nat. Genet. 32 (Supl.), 496-501). En una realizacion, los genes intrinsecos dados a conocer en el presente documento pueden normalizarse para controlar genes de mantenimiento. Por ejemplo, los genes de mantenimiento descritos en la publicacion de patente estadounidense 2008/0032293, que se incorpora en el presente documento como referencia en su totalidad, pueden usarse para la normalizacion. Los genes de mantenimiento a modo de ejemplo incluyen MRPL19, PSMC4, SF3A1, PUM1, ACTB, GAPD, GUSB, RPLP0 y TFRC. Un experto en la tecnica entendera que los metodos dados a conocer en el presente documento no estan asociados mediante normalizacion a ningun gen de mantenimiento particular, y que puede usarse cualquier gen de mantenimiento adecuado conocido en la tecnica.
Son posibles muchos enfoques de normalizacion, y a menudo pueden aplicarse en cualquiera de varios puntos en el analisis. En una realizacion, los datos de micromatriz se normalizan usando el metodo LOWESS, que es una funcion de normalizacion de suavizacion de la dispersion ponderada localmente global. En otra realizacion, los datos de qPCR se normalizan para dar la media geometrica del conjunto de multiples genes de mantenimiento.
El "centrado en la media" tambien puede usarse para simplificar la interpretacion. Habitualmente, para cada descriptor, se resta el valor promedio de ese descriptor para todas las muestras. De esta manera, la media de un descriptor coincide con el origen, y todos los descriptores se "centran" a cero. En "ajuste a escala de la varianza unitaria", los datos ajustarse a escala hasta una varianza igual. Habitualmente, el valor de cada descriptor se ajusta a escala mediante 1/DE, donde DE es la desviacion estandar para ese descriptor para todas las muestras. El "ajuste a escala de Pareto" es, en algunos casos, intermedio entre el centrado en la media y el ajuste a escala de la varianza unitaria. En el ajuste a escala de Pareto, el valor de cada descriptor se ajusta a escala mediante 1/(DE)2, donde DE es la desviacion estandar para ese descriptor para todas las muestras. De esta manera, cada descriptor tiene una varianza numericamente igual a su desviacion estandar inicial. El ajuste a escala de Pareto puede realizarse, por ejemplo, sobre los datos sin procesar o los datos centrados en la media.
El "ajuste a escala logaritmico" puede usarse para ayudar en la interpretacion cuando los datos tienen un sesgo positivo y/o cuando los datos abarcan una gran amplitud, por ejemplo, varios ordenes de magnitud. Habitualmente, para cada descriptor, el valor se sustituye por el logaritmo de ese valor. En "ajuste a escala de amplitud igual", cada descriptor se divide entre la amplitud de ese descriptor para todas las muestras. De esta manera, todos los descriptores tienen la misma amplitud, es decir, 1. Sin embargo, este metodo es sensible a la presencia de puntos de valores atipicos. En "ajuste a escala automatica", cada vector de datos se centra en la media y se mide a escala la varianza unitaria. Esta tecnica es muy util debido a que cada descriptor se pondera entonces igualmente, y los valores grandes y pequenos se tratan con el mismo enfasis. Esto puede ser importante para genes expresados a niveles muy bajos, pero todavia detectables.
En una realizacion, se recogen los datos para una o mas muestras de prueba y se clasifican usando el modelo de clasificacion PAM50 descrito en el presente documento. Cuando se comparan los datos de multiples analisis (por ejemplo, comparacion de los perfiles de expresion para una o mas muestras de prueba con los centroides construidos a partir de las muestras recogidas y analizadas en un estudio independiente), sera necesario normalizar los datos a lo largo de estos conjuntos de datos. En una realizacion, se usa discriminacion ponderada por distancia (DWD) para combinar estos conjuntos de datos entre si (Benito et al. (2004) Bioinformatics 20(1):105-114, incorporado como referencia en el presente documento en su totalidad). DWD es una herramienta de analisis de multiples variables que puede identificar sesgos sistematicos presentes en conjuntos de datos separados y despues llevar a cabo un ajuste global para compensar estos sesgos; en esencia, cada conjunto de datos separado es una nube multidimensional de puntos de datos, y DWD toma dos nubes de puntos y cambia una de manera que solape mas optimamente a la otra.
Los metodos descritos en el presente documento pueden implementarse y/o los resultados registrarse usando cualquier dispositivo que pueda implementar los metodos y/o registrar los resultados. Los ejemplos de dispositivos que pueden usarse incluyen pero no se limitan a dispositivos computacionales electronicos, incluyendo ordenadores de todos los tipos. Cuando los metodos descritos en el presente documento se implementan y/o registran en un ordenador, el programa informatico que puede usarse para configurar el ordenador para llevar a cabo las etapas de los metodos puede contenerse en cualquier medio legible por ordenador que puede contener el programa informatico. Los ejemplos de medio legible por ordenador que pueden usarse incluyen pero no se limitan a disquetes, CD-ROM, DVD, ROM, RAM, y otros dispositivos de almacenamiento informatico y de memoria. El programa informatico que puede usarse para configurar el ordenador para llevar a cabo las etapas de los metodos y/o registrar los resultados tambien puede proporcionarse por una red electronica, por ejemplo, por internet, una intranet, u otra red.
Calculo de riesgo de recidiva
En el presente documento se proporcionan metodos para predecir desenlace de cancer de mama dentro del contexto del subtipo intrinseco y opcionalmente otras variables clinicas. Desenlace puede referirse a supervivencia especifica de la enfermedad o global, supervivencia libre de acontecimiento o desenlace en respuesta a un tratamiento o una terapia particular. En particular, los metodos pueden usarse para predecir la probabilidad de supervivencia libre de enfermedad, a largo plazo. La "prediccion de la probabilidad de supervivencia de una paciente con cancer de mama" pretende evaluar el riesgo de que una paciente muera como resultado del cancer de mama subyacente. "Supervivencia libre de enfermedad, a largo plazo" pretende significar que la paciente no muere de o padece una reaparicion del cancer de mama subyacente a lo largo de un periodo de al menos cinco anos, o al menos diez o mas anos, tras el diagnostico o tratamiento inicial.
En una realizacion, se predice el desenlace basandose en la clasificacion de un sujeto segun subtipo. Esta clasificacion se basa en la obtencion del perfil de expresion usando la lista de genes intrinsecos enumerados en la tabla 1. Tal como se trata en el ejemplo 1, el subtipo de tumor segun el modelo PAM50 era mas indicativo de respuesta a quimioterapia que la clasificacion de marcador clinico convencional. Los tumores clasificados como HER2+ usando marcadores clinicos pero no enriquecidos en HER-2 usando el modelo PAM50 tenian una respuesta completa patologica menor (pCR) a un regimen de paclitaxel, 5-fluorouracilo, adriamicina y ciclofosfamida (T/FAC) que los tumores clasificados como HER2+ clinicamente y que pertenecen al subtipo de expresion enriquecido en HER-2. De manera similar, los tumores de tipo basal que no se puntuaron clinicamente como triple-negativos (ER-, PgR- y HER2-) tenian una pCR mas alta en comparacion con tumores triple-negativos que no eran de tipo basal mediante PAM50. Por tanto, el modelo PAM50 puede usarse para predecir con mas precision la respuesta a la quimioterapia que los marcadores clinicos convencionales.
Ademas de proporcionar una asignacion de subtipo, el modelo bioinformatico PAM50 proporciona una medicion de la similitud de una muestra de prueba para los cuatro subtipos que se traduce en una puntuacion de riesgo de recidiva (ROR) que puede usarse en cualquier poblacion de pacientes independientemente del estado patologico y las opciones de tratamiento. Los subtipos intrinsecos y ROR tambien tiene valor en la prediccion de respuesta completa patologica en mujeres tratadas con, por ejemplo, quimioterapia de taxano y antraciclina neoadyuvante [Rouzier 2005]. Por tanto, en diversas realizaciones de la presente invencion, se usa un modelo de riesgo de recidiva (ROR) para predecir el desenlace. Usando estos modelos de riesgo, los sujetos pueden estratificarse en grupos de riesgo de recidiva bajo, medio y alto. El calculo de ROR puede proporcionar informacion de pronostico para orientar las decisiones de tratamiento y/o monitorizar la respuesta a terapia.
En algunas realizaciones descritas en el presente documento, el rendimiento pronostico de los subtipos intrinsecos y/u otros parametros clinicos definidos en PAM50 se evalua utilizando un analisis de modelo de riesgos proporcionales de Cox, que es un metodo de regresion para datos de supervivencia que proporciona una estimacion de la razon de riesgo y su intervalo de confianza. El modelo de Cox es una tecnica estadistica bien reconocida para explorar la relacion entre la supervivencia de una paciente y variables particulares. Este metodo estadistico permite la estimacion del riesgo de individuos dadas sus variables pronosticas (por ejemplo, perfil de expresion de genes intrinsecos con o sin factores clinicos adicionales, tal como se describio en el presente documento). La "razon de riesgo" es el riesgo de muerte a cualquier punto de tiempo dado para pacientes que presentan variables pronosticas particulares. Vease de manera general Spruance et al., Antimicrob. Agents & Chemo. 48:2787-92, 2004.
El modelo de clasificacion PAM50 descrito en el presente documento puede entrenarse para determinar el riesgo de recidiva usando distancias de subtipo (o correlaciones) solas, o usando distancias de subtipo con variables clinicas tal como se trato anteriormente. En una realizacion, la puntuacion de riesgo para una muestra de prueba se calcula usando distancias de subtipo intrinseco solas usando la siguiente ecuacion: ROR = 0,05*Basal + 0,11*Her2 + -0,25*LumA + 0,07*LumB + -0,11*Normal, en la que las variables "Basal", "Her2", "LumA", "LumB" y "Normal" son las distancias al centroide de cada clasificador respectivo cuando se compara el perfil de expresion de una muestra de prueba con centroides construidos usando los datos de expresion genica depositados con el Gene Expression Omnibus (GEO) como numero de registro GSE2845. Puede accederse a estos datos en la direccion de internet www.ncbi.nlm.nih.gov/geo; tambien es posible que puedan usarse otros conjuntos de datos para derivar coeficientes del modelo de Cox similares. Cuando se usa la lista de genes intrinsecos expuesta en la tabla 1 para desarrollar un modelo de prediccion a partir de un conjunto de muestras distinto de las muestras usadas para derivar el conjunto de datos depositado como GSE2845, pueden usarse los metodos descritos en el ejemplo 1 o el ejemplo 3 para construir una formula para calcular el riesgo de recidiva a partir de este conjunto de muestras alternativo.
La puntuacion de riesgo tambien puede calcularse usando una combinacion de subtipo de cancer de mama y las variables clinicas tamano del tumor (T) y estado de los ganglios linfaticos (N) usando la siguiente ecuacion: ROR (completo) = 0,05*Basal + 0,1*Her2 + -0,19*LumA + 0,05*LumB + -0,09*Normal + 0,16*T + 0,08*N, de nuevo cuando se comparan perfiles de expresion de prueba con centroides construidos usando los datos de expresion genica depositados con GEO como numero de registro GSE2845.
Aun en otra realizacion, la puntuacion de riesgo para una muestra de prueba se calcula usando distancias de subtipo intrinseco solas usando la siguiente ecuacion:
ROR-S = 0,05*Basal + 0,12*Her2 + -0,34*LumA + 0,023*LumB,
en la que las variables "Basal", "Her2", "LumA" y "LumB" son tal como se definieron anteriormente y los perfiles de expresion de prueba se comparan con centroides construidos usando los datos de expresion genica depositados con GEO como numero de registro GSE2845.
Aun en otra realizacion, la puntuacion de riesgo tambien puede calcularse usando una combinacion de subtipo de cancer de mama y la variable clinica tamano del tumor (T) usando la siguiente ecuacion (en la que las variables son tal como se describieron anteriormente):
ROR-C = 0,05*Basal + 0,11*Her2 + -0,23*LumA + 0,09*LumB + 0,17*T.
Prediccion de la respuesta a terapia
El cancer de mama se trata mediante varias estrategias alternativas que pueden incluir, por ejemplo, cirugia, radioterapia, terapia hormonal, quimioterapia o alguna combinacion de las mismas. Tal como se conoce en la tecnica, las decisiones del tratamiento para pacientes con cancer de mama individuales pueden basarse en la receptividad endocrina del tumor, el estado menopausico de la paciente, la ubicacion y el numero de ganglios linfaticos de la paciente implicados, el estado de receptor de estrogeno y progesterona del tumor, el tamano del tumor primario, la edad de la paciente y el estadio de la enfermedad en el diagnostico. El analisis de una variedad de factores clinicos y ensayos clinicos ha conducido al desarrollo de recomendaciones y directrices de tratamiento para cancer de mama en estadio temprano por el Panel de Consenso Internacional ("International Consensus Panel") de la conferencia de St. Gallen (2005). Vease, Goldhirsch et al., Annals Oncol. 16:1569-83, 2005. Las directrices recomiendan que a las pacientes se les ofrezca quimioterapia para enfermedad no sensible endocrina; terapia endocrina como terapia principal para enfermedad sensible endocrina, anadiendo quimioterapia para algunos grupos de riesgo intermedio y todos los de riesgo alto en esta categoria; y tanto quimioterapia como terapia endocrina para todas las pacientes en la categoria de respuesta endocrina incierta excepto las que esten en el grupo de riesgo bajo.
La estratificacion de pacientes segun el riesgo de recidiva usando el modelo PAM50 y la puntuacion de riesgo dados a conocer en el presente documento proporcionan un factor de decision de tratamiento adicional o alternativo. Los metodos comprenden evaluar el riesgo de recidiva usando el modelo de clasificacion PAM50 opcionalmente en combinacion con una o mas variables clinicas, tales como estado de los ganglios, tamano del tumor y estado de ER. La puntuacion de riesgo puede usarse para orientar las decisiones de tratamiento. Por ejemplo, un sujeto que tiene una puntuacion de riesgo bajo puede que no se beneficie de determinados tipos de terapia, mientras que un sujeto que tiene una puntuacion de riesgo alto puede estar indicado para una terapia mas agresiva.
Los metodos de la invencion encuentran uso particular en la eleccion del tratamiento apropiado para pacientes con cancer de mama en estadio temprano. La mayoria de las pacientes con cancer de mama diagnosticadas en un estadio temprano de la enfermedad disfrutan de supervivencia a largo plazo tras cirugia y/o radioterapia sin terapia adyuvante adicional. Sin embargo, un porcentaje significativo (aproximadamente el 20%) de estas pacientes padecera reaparicion de la enfermedad o muerte, conduciendo a la recomendacion clinica de que algunas o todas las pacientes con cancer de mama en estadio temprano deben recibir terapia adyuvante. Los metodos de la presente invencion encuentran uso en la identificacion de esta poblacion de mal pronostico, de riesgo alto de pacientes con cancer de mama en estadio temprano y en la determinacion de ese modo de que pacientes se beneficiarian de terapia continuada y/o mas agresiva y monitorizacion estrecha tras el tratamiento. Por ejemplo, las pacientes con cancer de mama en estadio temprano que se ha evaluado que tienen una puntuacion de riesgo alto mediante los metodos dados a conocer en el presente documento pueden seleccionarse para una terapia adyuvante mas agresiva, tal como quimioterapia, tras cirugia y/o tratamiento con radiacion. En realizaciones particulares, los metodos de la presente invencion pueden usarse junto con las directrices de tratamiento establecidas por la conferencia de St. Gallen para permitir a los medicos tomar decisiones de tratamiento del cancer de mama mas informadas.
En diversas realizaciones, el modelo de clasificacion PAM50 proporciona informacion sobre subtipos de cancer de mama que no puede obtenerse usando ensayos clinicos convencionales tales como inmunohistoquimica u otros analisis histologicos. Por ejemplo, los sujetos que se han clasificado como receptor de estrogeno (ER)-positivos y/o receptor de progesterona (PR)-positivos podrian estar indicados segun las directrices convencionales para la terapia endocrina. Tal como se trata en el ejemplo 2, el modelo dado a conocer en el presente documento puede identificar un subconjunto de estos casos ER+/PgR+ que se clasifican como de tipo basal, lo que puede indicar la necesidad de terapia mas agresiva que no estaria indicada basandose solo en el estado de ER o PgR.
Por tanto, los metodos dados a conocer en el presente documento tambien encuentran uso en la prediccion de la respuesta de una paciente con cancer de mama a un tratamiento seleccionado. "Prediccion de la respuesta de una paciente con cancer de mama a un tratamiento seleccionado" pretende significar evaluar la probabilidad de que una paciente experimente un desenlace positivo o negativo con un tratamiento particular. Tal como se usa en el presente documento, "indicativo de un desenlace de tratamiento positivo" se refiere a un aumento de la probabilidad de que la paciente experimente resultados beneficiosos a partir del tratamiento seleccionado (por ejemplo, remision completa o parcial, reduccion del tamano del tumor, etc.). "Indicativo de un desenlace de tratamiento negativo" pretende significar un aumento de la probabilidad de que la paciente no se beneficie del tratamiento seleccionado con respecto a la progresion del cancer de mama subyacente.
En algunas realizaciones, el tiempo relevante para evaluar el pronostico o el tiempo de supervivencia libre de enfermedad empieza con la eliminacion quirurgica del tumor o la supresion, mitigacion o inhibicion del crecimiento tumoral. En otra realizacion, la puntuacion de riesgo basada en PAM50 se calcula basandose en una muestra obtenida tras el inicio de la terapia neoadyuvante tal como terapia endocrina. La muestra puede tomarse a cualquier tiempo tras el inicio de la terapia, pero preferiblemente se obtiene tras aproximadamente un mes de modo que la terapia neoadyuvante pueda cambiarse a quimioterapia en pacientes que no responden. Se ha mostrado que un subconjunto de tumores indicados para el tratamiento endocrino antes de la cirugia no responde a esta terapia. El modelo proporcionado en el presente documento puede usarse para identificar tumores agresivos que es probable que no respondan a la terapia endocrina, incluso cuando los tumores son positivos para receptores de estrogeno y/o progesterona. En esta realizacion, se obtiene una puntuacion de riesgo de PAM50 ponderada para la proliferacion segun la siguiente ecuacion: RSp = (-0,0129*Basal) + (0,106*Her2) + (-0,112*LumA) + (0,039*LumB) + (-0,069*Normal) + (0,272*Prolif), en la que la puntuacion de proliferacion ("prolif") se asigna como la medicion media de los siguientes genes (tras la normalizacion): CCNB1, UBE2C, BIRC5, KNTC2, CDC20, PTTG1, RRM2, MK167, TYMS, CEP55 y CDCA 1. Todas las otras variables son las mismas que las ecuaciones de RS descritas a continuacion. Tal como se trata en el ejemplo 2, la evaluacion de la puntuacion de riesgo tras el inicio de la terapia es mas predictivo del desenlace al tratamiento, al menos en una poblacion de pacientes ER+ que estan sometiendose a terapia endocrina neoadyuvante.
Kits
La presente invencion tambien proporciona kits utiles para clasificar subtipos intrinsecos de cancer de mama y/o proporcionar informacion de pronostico. Estos kits comprenden un conjunto de sondas de captura y/o cebadores especificos para los genes intrinsecos enumerados en la tabla 1, asi como reactivos suficientes para facilitar la deteccion y/o la cuantificacion del producto de la expresion de genes intrinsecos. El kit puede comprender ademas un medio legible por ordenador.
En una realizacion de la presente invencion, las sondas de captura estan inmovilizadas sobre una matriz. Por "matriz" se pretende decir un soporte solido o un sustrato con sondas peptidicas o de acido nucleico unidas al soporte o sustrato. Las matrices comprenden normalmente una pluralidad de diferentes sondas de captura que estan acopladas a una superficie de un sustrato en diferentes ubicaciones conocidas. Las matrices de la invencion comprenden un sustrato que tiene una pluralidad de sondas de captura que pueden unirse especificamente a un producto de expresion de genes intrinsecos. El numero de sondas de captura sobre el sustrato varia con el fin para el que la matriz este prevista. Las matrices pueden ser matrices de baja densidad o matrices de alta densidad y pueden contener 4 o mas, 8 o mas, 12 o mas, 16 o mas, 32 o mas direcciones, pero como minimo comprenderan sondas de captura para los 50 genes intrinsecos enumerados en la tabla 1.
Se describen tecnicas para la sintesis de estas matrices usando metodos de sintesis mecanica en, por ejemplo, la patente estadounidense n. D 5.384.261, incorporada en el presente documento como referencia en su totalidad para todos los fines. La matriz puede fabricarse sobre una superficie de practicamente cualquier forma o incluso una multiplicidad de superficies. Las matrices pueden ser sondas (por ejemplo, sondas de union a acido nucleico) sobre perlas, geles, superficies polimericas, fibras tales como fibras opticas, vidrio o cualquier otro sustrato apropiado, veanse las patentes estadounidenses n. os 5.770.358, 5.789.162, 5.708.153, 6.040.193 y 5.800.992, cada una de las cuales se incorpora por el presente documento en su totalidad para todos los fines. Las matrices pueden envasarse de una manera tal como para permitir el diagnostico u otra manipulacion en el dispositivo. Vease, por ejemplo, las patentes estadounidenses n. os 5.856.174 y 5.922.591 incorporadas en el presente documento como referencia.
En otra realizacion, el kit comprende un conjunto de cebadores oligonucleotidicos suficientes para la deteccion y/o cuantificacion de cada uno de los genes intrinsecos enumerados en la tabla 1. Los cebadores oligonucleotidicos pueden proporcionarse en forma liofilizada o reconstituida, o pueden proporcionarse como un conjunto de secuencias de nucleotidos. En una realizacion, los cebadores se proporcionan en un formato de microplaca, en el que cada conjunto de cebadores ocupa un pocillo (o multiples pocillos, como es el caso de replicados) en la microplaca. La microplaca puede comprender ademas suficientes cebadores para la deteccion de uno o mas genes de mantenimiento tal como se trata a continuacion. El kit puede comprender ademas reactivos e instrucciones suficientes para la amplificacion de productos de expresion a partir de los genes enumerados en la tabla 1.
Con el fin de facilitar el acceso directo, por ejemplo, para comparacion, revision, recuperacion y/o modificacion, los perfiles de expresion/distintivos moleculares se registran normalmente en una base de datos. Lo mas normalmente, la base de datos es una base de datos relacional a la que puede accederse mediante un dispositivo informatico, aunque pueden usarse otros formatos, por ejemplo, archivos indexados accesibles manualmente de perfiles de expresion tales como fotografias, lecturas de imagenes analogicas o digitales, hojas de calculo, etc. Independientemente de si los patrones de expresion registrados inicialmente son de naturaleza analogica o digital, los patrones de expresion, perfiles de expresion (patrones de expresion colectivos) y distintivos moleculares (patrones de expresion correlacionados) se almacenan digitalmente y se accede a los mismos por medio de una base de datos. Normalmente, la base de datos se compila y se mantiene en una instalacion central, estando disponible el acceso de manera local y/o remota.
El articulo "un" y "una" se usan en el presente documento para referirse a uno o mas de uno (es decir, al menos uno) del objeto gramatical del articulo. A modo de ejemplo, "un elemento" significa uno o mas elementos.
A lo largo de toda la memoria descriptiva la palabra "comprendiendo", o variaciones tales como "comprende" o "que comprende", se entendera que implican la inclusion de un elemento, numero entero o etapa, o grupo de elementos, numeros enteros o etapas establecidos, pero no la exclusion de cualquier otro elemento, numero entero o etapa, o grupo de elementos, numeros enteros o etapas.
Los siguientes ejemplos se ofrecen a modo de ilustracion y no a modo de limitacion:
PARTE EXPERIMENTAL
Ejemplo 1.
Metodos
Muestras y datos clínicos:
Las cohortes de pacientes para los conjuntos de entrenamiento y prueba consistieron en muestras con datos ya del dominio publico (Loi et al. (2007) J. Clin. Oncol. 25:1239-1246; va de Vijver et al. (2002) N Engl J Med 247:19992009; Wang et al (2005) Lancet 365:671-679; Ishvina et al. (2006) Cancer Res 66:10292-10301; y Hess et al (2006) J Clin Oncol 24:4236-4244, cada de uno de los cuales se incorpora como referencia en su totalidad) y tejidos recien congelados e incrustados en parafina fijados en formalina (FFPE) recogidos segun los protocolos aprobados por la junta de revision institucional en las instituciones respectivas.
Se obtuvo un conjunto de entrenamiento de 189 muestras de tumor de mama y 29 muestras normales como tejidos recien congelados y FFPE segun los protocolos de la IRB aprobados en la Universidad de Carolina del Norte en Chapel Hill, Universidad de Utah, Universidad Thomas Jefferson y Universidad de Washington. El conjunto de entrenamiento, del que se habia obtenido el perfil de expresion genica mediante micromatriz y qRT-PCR, tenia una mediana de seguimiento de 49 meses y representa pacientes tratadas de manera heterogenea segun las normas asistenciales indicadas en su estadio, estado de ER y HER2. Se obtuvo el perfil de expresion genica de un conjunto de prueba de 279 canceres de mama con supervivencia especifica de la enfermedad a largo plazo a partir de FFPE mediante qRT-PCR. Los datos clinicos para el conjunto de entrenamiento y de prueba sometidos a ensayo mediante qRT-PCR se proporcionan en las tablas 2 y 3.
Extracción de ácido nucleico:
Se purifico el ARN total de muestras congeladas frescas para micromatriz usando el kit RNeasy Midi de Qiagen segun el protocolo del fabricante (Qiagen, Valencia CA). Se determino la integridad del ARN usando un bioanalizador Agilent 2100 (Agilent Technologies, Palo Alto, CA). Se uso el kit de parafina para ARN de alta pureza (Roche Applied Science, Indianapolis, IN) para extraer ARN de tejidos FFPE (punzones de 2X10 micrometros o 1,5 mm) para qRT-PCR. Se elimino el ADN contaminante usando ADNasa Turbo (Ambion, Austin, TX). Se evaluo el rendimiento del ARN total usando el espectrofotometro NanoDrop ND-1000 (NanoDrop Technologies, Inc., Rockland, DE).
Transcripción inversa y PCR cuantitativa en tiempo real:
Se sintetizo el ADNc de primera cadena a partir de 1,2 !g de ARN total usando la transcriptasa inversa Superscript III (Kit 1st Strand; Invitrogen, Carlsbad, CA) y una mezcla de hexameros aleatorios y cebadores especificos de genes. Se mantuvo la reaccion a 55DC durante 60 minutos y luego a 70DC durante 15 minutos. Se lavo el ADNc en una columna de purificacion de PCR QIAquick (Qiagen Inc., Valencia, CA) y se almaceno a -80DC en Tris 25 mM, EDTA 1 mM hasta su uso adicional. Cada 5 !l de reaccion de PCR incluian 1,25 ng (0,625 ng/!l) de ADNc procedente de muestras de interes o 10 ng (5 ng/!l) para referencia, 2 pmol de cebadores tanto anteriores como posteriores y 2X mezcla maestra de SYBR Green I de LightCycler 480 (Roche Applied Science, Indianapolis, IN). Cada serie contenia un unico gen del que se habia obtenido el perfil por duplicado para las muestras de prueba, la muestra de referencia y el control negativo. El ADNc de muestra de referencia estaba compuesto por una contribucion igual de ARN total de referencia humano (Stratagene, La Jolla, CA) y las lineas celulares de mama MCF7, ME16C y SKBR3. Se realizo la amplificacion por PCR con el instrumento LightCycler 480 (Roche Applied Science, Indianapolis, IN) usando una etapa de desnaturalizacion inicial (95DC, 8 minutos) seguida por 45 ciclos de desnaturalizacion (95DC, 4 segundos), apareamiento (56DC, 6 segundos con transicion de 2,5DC/s) y extension (72DC, 6 segundos con transicion de 2DC/s). Se adquirio la fluorescencia (530 nm) del colorante SYBR Green I de ADNbc cada ciclo tras la etapa de extension. Se determino la especificad de la PCR mediante el analisis de la curva de fusion tras la amplificacion, se enfriaron las muestras hasta 65DC y se calentaron lentamente a de 2DC/s a 99DC mientras se monitorizaba continuamente la fluorescencia (10 adquisiciones/1DC). Se determino el numero relativo de copias para cada gen a partir de un conjunto de calibrador intraserial a 10 ng y usando una eficacia de PCR de 1,9. Se normalizo cada uno de los genes del clasificador PAM50 a la media geometrica de 5 genes de mantenimiento.
Micromatriz:
Se realizaron aislamiento, etiquetado e hibridaciones de ARN total en micromatrices 1Av2 humanas de Agilent o matrices 22k humanas de Agilent disenadas a medida usando el protocolo descrito en Hu et al (6). Todos los datos de las micromatrices se han depositado en GEO (direccion de internet www.ncbi.nlm.nih.gov/geo/) con el numero de registro de GSE10886. En la tabla 4 se facilitan fuentes para todos los conjuntos de datos de entrenamiento y de prueba de micromatriz.
Procesamiento previo de datos de micromatriz:
Los datos de micromatriz para el conjunto de entrenamiento (189 muestras) se extrajeron de la base de datos de micromatrices de la Universidad de Carolina del Norte (UNC). Se normalizaron al nivel inferior las intensidades de senal sin procesar de ambos canales mediante chip y se excluyeron las sondas del analisis de datos si no tenian una intensidad de senal de al menos 30 en ambos canales para al menos el 70% de los experimentos. Los datos normalizados para este conjunto se han colocado en GEO (GSE10886). Se obtuvo el centro mediano del conjunto de entrenamiento y se asignaron simbolos de genes usando la anotacion proporcionada por el fabricante. Los simbolos de genes duplicados se agruparon obteniendo el promedio en cada muestra.
Se descargaron datos normalizados para todos los conjuntos de prueba de GEO (GSE2845, GSE6532, GSE4922, GSE2034, GSE10886) o de los datos publicamente disponibles en la direccion de internet bioinformatics.mdanderson.org/pubdata (vease la tabla 5). Se transformaron logaritmicamente todas las medidas de intensidad (razones para los datos del NKI). Antes del calculo del centroide mas cercano, se obtuvo el centro mediano de los conjuntos de datos de Hess et al. (bioinformatics.mdanderson.org/pubdata), van de Vijver et al. (GSE2845), y Wang et al. (GSE2034) para minimizar los efectos de plataforma. El ajuste de esta forma supone una toma de muestras relativamente similar de la poblacion como conjunto de entrenamiento. Los conjuntos de datos de Loi et al. (GSE6532) e Ivshina et al. (GSE4922) se enriquecieron en gran medida para las muestras de ER+ en relacion con el conjunto de entrenamiento, por tanto puede violarse la suposicion subyacente para estos conjuntos. En estos dos casos, los genes en el conjunto de entrenamiento se centraron a la mediana de las muestras de ER+ (en contraposicion a la mediana para todas las muestras). Al igual que con el conjunto de entrenamiento, se asignaron simbolos de genes usando la anotacion proporcionada por el fabricante y se agruparon los simbolos de genes duplicados obteniendo el promedio en cada muestra.
Identificación de genes y muestras de subtipo intrínseco prototipo:
Se uso inicialmente un conjunto de genes "intrinsecos" expandido, compuesto principalmente por genes encontrados en 4 estudios previos (1, 6, 9, 11), para identificar muestras de tumor prototipo. Se represento la clase de tipo normal usando "valores normales" verdaderos a partir de mamoplastia de reduccion o tejido no implicado a simple vista. Se analizaron 189 tumores de mama a traves de 1906 genes "intrinsecos" mediante agrupamiento jerarquico (obtencion de centro mediano por caracteristica/gen, correlacion de Pearson, agrupamiento promedio)(12) y se analizo el dendograma de muestras usando "SigClust"(13). El algoritmo SigClust identifica estadisticamente grupos significativos/unicos sometiendo a prueba la hipotesis nula de que un grupo de muestras procede de un unico grupo, donde un grupo se caracteriza como una distribucion normal de multiples variables. Se ejecuto SigClust en cada nodo del dendograma comenzando en la raiz y deteniendose cuando la prueba ya no era significativa (p > 0,001).
Reducción del conjunto de genes usando muestras prototipo y qRT-PCR:
122 canceres de mama de 189 mujeres de las que se habia obtenido el perfil mediante qRT-PCR y micromatriz tenian perfiles prototipo tal como se determina mediante SigClust (tabla 2). Se derivo un conjunto de genes minimizado de estas muestras prototipo usando los datos de qRT-PCR para 161 genes que pasaban los criterios de rendimiento de FFPE establecidos en Mullins et al (14). Se emplearon varios metodos de minimizacion incluyendo los "N" mejores datos estadisticos de la prueba de la t para cada grupo (15), las mejores puntuaciones de indice de agrupamiento (16) y los genes restantes tras la "contraccion" de los datos estadisticos de la prueba de la t modificados (17). Se uso validacion cruzada (10% al azar omitido en cada uno de 50 ciclos) para evaluar la robustez de los conjuntos de genes minimizados. Se selecciono el metodo de la prueba de la t de "N" debido a que tiene el menor error de CV.
Predicción de subtipo de muestra.
Se compararon conjuntos de genes minimizados para determinar la reproducibilidad de la clasificacion a traves de 3 metodos de prediccion basados en centroide: Analisis de prediccion de micromatriz (PAM) (17), un centroide mas cercano simple (6), y clasificacion de centroide mas cercano (ClaNC) (18). La prediccion de subtipos se realizo calculando la correlacion de rangos de Spearman de cada caso de prueba para cinco centroides (LumA, LumB, enriquecido en HER-2, de tipo basal y de tipo normal) y se asigno la clase basandose en el centroide mas cercano. Se construyeron los centroides tal como se describe para el algoritmo PAM (17) usando los datos proporcionados en GSE10886; sin embargo, no se uso "contraccion" y se uso la correlacion de rangos de Spearman para la medida de la distancia. Se selecciono este metodo como clasificador debido a su reproducibilidad de predicciones de subtipo a partir de conjuntos de genes grandes y minimizados. Se uso el clasificador de 50 genes final (en adelante denominado PAM50) para realizar predicciones de subtipo en 6 conjuntos de datos de micromatriz y 1 conjunto de datos de qRT-PCR (tabla 4). El conjunto de datos de Hess et al (19) no tiene datos de desenlace y se evalua basandose en marcadores clinicos, subtipos y respuesta de neo-adyuvante.
Pronóstico usando datos de subtipo clínicos y moleculares:
Se evaluo la significacion pronostica de la clasificacion de subtipo intrinseco junto con variables clinicas convencionales (tamano del tumor (T), estado de los ganglios (N) y estado de ER) usando analisis de una variable y de multiples variables con el tiempo hasta la recidiva (es decir cualquier acontecimiento) como criterio de valoracion. Se realizaron pruebas de razon de verosimilitud para comparar modelos de datos clinicos disponibles, datos de subtipo y variables clinicas y moleculares combinadas. Se realizaron analisis de supervivencia categoricos usando una prueba de rangos logaritmicos y se visualizaron con diagramas de Kaplan-Meier.
Modelos de riesgo de desarrollo con datos clínicos y moleculares:
Se entrenaron modelos para determinar predicciones de riesgo de recidiva (ROR) usando subtipo solo y subtipo con informacion clinica. En ambos casos, se fijo un modelo de Cox de multiples variables usando regresion de Ridge para el subconjunto no tratado de la cohorte de NKI295 (20). Se asigno una puntuacion de riesgo a cada caso de prueba usando correlacion para el subtipo solo (ROR; modelo 1) o usando un modelo completo con correlacion de subtipo y dos variables clinicas (ROR (completo); modelo 2):
(1) ROR = 0,05*Basal + 0,11*Her2 + -0,25*LumA + 0,07*LumB + -0,11*Normal
(2) ROR (completo) = 0,05*Basal + 0,1*Her2 + -0,19*LumA + 0,05*LumB + -0,09*Normal + 0,16*T + 0,08*N
La suma de los coeficientes del modelo de Cox es la puntuacion de "riesgo de recidiva" para cada paciente. Con el fin de clasificar muestras en grupos de riesgo especificos, se eligieron umbrales del conjunto de entrenamiento del NKI que no requerian que la muestra de LumA estuviera en el grupo de alto riesgo y que la muestra de tipo basal no estuviera en el grupo de bajo riesgo. Se determinaron umbrales del conjunto de entrenamiento y permanecieron sin cambios cuando se evaluaron los casos de prueba. Se compararon las predicciones para el subtipo solo y modelos combinados usando el indice C (direccion de internet lib.stat.cmu.edu/S/Harrell/Design.html). Se realizo el analisis mediante SiZer para caracterizar la relacion entre la puntuacion de ROR y la supervivencia libre de recidiva (21). Los intervalos de confianza del 95% para la puntuacion de ROR son versiones locales de intervalos de confianza binomiales, calculandose el tamano de muestra local a partir de un estimador de densidad tipo nucleo gaussiano, basado en la eleccion de Sheather-Jones de anchura de ventana (22).
Resultados
Creación de un nuevo modelo de subtipo basado en genes y muestras prototipo:
Ha habido numerosos estudios que han analizado interacciones entre subtipos intrinsecos de cancer de mama y pronostico (1, 6, 9), alteraciones geneticas (23) y respuesta a farmacos (24). El fin de los metodos descritos en el presente documento fue normalizar y validad una clasificacion para los subtipos intrinsecos para fines clinicos y de investigacion. "SigClust" identifico objetivamente cinco subtipos de mama intrinsecos a partir de datos de micromatriz agrupados. Se usaron entonces estos prototipos para derivar un conjunto minimo de 50 genes (PAM50). Finalmente, se selecciono el mejor metodo de clasificacion y se uso con PAM50 para predecir subtipos en multiples conjuntos de prueba a partir de datos de micromatriz y qRT-PCR. De los 5 estudios de micromatriz con datos de desenlace (tabla 4), la cohorte de UNC tuvo significativamente peores desenlaces que las otras. Las predicciones de subtipo en un conjunto de prueba de micromatriz combinado mostro significacion pronostica en todas las pacientes, en pacientes a las que se administro tratamiento endocrino solo y en pacientes negativas para ganglios que no recibieron terapia sistemica adyuvante (figura 1).
Se evaluaron los factores pronostico clinicos y moleculares de supervivencia en analisis de una variable y de multiples variables en 1451 pacientes (tabla 5). En el analisis de una variable, se encontro que todos los subtipos de LumA, LumB y enriquecido en HER-2 eran significativos, como lo eran las variables clinicas ER, T y N. Los subtipos de LumA y enriquecido en HER-2 y las variables clinicas tambien fueron significativas en los analisis de multiples variables, lo que sugiere que el modelo mas amplio debe incluir informacion clinica y de subtipo. Al someter a prueba esta hipotesis se revelo que el modelo combinado representa significativamente mas variacion en supervivencia que cualquiera de las variables clinicas o de subtipo solas (p<0,0001 para ambas pruebas).
Distribución de subtipos biológicos a través de tumores positivos para ER y negativos para ER:
De todos los tumores positivos para ER en el conjunto de prueba de micromatriz combinado, el 73% eran luminales (A y B), el 10% estaban enriquecidos en HER2 y el 5% eran de tipo basal (tabla 6). A la inversa, cuando se consideraban los tumores negativos para ER, aproximadamente el 13% eran luminales (A y B), el 31% estaban enriquecido en HER-2 y el 48% eran de tipo basal. Los tumores identificados como de subtipo de tipo normal estaban divididos casi por igual entre tumores positivos para ER (11%) y negativos para ER (8%). Por tanto, aunque la representacion de subtipos cambio notablemente en distribucion dependiendo del estado de ER, todos los subtipos estaban representados en ambas categorias de positivos para ER y negativos para ER. Los diagramas de desenlaces para los subtipos en casos positivos para ER solo fueron significativos para la supervivencia libre de recidiva y siguieron las mismas tendencias que se observaron cuando se consideraba toda la enfermedad de mama invasiva.
Subtipos y respuesta a tratamiento neoadyuvante con T/FAC:
El estudio de Hess et al. que realizaron micromatrices en tumores para pacientes a las que se administro un regimen de paclitaxel, 5-fluorouracilo adriamicina y ciclofosfamida (T/FAC) (19) permitio la investigacion de la relacion entre los subtipos de PAM50, marcadores clinicos y como se relaciona cada uno con una respuesta patologica completa (pCR). Para el estado de HER2, el 64% de los tumores que eran positivos para HER2 mediante el ensayo clinico (FISH+ y/o IHC 3+, denominado HER2+clin) se clasificaron en el subtipo de expresion enriquecido en HER-2, estando el resto de HER2+clin asociado principalmente con los subtipos luminales. Los tumores que eran HER2+clin pero no del subtipo de expresion enriquecido en HER-2 tenian una tasa de pCR baja (16%) frente a los que eran HER2+clin y subtipo de expresion enriquecido en HER-2 (52%).
Otra distincion clinica relevante es la clasificacion de tumores "triple negativos" (ER-, PgR- y HER2-), de los cuales el 65% se denominaron de tipo basal por PAM50, denominandose el resto enriquecido en HER-2 (15%), LumA (4%), LumB (4%) y de tipo normal (12%). La clasificacion de PAM50 de tipo basal parece ser superior al triple negativo clinico con respecto a la tasa de pCR porque los tumores de tipo basal que no se clasificaron como triples negativos tuvieron un 50% de pCR en comparacion con los tumores triples negativos que no eran de tipo basal por PAM50 (22% de pCR, tabla 7).
Predicción de riesgo basada en subtipo biológico:
Se desarrollo un clasificador de riesgo supervisado para predecir desenlaces dentro del contexto de los subtipos intrinsecos y variables clinicas. Se selecciono una cohorte no tratada del conjunto de datos de micromatriz de NKI para entrenar el modelo de riesgo de recidiva (ROR) y seleccionar puntos de corte. Se validaron dos modelos de Cox (uno basado en el subtipo solo y otro basado en el subtipo, el tamano del tumor y el estado de los ganglios) usando el conjunto de prueba de micromatriz combinado. Excluyendo las variables clinicas, el modelo solo de subtipo funciono bien en la estratificacion de pacientes en grupos de riesgo de recidiva bajo, medio y alto (indice de c=0,65 [0,61-0,69]); sin embargo, el modelo completo (subtipo, tamano del tumor, estado de los ganglios) funciono mejor (indice de c=0,70 [0,66-0,74]) y, en la practica, el estadio es un parametro que es necesario tener en cuenta (figura 2). La figura 3 muestra la probabilidad de supervivencia libre de recidiva a los 5 anos representada graficamente como una escala lineal continua usando el modelo completo.
Se aplico el clasificador PAM50, sometido a ensayo mediante qRT-PCR, a una cohorte tratada de manera heterogenea archivada entre 1976 y 1995. Las clasificaciones de subtipo siguieron las mismas tendencias de supervivencia que las observadas en los datos de micromatriz y la puntuacion de ROR fue significativa para predicciones de recidiva a largo plazo. Este conjunto de muestras de edad anciana tambien se puntuo para marcadores clinicos convencionales (ER y HER2) mediante inmunohistoquimica (IHC) y se comparo con la prueba basada en expresion genica. El analisis de ESR1 y ERBB2 mediante la expresion genica mostro alta sensibilidad y especificidad en comparacion con el ensayo de IHC.
Discusion
Se desarrollo el clasificador PAM50 usando un conjunto de muestras y genes derivado estadisticamente y se valido a traves de multiples cohortes y plataformas con el intento de suministrar una prueba de diagnostico clinico para los subtipos intrinsecos de cancer de mama. Los conjuntos de prueba grandes y diversos permitieron la evaluacion del rendimiento del ensayo en un nivel de poblacion y en relacion con marcadores moleculares convencionales. Un hallazgo importante a partir de estos analisis es que todos los subtipos intrinsecos estan presentes dentro de ambos subconjuntos de tumor positivos para ER y negativos para ER clinicamente definidos, mostrando las designaciones de subtipo en las pacientes positivas para ER significacion pronostica. Por tanto, los subtipos moleculares no son simplemente otro metodo de clasificacion basado en el estado de ER.
Tambien hubo otros hallazgos importantes relativos a subtipos individuales. Por ejemplo, algunos de los tumores clasificados en el subtipo de expresion enriquecido en HER-2 no eran HER2+clin, lo que sugiere la presencia de un subtipo no basal negativo para ER que no se dirige por la amplificacion genica de HER2. Tambien se encontro que aproximadamente el 10% de los canceres de mama se clasificaron como de tipo normal y pueden ser o bien positivos para ER o bien negativos para ER y tienen un pronostico intermedio. Puesto que estos tumores se predecian por entrenamiento en tejido de mama normal, la clase de tipo normal puede ser un artefacto de tener un alto porcentaje de "contaminacion" normal en la muestra de tumor. Otras posibilidades son que estos son tumores de tipo basal que crecen lentamente que carecen de alta expresion de los genes de proliferacion, o son un posible nuevo subtipo que se ha denominado tumores bajos en claudina (25). Son necesarios analisis detallados histologicos, inmunohistoq uimicos y de expresion genica adicionales en estos casos para resolver estas cuestiones.
Las discrepancias entre marcadores moleculares de subtipo y convencionales tienen implicaciones terapeuticas importantes. Por ejemplo, una paciente con un tumor de subtipo de tipo basal que se clasifico positivo para ER o PgR se trataria probablemente mediante terapia endocrina y no seria elegible para protocolos que se dirigen a desarrollar terapias especificas de tipo basal (por ejemplo regimenes que contienen platino). Estos analisis del conjunto de datos de Hess et al. (19) mostraron que ninguna paciente con el subtipo LumA tenia una pCR cuando se les administro un regimen neoadyuvante agresivo, mientras que la tasa de pCR de los tumores de tipo basal fue del 59%. Ademas, ha habido debate sobre si el fenotipo triple negativo (ER-, PR-, HER2-) es el mismo que en el subtipo 26 de expresion de tipo basal. Un estudio de micromatriz tisular reciente de 3744 tumores confirmo el mal pronostico de los casos triples negativos, pero tambien revelo que los tumores que carecen de todos los marcadores no se comportaban igual que los que eran positivos para uno o dos marcadores de tipo basal (es decir CK5/6 o HER1) (27). De acuerdo con la idea de que el diagnostico de tipo basal debe realizarse independientemente del estado clinico de ER y PgR, se encontro una respuesta terapeutica mas alta a T/FAC en las pacientes identificadas como de tipo basal pero no triples negativas (50%) frente a las identificadas como triples negativas pero no de tipo basal (22%). Esto sugiere que la designacion de subtipo de tipo basal puede demostrar en ultima instancia ser superior a la definicion de triple negativo en la identificacion de tumores con un alto grado de sensibilidad a quimioterapia.
Proporcionar una clasificacion de subtipo absoluta es algo artificial ya que los tumores no existen como entidades biologicas diferenciadas. La clasificacion de tumores en grupos de riesgo bajo-medio-alto basandose en la distancia a cada centroide de subtipo (es decir, el modelo de ROR) fue un intento para tratar esta cuestion y produjo segregacion de supervivencia significativa. Esto fue cierto cuando se combinaban todos los casos de prueba, o tras estratificacion en cohortes habiendose administrado solo terapia endocrina, o sin tratamiento adyuvante sistemico. Uno de los principales beneficios del factor pronostico de ROR es la identificacion de pacientes LumA que tienen un riesgo de recidiva muy bajo y para las que es improbable el beneficio de la quimioterapia adyuvante. En este contexto, el factor pronostico de ROR basado en subtipos proporciona informacion similar a la puntuacion de reaparicion de OncotypeDx para pacientes positivas para ER, negativas para ganglios (4, 5). Sin embargo, el ensayo basado en PAM50 proporciona una puntuacion de riesgo de recidiva para todas las pacientes, incluyendo las que tienen enfermedad negativa para ER.
En resumen, este factor pronostico de subtipo y clasificador de ROR identifica eficazmente caracteristicas moleculares en tumores de mama que son importantes para pronostico y tratamiento. El ensayo de qRT-PCR puede realizarse usando tejidos de mama archivados, que seran utiles para ensayos clinicos prospectivos y estudios retrospectivos.
Tabla 2. Datos de subtipo y clinicos para muestras prototipo de conjuntos de entrenamiento de micromatriz/qRT-PCR
ID dela paciente
Registro deGEO Asignacion de subtipo(SigClust) Nombre de qPCR Edaden eldiagnostico Etnia pT* pN M % degrado Supervivencia global Estadovital ER(IHC)** PR(IHC)** HER2(estado)
1
GSM275694 De tipo basal BR000161BPE UU NA NA NA NA NA NA NA NA NA NA NA
3
GSM140985 De tipo basal BR000572BPE UU 45 AA 3 0 0 3 NA NA 0 0 NA
7
GSM140999 De tipo basal BR010235BPE UU 36 AA 1 0 0 3 49 0 0 0 0
10
GSM275782 De tipo basal BR010532BPE UU 47 AA 3 1 0 3 14 1 0 0 0
11
GSM80221 De tipo basal BR020018BPE UU 55 C 2 0 0 3 31 0 0 0 0
13
GSM141099 Enriquecido en HER2 BR020306BPE UU 42 C 4 2 1 3 22 1 1 1 1
14
GSM141102 LumB BR020439BPE UU 53 C 4 1 1 3 16 1 1 0 0
15
GSM275783 LumA BR020464BPE UU 44 C 2 0 0 1 2 0 1 1 0
16
GSM141105 De tipo basal BR020578BPE UU 76 AA 4 0 0 3 5 1 0 0 1
18
GSM141110 De tipo basal BR030459BPE UU 30 C 3 0 0 3 37 0 0 0 0
19
GSM275771 LumA BR030584BPE UU 54 C 1 1 NA NA NA 0 1 1 0
21
GSM141114 LumB BR040114BPE UU 56 C 2 0 0 2 16 0 1 1 0
22
GSM141117 LumB BR040182BPE UU 88 C 2 1 0 3 16 0 1 1 1
23
GSM141121 Enriquecido en HER2 BR040269BPE UU 46 C 2 0 0 3 17 0 0 0 1
28
GSM34523 De tipo basal PB00205PEUU 39 C NA NA 1 3 5 1 0 0 0
29
GSM52895 LumA PB00284PEUU 34 C 1 0 0 1 54 0 1 1 0
30
GSM34565 De tipo basal PB00297PEUU 55 AA 2 0 0 3 55 0 0 0 0
31
GSM34481 Enriquecido en HER2 PB00311PEUU 47 C 2 1 0 3 50 0 1 1 0
32
GSM34497 Enriquecido en HER2 PB00314PEUU 50 C 3 1 0 3 52 0 0 0 1
33
GSM34527 De tipo basal PB00334PEUU 50 AA 1 0 0 3 54 0 0 0 0
35
GSM34544 Enriquecido en HER2 PB00376PEUU 50 AA 2 0 0 3 49 0 0 0 0
37
GSM34549 LumA PB00441PEUU 83 C 1 0 0 2 14 0 1 1 0
38
GSM34528 Enriquecido en HER2 PB00455PEUU 52 AA 3 1 0 2 46 0 0 0 1
39
GSM52884 LumA PB00479PEUU 50 NA 2 0 0 NA NA 0 1 1 0
41
GSM50157 De tipo basal UB00028PEUU 46 C 1 0 0 3 59 0 0 0 0
42
GSM34437 De tipo basal UB00029PEUU 59 C 2 0 0 3 59 0 0 0 0
43
GSM34431 Enriquecido en HER2 UB00037PEUU 42 C 1 1 0 3 58 0 0 1 0
44
GSM34548 LumA UB00038PEUU 50 C 1 0 0 2 57 0 1 1 0
47
GSM34428 LumA UB00044PEUU 49 C 2 1 0 2 59 0 1 1 0
50
GSM34557 LumA UB00056PEUU 63 C 1 1 0 2 56 0 1 1 0
53
GSM34532 Enriquecido en HER2 UB00060PEUU 72 C 3 3 0 3 49 0 0 0 1
56
GSM34450 De tipo basal UB00067PEUU 80 C 1 1 0 3 38 1 0 0 0
57
GSM34451 LumA UB00069PEUU 40 C 1 0 0 2 7 0 NA NA 0
58
GSM34452 De tipo basal UB00071PEUU 60 C 1 0 0 3 50 0 0 0 0
60
GSM141079 LumA UB00081LPE UU 65 C NA 1 0 2 44 0 1 1 0
61
GSM141081 LumA UB00082PEUU 43 C 1 1 0 1 40 0 1 1 0
63
GSM141084 LumB UB00088PEUU 69 C 2 2 0 2 38 1 1 1 1
64
GSM141085 LumA UB00091PEUU 77 C 1 0 0 2 36 0 1 1 0
65
GSM141088 LumA UB00099PEUU 50 C 3 1 0 2 35 0 1 1 0
66
GSM141070 De tipo basal UB00100PEUU 49 C 1 0 0 3 34 0 NA NA 0
67
GSM141071 De tipo basal UB00110PEUU 76 C 2 0 0 3 31 0 0 0 0
68
GSM141072 De tipo basal UB00116PEUU 67 C 2 0 NA 3 34 0 0 0 1
69
GSM141073 Enriquecido en HER2 UB00117PEUU 72 otro NA 0 0 3 31 0 0 0 1
72
GSM275802 De tipo basal WU0032816563PE UU 59 C 2 0 0 3 82 0 0 0 0
73
GSM275803 Enriquecido en HER2 WU0043116439PE UU 73 C 4 1 0 3 44 1 0 0 1
74
GSM275800 Enriquecido en HER2 WU0044119793PE UU 49 C 3 1 0 2 27 1 1 1 1
75
GSM275804 LumA WU0050919794PE UU 57 C 2 1 0 3 51 0 0 0 0
76
GSM275805 Enriquecido en HER2 WU0053119795PE UU 75 C 2 0 0 1 81 0 1 0 0
78
GSM275807 LumB WU0055621032PE UU 46 C 2 1 0 2 88 0 1 1 0
82
GSM275810 De tipo basal WU0089918760PE UU 47 AA 2 0 0 3 83 0 1 1 0
86
GSM275813 De tipo basal WU0140716456PE UU 39 AA 2 0 0 3 80 0 0 0 0
88
GSM275815 Enriquecido en HER2 WU0150018755PE UU 88 C 1 0 0 3 70 0 1 0 0
89
GSM275816 Enriquecido en HER2 WU0150216455PE UU 74 C 2 2 0 3 88 0 1 0 0
90
GSM2758L7 Enriquecido en HER2 WU0151119773PE UU 50 AA 1 1 0 3 82 0 0 0 1
91
GSM275818 LumA WU0152021957PE UU 58 C 2 1 0 2 77 NA 1 1 NA
92
GSM275819 Enriquecido en HER2 WU0154014690PE UU 46 C 3 1 0 3 20 1 NA NA 0
93
GSM275799 LumB WU0157619797PE UU 64 O 2 1 0 3 56 0 1 1 0
95
GSM275821 LumB WU0158716348PE UU 72 C 1 0 1 2 82 0 1 0 0
96
GSM275822 LumB WU0161316349PE UU 78 C 2 2 0 3 17 0 1 1 0
97
GSM275823 De tipo basal WU0168016347PE UU 47 C 2 0 0 3 77 0 0 0 1
99
GSM275825 De tipo basal WU0179016344PE UU 32 AA 3 1 0 3 15 0 0 0 1
101
GSM275792 De tipo basal WU0188716342PE UU 73 AA 2 0 0 3 78 0 0 1 0
104
GSM275829 De tipo basal WU0210416341PE UU 57 C 2 1 0 3 51 0 0 0 0
105
GSM275830 De tipo basal WU0213218761PE UU 57 C 3 1 0 3 76 0 0 0 0
107
GSM275832 Enriquecido en HER2 WU0233821961PE UU 42 C 2 1 0 3 59 1 1 1 1
108
GSM275833 De tipo basal WU0239016330PE UU 46 C 2 0 1 3 9 1 0 0 0
109
GSM275834 De tipo basal WU0245514693PE UU 44 C 3 0 0 3 15 1 0 0 0
110
GSM275797 Enriquecido en HER2 WU0246821279PE UU 63 AA 1 2 0 3 72 0 NA NA 1
113
GSM275795 Enriquecido en HER2 WU0276916337PE UU 73 C 1 0 0 2 69 0 1 0 1
114
GSM275837 De tipo basal WU0277114694PE UU 43 C 3 0 0 3 16 1 0 0 1
116
GSM275839 De tipo basal WU0284319762PE UU 46 C 1 0 0 3 75 0 0 0 1
118
GSM275841 De tipo basal WU0294816566PE UU 44 C 1 0 0 3 62 0 0 0 0
120
GSM275842 Enriquecido en HER2 WU0306416462PE UU 74 AA 2 0 0 3 70 0 1 1 1
121
GSM275843 De tipo basal WU0329216446PE UU 50 AA 3 0 0 3 79 0 0 0 0
123
GSM275791 Enriquecido en HER2 WU0345616361PE UU 52 AA 1 0 0 3 67 0 1 1 0
125
GSM275846 LumB WU0353516451PE UU 82 C 2 0 0 3 60 0 1 1 0
126
GSM275796 Enriquecido en HER2 WU0365316448PE UU 49 C 1 2 0 3 102 0 0 0 1
127
GSM275847 De tipo basal WU0366116447PE UU 53 AA 4 1 0 3 3 1 1 1 0
128
GSM275788 LumA WU0366216452PE UU 75 AA 2 0 0 3 45 0 0 0 0
129
GSM275848 De tipo basal WU0368516502PE UU 42 AA 2 0 0 3 65 0 0 0 0
131
GSM275850 De tipo basal WU0371421262PE UU 66 AA 1 0 0 3 72 0 1 1 0
132
GSM275793 Enriquecido en HER2 WU0372116570PE UU 29 C 2 1 0 3 13 0 1 0 1
134
GSM275852 De tipo basal WU0379116497PE UU 61 C 1 1 0 3 62 0 0 0 0
135
GSM275853 De tipo basal WU0383121959PE UU 51 AA 2 1 0 3 68 0 0 0 1
139
GSM275857 De tipo basal WU0388516469PE UU 52 AA 2 1 0 3 26 1 1 1 0
140
GSM275858 Enriquecido en HER2 WU0394614842PE UU 72 C 2 1 0 2 15 NA 0 1 1
141
GSM275789 De tipo basal WU0400016466PE UU 49 AA 1 2 0 3 24 1 NA NA 0
144
GSM275861 Enriquecido en HER2 WU0403816465PE UU 51 AA 2 1 0 2 62 0 1 1 1
146
GSM275863 De tipo basal WU0432719803PE UU 73 C 1 0 0 2 69 0 1 0 1
147
GSM275864 LumB WU0453216463PE UU 75 AA 2 1 0 3 53 0 1 0 1
148
GSM275865 De tipo basal WU0483416461PE UU 42 AA 2 0 0 3 65 0 0 0 0
149
GSM275866 De tipo basal WU0495219753PE UU 64 AA 2 1 0 3 62 0 0 0 0
152
GSM275872 LumA WU0509416580PE UU 29 C 1 1 0 1 60 0 1 1 0
153
GSM275873 Enriquecido en HER2 WU0511819759PE UU 54 C 1 0 0 3 64 0 1 0 1
155
GSM275875 Enriquecido en HER2 WU0516221960PE UU 43 C 2 0 0 3 95 1 NA NA NA
156
GSM275876 De tipo basal WU0519114791PE UU 51 AA 4 1 1 2 46 1 NA NA 1
157
GSM275877 Enriquecido en HER2 WU0519616573PE UU 59 C 1 0 0 2 56 0 0 0 0
158
GSM275878 Enriquecido en HER2 WU0520716473PE UU 72 AA 4 1 0 3 59 0 1 0 1
159
GSM275879 De tipo basal WU0521516503PE UU 79 AA 2 0 0 3 48 0 0 0 0
160
GSM275880 Enriquecido en HER2 WU0533714835PE UU 51 C 2 1 0 3 14 1 0 0 0
161
GSM275881 Enriquecido en HER2 WU0541516357PE UU 52 C 2 0 0 3 48 0 1 1 1
163
GSM275883 De tipo basal WU0547816356PE UU 41 C 2 0 0 3 54 0 0 0 0
165
GSM275885 De tipo basal WU0564116354PE UU 40 AA 2 0 0 3 54 0 0 0 0
167
GSM275887 De tipo basal WU0599114687PE UU 70 AA 4 1 0 3 19 1 0 0 0
168
GSM275888 De tipo basal WU0603616352PE UU 42 AA 2 0 0 3 50 0 0 0 NA
169
GSM275889 De tipo basal WU0639719805PE UU 64 C 2 0 0 3 54 0 0 0 0
170
GSM275890 Enriquecido en HER2 WU0639819767PE UU 34 C 1 1 0 3 40 0 1 1 1
171
GSM275891 Enriquecido en HER2 WU0641619781PE UU 74 C 1 0 0 3 51 0 0 0 0
172
GSM275892 LumA WU0654518758PE UU 69 C 3 0 0 3 49 0 1 1 0
173
GSM275893 Enriquecido en HER2 WU0655914689PE UU 42 AA 4 2 0 3 35 1 0 0 0
174
GSM275894 De tipo basal WU0658016575PE UU 44 AA 2 0 0 3 48 0 0 0 0
175
GSM275895 LumB WU0661116475PE UU 46 C 2 0 0 3 51 0 1 1 1
177
GSM275897 De tipo basal WU0685715260PE UU 40 AA 2 1 0 3 11 1 0 0 0
178
GSM275898 LumA WU0740719770PE UU 66 C 2 1 0 3 5 0 1 1 0
180
GSM275900 LumA WU0750919782PE UU 57 AA 1 1 0 2 22 0 1 1 0
182
GSM275902 LumA WU0751214793PE UU 83 C 1 NA 0 2 21 0 1 1 0
184
GSM275904 De tipo basal WU0755816584PE UU 41 AA 1 0 0 3 29 0 0 0 0
185
GSM275905 De tipo basal WU0758916582PE UU 70 AA 2 1 0 3 19 0 0 0 0
187
GSM275907 LumA WU0779119784PE UU 78 C 1 0 0 2 53 0 1 1 1
188
GSM275908 LumA WU0780519777PE UU 41 C 2 1 0 3 58 0 1 1 0
189
GSM275909 De tipo basal WU0862616506PE UU 34 AA 4 1 0 3 37 0 0 0 0
190
GSM34464 De tipo basal NA 61 NA 2 1 0 3 13 1 0 NA NA
191
GSM140992 De tipo basal NA 29 NA 2 2 0 3 NA 1 0 NA NA
192
GSM50148 De tipo basal NA 51 C 4 2 0 NA 74 1 0 NA NA
193
GSM34562 De tipo basal NA 50 C 1 0 0 3 29 0 1 0 1
194
GSM52896 LumB NA 79 NA 2 2 0 3 15 0 1 NA 1
195
GSM141067 De tiponormal NA NA NA NA NA NA NA NA NA NA NA NA
196
GSM80240 De tiponormal NA NA NA NA NA NA NA NA NA NA
197
GSM34547 De tiponormal NA NA NA NA NA NA NA NA NA NA NA NA
198
GSM34483 De tiponormal NA NA NA NA NA NA NA NA NA NA NA NA
199
GSM34482 De tiponormal NA NA NA NA NA NA NA NA NA NA NA NA
200
GSM140990 De tiponormal NA NA NA NA NA NA NA NA NA NA NA NA
201
GSM140991 De tiponormal NA NA NA NA NA NA NA NA NA NA NA NA
202
GSM275777 De tiponormal NA NA NA NA NA NA NA NA NA NA NA NA
203
GSM275778 De tiponormal NA NA NA NA NA NA NA NA NA NA NA NA
204
GSM275781 De tiponormal NA NA NA NA NA NA NA NA NA NA NA NA
205
GSM275780 De tiponormal NA NA NA NA NA NA NA NA NA NA NA NA
206
GSM275779 De tiponormal NA NA NA NA NA NA NA NA NA NA NA NA
*estadio patologico del tumor: T1:2 cm, T2>2 cm-5 cm, T3>5 cm, NA=no evaluado estadio patologico de ganglio: N0=sin ganglios positivos, N1=ganglios axilares positivos, NA=no evaluado % de grado histologico: 0=grados 1 y 2, 1=grado 3**inmunohistoquimica: 0=de ausencia de tincion a tincion moderada, 1=fuerte tincion en la mayoria de las celulas cancerosasinmunohistoquimica e hibridacion in situ fluorescente: 0=negativo mediante IHC (0, 1) o 2+ mediante IHC y negativo mediante FISH, 1=3+ mediante IHC o 2+mediante IHC y positivo mediante FISH
Tabla 3. Datos de subtipo y clinicos para conjunto de prueba de qRT-PCR
ID de lapaciente
Prediccion de subtipo pT* pN % degrado Supervivenciaglobal Supervivencia libre de recidiva Cualquier recidiva*** DSS** ER (IHC) PR (IHC) HER2(IHC)
1001
LumB 2 1 1 2,3232877 0,690411 1 1 1 1 0
1002
Enriquecidoen HER2 2 NA 1 19,512329 2,9753425 1 1 0 0 0
1003
Enriquecidoen HER2 1 1 1 7,0410959 5,4 1 1 0 NA 1
1004
LumB 2 0 0 NA NA NA 1 1 1 0
1005
Enriquecidoen HER2 1 0 0 0,939726 0,3671233 1 1 0 NA NA
1006
LumB 2 1 0 0,7178082 0,5178082 1 2 1 1 0
1007
LumB NA NA 0 3,3287671 1,7616438 1 1 1 1 0
1008
Enriquecidoen HER2 2 NA 0 0,8849315 0,7068493 1 1 1 0 0
1009
De tipobasal 3 1 0 5,9917808 0,8246575 1 1 0 0 0
1010
LumA 2 1 NA 12,273973 9,0712329 1 1 1 1 NA
1011
Enriquecidoen HER2 2 1 1 3,2027397 1,2493151 1 1 0 0 1
1012
De tiponormal 1 1 0 25,435616 22,709589 1 1 1 1 0
1013
LumB 2 1 0 NA NA NA 1 1 0 0
1014
LumB 2 0 0 16,654795 16,654795 0 2 1 1 0
1015
LumA 2 0 0 4,5150685 3,8821918 1 1 1 0 0
1016
De tipobasal 2 0 1 2,0383562 1,6712329 1 1 0 0 0
1017
LumA 2 1 0 10,331507 5,9315068 1 1 1 0 0
1018
LumB 2 0 0 22,230137 21,89589 1 1 1 1 0
1019
LumB 2 1 0 3,0931507 1,4520548 1 1 1 1 0
1020
LumA 2 1 0 4,8630137 4,8630137 0 2 1 1 0
1021
LumA 1 0 0 6,7972603 4,9671233 1 2 1 1 0
1022
LumB 2 1 0 3,9150685 1,4164384 1 1 1 0 0
1023
LumA 2 1 0 25,945205 25,945205 0 3 1 1 0
1024
De tipobasal 3 NA 1 2,4438356 1,7753425 1 1 0 0 0
1025
LumA 1 1 0 2,8767123 0,0027397 1 1 1 0 1
1026
LumA 1 NA 0 8,0821918 8,0821918 0 2 1 1 0
1027
LumB 1 1 0 25,778082 25,778082 0 3 1 1 0
1028
LumA 2 1 0 9,2520548 8,9753425 1 1 1 1 0
1029
De tipobasal 2 0 1 3,4410959 1,9726027 1 1 0 0 0
1030
Enriquecidoen HER2 2 1 0 2,9232877 1,709589 1 1 1 1 1
1031
LumA 1 1 0 2,9616438 2,8958904 1 1 1 0 0
1032
LumA 2 0 0 4,509589 0,8465753 1 1 1 1 0
1033
LumB 1 NA 1 10,312329 9,9780822 1 1 NA NA NA
1034
LumB 1 0 1 15,19726 15,19726 0 2 1 1 0
1035
De tipobasal 1 1 1 25,339726 25,339726 0 3 1 1 0
1036
LumA 2 1 0 3,4465753 1,460274 1 1 1 NA 0
1037
De tipobasal 1 0 0 11,958904 11,958904 0 2 0 0 0
1038
De tipobasal 2 1 1 2,4849315 2,2082 L 92 1 1 0 NA 0
1039
LumA 2 NA 0 8,539726 6,8136986 1 1 1 1 0
1040
De tipobasal 2 0 0 25,090411 25,090411 0 3 0 0 0
1041
LumA 2 1 0 3,7369863 1,7643836 1 1 NA NA 0
1042
De tipobasal 1 NA 0 2,1780822 0,9561644 1 1 1 1 1
1043
LumB 2 1 0 2,5452055 0,5232877 1 1 1 1 0
1044
LumA 1 1 0 2,630137 0,7315068 1 1 1 1 0
1045
De tipobasal 2 1 1 1,4109589 1,060274 1 1 0 0 0
1046
De tipobasal 2 1 1 24,835616 24,835616 0 3 0 0 0
1047
De tipobasal 2 0 1 14,873973 14,536986 1 1 0 0 0
1048
Enriquecidoen HER2 1 1 1 2,3917808 1,5506849 1 1 1 1 0
1049
LumA 2 1 0 19,339726 19,339726 0 2 1 0 0
1050
LumB 2 1 0 13,605479 13,605479 0 2 1 0 NA
1051
LumB 2 1 0 2,4191781 1,4520548 1 1 1 1 0
1052
De tipobasal 2 1 0 12,073973 11,739726 1 1 NA NA 0
1053
De tipobasal 2 1 0 0,3506849 0,0027397 1 1 0 0 0
1054
De tipobasal 1 0 1 24,449315 24,449315 0 3 0 0 0
1055
LumB 2 0 0 6,1589041 4,1643836 1 1 1 0 0
1056
LumB 2 NA 0 1,2575342 0,0109589 1 1 1 1 0
1057
LumA 2 0 0 7,7753425 5,6630137 1 1 1 1 0
1058
De tipobasal 1 1 1 24,323288 24,323288 0 3 0 NA NA
1059
LumB 2 1 0 5,9863014 5,0876712 1 1 1 1 0
1060
LumB 1 1 1 24,115068 24,115068 0 3 1 1 0
1061
De tipobasal 2 1 1 4,7972603 4,7972603 0 2 0 0 0
1062
De tipobasal 3 1 1 24,084932 24,084932 0 3 0 0 0
1063
De tipobasal 2 0 0 24,019178 24,019178 0 3 1 0 0
1064
De tipobasal 2 0 1 22,791781 22,791781 0 3 0 NA NA
1065
Enriquecidoen HER2 2 0 0 9,5150685 9,5150685 0 NA 0 0 0
1066
De tipobasal 1 0 1 20,945205 20,945205 0 3 0 0 0
1067
De tiponormal 2 0 0 10,917808 10,917808 0 2 NA NA 1
1068
Enriquecidoen HER2 2 0 0 6,7013699 2,9726027 1 1 0 NA 0
1069
LumB 3 0 0 11,912329 11,912329 0 2 1 1 0
1070
LumB 2 0 0 20,731507 17,008219 1 3 1 1 0
1071
LumB 1 NA 0 4,0191781 1,2493151 1 2 1 1 0
1072
LumA 2 1 0 12,441096 12,441096 0 2 1 1 0
1073
Enriquecidoen HER2 3 0 0 20,660274 20,660274 0 3 NA NA 1
1074
LumA 1 NA 0 4,7835616 4,4465753 1 1 1 0 0
1075
LumA 2 0 0 2,7534247 2,4246575 1 1 1 1 0
1076
LumA 2 1 0 20,539726 20,539726 0 3 1 NA 0
1077
LumA 1 1 0 20,408219 12,328767 1 3 1 1 0
1078
De tiponormal 2 NA 0 2,6630137 1,2493151 1 1 1 NA 0
1079
Enriquecidoen HER2 1 1 0 NA NA NA 1 0 0 1
1080
De tipobasal 2 1 0 NA NA NA 3 1 1 0
1081
De tiponormal 2 1 0 NA NA NA 1 1 1 0
1082
Enriquecidoen HER2 2 0 1 NA NA NA 1 1 1 1
1083
LumB 2 0 0 NA NA NA 2 1 1 NA
1084
LumA 1 0 0 NA NA NA 3 NA NA 0
1085
De tipobasal 3 0 0 NA NA NA 1 1 0 0
1086
De tipobasal 1 0 1 19,969863 19,969863 0 3 0 0 0
1087
De tipobasal 1 0 0 19,657534 19,657534 0 3 0 0 0
1088
LumA 1 0 0 16,238356 3,9616438 1 1 1 1 0
1089
Enriquecidoen HER2 2 0 1 19,506849 19,506849 0 3 1 1 1
1090
LumA 1 0 0 8,5945205 6,9041096 1 1 0 0 0
1091
LumA 1 0 0 19,432877 2,6082192 1 3 1 1 0
1092
De tipobasal 1 0 NA 19,405479 19,405479 0 3 0 NA NA
1093
LumB 2 0 0 19,408219 16,756164 1 3 1 NA 0
1094
LumA 1 NA 0 19,358904 19,358904 0 3 1 1 0
1095
LumB 2 0 0 19,353425 19,353425 0 3 1 0 0
1096
LumA 2 0 0 13,345205 13,345205 0 2 1 1 0
1097
Enriquecidoen HER2 2 0 0 8,3890411 5,290411 1 2 1 0 0
1098
Enriquecidoen HER2 1 0 0 6,5863014 3,8767123 1 1 0 NA 1
1099
LumB 2 0 1 3,7780822 3,4438356 1 1 1 0 1
1100
Enriquecidoen HER2 1 0 0 19,20274 19,20274 0 3 1 0 1
1101
De tipobasal 2 0 1 19,186301 19,186301 0 3 0 0 1
1102
De tipobasal 1 0 0 5,8410959 4,7589041 1 1 0 NA NA
1103
LumB 1 0 0 17,734247 3,6876712 1 2 1 NA NA
1104
LumA 2 0 1 9,7917808 9,7917808 0 2 1 NA 0
1105
De tipobasal 1 0 1 19,106849 19,106849 0 3 0 NA 0
1106
De tipobasal 2 0 1 19,09863 19,09863 0 3 0 NA NA
1107
LumA 1 0 0 19,871233 19,871233 0 3 1 1 0
1108
De tipobasal 1 0 1 19,808219 19,808219 0 3 1 0 NA
1109
LumB 2 0 0 19,791781 1,6794521 1 3 1 1 0
1110
Enriquecidoen HER2 2 0 0 16,778082 16,778082 0 2 1 0 0
1111
LumA 1 0 0 19,789041 19,789041 0 3 1 1 0
1112
LumB 2 0 0 3,5068493 3,3643836 1 1 1 1 0
1113
LumB 2 0 1 2,3150685 0,9369863 1 2 1 0 0
1114
De tipobasal 2 0 1 3,3232877 3,3232877 1 1 0 NA 0
1115
Enriquecidoen HER2 2 0 1 19,986301 19,986301 0 3 1 1 0
1116
De tipobasal 2 0 1 NA NA NA 2 0 0 0
1117
Enriquecidoen HER2 1 0 1 19,758904 19,758904 0 3 1 NA 1
1118
LumB 1 0 1 19,717808 19,717808 0 3 1 1 0
1119
LumB 1 0 0 4,4054795 2,460274 1 1 1 NA 0
1120
LumB 2 0 1 5,3342466 4,8794521 1 1 1 1 0
1121
LumA 1 0 0 11,531507 11,531507 0 2 1 1 0
1122
De tiponormal 1 0 0 15,424658 14,824658 1 2 NA NA NA
1123
LumB 2 0 0 3,8876712 3,8794521 1 1 1 1 NA
1124
De tipobasal 1 0 0 19,252055 19,252055 0 3 0 0 0
1125
De tiponormal 1 0 0 19,205479 19,205479 0 3 1 1 0
1126
LumB 1 0 0 20,005479 20,005479 0 3 1 1 0
1127
LumA 1 0 0 19,950685 19,950685 0 3 1 NA 0
1128
De tiponormal 2 1 0 19,931507 2,2657534 1 3 1 NA 0
1129
LumA 1 0 0 19,849315 4,509589 1 3 1 1 0
1130
De tipobasal NA 0 1 8,0630137 8,0630137 0 NA 0 NA NA
1131
De tipobasal 2 1 1 1,030137 0,0520548 1 1 0 0 1
1132
De tiponormal 1 0 0 19,608219 19,608219 0 3 1 1 0
1133
Enriquecidoen HER2 1 1 1 19,550685 19,550685 0 3 1 1 0
1134
De tipobasal 2 1 0 2,0712329 1,230137 1 1 NA NA NA
1135
LumA 1 1 0 19,449315 19,449315 0 3 1 1 0
1136
LumB 1 1 0 5,0520548 4,4684932 1 1 1 1 0
1137
LumA 2 1 0 19,331507 17,657534 1 3 1 1 0
1138
LumA 1 1 0 19,331507 19,331507 0 3 1 1 0
1139
De tipobasal 1 0 1 19,046575 19,046575 0 3 NA 0 0
1140
Enriquecidoen HER2 1 0 0 18,917808 18,917808 0 3 1 0 0
1141
LumB 3 NA 0 5,5205479 1,8410959 1 1 1 1 0
1142
LumA 1 0 0 18,649315 18,649315 0 NA 1 NA 0
1143
LumA 1 0 0 4,8876712 4,8876712 0 1 1 1 0
1144
De tipobasal NA 1 0 2,9972603 2,9123288 1 1 NA NA 0
1145
LumA 1 0 0 18,753425 18,753425 0 3 1 1 NA
1146
LumA 3 NA 0 3,1917808 0,0027397 1 1 1 1 0
1147
De tipobasal 1 0 1 10,79726 10,79726 0 2 1 0 0
1148
LumB 1 1 0 13,542466 4,6027397 1 2 1 1 0
1149
LumB 2 1 0 18,715068 18,715068 0 3 1 1 0
1150
Enriquecidoen HER2 2 1 1 2,6027397 2,0931507 1 1 0 NA 1
1151
LumB NA NA 1 18,641096 18,641096 0 3 1 1 0
1152
LumA 1 0 0 18,621918 18,621918 0 3 1 1 0
1153
LumA NA NA 0 1,460274 1,460274 0 NA 1 NA 0
1154
LumA 2 0 0 7,3479452 7,3479452 0 2 1 1 0
1155
LumA 1 1 0 7,4246575 6,939726 1 2 1 1 0
1156
De tiponormal 2 0 0 18,452055 18,452055 0 3 0 0 0
1157
Enriquecidoen HER2 2 1 1 4,6246575 3,7671233 1 1 NA 0 NA
1158
LumA 1 1 0 7,3890411 8,060274 1 1 1 NA 0
1159
Enriquecidoen HER2 3 NA 1 18,986301 0,9863014 1 3 1 NA 1
1160
Enriquecidoen HER2 2 0 1 17,969863 17,969863 0 3 1 0 NA
1161
LumB 2 1 0 4,1452055 4,1452055 0 2 1 0 0
1162
LumA 1 1 0 17,909589 17,909589 0 3 1 1 0
1163
LumA 2 1 0 9,3972603 9,3972603 0 2 1 1 0
1164
LumA 2 0 0 7,8109589 7,8109589 0 2 1 1 0
1165
Enriquecidoen HER2 2 1 0 NA NA NA 1 0 0 NA
1166
De tipobasal 1 0 1 17,378082 17,378082 0 3 0 0 0
1167
Enriquecidoen HER2 NA NA 0 17,071233 17,071233 0 3 1 0 0
1168
LumA 1 0 NA 17,161644 17,161644 0 3 1 1 0
1169
De tipobasal 3 NA 1 10,742466 6,5315068 1 1 0 NA 0
1170
De tipobasal 1 NA 1 NA NA NA 1 0 0 0
1171
Enriquecidoen HER2 1 1 1 4,8438356 2,7506849 1 2 1 1 1
1172
LumB 1 NA 0 7,3972603 7,3972603 0 2 1 1 NA
1173
LumB 1 0 1 16,934247 3,4219178 1 3 1 1 0
1174
LumA 1 0 0 16,90137 16,90137 0 3 1 1 0
1175
LumB 2 1 0 16,882192 16,882192 0 3 1 1 0
1176
Enriquecidoen HER2 2 NA 1 9,1232877 9,1232877 0 2 1 1 1
1177
De tipobasal 1 1 1 2,0986301 0,6547945 1 1 0 0 0
1178
Enriquecidoen HER2 2 0 1 2,1534247 1,7506849 1 1 0 0 0
1179
De tipobasal 1 NA 1 0,0493151 0,0027397 1 1 0 0 0
1180
LumB 1 0 0 8,0328767 4,7917808 1 1 1 0 0
1181
LumA 1 0 0 7,8383562 7,8383562 0 2 1 NA 0
1182
Enriquecidoen HER2 3 1 0 16,706849 16,706849 0 3 0 0 0
1183
De tipobasal 2 1 0 3,3835616 1,0547945 1 1 1 1 NA
1184
De tipobasal 2 0 1 16,547945 16,547945 0 3 0 0 1
1185
Enriquecidoen HER2 2 0 0 16,520548 16,520548 0 3 1 1 1
1186
De tiponormal 2 1 0 1,7506849 1,7506849 0 2 1 NA 0
1187
Enriquecidoen HER2 3 NA 0 1,7150685 0,0082192 1 1 NA 0 1
1188
De tipobasal 2 1 1 16,479452 1,8219178 1 3 0 0 0
1189
De tiponormal 2 0 0 11,153425 7,0520548 1 1 NA NA 0
1190
LumA 2 0 0 16,287671 16,287671 0 3 1 1 0
1191
LumB 2 0 0 16,345205 16,345205 0 3 1 1 0
1192
LumB 1 0 0 16,227397 16,227397 0 3 1
1193
LumA NA NA 0 6,2821918 6,2821918 0 2 1 1 0
1194
LumA 3 NA 0 4,2767123 1,2849315 1 1 1 1 0
1195
LumA 2 0 0 9,7479452 9,7479452 0 2 1 1 NA
1196
LumB 1 NA 0 7,0684932 7,0684932 0 2 1 0 0
1197
LumA 1 0 0 5,8027397 5,8027397 0 2 1 0 0
1198
LumA 2 1 0 1,0383562 1,0383562 0 2 1 NA 0
1199
LumB 2 0 0 7,8520548 7,5178082 1 1 1 1 0
1200
LumA 2 0 0 15,863014 15,863014 0 3 1 1 0
1201
De tiponormal 1 0 0 15,693151 15,693151 0 3 1 0 0
1202
LumB 1 NA 1 0,030137 0,030137 0 2 1 0 0
1203
Enriquecidoen HER2 2 1 0 10,046575 10,046575 0 2 0 0 0
1204
LumA 2 0 0 15,210959 15,210959 0 3 1 1 0
1205
LumA 1 NA 0 15,189041 10,890411 1 3 1 1 0
1206
LumA 2 0 0 15,169863 15,169863 0 3 1 NA NA
1207
LumA 1 0 NA 2,2794521 0,9726027 1 1 1 NA 0
1208
Enriquecidoen HER2 1 0 1 8,0712329 6,0547945 1 1 0 0 1
1209
De tipobasal 2 1 0 4,1287671 3,8630137 1 1 1 0 0
1210
LumB 1 0 0 15,035616 15,035616 0 3 1 1 0
1211
LumB 3 NA 0 1,9780822 0,9123288 1 1 1 1 0
1212
De tipobasal 1 1 0 15,032877 15,032877 0 3 1 1 0
1213
Enriquecidoen HER2 2 1 0 15 15 0 3 0 0 0
1214
De tipobasal 1 0 1 14,967123 14,967123 0 3 0 NA 0
1215
De tiponormal 1 1 0 12,073973 12,073973 0 2 1 0 NA
1216
LumA 2 0 1 8,8 8,7835616 1 2 1 1 0
1217
LumA 1 1 0 14,89863 14,375342 1 3 1 1 0
1218
LumA 2 1 0 7,6767123 6,4410959 1 1 1 NA 0
1219
LumA 3 1 0 4,1890411 1,6493151 1 1 1 1 0
1220
De tipobasal 3 1 0 2,5150685 0,4109589 1 1 0 0 0
1221
De tiponormal 1 0 1 14,852055 14,852055 0 3 0 NA NA
1222
LumA 1 0 0 14,772603 14,772603 0 3 NA NA 0
1223
De tipobasal 3 1 1 1,5589041 1,3260274 1 2 0 0 0
1224
De tiponormal 1 0 0 14,709589 14,709589 0 3 NA NA 0
1225
De tipobasal 2 1 0 14,69589 13,29589 1 3 1 1 0
1226
LumA 3 NA 0 2,5232877 0,0410959 1 1 1 0 0
1227
LumA 1 0 0 14,578082 14,578082 0 3 1 0 0
1228
LumB 2 0 0 14,572603 14,572603 0 3 1 1 0
1229
Enriquecidoen HER2 2 0 1 14,613699 14,613699 0 3 0 0 0
1230
LumA 2 0 0 2,0109589 2,0109589 0 2 1 1 0
1231
LumA 1 0 0 14,542466 14,542466 0 3 1 0 0
1232
Enriquecidoen HER2 1 0 1 14,534247 14,534247 0 3 1 1 0
1233
LumB 1 NA 0 4:9123288 4,0849315 1 1 1 1 0
1234
LumB NA 1 0 5,4876712 5,4876712 0 2 1 NA 0
1235
LumA 1 0 0 14,641096 14,641096 0 3 1 1 0
1236
LumA 2 0 0 14,520548 14,520548 0 3 1 1 0
1237
LumA 2 0 0 7,3780822 5,0109589 1 2 1 1 0
1238
Enriquecidoen HER2 3 NA 1 NA NA NA 1 1 0 0
1239
Enriquecidoen HER2 2 1 0 14,465753 14,465753 0 3 1 NA NA
1240
De tipobasal 3 1 0 14,438356 14,438356 0 3 1
1241
LumA 1 0 0 14,421918 14,421918 0 3 1 1 0
1242
LumA 2 0 0 14,419178 14,419178 0 3 1 NA NA
1243
LumB 1 0 0 14,408219 14,408219 0 3 1 1 0
1244
LumB 1 1 0 10,013699 10,013699 0 2 1 1 0
1245
LumA 2 0 0 14,383562 14,383562 0 3 1 1 0
1246
LumB 2 0 0 4,5643836 4,5643836 0 2 1 1 0
1247
LumB 1 0 0 14,312329 1,4739726 1 3 1 1 0
1248
De tiponormal 1 1 0 14,249315 14,249315 0 3 NA NA 0
1249
LumA 3 0 0 13,49863 13,49863 0 2 1 0 0
1250
De tipobasal NA 0 1 14,235616 14,235616 0 3 0 NA 0
1251
LumB 1 0 0 14,945205 14,945205 0 3 1 0 0
1252
De tiponormal 1 0 0 1,6547945 1,2493151 1 1 NA NA 0
1253
LumA 2 1 0 4,2164384 4,2164384 0 2 1 0 0
1254
De tiponormal 1 0 0 12,526027 12,526027 0 3 1 NA 0
1255
LumB 2 1 0 12,463014 12,463014 0 3 1 1 0
1256
De tipobasal 2 1 0 3,7205479 1,7452055 1 1 1 1 NA
1257
De tiponormal 1 0 0 12,427397 12,427397 0 3 1 NA 0
1258
LumA 2 0 0 12,372603 12,372603 0 3 1 NA 0
1259
LumA 1 1 0 12,328767 12,328767 0 3 1 NA NA
1260
De tipobasal 1 1 0 12,29589 2,5945205 1 3 1 1 0
1261
LumA 2 0 0 12,312329 12,312329 0 3 1 NA 0
1262
De tiponormal 1 0 0 12,180822 12,180822 0 3 1 NA 0
1263
De tipobasal 1 0 0 12,2 12,2 0 3 NA NA NA
1264
Enriquecidoen HER2 1 0 1 3,6 2,0684932 1 1 1 1 0
1265
LumA 2 1 0 12,2 12,2 0 3 1 1 0
1266
De tiponormal 1 1 NA 11,857534 11,857534 0 3 1 NA 0
1267
Enriquecidoen HER2 2 0 1 11,186301 11,186301 0 3 0 0 0
1268
De tiponormal 1 1 NA 11,073973 11,073973 0 3 1 NA 0
1269
De tiponormal 3 0 0 10,969863 10,969863 0 3 1 1 0
1270
LumA 2 NA 0 10,920548 10,920548 0 3 1 1 0
1271
LumA 2 1 0 10,79726 10,79726 0 3 1 0 0
1272
LumB 1 0 0 10,668493 10,668493 0 3 1 0 0
1273
LumA 2 1 0 10,167123 10,167123 0 3 1 1 NA
1274
LumA 1 0 0 9,6821918 9,6821918 0 3 1 NA 0
1275
De tiponormal 2 0 0 9,5917808 9,5917808 0 3 1 1 0
1276
De tiponormal 1 0 0 9,6082192 9,6082192 0 3 1 1 0
1277
De tipobasal 2 0 1 9,5287671 9,5287671 0 3 0 NA 0
1278
De tiponormal 1 0 0 6,5835616 6,2547945 1 1 1 1 NA
1279
De tipobasal 2 1 0 9,3643836 9,3643836 0 3 NA NA 0
*tamano del tumor: T1:2 cm, T2>2 cm-5 cm, T3>5 cm, NA=no evaluadoestado de los ganglios: 0=negativo para ganglios, 1= positivo para ganglios, NA=estado de los ganglios desconocido% de grado histologico de Nottingham: 0=grados 1 y 2, 1=grado 3, NA=desconocido ***cualquier supervivencia libre de recidiva: 0=libre de recidiva, 1=recidiva**supervivencia especifica de enfermedad: 1=muerte por cancer de mama CA, 2=muerte por causa distinta a cancer de mama, 3=con vida, NA=desconocidainmunohistoquimica:
Biomarcador
0 1 NA
ER
< 1% de nucleos positivos � 1% de nucleos positivos No interpretable
PR
< 1% de nucleos positivos � 1% de nucleos positivos No interpretable
Enriquecido en HER2
Expresion negativa o debil Expresion fuerte No interpretable
Tabla 4: Datos fuente para conjuntos de datos de qRT-PCR y micromatriz
Autor
Muestras Plataforma Registros de GEO (u otra disponibilidad) Uso enclasificacion desubtipo Uso enprediccion de riesgo Numero N-,terapia sistemica sin adyuvante Numero de terapia endocrina solo % deER+
Parker et al
189 qRT-PCR - - 0 0 54%
Parker et al
279 qRT-PCR Prueba Prueba 0 0 62%
Parker et al
544 Agilent Custom, 1A, 1Av2 GSE10886 Comun a qRTPCR para entrenamiento(189); otros en Prueba (355) 355 enPrueba 31 27 56%
Hess et al
133 Affymetrix U133A bioinformatics.mdanderson.org/ pubdata Prueba Prueba 0 0 62%
Ivshina et al
289 Affymetrix U133A GSE4922 Prueba Prueba 142 66 86%
Loi et al
414 Affymetrix U133A & U133+2 GSE6532 Prueba Prueba 137 277 89%
van de Vijver et al
295 Agilent GSE2845 Prueba Sin tratar para entrenamiento(165); otrosen prueba 165 20 76%
Wang et al
286 Affymetrix U133A GSE2034 Prueba Prueba 286 0 73%
Tabla 5. Analisis de multiples variables y de una variable usando 1451 muestras de un conjunto de prueba de micromatriz combinado con datos clinicos
Variable
Una variable Multiples variables* (subtipo) Multiples variables* (clinico) Multiples variables*�� (subtipo + clinico)
Coeficiente
Valor de p Coeficiente Valor de p Coeficiente Valor de p Coeficiente Valor de p
De tipo basal
0,14 0,25 0,12 5,10E-01 - -0,11 5,50E01
Enriquecido en HER
0,62 1,00E-08 0,53 1,60E-03 - 0,35 4,00E02
LumA
-0,94 1,00E-22 -0,67 6,20E-05 - -0,64 1,60E04
LumB
0,42 5,60E-06 0,3 5,50E-02 - 0,24 1,30E01
Estado de ER
-0,47 1,80E-06 - - -0,5 5,50E-07 -0,37 3,00E03
Tamano del tumor
0,62 3,50E-12 - - 0,54 6,10E-09 0,47 5,30E07
Estado de los ganglios
0,37 2,80E-05 - - 0,24 1,10E-02 0,19 5,00E02
*Clase de tipo normal usada como estado de referencia Las variables significativas estan en cursiva � p = 4e-10 (mediante la prueba de razon de verosimilitud) para comparacion con el modelo de subtipo � = 2e-13 (mediante la prueba de razon de verosimilitud) para comparacion con el modelo clinico
Tabla 6. Distribucion de subtipos intrinsecos mediante estado de ER
Conjunto de prueba
Estado de ER N.D de muestras % de LumA % de LumB % de enriquecido en HER2 % de tipo basal % de tipo normal
UNC
Positivo para ER 137 44% 35% 7% 4% 9%
Negativo para ER
107 7% 5% 19% 51% 18%
Hess et al
Positivo para ER 82 44% 32% 10% 1% 13%
Negativo para ER
51 2% 2% 41% 51% 4%
Ivshina et al
Positivo para ER 211 42% 29% 11% 8% 9%
Negativo para ER
34 9% 15% 35% 38% 3%
Loi et al
Positivo para ER 349 39% 38% 8% 7% 8%
Negativo para ER
45 18% 9% 33% 27% 13%
van de Vijver et al
Positivo para ER 225 39% 31% 14% 4% 12%
Negativo para ER
70 1% 0% 31% 64% 3%
Wang et al
Positivo para ER 209 35% 33% 11% 8% 13%
Negativo para ER
77 5% 3% 29% 57% 6%
Tabla 7. Tasas de respuesta completa patologica a T/FAC para subtipos basadas en PAM50 y clasificacion triple negativa
Clasificación RD
pCR
De tipo basal 11 (41%) Enriquecido en HER2 17 (59%) LumA 36 (100%) LumB 22 (82%) De tipo normal 13 (93%) Triple negativo 13 (50%) Cualquier positivo 82 (80%)
16 (59%) 12 (41%) 0 (0%) 5 (18%) 1 (7%) 13 (50%) 20 (20%)
Triple negativo/basal 6 (35%) Triple negativo/no basal 7 (78%) No triple negativo/basal 4 (50%) No triple negativo/no basal 78 (83%)
11 (65%) 2 (22%) 4 (50%) 16 (17%)
*Los porcentajes se calculan en total por clasificacion
Bibliografia:
1. Sorlie T, Perou CM, Tibshirani R, et al: Gene expression patterns of breast carcinomas distinguish tumor 10 subclasses with clinical implications. Proc Natl Acad Sci U S A 98:10869-74, 2001
2. van't Veer LJ, Dai H, van de Vijver MJ, et al: Gene expression profiling predicts clinical outcome of breast cancer. Nature 415:530-6, 2002
15 3. van't Veer LJ, Paik S, Hayes DF: Gene expression profiling of breast cancer: a new tumor marker. J Clin Oncol 23:1631-5, 2005
4. Paik S, Shak S, Tang G, et al: A multigene assay to predict recurrence of tamoxifen-treated, node-negative breast
cancer. N Engl J Med 351:2817-26, 2004 20
5. Paik S, Tang G, Shak S, et al: Gene expression and benefit of chemotherapy in women with node-negative, estrogen receptor-positive breast cancer. J Clin Oncol 24:3726-34, 2006
6. Hu Z, Fan C, Oh DS, et al: The molecular portraits of breast tumors are conserved across microarray platforms. 25 BMC Genomics 7:96, 2006
7. Loi S, Haibe-Kains B, Desmedt C, et al: Definition of clinically distinct molecular subtypes in estrogen receptorpositive breast carcinomas through genomic grade. J Clin Oncol 25:1239-46, 2007
30 8. Perou CM, Sorlie T, Eisen MB, et al: Molecular portraits of human breast tumours. Nature 406:747-52, 2000
9. Sorlie T, Tibshirani R, Parker J, et al: Repeated observation of breast tumor subtypes in independent gene expression data sets. Proc Natl Acad Sci U S A 100:8418-23, 2003
35 10. Fan C, Oh DS, Wessels L, et al: Concordance among gene-expression based predictors for breast cancer. N Engl J Med 355:560-9, 2006
11. Perreard L, Fan C, Quackenbush JF, et al: Classification and risk stratification of invasive breast carcinomas
using a real-time quantitative RT-PCR assay. Breast Cancer Res 8:R23, 2006 40
12.
Eisen MB, Spellman PT, Brown PO, et al: Cluster analysis and display of genome-wide expression patterns. Proc Natl Acad Sci U S A 95:14863-8, 1998
13.
Yufeng L, Hayes DL, Nobel A, et al: Statistical significance of clustering for high dimension low sample size data.
Journal of the American Statistical Association, en prensa
14.
Mullins M, Perreard L, Quackenbush JF, et al: Agreement in breast cancer classification between microarray and quantitative reverse transcription PCR from fresh-frozen and formalin-fixed, paraffin-embedded tissues. Clin Chem 53:1273-9, 2007
15.
Storey JD, Tibshirani R: Statistical methods for identifying differentially expressed genes in DNA microarrays. Methods Mol Biol 224:149-57, 2003
16.
Dudoit S, Fridlyand J: A prediction-based resampling method for estimating the number of clusters in a dataset. Genome Biol 3:RESEARCH0036, 2000
17.
Tibshirani R, Hastie T, Narasimhan B, et al: Diagnosis of multiple cancer types by shrunken centroids of gene expression. Proc Natl Acad Sci U S A 99:6567-72, 2002
18.
Dabney AR: Classification of microarrays to nearest centroids. Bioinformatics 21:4148-54, 2005
19.
Hess KR, Anderson K, Symmans WF, et al: Pharmacogenomic predictor of sensitivity to preoperative chemotherapy with paclitaxel and fluorouracil, doxorubicin, and cyclophosphamide in breast cancer. J Clin Oncol 24: 4236-44, 2006
20.
van de Vijver MJ, He YD, van't Veer LJ, et al: A gene-expression signature as a predictor of survival in breast cancer. N Engl J Med 347:1999-2009, 2002
21.
Chaudhuri P, Marron JS: SiZer for Exploration of Structures in Curves. Journal of the American Statistical Association 94:807-823, 1999
22.
Sheather SJ, Jones MC: A Reliable Data-Based Bandwidth Selection Method for Kernel Density Estimation. Journal of the Royal Statistical Society 53:683-690, 1991
23.
Neve RM, Chin K, Fridlyand J, et al: A collection of breast cancer cell lines for the study of functionally distinct cancer subtypes. Cancer Cell 10:515-27, 2006
24.
Rouzier R, Pusztai L, Delaloge S, et al: Nomograms to predict pathologic complete response and metastasis-free survival after preoperative chemotherapy for breast cancer. J Clin Oncol 23:8331-9, 2005
25.
Herschkowitz JI, Simin K, Weigman VJ, et al: Identification of conserved gene expression features between murine mammary carcinoma models and human breast tumors. Genome Biol 8:R76, 2007
26.
Rakha E, Ellis I, Reis-Filho J: Are triple-negative and basal-like breast cancer synonymous� Clin Cancer Res 14:618; author reply 618-9, 2008
27.
Cheang MC, Voduc D, Bajdik C, et al: Basal-like breast cancer defined by five biomarkers has superior prognostic value than triple-negative phenotype. Clin Cancer Res 14:1368-76, 2008
Ejemplo 2.
Introducción y datos de antecedentes
Esta tecnologia tambien cubre el uso del clasificador de subtipo intrinseco basado en PAM50 como distintivo predictivo y de pronostico en la practica de terapia endocrina neoadyuvante. Las pacientes postmenopausicas con cancer de mama en estadio 2 y 3, positivo para ER y/o PgR pueden tratarse con un agente endocrino, normalmente un inhibidor de aromatasa o tamoxifeno, antes de la cirugia para mejorar los desenlaces clinicos, es decir para promover el uso de cirugia conservadora de mama o para mejorar la operabilidad en el entorno de un tumor que ha invadido los tejidos circundantes a la mama. Una prueba predicitiva para aumentar la confianza con que una paciente individual respondera a terapia endocrina neoadyuvante es un avance significativo.
Sumario
La puntuacion de riesgo ponderado por proliferacion y subtipo intrinseco basado en PAM50, cuando se aplica a muestras de canceres de mama ER+ recogidas tras iniciar el tratamiento con un agente endocrino, pueden usarse para predecir la respuesta a la terapia endocrina neoadyuvante y determinar el pronostico para pacientes con cancer de mama ER+ que se someteran a terapia a largo plazo con un agente endocrino. Se aplico un modelo de expresion genica de pronostico entrenado con muestras tumorales tomadas antes del tratamiento (puntuacion de riesgo ponderada por proliferacion de PAM50, descrito en otra parte en el presente documento) a muestras tomadas tras el inicio de la terapia endocrina neoadyuvante. Este enfoque es unico porque los estudios previos sobre la interaccion de perfiles de expresion genica y pronostico solo han examinado muestras previas al tratamiento y nunca han aplicado estos modelos a muestras tras el tratamiento. Las propiedades de pronostico y predictivas del modelo de pronostico ponderado por proliferacion y subtipo intrinseco de PAM50 en muestras iniciales se comparan con los mismos modelos aplicados a muestras tomadas un mes tras el inicio de la terapia endocrina neoadyuvante. La aplicacion del modelo de riesgo de recidiva ponderado por proliferacion y subtipo intrinseco de PAM50 a las muestras de un mes de tratamiento identifica de manera precisa tumores agresivos que no responden a tratamiento endocrino neoadyuvante o adyuvante. Las pacientes con estos tumores deben derivarse inmediatamente a tratamientos neoadyuvantes alternativos, tales como quimioterapia, porque estos tumores malos se comportan como enfermedad agresiva que no responde a la terapia endocrina. Se establecio un alto grado de correlacion entre el marcador de proliferacion Ki67 y la puntuacion de riesgo de PAM50 ponderada por proliferacion que apoya la afirmacion de que la puntuacion de riesgo ponderada por proliferacion de PAM50 tiene propiedades de pronostico. Sin embargo, estas propiedades de pronostico estan notablemente potenciadas cuando se aplica el analisis a muestras recogidas de tumores que se han expuesto a un agente endocrino. En la practica, esto puede lograrse facilmente recetando un agente endocrino durante algunas semanas antes de la cirugia definitiva o volviendo a tomar muestras de un tumor de manera temprana en el transcurso de un tratamiento endocrino neoadyuvante con el fin de identificar tumores que no responden.
Metodología: La evidencia para apoyar estas afirmaciones surge de un ensayo de fase 2 patrocinado por el National Cancer Institute de terapia neoadyuvante con el inhibidor de aromatasa letrozol (subvencion del NCI n.D R01 CA095614). La elegibilidad para el ensayo requirio mujeres postmenopausicas con canceres de mama en estadio 2 y 3 positivos para ER y/o PgR. Las pacientes recibieron 4 meses de terapia y luego se sometieron a cirugia. Se obtuvieron muestras de tumor congeladas en el nivel inicial, al mes y en la cirugia. Se analizaron las muestras mediante corte congelado y se extrajo el ARN usando metodologias convencionales de muestras ricas en tumor y se sometio a analisis de expresion genica usando las matrices 1x44K de Agilent. Se normalizaron los datos al conjunto de datos usado para entrenar el clasificador PAM50 (metodos descritos anteriormente) y se produjeron dos lecturas: una clasificacion intrinseca (LumA, LumB, enriquecido en HER2, de tipo basal y de tipo normal) y una puntuacion de riesgo de PAM50 ponderada por proliferacion. El objetivo de este estudio fue correlacionar los desenlaces de terapia endocrina neoadyuvante con la puntuacion de riesgo ponderada por proliferacion y clasificacion intrinseca derivada tanto de la muestra de nivel inicial como de la muestra durante el tratamiento tomada al mes.
Resultados:
La puntuacion de riesgo ponderada por proliferacion y subtipo intrinseco de PAM50 mostro cambios marcados al mes tras la terapia (tabla 8). La mayoria de las transiciones se produjeron en el grupo de LumB, cambiando la mayoria a LumA, pero el 16% permanecio en la categoria de LumB pese al tratamiento. Por el contrario, la mayoria de los tumores LumA permanecieron LumA tras la terapia. Estas transiciones se debieron a la supresion del agrupamiento de proliferacion en el grupo de LumB puesto que la puntuacion de riesgo ponderada por proliferacion de PAM50 mostro cambios similares, convirtiendose la mayoria de los tumores de tipo de alto riesgo (68%) en de riesgo intermedio o bajo en las muestras durante el tratamiento. La estrecha correlacion con inmunohistoquimica de Ki67 destaca adicionalmente esta conclusion. La correlacion entre los valores de Ki67 de nivel inicial y la puntuacion de riesgo ponderada por proliferacion de PAM50 fue alta (P=2,8xE-8). De manera similar, los valores de Ki67 al mes y la puntuacion de proliferacion de PAM50 al mes tambien estuvieron estrechamente correlacionados (P=3,8E-10). Sin embargo, aunque el subtipo de puntuacion de riesgo ponderada por proliferacion de PAM50 de nivel inicial solo mostro una correlacion muy debil con los valores de Ki67 de fin del estudio (P=0,04), hubo una estrecha correlacion entre la puntuacion de riesgo ponderada por proliferacion de PAM50 al mes y los valores de Ki67 de fin del estudio (la mayoria de los cuales se obtuvieron en la cirugia de 4 a 6 meses mas tarde (P=6,8E-11)). Esta ultima observacion apoya fuertemente la afirmacion de que puede usarse una prueba basada en PAM50 en tratamiento temprana para predecir si las muestras quirurgicas finales tendran caracteristicas de biomarcador favorables, tales como una baja tasa de proliferacion.
Para determinar las correlaciones clinicas asociadas con estos cambios inducidos por terapia endocrina en la puntuacion de riesgo y subtipo intrinseco de cancer de mama, se examinaron cuatro criterios de valoracion: respuesta clinica (criterios RECIST), tamano T patologico (T1 frente a mas alto (como evidencia para el descenso del estadio TNM patologico con el tratamiento), valores de Ki67 dicotomizados (se considera que los tumores que muestran un valor logaritmico natural de Ki67 de 1 o menos muestran un perfil favorable) y acontecimientos de recidiva. La puntuacion de riesgo o subtipo de nivel inicial no mostro capacidad convincente para predecir ninguno de estos criterios de valoracion lo que, en lo que se refiere a la recidiva, es probablemente una funcion del pequeno tamano de muestra en este ensayo (tabla 9). Por el contrario, y pese al pequeno tamano de muestra, el subtipo intrinseco de PAM50 al mes (tabla 10) mostro relaciones estadisticamente significativas con respuesta clinica (P=0,01), valor de Ki67 favorable al fin del tratamiento (P= 0,0003) y recidiva (0,009). Estas fuertes relaciones estuvieron conducidas por el desenlace extremadamente malo asociado con los tumores que se designaban o bien "no luminales" o bien luminales B en las muestras en tratamiento. La puntuacion de riesgo ponderada por proliferacion de PAM50 tenia propiedades similares. La puntuacion de riesgos ponderada por proliferacion de PAM50 de nivel inicial no predijo los desenlaces con neoadyuvante o a largo plazo de manera muy eficaz (tabla 11). Sin embargo, los tumores que se designaron de alto riesgo al mes mostraron correlaciones significativas con malos desenlaces en los cuatro criterios de valoracion examinados, es decir mala respuesta clinica (P=0,02), descenso del estadio TNM patologico bajo (p=0,02), valor de Ki67 desfavorable al fin del tratamiento (P=0,0001) y recidiva (p=0,001) (tabla 12).
Por tanto, puede usarse la aplicacion de la puntuacion de riesgo y subtipo intrinseco basados en PAM50 para 5 muestras de tumor recogidas de canceres de mama ER+ primarios que se someten a tratamiento prequirurgico con un agente para los siguientes fines:
1) Prediccion de ausencia de respuesta a la terapia endocrina neoadyuvante
10 2) Determinacion del pronostico para pacientes con cancer de mama ER+ que se someten posteriormente a tratamiento endocrino adyuvante.
Tabla 8. Grupo de riesgo ponderado por proliferacion y subtipo de PAM50 que cambia al mes tras el tratamiento.
Categoria de cambio
Numero Porcentaje
Cambios de subtipo intrínseco de PM50
De LumA a LumA
18 31,0
De LumA a LumB
1 1,7
De LumA a no Lum
0 0
De LumB a LumA
29 50,0
De LumB a LumB
6 10,3
De LumB a no Lum
1 1,7
De no Lum a no Lum
1 1,7
De no Lum a LumA
0 0
De no Lum a LumB
2 3,4
Total
58 100
Puntuación de riesgo de PAM50 ponderada por proliferación
De baja a baja
5 8,6
De baja a media
1 1,7
De baja a alta
0 0
De media a baja
7 12,1
De media a media
12 20,7
De media a alta
1 1,7
De alta a baja
11 19
De alta a media
14 24,1
De alta a alta
7 12,1
Total
58 100
Tabla 9. Interacciones entre designaciones de subtipo intrinseco de PAM50 de nivel inicial y desenlaces de terapia endocrina neoadyuvante.
Subtipo o puntuación en el nivel inicial
Criterio de valoración de fin del estudio Número/total % de desenlaces favorables Valor de P en la interacción
Subtipo
Respuesta clinica CR+PR frente a SD+PD 0,54
LumA
28/76 60,71
LumB
42/76 69,05
No Lum�
6/76 50,00
Tamano del tumor patologico* :2 cm frente a >2 cm
0,29
LumA
29/78 37,79
LumB
43/78 48,84
No Lum�
6/78 16,67
Ki67 en log normal� : log 1,0 frente a >1,0
0,03
LumA
30/29 66,67
LumB
43/79 37,21
No Lum�
6/79 33,33
Recidiva Si frente a No
0,262
LumA
30/78 90,00
LumB
42/78 90,4762
No Lum�
6/78 66,67
* Puesto que todas las pacientes tenian enfermedad en estadio clinico 2 o 3, el estadio patologico del tumor uno y cirugia se consideraron como evidencia de descenso del estadio TNM satisfactorio. Se supone que los tumores que evolucionaron durante la terapia y se sometieron a quimioterapia neoadyuvante tienen un tamano T patologico mayor de 2 cm al final del estudio. � Ki67 de fin del estudio se define como o bien la muestra quirurgica o bien el valor al mes si la paciente evoluciono con terapia endocrina neoadyuvante y se sometio a quimioterapia o no se sometio a cirugia. �No luminal se refiere a muestras designadas de tipo basal o enriquecidas en HER2. No se incluye de tipo normal en este analisis porque se supone que estas muestras no contienen suficientes celulas tumorales para la subtipificacion adecuada.

Tabla 10. Interacciones entre designaciones de subtipo intrinseco de PAM50 al mes con tratamiento y desenlaces de terapia endocrina neoadyuvante.
Subtipo de PAM50 al mes
Criterio de valoración de fin del estudio Número/total % de desenlaces favorables Valor de P en la interacción
Subtipo
Respuesta clinica CR+PR frente a SD + PD 0,01
LumA
45/56 75,56
LumB
9/56 44,44
No Lum�
2/56 0
Tamano del tumor patologico* :2 cm frente a >2 cm
0,41
LumA
46/57 47,83
LumB
9/57* 22,22
No Lum�
2/57 50,00
Ki67 en log normal� : log 1,0 frente a >1,0
0,0003
LumA
47/58 61,70
LumB
9/58 0
No Lum�
2/58 0
Recidiva Si frente a No
0,009
LumA
45/53 93,62
LumB
7/53 57,14
No Lum�
2/53 50,00
* Puesto que todas las pacientes tenian enfermedad en estadio clinico 2 o 3, el estadio patologico del tumor uno y cirugia se consideraron como evidencia de descenso del estadio TNM satisfactorio. Se supone que los tumores que evolucionaron durante la terapia y se sometieron a quimioterapia neoadyuvante tienen un tamano T patologico mayor de 2 cm al final del estudio. � Ki67 de fin del estudio se define como o bien la muestra quirurgica o bien el valor al mes si la paciente evoluciono con terapia endocrina neoadyuvante y se sometio a quimioterapia o no se sometio a cirugia. �No luminal se refiere a muestras designadas de tipo basal o enriquecidas en HER2. No se incluye de tipo normal en este analisis porque se supone que estas muestras no contienen suficientes celulas tumorales para la subtipificacion adecuada.

Tabla 11. Interacciones entre designaciones de puntuacion de riesgo ponderado por proliferacion de PAM50 de nivel inicial y desenlaces de terapia endocrina neoadyuvante
Puntuación de riesgo, con proliferación en nivel inicial
Criterio de valoración de fin del estudio Número/total % de desenlaces favorables Valor de P en la interacción †
Respuesta clinica CR+PR frente a SD + PD
0,4573
Baja
9/76 44,44
Media
28/76 67,79
Alta
39/76 66,67
Tamano del tumor patologico* :2 cm frente a >2 cm
1,0
Baja
9/78 44,44
Media
29/78 41,38
Alta
37/78 42,50
Ki67 en log normal� : log 1,0 frente a >1,0
0,03431
Baja
9/79 77,78
Media
30/79 56,67
Alta
40/79 35,00
Recidiva Si frente a No
0,1191
Baja
9/74 77,78
Media
29/74 96,67
Alta
36/74 84,62
* Puesto que todas las pacientes tenian enfermedad en estadio clinico 2 o 3, el estadio patologico del tumor uno y cirugia se consideraron como evidencia de descenso del estadio TNM satisfactorio. Se supone que los tumores que evolucionaron durante la terapia y se sometieron a quimioterapia neoadyuvante tienen un tamano T patologico mayor de 2 cm al final del estudio. � Ki67 de fin del estudio se define como o bien la muestra quirurgica o bien el valor al mes si la paciente evoluciono con terapia endocrina neoadyuvante y se sometio a quimioterapia o no se sometio a cirugia. �No luminal se refiere a muestras designadas de tipo basal o enriquecidas en HER2. No se incluye de tipo normal en este analisis porque se supone que estas muestras no contienen suficientes celulas tumorales para la subtipificacion adecuada.

Tabla 12. Interacciones entre puntuacion de riesgo ponderada por proliferacion de PAM50 al mes con tratamiento y desenlaces de terapia endocrina neoadyuvante
Puntuación de riesgo ponderada por proliferación de PAM50 al mes
Criterio de valoración de fin del estudio Número/total % de desenlaces favorables Valor de P en la interacción
Respuesta clinica CR+PR frente a SD + PD
0,02
Baja
21/56 80,95
Media
27/56 70,37
Alta
8/56 25,00
Tamano del tumor patologico* :2 cm frente a >2 cm
0,02
Baja
23/57 47,83
Media
26/57 53,85
Alta
8/57 0
Ki67 en log normal� : log 1,0 frente a >1,0
0,0001
Baja
23/58 78,26
Media
27/58 40,74
Alta
8/58 0
Recidiva Si frente a No
0,001
Baja
23/56 95,65
Media
27/56 92,59
Alta
6/56 33,33
* Puesto que todas las pacientes tenian enfermedad en estadio clinico 2 o 3, el estadio patologico del tumor uno y cirugia se consideraron como evidencia de descenso del estadio TNM satisfactorio. Se supone que los tumores que evolucionaron durante la terapia y se sometieron a quimioterapia neoadyuvante tienen un tamano T patologico mayor de 2 cm al final del estudio. � Ki67 de fin del estudio se define como o bien la muestra quirurgica o bien el valor al mes si la paciente evoluciono con terapia endocrina neoadyuvante y se sometio a quimioterapia o no se sometio a cirugia. �No luminal se refiere a muestras designadas de tipo basal o enriquecidas en HER2. No se incluye de tipo normal en este analisis porque se supone que estas muestras no contienen suficientes celulas tumorales para la subtipificacion adecuada.
Ejemplo 3.
Se realizo un analisis de riesgo de recidiva en las muestras descritas en el ejemplo 1, excepto en que se elimino la
5 clase de tipo normal del modelo. Se represento la clase de tipo normal usando "valores normales" verdaderos a partir de mamoplastia de reduccion o tejido no implicado a simple vista. Por tanto, esta clase se ha eliminado de todos los analisis de desenlace y esta clasificacion se considera una medida de control de calidad. Los metodos no descritos a continuacion son identicos a los metodos descritos en el ejemplo 1.
10 Metodos
Modelos pronósticos y predictivos usando datos de subtipo molecular y clínico:
Se usaron analisis de una variable y de multiples variables para determinar la significacion de subtipos intrinsecos
15 (LumA, LumB, enriquecido en HER2 y de tipo basal) en pacientes no tratadas y en pacientes que recibieron quimioterapia neoadyuvante. Para el pronostico, se compararon los subtipos con variables clinicas convencionales (T, N, estado de ER y grado histologico), con tiempo hasta la recidiva (es decir, cualquier acontecimiento) como criterio de valoracion. Se compararon los subtipos con el grado y los marcadores moleculares (ER, receptor de progesterona (PR), HER2) para la prediccion en la practica de neoadyuvante puesto que no es aplicable la
20 estadificacion patologica. Se realizaron pruebas de razon de verosimilitud para comparar modelos de datos clinicos, datos de subtipo y variables moleculares y clinicas combinadas disponibles. Se realizaron analisis de supervivencia categoricos usando una prueba de rangos logaritmicos y se visualizo con diagramas de Kaplan-Meier.
Modelos de riesgo de desarrollo con datos clínicos y moleculares
25 Se entreno el modelo de riesgo de subtipo con un modelo de Cox de multiples variables usando ajuste de regresion de Ridge para el subconjunto no tratado, negativo para ganglios de la cohorte de van de Vijver et al. (2002). Se asigno una puntuacion de ROR a cada caso de prueba usando correlacion con el subtipo solo (1) (ROR-S) o usando correlacion de subtipo junto con tamano del tumor (2) (ROR-C):
(1) ROR-S = 0,05*Basal + 0,12*Her2 + -0,34*LumA + 0,023*LumB
(2) ROR-C = 0,05*Basal + 0,11*Her2 + -0,23*LumA + 0,09*LumB + 0,17*T
35 La suma de los coeficientes para el modelo de Cox es la puntuacion de ROR para cada paciente. Para clasificar las muestras en grupos de riesgo especificos, se eligieron umbrales del conjunto de entrenamiento tal como se describe en el ejemplo 1. Se realizo un analisis mediante SiZer para caracterizar la relacion entre la puntuacion de ROR y la supervivencia libre de recidiva. Los IC del 95% para la puntuacion de ROR son versiones locales de IC binomiales, calculandose el tamano de muestra local a partir de un estimador de densidad tipo nucleo gaussiano, basado en la
40 eleccion de Sheather-Jones de anchura de ventana.
Comparación de modelos de predicción de recidiva
Se compararon cuatro modelos para prediccion de recidiva: (1) un modelo de variables clinicas solas (tamano del
45 tumor, grado y estado de ER), (2) ROR-S, (3) ROR-C, y (4) un modelo que combina subtipo, tamano del tumor y grado. Se eligio el indice C para comparar la fuerza de los diversos modelos. Para cada modelo, se estimo el indice C de 100 aleatorizaciones de la cohorte no tratada a dos tercios de conjunto de entrenamiento y un tercio de conjunto de prueba. Se calculo el indice C para cada conjunto de prueba para formar la estimacion de cada modelo y se compararon las estimaciones del indice C en todos los modelos usando la prueba de la t de dos muestras.
50 Resultados
Modelos de riesgo de recidiva para pronóstico en cáncer de mama negativo para ganglios
Se sometieron a prueba modelos de Cox usando el subtipo intrinseco solo y junto con variables clinicas. La tabla 13 muestra los analisis de multiples variables de estos modelos en una cohorte independiente de pacientes no tratadas (vease el ejemplo 1). En el modelo A, se encontro que los subtipos, el tamano del tumor (T1 o mayor) y el grado histologico eran factores significativos para ROR. Se encontro que la gran mayoria de los tumores de tipo basal 5 (95,9%) eran de grado medio o alto, y por tanto, en el modelo B, que es un analisis sin grado, el tipo basal se convierte en significativo. El modelo C muestra la significacion de los subtipos en la poblacion negativa para ganglios. Todos los modelos que incluyeron el subtipo y las variables clinicas fueron significativamente mejores que cualquiera de las variables clinicas solas (P<0,0001) o el subtipo solo (P<0,0001). Se entreno un clasificador de recidiva para predecir desenlaces dentro del contexto de los subtipos intrinsecos y variables clinicas. Se selecciono 10 una cohorte de tratamiento no sistemico, negativa para ganglios (n=141) del conjunto de datos de micromatriz de Vijver et al. (2002) para entrenar el modelo de ROR y para seleccionar puntos de corte. Hubo una clara mejoria en la reduccion con subtipo (ROR-S) en relacion con el modelo de variables clinicas disponibles solo (vease Parker et al. (2009) J Clin Oncol 27(8):1160-1167). Una combinacion de variables clinicas y subtipo (ROR-C) tambien es una mejora significativa con respecto a cualquier factor pronostico individual. Sin embargo, la informacion sobre el grado
15 no mejoro significativamente el indice C en el modelo combinado, lo que indica que el valor pronostico del grado se ha sustituido por la informacion proporcionada por el modelo de subtipo intrinseco. Cuando se usa ROR-C para ROR en un conjunto de prueba pronostico de pacientes no tratadas negativas para ganglios, solo el grupo de LumA contenia pacientes con bajo riesgo y la distincion de tres clases de riesgo bajo, medio y alto fue pronostico. Ademas, las puntuaciones de RORC tienen una relacion lineal con probabilidad de recidiva a los 5 anos.
20 Tabla 13. Modelos de supervivencia libre de recidiva (no tratada)
Variable
Modelo A Modelo B Modelo C
Razon de riesgo
p Razon de riesgo p Razon de riesgo p
De tipo basal*
1,33 0,33 1,79 0,3 1,58 0,066
Enriquecido en HER*
2,53 0,00012 3,25 <0,0001 2,9 <0,0001
LumB*
2,43 <0,0001 2,88 <0,0001 2,54 <0,0001
Estado de ER�
0,83 0,38 0,83 0,34 0,83 0,32
Tamano del tumor�
1,36 0,034 1,43 0,012 1,57 0,001
Estado de los ganglios�
1,75 0,035 1,72 0,041 - -
Grado histologico11
1,4 0,0042 - - - -
Completo frente a subtipo�
<0,0001 <0,0001 <0,0001
Completo frente a clinico�
<0,0001 <0,0001 <0,0001
*Clase luminal A usada como estado de referencia en analisis de multiples variables. �Razones de riesgo para ER usando marcador positivo en el numerador. �Tamano : 2 cm frente a > 2 cm. �Cualquier ganglio positivo. 11Grado codificado como una variable ordinal con tres niveles. �Los valores de P significativos indican prediccion mejorada en relacion con subtipo solo. �Los valores de P significativos indican prediccion mejorada en relacion con datos clinicos solos.
Subtipos y predicción de respuesta a tratamiento neoadyuvante con T/FAC
25 El estudio de Hess et al. (2006) que realizo micromatriz sobre tumores de pacientes tratadas con T/FAC permitio la investigacion de la relacion entre los subtipos y marcadores clinicos y como se relaciona cada uno con pCR>. La tabla 14 muestra los analisis de multiples variables de los subtipos junto con marcadores moleculares clinicos (ER. PR, HER2) y o bien con (modelo A) o bien sin (modelo B) grado histologico. Las unicas variables significativas en el
30 contexto de este estudio fueron los subtipos intrinsecos. Se encontro un 94% de sensibilidad y un 97% de valor predictivo negativo para identificar pacientes que no responden a quimioterapia cuando se usa el modelo de ROR-S para predecir pCR. La relacion entre puntuaciones de riesgo alto y una probabilidad mas alta de pCR es compatible con la conclusion de que los tumores positivos para ER indolentes (LumA) responden menos a quimioterapia. Sin embargo, a diferencia de ROR para pronostico, parece alcanzarse una meseta para el ROR frente a probabilidad la de pCR, lo que confirma la presencia de resistencia a quimioterapia significativa entre los tumores de riesgo mas alto.

Tabla 14. Modelos de respuesta neoadyuvante
Variable
Modelo A Modelo B Modelo C
Razon de probabilidades
P Razon de probabilidades P Razon de probabilidades P
De tipo basal*
1,33 0,3 1,79 0,3 1,58 0,066
Enriquecido en HER*
2,53 0,00012 3,25 <0,0001 2,9 <0,0001
LumB*
2,43 <0,0001 2,88 <0,0001 2,54 <0,0001
Estado de ER�
0,83 0,38 0,83 0,34 0,83 0,32
Estado de PR�
1,36 0,034 1,43 0,012 1,57 0,001
Grado histologico�
1,4 0,0042 - - - -
Completo frente a subtipo�
<0,0001 <0,0001 <0,0001
Completo frente a clinico11
<0,0001 <0,0001 <0,0001
*Clase luminal A usada como estado de referencia en analisis de multiples variables. �Razones de riesgo para ER, PR y HER2 son marcadores positivos en el numerador. �Grado codificado como una variable ordinal con tres niveles. �Los valores de P significativos indican prediccion mejorada en relacion con subtipo solo. 11Los valores de P significativos indican prediccion mejorada en relacion con datos clinicos solos.
Ejemplo 4.
En este estudio, se uso qRT-PCR y puntos de corte previamente establecidos (vease el ejemplo 1) para evaluar el
10 valor pronostico del clasificador PAM50 en el grupo de mujeres comun, clinicamente importante que son positivas para receptor de estrogeno y se trataron con tamoxifeno como su unica terapia sistemica adyuvante. A diferencia de la mayoria de informes previos, esta cohorte del estudio tratada homogeneamente incluye una gran proporcion de pacientes positivas para ganglios linfaticos. El seguimiento a largo plazo detallado disponible permite la evaluacion no solo de la supervivencia libre de recidiva, sino tambien del riesgo de muerte especifica por enfermedad de cancer
15 de mama, en comparacion con todos los factores de riesgo clinicopatologicos convencionales.
Metodos
Pacientes:
20 La cohorte del estudio se deriva de pacientes femeninas con cancer de mama invasivo, recien diagnosticadas en la provincia de la Columbia Britanica (British Columbia) en el periodo entre 1986 y 1992. Se corto tejido en diversos hospitales alrededor de la provincia, se congelo y se envio al laboratorio de receptor de estrogeno (ER) central en el Hospital de Vancouver (Vancouver Hospital); en este estudio se usa la parte del material recibido que se fijo en
25 formalina y se incrusto en parafina como referencia histologica. La informacion clinica vinculada a las muestras incluye edad, histologia, grado, tamano del tumor, numero de ganglios axilares implicados, invasion linfatica o vascular, estado de ER mediante el metodo DCC, tipo de terapia sistemica adyuvante local e inicial, fechas de diagnostico, primeria reaparicion local, regional o distante, fecha y causa de la muerte. Las caracteristicas de esta cohorte de pacientes se han descrito previamente en detalle en un estudio basado en la poblacion que valida el
30 modelo de pronostico ADJUVANT� [Olivotto 2005], y se usaron los mismos bloques fuente para montar micromatrices de tejido que se han caracterizado para la expresion de ER [Cheang 2006] y HER2 [Chia 2008]. Para este estudio, se seleccionaron pacientes que tenian tumores positivos para ER mediante inmunohistoquimica, y recibieron tamoxifeno como su unica terapia sistemica adyuvante. Durante el periodo de tiempo en el que estas pacientes recibieron su tratamiento, las directrices provinciales recomendaban tamoxifeno adyuvante para mujeres
35 posmenopausicas, con tumores positivos para ER que tenian algunas caracteristicas de riesgo alto presentes tales como invasion linfovascular. Se trato principalmente a pacientes similares sin caracteristicas de riesgo alto sin terapia sistemica adyuvante. En la mayoria de los casos, se ofrecio solo quimioterapia a mujeres premenopausicas.
Preparación de ARN:
Se aislo ARN de nucleos de tejido guiado por patologo. En resumen, se revisaron secciones de H y E de cada bloque por un patologo. Se seleccionaron areas que contenian carcinoma de mama invasivo representativo y se senalaron con un circulo en el bloque fuente. Usando una aguja de biopsia de 1,0 mm, se extrajeron al menos dos nucleos de tumor del area senalada con un circulo. Se recupero ARN usando el kit High Pure ARN Paraffin (Roche Applied Science, Indianapolis EN), se elimino el ADN con ADNasa Turbo (Ambion, Austin TX) y se avaluo el rendimiento de ARN usando un espectrofotometro ND-1000 (NanoDrop Technologies, Rockland A).
qRT-PCR:
Se realizo la sintesis de ADNc usando una mezcla de hexameros al azar y cebadores especificos de genes, y se realizo la qPCR con el instrumento LightCycler 480 de Roche tal como se describio anteriormente [Mullins 2007]. Cada placa de 384 pocillos contenia muestras por duplicado (2,5 ng de ADNc por reaccion) y un calibrador por triplicado (10 ng de ADNc por reaccion). Se considero que una muestra de tumor era de calidad insuficiente si faltaba cualquiera de los controles de referencia (ACTB, PSMC4, RPLP0, MRPL19 o SF3A1). La PCR fue tecnicamente satisfactoria para los 50 genes discriminadores en el 73% de los casos, y para 49 de los 50 en otro 15% de los casos. Para evaluar la tolerancia de los resultados del ensayo PAM50 para la informacion genica que faltaba, se evaluaron los valores de ROR-C en los datos tras la eliminacion simulada al azar de un numero creciente de genes. La perdida de un gen dio como resultado un cambio de 0-2 unidades en la puntuacion de riesgo, que se corresponde con un 1% de aumento/disminucion de la supervivencia especifica de la enfermedad a 10 anos.
Asignación del subtipo biológico a las muestras clínicas:
Se construyeron centroides de expresion genica que se corresponden con subtipos luminal A, luminal B, enriquecido en HER-2, de tipo basal y de tipo normal usando el panel de 50 genes intrinsecos tal como se describio en el ejemplo 1 y en Parker et al. (2007 J. Clin. Oncol. 27(8):1160-7, que se incorpora en el presente documento como referencia en su totalidad). Se asignaron las muestras a un subtipo intrinseco basandose en la distancia al centroide mas cercano calculada mediante la correlacion de rangos de Spearman, por investigadores ciegos a los datos de desenlace.
Relación del subtipo PAM50 con el desenlace clínico:
Se realizaron analisis estadisticos usando SPSS v16.0 y R v2.8.0. Se realizo un analisis de una variable del subtipo de tumor frente a supervivencia libre de recidiva distante de cancer de mama y supervivencia especifica de la enfermedad de cancer de mama mediante analisis de Kaplan-Meier, con prueba de rangos logaritmicos para determinar la significacion. Se realizo un analisis de multiples variables frente a los parametros clinicos convencionales de tamano del tumor, estado de los ganglios (% de ganglios positivos con respecto al total examinado), grado histologico, edad de la paciente y estado de HER2 (basandose en nucleos adyacentes del mismo bloque fuente, montados en micromatrices de tejido y sometidos a inmunotincion y analisis FISH usando protocolos equivalentes clinicos [Chia 2008]). Se desarrollaron modelos de regresion de Cox [Cox 1984] para estimar las razones de riesgo ajustadas de los subtipos de cancer de mama asignados a qPCR [Truong 2005]. Solo se incluyeron casos con informacion para todas las covariables en el analisis. Se usaron graficos suavizados de residuos de Schoenfeld ponderados para evaluar asunciones de riesgo proporcionales [Grambsch 1994].
Relación de la puntuación de riesgo de recidiva (ROR) con el desenlace clínico:
Se entreno el algoritmo de puntuacion de ROR (ROR-S que incorpora la correlacion de una muestra con los subtipos luminal A, luminal B, enriquecido en HER2 y de tipo basal; ROR-C que incorpora esta informacion mas tamano del tumor) y se valido en tres series de cancer de mama perfilados con micromatriz y una perfilada con qPCR. Se asignaron puntos de corte de estratificacion del riesgo en el conjunto de entrenamiento de tal manera que ninguna paciente luminal A estuviera en la categoria de riesgo alto, y ninguna paciente de tipo basal estuviera en la categoria de riesgo bajo. Se realizaron analisis de regresion de Cox y Kaplan-Meier como anteriormente.
Resultados
A partir de muestras quirurgicas que se habian fijado en formalina e incrustado en parafina 15-20 anos antes, se extrajeron nucleos de tumores de areas identificadas por el patologo de carcinoma de mama invasivo para 991 casos. Tras la extraccion del ARN, 815 muestras proporcionaron al menos 1,2 !g de ARN total a una concentracion de al menos 25 ng/!l, y se procedio al analisis mediante PCR. El molde era de calidad tecnicamente suficiente (basandose en controles de genes de mantenimiento internos) para qRT-PCR en 806. Entre estos casos, un total de 711 muestras proporcionaron datos cuantitativos de qRT-PCR de alta calidad para al menos 49 de los genes discriminadores de PAM50, y se incluyeron en analisis clinicos y de supervivencia posteriores. Las caracteristicas clinicas para estos 711 pacientes se presentan en la tabla 15.
Tabla 15
Parámetro clínico
Serie de TAM completa Luminal A Luminal B Her2 Basal Normal
Tamaño de la muestra
N 711 329 312 58 3 9
Edad (en anos)
Mediana [RIC] 67 67 68 66 68 66
Premenopausica
Si 18 9 7 2 0 0
No
678 315 297 56 3 7
Desconocido/embarazada
15 5 8 0 0 2
Cirugia
Mastectomia completa 428 187 196 36 3 6
Mastectomia parcial
274 139 111 21 0 3
Otros
9 3 5 1 0 0
Diseccion del ganglio axilar
Si 675 308 298 57 3 9
No
36 21 14 1 0 0
Radioterapia de la mama/pared del pecho
Si 372 180 153 34 0 5
No
339 149 159 24 3 4
Tamoxifeno adyuvante
Si 711 329 312 58 3 9
No
0 0 0 0 0 0
Quimioterapia adyuvante
Si 0 0 0 0 0 0
No
711 329 312 58 3 9
Tamano del tumor (cm)
Mediana [RIC] 2,2 2,0 2,5 2,5 2,5 3,0
Estadio T (clinico)
T0/IS 0 0 0 0 0 0
T1
298 155 113 24 3 3
T2
346 147 169 27 0 3
T3
18 10 5 3 0 0
T4
28 9 15 1 0 3
TX
21 8 10 3 0 0
N.D de ganglios positivos
0 199 83 91 18 0 7
1-3
328 162 139 24 1 2
4-9
111 49 51 10 1 0
+10
26 8 16 2 0 0
Desconocido
47 27 15 4 1 0
Grado
Grado 1: bien diferenciado 24 20 2 1 0 1
Grado 2: moderadamente diferenciado
306 169 119 13 0 5
Grado 3: escasamente diferenciado
338 117 173 43 2 3
Desconocido
43 23 18 1 1 0
Subtipo histologico
NOS ductal 642 289 288 54 3 8
Lobular
54 30 19 4 0 1
Mucinoso
7 4 3 0 0 0
Tubular
5 5 0 0 0 0
Medular
2 1 1 0 0 0
Apocrino
1 0 1 0 0 0
Invasion linfovascular
Si 444 184 215 39 1 5
No
230 122 84 18 2 4
Desconocido
37 23 13 1 0 0
Estado del receptor de estrogeno clinico (DCC)
Perdido 6 4 2 0 0 0
Negativo (0-9 fmol/g)
9 3 2 4 0 0
Positivo (>10 fmol/mg)
696 322 308 54 3 9
ER inmunohistoquimico
Negativo 0 0 0 0 0 0
Positivo
711 329 312 58 3 9
Basandose en el centroide de PAM50 mas cercano, se asigno un total de 329 (46,3%) de estos casos positivos para ER clinicamente como subtipos de cancer de mama intrinsecos luminal A, 312 (43,8%) como luminal B, 58 (8,2%) como enriquecido en HER-2, 3 (0,4%) como de tipo basal y 9 (1,3%) como de tipo normal mediante la expresion
5 genica (tabla 13). Para los nueve casos asignados como de tipo normal, se reviso la histologia, usando los nucleos de micromatriz de tejido tomados de la misma area del bloque fuente. En ocho de estos nueve casos, estaban ausentes celulas cancerosas invasivas viables o eran poco comunes en un nucleo inmediatamente adyacente, lo que concuerda con el perfil de expresion de tipo normal que representa una toma de muestras de tumor inadecuada. Por tanto se excluyeron los casos de tipo normal de analisis adicionales.
10 El subtipo biologico intrinseco era fuertemente pronostico mediante el analisis de Kaplan-Meier (figura 4). En la poblacion de la Columbia Britanica en el tiempo de la adquisicion de muestras para este estudio, muchos pacientes con un perfil de riesgo clinicamente bajo no recibieron terapia sistemica adyuvante [Olivotto 2005]. Por el contrario, los que recibieron tamoxifeno adyuvante que son los sujetos en este estudio comprendian un grupo de riesgo clinico
15 superior, con tasas de supervivencia libre de recidiva distante a 10 anos global del 62% y tasas de supervivencia especifica de la enfermedad de cancer de mama del 72%. Los que se determino que tenian un perfil luminal A mediante el ensayo PAM50 tenian un desenlace significativamente mejor (supervivencia libre de recidiva a 10 anos al 74%, supervivencia especifica de la enfermedad = 83%) que tumores luminal B, enriquecido en HER-2 o de tipo basal.
20 Todos los casos en este estudio eran positivos para receptor de estrogeno mediante inmunohistoquimica evaluada centralmente [Cheang 2006], y el 98,7% tambien era positivo mediante ensayo bioquimico recubierto con dextranocarbon clinico. A pesar de esto, el panel de qPCR de PAM50 asigno el 10% de casos a subtipos no luminales, la mayoria a enriquecido en HER-2, tal como se observo previamente cuando se consultan conjuntos de datos publicados para la expresion de los genes de PAM50 (ejemplo 2).
Para esta cohorte de mujeres clinicamente positivas para receptor de estrogeno, tratadas uniformemente con
5 tamoxifeno como su unica terapia sistemica adyuvante, se construyo un modelo de Cox de multiples variables para someter a prueba el valor independiente del subtipo PAM50 frente a la edad de la paciente y los factores clinicopatologicos convencionales de tamano del tumor, estado de los ganglios, grado histologico y expresion de HER2 (tabla 16). El subtipo biologico intrinseco permanecio significativo en el modelo de multiples variables, al igual que el estado de los ganglios y el tamano del tumor, pero el grado y el estado de HER2 clinico, significativos en el
10 analisis de una variable en esta cohorte, no contribuyo con informacion de pronostico independiente significativa para supervivencia o bien libre de recidiva o bien especifica de la enfermedad en el modelo de multiples variables incorporando el resultado de PAM50.
Tabla 16: analisis de una variable y multiples variables de modelo de Cox incorporando el subtipo biologico PAM50
15 para supervivencia libre de recidiva y especifica de la enfermedad de cancer de mama entre (A) 604 mujeres con cancer de mama positivo para ER, tratado con tamoxifeno con datos completos para todas las covariables para supervivencia libre de recidiva y (B) supervivencia especifica de la enfermedad de cancer de mama (BCDSS; excluye 2 casos con causa de la muerte desconocida).
Criterio de valoración clínico
supervivencia libre de recidiva de una variable supervivencia libre de recidiva de multiples variables
razon de riesgo (IC del 95%)
valor de p razon de riesgo (IC del 95%) valor de p
edad (continuo)
1,00 (0,990-1,02) 0,53 0,996 (0,9811,01) 0,62
grado (1 o 2) frente a 3
1,45 (1,12-1,89) 0,0047 1,11 (0,8461,46) 0,45
porcentaje de ganglios positivos
0 frente a (>0 a <25%)
1,66 (1,15-2,39) 0,0070 1,76 (1,22-2,55) 0,0028
0 frente a � 25%
2,98 (2,10-4,22) 7,3E-10 2,85 (2,00-4,06) 6,3E-9
tamaño del tumor : 2 cm frente a > 2 cm
2,02 (1,55-2,65) 2,5E-7 1,71 (1,30-2,24) 1,3E-4
HER2 (IHC) �0, 1 o 2 + FISH negativo� frente a �2 + FISH positivo o 3 +�
1,52(1,04-2,23) 0,032 1,24 (0,8131,88) 0,32
Subtipo PAM50
luminal A frente a luminal B
1,73 (1,31-2,28) 1,0E-4 1,62 (1,22-2,16) 9,2E-4
luminal A frente a enriquecido en HER2
1,86 (1,18-2,92) 0,0074 1,53 (0,9292,52) 0,095
luminal A frente a de tipo basal
76,4 (9,79-597) 3,5E-5 62,5 (7,87-496) 9,2E-5
B.
Criterio de valoración clínico
BCDSS de una variable BCDSS de multiples variables
razon de riesgo (IC del 95%)
valor de p razon de riesgo (IC del 95%) valor de p
edad (continuo)
1,02 (0,999-1,03) 0,069 1,01 (0,9881,02) 0,56
grado (1 o 2) frente a 3
1,43 (1,07-1,91) 0,015 1,05 (0,7751,42) 0,76
porcentaje de ganglios positivos
0 frente a (>0 a <25%)
1,56 (1,03-2,37) 0,034 1,68 (1,11-2,56) 0,015
0 frente a � 25%
3,22 (2,19-4,73) 2,4E-9 3,04 (2,06-4,48) 2,3E-8
tamaño del tumor : 2 cm frente a > 2 cm
2,29 (1,69-3,10) 8,0E-8 1,90 (1,40-2,58) 4,3E-5
HER2 (IHC) �0, 1 o 2 + FISH negativo� frente a �2 + FISH positivo o 3 +�
1,54 (1,01-2,35) 0,043 1,19 (0,7551,86) 0,46
Subtipo PAM50
luminal A frente a luminal B
2,05 (1,50-2,80) 6,0E-6 1,90 (1,37-2,62) 1,0E-4
luminal A frente a enriquecido en HER2
2,20 (1,33-3,64) 0,0021 1,85 (1,07-3,20) 0,028
luminal A frente a de tipo basal
104 (13,1-832) 1,2E-5 91,1 (11,2-743) 2,5E-5
Puede calcularse una puntuacion de riesgo de recidiva (ROR) a partir del panel de qPCR de PAM50. Las puntuaciones tanto de ROR-S (basada solo en la obtencion del subtipo molecular a partir del panel de PAM50) como de ROR-C (que combina informacion del subtipo y del tamano del tumor) son altamente pronosticas en una
5 poblacion tratada de manera homogenea con tamoxifeno adyuvante, para una serie que contiene grandes numeros de casos positivos para ganglios, y para el criterio de valoracion de supervivencia especifica a cancer de mama (figura 5).
Tal como se muestra en la figura 6, el algoritmo de ROR-C no solo es altamente pronostico entre pacientes
10 negativas para ganglios, sino que revela diferencias incluso mas amplias en supervivencia especifica de la enfermedad entre pacientes positivas para ganglios. El algoritmo identifica el 16% de pacientes positivas para ER clinicamente (tratadas con tamoxifeno adyuvante pero sin quimioterapia) quienes, a pesar de ser positivas para ganglios, se clasifican como de riesgo bajo, y estas mujeres tiene una tasa de supervivencia especifica de la enfermedad a 10 anos del 89%.
15 Como variable continua, ROR-C tiene una interaccion significativa con el porcentaje de ganglios linfaticos positivos, e interaccion significativa limite con el estadio ganglionar (tabla 17). El estadio ganglionar es un factor pronostico significativo entre pacientes con valores de ROR-C de moderados a altos (>23,5), pero entre pacientes con puntuaciones de ROR-C bajas, los desenlaces son buenos independientemente del estado de los ganglios (figura 7
20 y figura 8).
Tabla 17: Prueba de interaccion entre la puntuacion de ROR-C derivada de PAM50 y derivada del tamano del tumor, expresada como variable continua, y estado de los ganglios linfaticos axilares (A) expresado como % de ganglios positivos o (B) categorizado por el estadio ganglionar (en el que el grupo de referencia es negativo para ganglios, N
25 cat2 = 1-3 ganglios axilares implicados, y N cat3 = 4 o mas ganglios axilares implicados). El modelo en la tabla 17A usa la proporcion de ganglios positivos y la interaccion es significativa. El modelo en la tabla 17B usa un estado de los ganglios de 3 niveles (N-, 1-3 pos, >3 pos) y la interaccion esta en el limite.
Tabla 17A 30
Variable
Solo efectos principales Interaccion
Riesgo
valor de p Riesgo valor de p
ROR-C
1,75 1,60E-11 1,73 8,8E-11
% de ganglios pos.
1,56 2,50E-10 1,43 0,000017
Interaccion
1,17 0,043
Completo frente a reducido
0,04
Tabla 17B
Variable
Solo efectos principales Interaccion
Riesgo
valor de p Riesgo valor de p
ROR-C
1,77 6,20E-11 1,52 0,018
N cat2
1,8 9,40E-03 1,73 0,022
N cat3
3,88 1,20E-08 3,15 1,4E-05
ROR*N cat2
1,08 0,71
ROR*N cat3
1,62 0,061
Completo frente a reducido
0,11
Como ROR-C incluye informacion del tamano del tumor, para evaluar si el algoritmo de ROR da informacion de
5 pronostico adicional independiente mas alla de los parametros clinicos convencionales (incluyendo tamano del tumor) en esta poblacion de pacientes, se sometieron a prueba los modelos de Cox que incorporan ROR-S (tabla 18). Independientemente de si el criterio de valoracion es supervivencia libre de recidiva o especifica de la enfermedad, o si ROR-S esta incluido como variable continua o categorica, sigue siendo significativo, mientras que el grado y el estado de HER2 clinico no son significativos en analisis de multiples variables que incluyen la
10 informacion derivada de qPCR.
Tabla 18: Analisis de multiples variables de modelo de Cox que incorpora la puntuacion de ROR-S para supervivencia especifica de la enfermedad de cancer de mama entre mujeres con cancer de mama tratadas con tamoxifeno, positivas para ER y datos completos para todas las covariables. (A) categorias de riesgo definidas para
15 ROR-S, usando criterios de valoracion especificados previamente. (B) ROR-S como variable continua.
A.
Criterio de valoración clínico
Supervivencia libre de recidiva (N=613) Supervivencia especifica de la enfermedad (N=611)
razon de riesgo (IC del 95%)
valor de p razon de riesgo (IC del 95%) valor de p
edad (continuo)
0,995 (0,9801,01) 0,56 1,00 (0,9881,02) 0,56
grado (1 o 2) frente a 3
1,03 (0,7851,36) 0,81 1,00 (0,7381,36) 1,0
porcentaje de ganglios positivos
0 frente a (>0 a <25%)
1,79 (1,24-2,58) 0,0016 1,74 (1,16-2,63) 0,0081
0 frente a � 25%
2,87 (2,02-4,08) 4,4E-9 3,10 (2,10-4,57) 1,3E-8
tamaño del tumor : 2 cm frente a > 2 cm
1,70 (1,30-2,23) 1,2E-4 1,92 (1,42-2,61) 2,8E-5
HER2 (IHC) �0, 1 o 2 + FISH negativo� frente a �2 + FISH positivo o 3 +�
1,14 (0,7601,72) 0,52 1,10 (0,7011,74) 0,67
ROR-S (categorizado)
bajo frente a medio
2,00 (1,39-2,87) 1,9E-4 2,21 (1,45-3,36) 2,1E-4
bajo frente a alto
2,68 (1,63-4,41) 1,0E-4 3,25 (1,86-5,67) 3,4E-5
B.
Criterio de valoración clínico
Supervivencia libre de recidiva (N=613) Supervivencia especifica de la enfermedad (N=611)
razon de riesgo (IC del 95%)
valor de p razon de riesgo (IC del 95%) valor de p
edad (continuo)
0,997 (0,9821,01) 0,71 1,01 (0,9891,02) 0,48
grado (1 o 2) frente a 3
1,06 (0,8081,40) 0,66 1,02 (0,7491,38) 0,92
porcentaje de ganglios positivos
0 frente a (>0 a <25%)
1,77 (1,23-2,53) 0,0021 1,71 (1,13-2,58) 0,011
0 frente a � 25%
2,87 (2,02-4,06) 3,4E-9 3,12 (2,12-4,59) 8,5E-9
tamaño del tumor : 2 cm frente a > 2 cm
1,70 (1,30-2,23) 1,2E-4 1,92 (1,41-2,60) 3,0E-5
HER2 (IHC) �0, 1 o 2 + FISH negativo� frente a �2 + FISH positivo o 3 +�
1,05 (0,6991,59) 0,80 0,986 (0,6281,55) 0,95
ROR-S (continuo)
1,02 (1,01-1,03) 7,3E-5 1,02 (1,01-1,03) 1,0E-5
Los casos en esta seria se han evaluado previamente mediante inmunohistoquimica para ER, PR, HER2,
5 citoqueratina 5/6, receptor del factor de crecimiento epidermico y Ki67 [Cheang 2008][Cheang 2009], permitiendo que se asignara la obtencion de subtipos intrinsecos mediante una definicion inmunohistoquimica sustituta. Como todos los casos en esta serie son positivos para ER mediante inmunohistoquimica, todos se asignaron como o bien luminal A (si eran negativos para HER2 y de Ki67 bajo) o bien luminal B (si eran positivos para HER2 o de Ki67 alto). La disponibilidad de las asignaciones de la obtencion de subtipos de qPCR permite una comparacion con la
10 asignacion inmunohistoquimica en el mismo material, frente al desenlace de la paciente en esta cohorte tratada de manera homogenea. Un total de 606 casos tenian datos inmunohistoquimicos y de qPCR suficientemente completos para la asignacion a un subtipo luminal mediante ambos metodos. Entre estos, se asignaron 255 como luminal A y 193 como luminal B mediante ambos metodos, mientras que se asignaron 99 como luminal A mediante inmunotincion pero como luminal B mediante qPCR, y 59 como luminal B mediante inmunotincion pero como luminal
15 A mediante qPCR, para una concordancia del 74%, kappa = 0,48. Cuando los resultados eran discordantes, solo los casos asignados como luminal B mediante PCR tenian un desenlace significativamente peor que los asignados de manera concordante como luminal A. En los analisis de multiples variables entre estos casos, la asignacion tanto inmunohistoquimica como con PAM50 son factores pronostico independientemente significativos para determinar la supervivencia libre de recidiva, mientras que el grado y el estado de HER2 se salen del modelo (tabla 19). Para la
20 supervivencia especifica de la enfermedad, PAM50 es significativo mientras que la inmunohistoquimica esta en el limite. La magnitud del riesgo identificado es superior con la asignacion de qPCR para ambos criterios de valoracion. En un modelo de regresion de Cox por etapas que incorpora asignacion tanto inmunohistoquimica como de qPCR, solo qPCR permanece significativo.
25 Tabla 19: analisis de multiples variables del modelo de Cox para casos luminales, comparando la informacion de pronostico de la obtencion de subtipos intrinsecos mediante inmunohistoquimica frente a qPCR de PAM50.
A. Supervivencia libre de recidiva (N = 606) B. Supervivencia especifica de la enfermedad de cancer de mama (N = 605; excluye una muerte de causa indeterminada)
Criterio de valoración clínico
Subtipo inmunohistoquimico Subtipo de qPCR de PAM50
razon de riesgo (IC del 95%)
valor de p razon de riesgo (IC del 95%) valor de p
edad (continuo)
0,992 (0,98-1,01) 0,36 0,990 (0,971,01) 0,26
grado (1 o 2) frente a 3
1,18 (0,89-1,57) 0,24 1,12 (0,84-1,49) 0,43
porcentaje de ganglios positivos
0 frente a (>0 a <25%)
1,66 (1,11-2,48) 0,014 1,68 (1,12-2,50) 0,012
0 frente a � 25%
2,86 (1,95-4,19) 7,2E-8 2,93 (2,00-4,30) 3,8E-8
tamaño del tumor : 2 cm frente a > 2 cm
1,80 (1,34-2,42) 8,6E-5 1,81 (1,35-2,42) 7,4E-5
HER2 (IHC) �0, 1 o 2 + FISH negativo� frente a �2 + FISH positivo o 3 +�
1,21 (0,74-1,99) 0,45 1,30 (0,81-2,09) 0,27
Luminal B frente a luminal A
1,38 (1,02-1,86) 0,035 1,61 (1,20-2,16) 0,0014
Criterio de valoración clínico
Subtipo inmunohistoquimico Subtipo de qPCR de PAM50
razon de riesgo (IC del 95%)
valor de p razon de riesgo (IC del 95%) valor de p
edad (continuo)
1,00 (0,98-1,02) 0,67 1,00 (0,98-1,02) 0,89
grado (1 o 2) frente a 3
1,14 (0,83-1,55) 0,42 1,05 (0,77-1,44) 0,74
porcentaje de ganglios positivos
0 frente a (>0 a <25%)
1,44 (0,92-2,26) 0,106 1,50 (0,96-2,34) 0,077
0 frente a � 25%
2,79 (1,84-4,23) 1,2E-6 2,88 (1,90-4,38) 5,8E-7
tamaño del tumor : 2 cm frente a > 2 cm
2,07 (1,48-2,89) 1,8E-5 2,06 (1,48-2,87) 1,7E-5
HER2 (IHC) �0, 1 o 2 + FISH negativo� frente a �2 + FISH positivo o 3 +�
1,27 (0,75-2,55) 0,38 1,29 (0,78-2,13) 0,32
Luminal B frente a luminal A
1,38 (0,99-1,93) 0,060 1,89 (1,36-2,62) 1,5E-4
5 Resultados de las predicciones de Adjuvant�
Se realizo una comparacion del desenlace predicho por el modelo Adjuvant� con el desenlace predicho por el modelo de ROR en una cohorte de pacientes con cancer de mama. Esta cohorte consiste en 806 pacientes 10 diagnosticadas con cancer de mama invasivo, positivo para receptor de estrogeno, entre las fechas de 1986 y 1992. Todas las pacientes tenian cirugia primaria y terapia sistemica adyuvante con tamoxifeno solo; a ninguna de estas pacientes se les trato con quimioterapia. Se uso el modelo pronostico Adjuvant� Para calcular la probabilidad de supervivencia especifica a cancer de mama (BCSS) a 10 anos usando las caracteristicas clinicopatologicas convencionales de edad de la paciente, tamano del tumor, grado histologico, invasion linfovascular y numero de
15 ganglios linfaticos positivos. Todas las pacientes eran positivas para ER, y el riesgo de muerte por cancer de mama se ajusto para la terapia con tamoxifeno adyuvante.
De las 806 pacientes, 748 tenian suficientes datos clinicopatologicos para obtener una estimacion de Adjuvant� de BCSS. Las 58 pacientes restantes tenian o bien datos de tamano del tumor que faltaban o de ganglios linfaticos que
20 faltaban. La BCSS predicha por Adjuvant� media era del 73,7%. Esto corresponde con la BCSS observada del 73,2%. Entonces se dividio la cohorte en subgrupos basandose en la BCSS predicha por Adjuvant� a 10 anos (tabla 20).
Tabla 20
Categoria de riesgo
BCSS a 10 anos predicha por Adjuvant� N Numero de acontecimientos
1
90-100% 122 16
2
80-90% 164 32
3
70-80% 168 60
4
<70% 292 121
La BCSS observada a 10 anos, para cada uno de los grupos de riesgo de Adjuvant� era similar a la BCSS predicha
5 por Adjuvant� (tabla 21). Una excepcion notable es el grupo de riesgo mas bajo, en el subgrupo con una BCSS predicha por Adjuvant� del 90-100%, la BCSS observada a 10 anos es del 89%. Por consiguiente, parece que Adjuvant� sobreestima la supervivencia de este grupo de riesgo bajo. Esto concuerda con el estudio de validacion de Adjuvant� usando la base de datos BCOU (Olivotto et al. (2005)). En este estudio de validacion, se encontro que Adjuvant� subestimaba las muertes por cancer de mama en un 4,9% en el subgrupo con enfermedad T1N0. En el
10 subgrupo de pacientes con una BCSS predicha del 90-100%, 87 de 122 pacientes tenian cancer de mama T1N0.
Tabla 21
Grupo de riesgo de Adjuvant�
BCSS predicha por Adjuvant� media a 10 anos BCSS observada a 10 anos
90-100%
94% 89%
80-90%
85% 83%
70-80%
76% 75%
<70%
58% 61%
15 Entonces se uso ROR-S usando datos de qRT-PCR a partir de 50 genes para separar cada grupo de Adjuvant� en riesgo bajo frente a medio/alto (tabla 22). Debido al tamano relativamente pequeno de cada grupo, se combinaron los grupos de riesgo medio y alto para mejorar la potencia estadistica. Ademas, debido a que los subgrupos de riesgo de Adjuvant� ya estan definidos usando factores clinicos, se aplico ROR-S (en lugar de ROR-C).
20 Tabla 22
Grupo de riesgo de Adjuvant�
ROR-S bajo ROR-S medio o alto
90-100%
47 75
80-90%
56 108
70-80%
43 125
<70%
58 234
Entonces se realizo el analisis de Kaplan-Meier por separado en cada grupo de riesgo de Adjuvant�, y se sometieron a prueba las diferencias en la supervivencia entre los grupos de ROR-S de riesgo bajo frente a medio/alto usando la
25 prueba de rangos logaritmicos (tabla 23). Se observo que ROR-S podia aislar un subgrupo de riesgo bajo en cada uno de los grupos de riesgo de Adjuvant�. Se encontraron diferencias estadisticamente significativas en BCSS para pacientes de riesgo bajo frente a de riesgo medio/alto, en todos los subgrupos excepto para el grupo del 90-100%.
55 Tabla 23
Grupo de riesgo de Adjuvant�
BCSS observada BCSS para ROR-S de riesgo bajo BCSS para ROR-S de riesgo medio/alto Prueba de rangos logaritmicos de ROR-S
90-100%
89% 93% 85% p = 0,058
80-90%
83% 92% 78% p = 0,020
70-80%
75% 95% 68% p = 0,005
<70%
61% 71% 58% P = 0,009
En este grupo de riesgo bajo, ROR-S no es lo bastante estadisticamente significativo (p = 0,058). Sin embargo, este grupo proporciona algunas pruebas convincentes de que ROR-S anade informacion de pronostico adicional a Adjuvant�. Se muestra en la figura 9 un analisis de Kaplan-Meier del mismo grupo pero con BCSS predicha por Adjuvant� del 90-95% frente a del 95-100%.
En los grupos de riesgo intermedio, ROR-S funciona bien en la identificacion de pacientes de riesgo bajo frente a de riesgo superior. Tanto en el grupo del 80-90% (figura 10A) como en el grupo del 70-80% (figura 10B), el ROR-S identifica subgrupos con BCSS a 10 anos > 90%. Este es un resultado importante ya que ROR-S identifica tradicionalmente pacientes de riesgo alto a los que les va bien sin quimioterapia.
En el subgrupo de riesgo muy alto identificado por Adjuvant� (BCSS predicho <70%), ROR-S todavia puede identificar distintos grupos pronosticos (figura 10C).
Discusion
Estudios anteriores han establecido que los distintivos biologicos intrinsecos caracteristicos de los subtipos luminal A, luminal B, enriquecido en HER2 y de tipo basal estan presentes y tienen significacion pronostica en cohortes de cancer de mama de multiples instituciones diferentes, con perfiles obtenidos con diversas plataformas de micromatrices de expresion genica [Calza 2006][Kapp 2006][Hu 2006][Fan 2006]. Con el fin de identificar estos subtipos en muestras de patologia fijadas en formalina, incrustadas en parafina convencionales, se desarrollo una prueba de PCR con transcriptasa inversa cuantitativa [Mullins 2007] que identificaba estos subtipos basandose en un panel de 50 genes.
El analisis notificado en el presento documento consiste exclusivamente en pruebas basadas en qPCR, aplicadas a una serie de bloques de parafina relativamente antiguos (15-20 anos) con seguimiento largo y detallado, permitiendo el analisis no solo de la supervivencia libre de recidiva, sino tambien de la supervivencia especifica de la enfermedad de cancer de mama. El presente estudio consiste en mujeres con cancer de mama positivo para receptor de estrogeno que recibieron terapia hormonal (tamoxifeno) como su unico tratamiento adyuvante, un grupo de importancia clinica particular y relevancia contemporanea. Se determinaron de manera central el estado de receptor de estrogeno y el estado de HER2. El 70% de estas mujeres eran positivas para ganglios en la presentacion, y en la practica actual se les recomendaria habitualmente recibir quimioterapia adyuvante. La asignacion del subtipo PAM50 tal como se determino mediante PCR es altamente pronostica en estas mujeres. El subtipo sigue siendo significativo en analisis de multiples variables, mientras que el grado y el estado de HER2 clinico no. Los hallazgos usando el criterio de valoracion sustituto empleado comunmente de supervivencia libre de recidiva se mantienen todos para la supervivencia especifica de la enfermedad de cancer de mama.
Aunque las pacientes de esta cohorte se trataron hace mas de 20 anos, los hallazgos de este estudio siguen siendo relevantes para el tratamiento de pacientes con cancer de mama con un riesgo moderado de recidiva. Tales pacientes pueden obtener un beneficio significativo de terapia hormonal adyuvante pero la adicion adicional de quimioterapia puede tener efectos modestos (mejora del 2-5% en supervivencia libre de recidiva a 10 anos). Aunque la decision de continuar con la quimioterapia adyuvante es una decision individual tomada por la paciente y el oncologo de consulta, una mejora de la pronosticacion facilitara la toma de la decision terapeutica.
Se desarrollo una puntuacion de riesgo de recidiva y se valido en datos de micromatrices de pacientes negativas para ganglios que no revivieron terapia sistemica adyuvante (ejemplo 2), frente al criterio de valoracion de supervivencia libre de recidiva. Se muestra que este algoritmo predice la respuesta completa patologica en un conjunto de datos de ensayo clinico T/FAC neoadyuvante publicado de 133 pacientes y, en su formato de qPCR, predice la supervivencia libre de recidiva en una cohorte de 279 mujeres tratadas de manera homogenea con cancer de mama. Las puntuaciones de ROR generadas mediante qPCR a partir de muestras en bloques de parafina tambien son pronosticas en mujeres tratadas con tamoxifeno, positivas para estrogeno, en los subconjuntos tanto negativo para ganglios como positivo para ganglios. ROR-C identifica un grupo de pacientes de riesgo bajo entre las que incluso el estado de los ganglios no es un factor pronostico, y que por tanto pueden no requerir enfoques de tratamiento habitualmente reservados para pacientes positivas para ganglios que incluyen, por ejemplo, regimenes de quimioterapia de tercera generacion y radiacion de la pared del pecho.
Muy pocos casos (1,3%) se clasifican como de tipo normal usando el ensayo de PCR, en comparacion con el 12% cuando se aplica el clasificador PAM50 a datos de micromatrices de ADN de conjuntos grandes de canceres de mama primarios. Los analisis de micromatrices de ADN utilizan muestras tumorales homogeneizadas que, a pesar de la diseccion macroscopica para enriquecer el tumor, todavia pueden contener cantidades significativas de tejido de mama normal. Por el contrario, el ensayo de qPCR de PAM50 se realiza en un nucleo de tejido guiado por patologo, basandose en la identificacion microscopica directa de un area representativa de tumor puro en el bloque de fuente. Esta diferencia probablemente explica la frecuencia mucho mas baja de perfiles de tipo normal obtenidos usando el metodo de qPCR de PAM50 aplicado a bloques de parafina. La revision de la histologia, tal como se representa en nucleos de micromatrices de tejido extraidos del tejido inmediatamente adyacente, concuerda con la representacion tumoral inadecuada responsable de un perfil de tipo normal en ocho de los nueve casos de tipo normal.
Tal como se indico anteriormente basandose en la consulta de conjuntos de datos publicados con el clasificador PAM50, este ensayo identifica subtipos biologicos negativos para ER entre mujeres positivas para ER clinicamente incluso en entornos en los que el tumor es positivo mediante ensayos tanto de inmunohistoquimica como de union a ligando. Por lo menos el 10% de los casos se reasignan a subtipos no luminales, y estas mujeres tratadas con tamoxifeno tenian desenlaces malos, compatibles con una realidad biologica de independencia hormonal. Las mediciones clinicas del estado de ER y HER2, por si mismas, pueden estratificar pacientes con cancer de mama en subgrupos pronosticos y predictivos [Hayes 2007]. Sin embargo, basandose en mediciones de genes individuales (ER, PR) para asignar el pronostico y el tratamiento del cancer de mama se corre el riesgo de no solo los problemas de mediciones individuales de falsos positivos y negativos, sino tambien la posibilidad de que una biologia subyacente al tumor sea independiente de hormonas (a pesar de que un miembro de la ruta este expresandose a nivel proteico). A este respecto, la informacion proporcionada por la medicion simultanea de 50 genes, incluyendo otros en la ruta de respuesta a estrogenos junto con marcadores positivos de otros subtipos biologicos, es probable que sea un reflejo mas preciso de la biologia tumoral subyacente [Oh 2006].
Se han vinculado paneles sustitutos de inmunohistoquimica mas grandes a criterios de referencia de perfil de expresion y pueden proporcionar mas informacion que la simple medicion de ER, PR y HER2 [Cheang 2008b][Cheang 2009]. Se aplican facilmente paneles de anticuerpos limitados a bloques de parafina convencionales, y pueden anadir informacion de pronostico significativa mas alla de factores de riesgo clinicopatologicos convencionales [Ross 2008]. En este estudio, se realizo una comparacion directa de un panel de seis inmunotinciones establecidas (ER, PR, HER2, Ki67, citoqueratina 5/6 y receptor del factor de crecimiento epidermico) frente al ensayo de qPCR de 50 genes, usando los mismos bloques fuente. Cada metodo anade informacion de pronostico significativa mas alla de factores convencionales. Sin embargo, en este conjunto de pacientes positivas para ER clinicamente, hubo muchas asignaciones discrepantes a un subtipo biologico intrinseco, y el enfoque de qPCR era mejor en la prediccion del desenlace en estos casos.
En el analisis de multiples variables que incorpora los principales factores de riesgo clinicos, el grado ya no es significativo cuando se incluye el subtipo PAM50 o ROR. En comparacion con otros distintivos tales como la puntuacion de reaparicion y los indices de grado genomico [Paik 2004][Ivshina 2006][Sotiriou 2006], el PAM50 tambien tiene la ventaja de diferenciar casos de alto riesgo en subtipos luminal B, enriquecido en HER2 y de tipo basal, que es probable que respondan de manera diferente a las opciones de terapia sistemica (por ejemplo, hormonal, anti-HER2 y regimenes de quimioterapia con antraciclina frente a sin antraciclina). El ensayo tambien es mas facil de realizar, ya que no requiere tejido congelado [Glas 2006] ni microdiseccion manual de secciones de corte [Paik 2004] y puede aplicarse facilmente a bloques de parafina convencionales incluyendo tejidos de archivo tales como los de ensayos clinicos. Sin embargo, el ensayo puede realizarse en estos tipos de muestras si se desea. Debido a que el ensayo PAM50 se diseno para reflejar las caracteristicas principales de la biologia subyacente del cancer de mama, en lugar de optimizarse frente al desenlace en una poblacion particular, es particularmente probable que se extrapole bien en otras cohortes de pacientes, y siga siendo predictivo [Rouzier 2005]. En este estudio, se demostro por primera vez que el ensayo de qPCR de PAM50 tenia capacidad pronostica independiente y significativa entre mujeres positivas para receptor de estrogeno, tratadas con tamoxifeno, ya fuesen positivas para ganglios o negativas para ganglios. El ensayo identifica hasta un 10% de casos que se determino clinicamente que eran positivos para ER (mediante ensayo de inmunohistoquimica y de union a ligando) que se encuentran en grupos de riesgo alto negativos para ER, sustituye el grado y el estado de HER2 en modelos pronosticos de multiples variables y es superior a la obtencion de subtipos mediante inmunohistoquimica y clasificadores del riesgo clinico.
Bibliografia
Calza et al. (2006) Breast cancer Res. 8:R34.
Cheang et al. (2006) J Clin Oncol. Dec 20; 24(36):5637-44.
Cheang et al. (2008a) Annu Rev Pathol. 3:67-97.
Cheang MC et al. (2008b) Clin Cancer Res. 14(5):1368-76. Cheang MC et al. (2009) J Natl Cancer Inst. 101(10):736-50. Chia S et al. (2008) J Clin Oncol. 26(35):5697-704. Cox y Oakes (1984) Analysis of Survival Data. Chapman & Hall (Londres, Inglaterra). Cronin M et al. (2007) Clin Chem 53:1084-91. Fan et al. (2006) N. Engl. J. Med. 355:560-69. Glas et al. (2006) BMC Genomics 7:278. Grambsch y Therneau (1994) Biometrika 81(3):515-26. Hayes et al. (2007) N Engl J Med. 357(15):1496-506. Hu et al. (2006) BMC Genomics 7:96. Kapp et al. (2006) BMC Genomics 7:231. Loi et al. (2007) J Clin Oncol. 25(10):1239-46. Mullins et al. (2007) Clin Chem. 53(7):1273-9. Oh DS et al. (2006) J Clin Oncol. 24(11):1656-64. Olivotto et al. (2005) J Clin Oncol 23:2716-25. Paik (2004) N. Engl. J. Med. 351:2817-26. Parker et al. (2009) J Clin Oncol. 27(8):1160-1167. Ross et al. (2008) Clin Cancer Res. 14(20):6602-9. Rouzier R et al. (2005) Clin Cancer Res. 11(16):5678-85. Sorlie et al. (2003) Proc Natl Acad Sci USA. 100(14):8418-23. Sotiriou et al. (2006) J Natl Cancer Inst 98:262-272. Tibshirani et al. (2002) Proc Natl Acad Sci USA. 99(10):6567-72. Truong et al. (2005) Cancer 103(10):2006-14. van't Veer et al. (2005) J Clin Oncol. 23(8):1631-5. Todas las publicaciones y solicitudes de patente mencionadas en la memoria descriptiva son indicativas del nivel de
los expertos en la tecnica a la que esta invencion se refiere. Todas las publicaciones y solicitudes de patente se
incorporan en el presente documento como referencia en el mismo grado que si se indicara individualmente que
cada publicacion o solicitud de patente individual se incorpora como referencia.
Aunque la invencion anterior se ha descrito con algun detalle a modo de ilustracion y ejemplo para fines de claridad de comprension, sera obvio que pueden ponerse en practica determinados cambios y modificaciones dentro del alcance de las reivindicaciones adjuntas.
LISTA DE SECUENCIAS
<110> Charles M. Perou Philip Bernard Matthew Ellis Joel S. Parker James Stephen Marron Andrew Nobel Elaine Mardis Torsten O. Nielsen Maggie Cheang
<120> PERFILES DE EXPRESION G�NICA PARA PREDECIR DESENLACES EN C�NCER DE MAMA
<130> 35052/372870
<150> 61/057.508
<151> 2008-05-30
<160> 100
<170> FastSEQ para Windows version 4.0
<210> 1
<211> 19
<212> ADN
<213> Secuencia artificial
<220>
<223> Cebador oligonucleotidico
<400> 1 aaagattcct gggacctga 19
<210> 2
<211> 21
<212> ADN
<213> Secuencia artificial
<220>
<223> Cebador oligonucleotidico
<400> 2 acagccactt tcagaagcaa g 21
<210> 3
<211> 22
<212> ADN
<213> Secuencia artificial
<220>
<223> Cebador oligonucleotidico
<400> 3 ctggaagagt tgaataaaga 22
<210> 4
<211> 18
<212> ADN
<213> Secuencia artificial
<220>
<223> Cebador oligonucleotidico
<400> 4 tacctgaacc ggcacctg 18
<210> 5
<211> 20
<212> ADN
<213> Secuencia artificial
<220>
<223> Cebador oligonucleotidico
<400> 5 gcacaaagcc attctaagtc 20
<210> 6
<211> 17
<212> ADN
<213> Secuencia artificial
<220> <223> Cebador oligonucleotidico
<400> 6 gctggctgag cagaaag
17
<210> 7 <211> 19 <212> ADN <213> Secuencia artificial
<220> <223> Cebador oligonucleotidico
<400> 7 ctttcgcctg agcctattt
19
<210> 8 <211> 18 <212> ADN <213> Secuencia artificial
<220> <223> Cebador oligonucleotidico
<400> 8 ggccaaaatc gacaggac
18
<210> 9 <211> 19 <212> ADN <213> Secuencia artificial
<220> <223> Cebador oligonucleotidico
<400> 9 ctgtctgagt gccgtggat
19
<210> 10 <211> 20 <212> ADN <213> Secuencia artificial
<220> <223> Cebador oligonucleotidico
<400> 10 gtaaatcacc ttctgagcct
20
<210> 11 <211> 18 <212> ADN <213> Secuencia artificial
<220> <223> Cebador oligonucleotidico
<400> 11 ggaggcggaa gaaaccag
18
<210> 12 <211> 24 <212> ADN <213> Secuencia artificial
<220> <223> Cebador oligonucleotidico
<400> 12 gacaaggaga atcaaaagat cagc
24
<210> 13 <211> 17 <212> ADN <213> Secuencia artificial
<220> <223> Cebador oligonucleotidico
<400> 13 gtggcagcag atcacaa
17
<210> 14 <211> 20 <212> ADN <213> Secuencia artificial
<220> <223> Cebador oligonucleotidico
<400> 14 cctcacgaat tgctgaactt
20
<210> 15 <211> 23 <212> ADN <213> Secuencia artificial
<220> <223> Cebador oligonucleotidico
<400> 15 catgaaatag tgcatagttt gcc
23
<210> 16 <211> 25 <212> ADN <213> Secuencia artificial
<220> <223> Cebador oligonucleotidico
<400> 16 acacagaatc tatacccacc agagt
25
<210> 17 <211> 20 <212> ADN <213> Secuencia artificial
<220> <223> Cebador oligonucleotidico
<400> 17 gctggctctc acactgatag
20
<210> 18 <211> 18 <212> ADN <213> Secuencia artificial
<220> <223> Cebador oligonucleotidico
<400> 18 gcagggagag gagtttgt
18
<210> 19 <211> 23 <212> ADN <213> Secuencia artificial
<220> <223> Cebador oligonucleotidico
<400> 19 cccatccatg tgaggaagta taa
23
<210> 20 <211> 17 <212> ADN <213> Secuencia artificial
<220> <223> Cebador oligonucleotidico
<400> 20 cttcttggac cttggcg
17
<210> 21 <211> 17 <212> ADN <213> Secuencia artificial
<220> <223> Cebador oligonucleotidico
<400> 21 gctactacgc agacacg
17
<210> 22 <211> 19 <212> ADN <213> Secuencia artificial
<220> <223> Cebador oligonucleotidico
<400> 22 gatgttcgag tcacagagg
19
<210> 23 <211> 17 <212> ADN <213> Secuencia artificial
<220> <223> Cebador oligonucleotidico
<400> 23 ttcggctgga aggaacc
17
<210> 24 <211> 18 <212> ADN <213> Secuencia artificial
<220>
<223> Cebador oligonucleotidico
<400> 24 cgtggcagat gtgaacga
<210> 25
<211> 20
<212> ADN
<213> Secuencia artificial
<220>
<223> Cebador oligonucleotidico
<400> 25 ggagatccgt caactccaaa 20
<210> 26
<211> 18
<212> ADN
<213> Secuencia artificial
<220>
<223> Cebador oligonucleotidico
<400> 26 tgggtcgtgt caggaaac 18
<210> 27
<211> 20
<212> ADN
<213> Secuencia artificial
<220>
<223> Cebador oligonucleotidico
<400> 27 cgcagtcatc cagagatgtg 20
<210> 28
<211> 21
<212> ADN
<213> Secuencia artificial
<220>
<223> Cebador oligonucleotidico
<400> 28 actcagtaca agaaagaacc g 21
<210> 29
<211> 22
<212> ADN
<213> Secuencia artificial
<220>
<223> Cebador oligonucleotidico
<400> 29 gttggaccag tcaacatctc tg
<210> 30
<211> 18
<212> ADN
<213> Secuencia artificial
<220> <223> Cebador oligonucleotidico
<400> 30 tgtggctcat taggcaac
18
<210> 31 <211> 18 <212> ADN <213> Secuencia artificial
<220> <223> Cebador oligonucleotidico
<400> 31 gactccaagc gcgaaaac
18
<210> 32 <211> 24 <212> ADN <213> Secuencia artificial
<220> <223> Cebador oligonucleotidico
<400> 32 ccaacaaaat attcatggtt cttg
24
<210> 33 <211> 18 <212> ADN <213> Secuencia artificial
<220> <223> Cebador oligonucleotidico
<400> 33 ccagtagcat tgtccgag
18
<210> 34 <211> 19 <212> ADN <213> Secuencia artificial
<220> <223> Cebador oligonucleotidico
<400> 34 gtctctggta atgcacact
19
<210> 35 <211> 18 <212> ADN <213> Secuencia artificial
<220> <223> Cebador oligonucleotidico
<400> 35 gtggaatgcc tgctgacc
18
<210> 36 <211> 18 <212> ADN <213> Secuencia artificial
<220> <223> Cebador oligonucleotidico
<400> 36 aggggtgccc tctgagat
18
<210> 37 <211> 18 <212> ADN <213> Secuencia artificial
<220> <223> Cebador oligonucleotidico
<400> 37 cgagatcgcc aagatgtt
18
<210> 38 <211> 18 <212> ADN <213> Secuencia artificial
<220> <223> Cebador oligonucleotidico
<400> 38 aggcgaacac acaacgtc
18
<210> 39 <211> 19 <212> ADN <213> Secuencia artificial
<220> <223> Cebador oligonucleotidico
<400> 39 agcctcgaac aattgaaga
19
<210> 40 <211> 27 <212> ADN <213> Secuencia artificial
<220> <223> Cebador oligonucleotidico
<400> 40 atcgactgtg taaacaacta gagaaga
27
<210> 41 <211> 20 <212> ADN <213> Secuencia artificial
<220> <223> Cebador oligonucleotidico
<400> 41 tttaagaggg caatggaagg
20
<210> 42 <211> 18 <212> ADN <213> Secuencia artificial
<220> <223> Cebador oligonucleotidico
<400> 42 tgccgcagaa ctcacttg
18
<210> 43 <211> 20 <212> ADN <213> Secuencia artificial
<220> <223> Cebador oligonucleotidico
<400> 43 cctcagatga tgcctatcca
20
<210> 44 <211> 19 <212> ADN <213> Secuencia artificial
<220> <223> Cebador oligonucleotidico
<400> 44 cagcaagcga tggcatagt
19
<210> 45 <211> 17 <212> ADN <213> Secuencia artificial
<220> <223> Cebador oligonucleotidico
<400> 45 aatgccaccg aagcctc
17
<210> 46 <211> 23 <212> ADN <213> Secuencia artificial
<220> <223> Cebador oligonucleotidico
<400> 46 tcgaactgaa ggctatttac gag
23
<210> 47 <211> 18 <212> ADN <213> Secuencia artificial
<220> <223> Cebador oligonucleotidico
<400> 47 gtcgaagccg caattagg
18
<210> 48 <211> 20 <212> ADN <213> Secuencia artificial
<220> <223> Cebador oligonucleotidico
<400> 48 caaacgtgtg ttctggaagg
20
<210> 49 <211> 20 <212> ADN <213> Secuencia artificial
<220> <223> Cebador oligonucleotidico
<400> 49 tgccctgtat gatgtcagga
20
<210> 50 <211> 20 <212> ADN <213> Secuencia artificial
<220> <223> Cebador oligonucleotidico
<400> 50 gtgaggggtg tcagctcagt
20
<210> 51 <211> 22 <212> ADN <213> Secuencia artificial
<220> <223> Cebador oligonucleotidico
<400> 51 tggggcagtt ctgtattact tc
22
<210> 52 <211> 24 <212> ADN <213> Secuencia artificial
<220> <223> Cebador oligonucleotidico
<400> 52 cgatggtttt gtacaagatt tctc
24
<210> 53 <211> 17 <212> ADN <213> Secuencia artificial
<220> <223> Cebador oligonucleotidico
<400> 53 gcaaatcctt gggcaga
17
<210> 54 <211> 20 <212> ADN <213> Secuencia artificial
<220> <223> Cebador oligonucleotidico
<400> 54 gccgtacagt tccacaaagg
20
<210> 55 <211> 22 <212> ADN <213> Secuencia artificial
<220> <223> Cebador oligonucleotidico
<400> 55 gacgcttcct atcactctat tc
22
<210> 56 <211> 22 <212> ADN <213> Secuencia artificial
<220> <223> Cebador oligonucleotidico
<400> 56 ttcctccatc aagagttcaa ca
22
<210> 57 <211> 18 <212> ADN <213> Secuencia artificial
<220> <223> Cebador oligonucleotidico
<400> 57 gggcacatcc agatgttt
18
<210> 58 <211> 19 <212> ADN <213> Secuencia artificial
<220> <223> Cebador oligonucleotidico
<400> 58 gggtctgcac agactgcat
19
<210> 59 <211> 20 <212> ADN <213> Secuencia artificial
<220> <223> Cebador oligonucleotidico
<400> 59 tccttgtaat ggggagacca
20
<210> 60 <211> 23 <212> ADN <213> Secuencia artificial
<220> <223> Cebador oligonucleotidico
<400> 60 acttgggata tgtgaataag acc
23
<210> 61 <211> 20 <212> ADN <213> Secuencia artificial
<220> <223> Cebador oligonucleotidico
<400> 61 ggggaaagac aaagtttcca
20
<210> 62 <211> 20 <212> ADN <213> Secuencia artificial
<220> <223> Cebador oligonucleotidico
<400> 62 actgtctggg tccatggcta
20
<210> 63 <211> 18 <212> ADN <213> Secuencia artificial
<220> <223> Cebador oligonucleotidico
<400> 63 ggatttcgtg gtgggttc
18
<210> 64 <211> 20 <212> ADN <213> Secuencia artificial
<220> <223> Cebador oligonucleotidico
<400> 64 ccacagtctg tgataaacgg
20
<210> 65 <211> 24 <212> ADN <213> Secuencia artificial
<220> <223> Cebador oligonucleotidico
<400> 65 ccatcaacat tctctttatg aacg
24
<210> 66 <211> 20 <212> ADN <213> Secuencia artificial
<220> <223> Cebador oligonucleotidico
<400> 66 atcaactccc aaacggtcac
20
<210> 67 <211> 20 <212> ADN <213> Secuencia artificial
<220> <223> Cebador oligonucleotidico
<400> 67 gcccttacac atcggagaac
20
<210> 68 <211> 18 <212> ADN <213> Secuencia artificial
<220> <223> Cebador oligonucleotidico
<400> 68 gacttcaggg tgctggac
18
<210> 69 <211> 22 <212> ADN <213> Secuencia artificial
<220> <223> Cebador oligonucleotidico
<400> 69 tgtgaagcca gcaatatgta tc
22
<210> 70 <211> 21 <212> ADN <213> Secuencia artificial
<220> <223> Cebador oligonucleotidico
<400> 70 tattgggagg caggaggttt a
21
<210> 71 <211> 20 <212> ADN <213> Secuencia artificial
<220> <223> Cebador oligonucleotidico
<400> 71 ctgagttcat gttgctgacc
20
<210> 72 <211> 19 <212> ADN <213> Secuencia artificial
<220> <223> Cebador oligonucleotidico
<400> 72 gacagctact attcccgtt
19
<210> 73 <211> 21 <212> ADN <213> Secuencia artificial
<220> <223> Cebador oligonucleotidico
<400> 73 tatgtgagta agctcggaga c
21
<210> 74 <211> 17 <212> ADN <213> Secuencia artificial
<220> <223> Cebador oligonucleotidico
<400> 74 agtgggcatc ccgtaga
17
<210> 75 <211> 19 <212> ADN <213> Secuencia artificial
<220> <223> Cebador oligonucleotidico
<400> 75 agtggacatg cgagtggag
19
<210> 76 <211> 18 <212> ADN <213> Secuencia artificial
<220> <223> Cebador oligonucleotidico
<400> 76 caccgctgga aactgaac
18
<210> 77 <211> 19 <212> ADN <213> Secuencia artificial
<220> <223> Cebador oligonucleotidico
<400> 77 cgtgcacatc catgacctt
19
<210> 78 <211> 17 <212> ADN <213> Secuencia artificial
<220> <223> Cebador oligonucleotidico
<400> 78 gaggagatga ccttgcc
17
<210> 79 <211> 18 <212> ADN <213> Secuencia artificial
<220> <223> Cebador oligonucleotidico
<400> 79 gccatagcca ctgccact
18
<210> 80 <211> 17 <212> ADN <213> Secuencia artificial
<220> <223> Cebador oligonucleotidico
<400> 80 cttcgactgg actctgt
17
<210> 81 <211> 23 <212> ADN <213> Secuencia artificial
<220> <223> Cebador oligonucleotidico
<400> 81 cagacatgtt ggtattgcac att
23
<210> 82 <211> 20 <212> ADN <213> Secuencia artificial
<220> <223> Cebador oligonucleotidico
<400> 82 aggcgatcct gggaaattat
20
<210> 83 <211> 19 <212> ADN <213> Secuencia artificial
<220> <223> Cebador oligonucleotidico
<400> 83 cccatttgtc tgtcttcac
19
<210> 84 <211> 18 <212> ADN <213> Secuencia artificial
<220> <223> Cebador oligonucleotidico
<400> 84 ctgatggttg aggctgtt
18
<210> 85 <211> 19 <212> ADN <213> Secuencia artificial
<220> <223> Cebador oligonucleotidico
<400> 85 cgcactccag cacctagac
19
<210> 86 <211> 21 <212> ADN <213> Secuencia artificial
<220> <223> Cebador oligonucleotidico
<400> 86 tcacagggtc aaacttccag t
21
<210> 87 <211> 21 <212> ADN <213> Secuencia artificial
<220> <223> Cebador oligonucleotidico
<400> 87 gatggtagag ttccagtgat t
21
<210> 88 <211> 18 <212> ADN <213> Secuencia artificial
<220> <223> Cebador oligonucleotidico
<400> 88 tctggtcacg cagggcaa
18
<210> 89 <211> 20 <212> ADN <213> Secuencia artificial
<220> <223> Cebador oligonucleotidico
<400> 89 acacagatga tggagatgtc
20
<210> 90 <211> 25 <212> ADN <213> Secuencia artificial
<220> <223> Cebador oligonucleotidico
<400> 90 agtagctaca tctccaggtt ctctg
25
<210> 91 <211> 21 <212> ADN <213> Secuencia artificial
<220> <223> Cebador oligonucleotidico
<400> 91 cggattttat caacgatgca g
21
<210> 92 <211> 19 <212> ADN <213> Secuencia artificial
<220> <223> Cebador oligonucleotidico
<400> 92 catttgccgt ccttcatcg
19
<210> 93 <211> 20 <212> ADN <213> Secuencia artificial
<220> <223> Cebador oligonucleotidico
<400> 93 gcaggtcaaa actctcaaag
20
<210> 94 <211> 20 <212> ADN <213> Secuencia artificial
<220> <223> Cebador oligonucleotidico
<400> 94 agcgggcttc tgtaatctga
20
<210> 95 <211> 19 <212> ADN <213> Secuencia artificial
<220> <223> Cebador oligonucleotidico
<400> 95 gcctcagatt tcaactcgt
19
<210> 96 <211> 21 <212> ADN <213> Secuencia artificial
<220> <223> Cebador oligonucleotidico
<400> 96 ctgctgagaa tcaaagtggg a
21
<210> 97 <211> 19 <212> ADN <213> Secuencia artificial
<220> <223> Cebador oligonucleotidico
<400> 97 ggaacaaact gctctgcca
19
<210> 98 <211> 22 <212> ADN <213> Secuencia artificial
<220> <223> Cebador oligonucleotidico
<400> 98 acagctcttt agcatttgtg ga
22
<210> 99 <211> 23 <212> ADN <213> Secuencia artificial
<220> <223> Cebador oligonucleotidico
<400> 99 gggactatca atgttgggtt ctc
23
<210> 100 <211> 21 <212> ADN <213> Secuencia artificial
<220> <223> Cebador oligonucleotidico
<400> 100 cacacagttc actgctccac a
21

Claims (14)

  1. REIVINDICACIONES
    1. Metodo de clasificacion de un subtipo intrinseco de cancer de mama en una muestra de prueba que comprende:
    a) obtener un perfil de expresion genica para cada una de una pluralidad de muestras de cancer de mama de entrenamiento que se han clasificado segun el subtipo intrinseco de cancer de mama, en el que cada uno de los subtipos intrinsecos luminal A (LumA), luminal B (LumB), de tipo basal (basal), enriquecido en HER2 (HER2) y de tipo normal (normal) esta representado en la pluralidad de muestras de cancer de mama, y en el que el perfil de expresion genica se basa en la expresion de al menos 40 de los genes intrinsecos enumerados en la tabla 1;
    b) usar un algoritmo para construir perfiles de expresion genica o "centroides" para cada uno de los subtipos intrinsecos de cancer de mama en el conjunto de entrenamiento;
    c) obtener un perfil de expresion genica para dicha muestra de prueba, en el que el perfil de expresion genica se basa en la expresion de los mismos al menos 40 genes intrinsecos enumerados en la tabla 1 tal como se usan en la etapa a);
    d) comparar el perfil de expresion genica de la muestra de prueba con los centroides construidos en la etapa (b);
    e) calcular la distancia del perfil de expresion genica de la muestra de prueba a cada uno de los centroides; y,
    f) asignar la muestra de prueba a uno de los subtipos intrinsecos de cancer de mama basandose en el centroide mas cercano.
  2. 2.
    Metodo de prediccion de respuesta a la terapia neoadyuvante y/o adyuvante en un sujeto que tiene cancer de mama que comprende clasificar dicho sujeto segun el metodo segun la reivindicacion 1, en el que el subtipo de tumor intrinseco es indicativo de la respuesta a dicha terapia, prediciendo despues la respuesta.
  3. 3.
    Metodo segun la reivindicacion 2, en el que la terapia es terapia endocrina neoadyuvante, y el subtipo intrinseco se predice a partir de una muestra recogida de dicho sujeto tras el inicio de dicha terapia endocrina neoadyuvante.
  4. 4.
    Metodo segun la reivindicacion 3, en el que la muestra se recoge al menos un mes tras el inicio de dicha terapia endocrina neoadyuvante.
  5. 5.
    Metodo de prediccion de desenlace en un sujeto de prueba que tiene cancer de mama que comprende:
    a) obtener un perfil de expresion genica para cada una de una pluralidad de muestras de cancer de mama de entrenamiento que se han clasificado segun el subtipo intrinseco de cancer de mama, en el que cada uno de los subtipos intrinsecos luminal A (LumA), luminal B (LumB), de tipo basal (basal), enriquecido en HER2 (HER2) y de tipo normal (normal) esta representado en la pluralidad de muestras de cancer de mama, en el que se conoce el desenlace en dichas muestras, y en el que el perfil de expresion genica se basa en la expresion de al menos 40 de los genes intrinsecos enumerados en la tabla 1;
    b) usar un algoritmo para construir centroides para cada uno de los subtipos intrinsecos de cancer de mama en el conjunto de entrenamiento;
    c) calcular una puntuacion de riesgo para cada muestra de cancer de mama de entrenamiento ajustando un modelo a los perfiles de expresion genica obtenidos en la etapa (a), en el que el modelo representa la similitud de cada perfil de expresion genica con los centroides construidos en la etapa (b);
    d) estratificar las puntuaciones de riesgo obtenidas en la etapa (c) en multiples grupos de riesgo;
    e) obtener un perfil de expresion genica a partir de una muestra de cancer de mama de dicho sujeto de prueba, en el que el perfil de expresion genica se basa en la expresion de los mismos al menos 40 genes intrinsecos enumerados en la tabla 1 tal como se usan en la etapa a);
    f) comparar el perfil de expresion genica de la muestra de prueba con los centroides construidos en la etapa (b);
    g) calcular la distancia del perfil de expresion genica de la muestra de prueba a cada uno de los centroides;
    h) calcular una puntuacion de riesgo usando el modelo de la etapa (c) y la distancia a cada centroide obtenido en la etapa (f); y
    i) determinar en que grupo de riesgo se encuentra dicho sujeto de prueba comparando la puntuacion de riesgo obtenida en la etapa (h) con los grupos de riesgo asignados en la etapa (d), en el que la asignacion a un grupo de riesgo mas bajo indica un desenlace mas favorable, y la asignacion a un grupo de riesgo mas alto indica un desenlace menos favorable.
  6. 6. Metodo segun la reivindicacion 5, en el que
    (i)
    la puntuacion de riesgo se calcula usando una suma ponderada de variables independientes; o
    (ii)
    el desenlace es supervivencia especifica a cancer de mama, supervivencia libre de acontecimiento, o respuesta a la terapia; o
    (iii) el algoritmo se entrena usando los datos de expresion genica obtenidos en la reivindicacion 5; o
    (iv) dicho modelo correlaciona ademas el desenlace con una o mas variables clinicas.
  7. 7.
    Metodo segun la reivindicacion 6(iv), en el que dichas variables clinicas se seleccionan del grupo que consiste en tamano del tumor, estado de los ganglios, grado histologico, estado del receptor de la hormona estrogeno, estado del receptor de la hormona progesterona, niveles de HER-2 y ploidia tumoral.
  8. 8.
    Metodo segun la reivindicacion 6(ii), en el que el desenlace es respuesta a la terapia y se mide mediante uno o mas criterios de valoracion de terapia.
  9. 9.
    Metodo segun la reivindicacion 8, en el que dicho uno o mas criterios de valoracion de terapia se seleccionan de respuesta clinica (criterios RECIST), tamano del tumor patologico, valor de Ki67 dicotomizado o acontecimiento de recidiva.
  10. 10.
    Metodo segun la reivindicacion 1 o 5, en el que
    (i)
    dicho algoritmo es un algoritmo del centroide mas cercano; o
    (ii)
    el perfil de expresion genica para la muestra de prueba se obtiene usando reaccion en cadena de la polimerasa cuantitativa (qPCR) en tiempo real y transcripcion inversa con cebadores especificos para cada uno de dichos genes intrinsecos; o
    (iii) el perfil de expresion genica para la muestra de prueba se obtiene usando analisis de micromatriz con sondas especificas para un producto de expresion de cada uno de dichos genes intrinsecos; o
    (iv) los datos obtenidos a partir de los perfiles de expresion genica para las muestras de entrenamiento y el perfil de expresion genica para la muestra de prueba se procesan por medio de metodos de normalizacion antes del analisis.
  11. 11.
    Metodo segun la reivindicacion 1, en el que los centroides se construyen a partir de los datos de expresion genica depositados como numero de registro GSE10886 en el National Center for Biotechnology Information Gene Expression Omnibus.
  12. 12.
    Metodo segun la reivindicacion 10(iv), en el que dicho procesamiento comprende normalizacion para dar un conjunto de genes de mantenimiento.
  13. 13.
    Metodo segun la reivindicacion 12, en el que dichos genes de mantenimiento se seleccionan de MRPL19, PSMC4, SF3A1, PUMI, ACTB, TFRC, GUSB, RPLPO y/o GAPD.
  14. 14.
    Kit que consiste en reactivos suficientes para la medicion de los niveles de expresion de entre 40 y 50 de los genes intrinsecos enumerados en la tabla 1.
ES09770678.2T 2008-05-30 2009-06-01 Perfiles de expresión génica para predecir desenlaces en cáncer de mama Active ES2457534T3 (es)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US5750808P 2008-05-30 2008-05-30
US57508P 2008-05-30
PCT/US2009/045820 WO2009158143A1 (en) 2008-05-30 2009-06-01 Gene expression profiles to predict breast cancer outcomes

Publications (1)

Publication Number Publication Date
ES2457534T3 true ES2457534T3 (es) 2014-04-28

Family

ID=41202871

Family Applications (2)

Application Number Title Priority Date Filing Date
ES09770678.2T Active ES2457534T3 (es) 2008-05-30 2009-06-01 Perfiles de expresión génica para predecir desenlaces en cáncer de mama
ES13180605.1T Active ES2650610T3 (es) 2008-05-30 2009-06-01 Perfiles de expresión génica para predecir desenlaces en cáncer de mama

Family Applications After (1)

Application Number Title Priority Date Filing Date
ES13180605.1T Active ES2650610T3 (es) 2008-05-30 2009-06-01 Perfiles de expresión génica para predecir desenlaces en cáncer de mama

Country Status (13)

Country Link
US (7) US9631239B2 (es)
EP (2) EP2664679B1 (es)
JP (3) JP5740302B2 (es)
AU (1) AU2009262894B2 (es)
CA (1) CA2725760C (es)
CY (1) CY1114993T1 (es)
DK (1) DK2297359T3 (es)
ES (2) ES2457534T3 (es)
HR (1) HRP20140140T1 (es)
PL (1) PL2297359T4 (es)
PT (1) PT2297359E (es)
SI (1) SI2297359T1 (es)
WO (1) WO2009158143A1 (es)

Families Citing this family (65)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
AU2009262894B2 (en) * 2008-05-30 2014-01-30 British Columbia Cancer Agency Branch Gene expression profiles to predict breast cancer outcomes
ES2546089T3 (es) * 2009-01-23 2015-09-18 Bergen Teknologioverforing As Métodos para determinar un pronóstico de supervivencia para una paciente con cáncer de mama
US9771618B2 (en) 2009-08-19 2017-09-26 Bioarray Genetics, Inc. Methods for treating breast cancer
WO2011061568A1 (en) * 2009-11-22 2011-05-26 Azure Vault Ltd. Automatic chemical assay classification
PL2553118T3 (pl) 2010-03-31 2015-03-31 Sividon Diagnostics Gmbh Sposób przewidywania nawrotu raka sutka podczas leczenia endokrynologicznego
EP2671076A4 (en) * 2011-02-04 2016-11-16 Bioarray Genetics Inc METHODS OF USING GENE EXPRESSION SIGNATURES FOR SELECTING A TREATMENT METHOD, PREDICTING PROGNOSIS, SURVIVAL, AND / OR PREDICTING A RESPONSE TO TREATMENT
JP5971769B2 (ja) * 2011-03-15 2016-08-17 ザ ユニバーシティー オブ ノースカロライナ アット チャペル ヒル アントラサイクリン療法を用いて乳癌を処置する方法
HUE032391T2 (en) 2011-07-28 2017-09-28 Sividon Diagnostics Gmbh A method of predicting a response to chemotherapy in a patient suffering from, or at risk of, recurrent breast cancer
EA028452B1 (ru) 2011-07-29 2017-11-30 Медивейшн Простейт Терапьютикс, Инк. Лечение рака молочной железы
CA2857191A1 (en) * 2011-11-28 2013-06-06 National Research Council Of Canada Paclitaxel response markers for cancer
WO2013082440A2 (en) * 2011-11-30 2013-06-06 The University Of North Carolina At Chapel Hill Methods of treating breast cancer with taxane therapy
CN104704128A (zh) * 2012-05-22 2015-06-10 纳米线科技公司 预测乳腺癌结果的nano46基因和方法
US9939533B2 (en) 2012-05-30 2018-04-10 Lucerno Dynamics, Llc System and method for the detection of gamma radiation from a radioactive analyte
US9002438B2 (en) 2012-05-30 2015-04-07 Lucerno Dynamics System for the detection of gamma radiation from a radioactive analyte
WO2013188600A1 (en) 2012-06-12 2013-12-19 Washington University Copy number aberration driven endocrine response gene signature
CA2877378A1 (en) * 2012-06-29 2014-01-03 Nanostring Technologies, Inc. Methods of treating breast cancer with gemcitabine therapy
CN102719547B (zh) * 2012-07-02 2013-10-09 厦门大学 检测her2基因表达水平的实时荧光定量pcr试剂盒
US20150299797A1 (en) * 2012-08-24 2015-10-22 University Of Utah Research Foundation Compositions and methods relating to blood-based biomarkers of breast cancer
WO2014071218A2 (en) * 2012-11-02 2014-05-08 University Of Utah Research Foundation Biomarkers for breast cancer and methods of using same
WO2014075067A1 (en) * 2012-11-12 2014-05-15 Nanostring Technologies, Inc. Methods to predict breast cancer outcome
WO2014118333A1 (en) 2013-02-01 2014-08-07 Sividon Diagnostics Gmbh Method for predicting the benefit from inclusion of taxane in a chemotherapy regimen in patients with breast cancer
JP2016519935A (ja) * 2013-05-13 2016-07-11 ナノストリング テクノロジーズ,インコーポレイティド 結節陽性の初期乳癌における再発リスクを予測する方法
EP3415639B8 (en) * 2013-08-19 2023-07-12 Shuwen Biotech Co., Ltd. Methods and kits for the molecular subtyping of tumors
SG11201601060RA (en) 2013-08-19 2016-03-30 Biontech Diagnostics Gmbh Methods and kits for the molecular subtyping of tumors
EP3036712A4 (en) * 2013-08-20 2017-04-19 The Ohio State Innovation Foundation Methods for predicting prognosis
US20150072021A1 (en) * 2013-09-09 2015-03-12 British Columbia Cancer Agency Branch Methods and Kits for Predicting Outcome and Methods and Kits for Treating Breast Cancer with Radiation Therapy
KR101560880B1 (ko) 2013-10-15 2015-10-19 이화여자대학교 산학협력단 유방암의 예후 판단을 위한 정보를 제공하는 방법
US10628748B2 (en) 2013-12-03 2020-04-21 University Of Massachusetts System and methods for predicting probable relationships between items
CA2934626C (en) * 2014-02-18 2023-08-01 Dignity Health Lkb1 related diagnostics and treatments of cancer
CN106661624B (zh) * 2014-05-17 2021-04-06 加利福尼亚大学董事会 用于癌症诊断、预后和治疗选择的着丝粒/动粒蛋白基因
EP3221469B1 (en) 2014-11-21 2020-01-15 Nanostring Technologies, Inc Enzyme- and amplification-free sequencing
AU2015353747B2 (en) 2014-11-24 2021-02-25 Nanostring Technologies, Inc. Methods and apparatuses for gene purification and imaging
CA2969163A1 (en) * 2014-12-09 2016-06-16 King's College London Breast cancer treatment with taxane therapy
EP3230471B1 (en) 2014-12-12 2019-08-28 Medivation Prostate Therapeutics LLC Method for predicting response to breast cancer therapeutic agents and method of treatment of breast cancer
WO2016137113A1 (ko) * 2015-02-27 2016-09-01 연세대학교 산학협력단 유방암의 예후 및 항암화학요법 사용 여부 판단 장치 및 방법
CA2996426A1 (en) * 2015-10-05 2017-04-13 Cedars-Sinai Medical Center Method of classifying and diagnosing cancer
AU2016368696B2 (en) * 2015-12-07 2021-11-25 Ontario Institute For Cancer Research (Oicr) Gene signature of residual risk following endocrine treatment in early breast cancer
US11459617B2 (en) 2016-04-29 2022-10-04 Board Of Regents, The University Of Texas System Targeted measure of transcriptional activity related to hormone receptors
EP4324929A1 (en) 2016-05-16 2024-02-21 Nanostring Technologies, Inc. Methods for detecting target nucleic acids in a sample
US10934590B2 (en) 2016-05-24 2021-03-02 Wisconsin Alumni Research Foundation Biomarkers for breast cancer and methods of use thereof
WO2018039490A1 (en) 2016-08-24 2018-03-01 Genomedx Biosciences, Inc. Use of genomic signatures to predict responsiveness of patients with prostate cancer to post-operative radiation therapy
WO2018074865A2 (ko) * 2016-10-21 2018-04-26 서울대학교병원 유방암 예후 예측용 조성물 및 방법
CN110225980B (zh) 2016-11-21 2023-01-06 纳米线科技公司 化学组合物及其使用方法
ES2674327B2 (es) * 2016-11-28 2018-12-17 Geicam - Grupo Español De Investigacion En Cancer De Mama CES: un índice quimioendocrino basado en PAM50 para el cáncer de mama con receptores hormonales positivos con un riesgo intermedio de recidiva
KR101874716B1 (ko) * 2016-12-14 2018-07-04 연세대학교 산학협력단 유방암 분자아형 분류방법 및 이를 이용한 유방암 분자아형 분류 디바이스
WO2018160925A1 (en) * 2017-03-02 2018-09-07 President And Fellows Of Harvard College Methods and systems for predicting treatment responses in subjects
CA3055925A1 (en) * 2017-03-09 2018-09-13 Decipher Biosciences, Inc. Subtyping prostate cancer to predict response to hormone therapy
KR20200010576A (ko) * 2017-06-16 2020-01-30 난토믹스, 엘엘씨 Praegnant 전이성 유방암 코호트에서의 불량한 결과의 예후 지표 (prognostic indicators of poor outcomes in praegnant metastatic breast cancer cohort)
EP3679160A4 (en) 2017-09-08 2021-05-19 Myriad Genetics, Inc. METHOD OF USING BIOMARKERS AND CLINICAL VARIABLES TO PREDICT THE INTEREST OF CHEMOTHERAPY
IT201700109459A1 (it) * 2017-09-29 2019-03-29 Univ Degli Studi Di Perugia Metodo per effettuare prognosi del cancro della mammella, kit ed uso di questi
CN111316366A (zh) * 2017-11-08 2020-06-19 皇家飞利浦有限公司 用于同时多变量特征选择、特征生成和样本聚类的方法
WO2019165366A1 (en) * 2018-02-23 2019-08-29 Beth Israel Deaconess Medical Center Drug efficacy evaluations
CA3099909A1 (en) 2018-05-14 2019-11-21 Nanostring Technologies, Inc. Chemical compositions and methods of using same
KR101966589B1 (ko) * 2018-06-20 2019-04-05 연세대학교 산학협력단 유방암 분자아형 분류방법 및 이를 이용한 유방암 분자아형 분류 디바이스
AU2019370860A1 (en) * 2018-11-04 2021-06-24 Pfs Genomics, Inc. Methods and genomic classifiers for prognosis of breast cancer and predicting benefit from adjuvant radiotherapy
CN109801680B (zh) * 2018-12-03 2023-02-28 广州中医药大学(广州中医药研究院) 基于tcga数据库的肿瘤转移复发预测方法及系统
WO2020178399A1 (en) 2019-03-05 2020-09-10 Norwegian University Of Science And Technology (Ntnu) Breast cancer signature genes
CN109913551A (zh) * 2019-03-26 2019-06-21 深圳大学 乳腺癌分型的核酸组合物、乳腺癌分型试剂盒及其使用方法
CN111508555A (zh) * 2020-04-15 2020-08-07 淮南师范学院 一组用于度量生物分子集的网络拓扑学特性的方法
CN112626218A (zh) * 2021-01-07 2021-04-09 浙江科技学院 一种用于预测胰腺癌转移风险的基因表达分类器、体外诊断试剂盒
CN112735529A (zh) * 2021-01-18 2021-04-30 中国医学科学院肿瘤医院 乳腺癌预后模型的构建方法及应用方法、电子设备
RU2762317C1 (ru) * 2021-02-24 2021-12-17 Федеральное государственное бюджетное научное учреждение "Томский национальный исследовательский медицинский центр Российской академии наук" (Томский НИМЦ) Способ прогнозирования статуса рецептора эпидермального фактора роста her2/neu в основном опухолевом узле у больных раком молочной железы
JP2024511166A (ja) * 2021-03-25 2024-03-12 オンクセルナ セラピューティクス,インコーポレイテッド 癌の標的療法
WO2023250397A1 (en) * 2022-06-21 2023-12-28 Bioventures, Llc Methods for the molecular subtyping of tumors from archival tissue
CN115144599B (zh) * 2022-09-05 2023-01-06 西湖大学 蛋白组合在制备对儿童甲状腺癌进行预后分层的试剂盒中的用途及其试剂盒、系统

Family Cites Families (40)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4683202A (en) 1985-03-28 1987-07-28 Cetus Corporation Process for amplifying nucleic acid sequences
US4843155A (en) 1987-11-19 1989-06-27 Piotr Chomczynski Product and process for isolating RNA
US6040138A (en) 1995-09-15 2000-03-21 Affymetrix, Inc. Expression monitoring by hybridization to high density oligonucleotide arrays
US5800992A (en) 1989-06-07 1998-09-01 Fodor; Stephen P.A. Method of detecting nucleic acids
US20040235039A1 (en) 1990-03-20 2004-11-25 Regents Of The University Of California Chromosome-specific staining to detect genetic rearrangements
ATE148889T1 (de) 1991-09-18 1997-02-15 Affymax Tech Nv Verfahren zur synthese der verschiedenen sammlungen von oligomeren
US6025126A (en) 1991-10-28 2000-02-15 Arch Development Corporation Methods and compositions for the detection of chromosomal aberrations
EP0916396B1 (en) 1991-11-22 2005-04-13 Affymetrix, Inc. (a Delaware Corporation) Combinatorial strategies for polymer synthesis
US5384261A (en) 1991-11-22 1995-01-24 Affymax Technologies N.V. Very large scale immobilized polymer synthesis using mechanically directed flow paths
US5856174A (en) 1995-06-29 1999-01-05 Affymetrix, Inc. Integrated nucleic acid diagnostic device
US5854033A (en) 1995-11-21 1998-12-29 Yale University Rolling circle replication reporter systems
EP0880598A4 (en) 1996-01-23 2005-02-23 Affymetrix Inc RAPID EVALUATION OF NUCLEIC ACID ABUNDANCE DIFFERENCE, WITH A HIGH-DENSITY OLIGONUCLEOTIDE SYSTEM
DE69829402T2 (de) 1997-10-31 2006-04-13 Affymetrix, Inc. (a Delaware Corp.), Santa Clara Expressionsprofile in adulten und fötalen organen
US6020135A (en) 1998-03-27 2000-02-01 Affymetrix, Inc. P53-regulated genes
EP1631689A2 (en) 2003-05-28 2006-03-08 Genomic Health, Inc. Gene expression markers for predicting response to chemotherapy
ES2550614T3 (es) 2004-04-09 2015-11-11 Genomic Health, Inc. Marcadores de expresión génica para predecir la respuesta a la quimioterapia
WO2006010150A2 (en) 2004-07-15 2006-01-26 University Of Utah Research Foundation Housekeeping genes and methods for identifying the same
JP2006141210A (ja) 2004-11-16 2006-06-08 Hitachi Ltd キメラ遺伝子の検出方法
US20090299640A1 (en) 2005-11-23 2009-12-03 University Of Utah Research Foundation Methods and Compositions Involving Intrinsic Genes
US8986926B2 (en) 2005-12-23 2015-03-24 Nanostring Technologies, Inc. Compositions comprising oriented, immobilized macromolecules and methods for their preparation
ATE525482T1 (de) 2005-12-23 2011-10-15 Nanostring Technologies Inc Nanoreporter und verfahren zu deren herstellung und verwendung
WO2007084992A2 (en) 2006-01-19 2007-07-26 The University Of Chicago Prognosis and therapy predictive markers and methods of use
WO2008006517A2 (en) 2006-07-13 2008-01-17 Siemens Healthcare Diagnostics Gmbh Prediction of breast cancer response to taxane-based chemotherapy
US8415102B2 (en) 2007-04-10 2013-04-09 Nanostring Technologies, Inc. Methods and computer systems for identifying target-specific sequences for use in nanoreporters
US20090105167A1 (en) 2007-10-19 2009-04-23 Duke University Predicting responsiveness to cancer therapeutics
AU2009262894B2 (en) 2008-05-30 2014-01-30 British Columbia Cancer Agency Branch Gene expression profiles to predict breast cancer outcomes
ES2684317T3 (es) 2008-08-14 2018-10-02 Nanostring Technologies, Inc Nanoinformadores estables
EP3216874A1 (en) 2008-09-05 2017-09-13 TOMA Biosciences, Inc. Methods for stratifying and annotating cancer drug treatment options
WO2010039275A1 (en) 2008-10-03 2010-04-08 Oligonix, Inc. Method, array and system for detecting intergenic fusions
WO2010061269A2 (en) 2008-11-02 2010-06-03 Optimata Ltd. Improving cancer therapy by docetaxel and granulocyte colony-stimulating factor (g-csf)
CA2807557C (en) 2009-08-06 2019-09-17 Partha S. Ray Diagnosis of primary and metastatic basal-like breast cancer and other cancer types
EP2507396A4 (en) 2009-12-01 2013-06-19 Precision Therapeutics Inc MULTI-MEDICATION RESPONSE MARKERS FOR BREAST CANCER CELLS
WO2011130495A1 (en) 2010-04-14 2011-10-20 Nuvera Biosciences, Inc. Methods of evaluating response to cancer therapy
JP5971769B2 (ja) 2011-03-15 2016-08-17 ザ ユニバーシティー オブ ノースカロライナ アット チャペル ヒル アントラサイクリン療法を用いて乳癌を処置する方法
WO2012135340A2 (en) 2011-03-28 2012-10-04 Nanostring Technologies, Inc. Compositions and methods for diagnosing cancer
WO2013082440A2 (en) 2011-11-30 2013-06-06 The University Of North Carolina At Chapel Hill Methods of treating breast cancer with taxane therapy
CN104704128A (zh) 2012-05-22 2015-06-10 纳米线科技公司 预测乳腺癌结果的nano46基因和方法
CA2877378A1 (en) 2012-06-29 2014-01-03 Nanostring Technologies, Inc. Methods of treating breast cancer with gemcitabine therapy
WO2014075067A1 (en) 2012-11-12 2014-05-15 Nanostring Technologies, Inc. Methods to predict breast cancer outcome
US20150072021A1 (en) 2013-09-09 2015-03-12 British Columbia Cancer Agency Branch Methods and Kits for Predicting Outcome and Methods and Kits for Treating Breast Cancer with Radiation Therapy

Also Published As

Publication number Publication date
CA2725760A1 (en) 2009-12-30
DK2297359T3 (en) 2014-02-24
SI2297359T1 (sl) 2014-05-30
WO2009158143A1 (en) 2009-12-30
US9631239B2 (en) 2017-04-25
US20110145176A1 (en) 2011-06-16
US20190264290A1 (en) 2019-08-29
EP2664679A1 (en) 2013-11-20
PL2297359T3 (pl) 2014-07-31
JP2015119716A (ja) 2015-07-02
ES2650610T3 (es) 2018-01-19
CA2725760C (en) 2019-07-02
CY1114993T1 (el) 2016-12-14
PL2297359T4 (pl) 2014-07-31
AU2009262894B2 (en) 2014-01-30
PT2297359E (pt) 2014-03-19
EP2297359A1 (en) 2011-03-23
US20200040407A1 (en) 2020-02-06
US20160168645A1 (en) 2016-06-16
JP5740302B2 (ja) 2015-06-24
HRP20140140T1 (en) 2014-05-23
US20160153051A1 (en) 2016-06-02
US20230250484A1 (en) 2023-08-10
EP2297359B1 (en) 2013-11-13
JP2011524162A (ja) 2011-09-01
JP2017127330A (ja) 2017-07-27
EP2664679B1 (en) 2017-11-08
US20220213563A1 (en) 2022-07-07
AU2009262894A1 (en) 2009-12-30
JP6140202B2 (ja) 2017-05-31

Similar Documents

Publication Publication Date Title
ES2457534T3 (es) Perfiles de expresión génica para predecir desenlaces en cáncer de mama
US20230272476A1 (en) Nano46 genes and methods to predict breast cancer outcome
US20140037620A1 (en) Methods of Treating Breast Cancer with Gemcitabine Therapy
US20150252440A1 (en) Methods of Treating Breast Cancer with Anthracycline Therapy
US20150072021A1 (en) Methods and Kits for Predicting Outcome and Methods and Kits for Treating Breast Cancer with Radiation Therapy
US20130345161A1 (en) Methods of Treating Breast Cancer With Taxane Therapy
CN106834462A (zh) 一组胃癌基因的应用
US20140154681A1 (en) Methods to Predict Breast Cancer Outcome
US20160115551A1 (en) Methods to predict risk of recurrence in node-positive early breast cancer
US20160160293A1 (en) Breast cancer treatment with taxane therapy
AU2014202370B2 (en) Gene Expression Profiles to Predict Breast Cancer Outcomes
AU2016228291A1 (en) Gene Expression Profiles to Predict Breast Cancer Outcomes
WO2010067722A1 (ja) 乳癌の悪性度の評価方法および評価用キット