ES2399246T3 - Predicción del resultado del tratamiento del cáncer de mama - Google Patents

Predicción del resultado del tratamiento del cáncer de mama Download PDF

Info

Publication number
ES2399246T3
ES2399246T3 ES04788855T ES04788855T ES2399246T3 ES 2399246 T3 ES2399246 T3 ES 2399246T3 ES 04788855 T ES04788855 T ES 04788855T ES 04788855 T ES04788855 T ES 04788855T ES 2399246 T3 ES2399246 T3 ES 2399246T3
Authority
ES
Spain
Prior art keywords
expression
breast cancer
sequences
il17br
cells
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
ES04788855T
Other languages
English (en)
Inventor
Xiao-Jun Ma
Mark G. Erlander
Dennis C. Sgroi
Edward Enright
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Biotheranostics Inc
Original Assignee
Arcturus Bioscience Inc
Biotheranostics Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Priority claimed from US10/727,100 external-priority patent/US7504214B2/en
Priority claimed from US10/773,761 external-priority patent/US9856533B2/en
Application filed by Arcturus Bioscience Inc, Biotheranostics Inc filed Critical Arcturus Bioscience Inc
Priority claimed from PCT/US2004/030789 external-priority patent/WO2005028681A1/en
Application granted granted Critical
Publication of ES2399246T3 publication Critical patent/ES2399246T3/es
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)

Abstract

Un método para determinar el riesgo de recurrencia de cáncer en un sujeto que padece cáncer de mama ER+ en caso de tratamiento con tamoxifeno, comprendiendo dicho método ensayar una muestra de células de cáncer de mama ER+, procedente de dicho sujeto, para la expresión de los ARNm de HOXB13 e IL17BR humanos para determinar una proporción de los niveles de expresión de HOXB13 e IL17BR, en el que dicha proporción indica la ausencia de recurrencia de cáncer en dicho sujeto en caso de tratamiento con tamoxifeno.

Description

Predicción del resultado del tratamiento del cáncer de mama
Campo de la invención
La invención se refiere a la identificación y uso de perfiles de expresión génica, o patrones, con importancia clínica para el tratamiento de cáncer de mama usando tamoxifeno (novaldex) y otros agentes “antiestrógeno” contra cáncer de mama, incluyendo otros “moduladores selectivos de los receptores de estrógenos” (“SERM”), “reguladores negativos selectivos de los receptores de estrógenos” (“SERD”) e inhibidores de aromatasa (“Al”). En particular, la invención proporciona las identidades de secuencias génicas cuya expresión se correlaciona con la supervivencia de los pacientes y la protección de cáncer de mama en mujeres tratadas con tamoxifeno u otros agentes “antiestrógeno” contra cáncer de mama. Los perfiles de expresión génica, plasmados en expresión de ácido nucleico, expresión proteica u otros formatos de la expresión, pueden usarse para seleccionar sujetos aquejados de cáncer de mama que probablemente respondan de forma positiva al tratamiento con tamoxifeno u otro agente “antiestrógeno” contra cáncer de mama, así como los que probablemente no sean sensibles y por lo tanto candidatos para otros tratamientos. La invención también proporciona las identidades de conjuntos de secuencias de múltiples genes con patrones de expresión que son fuertemente predictivos de la sensibilidad a tamoxifeno y otros agentes “antiestrógeno” contra cáncer de mama.
Antecedentes de la invención
El cáncer de mama es con diferencia el cáncer más común entre mujeres. Cada año, se diagnostica cáncer de mama a más de 180.000 y 1 millón de mujeres en los Estados Unidos y en todo el mundo, respectivamente. El cáncer de mama es la causa principal de muerte para mujeres entre 50-55 años de edad, y es el tumor maligno no prevenible más habitual en mujeres en el Hemisferio Occidental. Actualmente viven con la enfermedad aproximadamente 2.167.000 mujeres en los Estados Unidos (Instituto del Cáncer Nacional, Programa de Vigilancia, Epidemiología y Resultados Sinales (NCI SEER), Cancer Statistics Review (CSR), wwwseer.ims.nci.nih.gov/Publications/CSR1973 (1998)). Basándose en tasas de cáncer de 1995 a 1997, un informe del Instituto Nacional del Cáncer (NCI) estima que aproximadamente 1 de cada 8 mujeres en los Estados Unidos (aproximadamente 12,8 por ciento) desarrollarán cáncer de mama durante su vida (Programa de Vigilancia, Epidemiología y Resultados Finales del NCT (SEER) publicación SEER Cancer Statistics Review 1973-1997). El cáncer de mama es la segunda forma más común de cáncer, después de cáncer de piel, entre mujeres en los Estados Unidos. Se espera que se diagnostique una estimación de 250.100 nuevos casos de cáncer de mama en los Estados Unidos en 2001. De éstos, se espera que se produzcan 192.200 nuevos casos de cáncer de mama más avanzado (invasivo) entre mujeres (un aumento del 5% respecto al año pasado), se espera que se produzcan
46.400 nuevos casos de cáncer de mama de estadio temprano (in situ) entre mujeres (aumento del 9% respecto al año pasado), y se espera que se diagnostiquen aproximadamente 1.500 nuevos casos de cáncer de mama en hombres (Cancer Facts & Figures 2001 American Cancer Society). Se espera una estimación de 40.600 muertes
(40.300 mujeres, 400 hombres) de cáncer mama en 2001. El cáncer de mama se clasifica en segunda posición solamente superado por el cáncer de pulmón entre las causas de muertes por cáncer en mujeres. Aproximadamente el 86% de mujeres a las que se les diagnostica cáncer de mama probablemente estén vivas cinco años después, aunque el 24% morirán de cáncer de mama después de 10 años y casi la mitad (47%) morirá de cáncer de mama después de 20 años.
Todas las mujeres están en riesgo de padecer cáncer de mama. Más del 70% de los cánceres de mama se producen en mujeres que no tienen factores de riesgo identificables aparte de la edad (U.S. General Accounting Office. Breast Cancer, 1971-1991: Prevention, Treatment and Research. GAO/PEMD-92-12; 1991). Solamente del 5 al 10% de los cánceres de mama están ligados a un historial familiar de cáncer de mama (Henderson IC, Breast Cancer. In: Murphy GP, Lawrence WL, Lenhard RE (eds). Clinical Oncology. Atlanta, GA: American Cancer Society; 1995:198-219).
Cada mama tiene de 15 a 20 secciones llamadas lóbulos. Dentro de cada lóbulo hay muchos lobulillos más pequeños. Los lobulillos terminan en docenas de bulbos minúsculos que pueden producir leche. Los lóbulos, lobulillos y bulbos están todos ligados por tubos estrechos llamados conductos. Estos conductos conducen al pezón en el centro de un área oscura de piel llamada la aureola. Los lóbulos y los conductos están rodeados de grasa. No hay músculos en la mama, pero hay músculos debajo de cada mama y cubren las costillas. Cada mama contiene también vasos sanguíneos y vasos linfáticos. Los vasos linfáticos portan un fluido incoloro llamado linfa, y conducen a los ganglios linfáticos. Los grupos de ganglios linfáticos se encuentran cerca de la mama en la axila (bajo el brazo), por encima de la clavícula, y en el pecho.
Los tumores de mama pueden ser benignos o malignos. Los tumores benignos no son cancerosos, no se expanden a otras partes del cuerpo y no son una amenaza para la vida. Habitualmente pueden retirarse y en la mayoría de los casos no regresan. Los tumores malignos son cancerosos y pueden invadir y dañar tejidos y órganos cercanos. Las células tumorales malignas pueden metastatizar, entrar en el torrente sanguíneo o en el sistema linfático. Cuando las células de cáncer de mama metastatizan fuera de la mama, con frecuencia se encuentran en los ganglios linfáticos bajo el brazo (ganglios linfáticos axilares). Si el cáncer ha alcanzado estos ganglios, significa que las células cancerosas pueden haberse propagado a otros ganglios linfáticos u otros órganos, tales como huesos, hígado o pulmones.
Se ha centrado una investigación intensiva e importante en la detección temprana, tratamiento y prevención. Esto ha incluido un énfasis en la determinación de la presencia de células epiteliales ductales cancerosas o precancerosas. Estas células se analizan, por ejemplo, con respecto a morfología celular, con respeto a marcadores proteicos, con respecto a marcadores de ácido nucleico, con respecto a anomalías cromosómicas, con respecto a marcadores bioquímicos y con respecto a otros cambios característicos que señalizarían la presencia de células cancerosas o precancerosas. Esto ha conducido a diversas alteraciones moleculares que se han indicado en cáncer de mama, pocas de las cuales se han caracterizado bien en muestras de ensayo de mama clínicas humanas. Las alteraciones moleculares incluyen presencia/ausencia de receptores esteroides de progesterona y estrógeno, expresión/amplificación de HER-2 (Mark HF, et al. HER-2/neu gene amplification in stages l-IV breast cancer detected by fluorescent in situ hybridization. Genet Med; 1(3): 98-103 1999), Ki-67 (un antígeno que está presente en todos los estadios del ciclo celular excepto G0 y se usa como un marcador para proliferación de células tumorales) y marcadores de pronóstico (incluyendo oncogenes, genes supresores de tumores y marcadores de angiogénesis) como p53, p27, Catepsina D, pS2, gen de resistencia a multifármaco (MDR) y CD31. El documento WO 02/103320 se refiere a marcadores genéticos, cuya expresión se correlaciona con cáncer de mama, y en particular que pueden usarse para diferenciar afecciones clínicas asociadas con cáncer de mama tales como la presencia o ausencia del receptor de estrógenos ESR1 y BRCA1 y tumores esporádicos.
El tamoxifeno es el agente antiestrógeno más frecuentemente prescrito en mujeres con cáncer de mama positivo para receptor de hormonas tanto de estadio temprano como metastásico (para revisiones, véase Clarke, R et al. “Antiestrogen resistance in breast cancer and the role of estrogen receptor signalling”. Oncogene 22, 7316-39 (2003) y Jordan, C. “Historical perspective on hormonal therapy of advanced breast Cancer”. Clin. Ther. 24 Sup. A, A3-16 (2002)). En el entorno con adyuvante, la terapia con tamoxifeno da como resultado una reducción del 40-50% en el riesgo anual de reaparición, lo que conduce a una mejora del 5,6% en la supervivencia a 10 años en pacientes negativos para ganglios linfáticos y una mejora del 10,9% correspondiente en pacientes positivos para ganglios (Grupo, E.B.C.T.C. Tamoxifen for early breast cancer. Cochrane Database Syst Rev, CD000486 (2001)). Se cree que el tamoxifeno actúa principalmente como un inhibidor competitivo de la unión de estrógenos con el receptor de estrógenos (ER). Los niveles absolutos de expresión de ER, así como los del receptor de progesterona (PR, un indicador de una ruta de ER funcional), son en la actualidad los mejores predictores de respuesta a tamoxifeno en situaciones clínicas (Group, (2001) y Bardou, V.J. et al. “Progesterone receptor status significantly improves outcome prediction over estrogen receptor status alone for adjuvant endocrine therapy in two large breast cancer databases”. J Clin Oncol 21, 1973-9 (2003)).
Sin embargo, el 25% de los tumores ER+/PR+, 66% de los casos de ER+/PR- y 55% de los casos de ER-/PR+ no responden, o desarrollan resistencia temprana a tamoxifeno, a través de mecanismos que en gran medida aún no se han aclarado (véase Clarke et al.; Nicholson, R.I. et al. "”The biology of antihormone failure in breast cancer”. Breast Cancer Res Treat 80 Supl. 1, S29-34; discussion S35 (2003) y Osborne, C.K. et al. “Growth factor receptor cross-talk with estrogen receptor as a mechanism for tamoxifen resistance in breast cancer”. Breast 12, 362-7 (2003)). Daidone et al., British Journal of Cancer 2000 Vol. 82 Nº 2 pág. 270-277 buscan identificar biomarcadores y el resultado después del tratamiento con tamoxifeno en cáncer de mama positivo para ganglios en mujeres mayores. Ellis et al.,
J. Ster. Biochem. & Mol. Bio. 86(2003) 301-307 evalúan perfiles de expresión en pacientes tratados con inhibidores de aromatasa y tamoxifeno. Van der Flier et al., J. Nat. Cane. Inst. Vol. 92 Nº 2 (2000) 120-127 revisan la expresión de Bcar1/p130Cas en la resistencia a terapia de tamoxifeno. Luo et al., Brit. J. Cancer 86 (2002) 1790-1976 supervisan los niveles proteicos de calicreína 6 humana y calicreína 10 humana en pacientes con cáncer de mama y sensibilidad a tamoxifeno. Hilsenback et al., J. Nat. Cane. Inst. Vol. 91 Nº 5 (1999) pág. 453-459 analizan datos de expresión en matrices de resistencia a tamoxifeno adquirida.
En la actualidad, no existe ningún medio fiable para permitir la identificación de estos pacientes no sensibles. En estos pacientes, el uso de terapias hormonales alternativas, tales como los inhibidores de aromatasa, letrozol y anastrozol (Ellis, M.J. et al. “Letrozole is more effective neoadjuvant endocrine therapy than tamoxifen for ErbB-1and/or ErbB-2-positive, estrogen receptor-positive primary breast cancer: evidence from a phase III randomized trial.” J Clin Oncol 19, 3808-16 (2001); Buzdar, A.U. “Anastrozole: a new addition to the armamentarium against advanced breast cancer." Am J Clin Oncol 21, 161-6 (1998); y Goss, P.E. et al. “A randomized trial of letrozole in postmenopausal women after five years of tamoxifen therapy for early-stage breast cancer.” N Engl J Med 349, 1793-802 (2003)); agentes quimioterapéuticos o inhibidores de otras rutas de señalización, tales como trastuzmab y gefitinib podrían ofrecer la posibilidad de mejorar el resultado clínico. Por lo tanto, la capacidad para predecir de forma precisa el resultado del tratamiento con tamoxifeno debería avanzar significativamente el tratamiento de cáncer de mama de estadio temprano identificando pacientes que probablemente no se beneficien de TAM de modo que puedan buscarse terapias adicionales o alternativas.
Sumario de la invención
La presente invención se refiere a la identificación y uso de patrones de expresión génica (o perfiles o “identificaciones”) y los niveles de expresión de secuencias génicas individuales que son únicamente relevantes para el cáncer de mama. En particular, se proporcionan las identidades de genes que se correlacionan con supervivencia de los pacientes y la reaparición del cáncer de mama (por ejemplo metástasis del cáncer de mama). Los perfiles de expresión génica, bien expresados en la expresión de ácido nucleico, expresión de proteínas o bien otros formatos de expresión, pueden usarse para predecir la supervivencia de los sujetos aquejados de cáncer de mama y la probabilidad de la reaparición de cáncer de mama, incluyendo metástasis de cáncer.
La invención posibilita de este modo la identificación y uso de patrones de expresión génica (o perfiles o “identificaciones”) y los niveles de expresión de secuencias génicas individuales que se correlacionan con (y por lo tanto son capaces de diferenciar entre) pacientes con buenos o malos resultados de supervivencia. En una realización, la invención proporciona patrones que pueden distinguir en pacientes con tumores de mama positivos para receptor de estrógenos (una isoforma) (ER+) entre los que son sensibles, o que probablemente sean sensibles, al tratamiento con tamoxifeno (TAM), u otro agente “antiestrógeno” contra cáncer de mama (tal como un “modulador selectivo de los receptores de estrógenos” (“SERM”), “regulador negativo selectivo de los receptores de estrógenos” (“SERD”) o inhibidores de aromatasa (“Al”)) y los que no son sensibles, o probablemente no sean sensibles, a dicho tratamiento. La sensibilidad puede verse con respecto a mejora de resultados de supervivencia a lo largo del tiempo. Estos patrones pueden por lo tanto distinguir pacientes con tumores de mama ER+ en al menos dos subtipos.
En un primer aspecto, la presente invención proporciona un medio no subjetivo para la identificación de pacientes con cáncer de mama (ER+ o ER-) como probablemente con un buen o mal resultado de supervivencia después del tratamiento con TAM u otro agente “antiestrógeno” contra cáncer de mama ensayando con respecto a los patrones de expresión desvelados en este documento. Por lo tanto cuando podría haberse usado previamente la interpretación subjetiva para determinar el pronóstico y/o el tratamiento de pacientes con cáncer de mama, la presente invención proporciona patrones de expresión génica objetivos, que pueden usarse solos o en combinación con criterios subjetivos para proporcionar una evaluación más precisa de los resultados de paciente con cáncer de mama ER+ o ER- o resultados esperados, incluyendo supervivencia y la reaparición del cáncer, después del tratamiento con TAM u otro agente “antiestrógeno” contra cáncer de mama. Los patrones de expresión de la invención proporcionan de este modo un medio para determinar el pronóstico del cáncer de mama ER+ o ER-. Además, los patrones de expresión también pueden usarse como un medio para ensayar tumores pequeños, negativos para ganglios que no se ensayan fácilmente por otros medios.
Los patrones de expresión génica comprenden genes capaces de diferenciar entre resultados de cáncer de mama con precisión significativa. Las secuencias génicas se identifican como correlacionadas con resultados de cáncer de mama ER+ de modo que los niveles de su expresión son relevantes para una determinación de los protocolos de tratamiento preferidos para un paciente, bien ER+ o bien ER-.
Por lo tanto, en una realización, la invención proporciona un método para determinar el riesgo de reaparición de cáncer en un sujeto aquejado de cáncer de mama ER+ si se trata con tamoxifeno, comprendiendo dicho método ensayar una muestra de células de cáncer de mama ER+ de dicho sujeto con respecto a la expresión de ARNm de IL 17BR y HOXB13 humano para determinar una relación de los niveles de expresión de HOXB13 e IL17BR, siendo dicha relación indicativa de ausencia de reaparición de cáncer en dicho sujeto si se trata con tamoxifeno.
La capacidad para correlacionar la expresión génica con resultado de cáncer de mama y sensibilidad a TAM es particularmente ventajosa a la luz de la posibilidad de que hasta el 40% de los sujetos ER+ que se someten a tratamiento con TAM sean no sensibles. Por lo tanto, la capacidad para identificar, con confianza, estos pacientes no sensibles en un momento temprano permite la consideración y/o aplicación de terapias alternativas (tales como un agente “antiestrógeno” diferente contra cáncer de mama u otros tratamientos anticáncer de mama) a los pacientes no sensibles. Dicho de otro modo, la capacidad para identificar sujetos no sensibles a TAM permite que el personal médico considere y/o utilice terapias alternativas para el tratamiento de los sujetos antes de que se gaste tiempo en terapia de TAM ineficaz. El tiempo gastado en una terapia ineficaz con frecuencia permite el crecimiento adicional del cáncer, y la probabilidad de éxito con terapias alternativas se reduce a lo largo del tiempo dado dicho crecimiento. Por lo tanto, la invención también proporciona métodos para mejorar el resultado de supervivencia de pacientes no sensibles mediante el uso de los métodos desvelados en este documento para identificar pacientes no sensibles para el tratamiento con terapias alternativas.
Se identifican patrones de expresión génica de la invención como se describe posteriormente. En general, se obtiene una gran muestra del perfil de expresión génica de una muestra a través de la cuantificación de los niveles de expresión de ARNm correspondientes a muchos genes. Este perfil se analiza después para identificar genes, cuya expresión se correlaciona de forma positiva, o negativa, con el resultado de cáncer de mama ER+ tras el tratamiento con TAM u otro agente “antiestrógeno” contra cáncer de mama. Después puede identificarse un perfil de expresión de un subconjunto de genes humanos por los métodos de la presente descripción correlacionados con un resultado particular. El uso de múltiples muestras aumenta la confianza con la que puede creerse que un gen se correlaciona con un resultado de supervivencia particular. Sin suficiente confianza, sigue siendo impredecible si la expresión de un gen particular se correlaciona de hecho con un resultado y también es impredecible si la expresión de un gen particular puede usarse de forma exitosa para identificar el resultado para un paciente con cáncer de mama. La invención se practica basándose en las identidades de las secuencias génicas descritas en este documento o las secuencias reales usadas independientemente de la identificación.
Puede usarse un perfil de genes que se correlacionan en gran medida con un resultado en relación con otro para ensayar una muestra de un sujeto aquejado de cáncer de mama para predecir la sensibilidad probable (o falta de la misma) a TAM u otro agente “antiestrógeno” contra cáncer de mama en el sujeto del que se obtuvo la muestra. Dicho ensayo puede usarse como parte de un método para determinar el tratamiento terapéutico para dicho sujeto basándose en el resultado de cáncer de mama identificado.
Como se analiza posteriormente, los genes correlacionados pueden usarse en combinación para aumentar la capacidad para correlacionar de forma precisa un fenotipo de expresión molecular con un resultado de cáncer de mama. Esta correlación es un modo de posibilitar de forma molecular la determinación de los resultados de supervivencia como se describen en este documento. Hay usos adicionales de los genes correlacionados en la clasificación de células y tejidos; determinación del diagnóstico y/o pronóstico; y determinación y/o alteración de la terapia.
La capacidad para diferenciar se confiere por la identificación de la expresión de los genes individuales como relevantes y no por la forma del ensayo usada para determinar el nivel real de expresión. Un ensayo puede utilizar cualquier característica identificadora de un gen individual identificado como se describe en este documento siempre que el ensayo refleje, de forma cuantitativa o cualitativa, la expresión del gen en el “transcriptoma” (la fracción transcrita de genes en un genoma) o el “proteoma” (la fracción traducida de genes expresados en un genoma). Los ensayos adicionales incluyen los basados en la detección de fragmentos polipeptídicos del miembro o los miembros relevantes del proteoma. Las características identificadoras incluyen, pero sin limitación, secuencias de ácido nucleico únicas usadas para codificar (ADN) o expresar (ARN), dichos genes o epítopos específicos de, o actividades de una proteína codificada por dicho gen. Todo lo que se requiere es la secuencia o las secuencias génicas necesarias para diferenciar entre resultados de cáncer de mama y una muestra que contenga células apropiadas para su uso en un ensayo de expresión.
Los inventores también describen la identificación de los patrones de expresión génica analizando expresión génica global, o casi global, de células únicas o poblaciones celulares homogéneas que se han separado por disección de,
o se han aislado o purificado de otro modo de, células contaminantes más allá de lo posible por una mera biopsia. Debido a que la expresión de numerosos genes fluctúa entre células de diferentes pacientes así como entre células de la muestra del mismo paciente, se usan múltiples datos de la expresión de genes individuales y patrones de expresión génica como datos de referencia para generar modelos que a su vez permiten la identificación de un gen
o genes individuales, cuya expresión se correlaciona en mayor medida con resultados de cáncer de mama particulares.
Los inventores también describen medios físicos y metodológicos para detectar la expresión del gen o genes identificados por los modelos generados por patrones de expresión individuales. Estos medios pueden dirigirse a ensayar uno o más aspectos del molde o los moldes de ADN que subyacen a la expresión del gen o los genes, del ARN usado como un intermedio para expresar el gen o los genes, o del producto proteico expresado por el gen o los genes.
Los inventores también describen que el gen o los genes identificados por un modelo como capaces de diferenciar entre resultados de cáncer de mama pueden usarse para identificar el estado celular de una muestra desconocida de célula o células de la mama. Preferentemente, la muestra se aísla mediante medios no invasivos. La expresión de dicho gen o genes en dicha muestra desconocida puede determinarse y compararse con la expresión de dicho gen o genes en datos de referencia de patrones de expresión génica correlacionados con resultados de cáncer de mama. Opcionalmente, la comparación con muestras de referencia puede ser por comparación con el modelo o los modelos construidos basándose en las muestras de referencia.
Una ventaja proporcionada por la presente invención es que no están presentes células no de mama contaminantes (tales como linfocitos que se infiltran u otras células del sistema inmune) para afectar posiblemente a los genes identificados o el análisis posterior de la expresión génica para identificar los resultados de supervivencia de pacientes con cáncer de mama. Dicha contaminación está presente cuando se usa una biopsia para generar perfiles de expresión génica. Sin embargo, y como se observa en este documento, la invención incluye la identidad de genes que pueden usarse con precisión significativa, incluso con presencia de células contaminantes.
Los inventores también describen un medio no subjetivo basado en la expresión de múltiples genes, o combinaciones de los mismos, para la identificación de pacientes con cáncer de mama como probablemente con buen o mal resultado de supervivencia después del tratamiento con TAM u otro agente “antiestrógeno” contra cáncer de mama. Estos genes son miembros de los patrones de expresión descritos en este documento que se ha descubierto que son fuertemente predictivos del resultado clínico después del tratamiento con TAM de cáncer de mama ER+.
La presente invención proporciona de este modo secuencias génicas identificadas como diferencialmente expresadas en cáncer de mama ER+ en correlación con sensibilidad a TAM. Las secuencias de dos genes presentan expresión aumentada en células de mama ER+ que responden a tratamiento con TAM (y por lo tanto falta de expresión aumentada en casos no sensibles). Las secuencias de otros dos genes presentan expresión reducida en células de mama ER+ que responden a tratamiento con TAM (y por lo tanto falta de expresión reducida en casos no sensibles).
El primer conjunto de secuencias que se ha descubierto que se expresan más en células de mama ER+ sensibles a TAM son las del receptor B de interleucina 17 (IL17RB), que se han mapeado en el cromosoma 3 humano en 3p21.1. IL17RB también se denomina receptor de interleucina 17B (IL17BR) y las secuencias que les corresponden, y por lo tanto pueden usarse en la práctica de la presente invención, se identifican por UniGene Cluster Hs.5470.
El segundo conjunto de secuencias que se ha descubierto que se expresan más en células de mama ER+ sensibles a TAM son las de una región transcrita recién identificada de colina deshidrogenasa (CHDH), que se han mapeado en el cromosoma 3 humano en 3p21.1. Esta está cerca de la localización mapeada para la subunidad 1D alfa, de tipo L, dependiente de voltaje del canal de calcio (CACNA1D) en 3p14.3. La invención se basa en parte en el descubrimiento inesperado de un error en bases de datos públicas que identificaron la secuencia de AI24093 como correspondiente a una parte transcrita de CACNA1D (en Hs.399966). Como se detalla posteriormente, las regiones transcritas de CHDH y CACNA1D se orientan de forma convergente de modo que la transcripción avance desde las regiones reguladoras de cada una hacia la región reguladora de la otra. Dicho de otro modo, se transcriben de forma convergente a partir de hebras complementarias en la misma región del cromosoma 3.
Por lo tanto, los inventores también describen la identificación de AI240933 que está en la orientación errónea con respecto a transcripción de CACNA1D pero en la orientación correcta como transcripción de CHDH y como se
localiza en el extremo 3’ de la transcripción de CHDH. Sin quedar ligado a la teoría, y aportado para mejorar el entendimiento de la descripción, se cree que la secuencia de AI240933 es una parte del extremo 3’ del transcrito de CHDH. Es posiblemente parte de la región no traducida 3’ (UTR) de CHDH. La descripción puede practicarse con
secuencias correspondientes a CHDH así como las identificadas por Hs.126688.
El primer conjunto de secuencias que se ha descubierto que se expresa a niveles menores en células de mama ER+ sensibles a TAM son las de la caja homeótica B13 (HOXB13), que se ha mapeado en el cromosoma 17 humano en 17q21.2. Las secuencias correspondientes a HOXB13, y que pueden usarse por lo tanto en la práctica de la presente invención, se identifican por UniGene Cluster Hs.66731.
El segundo conjunto de secuencias que se ha descubierto que se expresa a niveles menores en células de mama ER+ sensibles a TAM son las de quinolinato fosforribosiltransferasa (QPRT, también conocida como nicotinatonucleótido pirofosforilasa, carboxilante), que se ha mapeado en el cromosoma 16 humano en 16p12.1. Las secuencias correspondientes a QPRT que pueden usarse en la práctica de la presente invención, se identifican por UniGene Cluster Hs.335116.
La invención puede practicarse basándose en las identidades de estas secuencias génicas o las secuencias reales usadas independientemente de la identidad asignada.
Las secuencias identificadas pueden por lo tanto usarse en métodos para determinar la sensibilidad, o ausencia de sensibilidad, del cáncer de mama ER+ o ER- de un sujeto a tratamiento con TAM, o tratamiento con otro agente “antiestrógeno” contra cáncer de mama, mediante análisis de células de mama en una muestra que contenga tejidos
o células de un sujeto. Como ejemplos no limitantes, puede usarse la falta de expresión aumentada de secuencias de IL17BR y/o CHDH y/o la falta de expresión reducida de secuencias de HOXB 13 y/o QPRT como un indicador de casos no sensibles. La presente invención proporciona un medio no empírico para determinar la sensibilidad a TAM
u otro SERM en pacientes ER+. Esto proporciona ventajas frente al uso de un enfoque de “esperar y ver” después del tratamiento con TAM u otro agente “antiestrógeno” contra cáncer de mama. Los niveles de expresión de estas secuencias también pueden usarse como un medio para ensayar tumores pequeños, negativos para ganglios que no se evalúan fácilmente por medios convencionales.
Los niveles de expresión de las secuencias identificadas pueden usarse solos o en combinación con otras
secuencias capaces de determinar la sensibilidad a tratamiento con TAM u otro agente “antiestrógeno” contra cáncer
de mama. Preferentemente, las secuencias de la invención se usan solas o en combinación entre sí, tal como en el formato de una relación de niveles de expresión que pueda tener capacidad predictiva mejorada frente a análisis basado en la expresión de secuencias correspondientes a genes individuales. La invención proporciona relaciones del nivel de expresión de una secuencia que se infraexpresa y el nivel de expresión de una secuencia que se sobreexpresa como un indicador de sensibilidad o ausencia de sensibilidad.
La presente invención proporciona medios para correlacionar un fenotipo de expresión molecular con una respuesta fisiológica en un sujeto con cáncer de mama ER+. Esta correlación proporciona un medio para diagnosticar y/o determinar molecularmente tratamiento para un sujeto aquejado de cáncer de mama. Hay usos adicionales de las secuencias en la clasificación de células y tejidos; y determinación de diagnóstico y/o pronóstico. Puede usarse el uso de las secuencias para identificar células de una muestra como sensibles, o no, a tratamiento con TAM y otro agente “antiestrógeno” contra cáncer de mama para determinar la selección, o alteración, de la terapia usada para tratar tales células en el sujeto, así como el sujeto en sí mismo, del que se originó la muestra.
Tales métodos de la invención pueden usarse para ayudar en la determinación de proporcionar tamoxifeno u otro agente “antiestrógeno” contra cáncer de mama como un agente quimiopreventivo o quimioprotector a un sujeto en alto riesgo de desarrollo de cáncer de mama. Estos métodos de la invención son un avance frente a los estudios de Fabian et al. (J Natl Cancer Inst. 92(15): 1217-27,2000), que propusieron una combinación de citomorfología y el modelo de riesgo de Gail para identificar pacientes con alto riesgo. Los métodos pueden usarse en combinación con evaluaciones de riesgo relativo de cáncer de mama tales como la analizada por Tan-Chiu et al. (J Natl Cancer Inst. 95(4): 302-307, 2003). Los ejemplos no limitantes incluyen ensayar muestras mínimamente invasivas, tales como aspirados de aguja fina aleatorios (perialveolares) o muestras de lavado de conductos (tales como las descritas por Fabian et al. y opcionalmente en combinación con o como una adición a un mamograma positivo para cáncer de mama benigno o maligno), de células de mama con respecto a los niveles de expresión de secuencias génicas como se describen en este documento para ayudar en la determinación de la administración de terapia con un agente “antiestrógeno” contra cáncer de mama, tal como la que puede producirse en casos de sujetos de alto riesgo (tales como los descritos por Tan-Chiu et al.). Los ensayos conducirían de este modo a la identificación de sujetos para los que la aplicación de un agente “antiestrógeno” contra cáncer de mama probablemente sería beneficiosa como un agente quimiopreventivo o quimioprotector. Se contempla que dicha aplicación como se permite por la presente invención podría conducir a efectos beneficiosos como los vistos con la administración de tamoxifeno (véase por ejemplo, Wickerham D. L., Breast Cancer Res. and Treatment 75 Supl 1:S7-12, Discussion S33-5, 2000). Otras aplicaciones de la invención incluyen ensayar cáncer de mama avanzado, incluyendo cáncer metastásico, para determinar la sensibilidad, o ausencia de sensibilidad, del mismo a tratamiento con un agente “antiestrógeno” contra cáncer de mama.
Un ensayo de la invención puede utilizar un medio relacionado con el nivel de expresión de las secuencias descritas en este documento siempre que el ensayo refleje, de forma cuantitativa o cualitativa, la expresión de la secuencia. Preferentemente, sin embargo, se prefiere un medio de ensayo cuantitativo. Se proporciona la capacidad para determinar sensibilidad a TAM u otro agente “antiestrógeno” contra cáncer de mama y por lo tanto el resultado del tratamiento con el mismo por el reconocimiento de la relevancia del nivel de expresión de las secuencias identificadas y no por la forma del ensayo usada para determinar el nivel real de expresión. Las características identificadoras de la secuencia incluyen, pero sin limitación, secuencias de ácido nucleico únicas usadas para codificar (ADN), o expresar (ARN), las secuencias descritas o epítopos específicos de, o actividades de, proteínas codificadas por las secuencias. Los medios alternativos incluyen detección de amplificación de ácido nucleico como indicativa de aumento de los niveles de expresión e inactivación, deleción o metilación del ácido nucleico, como indicativa de la reducción de los niveles de expresión. Dicho de otro modo, la invención puede practicarse ensayando uno o más aspectos del molde o los moldes de ADN que subyacen a la expresión de la secuencia o las secuencias descritas, del ARN usado como un intermedio para expresar la secuencia o las secuencias, o del producto proteico expresado por la secuencia o las secuencias, así como fragmentos proteolíticos de tales productos. Como tal, la detección de la presencia de, cantidad de, estabilidad de, o degradación (incluyendo velocidad) de, dicho ADN, ARN y moléculas proteicas puede usarse en la práctica de la descripción.
La práctica de la presente invención no se ve afectada por la presencia de emparejamientos erróneos menores entre las secuencias descritas y las expresadas por células de la muestra de un sujeto. Un ejemplo no limitante de la existencia de dichos emparejamientos erróneos se ve en casos de polimorfismos de secuencia entre individuos de una especie, tales como pacientes humanos individuales dentro de Homo sapiens. El conocimiento de que la expresión de las secuencias descritas (y secuencias que varían debido a emparejamientos erróneos menores) se correlaciona con la presencia de células de mama no normales o anómalas y cáncer de mama es suficiente para la práctica de la invención con una muestra que contenga células apropiada mediante un ensayo con respecto a expresión.
En una realización, la invención posibilita la identificación de los niveles de expresión de las secuencias descritas por análisis de su expresión en una muestra que contenga células de mama ER+ o ER-. En una realización preferida, la muestra contiene células únicas o poblaciones celulares homogéneas que se han separado por disección de, o aislado o purificado de otro modo de, células contaminantes más allá de lo posible por una mera biopsia. Como alternativa, pueden usarse células no diseccionadas dentro de una “sección” de tejido. Están disponibles múltiples medios para dicho análisis, incluyendo detección o expresión dentro de un ensayo con respecto a expresión génica global, o casi global, en una muestra (por ejemplo como parte de un análisis de perfil de expresión génica tal como en una micromatriz) o por detección específica, tal como PCR cuantitativa (Q-PCR), o PCR cuantitativa en tiempo real.
Preferentemente, la muestra se aísla mediante medios no invasivos o mínimamente invasivos. La expresión de la secuencia o secuencias descritas en la muestra puede determinarse y compararse con la expresión de dicha secuencia o secuencias en datos de referencia de células de mama cancerosas o no normales. Como alternativa, el nivel de expresión puede compararse con los niveles de expresión en células normales o no cancerosas, preferentemente de la misma muestra o sujeto. En realizaciones de la invención que utilizan Q-PCR, el nivel de expresión puede compararse con los niveles de expresión de genes de referencia en la misma muestra o puede usarse una relación de niveles de expresión.
Cuando se aíslan células de mama individuales en la práctica de la invención, un beneficio es que no están presentes células no de mama contaminantes (tales como linfocitos que se infiltran u otras células del sistema inmune) para afectar posiblemente a la detección de la expresión de la secuencia o las secuencias descritas. Dicha contaminación está presente cuando se usa una biopsia para generar perfiles de expresión génica. Sin embargo, el análisis de la expresión génica diferencial y correlación con resultados de cáncer de mama ER+ con muestras tanto aisladas como no aisladas, como se describe en este documento, aumenta el nivel de confianza de las secuencias descritas como capaces de tener potencia predictiva significativa con uno de los tipos de muestra.
Aunque la presente invención se describe principalmente en el contexto de cáncer de mama humano, puede practicarse en el contexto de cáncer de mama de cualquier animal que se sepa que está aquejado potencialmente de cáncer de mama. Los animales preferidos para la aplicación de la presente invención son mamíferos, particularmente los importantes para aplicaciones agrícolas (tales como, pero sin limitación, vacas, ovejas, caballo y
otros “animales de granja”), animales modelo de cáncer de mama y animales para compañía humana (tales como,
pero sin limitación, perros y gatos).
Los anteriores aspectos y realizaciones de la invención pueden aplicarse igualmente con respecto al uso de más de un agente “antiestrógeno” contra cáncer de mama. En el caso de una combinación de agentes, puede usarse cualquier combinación de más de un SERM, SERD o Al en lugar de TAM u otro agente “antiestrógeno” contra cáncer de mama. La aromatasa es una enzima que proporciona una fuente principal de estrógeno en tejidos corporales incluyendo la mama, hígado, músculo y grasa. Sin quedar ligado a la teoría, y proporcionado solamente para ayudar en un mejor entendimiento de la invención, se entiende que los AI actúan de una manera comparable a TAM y otros agentes “antiestrógeno” contra cáncer de mama, que se cree que actúan como antagonistas de receptor de estrógenos en tejidos mamarios y por lo tanto contra cáncer de mama. Los AI pueden ser agentes no esteroideos o esteroideos. Los ejemplos de los primeros, que inhiben la aromatasa mediante el grupo protético hemo incluyen, pero sin limitación, anastrozol (arimidex), letrozol (femara) y vorozol (rivisor), que se han usado o contemplado como tratamientos para cáncer de mama metastásico. Los ejemplos de AI esteroideos, que inactivan aromatasa, incluyen, pero sin limitación, exemestano (aromasina), androstenediona y formestano (lentaron).
Otras formas de terapia para reducir los niveles de estrógenos incluyen ablación ovárica quirúrgica o química. La primera es la retirada física de los ovarios mientras que la segunda es el uso de agentes para bloquear la producción ovárica de estrógeno. Un ejemplo no limitante de la segunda son agonistas de la hormona liberadora de gonadotropina (GnRH), tales como goserelina (zoladex).
La invención descrita en este documento se basa en parte en el rendimiento de un análisis de micromatriz de todo el genoma de tumores de mama invasivos positivos para el receptor de hormonas de 60 pacientes tratados con adyuvante tamoxifeno solamente, que conduce a la identificación de una relación de expresión de dos genes que es altamente predictiva del resultado clínico. Esta relación de expresión, que se adapta fácilmente a análisis basado en PCR de muestras de ensayo clínicas incluidas en parafina convencionales, se validó en un conjunto independiente de 20 pacientes como se describe posteriormente.
Breve descripción de las figuras
La Figura 1 muestra análisis de las características operativas del receptor (ROC) de los niveles de expresión de IL17BR, HOXB13 y CACNA1D como predictores de los resultados del cáncer de mama en secciones de tejido completo (los 3 gráficos de la parte superior) y células microdiseccionadas con láser (los 3 gráficos de la parte inferior). AUC se refiere al área bajo la curva.
La Figura 2 contiene seis partes relacionadas con la validación de una proporción entre la expresión de HOXB 13 y la expresión de IL17BR como indicador de la capacidad de respuesta, o la falta de la misma, a TAM. Las partes a y b muestran los resultados del análisis de la expresión génica de las secuencias de HOXB13 y IL17BR mediante Q-PCR en muestras de respondedores y de no respondedores. Los gráficos de los conjuntos de datos de formación y validación de los respondedores y los no respondedores se muestran en las partes c y d, en las que “0” indica los puntos de datos de Respondedores en ambas y "1” indica los puntos de datos de los no tespondedores en ambas. Las partes e y f muestran gráficos de los conjuntos de datos de formación y validación de los respondedores y los no respondedores en función de la supervivencia, en los que la línea superior en cada parte representa los respondedores y la línea inferior representa los no respondedores.
La Figura 3 muestra una representación esquemática de la región 3’ conocida de la secuencia del gen CHDH en combinación con las secuencias en 3’ no traducidas de CHDH identificadas mediante la presente
divulgación.
La Figura 4 muestra los resultados de una reacción de amplificación mediante PCR en la que se produce un amplicón consistente con la prevista a partir del esquema de la Figura 1. Los cebadores para PCR usados fueron los siguientes: cebador de CHDH directo: 5'-AAAGTCTT-GGGAAATGAGACAAGT-3'; cebadores inversos 83R: 5'-AGCTGTCATTTGCCAGTGAGA-3' y 81R: 5'-CTGT-CATTTGCCAGTGAGAGC-3'.
La Figura 5 muestra la alineación de 28 secuencias para identificar un cóntigo que comprende la región del extremo 3’ de CHDH. La alineación incluye la secuencia de AI240933, que incluye el extremo 3' de la secuencia consenso ensamblada.
La Figura 6 muestra la secuencia de un cóntigo ensamblado que contiene el nuevo extremo 3’ de CHDH.
La Figura 7 muestra una representación de una región del cromosoma 3 humano en la que se identifica la localización de CACNA1D mediante "Hs.399966" y la localización de CHDH se identifica mediante "Hs. 126688".
Figura 8, la Parte A contiene seis partes relacionadas con la validación de una proporción entre la expresión de QPRT y la expresión de CHDH como indicador de la capacidad de respuesta, o la falta de la misma, a TAM. Las tres porciones identificadas por "QPRT:CHDH AI240933" reflejan la proporción usando una sonda para la expresión de la secuencia GenBank AI240933. Las tres porciones identificadas por "QPRT:CHDH AJ272267" reflejan la proporción usando una sonda para la expresión de la secuencia GenBank AJ272267, identificada como la de un ARNm parcial para CHDH. La parte B contiene el uso análogo de una proporción de la expresión de HOXB13 y la expresión de IL17BR como indicador de la capacidad de respuesta a TAM. Se muestran los gráficos de los conjuntos de datos de respondedores (”R”) y no respondedores (“NR”). Los valores P son la prueba t de dos muestras.
Modos de llevar a cabo la invención
Definiciones de los términos y expresiones como se usan en el presente documento:
Un “patrón” o “perfil” o “firma” de expresión génica hace referencia a la expresión relativa de genes
correlacionada con la capacidad de respuesta al tratamiento del cáncer de mama ER+ con TAM u otro agente “antiestrógenos” contra el cáncer de mama. La capacidad de respuesta, o la falta de la misma, se puede expresar como los resultados de la supervivencia que se correlacionan con un “patrón” o “perfil” o “firma” de
la expresión que es capaz de diferenciar dichos resultados y predecirlos.
Un “modulador selectivo del receptor de estrógenos" o SERM es un agente "antiestrógenos" que en algunos tejidos
actúa como estrógenos (agonistas) pero bloquea la acción de los estrógenos en otros tejidos (antagonista). Un
“regulador por disminución selectivo del receptor de estrógenos” o (“SERD”) o antiestrógenos “puros” incluye
agentes que bloquean la actividad de los estrógenos en todos los tejidos. Véase Howell y col. (Best Bractice & Res. Clin. Endocrinol. Metab. 18(1):47-66, 2004). Los SERM preferidos de la invención son aquéllos que son antagonistas de los estrógenos en tejidos y células de mama, incluidos los de cáncer de mama. Ejemplos no limitantes de estos incluyen TAM, raloxifeno, GW5638 e ICI 182,780. Se han revisado los posibles mecanismos de acción por varios SERM (véase, por ejemplo, Jordan y col., 2003, Breast Cancer Res. 5:281-283; Hall y col., 2001, J. Biol. Chem. 276(40): 36869-36872; Dutertre y col., 2000, J. Pharmacol. Exp. Therap. 295(2):431-437; y Wijayaratne y col., 1999, Endocrinology 140(12):5828-5840). Otros ejemplos no limitantes de SERM en el contexto de la invención incluyen trifeniletilenos, tales como tamoxifeno, GW5638, TAT-59, clomifeno, toremifeno, droloxifeno e idoxifeno; benzotiofenos, tales como arzoxifeno (LY353381 o LY353381-HCI); benzopiranos, tal como EM-800; naftalenos, tales como CP-336,156; y ERA-923.
Ejemplos no limitantes de SERD o antiestrógenos “puros” incluyen agentes tales como ICI 182,780 (fulvestrant o faslodex) o el análogo oral SR16243 y ZK 191703, así como inhibidores de la aromatasa y agentes químicos de ablación ovárica como se describe en el presente documento.
Otros agentes abarcados por los SERM como se usan en el presente documento incluyen inhibidores del receptor de la progesterona y fármacos relacionados, tales como progestomiméticos como acetato de medroxiprogesterona, megace y RU-486; e inhibidores basados en péptidos de la acción de los ER, tales como análogos de la LH-RH (leuprorelina, zoladex, [D-Trp6]LH-RH), análogos de la somatostatina y miméticos de motivo LXXLL de los ER así como tibolona y resveratrol. Como se ha indicado anteriormente, los SERM preferidos de la invención son aquéllos que son antagonistas de los estrógenos en tejidos y células de mama, incluidos los de cáncer de mama. Ejemplos no limitantes de SERM preferidos incluyen los metabolitos reales o contemplados (in vivo) de cualquier SERM, tal como, entre otros, 4-hidroxitamoxifeno (metabolito del tamoxifeno), EM652 (o SCH 57068 en el que EM-800 es un profármaco de EM-652) y GW7604 (metabolito de GW5638). Véase en Willson y col., (1997, Endocrinology 138(9):3901-3911) y Dauvois y col., (1992, Proc. Nat'l. Acad. Sci., USA 89:4037-4041) debates de algunos SERM específicos.
Otros SERM preferidos son los que producen el mismo perfil de expresión génica relevante que el tamoxifeno o el 4hidroxitamoxifeno. Un ejemplo de medios para identificar dichos SERM lo proporcionan Levenson y col., (2002, Cancer Res. 62:4419-4426).
Un “gen” es un polinucleótido que codifica un producto pequeño, de naturaleza ARN o proteináceo. Se ha apreciado
que un polinucleótido puede ser capaz de codificar un producto pequeño. El término incluye alelos y polimorfismos de un gen que codifica el mismo producto, o un análogo del mismo funcionalmente asociado (incluidos ganancia, pérdida o modulación de la función) en base a la localización cromosómica y a la capacidad para recombinarse durante la mitosis normal.
Una “secuencia” o “secuencia génica” como se usa en el presente documento es una molécula de ácido nucleico o
polinucleótido compuesta por un orden pequeño de bases nucleotídicas. El término incluye el orden de las bases
que codifica un producto pequeño (es decir, “región de codificación”), de naturaleza ARN o proteinácea, así como las bases en orden que preceden o siguen a una “región de codificación”). Ejemplos no limitantes de esto último incluyen las regiones no traducidas en 5’ y 3’ de un gen. Se ha apreciado que más de un polinucleótido puede ser capaz de codificar un producto pequeño. También se aprecia que pueden existir alelos y polimorfismos de las secuencias divulgadas y se pueden usar en la práctica de la invención para identificar el o los niveles de expresión de las secuencias divulgadas o el alelo o polimorfismo. La identificación de un alelo o polimorfismo depende en parte de la localización cromosómica y la capacidad para recombinarse durante la mitosis.
Los términos “correlacionan” o “correlación” o equivalentes de los mismos hacen referencia a una asociación entre la expresión de uno o más genes y una respuesta fisiológica de una célula de cáncer de mama y/o un paciente de cáncer de mama en comparación con la falta de respuesta. Un gen se puede expresar a niveles más altos o más bajos y seguir correlacionado con la capacidad de respuesta, la falta de capacidad de respuesta o la supervivencia o el resultado del cáncer de mama. Los inventores describen, por ejemplo, la correlación entre incrementos de la expresión de las secuencias de IL17BR y/o CHDH y la capacidad de respuesta de las células de mama ER+ a TAM
o a otro agente “antiestrógenos” contra el cáncer de mama. Por tanto, los incrementos son indicativos de la
capacidad de respuesta. Por el contrario, la falta de incrementos, incluidos los niveles de expresión no modificados, son indicadores de falta de capacidad de respuesta. De un modo simular, los inventores describen, por ejemplo, la correlación entre disminuciones de la expresión de las secuencias de HOXB13 y/o QPRT y la capacidad de respuesta de las células de mama ER+ a TAM o a otro SERM. Por tanto, las disminuciones son indicativas de la capacidad de respuesta, mientras que la falta de disminuciones, incluidos los niveles de expresión no modificados, son indicadores de la falta de capacidad de respuesta. Los incrementos y disminuciones se pueden expresar fácilmente en forma de una proporción entre la expresión en una célula no normal y una célula normal, de modo que una proporción de uno (1) indica ausencia de diferencia entre las proporciones de dos (2) y un medio indica el doble y la mitad de la expresión en células no normales frente a las células normales, respectivamente. Los niveles de expresión se pueden determinar fácilmente mediante procedimientos cuantitativos como se describe más adelante.
Por ejemplo, los incrementos en la expresión génica pueden indicarse mediante proporciones de o aproximadamente 1,1, de o aproximadamente 1,2, de o aproximadamente 1,3, de o aproximadamente 1,4, de o aproximadamente 1,5, de o aproximadamente 1,6, de o aproximadamente 1,7, de o aproximadamente 1,8, de o aproximadamente 1,9, de o aproximadamente 2, de o aproximadamente 2,5, de o aproximadamente 3, de o aproximadamente 3,5, de o aproximadamente 4, de o aproximadamente 4,5, de o aproximadamente 5, de o aproximadamente 5,5, de o aproximadamente 6, de o aproximadamente 6,5, de o aproximadamente 7, de o aproximadamente 7,5, de o aproximadamente 8, de o aproximadamente 8,5, de o aproximadamente 9, de o aproximadamente 9,5, de o aproximadamente 10, de o aproximadamente 15, de o aproximadamente 20, de o aproximadamente 30, de o aproximadamente 40, de o aproximadamente 50, de o aproximadamente 60, de o aproximadamente 70, de o aproximadamente 80, de o aproximadamente 90, de o aproximadamente 100, de o aproximadamente 150, de o aproximadamente 200, de o aproximadamente 300, de o aproximadamente 400, de o aproximadamente 500, de o aproximadamente 600, de o aproximadamente 700, de o aproximadamente 800, de o aproximadamente 900, o de o aproximadamente 1000. Una proporción de 2 es un incremento del 100 % (o del doble) en la expresión. Las disminuciones en la expresión génica pueden estar indicadas por proporciones de o aproximadamente 0,9, de o aproximadamente 0,8, de o aproximadamente 0,7, de o aproximadamente 0,6, de o aproximadamente 0,5, de o aproximadamente 0,4, de o aproximadamente 0,3, de o aproximadamente 0,2, de o aproximadamente 0,1, de o aproximadamente 0,05, de o aproximadamente 0,01, de o aproximadamente 0,005, de o aproximadamente 0,001, de o aproximadamente 0,0005, de o aproximadamente 0,0001, de o aproximadamente 0,00005, de o aproximadamente 0,00001, de o aproximadamente 0,000005, o de o aproximadamente 0,000001.
Para un fenotipo dado, una proporción de la expresión de una secuencia génica expresada a niveles incrementados en la correlación con el fenotipo y la expresión de una secuencia génica expresada a niveles disminuidos en correlación con el fenotipo también se puede usar como indicador del fenotipo. Como ejemplo no limitante, el fenotipo de la falta de capacidad de respuesta al tratamiento con tamoxifeno del cáncer de mama se correlaciona con un incremento de la expresión de HOXB13 y/o QPRT así como una expresión disminuida de IL17BR y/o CHDH Por tanto, una proporción de los niveles de expresión de HOXB13 o QPRT a IL17BR o CHDH se puede usar como indicador de la falta de capacidad de respuesta.
Un “polinucleótido” es una forma polimérica de nucleótidos de cualquier longitud, ya sea ribonucleótidos o desoxirribonucleótidos. Este término hace referencia únicamente a la estructura primaria de la molécula. Por tanto, este término incluye formas monocatenarias y bicatenarias de ADN y ARN. También Incluye tipos conocidos de modificaciones, incluidos marcadores conocidos en la técnica, metilación, “capuchones”, sustitución de uno o más de los nucleótidos naturales con un análogo y modificaciones internucleotídicas tales como enlaces sin carga (p. ej., fosforotioatos, fosforoditioatos etc.), así como formas no modificadas del polinucleótido.
El término “amplificar” se usa en su sentido más amplio para querer decir que la creación de un producto de amplificación se puede efectuar enzimáticamente con ADN o ARN polimerasas. “Amplificación", como se usa en el
presente documento, se refiere, en general, al proceso de producir múltiples copias de una secuencia deseada, en
particular las de una muestra. “Múltiples copias” quiere decir al menos 2 copias. Una “copia” no necesariamente
significa una perfecta complementariedad de secuencia o identidad con la secuencia molde. En general, los procedimientos para amplificar el ARNm se conocen en la técnica e incluyen PCR con transcripción inversa (RT-PCR) y los descritos en la solicitud de patente de EE.UU. 10/062,857 (presentada el 25 de octubre de 2001), así como las solicitudes de patente provisionales de EE.UU. 60/298,847 (presentada el 15 de junio de 2001) y 60/257,801 (presentada el 22 de diciembre de 2000). Otro procedimiento que se puede usar es la PCR cuantitativa (o Q-PCR). Como alternativa, el ARN puede marcarse directamente como el ADNc correspondiente mediante procedimientos conocidos en la técnica.
Con “correspondiente” se quiere decir que una molécula de ácido nucleico comparte una cantidad sustancial de
identidad de secuencia con otra molécula de ácido nucleico. Cantidad sustancial significa al menos 95 %, normalmente al menos 98 % y más normalmente al menos 99 % y la identidad de secuencia se determina usando el algoritmo BLAST, como se describe en Altschul y col., (1990), J. Mol. Biol. 215:403-410 (usando los parámetros por defecto publicados, es decir los parámetros w=4, t=17).
Una “micromatriz” es una matriz lineal o bidimensional o tridimensional (y de fase sólida) de regiones
preferentemente pequeñas, teniendo cada una un área definida, formadas sobre la superficie de un soporte sólido tales como, entre otros, cristal, plástico o membrana sintética. La densidad de las regiones pequeñas en una micromatriz se determina con el número total de polinucleótidos inmovilizados que se han de detectar sobre la superficie de un único soporte de fase sólida, preferentemente de al menos aproximadamente 50/cm2, más preferentemente de al menos aproximadamente 100/cm2, incluso más preferentemente de al menos aproximadamente 500/cm2, pero preferentemente inferior a aproximadamente 1.000/cm2. Preferentemente, las matrices contienen menos de aproximadamente 500, aproximadamente 1.000, aproximadamente 1.500, aproximadamente 2.000, aproximadamente 2.500 o aproximadamente 3.000 polinucleótidos inmovilizados en total. Como se usa en el presente documento, una micromatriz de ADN es una matriz de oligonucleótidos o polinucleótidos colocados sobre un circuito u otras superficies usadas para hibridar con polinucleótidos amplificados
o clonados de una muestra. Dado que la posición en la matriz de cada grupo concreto de cebadores se conoce, las identidades de los polinucleótidos de una muestra se pueden determinar en base a su unión a una posición concreta en la micromatriz. Como alternativa al uso de una micromatriz, en la práctica de la invención se puede usar una matriz de cualquier tamaño, incluida una disposición de una o más posiciones de una disposición bidimensional o tridimensional en una fase sólida para detectar expresión de una única secuencia génica.
Dado que la invención depende de la identificación de los genes que están sobre o subexpresados, una realización de la invención implica determinar la expresión mediante hibridación de ARNm o una versión clonada o amplificada del mismo, de una célula de muestra con un polinucleótido que es único de una secuencia génica concreta. Los polinucleótidos de este tipo preferidos contienen al menos aproximadamente 16, al menos aproximadamente 18, al menos aproximadamente 20, al menos aproximadamente 22, al menos aproximadamente 24, al menos aproximadamente 26, al menos aproximadamente 28, al menos aproximadamente 30 o al menos aproximadamente 32 pares de bases consecutivos de una secuencia génica que no se encuentra en otras secuencias génicas. El
término “aproximadamente”, como se usa en la frase anterior, hace referencia a un incremento o disminución de 1
con respecto al valor numérico indicado. Incluso más preferidos son los polinucleótidos de al menos o aproximadamente 50, al menos o aproximadamente 100, al menos o aproximadamente 150, al menos o aproximadamente 200, al menos o aproximadamente 250, al menos o aproximadamente 300, al menos o aproximadamente 350, al menos o aproximadamente 400, al menos o aproximadamente 450 o al menos o aproximadamente 500 pares de bases consecutivos de una secuencia que no se encuentra en otras secuencias
génicas. El término “aproximadamente”, como se usa en la frase anterior, hace referencia a un incremento o
disminución del 10 % con respecto al valor numérico indicado. Por supuesto, polinucleótidos más largos pueden contener errores de apareamiento minoritarios (p. ej., mediante la presencia de mutaciones) que no afectan a la hibridación con los ácidos nucleicos de una muestra. Dichos polinucleótidos también se pueden denominar sondas polinucleotídicas que son capaces de hibridar con las secuencias de los genes, o con porciones únicas de las mismas, descritas en el presente documento. Dichos polinucleótidos pueden estar marcados para ayudar a su detección. Preferentemente, las secuencias son las de ARNm codificadas por los genes, el correspondiente ADNc de dichos ARNm y/o versiones amplificadas de dichas secuencias. En realizaciones preferidas de la invención, las sondas polinucleotídicas están inmovilizadas sobre una matriz, otros dispositivos de soporte sólido o manchas individuales que localizan las sondas.
En otra realización de la invención, todo o parte de una secuencia divulgada se puede amplificar y detectar mediante procedimientos tales como la reacción en cadena de la polimerasa (PCR) y variaciones de la misma, tales como, entre otras, PCR cuantitativa (Q-PCR), PCR con transcripción inversa (RT-PCR) y PCR en tiempo real (incluida como medio de medición de las cantidades iniciales de las copias de ARNm para cada secuencia en una muestra), opcionalmente RT-PCR en tiempo real o Q-CPR en tiempo real. Dichos procedimientos usarían uno o dos cebadores que son complementarios a porciones de una secuencia divulgada, en los que los cebadores se usan para cebar la síntesis de ácidos nucleicos. Los ácidos nucleicos recién sintetizados están opcionalmente marcados y se pueden detectar directamente o mediante hibridación con un polinucleótido de la invención. Los ácidos nucleicos recién sintetizados pueden ponerse en contacto con polinucleótidos (que contienen secuencias) de la invención en condiciones que permitan su hibridación. Procedimientos adicionales para detectar la expresión de ácidos nucleicos expresados incluyen ensayos de protección con RNAsa, incluidas hibridaciones en fase líquida e hibridación in situ de células.
Como alternativa, y en otra realización más de la divulgación, la expresión génica se puede determinar mediante análisis de la proteína expresada en una muestra celular de interés mediante el uso de uno o más anticuerpos específicos de uno o más epítopos de productos génicos individuales (proteínas) o fragmentos proteolíticos de los mismos, en dicha muestra celular o en un fluido corporal de un sujeto. La muestra celular puede ser una de células epiteliales de cáncer de mama enriquecida de la sangre de un sujeto, tal como mediante el uso de anticuerpos marcados contra marcadores de superficie celular, seguido de clasificación celular activada por fluorescencia (FACS). Dichos anticuerpos están marcados, preferentemente, para permitir su fácil detección tras la unión al producto génico. Las metodologías de detección adecuadas para usar en la práctica de la divulgación incluyen, entre otras, inmunohistoquímica de muestras o tejido que contienen células, ensayos de inmunosorción ligado a enzimas (ELISA) incluyendo los ensayos con anticuerpos de tipo sándwich de tejidos que contienen células o muestras de sangre, espectroscopia de masas e inmuno-PCR.
El término “marcador” se refiere a una composición capaz de producir una señal detectable indicativa de la presencia de la molécula marcada. Marcadores adecuados incluyen radioisótopos, cromóforos nucleotídicos, enzimas, sustratos, moléculas fluorescentes, restos quimioluminiscentes, partículas magnéticas, restos bioluminiscentes y similares. Como tal, un marcador es cualquier composición detectable por medios espectroscópicos, fotoquímicos, bioquímicos, inmunoquímicos, eléctricos, ópticos o químicos.
El término “soporte” se refiere a soportes convencionales tales como soportes de perlas, partículas, tiras reactivas, fibras, filtros, membranas y silano o silicato, tales como portaobjetos de cristal.
Como se usa en el presente documento, una “muestra de tejido de mama” o “muestra de célula de mama” hace referencia a una muestra de tejido o fluido de mama aislada de un individuo que se sospecha que está afectado con cáncer de mama o en riesgo de desarrollarlo. Dichas muestras son aislados primarios (en contraste con las células cultivadas) y se pueden obtener mediante cualquier medio no invasivo o mínimamente invasivo, incluidos, entre otros, lavado ductal, aspiración con aguja fina, biopsia con aguja, los dispositivos y procedimientos descritos en la patente de EE.UU. 6,328,709, o cualquier otro medio adecuado reconocido en la técnica. Como alternativa, la
“muestra” se puede obtener mediante un procedimiento invasivo, incluida, entre otras, la biopsia quirúrgica.
“Expresión” y “expresión génica” incluyen transcripción y/o traducción de material de ácido nucleico.
Como se usa en el presente documento, el término “que comprende” y sus afines se usan en su sentido de incluido; es decir, equivalente al término "que incluye" y sus correspondientes afines.
Condiciones que “permiten” que se produzca un acontecimiento o condiciones que son “adecuadas” para que se produzca un acontecimiento, tal como hibridación, extensión de hebra y similares, o condiciones “adecuadas” son
condiciones que no impiden que se produzcan dichos acontecimientos. Por tanto, estas condiciones permiten, potencian, facilitan y/o conducen al acontecimiento. Dichas condiciones, conocidas en la técnica y descritas en el presente documento, dependen de, por ejemplo, la naturaleza de la secuencia nucleotídica, la temperatura y las condiciones tampón. Estas condiciones también dependen de qué acontecimiento se desee, tal como hibridación, escisión, extensión de hebra o transcripción.
"Mutación” de secuencia, como se usa en el presente documento, hace referencia a cualquier alteración de
secuencia en la secuencia de un gen de interés divulgado en el presente documento en comparación con una secuencia de referencia. Una mutación de secuencia incluye cambios en un solo nucleótido o alteraciones de más de un nucleótido en una secuencia debido a mecanismos tales como sustitución, deleción o inserción. Un polimorfismo de un solo nucleótido (SNP) es también una mutación de secuencia como se usa en el presente documento. Dado que la presente invención se basa en el nivel relativo de la expresión génica, las mutaciones en las regiones no codificantes de genes tal como se divulgan en el presente documento también pueden analizarse en la práctica de la invención.
“Detección” incluye cualquier medio de detección, incluida la detección directa e indirecta de la expresión génica y cambios en la misma. Por ejemplo, los productos “menos detectables” se pueden observar directa o indirectamente, y el término indica cualquier reducción (incluida la ausencia de señal detectable). De un modo similar, producto “más detectable” significa cualquier incremento observado tanto directa como indirectamente.
Los incrementos y disminuciones de la expresión de las secuencias divulgadas se definen en los términos siguientes en base al porcentaje de cambios o al número de cambios sobre la expresión en células normales. Los incrementos pueden ser 10, 20, 30, 40, 50, 60, 70, 80, 90, 100,120, 140, 160, 180 o 200 % respecto a los niveles de expresión en células normales. Como alternativa, el número de incrementos puede ser 1, 1,,5, 2, 2;5, 3, 3,5, 4, 4,5, 5, 5,5, 6, 6,5, 7, 7,5, 8, 8,5, 9, 9,5, o 10 veces sobre los niveles de expresión en células normales. Las disminuciones pueden ser 10, 20, 30, 40, 50, 55, 60, 65, 70, 75, 80, 82, 84, 86, 88, 90, 92, 94, 96, 98, 99 o 100 % respecto a los niveles de expresión en células normales.
A menos que se defina otra cosa, todos los términos técnicos y científicos usados en el presente documento tienen el mismo significado que un experto en la técnica a la que la presente invención pertenece entiende habitualmente.
Realizaciones de la invención
En un primer aspecto, la invención divulgada se refiere a la identificación y uso de patrones (o perfiles o “firmas”) de
expresión génica que discriminan entre (o se correlacionan con) supervivencia del cáncer de mama en un sujeto tratado con tamoxifeno (TAM) u otro agente "antiestrógenos" contra el cáncer de mama. Dichos patrones se pueden determinar mediante los procedimientos de la invención mediante el uso de una serie de muestras de células o tejido de referencia, tales como las revisadas por un patólogo experto en la anatomía patológica del cáncer de mama, que reflejan células de cáncer de mama frente a células normales u otras células no cancerosas. Los resultados experimentados por los sujetos de los que las muestras se pueden correlacionar con los datos de expresión para identificar patrones que se correlacionen con los resultados tras el tratamiento con TAM u otro agente “antiestrógenos” contra el cáncer de mama. Dado que el perfil de expresión génica global difiere de una persona a otra, de un cáncer a otro y de una célula cancerosa a otra, las correlaciones entre ciertas células y genes expresados o subexpresados se pueden realizar como se divulga en el presente documento para identificar genes que son capaces de discriminar entre resultados de cáncer de mama.
La presente divulgación se puede poner en práctica con un número cualquiera de los genes que se cree que se expresan de forma diferencial, o que probablemente lo hagan, con respecto a los resultados de cáncer de mama, en particular en los casos de cáncer de mama ER+. La identificación se puede realizar usando los perfiles de expresión de varias poblaciones de células de cáncer de mama homogéneas que se aislaron mediante microdisección, tales como, entre otras, microdisección por captura por láser (LCM) de 100 - 1.000 células. El nivel de expresión de cada gen del perfil de expresión se puede correlacionar con un resultado concreto. Como alternativa, los niveles de expresión de múltiples genes se pueden agrupar para identificar correlaciones con resultados concretos.
Los genes con correlaciones significativas con la supervivencia del cáncer de mama cuando el sujeto es tratado con tamoxifeno se pueden usar para generar modelos de expresiones génicas que discriminarían de forma máxima entre
resultados cuando un sujeto responde al tratamiento con tamoxifeno u otro agente “antiestrógenos” contra el cáncer
de mama y resultados en los que el tratamiento no ha tenido éxito. Como alternativa se pueden usar genes con correlaciones significativas en combinación con genes con correlaciones menores sin una pérdida significativa de capacidad para discriminar entre resultados. Dichos modelos se pueden generar por cualquier medio adecuado reconocido en la técnica, incluyendo, entre otros, análisis por grupos, máquinas de vector con soporte, redes neurales u otro algoritmo conocido en la técnica. Los modelos son capaces de predecir la clasificación de una muestra desconocida en base a la expresión de los genes usados para discriminación en los modelos. Se puede usar la validación cruzada de "dejar uno fuera" para analizar el funcionamiento de varios modelos y ayudar a identificar pesos (genes) que no proporcionan información o son perjudiciales para la capacidad de predicción de los modelos. La validación cruzada también se puede usar para identificar genes que potencian la capacidad predictiva de los modelos.
El o los genes identificados que se correlacionan con resultados concretos del cáncer de mama en relación con el tratamiento con tamoxifeno mediante los modelos anteriores proporcionan la capacidad de centrar el análisis de la expresión génica en solo los genes que contribuyen a la capacidad de identificar un sujeto como que probablemente tenga un resultado concreto respecto a otro. La expresión de otros genes en una célula de cáncer de mama sería relativamente incapaz de proporcionar información pertinente y, por tanto, ayudar a la discriminación de un resultado de cáncer de mama.
Como apreciarán los expertos en la técnica, los modelos son muy útiles con incluso un conjunto pequeño de datos de expresión génica de referencia y pueden ser cada vez más precisos con la inclusión de más datos de referencia, aunque el incremento incremental en la precisión probablemente disminuya con cada dato adicional. La preparación de datos de expresión génica de referencia adicionales usando genes identificados y divulgados en el presente documento para discriminar entre diferentes resultados en el cáncer de mama tras el tratamiento con tamoxifeno u
otro agente “antiestrógenos” contra el cáncer de mama es rutinario y un experto en la técnica la puede realizar
fácilmente para permitir la generación de modelos como se ha descrito en lo que antecede para predecir el estado de una muestra desconocida en base a los niveles de expresión de dichos genes.
Para determinar los niveles de expresión (aumentados o disminuidos) de los genes en la práctica de la presente invención se puede usar cualquier procedimiento conocido en la técnica. En una realización preferida de la invención, se usa la expresión basada en la detección de ARN que hibrida con los genes identificados y divulgados en el presente documento. Esto se realiza fácilmente mediante cualquier procedimiento de detección de ARN o amplificación + detección o reconocido como equivalente en la técnica, tal como, entre otros, PCR-transcripción inversa, los procedimientos divulgados en la patente de EE.UU. 6,794,141 y los procedimientos para detectar la presencia o ausencia de secuencias estabilizantes o desestabilizantes de ARN.
Como alternativa se puede usar la expresión basada en la detección del estado de ADN. La detección del ADN de un gen identificado como metilado o delecionado se puede usar para genes que tienen una expresión disminuida en correlación con un resultado concreto del cáncer de mama. Esto se puede realizar fácilmente mediante procedimientos basados en PCR conocidos en la técnica, incluidos, entre otros, Q-PCR. Por el contrario, la detección del ADN de un gen identificado como amplificado se puede usar para genes que tienen una expresión aumentada en correlación con un resultado concreto del cáncer de mama. Esto se puede realizar fácilmente mediante procedimientos basados en PCR, hibridación fluorescente in situ (FISH) e hibridación cromosómica in situ (CISH) conocidos en la técnica.
También se puede usar la expresión basada en la detección de una presencia, incremento o disminución de los niveles o actividad de proteínas. La detección se puede realizar mediante cualquier procedimiento basado en inmunohistoquímica (IHC), basado en sangre (especialmente para proteínas secretadas), basado en anticuerpos (incluidos autoanticuerpos contra la proteína), basado en exfoliados celulares (de cáncer), basado en espectroscopia de masas y basado en imágenes (incluido el uso de ligando marcado) conocido en la técnica y reconocido como adecuado para la detección de la proteína. Los procedimientos basados en anticuerpos e imágenes son útiles adicionalmente para la localización de tumores tras la determinación del cáncer mediante el uso de células obtenidas mediante un procedimiento no invasivo (tal como lavado ductal o aspiración con aguja fina), en los que la fuente de las células cancerosas no se conoce. Un anticuerpo o ligando marcado se puede usar para localizar el o los carcinomas en un paciente o para ayudar en el enriquecimiento de células de cáncer exfoliadas de un fluido corporal.
Una realización preferida que usa un ensayo basado en ácido nucleico para determinar la expresión es mediante inmovilización de una o más secuencias de los genes identificadas en el presente documento en un soporte sólido, incluidos, entre otros, un sustrato sólido como matriz o en perlas o en tecnología a base de perlas tal como se conoce en la técnica. Como alternativa, también se pueden usar ensayos de expresión basados en solución conocidos en la técnica. El o os genes inmovilizados pueden estar en forma de polinucleótidos que son únicos o, de otro modo, específicos del o los genes de forma que los polinucleótidos serían capaces de hibridar con un ADN o ARN correspondiente al o los genes. Estos polinucleótidos pueden ser la longitud total del o los genes o ser secuencias cortas de los genes (hasta de un nucléotido más corto que la secuencia de longitud total conocida en la
técnica mediante deleción del extremo 5¡ o 3’ de la secuencia) que están opcionalmente mínimamente interrumpidos
(tal como mediante errores de apareamiento o pares de bases no complementarias insertados) de modo que no afecta a la hibridación con un ADN o ARN correspondiente al o los genes. Preferentemente, los polinucleótidos
usados son del extremo 3’ del gen, tal como en aproximadamente 350, aproximadamente 300, aproximadamente
250, aproximadamente 200, aproximadamente 150, aproximadamente 100 o aproximadamente 50 nucleótidos de la señal de poliadenilación o sitio de poliadenilación de un gen o secuencia expresada. Los polinucleótidos que contienen mutaciones respecto a las secuencias de los genes divulgados se pueden usar siempre que la presencia de las mutaciones siga permitiendo hibridación para producir una señal detectable.
El o los genes inmovilizados, o secuencias complementarias de los mismos, se pueden usar para determinar el estado de las muestras de ácido nucleico preparadas de célula(s) de mama de muestra para las que no se conoce el resultado del sujeto de la muestra (p. ej., paciente del que se obtiene la muestra) o para la confirmación de un resultado que ya se ha asignado al sujeto de la muestra. Sin limitar la divulgación, dicha célula puede proceder de un paciente con cáncer de mama ER+ o ER-. El o los polinucleótidos inmovilizados solo tienen que ser suficientes para hibridar específicamente con las correspondientes moléculas de ácido nucleico derivadas de la muestra en condiciones adecuadas. Aunque incluso una única secuencia génica correlacionada puede proporcionar la precisión adecuada en la discriminación entre dos resultados de cáncer de mama, se pueden usar dos o más, tres o más, cuatro o más, cinco o más, seis o más, siente o más, ocho o más, nueve o más, diez o más, once o más, o cualquier número entero de los genes identificados en el presente documento, como subpoblación capaz de discriminar en combinación con un incremento de la precisión del procedimiento. La divulgación contempla específicamente la selección de más de uno, dos o más, tres o más, cuatro o más, cinco o más, seis o más, siete o más, ocho o más, nueve o más, diez o más, once o más o cualquier número entero de los genes divulgados en las tablas y figuras en el presente documento para usar como una subpoblación en la identificación del resultado de supervivencia del cáncer de mama.
Por supuesto, se puede usar 1 o más, 2 o más, 3 o más, 4o más, 5 o más, 6 o más, 7 o más, 8 o más, 9 o más, cualquier número entero o todos los genes proporcionados en las Tablas 2, 3 y/o XXX más adelante. “Acceso” como se usa en el contexto de las Tablas del presente documento hace referencia al número de acceso en GenBank de una secuencia de cada gen. El valor P hace referencia a los valores asignados como se describe en los ejemplos siguientes. Las indicaciones de "E-xx", en el que “xx” es un número de dos dígitos se refiere a una notación alternativa para cifras exponenciales en las que "E-xx" es “10’-xx". Por tanto, en combinación con los números a la izquierda de "E-xx", el valor que se está representando es el número de la izquierda por 10’xx. “Descripción”, como se usa en las Tablas, proporciona un breve identificador de lo que codifica la secuencia/gen.
Los genes con una correlación identificada por un valor p inferior o de aproximadamente 0,02, inferior o de aproximadamente 0,01, inferior o de aproximadamente 0,05 o inferior o de aproximadamente 0,001 se prefieren para usar en la práctica de la divulgación. La presente divulgación incluye el uso de gen(es) cuya expresión identifica
diferentes resultados del cáncer de mama tras el tratamiento con TAM u otro agente “antiestrógenos” contra el
cáncer de mama para permitir la identificación simultánea del resultado de supervivencia del cáncer de mama de un paciente en base al análisis de una muestra de cáncer de mama de dicho paciente.
En un segundo aspecto, que también sirve como realizaciones del uso de una subpoblación de los genes divulgados en el presente documento, la presente divulgación se refiere a la identificación y uso de múltiples conjuntos de secuencias para la determinación de la capacidad de respuesta del cáncer de mama ER+ al tratamiento con TAM u otro agente “antiestrógenos” contra el cáncer de mama. La expresión diferencial de estas secuencias en el cáncer d emana respecto a las células de mama normales se usa para predecir la capacidad de respuesta al TAM o a otro agente "antiestrógenos" contra el cáncer de mama en un sujeto.
Para identificar los patrones de expresión génica en cánceres de mama invasivos, en fase temprana, ER positivos, que podrían predecir la respuesta a terapia hormonal, se realizó el análisis de expresión génica en microserie sobre tumores de 60 mujeres tratadas de forma uniforme trató con adyuvante tamoxifeno solo. Estas pacientes se identificaron de un total de 103 casos ER+ en fase temprana que se presentaron en el Hospital General de Massachusetts entre 1987 y 1997, de los cuales se congelaron instantáneamente muestras tumorales y de los cuales se disponía de un seguimiento mínimo de 5 años (véase la Tabla 1 para los detalles). Dentro de esta cohorte, 28 (46%) mujeres desarrollaron metástasis distante con un tiempo medio hasta la recurrencia de 4 años ("no respondedores a tamoxifeno") y 32 (54%) mujeres permanecieron sin enfermedad con un seguimiento medio de 10 años ("respondedores a tamoxifeno"). Los respondedores se hicieron coincidir con los casos de no respondedores con respecto a la estadificación TNM (véase Singletary, S.E. et al. "Revision of the American Joint Committee on Cancer staging system for breast cancer." J Clin Oncol 20, 3628-36 (2002)) y el grado del tumor (véase Dalton, L.W. et al. "Histologic grading of breast cancer: linkage of patient outcome with level of pathologist agreement." Mod Pathol 13, 730-5. (2000)).
Estudios previos que vinculan los perfiles de expresión génica con el resultado clínico en cáncer de mama han demostrado que el potencial de metástasis distante y la probabilidad de supervivencia global puede ser predecible a través de características biológicas del tumor primario en el momento del diagnóstico (véase Huang, E. et al. "Gene expression predictors of breast cancer outcomes." Lancet 361,1590-6 (2003); Sorlie, T. et al. "Gene expression patterns of breast carcinomas distinguish tumor subclasses with clinical implications." Proc Natl Acad Sci U S A 98:10869-74 (2001); Sorlie, T. et al. "Repeated observation of breast tumor subtypes in independent gene expression data sets." Proc Natl Acad Sci U S A 100, 8418-23 (2003); Sotiriou, C. et al. "Breast cancer classification and prognosis based on gene expression profiles from a population-based study." Proc Natl Acad Sci U S A 100, 10393-8 (2003); van't Veer, L.J. et al. "Gene expression profiling predicts clinical outcome of breast cancer." Nature 415, 5306 (2002); y van de Vijver, M.J. et al. "A gene-expression signature as a predictor of survival in breast cancer." N Engl J Med 347, 1999-2009 (2002)). En particular, una firma de expresión de 70 genes ha demostrado ser un potente factor pronóstico, superando todos los parámetros clínico-patológicos conocidos. Sin embargo, en esos estudios las pacientes recibieron terapia sin adyuvante (van 't Veer, L.J. et al. Nature 2002) o se trataron de forma no uniforme con regímenes hormonales y quimioterapéuticos (Huang, E. et al.; Sorlie, T. et al.; Sorlie, T. et al.; Sotiriou, C. et al.; y van de Vijver, M.J. et al. N Engl J Med 2002). Las pacientes con cáncer de mama ER+ en fase temprana tratadas con tamoxifeno solo, tal como la cohorte estudiada aquí, representan solamente un conjunto de la población ensayada con la firma de 70 genes. Es de observar que 61 de los genes en la firma de 70 genes estuvieron presentes en la microserie usada como se describe a continuación, pero no se observó asociación significativa con el resultado clínico en el subconjunto definido de pacientes.
En comparación con biomarcadores existentes, incluyendo ER1, PGR, ERBB2 y EGFR, las series de secuencias génicas descritas en este documento son significativamente más predictivas de sensibilidad al tratamiento con TAM. Un análisis multivariable indicó que estos tres genes eran predoctores significativos de resultado clínico independiente del tamaño del tumor, el estado nodal y el grado del tumor. La expresión de ER y el receptor de progesterona (PR) han sido los predictores clínico-patológicos principales de de respuesta a TAM. Sin embargo, hasta el 40% de los tumores ER+ no lograron responder o desarrollaron resistencia a TAM. La invención por tanto proporciona el uso de los biomarcadores identificados para permitir un mejor tratamiento del paciente identificando pacientes que tienen mayor probabilidad de beneficiarse de TAM u otra terapia endocrina y aquellos que tienen probabilidad de desarrollar resistencia y recurrencia tumoral.
Como se indica en este documento, la secuencia o secuencias identificadas por la presente invención se expresan en correlación con células cancerosas de mama ER+. Por ejemplo, se ha descubierto que IL17BR, identificado por los grupos I.M.A.G.E. Consortium NM_018725 y NM_172234 ("The I.M.A.G.E. Consortium: An Integrated Molecular Analysis of Genomes and their Expression," Lennon et al., 1996, Genomics 33:151-152; véase también image.IInI.gov) es útil para predecir la sensibilidad al tratamiento con TAM.
En realizaciones preferidas de la invención, puede usarse cualquier secuencia, o parte única de la misma, de las secuencias IL17BR del grupo, así como el grupo UniGene Homo sapiens Hs.5470. Asimismo, puede usarse cualquier secuencia que codifique todo o una parte de la proteína codificada por cualquier secuencia de IL17BR descrita en este documento. Las secuencias consenso de los grupos I.M.A.G.E. Consortium son las siguientes, con la región codificada asignada (finalizando con un codón de terminación) subrayada y precedida por la región no
SEC ID Nº 2 (secuencia consenso para IL17BR, variante de transcrito 2, identificada como NIVM72234 o NM_172234.1):
A continuación se enumeran los números de ID de clon de I.M.A.G.E. Consortium y los correspondientes números de acceso a GenBank de las secuencias identificadas como pertenecientes a los grupos I.M.A.G.E. Consortium y UniGene. También se incluyen secuencias que no están identificadas con un número de ID de clon pero aún así son de IL17BR. Las secuencias incluyen aquellas de las secuencias de la hebra "con sentido" y complementaria correspondientes a IL17BR. La secuencia de cada número de acceso a GenBank se presenta en el Apéndice adjunto.
Número de ID de clon
Números de acceso a GenBank
2985728
AW675096, AW673932, BC000980
5286745
BI602183
5278067
B1458542
5182255
BI823321
924000
AA514396
3566736
IBF110326
3195409
BE466508
3576775
BF740045
2772915
AW299271
1368826
AA836217
1744837
AI203628
2285564
AI627783
2217709
AI744263
2103651
AI401622
2419487
AI826949
3125592
BE047752
2284721
AI911549
3643302
BF194822
1646910
AI034244
1647001
AI033911
3323709
BF064177
1419779
AA847767
2205190
AI538624
2295838
AI913613
2461335
AI942234
12130362
JAI580483
2385555
AI831909
2283817
AI672344
2525596
AW025192
454687
AA677205
1285273
AA721647
3134106
BF115018
342259
W61238, W61239
Número de ID de clon
Números de acceso a GenBank
1651991
AI032064
2687714
AW236941
3302808
BG057174
2544461
AW058532
122014
T98360, T98361
2139250
AI470845
2133899
AI497731
121300 T96629, T96740
T96629, T96740
162274
H25975, He941
3446667
BE539514, BX282554
156864
R74038, R74129
4611491
BG433769
4697316
BG530489
429376
AA007528, AA007529
5112415
BI260259
701357
AA287951, AA287911 T97852, T97745 N40294 AA809841 AA832389 H14692 AA732635 AA928257
121909
268037
1307489
1357543
48442
1302619
1562857
1731938
AI184427 AI298577 AI692717 AA910922 H90761 AI620122 AI793318, AA962325, AI733290 BQ226353 W04990 BM455231 BI492426 BG674622 BX111256 BX1117618 AA682806
1896025
2336350
1520997
240506
2258560
1569921
6064627
299018
5500181
2484011
4746376
233783
1569921
450450
Número de ID de clon
Números de acceso a GenBank
1943085
AI202376 AI658949
2250390
4526156
BG403405 BE673417 AW021469 CF455736 AW339874 BG399724 BF475787 BF437145 H64601 AF212365, AKp95091 AF208110, AF208111, AF250309, AK095091 BM983744, CB305764, BM715988, BM670929, BI792416, BI715216, N56060, CB241389, AV660618, BX088671, CB154426, CA434589, CA412162, CA314073, BF921554, BF920093, AV685699, AV650175, BX483104, CD675121, BE081436, AW970151, AW837146, AW368264, D25960, AV709899, BX431018, AL535617, AL525465, BX453536, BX453537, AV728945, AV728939, AV727345
3249181
2484395
30515867
285815
4556884
3254505
3650593
233783
Ninguno (secuencias de ARNm)
Ninguno
En una realización preferida, puede usarse cualquier secuencia, o parte única de la misma, de la siguiente secuencia de IL17BR, identificada por AF208111 o AF208111.1, en la práctica de la invención.
SEC ID Nº 3 (secuencia para IL17BR): En realizaciones preferidas de la descripción, puede usarse cualquier secuencia, o parte única de la misma, de las secuencias CHDH del grupo, así como el grupo UniGene Homo sapiens Hs. 126688. Asimismo, puede usarse cualquier secuencia que codifique todo o una parte de la proteína codificada por cualquier secuencia de CHDH descrita en este documento, incluyendo secuencias del nuevo contig ensamblado. Las secuencias consenso de los grupos I.M.A.G.E. Consortium son los siguientes, con la región codificante asignada (finalizando con un codón de terminación) subrayada y precedida por la región no traducida y/o no codificante 5' y seguida de la región previamente identificada no traducida y/o no codificante 3':
SEC ID Nº 4 (secuencia consenso para CHDH, identificada como NM_018397 o NM_018397.1):
A continuación se enumeran los números de ID de clon I.M.A.G.E. Consortium y los correspondientes números de acceso a GenBank de secuencias identificadas como pertenecientes a los grupos I.M.A.G.E. Consortium y UniGene. También se incluyen secuencias que no están identificadas con un número de ID de clon pero aún así son de CHDH. Las secuencias incluyen aquellas de las secuencias de hebra "con sentido" y complementaria correspondientes a CHDH. Secuencias adicionales para su uso en la práctica de la descripción son aquellas alineadas en la Figura 5, que también se proporcionan en el Apéndice adjunto.
Número de ID de clon / número(s) de acceso a GenBank
4824572/BC034502 y BG720228
5191415/BI765156
5311690/B1667529
5267676/BI460380
11031605/AA609488
3842653/BE732217
4543273/BG336766
3504516/BE279319
3140587BE279968
6297066/BQ648069
2714263/AW449121
2735859/AW450678
2720363/AW139168
3642981/BF195860
5931105/BQ066460
3574335/BF430927
3268842/BF435866
3267752/BF435185
Número de ID de clon / número(s) de acceso a GenBank
1868020/AI264647 y BX116752 y AI733810 y AI792632
2365837/AI741739
3085519BF510364
1647746/AI034449
2695349/AW194S22
2285283/AI628996
2694067/AW235087
2285315/AI629023
2463061/AI928186
2462306/AI927042
2381448/AI768443
2298488/AI650346
3134601/BF197300
2300327/AI631941
2697626/AW167538
3034918/AW779820
2525301/AW024823
2300291/AI631914
2137091/AI473735
4147169/BG060119
2772286/AW299654
2172535/AI564145
2690214/AW241612
1868068/AI241086
1608918/AA991365
3134810/BF197431
1869723/AI245204
2691133/AW242403
6109050/BU500214
2384051/AI796286
12055388/AI308167
3032446/AW771262
2907815/AW340332
1636795//AI792354 y AI017355
2299592/AI640195
2054920/AI334627
2690173/AW237735
1869819/AI245373
3195030BE464406
Número de ID de clon / número(s) de acceso a GenBank
1646613/AI025866
2773291/AW299629
2461358/AI942245
5678397/BM142449 y BM142311
5672209/BM052814 y BM053126
2137904/AI800207
511224/A088689 y M088826
2734357/AW449405
381379/AA052926 y AA052927
2337545/AI914219
2528186/AW337722
2028284/AI262965
3436048BF940636
2344677/AI695649
123940/R00867 y R01524/
240988/H90906 y H91018
240077/H82409 y H82667
Ninguno (secuencias de ARNm)/NM_018397.1 y AJ272267.1 y AK055402.1
Ninguno/AA772473.1 y BM682615.1 y BM713059.1 y BM716959.1 y BU738538.1 y AA324019.1 y AA302740.1 y C20981.1 y BF930030.1 y BQ303877.1 y BM769931.1 y AW900269.1 y F26419.1 y CB147231.1 y BE765491.1 AV656671.1
En una realización preferida, puede usarse cualquier secuencia, o parte única de la misma, de las secuencias CHDH de las Figuras 5 ó 6 en la práctica de la descripción.
5 En otro conjunto de realizaciones preferidas de la descripción, puede usarse cualquier secuencia, o parte única de la misma, de las secuencias QPRT del grupo I.M.A.G.E. Consortium NM_014298, así como los grupos UniGene Homo sapiens Hs. 126688. Asimismo, puede usarse cualquier secuencia que codifique todo o parte de la proteína codificada por cualquier secuencia de QPRT descrita en este documento. La secuencia consenso del grupo
I.M.A.G.E. Consortium es la siguiente, con la región codificada asignada (finalizando con un codón de terminación)
10 subrayada y precedida por la región no traducida y/o no codificada 5' y seguida de la región no traducida y/o no codificada 3':
SEC ID Nº 5 (secuencia consenso para QPRT, identificada como NM_014298 o NM_014298.2):
A continuación se enumeran los números de ID de clon I.M.A.G.E. Consortium y los correspondientes números de acceso a GenBank de secuencias identificadas como pertenecientes a los grupos I.M.A.G.E. Consortium y UniGene. También se incluyen secuencias que no están identificadas con un número de ID de clon pero aún así son de QPRT. Las secuencias incluyen aquellas de las secuencias de hebra "con sentido" y complementaria correspondientes a QPRT. Secuencias representativas de los siguientes números de acceso a GenBank se presentan en el Apéndice adjunto.
Número de ID de clon / número(s) de acceso a GenBank
2960170/BC005060 y BE299670 y BE299712 □
3506460/BE273102 y BC010033
3959973/BC018910 y BE902622
267692/N23182 y N32648
3843834/BE735342
4872092/BX283118 y BG769505
4845859/13G750434
4868806/BG766440
4594651/BG441877
4553618/BG337811
4554044/BG338063
Número de ID de clon / número(s) de acceso a GenBank
44731611/BG251163
14581127/BG396079
4136221/BF316915
4127089/BF313098
4508387/BG257831
4125826/BF312975
4411920/BG115486
4842556/BG748194
4395232/BF980859
4122808/BF304964
6305325/BQ643384
4107138/BF204965
4875437/BG753310/
6337913/BU501237
4136491/BF317004
4131857/13F307788
4302204/BF684687
5092370/B1195027
3353576/BE257622
4473768/BG252578
3912491/BE887856
160124003/BU186666
4873695/BG751315
4873694/BG751234
4080072/BF237708
6300166/BQ876922
896716/B1198351
4877853/BG770209
4896715/BI198375
5087154/BI252426 y BI252874
6085289/BU174626
5741237/BM558378
4995462/BI088884
6720160/CA488404
5764841/BM926410
6208509/BQ879962
4581968/BG396587
5554997/BM477735
Número de ID de clon / número(s) de acceso a GenBank
3451668/BE538581
5803440/BQ069150
6250974/BQ688755
6251079/BQ685759
5535758/BM468306
6146330/BU165540
1740729/AI191477
2729947/AW293885
6082577BU174653
2753118/AW275889
2437568/AI884372
2507497/AI961218
5207705/BI771713
2067750/AI383718
263894/N28522 y H99843
1148416/AA627205
138014/R63144
70610/T49073 y T49074
5531252/BM800219
3629874/BE409186
5001398/BI093643
4361336/BF971224
4451023/BG121013
3844815/BE730924
4361451/BF970190
4154033/BF346117
4915206/BG818225
4444686/BG118070
6086243/BU149745
4899066/BG829478
6086128/BU180123
4366207/BG108477
3140355/BE280221
5459527/BM012505
3627907/BE382922
5418599/BM016313
4862852/BG765156
14877780/BG769917
Número de ID de clon / número(s) de acceso a GenBank
3162024/BE262076
5182393/BI518189 y BI517759
5417445/BM015407
16015713/BU175170
417111/W87557 y W87461
4580196/BG395022
16271908/BQ648651
6298174BQ652789
6271910/BQ653475
6271630/BQ647246
798664/BM928534
6652195/BU860925
6299767/BQ651366
5225259/BI838658
4895399/BI198873
740128/A477534 y AA479051
617256/BU178924
4562784/BG326197
3957711/BE902093
6293406/BQ650920
Ninguno (secuencias de ARNm)/BT007231.1 y NM_014298.2 y AK090801.1 y D78177.1
Ninguno/CB156177.1 y BM711970.1 y BM675916.1 y BM675420.1 y BM714918.1 y AA337770.1 y AA305670.1 y AA305611.1 y BU622082.1 y AV705250.1 y AL528086.2 y AL531128.2 y AL543783.2 y AL548817.2 y AL554386.2 y AL563056.2 y AL563955.2 y AL570131.2 y AL573234.2 y BF956608.1 y AV648116.1 y AV645766.1 y BF742969.1 y AL577191.2 y CD050133.1 y CD049103.1 y BX417895.1 y CB529044.1 y CD250136.1 y AA054830.1 y BX508036.1 y BX454610.1
En otro conjunto de realizaciones preferidas de la invención, puede usarse cualquier secuencia, o parte única de la misma, de las secuencias HOXB13 del grupo I.M.A.G.E. Consortium NM_006361, así como los grupos UniGene Homo sapiens Hs.66731. Asimismo, puede usarse cualquier secuencia que codifique todo o parte de la proteína 5 codificada por cualquier secuencia de HOXB13 descrita en este documento. La secuencia consenso del grupo
I.M.A.G.E. Consortium es la siguiente, con la región codificada asignada (finalizando con un codón de terminación) subrayada y precedida por la región no traducida y/o no codificada 5' y seguida de la región no traducida y/o no codificada 3':
10 SEC ID Nº 6 (secuencia consenso para HOXB13, identificada como NM_006361 o NM_006361.2):
A continuación se enumeran los números de ID de clon I.M.A.G.E. Consortium y los correspondientes números de acceso a GenBank de secuencias identificadas como pertenecientes a los grupos I.M.A.G.E. Consortium y UniGene. También se incluyen secuencias que no están identificadas con un número de ID de clon pero aún así son de HOXB13. Las secuencias incluyen aquellas de las secuencias de hebra "con sentido" y complementaria correspondientes a HOXB13. La secuencia de cada número de acceso a GenBank se presenta en el Apéndice adjunto.
Número de ID de clon
Números de acceso a GenBank
4250486
BF676461, BC007092
5518335
BM462617
4874541
BG752489
4806039
BG778198
3272315
CB050884, CB050885
4356740
BF96519
6668163
BU930208
1218366
AA807966
2437746
AI884491
11187697
AA652388
3647557
BF446158
1207949
AA657924
1047774
AA644637
3649397
BF222357
971664
AA527613
996191
AA533227
813481
AA456069, AA455572, BX117624
Número de ID de clon
Números de acceso a GenBank
6256333
BQ673782
2408470
AI814453
2114743
AI417272
998548
AA535663
2116027
AI400493
3040843
AW779219
1101311
AA594847
1752062
AI150430
898712
M494387
1218874
AA662643
2460189
AI935940
986283
AA532530
1435135
AA857572
1871750
AI261980
3915135
BE888751
2069668
AI378797
667188
AA234220, AA236353
1101561
AA588193
1170268
AI821103, AI821851, AA635855
2095067
AI420753
4432770
BG180547
783296
AA468306, AA468232
3271646
CB050115, CB050116
1219276
AA661819
30570598
CF146837
30570517
CF146763
30568921
CF144902
3099071
CF141511
3096992
CF139563
3096870
CF139372
3096623
CF139319
3096798
CF139275
30572408
CF122893
2490082
AI972423
2251055
AI918975
2419308
AI826991
2249105
AI686312
2243362
AI655923
Número de ID de clon
Números de acceso a GenBank
30570697
CF146922
3255712
BF476369
3478356
BF057410
3287977
BE645544
3287746
BE645408
3621499
BE388501
30571128
CF147366
30570954
CF147143
Ninguno (secuencias de ARNm)
BT007410, BC007092, U57052, U81599
Ninguno
CB120119, CB125764, AU098628, CB126130, BI023924, BM767063, BM794275, BQ363211, BM932052, AA357646, AW609525, CB126919, AW609336, AW609244, BF855145, AU126914, CB126449, AW582404, BX641644
En una realización preferida, puede usarse cualquier secuencia, o parte única de la misma, de la siguiente secuencia de HOXB13, identificada por BC007092 o BC007092.1, en la práctica de la invención.
Las secuencias identificadas por SEC ID Nº se proporcionan usando representaciones convencionales de una hebra de ADN empezando a partir del extremos ligado a 5' fosfato hasta el extremo ligado a 3' hidroxilo. La asignación de 10 las regiones codificantes es generalmente por comparación con la secuencia o secuencias consenso y por lo tanto pueden contener inconsistencias relativas a otras secuencias asignadas al mismo grupo. Éstas no tienen efecto sobre la práctica de la invención porque la invención puede ponerse en práctica por el uso de segmentos más cortos (o combinaciones de los mismos) de secuencias únicas para cada una de las tres series descritas anteriormente y afectadas por inconsistencias. Como ejemplos no limitantes, puede usarse un segmento de la secuencia de ácido 15 nucleico IL17BR, CHDH, QPRT, o HOXB13 compuesta por una secuencia de la región no traducida 3' y/o una secuencia desde el extremo 3' de la región codificante como sonda para la detección de la expresión de IL17BR,
CHDH, QPRT, o HOXB13, respectivamente, sin verse afectada por la presencia de ninguna inconsistencia en las regiones codificantes debidas a diferencias entre las secuencias. Asimismo, el uso de un anticuerpo que reconozca específicamente una proteína, o fragmento de la misma, codificada por las secuencias IL17BR, CHDH, QPRT, o HOXB13 descritas en este documento, para detectar su expresión no se vería afectada por la presencia de ninguna inconsistencia en la representación de las regiones codificantes proporcionadas anteriormente.
Como apreciarán los especialistas en la técnica, algunas de las secuencias anteriores incluyen tramos 3' poli A (o poli T en la hebra complementaria) que no contribuyen a la singularidad de las secuencias descritas. La invención por tanto puede ponerse en práctica con secuencias que carecen de los tramos 3' poli A (o poli T). La singularidad de las secuencias descritas se refiere a las partes o las totalidades de las secuencias que se encuentran solamente en los ácidos nucleicos IL17BR, CHDH, QPRT, o HOXB13, incluyendo las secuencias únicas encontradas en la parte no traducida 3' de los genes. Secuencias únicas preferidas para la práctica de la descripción son aquellas que contribuyen a las secuencias consenso para cada una de las tres series de modo que las secuencias únicas serán útiles para detectar la expresión en una diversidad de individuos en lugar de ser específicas para un polimorfismo presente en algunos individuos. Como alternativa, pueden usarse secuencias únicas para un individuo o una subpoblación. Las secuencias únicas preferidas son preferiblemente de las longitudes de los polinucleótidos de la invención como se analiza en este documento.
Para determinar los niveles de expresión (aumentados o disminuidos) de las secuencias descritas anteriormente en la práctica de la presente invención, puede utilizarse cualquier método conocido en la técnica. En una realización preferida de la invención, se usa la expresión basada en la detección de ARN que hibrida con polinucleótidos que contienen las secuencias descritas anteriormente. Esto se realiza fácilmente por cualquier método de detección o amplificación+detección de ARN conocido o reconocido como equivalente en la técnica tal como, aunque sin limitación, PCR de transcripción inversa (opcionalmente PCR a tiempo real), los métodos descritos en la patente de Estados Unidos 6.794.141, los métodos descritos en la patente de Estados Unidos 6.291.170, y PCR cuantitativa. También pueden usarse métodos para identificar la estabilidad aumentada del ARN (que provoca la observación de una expresión aumentada) o estabilidad disminuida del ARN (que provoca una observación de expresión disminuida). Estos métodos incluyen la detección de secuencias que aumentan o disminuyen la estabilidad de los ARNm que contienen las secuencias IL17BR, CHDH, QPRT, o HOXB13 descritas en este documento. Estos métodos también incluyen la detección de degradación aumentada de ARNm.
En realizaciones particularmente preferidas de la descripción, se usan polinucleótidos que tienen secuencias presentes en las regiones no traducidas y/o no codificantes 3' de las secuencias descritas anteriormente para detectar la expresión o ausencia de expresión de las secuencias IL17BR, CHDH, QPRT, o HOXB13 en células mama en la práctica de la descripción. Dichos polinucleótidos pueden contener opcionalmente secuencias en las partes 3' de las regiones codificantes de las secuencias descritas anteriormente. Los polinucleótidos que contienen una combinación de secuencias de las regiones codificantes y no codificantes 3' preferiblemente tienen las secuencias dispuestas de forma contigua, sin secuencias o secuencias heterólogas intermedias.
Como alternativa, la descripción puede ponerse en práctica con polinucleótidos que tienen secuencias presentes en las regiones no traducidas y/o no codificantes 5' de las secuencias IL17BR, CHDH, QPRT, o HOXB13 en células de mama para detectar sus niveles de expresión. Dichos polinucleótidos pueden contener opcionalmente secuencias encontradas en las partes 5' de las regiones codificantes. Los polinucleótidos que contienen una combinación de secuencias de las regiones codificantes y no codificantes 5' preferiblemente tienen las secuencias dispuestas de forma contigua, son secuencia o secuencias intermedias. La descripción también puede ponerse en práctica con secuencias presentes en las regiones codificantes de IL17BR, CHDH, QPRT, o HOXB13.
Los polinucleótidos preferidos contienen secuencias de regiones no traducidas y/o no codificantes 3' ó 5' de al menos aproximadamente 16, al menos aproximadamente 18, al menos aproximadamente 20, al menos aproximadamente 22, al menos aproximadamente 24, al menos aproximadamente 26, al menos aproximadamente 28, al menos aproximadamente 30, al menos aproximadamente 32, al menos aproximadamente 34, al menos aproximadamente 36, al menos aproximadamente 38, al menos aproximadamente 40, al menos aproximadamente 42, al menos aproximadamente 44, o al menos aproximadamente 46 nucleótidos consecutivos. El término "aproximadamente" como se usa en la fresa previa se refiere a un aumento o disminución de 1 desde el valor numérico establecido. Son incluso más preferidos polinucleótidos que contienen secuencias de al menos o aproximadamente 50, al menos o aproximadamente 100, al menos o aproximadamente 150, al menos o aproximadamente 200, al menos o aproximadamente 250, al menos o aproximadamente 300, al menos o aproximadamente 350, o al menos o aproximadamente 400 nucleótidos consecutivos. El término "aproximadamente" como se usa en la frase precedente se refiere a un aumento o disminución del 10% a partir del valor numérico establecido.
Las secuencias del extremo 3' o 5' de las regiones codificantes descritas anteriormente encontradas en polinucleótidos de la invención son de las mismas longitudes que los descritos anteriormente, excepto que estarían limitadas de forma natural por la longitud de la región codificante. El extremo 3' de una región codificante puede incluir secuencias hasta la mitad 3' de la región codificante. A la inversa, el extremo 5' de una región codificante puede incluir secuencias hasta la mitad 5' de la región codificante. Por supuesto, las secuencias descritas anteriormente, o las regiones codificantes y polinucleótidos que contienen partes de las mismas, pueden usarse en sus totalidades.
Los polinucleótidos que combinan las secuencias de una región no traducida y/o no codificante 3' y el extremo 3' asociado de la región codificante son preferiblemente de al menos o aproximadamente 100, al menos o aproximadamente 150, al menos o aproximadamente 200, al menos o aproximadamente 250, al menos o aproximadamente 300, al menos o aproximadamente 350, o al menos o aproximadamente 400 nucleótidos consecutivos. Preferiblemente, los polinucleótidos usados son del extremo 3' del gen, tal como en aproximadamente 350, aproximadamente 300, aproximadamente 250, aproximadamente 200, aproximadamente 150, aproximadamente 100, o aproximadamente 50 nucleótidos desde la señal de poliadenilación o sitio de poliadenilación de un o gen o secuencia expresada. También pueden usarse polinucleótidos que contienen mutaciones relativas a las secuencias de los genes descritos también siempre que la presencia de las mutaciones aún permita la hibridación para producir una señala detectable.
En otra realización de la invención, pueden usarse polinucleótidos que contienen deleciones de nucleótidos desde el extremo 5' y/o 3' de las secuencias descritas anteriormente. Las deleciones son preferiblemente de 1-5, 5-10, 10-15, 15-20, 20-25, 25-30, 30-35, 35-40, 40-45, 45-50, 50-60, 60-70, 70-80, 80-90, 90-100, 100-125, 125-150, 150-175, ó 175-200 nucleótidos desde el extremo 5' y/o 3', aunque la extensión de las deleciones estaría limitada de forma natural por la longitud de las secuencias descritas y la necesidad de ser capaz de usar los polinucleótidos para la detección de los niveles de expresión.
Otros polinucleótidos de la invención desde el extremo 3' de las secuencias descritas anteriormente incluyen aquellos de cebadores y sondas opcionales para PCR cuantitativa. Preferiblemente, los cebadores y sondas son aquellos que amplifican una región de menos de aproximadamente 350, menos de aproximadamente 300, menos de aproximadamente 250, menos de aproximadamente 200, menos de aproximadamente 150, menos de aproximadamente 100, o menos de aproximadamente 50 nucleótidos desde la señal de poliadenilación o sitio de poliadenilación de un gen o secuencia expresada.
En otra realización de la invención, pueden usarse polinucleótidos que contienen partes de las secuencias descritas anteriormente que incluyen el extremo 3' en la práctica de la invención. Dichos polinucleótidos contendrían al menos o aproximadamente 50, al menos o aproximadamente 100, al menos o aproximadamente 150, al menos o aproximadamente 200, al menos o aproximadamente 250, al menos o aproximadamente 300, al menos o aproximadamente 350, o al menos o aproximadamente 400 nucleótidos consecutivos desde el extremo 3' de las secuencias descritas.
La descripción, por tanto, también incluye polinucleótidos usados para detectar la expresión de IL17BR, CHDH, QPRT, o HOXB13 en células de mama. Los polinucleótidos pueden comprender un polinucleótido más corto que consiste en secuencias halladas en las SEC ID Nº proporcionadas anteriormente en combinación con secuencias heterólogas no halladas de forma natural en combinación con las secuencias IL17BR, CHDH, QPRT, o HOXB13.
Como ejemplos no limitantes, puede usarse un polinucleótido que comprende una de las siguientes secuencias en la práctica de la invención.
SEC ID Nº 8: GCTCTCACTGGCAAATGACAGCTCTGTGCAAGGAGCACTCCCAAGTATAAAAATTATTAC
SEC ID Nº 9: TGCCTAATTTCACTCTCAGAGTGAGGCAGGTAACTGGGGCTCCACTGGGTCACTCTGAGA
SEC ID Nº 10: GATCGTTAGCCTCATATTTTCTATCTAGAGCTCTGTAGAGCACTTTAGAAACCGCTTTCA
La SEC ID Nº 8 es una parte de la secuencia AI240933 mientras que la SEC ID Nº 9 es una parte de la secuencia AJ272267 (ARNm de CHDH). Corresponden a las dos posiciones "60meras" indicadas en la Figura 3. La SEC ID Nº 10 es un polinucleótido capaz de hibridar con algunas secuencias de HOXB13 como se describe en este documento.
Por tanto, la descripción puede ponerse en práctica con un polinucleótido que consiste en la secuencia de las SEC ID Nº 8, 9 ó 10 en combinación con una o más secuencias heterólogas que no se hallan normalmente con las SEC ID Nº 8, 9 ó 10. Como alternativa, la descripción también puede ponerse en práctica con un polinucleótido que consiste en la secuencia de las SEC ID Nº 8, 9 ó 10 en combinación con una o más secuencias de origen natural que se hallan normalmente con las SEC ID Nº 8, 9 ó 10.
Pueden usarse polinucleótidos con secuencias que comprenden las SEC ID Nº 8 ó 9, de origen natural o sintético, para detectar ácidos nucleicos que se sobre-expresan en células de cáncer de mama que son sensibles, y aquellos que no se sobre-expresan en células de cáncer de mama que son no sensibles, al tratamiento con TAM u otro agente "antiestrógenos" contra el cáncer de mama. Pueden usarse polinucleótidos con secuencias que comprenden la SEC ID Nº 10, de origen natural o sintético, para detectar ácidos nucleicos que se infra-expresan en células de cáncer de mama que son sensibles, y aquellos que no se Infra-expresan en células de cáncer de mama que son no sensibles, al tratamiento con TAM u otro agente "antiestrógenos" contra el cáncer de mama.
Secuencias adicionales que pueden usarse en polinucleótidos como se ha descrito anteriormente para la SEC ID Nº 8 y 9 es la siguiente, que es complementaria a una parte de las secuencias de IL17BR descritas en este documento:
SEC ID Nº 11: TCCAATCGTTAGTTAATGCTACATTAGTT
Secuencias adicionales que pueden usarse en polinucleótidos como se ha descrito anteriormente para la SEC ID Nº 10 son la siguiente, que es complementaria a una parte de las secuencias de IL17BR descritas en este documento:
SEC ID Nº 12: CAATTCATGAAAGCGGTTTCTAAAG
Además, pueden usarse cebadores de secuencias definidas para amplificar por PCR partes de las secuencias de CHDH para determinar su nivel de expresión. Por ejemplo, pueden usarse cebadores que comprenden las siguientes secuencias para amplificar una parte de la secuencia AI240933.
Cebador directo (SEC ID Nº 13): TGAAGTGTTTTTGCCTGGATCA Cebador inverso (SEC ID Nº 14): CACCACTTTGTTATGAAGACCTTACAA
En algunas realizaciones de la descripción, lo cebadores pueden usarse en métodos de RT-PCR cuantitativa conocidos en la técnica, opcionalmente en presencia de una sonda marcada o detectable que se une a ácidos nucleicos bicatenarios (tal como Sybr Green™) o una sonda específica tal como una sonda "TaqMan". En una realización, dicha sonda puede comprender la secuencia AGTAAGAATGTCTTAAGAAGAGG (SEC ID Nº 15) para la detección de la expresión de AI240933.
Además, pueden usarse polinucleótidos que contienen otras secuencias, particularmente secuencias únicas, presentes en moléculas de ácido nucleico de origen natural que comprenden las SEC ID Nº 8-15 en la práctica de la descripción.
Otros polinucleótidos para su uso en la práctica de la descripción incluyen aquellos que tienen suficiente homología con aquellos descritos anteriormente para detectar la expresión por el uso de técnicas de hibridación. Dichos polinucleótidos preferiblemente tienen aproximadamente o el 95%, aproximadamente o el 96%, aproximadamente o el 97%, aproximadamente o el 98%, o aproximadamente o el 99% de identidad con secuencias de IL17BR, CHDH, QPRT, o HOXB13 descritas en este documento. La identidad se determina usando el algoritmo BLAST, como se ha descrito anteriormente. Los otros polinucleótidos para su uso en la práctica de la descripción también pueden describirse en base a la capacidad de hibridar con polinucleótidos de la invención en condiciones rigurosas de aproximadamente el 30% v/v a aproximadamente el 50% de formamida y de aproximadamente 0,01 M a aproximadamente 0,15 M de sal para hibridación y de aproximadamente 0,01 M a aproximadamente 0,15 M de sal para las condiciones de lavado a aproximadamente 55 a aproximadamente 65ºC o superior, o condiciones equivalentes a las mismas.
En una realización adicional de la descripción, se proporciona una población de moléculas de ácido nucleico monocatenario que comprenden una o ambas hebras de una secuencia humana de IL17BR, CHDH, QPRT, o HOXB13 como sonda, de modo que pueda hibridarse al menos una parte de dicha población con una o ambas hebras de una molécula de ácido nucleico amplificada cuantitativamente a partir del ARN de una célula de cáncer de mama. La población puede ser solamente la hebra antisentido de una secuencia humana de IL17BR, CHDH, QPRT,
o HOXB13 de modo que pueda hibridarse una hebra con sentido de una molécula a partir de, o amplificarse a partir de, una célula de cáncer de mama con una parte de dicha población. En el caso de IL17BR o CHDH, la población preferiblemente comprende una cantidad suficientemente en exceso de dicha una o ambas hebras de una secuencia humana de IL17BR o CHDH en comparación con la cantidad de moléculas de ácido nucleico expresadas (o amplificadas) que contienen una secuencia de IL17BR o CHDH complementaria a partir de una célula de mama normal. Esta condición de exceso permite que la cantidad aumentada de expresión de ácido nucleico en una célula de cáncer de mama sea fácilmente detectable como un aumento.
Como alternativa, la población de moléculas monocatenarias es igual a o en exceso de todo de una o ambas hebras de las moléculas de ácido nucleico amplificadas a partir de una célula de cáncer de mama de modo que la población es suficiente para hibridar con todo de una o ambas hebras. Las células preferidas son aquellas de una paciente con cáncer de mama que es ER+ o para la cual se contempla el tratamiento con tamoxifeno o uno o más agentes "antiestrógenos" diferentes contra el cáncer de mama. Las moléculas monocatenarias pueden, por supuesto, ser la forma desnaturalizada de cualquier secuencia de IL17BR, CHDH, QPRT, o HOXB13 que contenga la molécula de ácido nucleico bicatenaria o polinucleótido descrito en este documento.
La población también puede describirse como hibridada con una secuencia de IL17BR o CHDH que contiene moléculas de ácido nucleico a un nivel al menos dos veces tan elevado como por moléculas de ácido nucleico de una célula de mama. Como en las realizaciones descritas anteriormente, las moléculas de ácido nucleico `pueden ser aquellas amplificadas cuantitativamente a partir de una célula de cáncer de mama de modo que reflejen la cantidad de expresión en dicha célula.
La población preferiblemente se inmoviliza en un soporte sólido, opcionalmente en forma de una localización en una microserie. Una parte de la población se hibrida preferiblemente con moléculas de ácido nucleico amplificadas cuantitativamente a partir de una célula de mama no normal o anormal por amplificación de ARN. El ARN amplificado puede ser el obtenido de una célula de cáncer de mama, siempre que la amplificación usada fuera cuantitativa con respecto a secuencias que contienen IL17BR, CHDH, QPRT, o HOXB13.
En otra realización de la descripción, puede usarse expresión basada en la detección del estado de ADN. La detección del ADN de QPRT o HOXB13 metilado, delecionado o inactivado de otro modo, puede usarse como indicación de expresión disminuida hallada en células de mama no normales. Esto puede realizarse fácilmente por métodos basados en PCR conocidos en la técnica. El estado de las regiones promotoras de QPRT o HOXB13 también puede ensayarse como una indicación de expresión disminuida de secuencias de QPRT o HOXB13. Un ejemplo no limitante es el estado de metilación de secuencias halladas en la región promotora.
A la inversa, puede usarse la detección del ADN de una secuencia amplificada como indicación de expresión aumentada hallada en células de mama no normales. Esto puede realizarse fácilmente por métodos basados en PCR, de hibridación fluorescente in situ (FISH) e hibridación de cromosomas in situ (CISH) conocidos en la técnica.
Una realización preferida que usa un ensayo basado en ácido nucleico para determinar la expresión es por inmovilización de una o más de las secuencias identificadas en este documento en un soporte sólido incluyendo, aunque sin limitación, un sustrato sólido como una serie o perlas o tecnología basada en perlas como se sabe en la técnica. Como alternativa, también pueden usarse ensayos de expresión basados en solución conocidos en la técnica. La secuencia o secuencias inmovilizadas pueden estar en forma de polinucleótidos como se describe en este documento, de modo que el polinucleótidos sería capaz de hibridar con un ADN o ARN correspondiente a la secuencia o secuencias.
El polinucleótido o polinucleótidos inmovilizados pueden usarse para determinar el estado de muestras de ácido nucleico preparadas a partir de una célula o células de cáncer de mama de muestra, opcionalmente como parte de un método para detectar el estado ER en dicha célula o células. Sin limitar la descripción, dicha célula puede ser de un paciente sospechoso de estar afectado con, o en riesgo de desarrollar, cáncer de mama. El polinucléotido o polinucleótidos inmovilizados tiene que se solamente suficientes para hibridar específicamente con las moléculas de ácido nucleico correspondientes obtenidas de la muestra (y para la exclusión de hibridación detectable o significativa con otras moléculas de ácido nucleico).
En otra realización de la descripción, puede usarse una proporción de los niveles de expresión de dos de los genes descritos para predecir la respuesta al tratamiento con TAM u otro SERM. Preferiblemente, la proporción es la de dos genes con patrones opuestos de expresión, tal como un gen infra-expresado a un gen sobre-expresado, en correlación con el mismo fenotipo. Ejemplos no limitantes incluyen la proporción de HOXB13 sobre IL17BR o la proporción de QPRT sobre CHDH. Este aspecto de la invención se basa en parte en la observación de que dicha proporción tiene una correlación más fuerte con el resultado del tratamiento con TAM que el nivel de expresión de cualquier gen solo. Por ejemplo, la proporción de HOXB13 sobre IL17BR tiene una precisión de clasificación observada del 77%.
Como ejemplo no limitante, pueden usarse los valores Ct de detección basada en Q-PCR de los niveles de expresión génica para obtener una proporción para predecir la respuesta al tratamiento con uno o más agentes "antiestrógenos" contra el cáncer de mama.
Realizaciones adicionales de la invención
En realizaciones en las que tiene que analizarse solamente uno o unos pocos genes, el ácido nucleico obtenido de la célula o células de cáncer de mama de muestra puede amplificarse preferentemente por el uso de cebadores apropiados de modo que se amplifiquen solamente los genes a analizar para reducir las señales de fondo contaminantes de otros genes expresados en la célula de mama. Como alternativa, y cuando tienen que analizarse múltiples genes o cuando se usan muy pocas células (o una célula), el ácido nucleico de la muestra puede amplificarse de forma global antes de la hibridación de los polinucleótidos inmovilizados. Por supuesto, puede marcarse directamente y usarse el ARN o el equivalente de ADNc del mismo, sin amplificación, por métodos conocidos en la técnica.
También puede usarse la expresión de secuencias basada en la detección de una presencia, aumento o disminución en los niveles de proteínas o actividad. La detección puede realizarse por cualquier procedimiento basado en inmunohistoquímica (IHC), basado en fluido corporal (en el que un polipéptido IL17BR, CHDH, QPRT o HOXB13, o fragmento del mismo, se encuentra en un fluido corporal tal como, pero no se limita, a sangre), basado en anticuerpos (incluyendo autoanticuerpos contra la proteína, si están presente), basado en células exfoliadas (del cáncer), basado en espectroscopía de masas y basado en imágenes (incluyendo el uso de ligando marcado, cuando esté disponible) conocido en la técnica y reconocido según convenga para la detección de la proteína. Los procedimientos basados en anticuerpos y en imágenes son adicionalmente útiles para la localización de tumores después de la determinación de cáncer usando células obtenidas por un procedimiento no invasivo (tal como lavado ductal o aspiración con aguja fina), en el que la fuente de las células cancerosas es desconocida. Un anticuerpo marcado o ligando puede usarse para localizar el (los) carcinoma(s) dentro de una paciente.
Anticuerpos para su uso en tales procedimientos de detección incluyen anticuerpos policlonales, opcionalmente aislados de fuentes que se producen naturalmente cuando están disponibles, y anticuerpos monoclonales, que incluyen aquellos preparados por el uso de polipéptidos IL17BR, CHDH, QPRT o HOXB13 (o fragmentos de los mismos) como antígenos. Tales anticuerpos, además de fragmentos de los mismos (que incluyen, pero no se limitan a, fragmentos Fab) sirven para detectar o diagnosticar células de mama no normales o cancerosas en virtud de su capacidad para unirse específicamente a polipéptidos IL17BR, CHDH, QPRT o HOXB13 para la exclusión de otros polipéptidos que producen una señal detectable. También pueden usarse anticuerpos recombinantes, sintéticos e híbridos con la misma capacidad en la práctica de la divulgación. Los anticuerpos pueden generarse fácilmente por inmunización con un polipéptido IL17BR, CHDH, QPRT o HOXB13 (o fragmento del mismo), y también pueden usarse sueros policlonales en la práctica de la divulgación.
Los procedimientos de detección basados en anticuerpos son muy conocidos en la técnica e incluyen ensayo tipo sándwich y de ELISA, además de ensayos basados en transferencia Western y citometría de flujo como ejemplos no limitantes. Muestras para análisis en tales procedimientos incluyen cualquiera que contenga polipéptidos IL17BR, CHDH, QPRT o HOXB13 o fragmentos de los mismos. Ejemplos no limitantes incluyen aquellos que contienen células de mama y contenidos de células, además de fluidos corporales (incluyendo sangre, suero, saliva, líquido linfático, además de secreciones de la mucosa y otras celulares como ejemplos no limitantes) que contienen los polipéptidos.
Las realizaciones de ensayo anteriores pueden usarse de varias formas diferentes para identificar o detectar la respuesta al tratamiento con TAM u otro agente “antiestrógeno” contra cáncer de mama basándose en la expresión génica en una muestra de células de cáncer de mama de una paciente. En algunos casos, esto reflejaría un cribado secundario para la paciente, que puede ya haberse sometido a una mamografía o examen físico como cribado primario. Si el cribado primario es positivo, la posterior biopsia con aguja, lavado ductal, aspiración con aguja fina u otro procedimiento mínimamente invasivo análogo puede proporcionar la muestra para su uso en las realizaciones de ensayo antes, simultáneamente con o después de ensayar el estado de RE. La presente invención es particularmente útil en combinación con protocolos no invasivos tales como lavado ductal o aspiración con aguja fina, para preparar una muestra de células de mama.
La presente invención proporciona un conjunto más objetivo de criterios en forma de perfiles de expresión génica de un conjunto discreto de genes para discriminar (o delinear) un conjunto discreto de genes, para discriminar (o delinear) entre desenlaces de cáncer de mama. En realizaciones particularmente preferidas de la invención, los ensayos se usan para discriminar entre desenlaces buenos y malos después del tratamiento con tamoxifeno u otro agente “antiestrógeno” contra cáncer de mama. Pueden realizarse comparaciones que discriminan entre desenlaces después de aproximadamente 10, aproximadamente 20, aproximadamente 30, aproximadamente 40, aproximadamente 50, aproximadamente 60, aproximadamente 70, aproximadamente 80, aproximadamente 90, aproximadamente 100 o aproximadamente 150 meses.
Aunque los desenlaces de supervivencia buenos y malos pueden definirse relativamente en comparación entre sí, un desenlace “bueno” puede visualizarse como una tasa de supervivencia mejor del 50% después de aproximadamente 60 meses de la intervención posquirúrgica para extirpar tumor(es) de cáncer de mama. Un
desenlace “bueno” también puede ser una tasa de supervivencia mejor de aproximadamente el 60%,
aproximadamente el 70%, aproximadamente el 80% o aproximadamente el 90% después de aproximadamente 60
meses de la intervención posquirúrgica. Un desenlace “malo” puede visualizarse como una tasa de supervivencia
del 50% o menos después de aproximadamente 60 meses de la intervención posquirúrgica para extirpar
tumor(es) de cáncer de mama. Un desenlace “malo” también puede ser una tasa de supervivencia de
aproximadamente el 70% o menos después de aproximadamente 40 meses, o aproximadamente una tasa de supervivencia de aproximadamente el 80% o menos después de aproximadamente 20 meses de la intervención posquirúrgica.
En otra realización de la divulgación basada en la expresión de algunos genes, el aislamiento y el análisis de una muestra de células de cáncer de mama puede realizarse del siguiente modo:
(1)
Se realiza lavado ductal u otro procedimiento no invasivo en una paciente para obtener una muestra.
(2)
La muestra se prepara y se recubre sobre un portaobjetos de microscopio. Obsérvese que el lavado ductal produce agrupaciones de células que se examinan citológicamente como se ha establecido anteriormente.
(3)
El anatomopatólogo o software de análisis de imágenes barre la muestra para la presencia de células atípicas.
(4)
Si se observan células atípicas, aquellas células se recogen (por ejemplo, por microdisección tal como LCM).
(5)
Se extrae ARN de las células recogidas.
(6)
Se ensaya el ARN, directamente o después de la conversión en ADNc o amplificación del mismo, para la expresión de secuencias de IL17BR, CHDH, QPRT y/o HOXB13.
Con el uso de la presente invención, los médicos expertos pueden prescribir o detener el tratamiento con TAM u otro agente “antiestrógeno” contra cáncer de mama basándose en el pronóstico determinado por la práctica de la presente invención.
La discusión anterior también es aplicable cuando se detecta una lesión palpable, seguido de aspiración con aguja fina o biopsia con aguja de células de la mama. Las células se siembran en placa y son revisadas por una anatomopatólogo o sistema de obtención de imágenes automatizado que selecciona células para el análisis como se ha descrito anteriormente.
Sin embargo, la presente invención también puede usarse con biopsias de tejido sólido, que incluyen aquellas guardadas como un espécimen FFPE. Por ejemplo, una biopsia sólida puede recogerse y prepararse para visualización, seguido de determinación de la expresión de uno o más genes identificados en el presente documento para determinar el desenlace del cáncer de mama. Como otro ejemplo no limitante, una biopsia sólida puede recogerse y prepararse para visualización, seguido de determinación de la expresión de IL17BR, CHDH, QPRT y/o HOXB13. Un medio preferido es mediante el uso de hibridación in situ con sonda(s) que identifican polinucleótidos o proteínas para ensayar la expresión de dicho(s) gen(es).
En un procedimiento alternativo, la biopsia de tejido sólido puede usarse para extraer moléculas, seguido de análisis de la expresión de uno o más genes. Esto proporciona la posibilidad de excluir la necesidad de visualización y recogida de sólo células cancerosas o células que se sospecha que son cancerosas. Este procedimiento puede por supuesto modificarse de forma que sólo se recojan células que han sido seleccionadas positivamente y se usan para extraer moléculas para el análisis. Esto requeriría la visualización y selección como un requisito previo al análisis de la expresión génica. En el caso de una muestra FFPE, las células pueden obtenerse seguido de extracción, amplificación y detección de ARN como se describe en el presente documento.
En una alternativa a lo anterior, la(s) secuencia(s) identificada(s) en el presente documento puede(n) usarse como parte de una PCR simple o ensayo basado en matriz simplemente para determinar la respuesta al tratamiento con TAM u otro agente “antiestrógeno” contra cáncer de mama mediante el uso de una muestra de un procedimiento de muestreo no invasivo o mínimamente invasivo. La detección de la expresión de secuencias de muestras puede ser mediante el uso de una única micromatriz capaz de ensayar la expresión de las secuencias desveladas, además de otras secuencias, que incluyen secuencias conocidas por no variar en los niveles de expresión entre células de mama normales y no normales, por comodidad y precisión mejorada.
Otros usos de la presente invención incluyen proporcionar la capacidad para identificar muestras de células de
cáncer de mama que tienen diferentes respuestas a tratamiento con TAM u otro agente “antiestrógeno” contra
cáncer de mama para investigación o estudio adicional. Esto proporciona un avance basado en criterios genéticos/moleculares objetivos.
En otra realización más de la divulgación basada en la expresión de múltiples genes en un patrón o perfil de expresión, el aislamiento y análisis de una muestra de células de cáncer de mama puede realizarse del siguiente modo:
(1)
Se realiza lavado ductal u otro procedimiento no invasivo en un paciente para obtener una muestra.
(2)
La muestra se prepara y se recubre sobre un portaobjetos de microscopio. Obsérvese que el lavado ductal produce agrupaciones de células que se examinan citológicamente como se ha establecido anteriormente.
(3)
El anatomopatólogo o software de análisis de imágenes barre la muestra para la presencia de células no normales y/o de cáncer de mama atípicas.
(4)
Si se observan células atípicas, aquellas células se recogen (por ejemplo, por microdisección tal como LCM).
(5)
Se extrae ARN de las células recogidas.
(6)
El ARN se purifica, se amplifica y se marca.
(7)
El ácido nucleico marcado se pone en contacto con una micromatriz que contiene polinucleótidos complementarios a todo o parte de uno o más de los genes identificados en el presente documento como que guardan relación con discriminaciones entre desenlaces de cáncer de mama bajo condiciones de hibridación adecuadas, luego se procesan y se barren para obtener un patrón de intensidades de cada sitio (con respecto a un control para la expresión génica general en células) que determinan el nivel de expresión del (de los) gen(es) en las células.
(8)
El patrón de intensidades se analiza por comparación con los patrones de expresión de los genes en muestras de células de cáncer de mama conocidas que guardan relación con desenlaces (con respecto al mismo control).
Un ejemplo específico del procedimiento anterior sería realizar lavado ductal tras un cribado primario, observar y recoger células no normales y/o atípicas para el análisis. La comparación con patrones de expresión conocidos tales como aquellos hechos posibles por un modelo generado por un algoritmo (tal como, pero no se limitan a, análisis tipo vecino más próximo, SVM o redes neurales) con datos de expresión génica de referencia para los diferentes desenlaces de supervivencia de cáncer de mama identifica las células que guardan relación con sujetos con desenlaces buenos o malos. Otro ejemplo sería tomar un tumor de mama extirpado de un sujeto después de intervención quirúrgica, opcionalmente convirtiendo todo o parte de él en una muestra FFPE antes del posterior aislamiento y preparación de células de cáncer de mama del tumor para la determinación/identificación de células atípicas, no normales o cancerosas, y aislamiento de dichas células seguido de las etapas 5 a 8 anteriores.
Alternativamente, la muestra puede permitir la recogida de células tanto normales, además de cancerosas, para análisis. Los patrones de expresión génica para cada una de estas dos muestras se compararán entre sí, además del modelo, y dichas comparaciones normales frente a individuales basadas en el conjunto de datos de referencia. Este enfoque puede ser significativamente más poderoso que el que las células cancerosas sólo se aproximan debido a que utiliza significativamente más información de las células normales y las diferencias entre células normales y cancerosas (en tanto los conjuntos de datos de la muestra como de referencia) para determinar el desenlace de cáncer de mama de la paciente basándose en expresión génica en las células cancerosas de la muestra.
Los genes identificados en el presente documento también pueden usarse para generar un modelo que puede predecir los desenlaces de supervivencia y reaparición de cáncer de mama de una muestra de células de mama RE+ basándose en la expresión de los genes identificados en la muestra. Un modelo tal puede generarse por cualquiera de los algoritmos descritos en el presente documento o de otro modo conocidos en la técnica, además de aquellos reconocidos como equivalentes en la materia usando gen(es) (y subconjuntos de los mismos) desvelados en el presente documento para la identificación de desenlaces de cáncer de mama. El modelo proporciona un medio para comparar los perfiles de expresión de gen(es) del subconjunto de la muestra con los perfiles de datos de referencia usados para construir el modelo. El modelo puede comparar el perfil de la muestra con cada uno de los perfiles de referencia o con un modelo que define delineaciones hechas basándose en los perfiles de referencia. Adicionalmente puede usarse valores relativos del perfil de la muestra en comparación con el modelo o perfiles de referencia.
En una realización preferida de la invención, muestras de células de mama identificadas como normales y cancerosas del mismo sujeto pueden analizarse, opcionalmente mediante el uso de una única micromatriz, para sus perfiles de expresión de los genes usados para generar el modelo. Esto proporciona un medio ventajoso de identificar desenlaces de supervivencia y reaparición basados en diferencias relativas de los perfiles de expresión de la muestra normal. Esas diferencias pueden luego usarse en la comparación con diferencias entre datos de referencia normales y cancerosos individuales que también se usaron para generar el modelo.
Artículos de fabricación
Los materiales y procedimientos de la presente invención son idealmente aptos para la preparación de kits producidos según procedimientos muy conocidos. Los presentes inventores describen kits que comprenden agentes (como los polinucleótidos y/o anticuerpos descritos en el presente documento como ejemplos no limitantes) para la detección de la expresión de las secuencias desveladas. Se proporcionan tales kits, que opcionalmente comprenden el agente con una descripción identificadora o etiqueta o instrucciones referentes a su uso en los procedimientos de la presente invención. Un kit tal puede comprender recipientes, cada uno con uno o más de los diversos reactivos (normalmente en forma concentrada) utilizados en los procedimientos que incluyen, por ejemplo, micromatrices prefabricadas, tampones, los trifosfatos de nucleótidos apropiados (por ejemplo, dATP, dCTP, dGTP y dTTP; o rATP, rCTP, rGTP y UTP), transcriptasa inversa, ADN polimerasa, ARN polimerasa, y uno o más complejos de cebadores de la presente invención (por ejemplo, poli(T) de longitud apropiada o cebadores al azar ligados a un promotor reactivo con la ARN polimerasa). Normalmente también se incluirá un conjunto de instrucciones.
Los procedimientos proporcionados por la presente invención también pueden automatizarse por completo o en parte. Todos los aspectos de la presente invención también pueden ponerse en práctica de forma que consistan esencialmente en un subconjunto de los genes desvelados para la exclusión de material irrelevante para la identificación de desenlaces de supervivencia de cáncer de mama mediante una muestra que contiene células.
Habiendo descrito ahora generalmente la invención, la misma se entenderá más fácilmente mediante referencia a los siguientes ejemplos que se proporcionan a modo de ilustración, y que no pretenden ser limitantes de la presente invención, a menos que se especifique.
Ejemplos
Ejemplo 1
Procedimientos generales
Criterios de selección de pacientes y tumores y diseño del estudio
Los criterios de inclusión de pacientes para este estudio fueron: mujeres diagnosticadas en el Hospital general de Massachusetts (MGH) entre 1987 y 2000 con cáncer de mama positivo para RE, tratamiento con cirugía de mama convencional (mastectomía radical modificada o lumpectomía) y radiación, seguido de cinco años del adyuvante sistémico tamoxifeno; ninguna paciente recibió quimioterapia antes de la reaparición. Los datos clínicos y de seguimiento se derivaron del registro de tumores del MGH. No faltaron datos del registro y todos los registros médicos disponibles se registraron como un segundo escalón de la confirmación de datos.
Todos los especímenes de tumor recogidos en el momento del diagnóstico inicial se obtuvieron de repositorios de tejidos congelados e incorporados en parafina fijada a formalina (FFPE) en el Hospital general de Massachusetts. Las muestras tumorales con más del 20% de células tumorales se seleccionaron con una mediana superior al 75% para todas las muestras. Cada muestra se evaluó para las siguientes características: tipo de tumor (ductal frente a lobular), tamaño del tumor y grado histológico combinado de Nottingham. La expresión del receptor de estrógeno y progesterona se determinó por análisis de unión a hormona bioquímicos y/o por tinción inmunohistoquímica como se ha descrito (Long, A.A. y col. “High-specificity in-situ hybridization. Methods and application.” Diagn Mol Pathol 1, 4557 (1992)); la positividad del receptor se definió como superior a 3 fmol/mg de tejido tumoral (Long y col.) y superior al 1% de tinción nuclear para los ensayos bioquímicos e inmunohistoquímicos, respectivamente.
El diseño del estudio es del siguiente modo: se seleccionó un conjunto de entrenamiento de 60 especímenes de cáncer de mama congelados para identificar firmas de expresión génica predictivas de desenlace o respuesta, en el entorno de terapia de tamoxifeno adyuvante. Los tumores de pacientes que respondieron al tratamiento se hicieron corresponder con los de pacientes que no respondieron al tratamiento con respecto a estadificación de TNM y grado del tumor. La expresión génica diferencial identificada en el conjunto de entrenamiento se validó en un grupo independiente de 20 tumores de mama invasivos con muestras de tejido incorporado en parafina fijado a formalina (FFPE).
LCM, aislamiento y amplificación de ARN
Con cada muestra tumoral congelada dentro de la cohorte de 60 casos, el ARN se aisló de tanto una sección de tejido completo de 8 m de espesor como de una población altamente enriquecida de 4.000-5.000 células epiteliales malignas adquiridas por una microdisección de captura láser usando un sistema de LCM PixCell Ile (Arcturus, Mountain View, CA). De cada muestra tumoral dentro del conjunto de prueba de 20 casos, el ARN se aisló de cuatro secciones de tejido FFPE de 8 m de espesor. El ARN aislado se sometió a una ronda de transcripción in vitro con
T7 polimerasa usando el kit RiboAmp™ (muestras congeladas) u otro sistema para muestras FFPE según instrucciones del fabricante (Arcturus Bioscience, Inc., Mountain View, CA para RiboAmp™). Se generó ARNc
marcado por una segunda ronda de transcripción in vitro de ARN basada en T7 en presencia de 5-[3aminoalil]uridin-5'-trifosfato (Sigma-Aldrich, St. Louis, MO). El ARN de referencia humano universal (Stratagene, San Diego, CA) se amplificó del mismo modo. El ARNa purificado se conjugó después con colorante Cy5 (muestras experimentales) o Cy3 (muestra de referencia) (Amersham Biosciences).
Análisis de micromatrices
Se fabricó una micromatriz de oligonucleótidos (60-meros) de 22.000 genes diseñada por encargo usando tecnología de síntesis in situ de chorro de tinta (Agilent Technologies, Palo Alto, CA). Se co-hibridaron ARN de muestra marcado con Cy5 y ARN de referencia marcado con Cy3 a 65ºC, 1X tampón de hibridación (Agilent Technologies). Los portaobjetos se lavaron a 37ºC con 0,1X SSC/ 0,005% de Triton X-102. El análisis de imágenes se realizó usando el software de análisis de imágenes Agilent. Las relaciones brutas de Cy5/Cy3 se normalizaron usando regresión no lineal dependiente de la intensidad.
Una matriz de datos matriz que consistía en relaciones de Cy5/Cy3 normalizadas de todas las muestras se centró en la mediana para cada gen. Se calculó la varianza de cada gen con respecto a todas las muestras y se seleccionó el primer 25% de genes de alta varianza (5.475) para análisis adicionales. Las pruebas de identificación y permutación para la significancia de la expresión génica diferencial se realizaron usando BRB ArrayTools, desarrollado por Dr. Richard Simon y Amy Peng (véase el sitio http en linus.nci.nih.gov/BRB-Array-Tools.html). El análisis de agrupaciones jerárquicas se realizó con el software GeneMaths (Applied-Maths, Bélgica) usando correlación de cosenos y enlace completo. Todos los otros procedimientos estadísticos (prueba de la t de dos muestras, análisis de la característica de operación del receptor, regresión logística multivariable y análisis de supervivencia) se realizaron en el entorno estadístico R de fuente abierta (véase el sitio http en www.r-project.org). La prueba estadística de
significancia de curvas ROC fue mediante el procedimiento de DeLong (“Comparing the areas under two or more correlated receiver operating characteristic curves: a nonparametric approach”. Biometrics 44, 837-45 (1988)). La
supervivencia sin enfermedad se calculó a partir de la fecha del diagnóstico. Los acontecimientos se puntuaron como la primera metástasis distante, y se censuraron los pacientes que siguieron sin enfermedad en el último seguimiento. Las curvas de supervivencia se calcularon por las estimaciones de Kaplan-Meier y se compararon por pruebas del orden logarítmico.
5 Análisis por PCR cuantitativa en tiempo real
La PCR en tiempo real se realizó en muestras de entrenamiento de 59 de los 60 casos (se excluyó un caso debido a materiales insuficientes) y las muestras de validación de 20 casos. Brevemente, 2 g de ARN amplificado se
10 convirtieron en ADNc bicatenario. Para cada caso se usaron 12 ng de ADNc por triplicado para PCR en tiempo real con un ABI 7900HT (Applied Biosystems) como se ha descrito (Gelmini, S. y col. “Quantitative polymerase chain reaction-based homogeneous assay with fluorogenic probes to measure c-erbB-2 oncogene amplification”. Clin Chem 43, 752-8 (1997)). Las secuencias de los pares de cebadores de PCR y la sonda MGB fluorogénica (5' a 3'), respectivamente, que se usaron para cada gen son del siguiente modo:
15 HoxB13 TTCATCCTGACAGTGGCAATAATC, CTAGATAGAAAATATGAGGCTAACGATCAT, VIC- CGATAACCAGTACTAGCTG;
20 IL17BR GCATTAACTAACGATTGGAAACTACATT, GGAAGATGCTTTATTGTTGCATTATC, VIC-ACAACTTCAAAGCTGTTTTA.
25 Los niveles de expresión relativa de HOXB13 en muestras normales, de DCIS y de IDC se calcularon del siguiente modo. Primero, todos los valores de CT se ajustan restando la mayor CT (40) de entre todas las muestras, luego la expresión relativa = 1 / 2^CT.
Hibridación in situ
30 Se prepararon sondas de ARN marcadas con Dig usando el kit de marcado de ADN con DIG (SP6/T7) de Roche Applied Science siguiendo el protocolo proporcionado con el kit. La hibridación in situ se realizó en secciones de tejido congeladas como se ha descrito (Long y col.).
35 Tabla 1. Pacientes y características de tumor del conjunto de entrenamiento.
ID de muestra Tipo de tumor Tamaño Grado Nodos RE RP Edad SSE Estado
1389 D 1,7 2 0/1 PosPos 80 94 0 648 D 1,1 2 0/15 PosND 62 160 0 289 D 3 2 0/15PosND 75 63 1 749 D 1,8 2 2/9 PosPos 61 137 0 420 D/L 2 3 ND PosPos 72 58 633 D 2,7 3 0/11 PosND 61 20 662 D 1 3 6/11 PosPos 79 27 849 D 2 1 0/26 PosNeg 75 23 356 D 1 2 2/20PosND 58 24
1304 D 2 3 0/14 PosPos 57 20 1419 D 2,5 2 1/8 PosPos 59 86 0 1093 D 1 3 1/14 PosPos 66 85 0 1047 D/L 2,6 2 0/18 Pos Neg 70 128 0 1037 D/L 1,5 2 0/4 Pos Pos 85 83 0
319 D 4 2 1/13PosND 67 44 1 25 D 3,5 2 0/9 NegPos62 75 1 180 D 1,6 2 2/19 PosPos 69 169 0 687 D 3,5 3 3/16 PosND 73 142 0 856 D 1,6 2 0/16 PosPos 73 88 0 1045 D 2,5 3 1/12 Pos Neg 73 121 0 1205 D 2,7 2 1/19 PosPos 71 88 0 1437 D 1,7 2 2/22 PosPos 67 89 0 1507 D 3,7 3 0/40 PosPos 70 70 0
469 D 1 1 0/19PosND 66 161 0 829 D 1,2 2 0/9 PosND 69 136 0 868 D 3 3 0/13 PosPos 65 130 0
1206 D 4,1 3 0/15 Pos Neg 84 56 843 D 3,4 2 11/20 Pos Neg 76 122 342 D 3 2 9/21 PosND 62 102 1218 D 4,5 1 3/16 Pos Pos 62 10
547 D/L 1,5 2 ND Pos ND 74 129 1125 D 2,6 2 0/18 Pos Pos 54 123 0 1368 D 2,6 2 ND PosPos 82 63 0
605 D 2,2 2 6/18 PosND 70 110 0 59 L 3 2 33/38PosND 70 21 68 D 3 2 0/17PosND 53 38
317 D 1,2 3 1/10 PosPos 71 5 374 D 1 3 0/15 PosNeg 57 47 823 D 2 2 0/6 PosPos51 69 280 D 2,2 3 0/12 PosND 66 44 651 D 4,7 3 10/13 Pos ND 48 137 763 D 1,8 2 0/14 PosPos 63 118 0
1085 D 4,7 2 0/8 Pos Pos 48 101
1363 D 2,1 2 0/15 Pos Pos 56 114 0 295 D 3,5 2 3/21 Pos Pos 52 118 871 D 4 3 0/16PosNeg61 6
1343 D 2,5 3 ND PosPos 79 21 140 L >2,0 2 18/28 Pos ND 63 43 260 D/L 0,9 2 1/13 Pos ND 73 42 297 D 0,8 2 1/16 PosPos 66 169 0
1260 D 3,5 2 0/14 PosPos 58 79 0 1405 D 1 3 ND PosPos81 95 0 518 L 5,5 2 3/20 PosND 68 156 0 607 D 1,2 2 5/14 PosPos 76 114 0 638 D 2 2 1/24 PosPos 67 148 0 655 D 2 3 ND PosPos73 143 0 772 D 2,5 2 0/18 PosPos 68 69 1 878 D/L 1,6 2 0/9 Pos Neg 76 138 0 1279 D 2 2 0/12 PosPos 68 102 0 1370 D 2 2 ND PosPos73 61 0
Abreviaturas: D, ductal; L, lobular; D/L, características de ductal y lobular; pos, positivo; neg, negativo; ND, no determinado; RE, receptor de estrógeno; RP, receptor de progesterona; SSE, supervivencia sin enfermedad (número de meses); estado = 1, recurrido; restado = 0, sin enfermedad.
Ejemplo 2
Identificación de genes diferencialmente expresados
5 El perfilado de la expresión génica se realizó usando una micromatriz de oligonucleótidos de 22.000 genes como se ha descrito anteriormente. En el análisis inicial se usó ARN aislado de secciones de tejido de tumor congeladas tomadas de las biopsias primarias archivadas. El conjunto de datos de la expresión resultante se filtró primero basándose en la varianza global de cada gen con los primeros 5.475 genes de alta varianza (centil 75)
10 seleccionados para análisis adicional. Usando este conjunto de datos reducido se realizó la prueba de la t en cada gen comparando los pacientes que respondieron y los pacientes que no respondieron a tamoxifeno, conduciendo a la identificación de 19 genes diferencialmente expresados en el corte de valor p de 0,001 (Tabla 2). Se estimó que la probabilidad de seleccionar muchos genes o genes más diferencialmente expresados por casualidad era 0,04 permutando al azar la clase de paciente con respecto al desenlace del tratamiento y repitiendo el procedimiento de
15 la prueba de la t 2.000 veces. Por tanto, este análisis demostró la existencia de diferencias estadísticamente significativas en la expresión génica entre los cánceres de mama primarios de pacientes que respondieron y pacientes que no respondieron a tamoxifeno.
Tabla 2. Firma de 19 genes identificados por la prueba de la t en el conjunto de datos de secciones
Valor p paramétrico
Media en pacientes que responden al tratamiento Media en pacientes que no responden al tratamiento Veces de diferencia de las medias Acc de GB Descripción
1
1,96E-05 0,759 1,317 0,576 AW006861 SCYA4 | citocina A4 inducible pequeña
2
2,43E-05 1,31 0,704 1,861 AI240933 EST
3
8,08E-05 0,768 1,424 0,539 X59770 IL1R2 | receptor de interleucina 1, tipo II
4
9,57E-05 0,883 1,425 0,62 AB000520 Proteína adaptadora APS con homología con pleckstrina y dominios de homología 2 con src
5
9,91 E-05 1,704 0,659 2,586 AF208111 IL17BR | receptor de interleucina 17B
6
0,0001833 0,831 1,33 0,625 AI820604 EST
7
0,0001935 0,853 1,459 0,585 AI087057 DOK2 | proteína de acoplamiento 2, 56 kD
8
0,0001959 1,29 0,641 2,012 AJ272267 CHDH | colina deshidrogenasa
9
0,0002218 1,801 0,943 1,91 N30081 EST, débilmente similares a la proteína hipotética 138022 [H. sapiens]
10
0,0004234 1,055 2,443 0,432 AI700363 EST
11
0,0004357 0,451 1,57 0,287 AL117406 ABCC11 | casete de unión a ATP, subfamilia C (CFTR/MRP), miembro 11
12
0,0004372 1,12 3,702 0,303 BC007092 Homeocaja de HOXB13 B13
13
0,0005436 0,754 1,613 0,467 M92432 guanilato ciclasa 2D GUCY2D, membrana (específica para retina)
14
0,0005859 1,315 0,578 2,275 AL050227 ARNm de Homo sapiens; ADNc DKFZp586M0723 (del clon DKFZp586M0723)
15
0,000635 1,382 0,576 2,399 AW613732 ADNc de Homo sapiens FLJ31137 fis, clon IMR322001049
16
0,0008714 0,794 1,252 0,634 BC007783 SCYA3 | citocina A3 inducible pequeña
17
0,0008912 2,572 1,033 2,49 X81896 C11 orf25 | marco de lectura abierto 25 del cromosoma 11
18
0,0009108 0,939 1,913 0,491 BC004960 MGC10955 | proteína hipotética MGC10955
19
0,0009924 1,145 0,719 1,592 AK027250 ADNc de Homo sapiens: FLJ23597 fis, clon LNG15281
5 Para perfeccionar nuestro análisis con respecto a las células tumorales y evitar una posible variabilidad atribuible a una contaminación por células estromales, se reanalizó la misma cohorte después de una microdisección por captura láser (LCM, Lasser Capture Microdissection) de las células tumorales dentro de cada sección de tejido. Usando varianza basada en exploración por filtrado génico y ensayo t idéntico al utilizado para el conjunto de datos de todas las secciones tisulares, se identificaron 9 secuencias génicas expresadas diferencialmente con un valor de
10 P < 0,001 (Tabla 3).
Tabla 3. Firma de 9 genes identificados por ensayo t en el conjunto de datos de LCM
Valor p paramétrico
Media de respondedores Media de no respondedore s Factor de diferencia de medias GBacc Descripción
1
2,67E-05 1,101 4,891 0,225 BC007092 HOXB13homeoboxB13
2
0,0003393 1,045 2,607 0,401 AI700363 MSE (marcador de secuencia expresada)
3
0,0003736 0,64 1,414 0,453 NM_ 014298 QPRT | quinolinato fosforribosiltransferasa (nicotinato-nucleótido pirofosforilasa (carboxilación))
4
0,0003777 1,642 0,694 2,366 AF208111 IL17BR | receptor de interleucina 17B
5
0,0003895 0,631 1,651 0,382 AF033199 ZNF204 | proteína de dedos de cinc 204
6
0,0004524 1,97 0,576 3,42 AI688494 FLJ13189 proteína teórica FLJ 13189
7
0,0005329 1,178 0,694 1,697 AI240933 MSE
8
0,0007403 0,99 1,671 0,592 AL157459 ARNm de Homo sapiens; ADNc DKFZp434B0425 (del clon DKFZp434B0425)
9
0,0007739 0,723 1,228 0,589 BC002480 FLJ 13352 | proteína teórica FLJ 13352
5 Solo se identificaron 3 genes como diferencialmente expresados tanto en el análisis de LCM como de sección de tejido completo: el gen homeobox HOXB13 (identificado dos veces como AI700363 y BC007092), el receptor 17B de interleucina 17B, IL17BR (AF208111) y el canal de calcio regulado por voltaje CACNA1D (AI240933). HOXB 13 se sobreexpresó diferencialmente en casos no sensibles a tamoxifeno mientras que IL17BR y CACNA1D se sobreexpresaron en casos sensibles a tamoxifeno. Cabe destacar, que la secuencia QPRT TUVO similitudes con la
10 secuencia HOXB13 en relación con los niveles de expresión en respondedores y no respondedores. Basándose en su identificación como marcadores derivados de tumores significativamente asociados con resultados clínicos en dos análisis independientes, la utilidad de cada uno de estos genes se evaluó por sí mismo y en combinación con el resto.
15 Para definir la sensibilidad y especificidad de la expresión de HOXB13, IL17BR y CACNA1D como marcadores de resultado clínico, se utilizó un análisis Característico Operativo del Receptor (ROC) (Pepe, M.S. “An interpretation for the ROC curve and inference using GLM procedures.” Biometrics 56, 352-9 (2000)). Para datos derivados de secciones de tejido completo, los valores del Área Bajo la Curva (ABC) para IL17BR, HOXB 13 y CACNAID fueron de 0,79, 0,67 y 0,81 para IL17BR, HOXB 13 y CACNA1D, respectivamente (véase la Tabla 4 y la Figura 1, parte
20 superior). El análisis ROC de los datos generados a partir de las células tumorales microdiseccionadas produjo valores del ABC de 0,76, 0,8 y 0,76 para estos genes (véase la Tabla 4 y la Figura 1, parte inferior).
Tabla 4. Análisis ROC del uso de la expresión de IL17BR, CACNA1D y HOXB13 para predecir respuestas a
tamoxifeno
Secciones de tejido
ABC
Valor P ABC valor P LCM
IL17BR
0,79 1,58E-06 0,76 2,73E-05
CACNA1D
0,81 3,02E-08 0,76 1,59E-05
HOXB13
0,67 0,012 0,79 9,94E-07
ESR1
0,55 0,277 0,63 0,038
PGR
0,63 0,036 0,63 0,033
ERBB2
0,69 0,004 0,64 0,027
EGFR
0,56 0,200 0,61 0,068
ABC, área bajo la curva; los valores de P son ABC > 0,5
5 Un ensayo de significado estadístico indicó que todos estos valores del ABC son significativamente mayores de 0,5, el valor esperado del modelo nulo que predice al azar resultados clínicos. Por lo tanto, estos tres genes tienen posible utilidad para predecir resultados clínicos de terapia adyuvante con tamoxifeno. Como comparativa, se analizaron marcadores que son normalmente útiles en la evaluación de la probabilidad de respuesta a tamoxifeno en comparación. Los niveles del ER (símbolo del gen ESR1) y del receptor de progesterona (RP, símbolo del gen PGR)
10 se sabe que se correlacionan positivamente con la respuesta a tamoxifeno (véase Fernández, M. D., et al. “Quantitative oestrogen and progesterone receptor values in primary breast cancer and predictability of response to endocrine therapy.” Clin Oncol 9, 245-50 (1983); Ferno, M. et al. “Results of two or five years of adjuvant tamoxifen correlated to steroid receptor and S-phase levels.” South Sweden Breast Cancer Group, and South-East Sweden Breast Cancer Group. Breast Cancer Res Treat 59, 69-76 (2000); Nardelli, G. B., et al. “Estrogen and progesterone
15 receptors status in the prediction of response of breast cancer to endocrine therapy (preliminary report).” Eur J Gynaecol Oncol 7, 151-8 (1986); and Osborne, C. K., et al. “The value of estrogen and progesterone receptors in the treatment of breast cancer.” U 46, 2884-8 (1980)).
Además, se piensa que las rutas de señalización del factor de crecimiento (EGFR, ERBB2), regulan negativamente
20 la señalización dependiente de estrógeno y por tanto contribuye a pérdida de sensibilidad a tamoxifeno (véase Dowsett, M. “Overexpression of HER-2 as a resistance mechanism to hormonal therapy for breast cancer.” Endocr Relat Cancer 8, 191-5 (2001)). El análisis ROC de estos genes confirmó su correlación con resultados clínicos, pero con valores de ABC que variaban solamente de 0,55 a 0,69 alcanzando un significado estadístico para PGR y ERBB2 (véase la Tabla 4).
25 El conjunto de datos de LCM es particularmente relevante, ya que EGFR, ERBB2, ESR1 y PGR se miden normalmente a nivel de células tumorales usando inmunohistoquímica o como hibridación in situ con fluorescencia. Como marcadores individuales de resultado clínico, HOXB13, IL17BR y CAC1D sobrepasaron el rendimiento de ER1, PGR, EGFR y ERBB2 (véase la Tabla 4).
Ejemplo 3
Identificación de la proporción de la expresión de HOXB13:IL17BR
35 La proporción de la expresión de HOXB13:IL17BR se identificó de la siguiente manera como un fuerte indicador de resultado compuesto. Dado que HOXB13 e IL17BR tienen modelos de expresión opuestos, la proporción de la expresión de HOXB13 sobre IL17BR se examinó para determinar si esto proporciona un mejor indicador compuesto de respuesta a tamoxifeno. De hecho, tanto el ensayo t como el análisis ROC demostraron que la proporción de los dos genes tenía una correlación más fuerte con resultados de tratamiento que cualquier gen en solitario, tanto en los
40 conjuntos de datos de secciones de tejido completo como de LCM (véase la Tabla 5). Los valores del ABC de HOXB13:IL17BR alcanzaron 0,81 para el conjunto de datos de las secciones de tejidos y 0,84 para el conjunto de datos de LCM. El emparejamiento de HOXB13 con CACNA1D o el análisis de los tres marcadores juntos no proporcionó un poder predictivo adicional.
Tabla 5. La proporción de HOXB13:IL17BR es un fuerte indicador de resultados de tratamiento
Ensayo t
ROC
t-estadístico
Valor P Valor P ABC
IL17BR
4,15 1,15E-04 0,79 1,58E-06
Sección
HOXB13 -3,57 1,03E-03 0,67 0,01
de tejido
HOXB13:IL17B R -4,91 1,48E-05 0,81 1,08E-07
LCM
IL17BR 3,70 5,44E-04 0,76 2,73E-05
HOXB13
-4,39 8,00E-05 0,79 9,94E-07
HOXB13:IL17BR
-5,42 2,47E-06 0,84 4,40E-11
ABC, área bajo la curva; los valores de P son ABC > 0,5.
La proporción HOXB13/IL7BR se comparó con factores de pronóstico bien establecidos para cáncer de mama, tales
5 como edad del paciente, tamaño del tumor, grado y estado del nódulo linfático (véase Fitzgibbons, P. L. et al. “Prognostic factors in breast cancer. College of American Pathologists Consensus Statement 1999.” Arch Pathol Lab Med 124, 966-78 (2000)). El análisis univariado de regresión logística indicó que solo el tamaño del tumor fue marginalmente significativo en esta cohorte (P=0,04); esto no fue sorprendente dado que el grupo de respondedores era muy parecido al grupo de no respondedores con respecto al tamaño del tumor, grado del tumor y estado del
10 nódulo linfático durante la selección de los pacientes. Entre los indicadores conocidos positivos (ESR1 y PGR) y negativos (ERBB2 y EGFR) de respuesta a tamoxifeno, el análisis ROC de los datos de las secciones de tejidos indicó que solo PGR y ERBB2 fueron significativos (véase la Tabla 4). Por lo tanto, se realizó una comparación de los modelos de regresión logística que contenía la proporción HOXB13: IL17BR en sí misma o en combinación con el tamaño del tumor, y los niveles de expresión de PGR y ERBB2 (véase la Tabla 6). La proporción HOXB13:IL17BR
15 en solitario fue un indicador muy significativo (P=0,0003) y tuvo una razón de probabilidades de 10,2 (IC del 95% de 2,9-35,6). En el modelo multivariado, la proporción HOXB13:IL17BR es la única variable significativa (P=0,002) con una razón de probabilidades de 7,3 (IC del 95% de 2,1-26). Por tanto, la proporción de la expresión de HOXB13:IL17BR es un fuerte indicador independiente del resultado de tratamiento en el caso de terapia adyuvante con tamoxifeno.
20 Tabla 6. Análisis de Regresión Logística Modelo Univariado Indicador Razón de Probabilidades IC del 95% Valor P HOXB13:IL17BR 10,17 2,9-35,6 0,0003
Modelo Multivariado Indicadores Razón de Probabilidades IC del 95% Valor P Tamaño del 1,5 0,7-3,5 0,3289 tumor PGR 0,8 0,3-1,8 0,5600 ERBB2 1,7 0,8-3,8 0,1620 HOXB13:IL17BR 7,3 2,1-26,3 0,0022
Todos los indicadores son variables continuas. Los valores de expresión de genes eran de mediciones de micromatrices. La razón de probabilidades es la proporción de probabilidad intercuartil, en base a la diferencia de un indicador de su cuartil inferior (0,25) con respecto a su cuartil superior (0,75); IC, intervalo de confianza.
Ejemplo 4
25 Validación independiente de la proporción de la expresión HOXB13:IL17BR
La reducción de una firma de micromatriz compleja a una proporción de expresión de dos genes permite el uso de estrategias de detección más sencillas, tales como análisis por PCR cuantitativa en tiempo real (RT-QPCR). Se analizó la proporción de la expresión HOXB13:IL17BR mediante RT-QPCR utilizando secciones de tejidos 30 congeladas que se encontraban disponibles en 59 de los 60 casos de entrenamiento (Figura 2, parte a). Los datos de la RT-QPCR eran fuertemente concordantes con los datos de la micromatriz de los especímenes tumorales
congelados (coeficiente de correlación r=0,83 para HOXB13, 0,93 para IL17BR). Además, las proporciones
HOXB13:IL17BR derivadas de la PCR, representadas como las ∆CT, en el que CT son los ciclos de amplificación de la PCR para conseguir una cantidad umbral predeterminada (por ejemplo, Figura 2, partes a y b) y ∆CT es la diferencia de CT entre HOXB13 e IL17BR, se correlacionaron altamente con los datos derivados de micromatrices
5 (r= 0,83) y con resultados de tratamiento (ensayo t P=0,0001, Figura 2, parte c). Por tanto, parece que el análisis de RT-QPCR convencional para la proporción de la expresión de HOXB13 con respecto a IL17BR es equivalente al análisis basado en micromatrices de especímenes tumorales congelados.
Para validar la utilidad predictiva de la proporción de la expresión HOXB13:IL17BR en una cohorte de pacientes
10 independiente, se identificaron 20 tumores de mama primarios de fase temprana ER-positivos adicionales, de mujeres tratadas con tamoxifeno adyuvante solo a MGH entre 1991 y 2000, y para los que se disponía de registros médicos y tejidos incluidos en parafina. De los 20 casos del archivo, 10 habían sido recurrentes con un tiempo medio de recurrencia de 5 años y 10 permanecieron libres de enfermedad con un seguimiento medio de hasta 9 años (véase la Tabla 7 para más detalles).
15 Tabla 7. Características de los pacientes y de los tumores del conjunto de validación.
Muestra
Tipo de Tumor Tamaño Grado Nódulos ER PR Edad DFS Estado
Ensayo 1
D 1,9 3 0/10 Pos Pos 69 15 1
Ensayo 2
D 1,7 3 0/19 Pos Pos 61 117 1
Ensayo 3
D 1,7 2 0/26 Pos ND 65 18 1
Ensayo 4
D 1,2 2 0/19 Pos Pos 63 69 1
Ensayo 5
D 1,7 2 2/2 Pos Pos 60 52 1
Ensayo 6
D 1,1 1 0/10 Pos Pos 54 59 1
Ensayo 7
D >1,6 2 0/17 Pos Neg 66 32 1
Ensayo 8
L 2,6 1-2 0/14 Pos Pos 58 67 1
Ensayo 9
D 1,2 2 ND Pos Pos 93 58 1
Ensayo 10
D 4 3 0/20 Pos Pos 66 27 1
Ensayo 11
D 1,1 2 0/19 Pos Pos 64 97 0
Ensayo 12
D 2,7 2 0/10 Pos Pos 66 120 0
Ensayo 13
D 0,9 1 0/22 Pos Pos 66 123 0
Ensayo 14
D 2,1 2 0/16 Pos Pos 57 83 0
Ensayo 15
D 0,8 1-2 0/8 Pos Pos 74 80 0
Ensayo 16
D 1 2 0/13 Pos Pos 74 93 0
Ensayo 17
D 1,6 2 0/29 Pos Pos 66 121 0
Ensayo 18
L 1,5 1-2 0/8 Pos Pos 65 25 0
Ensayo 19
D 1,5 3 0/19 Pos Pos 60 108 0
Ensayo 20*
L 4 1-2 0/19 Pos Pos 60 108 0
Abreviaturas: Las mismas que las de la Tabla 1 complementaria. * El paciente recibió tamoxifeno durante 2 años
El ARN se extrajo de secciones de tejido completo incluidas en parafina fijadas con formalina (FFPE, Formalin-Fixed Paraffin-Embedded), amplificadas linealmente y se usaron como molde para análisis RT-QPCR. Coherente con los 20 resultados de la cohorte de entrenamiento, la proporción de la expresión HOXB13:IL17BR en esta cohorte de pacientes independiente estuvo muy correlacionada con el resultado clínico (ensayo t P=0,035) con una mayor
expresión de HOXB13 (∆CT inferior) correlacionada con un mal resultado (Figura 2, parte d). Para ensayar la
precisión predictiva de la proporción HOXB13:IL17BR, se usaron los datos de la RT-QPCR de las secciones tisulares congeladas (n=59) para construir un modelo de regresión logística. En este conjunto de entrenamiento, el modelo predijo un resultado de tratamiento con una precisión global del 76% (P=0,000065, intervalo de confianza del 95% del 63%-86%). Los valores predictivos positivos y negativos fueron 78% y 75%, respectivamente. Aplicando este modelo a los 20 pacientes independientes en la cohorte de validación, el resultado del tratamiento para 15 de los 20 pacientes se predijo correctamente (precisión global 75%, P=0,04, intervalo de confianza del 95% del 51%91%), con valores predictivos positivos y negativos de 78% y 73%, respectivamente.
El análisis de Kaplan-Meier de los grupos de pacientes como se predice mediante el modelo dio como resultado curvas de supervivencia libre de enfermedad significativamente diferentes tanto en el conjunto de entrenamiento con en el conjunto de ensayo independiente (Figura 2, partes e y f).
Un ejemplo adicional representativo de la aplicación de la proporción a las muestras de sección y muestras LCM de la cohorte de 60 pacientes se muestra en la Figura 8, Parte B (indicado por “Secciones” y “LCM”, respectivamente). En esta figura también se muestra una aplicación ejemplar de la proporción de 31 muestras FFPE (indicado por
“FFPE”).
Ejemplo 5
Identificación de secuencias adicionales como resultado de la expresión de CHDH
El hecho de que la secuencia de AI240933 fuese complementaria con la cadena codificante de CACNA1D conduce a la cuestión de si en el Ejemplo 2 anterior se detectó la expresión de una secuencia distinta de la de CACNA1D.
Por lo tanto se realizó un ensamblaje de secuencias que condujo a la identificación de una región 3’ más larga de las
secuencias conocidas expresadas como parte de CHDH (véanse las Figuras 5 y 3). Esta secuencia más larga se confirmó que se expresaba por análisis PCR usando sondas que eran capaces de amplificar una región calculada de 4283 nucleótidos que abarcaba las partes de la secuencia de CHDH previamente identificada y las de la secuencia de AI240933 (véase la Figura 4).
El ensamblaje de las secuencias de la Figura 5 condujo a la identificación de un cóntigo de secuencias más largo mostrado en la Figura 6. Se proporcionó un refuerzo adicional para la probabilidad de un cóntigo más largo mediante un alineamiento del cóntigo con las secuencias CHDH de ratón.
En la Figura 7 se muestra la relación de probabilidad entre las secuencias de CHDH y CACNA1D.
Ejemplo 6
Identificación y uso de la proporción de expresión de QPRT:CHDH
La proporción de la expresión de AQPRT:CHDH se identificó como un identificador fuerte y compuesto de resultado de una manera similar a la descrita en el Ejemplo 3 anterior. Dado que QPRT y CHDH tienen patrones de expresión opuestos, la proporción de la expresión de QPRT sobre CHDH se examinó para determinar su capacidad de funcionar como un indicador compuesto de respuesta a tamoxifeno. Los resultados de la aplicación de la proporción con respecto a las muestras de sección y muestras de LCM de la cohorte de 60 pacientes se muestran en la Figura 8, Parte A (indicado como “Secciones” y “LCM” respectivamente). En la figura también se muestra una aplicación ejemplar de la proporción con respecto a 31 muestras FFPE (indicadas como “FFPE”).
Referencias adicionales
Ma, X. J. et al. Gene expression profiles of human breast cancer progression. Proc Natl Acad Sci U S A 100, 5974-9 (2003). Nicholson, R. I. et al. Epidermal growth factor receptor expression in breast cancer: association with response to endocrine therapy. Breast Cancer Res Treat 29, 117-25 (1994).
Anexo Secuencias identificadas como las del grupo de IL17BR
Secuencias identificadas como las de CHDH
>gi|26011703|gb|CA774243.1 |CA774243 en 24a07.x1 Páncreas Fetal Humano 1B, ADNc de Homo sapiens clon IMAGE: 3'
>gi|23527150|gb|BU679327.1|BU679327UI-CF-DU1-aau-i-03-0-Ul.s1 UI-CF-DU1 ADNc de Homo sapiens clon Ul10 CF-DU1-aau-i-03-0-UI 3'
>gi|23274053|gb|BU608029.1|BU608029 UI-CF-FN0-aes-l-02-0-Uls1 UI-CF-FNO ADNc de Homo sapiens clon Ul-CF-FN0-aes-1-02-0-UI 3'
>gi| 11451784|gb|BF439267.1 |BF439267 nab62a07.x1 Soares_NSF_F8_9W_OT_PA_P_S1_ ADNc de Homo sapiens clon IMAGE:3272340 3'
>gi|11448468|gb|BF436153.1|BF436153 nab77h10.x1 Soares_NSF_F8_9W_OT_PA_P_S1 ADNc de Homo sapiens clon IMAGE:3273859 3'
>gi|10033200|gb|BE672659.1|BE672659 7b71b03.x1NCI_CGAP_Lu24 ADNc de Homo sapiens clon IMAGE: 3233645 3'
>gi|6837905|gb|AW341279.1|AW341279 xz97e03.x1NCI_CGAP_Lu24 ADNc de Homo sapiens clon IMAGE: 2872156 3'
>gi|5543775|gb|AI869807.1|AI869807wm04b02.x1 NCI_CGAP_Ut4 ADNc de Homo sapiens clon lMAGE:24349233'
10 >gi|5543768|gb|AI869800.1|AI869800wm04a03.x1 NCI_CGAP_Ut4 ADNc de Homo sapiens clon lMAGE:24349243'
>gi|4610281|gb|AI601252.1|AI601252 ar88c09.x1 colon Barstead HPLRB7 ADNc de Homo sapiens clon IMAGE: 2152336 3'
>gi|4330088|gb|AI467998.1|AI467998tj84e10.x1 Soares_NSF_F8_9W_OT_PA_P_S1 ADNc de Homo sapiens clon IMAGE:2148234 3'
>gi|4311745|gb|AI459166.1 |AI|459166 tj65h07.x1 Soares_NSF_F8_9W_OT_PA_P_S1 ADNc de Homo sapiens clon IMAGE:2146429 3'
>gi|4222874|gb|AI393327.1|AI393327 tg44a12.x1 Soares_NFL_T_GBC_S1 ADNc de Homo sapiens clon IMAGE: 21116143'
>gi|3933768|gb|AI290994.1|AI290994qm09e05.x1 NCI_CGAP_Lu5 ADNc de Homo sapiens clon IMAGE:18813443'
>gi|3844395|gb|AI248998.1|AI248998 qh80f04.x1 Soares_fetal_higado_bazo_1NFLS_S1 ADNc de Homo sapiens clon lMAGE:1851007 3'
>gi|3405022|gb|AI075844.1|AI075844 oz16d08.x1 Soares_fetal_higado_bazo_1NFLS_S1 ADNc de Homo sapiens clon lMAGE:1675503 3'
>gi|3307963|gb|AI051972.1|AI051972 ow83h10.x1 Soares_fetal_higado_bazo_1NFLS_S1 ADNc de Homo sapiens clon lMAGE:1653475 3'
>gi|3254601|gb|AI033648.1|AI033648ow22e09.x1 Soares_tumor_paratiroideo_NbHPA ADNc de Homo sapiens clon lMAGE: 1647592 3'
>gi|3229367|gb|AI015031.1|AI015031 ot30f04.s1 Soares_testículo_NHT ADNc de Homo sapiens clon MAGE:1618303 3'
>gi|3055333|gb|M915941.1 |M915941 on18d06.s1 NCI_CGAP_Lu5 ADNc de Homo sapiens con IMAGE: 155703 3'
>gi|2953300|gb|AA861160.1|AA861160 ak36b12.s1Soares_testículo_NHT ADNc de Homo sapiens clon IMAGE: 1408031 3'
>gi| 1782040|gb| AA192157.1 |AA192157 zq02g05.s1 músculo Stratagene 937209 ADNc de Homo sapiens clon MAGE: 628568 3'
>gi|1230953|gb|N73668.1|N73668 yz78h05.s1 Soares_esclerosis_múltiple_2NbHMSP ADNc de Homo sapiens clon IMAGE:289209 3'
>gi|2142013|gb|AA437099.1|AA437099 zv53b09.s1Soares_testúculos_NHT ADNc de Homo sapiens clon IMAGE: 757337 3'
>gi|3836330|gb|AI240933.1 |AI240933 qk01 b11 .x1 NCI_CGAP_Kid3 ADNc de Homo sapiens con IMAGE: 1867677 3'
>gi|2669971|gb|AA682690.1|AA682690 zj86f07.s1 Soares_fetal_hígado_bazo_1NFLS_S1 ADNc de Homo sapiens clon IMAGE:461797 3'
>gi|1162804|gb|N39597.1|N39597 yy51e04.s1 Soares_esclerosis_múltiple_2NbHMSP ADNc de Homo sapiens clon IMAGE:277086 3'
>gi|3838507|gb|AI243110.1|AI243110 qh26f06.x1 Soares_NFL_T_GBC_S1 ADNc de Homo sapiens clon IMAGE: 1845827 3'
Secuencias identificadas como las del grupo QPRT 15 BC005060
Secuencias identificadas como las del grupo HOXB 13 BF676461
[0187] Secuencias de la Tabla 4 no descritas anteriormente AW006861 (Clon IMAGE ID::2497262)
AI820604 (Clon IMAGE ID: 1605108
AI087057 (Clon IMAGE ID:1671188)
N30081 (Clon IMAGE ID: 258695)
AI700363 (Clon IMAGE ID: 2327403)
AL117406
AW613732 (Clon IMAGE ID: 2953502)
BC007783 (Clon IMAGE ID: 4308472)
BC004960 (Clon IMAGE ID: 3632495) Secuencias de la Tabla 5 no descritas anteriormente AI688494 (Clon IMAGE ID: 2330499) BC002480 (Clon IMAGE ID: 3350037)

Claims (7)

  1. REIVINDICACIONES
    1.
    Un método para determinar el riesgo de recurrencia de cáncer en un sujeto que padece cáncer de mama ER+ en caso de tratamiento con tamoxifeno, comprendiendo dicho método ensayar una muestra de células de cáncer de mama ER+, procedente de dicho sujeto, para la expresión de los ARNm de HOXB13 e IL17BR humanos para determinar una proporción de los niveles de expresión de HOXB13 e IL17BR, en el que dicha proporción indica la ausencia de recurrencia de cáncer en dicho sujeto en caso de tratamiento con tamoxifeno.
  2. 2.
    El método de la reivindicación 1, en el que dicha proporción indica la ausencia de recurrencia de cáncer por metástasis o un resultado de supervivencia.
  3. 3.
    El método de acuerdo con una cualquiera de las reivindicaciones 1 y 2, en el que dicha muestra de células de cáncer de mama se obtiene mediante una técnica mínimamente invasiva o se selecciona entre biopsia realizada con aguja gruesa, biopsia excisional, una muestra obtenida por lavado ductal, una muestra obtenida por aspiración con aguja fina o células microdiseccionadas procedentes de dicha muestra.
  4. 4.
    El método de una cualquiera de las reivindicaciones 1 a 3, en el que dicho ensayo para la expresión comprende la detección de ácidos nucleicos preparados por amplificación de ARNm procedente de dicha muestra de células de cáncer de mana o la detección de ácidos nucleicos de dicha muestra de células de cáncer de mama por PCR cuantitativa.
  5. 5.
    El método de una cualquiera de las reivindicaciones 1 a 3, en el que dicho ensayo se realiza por hibridación con un polinucleótido que comprende las secuencias de al menos 15 nucleótidos de la región 3' no traducida, de la región codificante, o de la región 5' no traducida, de los genes de HOXB13 e IL17BR humanos.
  6. 6.
    El método de una cualquiera de las reivindicaciones 1 a 3, en el que dicho ensayo para la expresión comprende ensayar la inactivación o metilación del gen de HOXB13.
  7. 7.
    El método de la reivindicación 4, en el que dicho ensayo es para determinar los niveles de expresión de HoxB 13 e IL17BR y comprende realizar PCR en tiempo real y determinar una proporción de los niveles de expresión de los
    ARN de HoxB 13 e IL17BR, expresada como una ∆Ct de los valores de Ct observados para los niveles de expresión
    de los ARN de HoxB 13 e IL17BR.
ES04788855T 2003-09-19 2004-09-17 Predicción del resultado del tratamiento del cáncer de mama Active ES2399246T3 (es)

Applications Claiming Priority (9)

Application Number Priority Date Filing Date Title
US50408703P 2003-09-19 2003-09-19
US504087P 2003-09-19
US727100 2003-12-02
US10/727,100 US7504214B2 (en) 2003-09-19 2003-12-02 Predicting outcome with tamoxifen in breast cancer
US10/773,761 US9856533B2 (en) 2003-09-19 2004-02-06 Predicting breast cancer treatment outcome
US773761 2004-02-06
US54719904P 2004-02-23 2004-02-23
US547199P 2004-02-23
PCT/US2004/030789 WO2005028681A1 (en) 2003-09-19 2004-09-17 Predicting breast cancer treatment outcome

Publications (1)

Publication Number Publication Date
ES2399246T3 true ES2399246T3 (es) 2013-03-27

Family

ID=47833561

Family Applications (1)

Application Number Title Priority Date Filing Date
ES04788855T Active ES2399246T3 (es) 2003-09-19 2004-09-17 Predicción del resultado del tratamiento del cáncer de mama

Country Status (1)

Country Link
ES (1) ES2399246T3 (es)

Similar Documents

Publication Publication Date Title
EP1670946B1 (en) Predicting breast cancer treatment outcome
US20180127834A1 (en) Predicting breast cancer treatment outcome
Costas et al. New perspectives on screening and early detection of endometrial cancer
KR101437718B1 (ko) 위암의 예후 예측용 마커 및 이를 이용하는 위암의 예후 예측 방법
ES2667547T3 (es) Pronóstico de cáncer de mama después del tratamiento
US20060088851A1 (en) Invasion/migration gene
US20030236632A1 (en) Biomarkers for breast cancer
JP2007516692A (ja) 乳癌の徴候
JP2013533486A (ja) 乳がんの診断および治療
TWI622892B (zh) 基因表現圖譜以及將其應用於乳癌醫療之方法與套組與微陣列晶片
BR112016005225B1 (pt) Métodos para avaliar câncer de mama em um indivíduo
US20170137891A1 (en) Integration of tumor characteristics with breast cancer index
Li et al. ZCCHC12, a potential molecular marker of papillary thyroid carcinoma: a preliminary study
US20060263806A1 (en) Biomarkers for breast cancer
ES2399246T3 (es) Predicción del resultado del tratamiento del cáncer de mama
KR20190121578A (ko) 전립선암 진단용 바이오마커 및 이의 용도
US20200370122A1 (en) Immune index methods for predicting breast cancer outcome
WO2010126338A2 (ko) 유방암 진단용 바이오마커 및 유방암 진단제
KR101441013B1 (ko) 유방암 진단용 바이오마커
Wen et al. Breast cancer pathology in the era of genomics
JP2007510424A (ja) 分子マーカー
US20030198961A1 (en) Determining cancer aggressiveness
KR20210040921A (ko) 신장암 환자의 치료 전략 결정 및 예후 진단용 재발 특이적 마커
JP2007503826A (ja) 乳癌のリスクの診断
DTX et al. Additionally, gene segments or polymorphic gene segments