ES2622858T3 - Predicción del pronóstico para el cáncer de melanoma - Google Patents

Predicción del pronóstico para el cáncer de melanoma Download PDF

Info

Publication number
ES2622858T3
ES2622858T3 ES08766967.7T ES08766967T ES2622858T3 ES 2622858 T3 ES2622858 T3 ES 2622858T3 ES 08766967 T ES08766967 T ES 08766967T ES 2622858 T3 ES2622858 T3 ES 2622858T3
Authority
ES
Spain
Prior art keywords
expression
melanoma
protein
cancer
mpm
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
ES08766967.7T
Other languages
English (en)
Inventor
Michael Alan Black
Jonathan Cebon
Parry John Guilford
Thomas John
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ludwig Institute for Cancer Research Ltd
Pacific Edge Ltd
Ludwig Institute for Cancer Research New York
Original Assignee
Ludwig Institute for Cancer Research Ltd
Pacific Edge Ltd
Ludwig Institute for Cancer Research New York
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ludwig Institute for Cancer Research Ltd, Pacific Edge Ltd, Ludwig Institute for Cancer Research New York filed Critical Ludwig Institute for Cancer Research Ltd
Application granted granted Critical
Publication of ES2622858T3 publication Critical patent/ES2622858T3/es
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6876Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
    • C12Q1/6883Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material
    • C12Q1/6886Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material for cancer
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61PSPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
    • A61P35/00Antineoplastic agents
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/30ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for calculating health indices; for individual health risk assessment
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/118Prognosis of disease development
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/158Expression markers
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/16Primer sets for multiplex assays

Landscapes

  • Health & Medical Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Organic Chemistry (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Pathology (AREA)
  • General Health & Medical Sciences (AREA)
  • Public Health (AREA)
  • Wood Science & Technology (AREA)
  • Genetics & Genomics (AREA)
  • Analytical Chemistry (AREA)
  • Immunology (AREA)
  • Zoology (AREA)
  • Medical Informatics (AREA)
  • Microbiology (AREA)
  • Biochemistry (AREA)
  • General Engineering & Computer Science (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Molecular Biology (AREA)
  • Biotechnology (AREA)
  • Hospice & Palliative Care (AREA)
  • Biophysics (AREA)
  • Oncology (AREA)
  • Physics & Mathematics (AREA)
  • Epidemiology (AREA)
  • Data Mining & Analysis (AREA)
  • Biomedical Technology (AREA)
  • Databases & Information Systems (AREA)
  • Primary Health Care (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • Medicinal Chemistry (AREA)
  • General Chemical & Material Sciences (AREA)
  • Pharmacology & Pharmacy (AREA)
  • Veterinary Medicine (AREA)
  • Animal Behavior & Ethology (AREA)
  • Nuclear Medicine, Radiotherapy & Molecular Imaging (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
  • Apparatus Associated With Microorganisms And Enzymes (AREA)
  • Investigating Or Analysing Biological Materials (AREA)

Abstract

Un método para determinar el pronóstico del melanoma en un paciente, comprendiendo el método: (i) determinar el nivel de expresión de un marcador pronóstico del melanoma (MPM) que es la proteína factor 8 del glóbulo de la grasa de la leche-EGF (MFGE8), o de una firma de pronóstico que comprende dos o más MPMs, al menos uno de los cuales es MFGE8 en una muestra del melanoma tumoral del paciente, (ii) aplicar un modelo predictivo, establecido mediante la aplicación de un método predictivo a los niveles de expresión del MPM o de la firma pronóstica en muestras tumorales con buen y mal pronóstico, (iii) establecer un pronóstico.

Description

5
10
15
20
25
30
35
40
45
50
DESCRIPCION
Prediccion del pronostico para el cancer de melanoma
Esta solicitud reivindica prioridad de la Solicitud de Patente Provisional de Nueva Zelanda No. 555363 presentada el 24 de mayo de 2007.
CAMPO DE LATECNICA
Esta invencion se refiere a metodos y composiciones para determinar el pronostico del cancer en un paciente. Espedficamente, esta invencion se refiere al uso de marcadores geneticos y proteomicos para determinar el pronostico del melanoma, basado en firmas pronosticas.
ESTADO DE LA TECNICA
En los pafses industrializados, la incidencia del melanoma ha aumentado de manera costante en los ultimos 25 anos, siendo la incidencia en Australia la mas alta del mundo1. Aunque la "epidemia de melanoma" percibida probablemente representa una mayor deteccion de melanomas delgados2, el melanoma afecta a grupos de edad predominantemente mas jovenes, lo que resulta en una perdida de anos de vida productiva superada solo por las neoplasias malignas de la infancia y el cancer testicular3,4. El melanoma no responde en gran medida a la quimioterapia citotoxica5, a los agentes biologicos6,7 y a las diversas estrategias de vacunacion8. Un pequeno subgrupo de pacientes parece beneficiarse de las quimioterapias biologicas y/o citotoxicas, pero la identificacion de estos pacientes a priori es actualmente imposible, la cual requiere la exposicion de muchos pacientes a toxicidades sustanciales con una baja probabilidad de beneficio.
Una vez que el melanoma se ha metastatizado en los ganglios linfaticos locales, el 70% de los pacientes muere en los 5 anos siguientes9. El subgrupo de pacientes con una supervivencia prolongada representa una cohorte unica. Ninguna terapia adyuvante actual ofrece un beneficio de supervivencia global, y mientras algunos clmicos ofrecen interferon a para mejorar la supervivencia sin enfermedad, muchos centros internacionales no ofrecen ningun tratamiento adyuvante activo fuera de los ensayos clmicos. La prediccion de que pacientes es probable que respondan bien, independientemente del uso de terapias adyuvantes, evitana una toxicidad innecesaria y permitina el desarrollo de mejores estrategias terapeuticas dirigidas a aquellos que tienen mas probabilidades de obtener beneficios. Una mejor estratificacion de los pacientes en ensayos clmicos adyuvantes reducina los errores de tipo I y de tipo II. La actualizacion de 12 anos despues del estudio ECOG 1684 y otros estudios aleatorios han demostrado que el interferon-a mejora la TTP pero no la supervivencia global en el melanoma en estadio III5,10,11. La heterogeneidad inherente dentro de las poblaciones de pacientes, que ahora son bien reconocidas pero que no pueden ser controladas, puede haber confundido los efectos prometedores sobre la supervivencia observada en el estudio ECOG 168410 inicial y otros estudios mas pequenos de fase II. Estratificar a los pacientes mas propensos a la recafda puede equilibrar esta heterogeneidad y permitir que los tratamientos sean comparados con mayor precision.
Existe una necesidad de nuevas herramientas para predecir el pronostico del melanoma. Esta invencion proporciona metodos basados en marcadores de pronostico del melanoma, para ayudar en el pronostico y el tratamiento del cancer.
EXPLICACION DE LA INVENCION
Se describe en este documento un conjunto de genes marcadores identificados que son expresados diferencialmente en melanomas con un buen pronostico y melanomas con un mal pronostico. Este conjunto de genes puede utilizarse para generar firmas de pronosticos, que comprenden dos o mas marcadores, capaces de predecir la velocidad de progresion del melanoma en un paciente.
Los marcadores individuales se pueden expresar diferencialmente dependiendo de si el tumor progresa rapidamente o no. La exactitud de la prediccion se puede mejorar combinando los marcadores juntos en una firma pronostica, proporcionando pruebas individuales mucho mas eficaces que los ensayos de un solo gen. Tambien esta prevista la aplicacion de tecnicas, tales como estadfsticas, aprendizaje de maquinas, inteligencia artificial y minena de datos a las firmas de pronosticos para generar modelos de prediccion. En otra realizacion, los niveles de expresion de los marcadores de una firma pronostica particular en el tumor de un paciente pueden aplicarse entonces al modelo de prediccion para determinar el pronostico.
En ciertas realizaciones, el nivel de expresion de los marcadores puede establecerse utilizando procedimientos de micromatrices, reaccion en cadena de polimerasa cuantitativa (qPCR) o inmunoensayos.
Espedficamente, la presente invencion proporciona un metodo para determinar el pronostico del melanoma en un paciente, que comprende las etapas de:
5
10
15
20
25
30
35
40
45
50
(i) determinar el nivel de expresion de un marcador de pronostico de melanoma (MPM), que es la protema del factor 8 del globulo de grasa de leche-EGF (MFGE8), o de una firma de pronostico que comprende dos o mas MPM, al menos uno de los cuales es MFGE8, en una muestra de melanoma tumoral del paciente,
(ii) aplicar un modelo predictivo, establecido mediante la aplicacion de un metodo predictivo a los niveles de expresion del MPM o la firma predictiva en las muestras de tumor pronosticamente buenas y malas,
(iii) establecer un pronostico.
Alternativamente, la presente invencion tambien proporciona un metodo para determinar la idoneidad de un paciente de melanoma para un ensayo de farmaco, que comprende las etapas de:
(i) determinar el nivel de expresion de un MPM, que es la protema del factor 8 del globulo de grasa de leche-EGF (MFGE8), o de una firma de pronostico que comprende dos o mas MPM, al menos uno de los cuales es MFGE8, en una muestra de melanoma tumoral del paciente,
(ii) aplicar un modelo predictivo, establecido mediante la aplicacion de un metodo predictivo a los niveles de expresion del MPM o de la firma predictiva en las muestras de tumor pronosticamente buenas y malas,
(iii) establecer la idoneidad del paciente al ensayo.
Los MPM descritos en este documento se pueden seleccionar de la tabla 1. El metodo predictivo se selecciona del grupo consistente en modelos lineales, maquinas vectoriales de apoyo, redes neuronales, arboles de clasificacion y regresion, metodos de aprendizaje conjunto, analisis discriminante, metodo del vecino mas cercano, redes bayesianas, analisis de componentes independientes.
La determinacion del nivel de expresion de un MPM o una firma pronostica puede llevarse a cabo detectando el nivel de expresion de ARNm de cada gen, por ejemplo usando el metodo qPCR usando un cebador directo y un cebador inverso. La determinacion del nivel de expresion de un MPM o una firma de pronostico tambien puede llevarse a cabo detectando el nivel de expresion de ADNc de cada gen, por ejemplo usando un nucleotido complementario a al menos una porcion de dicho ADNc. Ademas, el nivel de expresion de un MPM o una firma pronostica puede determinarse detectando el nivel de expresion de la protema de cada marcador o detectando el nivel de expresion del peptido de cada marcador, por ejemplo utilizando un anticuerpo dirigido contra cada marcador, tal como un anticuerpo monoclonal o un anticuerpo monoclonal o un antisuero policlonal. Se podna utilizar un metodo de inmunoensayo de tipo sandwich o ensayo ELISA.
En otro aspecto, la presente invencion proporciona un uso de un dispositivo para determinar el pronostico del melanoma, para determinar el nivel de expresion de MFGE8 o de una firma pronostica que comprende dos o mas MPMS, al menos uno de los cuales es MFGE8, comprendiendo el dispositivo:
un sustrato que tiene una o mas localizaciones sobre el mismo, teniendo cada localizacion dos o mas oligonucleotidos sobre el mismo, cada oligonucleotido seleccionado de uno o mas MPM en el que al menos uno de los MPM es MFGE8.
Los dos o mas oligonucleotidos descritos en este documento pueden ser los MPM seleccionados de la tabla 1.
Tambien se describe en este documento el uso de un reactivo para detectar la expresion de un MPM, o de una firma pronostica que comprende dos o mas MPM, en la fabricacion de un kit para predecir el pronostico del melanoma en un paciente. Los MPM se pueden seleccionar de la tabla 1.
El reactivo puede detectar el nivel de expresion de uno o mas MPMs mediante la deteccion de la expresion de ARNm de MPM o ADNc de MPM. El reactivo puede ser un oligonucleotido complementario de al menos una porcion del ARNm o ADNc de MPM. Alternativamente, el reactivo puede detectar el nivel de expresion de uno o mas MPMs mediante la deteccion de la expresion de una protema o peptido MPM. El reactivo puede ser un anticuerpo, tal como un anticuerpo monoclonal de antisuero policlonal.
El kit puede ser adecuado para realizar un inmunoensayo tipo sandwich o un ensayo ELISA.
BREVE DESCRIPCION DE LOS DIBUJOS
Esta invencion se describe con referencia a realizaciones espedficas de la misma y con referencia a las figuras, en las que:
La figura 1 representa los 22 genes utilizados para construir puntuaciones predictivas ("marcadores de melanoma"). Los genes se seleccionaron usando una prueba de Mann-Whitney.
La Figura 2 muestra los agrupamientos de Ontologfa Genetica de los genes expresados diferencialmente y el significado asociado. Las ontologfas mas significativas estan determinadas por el numero de genes que se
5
10
15
20
25
30
35
40
45
50
superponen entre las categonas, es dedr, la probabilidad de que sea una co-incidencia que estos muchos genes estaban en ambas la lista de genes y la categona.
Figura 3. Esquema experimental que comprende un conjunto de entrenamiento y dos independientes aplicados al Conjunto de Validacion A usando el qPS y el Conjunto B usando el aPS. El conjunto de entrenamiento se utilizo para desarrollar genes predictivos que luego se aplicaron al Conjunto de Validacion A utilizando el qPS y el Conjunto B utilizando el aPS.
La Figura 4 representa el ARN usado para crear el ADNc de referencia usado tanto en los experimented de matriz como en la forma de un comparador en los ensayos de qPCR.
La figura 5 representa los ensayos usados para qPCR usando sondas de biblioteca de sonda universal.
La figura 6 representa las caractensticas del paciente para el conjunto de prueba y el conjunto de validacion A.
La figura 7 representa el analisis de los componentes principales utilizando todos los genes (A) y los genes expresados diferencialmente (B), demostrando la capacidad de los 15 genes para segregar los grupos pronosticos buenos (cuadros rellenos) de los malos (cuadros sin rellenar). Estos genes se utilizaron para desarrollar la matriz y qPCR basada en los predictores.
La Figura 8 representa la aplicacion de los aPS (a-b) y qPS (c-d) en el conjunto de entrenamiento demostrando su correlacion con TTP y la supervivencia global. El aPS utiliza solo los 15 genes con la mayor correlacion entre los datos de matriz y los datos qPCR y el qPS utiliza los cinco genes con la mayor capacidad para separar los dos grupos.
La Figura 9 representa el algoritmo de regresion logfstica qPS aplicado al conjunto de entrenamiento y al conjunto de validacion A. Se dibuja una lmea horizontal en valores medios.
La figura 10 representa la distribucion de las puntuaciones de qPS de los grupos pronosticos buenos y malos del tercer conjunto independiente.
Descripcion detallada
Definiciones
Antes de describir las realizaciones de la invencion en detalle, sera util proporcionar algunas definiciones de los terminos utilizados en la presente memoria.
El termino “marcador” se refiere a una molecula que esta asociada cuantitativa o cualitativamente con la presencia de un fenomeno biologico. Los ejemplos de “marcadores” incluyen un polinucleotido, tal como un gen o fragmento genico, fragmento de ARN o ARN; o un producto genico que incluye un polipeptido tal como un peptido, oligopeptido, protema o fragmento de protema; o cualquier metabolito relacionado, por productos, o cualquier otra molecula identificadora, tal como anticuerpos o fragmentos de anticuerpos, esten relacionados directa o indirectamente con un mecanismo subyacente al fenomeno. Los marcadores de la invencion incluyen las secuencias de nucleotidos (por ejemplo, secuencias de GenBank) como se describen en este documento, en particular, las secuencias de longitud completa, cualquier secuencia de codificacion, cualquier fragmento o cualquier complemento de la misma y cualquier marcador medible de la misma como se definio anteriormente.
El termino "MPM" o las expresiones "marcador pronostico de melanoma" o "miembro de la familia de MPM" se refieren a un marcador con una expresion alterada que esta asociada con un pronostico particular, por ejemplo, una probabilidad mas alta o mas baja de que un cancer progrese a un estadio mas avanzado, como se describe en este documento, pero puede excluir moleculas que son conocidas en la tecnica anterior para asociarse con el pronostico del melanoma. Debe entenderse que el termino MPM no requiere que el marcador sea espedfico solo para melanomas. Mas bien, la expresion de un MPM puede ser alterada en otros tipos de tumores, incluyendo tumores malignos.
Las expresiones "firma pronostica", "firma" y similares se refieren a un conjunto de dos o mas marcadores, por ejemplo MPM, que cuando se analizan juntos como un conjunto permiten la determinacion o prediccion de un evento, por ejemplo el resultado del pronostico del melanoma. El uso de una firma que comprende dos o mas marcadores reduce el efecto de la variacion individual y permite una prediccion mas robusta. Los ejemplos no limitativos de MPMs se ponen en cuarto lugar en XX. En el contexto de la presente invencion, la referencia a "al menos uno", "al menos dos", "al menos cinco", etc., de los marcadores enumerados en cualquier conjunto particular (por ejemplo, cualquier firma) significa una cualquiera o cualquiera y todas las combinaciones de los marcadores enumerados.
La expresion "metodo de prediccion" se define para abarcar el genero mas amplio de metodos de los campos de la estadfstica, el aprendizaje automatico, la inteligencia artificial y la minena de datos, que se pueden utilizar para especificar un modelo de prediccion. La expresion incluye tambien cualquier metodo adecuado para predecir un resultado, e incluye los metodos de no solo usar analisis complejos de marcadores multiples, sino tambien la
5
10
15
20
25
30
35
40
45
50
55
comparacion directa de la expresion de un solo marcador o firma con la de un tejido de control, o con un umbral predeterminado, con el fin de predecir un resultado. Estos se discuten mas adelante en la seccion Descripcion detallada.
La expresion "modelo de prediccion" se refiere al modelo matematico espedfico obtenido aplicando un metodo de prediccion a una coleccion de datos. En los ejemplos detallados en el presente documento, tales conjuntos de datos consisten en mediciones de la actividad genica en muestras de tejido tomadas de pacientes con melanoma con un pronostico bueno o malo, para el cual se conoce la clase (buena o mala) de cada muestra. Estos modelos pueden ser usados para (1) clasificar una muestra de estado de pronostico desconocido como uno de bueno o malo, o (2) hacer una prediccion probabdstica (es decir, producir una proporcion o porcentaje que se interprete como una probabilidad) que representa la probabilidad de que la muestra desconocida tenga un buen pronostico, basado en la medicion de los niveles de expresion de ARNm o de los productos de expresion, de una coleccion espedfica de genes, en la muestra desconocida. Los detalles exactos de como se combinan estas mediciones espedficas de genes para producir clasificaciones y predicciones probabilfsticas dependen de los mecanismos espedficos del metodo de prediccion utilizado para construir el modelo. La expresion tambien incluye cualquier modelo adecuado para predecir un resultado, e incluye los modelos no solo utilizando analisis complejos de marcadores multiples, sino tambien modelos que implican la comparacion directa de la expresion de un solo marcador o firma con la de un tejido de control, o con un umbral predeterminado, con el fin de predecir un resultado.
"Sensibilidad", "especificidad" (o "selectividad") y "tasa de clasificacion", cuando se aplican para describir la eficacia de los modelos de prediccion, significan lo siguiente:
"Sensibilidad" significa la proporcion de muestras verdaderamente positivas que tambien se predice (por el modelo) que son positivas. En una prueba para el pronostico del melanoma, sena la proporcion de tumores que tienen un buen pronostico predicho por el modelo de ser buenos. "Especificidad" o "selectividad" significa la proporcion de muestras verdaderamente negativas que tambien se predice (por el modelo) que son negativas. En una prueba para el pronostico del melanoma, esto equivale a la proporcion de muestras que tienen un mal pronostico que se predicen por malos por el modelo. "Tasa de clasificacion" es la proporcion de todas las muestras que se clasifican correctamente por el modelo de prediccion (sea como positivo o negativo).
Como se usa en la presente memoria, “anticuerpos” y terminos similares se refieren a moleculas de inmunoglobulina y porciones inmunologicamente activas de moleculas de inmunoglobulina (Ig), es decir, moleculas que contienen un sitio de union a antfgeno que se une espedficamente (inmunorreacciona con) un antfgeno. Estos incluyen, pero no se limitan a, fragmentos policlonales, monoclonales, quimericos, de cadena sencilla, Fc, Fab, Fab' y Fab2 y una biblioteca de expresion de Fab. Las moleculas de anticuerpo se relacionan con cualquiera de las clases IgG, IgM, IgA, IgE e IgD, que difieren entre sf por la naturaleza de la cadena pesada presente en la molecula. Estas incluyen tambien subclases, tales como IgG1, IgG2 y otras. La cadena ligera puede ser una cadena kappa o una cadena lambda. La referencia en este documento a anticuerpos incluye una referencia a todas las clases, subclases y tipos. Tambien se incluyen anticuerpos quimericos, por ejemplo, anticuerpos monoclonales o fragmentos de los mismos que son espedficos de mas de una fuente, por ejemplo, una secuencia de raton o humana. Se incluyen ademas anticuerpos de camelidos, anticuerpos de tiburon o nanocuerpos.
Los terminos "cancer" y "canceroso" se refieren o describen la condicion fisiologica en mairnferos que se caracteriza tfpicamente por crecimiento celular anormal o no regulado. El cancer y la patologfa del cancer pueden asociarse, por ejemplo, con metastasis, interferencia con el funcionamiento normal de las celulas vecinas, liberacion de citoquinas u otros productos secretores a niveles anormales, supresion o agravacion de la respuesta inflamatoria o inmunologica, neoplasia, premalignidad, malignidad, invasion de tejidos u organos circundantes o lejanos, tales como ganglios linfaticos, etc. Se incluyen espedficamente los melanomas.
El termino “melanoma” se refiere a un tumor que se origina a partir de melanocitos que se encuentran en la piel, pero tambien otros sitios tales como superficies mucosas bucales y anogenitales, esofago, meninges y el ojo. Estos tumores son capaces de hacer metastasis en cualquier organo.
Las expresiones “expresado diferencialmente” y “expresion diferencial” y frases similares se refieren a un marcador genico cuya expresion se activa a un nivel mas alto o mas bajo en un sujeto (por ejemplo, muestra de prueba) que tiene una afeccion, espedficamente cancer, tal como melanoma, en relacion con su expresion en un sujeto de control (por ejemplo, muestra de referencia). Los terminos tambien incluyen marcadores cuya expresion es activada a un nivel mas alto o mas bajo en diferentes etapas de la misma condicion; en enfermedades con buen o mal pronostico; o en celulas con niveles mas altos o mas bajos de proliferacion. Un marcador expresado diferencialmente puede ser activado o inhibido al nivel del polinucleotido o al nivel de polipeptido, o puede estar sujeto a un empalme alternativo para dar como resultado un producto polipeptido diferente. Dichas diferencias pueden ser evidenciadas por un cambio en los niveles de ARNm, expresion superficial, secrecion u otro reparto de un polipeptido, por ejemplo.
La expresion diferencial puede incluir una comparacion de la expresion entre dos o mas marcadores (por ejemplo, genes o sus productos genicos); o una comparacion de las relaciones de la expresion entre dos o mas marcadores (por ejemplo, genes o sus productos genicos); o una comparacion de dos productos procesados de manera diferente
5
10
15
20
25
30
35
40
45
50
55
60
(por ejemplo, transcritos o polipeptidos) del mismo marcador, que difieren entre sujetos normales y sujetos enfermos; o entre varias etapas de la misma enfermedad; o entre enfermedades que tienen un buen o mal pronostico; o entre celulas con niveles de proliferacion mas altos y mas bajos; o entre tejido normal y tejido enfermo, espedficamente cancer, o melanoma. La expresion diferencial incluye diferencias tanto cuantitativas como cualitativas en el patron de expresion temporal o celular en un gen o sus productos de expresion entre, por ejemplo, las celulas normales y enfermas, o entre celulas que han sufrido diferentes estados de enfermedad o estadios de enfermedad, o celulas con diferentes niveles de proliferacion
El termino “expresion” incluye la produccion de polinucleotidos y polipeptidos, en particular, la produccion de ARN (por ejemplo ARNm) de un gen o porcion de un gen e incluye la produccion de un polipeptido codificado por un ARN o gen o porcion de un gen, y la aparicion de un material detectable asociado con la expresion. Por ejemplo, la formacion de un complejo, por ejemplo, a partir de una interaccion polipeptido-polipeptido, interaccion polipeptido- nucleotido, o similar, se incluye dentro del alcance del termino "expresion". Otro ejemplo es la union de un ligando de union, tal como una sonda de hibridacion o anticuerpo, a un gen u otro polinucleotido u oligonucleotido, un polipeptido o un fragmento de protema, y la visualizacion del ligando de union. Asf, la intensidad de un punto en un micromatriz, en una transferencia de hibridacion, tal como una transferencia de Northern, o en una inmunotransferencia, tal como una transferencia de Western, o en una matriz de perlas, o por analisis de PCR, se incluye dentro del termino "expresion" de la molecula biologica subyacente.
Las expresiones "umbral de expresion" y "umbral de expresion definido" se usan indistintamente y se refieren al nivel de un marcador en cuestion fuera del cual el polinucleotido o polipeptido sirve como marcador predictivo para la supervivencia del paciente. El umbral dependera del modelo predictivo establecido derivado experimentalmente de estudios clmicos tales como los descritos en los Ejemplos a continuacion. Dependiendo del modelo de prediccion utilizado, el umbral de expresion se puede establecer para alcanzar la maxima sensibilidad, o para una especificidad maxima, o para un error mmimo (tasa de clasificacion maxima). Por ejemplo, se puede establecer un umbral mas alto para conseguir errores mmimos, pero esto puede resultar en una sensibilidad mas baja. Por lo tanto, para cualquier modelo predictivo dado, se usaran estudios clmicos para establecer un umbral de expresion que generalmente alcance la sensibilidad mas alta mientras que tiene una tasa de error minima. La determinacion del umbral de expresion para cualquier situacion esta dentro del conocimiento de los expertos en la tecnica. La expresion "supervivencia a largo plazo" se utiliza en este documento para referirse a la supervivencia durante al menos 5 anos, mas preferiblemente durante al menos 8 anos, lo mas preferiblemente durante al menos 10 anos despues de la cirugfa u otro tratamiento.
El termino "micromatriz" se refiere a una disposicion ordenada o no ordenada de agentes de captura, preferiblemente polinucleotidos (por ejemplo, sondas) o polipeptidos sobre un sustrato. Vease, por ejemplo, Microarray Analysis, M. Schena, John Wiley & Sons, 2002; Microarray Biochip Technology, M. Schena, ed., Eaton Publishing. 2000; Guide to Analysis of DNA Microarray Data, S. Knudsen, John Wiley & Sons, 2004; y Protein Microarray Technology, D. Kambhampati, ed. John Wiley & Sons. 2004.
El termino "oligonucleotido" se refiere a un polinucleotido, tfpicamente una sonda o cebador, que incluye, sin limitacion, desoxirribonucleotidos monocatenarios, ribonucleotidos monocatenarios o bicatenarios, hfbridos de ARN:ADN y ADNs de doble hebra. Los oligonucleotidos, tales como los oligonucleotidos de sonda de ADN de cadena sencilla, se sintetizan a menudo mediante metodos qrnmicos, por ejemplo utilizando sintetizadores de oligonucleotidos automatizados que estan comercialmente disponibles, o mediante una variedad de otros metodos, incluyendo sistemas de expresion in vitro, tecnicas recombinantes y expresion en celulas y organismos.
El termino "polinucleotido", cuando se usa en singular o plural, se refiere generalmente a cualquier polirribonucleotido o polidesoxirribonucleotido, que puede ser ARN o ADN no modificado o ARN o ADN modificado. Esto incluye, sin limitacion, ADN de cadena sencilla y doble, ADN que incluye regiones monocatenarias y bicatenarias, ARN de cadena sencilla y doble, y ARN que incluyen regiones monocatenarias y bicatenarias, moleculas dbridas que comprenden ADN y ARN que pueden ser monocatenarias o, mas tfpicamente, bicatenarias o incluir regiones monocatenarias y bicatenarias. Tambien se incluyen regiones de triple cadena que comprenden ARN o ADN o ARN y ADN. Se incluyen espedficamente ARNm, ADNc, y ADN genomicos, y cualquier fragmento de los mismos. El termino incluye ADN y ARN que contienen una o mas bases modificadas, tales como bases tritiadas, o bases inusuales, tales como inosina. Los polinucleotidos de la invencion pueden abarcar secuencias codificantes o no codificantes, o secuencias de sentido o antisentido. Se entendera que cada referencia a un termino "polinucleotido" o similar, en la presente memoria, incluira las secuencias de longitud completa asf como cualquier fragmento, derivado o variante del mismo.
"Polipeptido", como se usa en el presente documento, se refiere a una secuencia de oligopeptido, peptido o protema, o fragmento de la misma, y a moleculas naturales, recombinantes, sinteticas o semisinteticas. Cuando se dice "polipeptido" en la presente memoria para referirse a una secuencia de aminoacidos de una molecula de protema de origen natural, "polipeptido" y terminos similares, no pretende limitar la secuencia de aminoacidos a la secuencia completa de aminoacidos nativa para la molecula de longitud total. Se entendera que cada referencia a un "polipeptido" o similar, en la presente memoria descriptiva, incluira la secuencia de longitud completa, asf como cualquier fragmento, derivado o variante del mismo.
5
10
15
20
25
30
35
40
45
50
55
El termino "pronostico" se refiere a una prediccion del resultado medico, por ejemplo, un resultado malo o bueno (por ejemplo, probabilidad de supervivencia a largo plazo); un pronostico negativo o un resultado deficiente, incluye una prediccion de recafda, progresion de la enfermedad (por ejemplo, crecimiento o metastasis tumoral, o resistencia a farmacos) o mortalidad; un pronostico positivo o un buen resultado incluye una prediccion de remision de la enfermedad (por ejemplo, estado sin enfermedad), mejoramiento (por ejemplo, regresion del tumor) o estabilizacion.
El termino "proliferacion" se refiere a los procesos que conducen al aumento del tamano celular o del numero de celulas, y puede incluir uno o mas de: crecimiento de tumores o celulas, angiogenesis, inervacion y metastasis.
El termino "qPCR" o "QPCR" se refiere a la reaccion cuantitativa en cadena de la polimerasa, tal como se describe, por ejemplo, en PCR Technique: Quantitative PCR, JW Larrick, ed., Eaton Publishing, 1997, y A-Z of Quantitative PCR, S. Bustin ed., IUL Press. 2004.
El termino "tumor" se refiere a todo el crecimiento y la proliferacion de celulas neoplasicas, ya sean malignas o benignas, y todas las celulas y tejidos precancerosos y cancerosos.
La "rigor" de las reacciones de hibridacion es facilmente determinable por cualquier experto en la tecnica y generalmente es un calculo empmco dependiente de la longitud de la sonda, la temperatura de lavado y la concentracion de sales. En general, las sondas mas largas requieren temperaturas mas altas para el recocido apropiado, mientras que las sondas mas cortas necesitan temperaturas mas bajas. La hibridacion depende generalmente de la capacidad del ADN desnaturalizado para reanudarse cuando las hebras complementarias estan presentes en un entorno por debajo de su temperatura de fusion. Cuanto mas alto sea el grado de homologfa deseada entre la sonda y la secuencia hibridable, mayor sera la temperatura relativa que puede utilizarse. Como resultado, se deduce que las temperaturas relativas mas altas tendenan a hacer las condiciones de reaccion mas rigurosas, mientras que las temperaturas mas bajas no tanto. Detalles adicionales y explicacion de la rigurosidad de las reacciones de hibridacion se encuentran, por ejemplo, en Ausubel et al., Current Protocols in Molecular Biology, Wiley Interscience Publishers, (1995).
"Condiciones rigurosas" o "condiciones de alta rigurosidad", como se definen en este documento, tfpicamente: (1) emplean baja fuerza ionica y alta temperatura para el lavado, por ejemplo cloruro sodico 0,015 M/citrato sodico 0,0015 M/dodecil sulfato sodico al 0,1% a 50°C; (2) emplean un agente desnaturalizante durante la hibridacion, tal como formamida, por ejemplo, formamida al 50% (v/v) con albumina de suero bovino al 0,1%/Ficoll al 0,1%/polivinilpirrolidona al 0,1%/tampon fosfato de sodio 50 mM a pH 6,5 con cloruro de sodio 750 mM, citrato sodico 75 mM a 42°C; o (3) emplean formamida al 50%, SSC 5X (NaCl 0,75 M, citrato de sodio 0,075 M), fosfato sodico 50 mM (pH 6,8), pirofosfato sodico al 0,1%. 5X, solucion de Denhardt, ADN de esperma de salmon sonicado (50 |ig/ml), SDS al 0,1% y sulfato de dextrano al 10% a 42°C, con lavados a 42°C en SSC 0,2X (cloruro sodico/citrato sodico) y formamida al 50% a 55°C, seguido de un lavado de alta rigurosidad que comprende 0,1 X SSC que contiene eDTa a 55°C.
Las "condiciones moderadamente rigurosas" pueden identificarse como se describe en Sambrook et al. Molecular Cloning: A Laboratory Manual, Nueva York: Cold Spring Harbor Press, 1989, e incluyen el uso de la solucion de lavado y las condiciones de hibridacion (por ejemplo, temperatura, fuerza ionica y % de SDS) menos estrictas que las descritas anteriormente. Un ejemplo de condiciones moderadamente rigurosas es la incubacion durante la noche a 37°C en una solucion que comprende: 20% de formamida, 5X SSC (NaCl 150 mM, citrato trisodico 15 mM), fosfato sodico 50 mM (pH 7,6), 5x Solucion de Denhardt, sulfato de dextrano al 10% y ADN de esperma de salmon cortado desnaturalizado a 20 mg/ml, seguido por lavado de los filtros en 1X SSC a aproximadamente 37-50°C. El experto en la tecnica reconocera como ajustar la temperatura, la fuerza ionica, etc. segun sea necesario para acomodar factores tales como la longitud de la sonda y similares.
La practica de la presente invencion empleara, a menos que se indique lo contrario, tecnicas convencionales de biologfa molecular (incluyendo tecnicas recombinantes), microbiologfa, biologfa celular y bioqmmica, que estan dentro de la experiencia en la tecnica. Tales tecnicas se explican completamente en la literatura, tales como Molecular Cloning: A Laboratory Manual, 2a edicion. Sambrook et al., 1989; Oligonucleotide Synthesis. MJ Gait, ed., 1984; Animal Cell Culture, R.I. Freshney, ed., 1987; Methods in Enzymology, Academic Press, Inc.; Handbook of Experimental Immunology, 4a edicion. D. M. Weir y CC. Blackwell. Eds Blackwell Science Inc., 1987; Gene Transfer Vectors for Mammalian Cells. J. M. Miller y M. P. Calos. Eds., 1987; Current Protocols in Molecular Biology. F. M. Ausubel et al., Eds., 1987; y PCR: The Polymerase Chain Reaction, Mullis et al., Eds. 1994.
Descripcion de las realizaciones de la invencion
La presente invencion describe el uso de micromatrices para identificar y determinar el papel pronostico espedfico de marcadores y firmas pronosticos espedficos en melanoma, de acuerdo con las reivindicaciones adjuntas. Los estudios basados en micromatrices mostrados en este documento establecen marcadores que pueden usarse para predecir un pronostico bueno o malo para un paciente con melanoma. En particular, los estudios basados en micromatrices y analisis de qPCR mostrados en el presente documento indican que los genes expresados diferencialmente particulares pueden usarse como firmas pronosticas que estan asociadas con un pronostico
5
10
15
20
25
30
35
40
45
50
55
particular. Por lo tanto, la invencion puede utilizarse para identificar pacientes que puedan presentar una enfermedad agresiva.
Se describen en este documento marcadores para la determinacion del pronostico de enfermedad. Usando los metodos descritos en este documento, se ha encontrado que los marcadores estan asociados con el pronostico del melanoma, y pueden usarse para predecir el resultado. El analisis por micromatriz de muestras tomadas de pacientes con diversas etapas de melanoma ha llevado al sorprendente descubrimiento de que patrones espedficos de expresion de marcador se asocian con el pronostico del cancer. Por lo tanto, la presente descripcion proporciona un conjunto de genes, esbozados en la Tabla 1, que se expresan diferencialmente en melanomas con un resultado bueno o malo. Los genes esbozados en la Tabla 1 proporcionan un conjunto de marcadores de pronostico del melanoma (MPM).
Una disminucion en ciertos marcadores pronosticos de melanoma (MPM), por ejemplo, puede ser indicativa de un pronostico particular. Por el contrario, un aumento en otros MPM es indicativo de un pronostico particular. Un pronostico particular puede incluir la velocidad de progresion de la enfermedad. Se puede determinar una disminucion o aumento de la expresion, por ejemplo, mediante la comparacion de una muestra de ensayo, por ejemplo, una muestra de tumor de un paciente, con una muestra de referencia, por ejemplo, una muestra asociada con un pronostico conocido. En particular, se podna usar una o mas muestras de pacientes con buen pronostico como muestra de referencia.
Por ejemplo, para obtener un pronostico, los niveles de expresion en la muestra de un paciente (por ejemplo, la muestra de tumor) se pueden comparar con las muestras del paciente o pacientes con un resultado conocido. Si la muestra del paciente muestra un aumento o una disminucion de la expresion de uno o mas MPMs que se compara con las muestras con mal resultado (una rapida progresion de la enfermedad), entonces hay un pronostico malo. Si la muestra del paciente muestra la expresion de uno o mas MPMs que es comparable a las muestras con buen resultado (una progresion lenta de la enfermedad) entonces hay un pronostico positivo, o buen pronostico. Como ejemplos adicionales, los niveles de expresion de una firma pronostica que comprende dos o mas MPM de una muestra de paciente (por ejemplo, una muestra de tumor) se pueden comparar con muestras de canceres que se sabe que tienen un pronostico bueno o malo. Si la muestra del paciente muestra una expresion aumentada o disminuida de los MPM en comparacion con muestras con buen pronostico y/o expresion comparable a muestras de mal pronostico, entonces hay un pronostico negativo. Si la muestra del paciente muestra una expresion de MPM que es comparable a muestras de buen pronostico y/o expresion inferior o superior a muestras con un pronostico malo, entonces hay un pronostico positivo o bueno.
Como una aproximacion, se puede aplicar un metodo de prediccion a un panel de marcadores, por ejemplo el panel de MPM esbozado en la Tabla 1, con el fin de generar un modelo predictivo. Esto implica la generacion de una firma pronostica, que comprende dos o mas MPM.
Los MPM descritos en la Tabla 1 proporcionan por lo tanto un conjunto util de marcadores para generar firmas de prediccion para determinar el pronostico del cancer y establecer un regimen de tratamiento o modalidad de tratamiento espedfico para ese tumor. En particular, un pronostico positivo puede ser utilizado por un paciente para decidir seguir opciones de tratamiento particulares. Un pronostico negativo puede ser utilizado por un paciente para decidir terminar el tratamiento o perseguir tratamientos altamente agresivos o experimentales. Ademas, un paciente puede elegir tratamientos basandose en su pronostico predicho por la expresion de marcadores pronosticos (por ejemplo, MPM).
Los niveles de MPM pueden detectarse en el tejido tumoral, tejido proximal al tumor, muestras de ganglios linfaticos, muestras de sangre, muestras de suero, muestras de orina o muestras fecales, usando cualquier tecnica adecuada, y pueden incluir, pero no se limitan a, sondas de oligonucleotidos, PCR cuantitativa, o anticuerpos contra los marcadores. Se apreciara que analizando la presencia y las cantidades de expresion de una pluralidad de MPMs en forma de firmas de prediccion, y construyendo una firma pronostica, se aumentara la sensibilidad y la precision del pronostico. Por lo tanto, se pueden usar marcadores multiples de acuerdo con la presente invencion para determinar el pronostico de un cancer.
La descripcion incluye el uso de material de biopsia embebido en parafina archivado para el ensayo de los marcadores en el conjunto, y por lo tanto es compatible con el tipo de material de biopsia mas ampliamente disponible. Tambien es compatible con varios metodos diferentes de recoleccion de tejido tumoral, por ejemplo, mediante biopsia de nucleo o aspiracion con aguja fina. En ciertos aspectos, el ARN se afsla de una muestra de tejido cancengeno fijado, embebido en cera, del paciente. El aislamiento puede realizarse mediante cualquier tecnica conocida en la tecnica, por ejemplo a partir de tejido de biopsia de nucleo o celulas de aspiracion con aguja fina.
En un aspecto, la presente descripcion se refiere a un metodo para predecir un pronostico, por ejemplo, la probabilidad de la supervivencia a largo plazo de un paciente de cancer despues del tratamiento, que comprende determinar el nivel de expresion de uno o mas marcadores pronosticos o sus productos de expresion en una muestra obtenida del paciente, normalizado frente al nivel de expresion de otros transcritos de ARN o sus productos en la muestra, o de un conjunto de referencia de transcriptos de ARN o sus productos de expresion. En aspectos
espedficos, el marcador pronostico es uno o mas marcadores enumerados en la Tabla 1 o se incluye como una o mas de las firmas pronosticas derivadas de los marcadores enumerados en la Tabla 1.
En otros aspectos, los niveles de expresion de los marcadores pronosticos o sus productos de expresion se determinan, por ejemplo, para los marcadores enumerados en la Tabla 1 y una firma pronostica derivada de los 5 marcadores enumerados en la Tabla 1. En otro aspecto, el metodo comprende la determinacion de los niveles de expresion de un conjunto completo de marcadores de pronostico o sus productos de expresion, por ejemplo, para los marcadores enumerados en la Tabla 1, o una firma pronostica derivada de los marcadores enumerados en la Tabla 1.
En un aspecto adicional, la presente descripcion se refiere a una matriz (por ejemplo, micromatriz) que comprende 10 polinucleotidos que se hibridan con dos o mas marcadores, por ejemplo, para los marcadores enumerados en la Tabla 1, o una firma pronostica derivada de los marcadores enumerados en la Tabla 1. En aspectos particulares, la matriz comprende polinucleotidos que se hibridan con una firma de pronostico derivada de los marcadores enumerados en la Tabla 1. En otro aspecto espedfico, la matriz comprende polinucleotidos que hibridan con el conjunto completo de marcadores, por ejemplo, para los marcadores enumerados en la Tabla 1.
15 Para estas matrices, los polinucleotidos pueden ser ADNc, u oligonucleotidos, y la superficie solida sobre la que se muestran puede ser vidrio, por ejemplo. Los polinucleotidos pueden hibridar con uno o mas de los marcadores como se describen en el presente documento, por ejemplo, a las secuencias de longitud completa, a cualquier secuencia codificante, a cualquier fragmento o a cualquier complemento del mismo. En aspectos particulares, un aumento o disminucion en los niveles de expresion de uno o mas MPM indica una menor probabilidad de supervivencia a largo 20 plazo, por ejemplo, debido a la recurrencia del cancer, mientras que la ausencia de un aumento o disminucion en los niveles de expresion de uno o mas MPM indica Una mayor probabilidad de supervivencia a largo plazo sin recurrencia del cancer.
Tabla 1: Marcadores predictivos de melanoma
Descripcion
Valor P Comun Genbank
Dominio de la tiorredoxina que contiene 5
0,049 TXNDC5 NM_030810
Receptor alfa de tipo 2 de tipo inmunoglobina pareado
0,049 PILRA NM_013439
Complejo mayor de histocompatibilidad, clase I, E
0,049 HLA-E NM_005516
Kiaa1067; Kiaa1067
0,049 XM_036173
Inosina trifosfatasa (nucleosido trifosfato pirofosfatasa)
0,049 ITPA NM_033453
Desmuslin*
0,0482 DMN NM_145728
Protema de union a GTP 2
0,0429 GTPBP2 NM_019096
Protema del factor 8 del globulo de la grasa de leche EGF
0.0429 MFGE8 NM_005928
Isocitrato deshidrogenasa 1 (NADP+), soluble
0,0365 IDH1 NM_005896
Protema mitocondrial ribosomica S5
0,0365 MRPS5 NM_031902
Lectina, union a galactosido, soluble, 7 (galectina 7)
0,0307 LGALS7 NM_002307
Kv canal que interactua con la protema 2
0,0295 KCNIP2 AF347114
Carbohidrato (N-acetilglucosamina 6-O) sulfotransferasa 4
0,0295 CHST4 NM_005769
Ensembl genscan prediccion
0,0295 AL451139.11.67295.95669.1
Ligando independiente de fosfotirosina humana
0,023 OSIL; A170; P62B U46752
Factor nuclear del potenciador del gen polipeptido ligero kappa en el inhibidor de las celulas B, beta
0,023 NFKBIB NM_002503
5
10
15
20
25
30
35
40
Homologo de soporte mitocondrial 2 (C. elegans)
0,023 MTCH2 NM_014342
Protema relacionada con el factor ADP-ribosilacion 1
0,0136 ARFRP1 NM_003224
cadena gamma de inmunoglobulina espedfica de alergeno del polen de abedul**
0,0136 BABI-L AJ131063
Tubulina alfa 1b***
0,0136 TUBA1B NM_006082
Exon parcial n-myc 3
0,00371 AJ242956_2
Plexin B2
0,000756 PLXNB2 AB002313
* Este marcador se conoda previamente como kiaa0353; dmn (XM_031031).
** Este marcador se conoda anteriormente como inmunoglobulina kappa variable 1-5 (IGKC; AJ131063).
*** Este marcador se conoda previamente como similar a tubulina alfa 6; loc143712 (XM_084610).
Enfoques generales para la deteccion de marcadores pronosticos
Los siguientes enfoques son metodos no limitativos que pueden usarse para detectar los marcadores de proliferacion, incluyendo miembros de la familia MPM: enfoques de micromatrices usando sondas oligonucleotfdicas selectivas para un MPM; QPCR en tiempo real en muestras tumorales usando cebadores y sondas espedficas de MPM; QPCR en tiempo real en muestras de ganglios linfaticos, sangre, suero, fecal u orina utilizando cebadores y sondas espedficas de MPM; ensayos inmunologicos ligados a enzimas (ELISA); inmunohistoqmmica utilizando anticuerpos anti-marcador; y analisis de matriz o datos qPCR utilizando computadoras.
Otros metodos utiles incluyen transferencia Northern e hibridacion in situ (Parker y Barnes, Methods in Molecular Biology 106: 247 - 283 (1999)); ensayos de proteccion de RNasa (Hod. BioTechniques 13: 852 - 854 (1992)); reaccion en cadena de la polimerasa de transcripcion inversa (RT-PCR, Weis y col., Trends in Genetics 8: 263-264 (1992)); analisis en serie de la expresion genica (SAGE, Velculescu et al., Science 270: 484 - 487 (1995); y Velculescu et al., Cell 88: 243 - 51 (1997)), tecnologfa MassARRAY (Sequenom, San Diego, CA) y el analisis de la expresion genica mediante secuenciacion de firma paralela masiva (MPSS, Brenner y col., Nature Biotechnology 18: 630-634 (2000)). Alternativamente, pueden emplearse anticuerpos que pueden reconocer complejos espedficos, incluyendo duplex de ADN, duplex de ARN y duplex hubrido de ADN-ARN o duplex de ADN-polipeptido.
Los datos primarios pueden recogerse y el analisis de cambio de pliegues puede realizarse, por ejemplo, mediante la comparacion de los niveles de expresion de marcadores en tejido tumoral y tejido no tumoral; por comparacion de los niveles de expresion del marcador a niveles determinados en tumores recurrentes y tumores no recurrentes; por comparacion de los niveles de expresion de marcador a niveles determinados en tumores con o sin metastasis; por comparacion de los niveles de expresion de marcador a niveles determinados en tumores de etapas diferentes; o mediante la comparacion de los niveles de expresion de marcador a niveles determinados en celulas con diferentes niveles de proliferacion. Se determina un pronostico negativo o positivo basado en este analisis. Un analisis adicional de la expresion del marcador tumoral incluye hacer coincidir los marcadores que muestran una expresion aumentada o disminuida con los perfiles de expresion de tumores de melanoma conocidos para proporcionar un pronostico.
Un umbral para concluir que la expresion se incrementa dependera del marcador particular y tambien del modelo predictivo particular que se va a aplicar. El umbral se fija generalmente para alcanzar la sensibilidad y la selectividad mas altas con la tasa de error mas baja, aunque pueden ser deseables variaciones para una situacion clmica particular. El umbral deseado se determina analizando una poblacion de tamano suficiente teniendo en cuenta la variabilidad estadfstica de cualquier modelo predictivo y se calcula a partir del tamano de la muestra utilizada para producir el modelo predictivo. Lo mismo se aplica a la determinacion de un umbral para concluir que la expresion se reduce. Se puede apreciar que se pueden seleccionar otros umbrales, o metodos para establecer un umbral, para concluir que se ha producido una expresion aumentada o disminuida sin apartarse del alcance de esta invencion.
Tambien es posible que un modelo de prediccion pueda producir como resultado un valor numerico, por ejemplo una puntuacion, valor de probabilidad o probabilidad. En estos casos, es posible aplicar umbrales a los resultados producidos por modelos de prediccion, y en estos casos se aplican principios similares a los que se usan para establecer umbrales para los valores de expresion.
Una vez que se ha obtenido el nivel de expresion, o el resultado de un modelo de prediccion, de una firma predictiva en una muestra de tumor, entonces se puede determinar la probabilidad de que el cancer se repita.
5
10
15
20
25
30
35
40
45
50
55
A partir de los marcadores identificados, pueden utilizarse firmas pronosticas que comprenden uno o mas MPM para determinar el pronostico de un cancer, comparando el nivel de expresion de uno o mas marcadores con la firma pronostica descrita. Mediante la comparacion de la expresion de uno o mas de los MPM en una muestra de tumor con la firma pronostica descrita, puede determinarse la probabilidad de que el cancer se repita. La comparacion de los niveles de expresion de la firma pronostica para establecer un pronostico se puede hacer aplicando un modelo predictivo como se describio anteriormente.
Determinar la probabilidad de que el cancer se repita es de gran valor para el medico. Una alta probabilidad de que un tumor no responda al tratamiento significa que debe considerarse un tratamiento de dosis mas larga o mas alta o que no se puede administrar tratamiento en absoluto. Un pronostico exacto tambien es beneficioso para el paciente. Permite al paciente, junto con sus parejas, familiares y amigos tomar decisiones sobre el tratamiento, asf como decisiones sobre sus cambios en el futuro y en el estilo de vida. Por lo tanto, la invencion tambien proporciona un metodo que establece un regimen de tratamiento para un cancer particular basado en el pronostico establecido comparando la expresion de los marcadores en una muestra de tumor con la firma de expresion diferencial.
Se apreciara que la seleccion del marcador, o la construccion de una firma de pronostico, no tiene que estar restringida a los MPM descritos en la Tabla 1 de esta memoria, pero podna implicar el uso de uno o mas MPM de las firmas reveladas, o una nueva firma puede establecerse utilizando los MPM seleccionados de las listas de marcadores reveladas. El requisito de cualquier firma es que prediga la probabilidad de una progresion rapida de la enfermedad con suficiente precision como para ayudar a un medico a establecer un regimen de tratamiento.
PCR de transcripcion Inversa (RT-PCR)
De las tecnicas mencionadas anteriormente, el metodo cuantitativo mas sensible y flexible es la RT-PCR, que puede utilizarse para comparar los niveles de ARN en diferentes poblaciones de muestra, en tejidos normales y tumorales, con o sin tratamiento farmacologico, para caracterizar patrones de expresion, para discriminar entre ARN estrechamente relacionados, y para analizar la estructura del ARN.
Para la RT-PCR, el primer paso es el aislamiento del ARN de una muestra diana. El material de partida es tfpicamente ARN total aislado a partir de tumores humanos o lmeas celulares tumorales, y tejidos o lmeas celulares normales correspondientes, respectivamente. El ARN se puede aislar de una variedad de muestras, tales como muestras de tumor de mama, pulmon, colon (por ejemplo, intestino grueso o intestino delgado), piel, colorrectal, gastrico, esofagico, anal, rectal, prostata, cerebro, hngado, pancreas, bazo, timo, testmulo, ovario, utero, etc., de tumores primarios o lmeas celulares tumorales y de muestras agrupadas de donantes sanos. Si la fuente de ARN es un tumor, el ARN puede extraerse, por ejemplo, de muestras de tejido congeladas o archivadas, embebidas en parafina y fijadas (por ejemplo, fijadas con formalina).
El primer paso en el perfil de expresion genica por RT-PCR es la transcripcion inversa de la plantilla de ARN en ADNc, seguido por su amplificacion exponencial en una reaccion de PCR. Las dos transcriptasas inversas mas comunmente usadas son la transcriptasa inversa del virus de la mieloblastosis aviar (AMV - RT) y la transcriptasa inversa del virus de la leucemia murina de Moloney (MMLV - RT). El paso de transcripcion inversa es normalmente cebado usando cebadores espedficos, hexameros aleatorios, o cebadores de oligo-dT, dependiendo de las circunstancias y el objetivo del perfilado de expresion. Por ejemplo, el ARN extrafdo puede ser transcrito inversamente utilizando un kit de PCR GeneAmp RNA (Perkin Elmer, CA, EE.UU.), siguiendo las instrucciones del fabricante. El ADNc derivado se puede utilizar entonces como plantilla en la reaccion de PCR subsiguiente.
Aunque la etapa de PCR puede utilizar una variedad de ADN polimerasas ADN-dependientes termoestables, emplea tfpicamente la ADN polimerasa Taq, que tiene una actividad de nucleasa 5'-3' pero carece de una actividad de endonucleasa de correccion 3'- 5'. Por lo tanto, la PCR TaqMan (q) utiliza tfpicamente la actividad de nucleasa 5' de la polimerasa Taq o Tth para hidrolizar una sonda de hibridacion unida a su amplicon diana, pero puede usarse cualquier enzima con actividad de 5' nucleasa equivalente.
Se usan dos cebadores de oligonucleotidos para generar un amplicon tfpico de una reaccion de PCR. Un tercer oligonucleotido, o sonda, esta disenado para detectar la secuencia de nucleotidos situada entre los dos cebadores de PCR. La sonda no es extensible por la enzima ADN polimerasa Taq y esta marcada con un colorante fluorescente indicador y un colorante fluorescente extintor. Cualquier emision inducida por laser procedente del colorante indicador se inactiva mediante el colorante de inactivacion cuando los dos colorantes estan situados juntos como estan en la sonda. Durante la reaccion de amplificacion, la enzima Taq ADN polimerasa divide la sonda de una manera dependiente de la plantilla. Los fragmentos de sonda resultantes se disocian en la solucion, y la senal procedente del colorante indicador liberado esta libre del efecto de extincion del segundo fluoroforo. Se libera una molecula de colorante indicador para cada nueva molecula sintetizada, y la deteccion del colorante indicador no inactivado proporciona la base para la interpretacion cuantitativa de los datos.
El TaqMan RT-PCR se puede realizar utilizando un equipo comercialmente disponible, tal como, por ejemplo, el sistema de deteccion de secuencias ABI PRISM 7700 (Perkin-Elmer-Applied Biosystems, Foster City, CA, EE.UU.) o Lightcycler (Roche Molecular Biochemicals, Mannheim, Alemania). En una realizacion preferida, el procedimiento de la nucleasa 5' se ejecuta en un dispositivo de PCR cuantitativa en tiempo real tal como el sistema de deteccion de
5
10
15
20
25
30
35
40
45
50
55
secuencias ABI PRISM 7700tam. El sistema consta de un termociclador, laser, dispositivo de carga acoplada (CCD), camara y computadora. El sistema amplifica muestras en un formato de 96 pocillos en un termociclador. Durante la amplificacion, la senal fluorescente inducida por el laser se recoge en tiempo real a traves de cables de fibra optica para los 96 pozos y se detecta en el CCD. El sistema incluye un software para ejecutar el instrumento y para analizar los datos.
Los datos del ensayo de nucleasa 5' se expresan inicialmente como Ct, o el ciclo umbral. Como se discutio anteriormente, los valores de fluorescencia se registran durante cada ciclo y representan la cantidad de producto amplificada hasta ese punto en la reaccion de amplificacion. El punto en el que la senal fluorescente se registra primero como estadfsticamente significativo es el ciclo de umbral.
Para minimizar los errores y el efecto de la variacion entre muestras, la RT-PCR se realiza generalmente utilizando un estandar interno. El patron interno ideal se expresa a un nivel constante entre diferentes tejidos, y no se ve afectado por el tratamiento experimental. Los ARN mas utilizados para normalizar los patrones de expresion genica son los ARNm para los genes de limpieza gliceraldehndo-3-fosfato-deshidrogenasa (GAPDH) y actina.
PCR cuantitativa en tiempo real (qPCR)
Una variacion mas reciente de la tecnica de RT-PCR es la PCR cuantitativa en tiempo real, que mide la acumulacion de productos de PCR a traves de una sonda fluorigenica marcada doble (es decir, sonda TaqMan). La PCR en tiempo real es compatible tanto con la PCR cuantitativa competitiva como con la PCR cuantitativa comparativa. La primera utiliza un competidor interno para cada secuencia objetivo para la normalizacion, mientras que la ultima utiliza un gen de normalizacion contenido dentro de la muestra, o un gen de limpieza para la RT-PCR. Se proporcionan mas detalles, por ejemplo, por Held et al., Genome Research 6: 986 - 994 (1996).
Los niveles de expresion pueden determinarse usando tejidos fijados, embebidos en parafina, como fuente de ARN. De acuerdo con un aspecto de la presente invencion, los cebadores y sondas de PCR se disenan basandose en las secuencias de intron presentes en el gen a amplificar. En esta realizacion, la primera etapa en el diseno de cebador/sonda es la delineacion de las secuencias de intron dentro de los genes. Esto puede hacerse mediante software disponible publicamente, tal como el software DNA BLAT desarrollado por Kent. W J Genome Res. 12 (4): 656 - 64 (2002). O por el software BLAST incluyendo sus variaciones. Los pasos subsiguientes siguen metodos bien establecidos de cebador de PCR y diseno de sonda.
Con el fin de evitar las senales no espedficas, es util para enmascarar secuencias repetitivas dentro de los intrones en el diseno de los cebadores y las sondas. Esto puede lograrse facilmente usando el programa Repeat Masker disponible en lmea a traves del Baylor College of Medicine, que filtra secuencias de ADN contra una biblioteca de elementos repetitivos y devuelve una secuencia problema en la que los elementos repetitivos estan enmascarados. Las secuencias enmascaradas pueden utilizarse entonces para disenar secuencias de cebador y sonda usando cualquier paquete de diseno de cebador/sonda comercialmente, o de otro modo publicamente, disponible tal como Primer Express (Applied Biosystems); ensayo por diseno MGB (Applied Biosystems); Primer3 (Steve Rozen y Helen J. Skaletsky (2000) Primer3 en la WWW para usuarios generales y para programadores biologos en: Krawetz S, Misener S (eds) Bioinformatics Methods and Protocols: Methods in Molecular Biology. Humana Press. Totowa, NJ. pp. 365 - 386).
Los factores mas importantes considerados en el diseno del cebador de PCR incluyen la longitud del cebador, la temperatura de fusion (Tm), y el contenido de G/C, la especificidad, las secuencias de cebador complementarias y la secuencia del extremo 3'. En general, los cebadores optimos de PCR tienen generalmente 17-30 bases de longitud, y contienen aproximadamente 20-80%, tales como, por ejemplo, aproximadamente 50-60% de bases G + C. Temperaturas de fusion entre 50 y 80°C, por ejemplo, de aproximadamente 50 a 70°C, son tfpicamente preferidas. Para obtener mas directrices para el cebador de PCR y el diseno de la sonda vease, por ejemplo, Dieffenbach, C. W. y col., General Concepts for PCR Primer Design in: PCR Primer, A Laboratory Manual. Cold Spring Harbor Laboratory Press. Nueva York, 1995, pp. 133-155; Innis y Gelfand, Optimization of PCRs in: PCR Protocols, A Guide to Methods and Applications, CRC Press. London, 1994, pags. 5-11; y Plasterer, T. N. Primer select: Primer Primer and probe design. Methods Mol. Biol. 70: 520 - 527 (1997).
Analisis de micromatrices
La expresion diferencial tambien puede ser identificada, o confirmada usando la tecnica de micromatrices. Por lo tanto, el perfil de expresion de los MPM se puede medir en tejido tumoral fresco o embebido en parafina, utilizando la tecnologfa de las micromatrices. En este metodo, las secuencias polinucleotfdicas de interes (incluyendo ADNc y oligonucleotidos) se colocan en placas, o matrices, sobre un sustrato de microchip. Las secuencias en matrices (es decir, sondas de captura) se hibridan entonces con polinucleotidos espedficos de celulas o tejidos de interes (es decir, dianas). Al igual que en el metodo de RT-PCR, la fuente de ARN es tfpicamente ARN total aislado a partir de tumores humanos o lmeas celulares tumorales, y los correspondientes tejidos o lmeas celulares normales. De este modo, el ARN puede aislarse de una variedad de tumores primarios o lmeas celulares tumorales. Si la fuente de ARN es un tumor primario, el ARN puede extraerse, por ejemplo, de muestras de tejido congeladas o embebidas y
5
10
15
20
25
30
35
40
45
50
55
fijadas en parafina (FFPE) fijadas en formalina (por ejemplo, fijadas en formalina), que se preparan y conservan rutinariamente en la practica cUnica diaria.
En una realizacion espedfica de la tecnica de micromatrices, los insertos amplificados por PCR de clones de ADNc se aplican a un sustrato. El sustrato puede incluir hasta 1, 2, 5, 10, 15, 20, 25, 30, 35, 40, 45, 50, o 75 secuencias de nucleotidos. En otros aspectos, el sustrato puede incluir al menos 10.000 secuencias de nucleotidos. Las secuencias micromatrizadas, inmovilizadas en el microchip, son adecuadas para la hibridacion en condiciones rigurosas. Como otras realizaciones, las dianas para las micromatrices pueden tener al menos 50, 100, 200, 400, 500, 1000 o 2000 bases de longitud; o 50 -100, 100 - 200, 100 - 500, 100 - 1000, 100 - 2000 o 500 - 5000 bases de longitud. Como realizaciones adicionales, las sondas de captura para las micromatrices pueden ser al menos 10, 15, 20, 25, 50, 75, 80 o 100 bases de longitud; o 10-15, 10-20, 10-25, 10 - 50. 10-75, 10 - 80, o 20-80 bases de longitud.
Las sondas de ADNc marcadas fluorescentemente pueden generarse mediante la incorporacion de nucleotidos fluorescentes por transcripcion inversa del ARN extrafdo de los tejidos de interes. Las sondas de ADNc marcadas aplicadas al chip se hibridan con especificidad a cada punto del ADN en la matriz. Despues de un lavado riguroso para eliminar las sondas no espedficamente unidas, el chip es escaneado por microscopfa laser confocal o por otro metodo de deteccion, tal como una camara CCD. La cuantificacion de la hibridacion de cada elemento en forma de matriz permite la evaluacion de la abundancia del ARNm correspondiente. Con fluorescencia de doble color, las sondas de ADNc marcadas separadamente generadas a partir de dos fuentes de ARN se hibridan en parejas con la matriz. La abundancia relativa de las transcripciones de las dos fuentes correspondientes a cada gen especificado se determina asf simultaneamente.
La escala miniaturizada de la hibridacion proporciona una evaluacion conveniente y rapida del patron de expresion para un gran numero de genes. Se ha demostrado que tales metodos tienen la sensibilidad requerida para detectar transcritos raros, que se expresan en unas pocas copias por celula, y detectan reproduciblemente diferencias al menos aproximadamente dos veces en los niveles de expresion (Schena et al., Proc. Natl. Acad. Sci. USA 93 (2): 106 - 149 (1996)). El analisis de micromatrices puede ser realizado por equipos disponibles comercialmente, siguiendo los protocolos del fabricante, tales como, por ejemplo, utilizando la tecnologfa Affymetrix GenChip, la tecnologfa de micromatriz Illumina o la tecnologfa de micromatrices de Incyte. El desarrollo de metodos de micromatrices para el analisis a gran escala de la expresion genica hace posible buscar sistematicamente marcadores moleculares de la clasificacion del cancer y la prediccion de resultados en una variedad de tipos de tumores.
Aislamiento, purificacion y amplificacion de ARN
Los metodos generales para la extraccion del ARNm son bien conocidos en la tecnica y se describen en libros de texto convencionales de biologfa molecular, incluyendo Ausubel et al., Current Protocols of Molecular Biology, John Wiley and Sons (1997). Los metodos para la extraccion de ARN de tejidos embebidos en parafina se describen, por ejemplo, en Rupp y Locker, Lab Invest. 56: A67 (1987), y De Sandres et al., BioTechniques 18: 42044 (1995). En particular, el aislamiento del ARN se puede realizar usando el kit de purificacion, el sistema tampon, y la proteasa de los fabricantes comerciales, tales como Qiagen, segun las instrucciones del fabricante. Por ejemplo, el ARN total de celulas en cultivo puede aislarse usando mini-columnas Qiagen RNeasy. Otros kits de aislamiento de ARN comercialmente disponibles incluyen el Kit de Purificacion de ADN y ARN Completo MasterPure (EPICENTER (D, Madison, WT) y el Kit de Aislamiento de ARN de Bloque de Parafina (Ambion. Ca). El ARN total de muestras de tejido se puede aislar usando ARN Stat-60 (Tel-Test). El ARN preparado a partir de un tumor puede aislarse, por ejemplo, mediante centrifugacion en gradiente de densidad de cloruro de cesio.
Los pasos de un protocolo representativo para perfilar la expresion genica usando tejidos fijados embebidos en parafina como la fuente de ARN, incluyendo el aislamiento de ARNm, la purificacion, la extension del cebador y la amplificacion, se dan en varios artfculos publicados en revistas (por ejemplo, TE Godfrey y col. J. Molec. Diagnostics 2: 84 - 91 (2000); K. Specht et al., Am. J. Pathol. 158:419 - 29 (2001)). En resumen, un proceso representativo comienza con el corte de aproximadamente secciones de espesor 10 pm de muestras de tejido tumoral embebidas en parafina. A continuacion, se extrae el ARN y se eliminan la protema y el ADN. Despues del analisis de la concentracion de ARN, se pueden incluir etapas de reparacion y/o amplificacion de ARN, si es necesario, y el ARN es transcrito inversamente usando promotores espedficos de genes seguido de RT-PCR. Finalmente, los datos se analizan para identificar las mejores opciones de tratamiento disponibles para el paciente sobre la base del patron de expresion genica caractenstico identificado en la muestra de tumor examinada.
Inmunohistoqmmica y proteomica
Los metodos inmunohistoqmmicos son tambien adecuados para detectar los niveles de expresion de los marcadores de proliferacion de la presente invencion. De este modo, se utilizan anticuerpos o antisueros, preferiblemente antisueros policlonales, y lo mas preferiblemente anticuerpos monoclonales espedficos para cada marcador, para detectar la expresion. Los anticuerpos pueden detectarse por marcaje directo de los propios anticuerpos, por ejemplo, con marcadores radiactivos, marcadores fluorescentes, marcadores de haptenos tales como biotina o una enzima tal como peroxidasa de rabano picante o fosfatasa alcalina. Alternativamente, el anticuerpo primario no marcado se usa junto con un anticuerpo secundario marcado, que comprende antisueros, antisueros policlonales o
5
10
15
20
25
30
35
40
45
50
55
un anticuerpo monoclonal espedfico para el anticuerpo primario. Los protocolos y kits de inmunohistoqmmica son bien conocidos en la tecnica y estan comercialmente disponibles.
La proteomica puede usarse para analizar los polipeptidos presentes en una muestra (por ejemplo, tejido, organismo o cultivo celular) en un cierto punto del tiempo. En particular, pueden usarse tecnicas proteomicas para evaluar los cambios globales de expresion de polipeptidos en una muestra (tambien denominada proteomica de expresion). El analisis proteomico incluye tipicamente: (1) separacion de polipeptidos individuales en una muestra mediante electroforesis en gel 2-D (2-D PAGE); (2) identificacion de los polipeptidos individuales recuperados del gel, por ejemplo, por espectrometna de masas o secuenciacion N-terminal, y (3) analisis de los datos usando bioinformatica. Los metodos proteomicos son suplementos valiosos para otros metodos de perfiles de expresion genica, y pueden usarse solos o en combinacion con otros metodos para detectar los productos de los marcadores de proliferacion descritos en el presente documento.
Una vez que se ha evaluado el nivel de expresion de uno o mas marcadores pronosticos en una muestra de tumor, se puede determinar la probabilidad de que el cancer responda al tratamiento. Los inventores han identificado una serie de marcadores que se expresan diferencialmente en los melanomas que responden al tratamiento (buen pronostico) en comparacion con los melanomas que no responden al tratamiento (mal pronostico) en los conjuntos de datos del paciente. Los marcadores se exponen en la Tabla 1 y en el ejemplo siguiente.
Seleccion de genes expresados diferencialmente.
Una aproximacion a la seleccion de los genes considerados significativos implicaba simplemente mirar el "cambio de pliegue" de un determinado gen entre los dos grupos de interes. Mientras que este enfoque se centra en los genes que parecen cambiar de forma mas espectacular, la consideracion de las estadfsticas basicas nos lleva a darnos cuenta de que si la varianza (o nivel de ruido) es bastante alto (como se ve a menudo en los experimentos de micromatrices) entonces el cambio de pliegue aparentemente grande puede ocurrir con frecuencia por casualidad.
Los experimentos con micromatrices, como los descritos en este documento, implican tfpicamente la medicion simultanea de miles de genes. Si se comparan los niveles de expresion de un gen particular entre dos grupos (por ejemplo, tumores con buen pronostico y mal pronostico), las pruebas tfpicas de significacion (tales como la prueba t) no son adecuadas. Esto se debe a que en un conjunto de miles de experimentos (en este contexto cada gen constituye un "experimento"), la probabilidad de que al menos un experimento pase los criterios habituales de significacion por casualidad es esencialmente la unidad. En una prueba de significacion, tfpicamente se calcula la probabilidad de que la "hipotesis nula" sea la correcta. En el caso de comparar dos grupos, la hipotesis nula es que no hay diferencia entre los dos grupos. Si una prueba estadfstica produce una probabilidad para la hipotesis nula por debajo de algun umbral (usualmente 0,05 o 0,01), se afirma que podemos rechazar la hipotesis nula, y aceptar la hipotesis de que los dos grupos son significativamente diferentes. Claramente, en tal prueba, un rechazo de la hipotesis nula por casualidad solo podna esperarse 1 en 20 veces (o 1 en 100). El uso de pruebas t, u otras pruebas estadfsticas similares de significacion, fracasan en el contexto de las micromatrices, produciendo demasiados falsos positivos (o errores de tipo I).
En este tipo de situacion, donde se estan probando multiples hipotesis al mismo tiempo, se aplican procedimientos de comparacion multiples tfpicos, tal como el Metodo Bonferroni12. Sin embargo, tales pruebas son demasiado conservadoras para la mayona de los experimentos de micromatrices, lo que resulta en demasiados errores falsos negativos (tipo II).
Un enfoque mas reciente consiste en eliminar la tentativa de aplicar una probabilidad para que una prueba dada sea significativa y establecer un medio para seleccionar un subconjunto de experimentos, de modo que la proporcion esperada de errores de Tipo I (o tasa de descubrimiento falso13) se controla. Este enfoque ha sido utilizado en esta investigacion, a traves de diversas implementaciones; es decir, los metodos proporcionados con BRB Array Tools14, y el paquete limma15,16 de Bioconductor (que utiliza el entorno estadfstico R17,18).
Metodologfa general para la minena de datos: Generacion de firmas pronosticas
La minena de datos es la expresion utilizada para describir la extraccion de "conocimiento", en otras palabras el "saber-como", o capacidad predictiva de (normalmente) grandes volumenes de datos (el conjunto de datos). Este es el enfoque utilizado en este estudio para generar firmas pronosticas. En el caso de este estudio, el "saber-como" es la capacidad de predecir con exactitud el pronostico de un conjunto dado de mediciones de expresion genica, o "firma" (como se describe generalmente en esta seccion y con mas detalle en la seccion de ejemplos).
Los detalles espedficos utilizados para los metodos utilizados en este estudio se describen en los Ejemplos 17-20. Sin embargo, la aplicacion de cualquiera de los metodos de minena de datos (tanto los descritos en los Ejemplos como los descritos en este documento) puede seguir este protocolo general.
La minena de datos19, y el tema relacionado aprendizaje automatico20 es una tarea matematica compleja y repetitiva que implica el uso de uno o mas paquetes de software de computadora apropiados (vease abajo). El uso de software es ventajoso por un lado, ya que no es necesario estar completamente familiarizado con las complejidades de la teona detras de cada tecnica para poder utilizar con exito tecnicas de minena de datos, siempre que se
5
10
15
20
25
30
35
40
45
50
55
respete la metodologfa correcta. La desventaja es que la aplicacion de la minena de datos a menudo se puede ver como un "cuadro negro": uno inserta los datos y recibe la respuesta. La forma en que esto se logra se suele enmascarar del usuario final (este es el caso de muchas de las tecnicas descritas y, a menudo, puede influir en el metodo estadfstico elegido para la minena de datos. Por ejemplo, las redes neuronales y las maquinas vectoriales de soporte tienen una implementacion particularmente compleja que hace muy diffcil para el usuario final extraer las "reglas" utilizadas para producir la decision. Por otro lado, los k-vecinos mas cercanos y el analisis discriminante lineal tienen un proceso muy transparente para la toma de decisiones que no esta oculto al usuario.
Hay dos tipos de enfoques utilizados en la minena de datos: enfoques supervisados y no supervisados. En el enfoque supervisado, se conoce la informacion que esta siendo enlazada a los datos, tales como datos categoricos (por ejemplo, buen o mal pronostico). Lo que se requiere es la capacidad de vincular la respuesta observada (por ejemplo, buen vs. mal pronostico) a las variables de entrada. En el enfoque no supervisado, las clases dentro del conjunto de datos no se conocen de antemano, y la metodologfa de minena de datos se emplea para intentar encontrar las clases o la estructura dentro del conjunto de datos.
En el presente ejemplo se utilizo el enfoque supervisado y se discute en detalle en este documento, aunque se apreciara que se podna usar cualquiera de las otras tecnicas.
El protocolo general incluye los siguientes pasos:
- Representacion de datos. Esto implica la transformacion de los datos en una forma que es mas probable que funcione con exito con la tecnica de minena de datos escogida. En donde los datos son numericos, tal como en este estudio donde los datos que se investigan representan niveles relativos de expresion genica, esto es bastante simple. Si los datos cubren un amplio rango dinamico (es decir, muchos ordenes de magnitud) a menudo se toma el log de los datos. Si los datos abarcan muchas mediciones de muestras separadas en dfas separados por investigadores independientes, se debe tener especial cuidado para asegurar que el error sistematico se minimice. La minimizacion del error sistematico (es decir, los errores resultantes de diferencias de protocolo, diferencias de maquina, diferencias de operador y otros factores cuantificables) es el proceso al que se hace referencia en este documento como "normalizacion".
- Seleccion de caractensticas. Normalmente, el conjunto de datos contiene muchos mas elementos de datos de los que sena practico medir en el dfa a dfa, y ademas muchos elementos que no proporcionan la informacion necesaria para producir un modelo de prediccion. La capacidad real de un modelo de prediccion para describir un conjunto de datos se deriva de algun subconjunto de la dimensionalidad completa del conjunto de datos. Estas dimensiones son los componentes (o caractensticas) mas importantes del conjunto de datos. Tengase en cuenta en el contexto de los datos de micromatrices que las dimensiones del conjunto de datos son los genes individuales. La seleccion de caractensticas, en el contexto descrito en este documento, implica encontrar aquellos genes que son mas "expresados diferencialmente". En un sentido mas general, involucra a aquellos grupos que pasan una cierta prueba estadfstica de significacion, es decir, el nivel de una variable particular consistentemente mayor o menor en uno u otro de los grupos investigados. A veces las caractensticas son aquellas variables (o dimensiones) que exhiben la mayor varianza.
La aplicacion de la seleccion de caractensticas es completamente independiente del metodo utilizado para crear un modelo de prediccion, e implica una gran cantidad de experimentacion para lograr los resultados deseados. Dentro de esta invencion, la seleccion de genes significativos implico la seleccion de caractensticas. Ademas, los metodos de reduccion de datos (tal como el analisis de componentes principales) se pueden aplicar al conjunto de datos.
- Instruccion. Una vez que se han establecido las clases (por ejemplo, el pronostico bueno/malo) y las caractensticas del conjunto de datos, y los datos se representan en una forma aceptable como entrada para la minena de datos, se aplica el conjunto de datos reducido (como se describe por las caractensticas) al modelo de prediccion de eleccion. La entrada para este modelo suele ser en forma de una entrada numerica multidimensional, (conocida como vector), con informacion de salida asociada (un marcador de clase o una respuesta). En el proceso de instruccion, los datos seleccionados se introducen en el modelo de prediccion, ya sea secuencialmente (en tecnicas tales como las redes neuronales) o como un todo (en tecnicas que aplican algun tipo de regresion, tales como los modelos lineales, analisis discriminante lineal, maquinas vectoriales de apoyo). En algunos casos (por ejemplo, k-vecinos mas cercanos) el conjunto de datos (o subconjunto del conjunto de datos obtenido despues de la seleccion de caractensticas) es en sf mismo el modelo. Como se discutio, se pueden establecer modelos efectivos con una comprension minima de las matematicas detalladas, a traves del uso de varios paquetes de software donde los parametros del modelo han sido predeterminados por los analistas expertos como los mas probables para conducir a resultados exitosos.
- Validacion. Este es un componente clave del protocolo de la minena de datos, y la aplicacion incorrecta de esta con frecuencia conduce a errores. Porciones del conjunto de datos deben estar aparte, aparte de la seleccion de caractensticas y de la instruccion, para probar el exito del modelo de prediccion. Ademas, si los resultados de la validacion se utilizan para efectuar la seleccion de caractensticas y la instruccion del modelo, entonces se obtiene un conjunto de validacion adicional para probar el modelo antes de que se aplique a situaciones de la vida real. Si este
5
10
15
20
25
30
35
40
45
50
proceso no es estrictamente respetado, el modelo probablemente fallara en situaciones del mundo real. Los metodos de validacion se describen con mas detalle a continuacion.
- Aplicacion. Una vez que el modelo ha sido construido y validado, debe ser empaquetado de alguna manera y ser accesible para los usuarios finales. Esto a menudo implica la implementacion de alguna forma de aplicacion de hoja de calculo, en la que el modelo se ha incrustado con automatizacion de un paquete de software estadfstico o refactorizacion del modelo en una aplicacion codificada por el personal de tecnologfa de la informacion.
Ejemplos de paquetes de software que se utilizan con frecuencia son:
- Complementos de hoja de calculo, obtenidos de multiples vendedores.
- El entorno estadfstico R.
- Los paquetes comerciales MatLab, S-plus, SAS, SPSS, STATA.
- Software libre de codigo abierto, como Octave (un clon de MatLab)
- muchas y variadas bibliotecas C++, que pueden ser utilizadas para implementar modelos de prediccion en un entorno comercial, de codigo cerrado.
Ejemplos de metodos de minena de datos
Los metodos descritos en este documento se pueden llevar a cabo realizando primero la etapa de minena de datos (arriba) y, a continuacion, aplicando los paquetes de software conocidos apropiados. Una descripcion mas detallada del proceso de minena de datos se describe en detalle en muchos textos escritos muy bien19.
- Modelos lineales19,21: Los datos se tratan como la entrada de un modelo de regresion lineal, de los cuales los marcadores de clase o variables de respuestas son la salida. Los marcadores de clase u otros datos categoricos deben ser transformados en valores numericos (normalmente enteros). En modelos lineales generalizados, los marcadores de clase o las variables de respuesta no estan relacionadas de forma lineal con los datos de entrada, sino que se transforman mediante el uso de una "funcion de enlace". La regresion logfstica es la forma mas comun del modelo lineal generalizado.
- Analisis Discriminante Lineal ’ . Siempre que los datos sean linealmente separables (es decir, los grupos o
clases de datos puedan ser separados por un hiperplano, que es una extension n-dimensional de un umbral), esta tecnica puede aplicarse. Se utiliza una combinacion de variables para separar las clases, de modo que la varianza entre grupos se maximice y la varianza dentro del grupo se minimice. El subproducto de esto es la formacion de una regla de clasificacion. La aplicacion de esta regla a muestras de clase desconocida permite hacer predicciones o clasificacion de la pertenencia a la clase para esa muestra. Existen variaciones del analisis discriminante lineal, tales como los centroides reducidos mas cercanos que se utilizan comunmente para el analisis de micromatrices.
- Maquinas vectoriales de apoyo24: Se utiliza una coleccion de variables conjuntamente con una coleccion de pesos para determinar un modelo que maximice la separacion entre clases en terminos de esas variables ponderadas. La aplicacion de este modelo a una muestra produce una clasificacion o prediccion de la pertenencia a la clase para esa muestra.
- Redes neuronales23: Los datos se tratan como la entrada en una red de nodos, que se asemejan superficialmente a neuronas biologicas, que aplican la entrada de todos los nodos a los que estan conectados y transforman la entrada en una salida. Comunmente, las redes neuronales utilizan el algoritmo "multiplicar y sumar" para transformar las entradas de multiples nodos de entrada conectados en una sola salida. Un nodo no necesariamente produce una salida a menos que las entradas a ese nodo excedan un cierto umbral. Cada nodo tiene como entrada la salida de varios otros nodos, estando el nodo de salida final ligado generalmente a una variable categorica. El numero de nodos y la topologfa de los nodos se pueden variar en formas casi infinitas, proporcionando la capacidad de clasificar datos extremadamente ruidosos que no pueden ser clasificados de otras maneras. La implementacion mas comun de las redes neuronales es el perceptron multicapa.
Arboles de clasificacion y regresion25: En ellos, las variables se utilizan para definir una jerarqrna de reglas que se puede seguir de forma escalonada para determinar la clase de una muestra. El proceso tfpico crea un conjunto de reglas que conducen a una salida de clase espedfica, o una declaracion espedfica de la incapacidad para discriminar. Un arbol de clasificacion de ejemplo es una implementacion de un algoritmo tal como:
si el gen A> x y el gen Y > x y el gen Z = z
entonces
la clase A
si no el gen A = q
5
10
15
20
25
30
35
40
45
50
entonces clase B
Metodos vecinos mas cercanos22,23. Las predicciones o clasificaciones se realizan comparando una muestra (de clase desconocida) con las que la rodean (de clase conocida), con la proximidad definida por una funcion de distancia. Es posible definir muchas funciones de distancia diferentes. Las funciones de distancia usadas comunmente son la distancia euclidiana (una extension de la distancia pitagorica, como en la triangulacion, a n- dimensiones), diversas formas de correlacion (incluido el coeficiente de correlacion de Pearson). Tambien hay funciones de transformacion que convierten puntos de datos que normalmente no estanan interconectados por una metrica de distancia significativa en el espacio euclidiano, de manera que la distancia euclfdea puede aplicarse (p. ej. distancia de Mahalanobis). Aunque la metrica de la distancia puede ser bastante compleja, la premisa basica de los k vecinos mas cercanos es bastante simple, siendo esencialmente una reafirmacion de "encontrar los vectores de datos k que son mas similares a la entrada desconocida, averiguar a que clase corresponden, y votar en cuanto a que clase la entrada desconocida es".
Otros metodos:
- Redes bayesianas. Un grafico adclico dirigido se utiliza para representar una coleccion de variables en conjuncion con su distribucion de probabilidad conjunta, que se utiliza entonces para determinar la probabilidad de pertenencia a una muestra.
- Analisis de componentes independientes, en los que las senales independientes (por ejemplo, pertenencia a la clase) se vuelven a aislar (en componentes) de una coleccion de variables. Estos componentes pueden usarse entonces para producir una clasificacion o prediccion de la pertenencia a la clase de una muestra.
Metodos de aprendizaje en conjunto en los que se combinan una coleccion de metodos de prediccion para producir una clasificacion o prediccion conjunta de la pertenencia a una muestra
Hay muchas variaciones de estas metodologfas que pueden ser exploradas19, y muchas nuevas metodologfas estan constantemente siendo definidas y desarrolladas. Se apreciara que cualquiera de estas metodologfas puede aplicarse para obtener un resultado aceptable. Se debe prestar especial atencion a evitar la sobreequipacion, asegurando que todos los resultados se prueban a traves de un esquema de validacion integral.
Validacion
La aplicacion de cualquiera de los metodos de prediccion descritos implica la instruccion y validacion cruzada12,26 antes de que el metodo pueda ser aplicado a nuevos conjuntos de datos (tales como datos de un ensayo clmico). La instruccion involucra tomar un subconjunto del conjunto de datos de interes (en este caso medidas de expresion genica a partir de melanoma), de tal manera que este estratificado a traves de las clases que se estan probando (en este caso tumores con buena o mala probabilidad de progresion rapida). Este conjunto de instruccion se utiliza para generar un modelo de prediccion (definido anteriormente), que se prueba en el resto de los datos (el conjunto de pruebas).
Es posible alterar los parametros del modelo de prediccion para obtener un mejor rendimiento en el conjunto de pruebas, sin embargo, esto puede conducir a la situacion conocida como sobreequipamiento, donde el modelo de prediccion funciona en el conjunto de datos de la instruccion, pero no en cualquier conjunto de datos externo. Para evitar esto, se sigue el proceso de validacion. Hay dos tipos principales de validacion tipicamente aplicados, la primera (validacion de espera) implica dividir el conjunto de datos en tres grupos: prueba, instruccion y validacion. El conjunto de validacion no tiene ninguna entrada en el proceso de instruccion en absoluto, de modo que cualquier ajuste de parametros u otros refinamientos debe tener lugar durante la aplicacion al conjunto de pruebas (pero no el conjunto de validacion). El segundo tipo principal es la validacion cruzada, que puede aplicarse de varias maneras diferentes, descritas a continuacion.
Existen dos subtipos principales de validacion cruzada: la validacion cruzada de K-fold y la validacion cruzada leave- one-out. Validacion cruzada K-fold: El conjunto de datos se divide en K submuestras, cada submuestra que contiene aproximadamente las mismas proporciones de los grupos de clase que el original.
En cada ronda de validacion, una de las submuestras K se deja a un lado, y la instruccion se logra utilizando el resto del conjunto de datos. La efectividad de la instruccion para esa ronda se calcula con la correccion de la clasificacion del grupo excluido. Este procedimiento se repite K veces, y la efectividad general se determina mediante la comparacion de la clase predicha con la clase conocida.
Validacion cruzada "leave-one-out": Una variacion comunmente utilizada de la validacion cruzada de K-fold, en la que K = n, donde n es el numero de muestras.
Combinaciones de MPMS, tales como los descritos anteriormente en la Tabla 1, pueden usarse para construir modelos predictivos para el pronostico.
5
10
15
20
25
30
35
40
45
50
Firmas de pronostico
Las firmas pronosticas, que comprenden uno o mas de estos marcadores, pueden usarse para determinar el resultado de un paciente, mediante la aplicacion de uno o mas modelos predictivos derivados de la firma. En particular, un clmico o investigador puede determinar la expresion diferencial (por ejemplo, aumento o disminucion de la expresion) de uno o mas marcadores en la firma, aplicar un modelo predictivo y predecir asf el pronostico negativo, por ejemplo, la probabilidad de recidiva de la enfermedad de un paciente, o, alternativamente, la probabilidad de un pronostico positivo (remision continua).
Se ha desarrollado una firma pronostica. Como se describe en el Ejemplo a continuacion, se ha establecido una firma pronostica que comprende 22 genes a partir de un conjunto de pacientes con melanoma (Tabla 1). Mediante la obtencion de una muestra de paciente (por ejemplo, una muestra de tumor) y haciendo coincidir los niveles de expresion de uno o mas marcadores en la muestra con el perfil de expresion diferencial, puede determinarse la probabilidad de que el cancer progrese rapidamente.
Ensayos de farmacos
La presente invencion tambien se puede usar para seleccionar individuos para ensayos de farmacos particulares. Al establecer el pronostico de un individuo con melanoma, entonces se puede tomar una mejor decision sobre si un paciente debe someterse a un tratamiento convencional para el que es probable que responda, o si debe participar en un ensayo de farmaco particular que tenga como objetivo un determinado tipo de tumor o etapa.
La seleccion de pacientes con un corto tiempo predicho hasta la progresion de la enfermedad tambien permitina el acortamiento de la duracion de los ensayos con farmacos y permitina que menos pacientes se inscribieran para obtener datos estadfsticamente significativos sobre la respuesta a los farmacos.
EJEMPLOS
Los ejemplos descritos en este documento tienen el fin de ilustrar las realizaciones de la invencion. Otras realizaciones, metodos y tipos de analisis estan dentro del alcance de las personas con conocimientos ordinarios en las tecnicas de diagnostico molecular y no necesitan ser descritos en detalle a continuacion.
Para investigar los mecanismos biologicos dentro de los tumores que pueden afectar al resultado clmico en el melanoma en estadio III, se realizo el perfil de expresion genica en un conjunto inicial de 29 muestras de melanoma de pacientes con diversos resultados clmicos despues de linfadenectoirna para el melanoma de estadio IIIB y IIIC. A continuacion, esto se utilizo para predecir prospectivamente el resultado clmico basado en un perfil molecular en dos conjuntos de validacion independientes que comprendfan 10 y 14 pacientes. Utilizando esta informacion molecular, se identificaron tambien vfas celulares y redes que pueden ser reguladas diferencialmente entre los dos grupos de pacientes y que son posibles blancos para la intervencion terapeutica.
Materiales y metodos
Coleccion de muestras y seleccion para analisis de micromatrices
El esquema general de los experimentos realizados se representa en la Figura 3. El tejido de melanoma ex vivo de 29 pacientes que se sometieron a linfadenectornfa quirurgica para nodulos clmicamente palpables entre 1997 y 2004 en Austin Health fueron seleccionados para el analisis de micromatrices. Todos los espedmenes fueron recolectados bajo un protocolo de adquisicion de tejidos aprobado por el Comite de Etica de Investigacion Humana de Salud de Austin y con el consentimiento informado por escrito de cada paciente. Los espedmenes congelados instantaneos se incrustaron en el compuesto optimo de temperatura de corte (OCT) y se almacenaron como bloques de tejido a -80°C dentro del repositorio de bancos de tejidos Ludwig/Austin. El diagnostico fue confirmado por un patologo en todos los casos.
Las muestras de pacientes se seleccionaron para el analisis de micromatrices en base al tiempo transcurrido hasta la progresion tumoral (TTP) de la fase III a la enfermedad en estadio IV e incluyeron 16 pacientes con pronosticos "malos" (media de TTP 4 meses) y 13 "buenos" (media de TTP 42 meses). Los examenes postoperatorios en una Unidad de Melanoma dedicada se realizaron mensualmente durante los 12 meses iniciales despues de la linfadenectornfa, seguido de tres y seis revisiones mensuales despues de acuerdo con el requisito clmico hasta cuatro anos, con revision anual posterior. Las investigaciones de estadificacion se realizaron segun sospecha clmica o rutinariamente cada 3-6 meses.
Los tejidos se consideraron aceptables para este estudio si una necrosis minima estaba presente y las celulas tumorales comprendfan al menos el 60% de la poblacion celular total. En el momento de la extraccion de ARN, dos cortes de 5 pm fueron cortados y tenidos con hematoxilina y eosina para asegurar la integridad del tejido extrafdo.
Extraccion de ARN y smtesis de ADNc
La smtesis de ADNc y la hibridacion con un diseno de referencia comun se realizaron por duplicado para los 29 pacientes seleccionados. Se extrajo el ARN total de tejido embebido por OCT sumergiendo y homogeneizando las
5
10
15
20
25
30
35
40
45
50
55
secciones de tejido en Tri-reactivo (Molecular Research Center, Cincinnati, OH). Se anadieron 1,5 ml de cloroformo al homogeneizado, se centrifugo la muestra y se retiro la fase superior y se mezclo con etanol al 100%. La purificacion utilizando una columna RNeasy se realizo de acuerdo con las instrucciones del fabricante (Qiagen, Valencia, CA). La calidad del ARN se confirmo sobre la base de 260: 280 relaciones de absorbancias y la integridad se inspecciono en geles de formaldetudo-agarosa frente a marcadores estandar de ARNr. El ADNc se sintetizo a partir de 20 pg de ARN en presencia de oligo(dT) y aminoalil desoxinucleotido. Se acoplaron colorantes Cy (Amersham Biosciences, Buckinghamshire, RU) a ADNc de tumor y ADNc de referencia producidos en paralelo. El ADNc de referencia se sintetizo a partir del ARN agrupado de una variedad de tumores y lmeas celulares incluyendo melanoma, asf como de tejidos normales (vease la Figura 4).
Matrices de oligonucleotidos y analisis de datos
30.888 sondas de oligonucleotidos, que representan genes individuales y controles internos, se obtuvieron de MWG Biotech (Erbesberg, Alemania) y se detectaron como matrices de alta densidad utilizando un robot Omnigrid (Gene Machines, San Carlos, CA). El ADNc de tumor/referencia marcado fue co-hibridizado y escaneado usando un escaner de micromatrices Genepix 4000A (Axon Instruments, Union City, CA). La superposicion de la matriz se alineo con la imagen escaneada y la extraccion de caractensticas se realizo utilizando el software Gene Pix v6.0 (Axon Instruments, Foster City, CA). Los datos brutos se analizaron utilizando GeneSpring v7.2 (Silicon Genetics, Redwood City, CA). Los datos se normalizaron al grupo “print-tip” y luego se normalizaron con la mediana. En resumen, una curva de baja se ajusto a la representacion de log-intensidad frente a log-ratio. El veinte por ciento de los datos se utilizo para calcular el ajuste de baja en cada punto. Esta curva se utilizo para ajustar el valor de control para cada medicion. Cada gen se dividio entonces por la mediana de sus mediciones en todas las muestras.
Los datos para el grupo de validacion independiente B del estudio de melanoma EORTC27 se pusieron a disposicion a traves del repositorio de datos publico Array Express;
http://www.ebi.ac.uk/arrayexpress/. Los datos se cargaron en Genespring v7.2 y se normalizaron por punto, por chip y por gen. En resumen, la intensidad medida de cada gen se dividio por su valor de canal de control en cada muestra y luego se dividio por el percentil 50 de todas las mediciones de esa muestra. Finalmente, cada gen se dividio por la mediana de sus mediciones en todas las muestras. Los valores de expresion de los genes expresados diferencialmente se utilizaron para calcular una puntuacion predictiva como se describe a continuacion.
Metodos estadfsticos
Los datos de expresion genica se sometieron primero a un filtro que exclrna las sondas que no estaban presentes en todas las muestras. De las 30.888 sondas iniciales consideradas, 18.807 pasaron este filtro y se usaron para el analisis de la varianza, la agrupacion jerarquica y el analisis de componentes principales. Los genes expresados diferencialmente se descubrieron realizando una prueba de Wilcoxon-Mann-Whitney con el metodo de control de tasa de descubrimiento falso de Benjamini y Hochberg28 usado para corregir la correccion de multiples pruebas basandose en un valor de corte de 0,05. La agrupacion jerarquica de las muestras se realizo mediante la correlacion de Spearman como la funcion de distancia y el promedio de vinculacion.
PCR cuantitativa en tiempo real (qPCR)
La qPCR se realizo en genes diferencialmente expresados para confirmar los resultados de la matriz y, a continuacion, en la validacion del predictor utilizando la validacion conjunto A. La primera cadena ADNc fue sintetizada a partir de 2 pg del ARN total extrafdo para el experimento de matriz usando un cebador de hexamero al azar (Promega, Madison, WI). Se obtuvieron controles negativos omitiendo la trancriptasa inversa. Se disenaron ensayos de multiplexion de intrusion para qPCR (vease la Figura 5 para el diseno de ensayo) usando el centro de diseno de ensayos Universal Probe Library
https://www.roche-applied-science.com/ (Roche, Mannheim, Alemania). Todas las reacciones se llevaron a cabo por duplicado usando el detector de secuencia ABI 7700 (Applied Biosystems, Foster City, CA). Las condiciones del termociclador fueron las siguientes: 50°C durante 2 minutos, 95°C durante 10 minutos seguido de 40 ciclos de 94°C durante 20 segundos y 60°C durante 45 segundos. Todos los resultados se normalizaron a la amplificacion 18S (Applied Biosystems, Foster City, CA). Se calculo la expresion relativa utilizando el valor umbral objetivo (CT) para referencia como el comparador de los inventores29.
A continuacion, se representaron los valores de expresion relativos para los genes individuales a lo largo de los valores de las matrices de la relacion Iog2 normalizada y se calcularon los coeficientes de correlacion.
Resultados
Se enumeran las caractensticas clmicas y patologicas de los pacientes incluidos en el conjunto de pruebas y el conjunto de validacion A (vease la figura 6). Todos los pacientes teman informacion sobre la edad en el diagnostico inicial, el sexo, y el numero y la localizacion de las metastasis ganglionares linfaticas positivas. No todos los pacientes tuvieron su diagnostico inicial realizado en el hospital de los inventores, por lo que en algunos casos no se pudo determinar si la ulcera estaba presente en el melanoma primario. La ulcera en el primario es un factor pronostico independiente que, si se presenta, altera la enfermedad del BIII a IIIC30.
5
10
15
20
25
30
35
40
45
50
El promedio de TTP para el grupo de "buen" pronostico fue de 40 meses en comparacion con 4 meses en el grupo "malo". No hubo diferencias estad^sticamente significativas en la edad mediana y el sexo entre los grupos, aunque el grupo "bueno" pareda mas joven y contema mas mujeres. No hubo diferencias estad^sticamente significativas en otras caractensticas pronosticas conocidas, incluyendo la estadificacion de AJCC, el uso de interferon adyuvante y la presencia de linfocitos infiltrantes de tumores, aunque hubo una limitacion del tamano de la muestra.
Un paciente habfa aislado la enfermedad del estadio IV confinada al bazo resecado, pero dado que permanecio sin enfermedad, esta muestra se incluyo. La exclusion de esta muestra no altero el perfil de expresion genica.
Los genes diferencialmente expresados segregan los dos grupos pronosticos
El agrupamiento jerarquico no supervisado no revelo subgrupos de melanomas que se correlacionaban con el pronostico u otra informacion clmica, lo que se esperaba dadas las similitudes entre las muestras. Para investigar genes que pudieran segregar efectivamente los grupos pronosticos, se investigo la expresion genica diferencial. 2.140 genes fueron expresados diferencialmente entre los dos grupos, sin embargo, la aplicacion estricta de multiples pruebas de correccion redujo esto a 22 genes con expresion diferencial altamente significativa (Figura 1]. Los 22 genes fueron ademas validados en el conjunto de instruccion utilizando qPCR y los genes con el mayor coeficiente de correlacion entre las dos plataformas (r> 0,5, p <0,05) fueron seleccionados para el analisis posterior (datos no presentados). De los 22 iniciales, quince genes mostraron una alta correlacion multiplataforma y estos se utilizaron en el desarrollo de una puntuacion predictiva. El analisis de componentes principales demostro la capacidad de los 15 genes para segregar los grupos pronosticos (Figura 7).
Desarrollo de puntuaciones predictivas
El conjunto de prueba inicial se utilizo para desarrollar un predictor que se probo en dos conjuntos de validacion independientes. Dos algoritmos predictivos se desarrollaron sobre la base de los datos de la matriz y, entonces, los datos qPCR:
1. Para calcular una puntuacion predictiva de los datos de la matriz (aPS), los quince genes con la correlacion mas significativa entre la matriz y qPCR se utilizaron. Las relaciones de expresion de Iog2 normalizadas se transformaron elevando los valores a la potencia de dos. Los genes desregulados en el grupo pronostico “bueno” se atribuyeron a un valor negativo. La puntuacion final se calculo entonces por la suma de los valores para los quince genes. Una puntuacion positiva se asocio con un mejor resultado.
2. Para los datos qPCR (qPS), se aplicaron valores AA CT para los quince genes mas correlacionados a un algoritmo de regresion logfstica que utiliza el Criterio de Informacion de Akaike para seleccionar solamente a aquellos genes que contribuyen a la distincion de clase. Esto selecciono cinco genes significativos que se utilizaron entonces en la siguiente ecuacion:
qPS = [1328,15-187,42(IDH) + 137,10(MFG8) + 73,61(PILRA) + 211,22(HLA-E) + 143,94(TXNDCS)] x -1 Al igual que con el SPA, una puntuacion positiva se asocio con el mejor resultado utilizando este metodo.
Las puntuaciones predictivas se correlacionan con TTP y la supervivencia
Como se esperaba, tanto el aPS como el qPS aplicados al conjunto de prueba eran capaces de distinguir los dos grupos pronosticos. Una fuerte correlacion entre las puntuaciones individuales y ambas TTP y la supervivencia global fueron evidentes, de tal manera que la magnitud de las puntuaciones individuales (puntuaciones altas con aPS y puntuaciones negativas para qPS) se correlacionaron con el mejor resultado tanto para qPS como para aPS (Figura 8, correlacion Spearman Rank r = 0,7908, p< 0,0001). Esto sugiere que el nivel de expresion de estos genes expresados diferencialmente esta relacionado con mecanismos biologicos subyacentes que influyen directamente en el resultado clmico, enfatizando su relevancia pronostica.
Aplicacion de la puntuacion predictiva a tres conjuntos independientes
Los resultados se aplicaron luego en datos generados independientemente. Se identifico un conjunto de datos publicado con un subgrupo de pacientes similares a los nuestros. De los 83 pacientes que fueron perfilados en este estudio27, 14 teman estadio III de enfermedad con seguimiento a largo plazo. En este subgrupo, diez pacientes habnan sido clasificados como "malos" (media de TTP 10 meses) y cuatro "buenos" (promedio de TTP 62 meses) utilizando criterios similares aplicados en el conjunto de pruebas de los inventores. Cuando se aplico el algoritmo aPS a estas muestras, se pronosticaron correctamente todos los diez pacientes "malos" y dos de los cuatro "buenos" pacientes, obteniendose una tasa de clasificacion global correcta del 85%.
A continuacion, se aplico el algoritmo qPS a un conjunto independiente de diez tumores del banco de tejidos Ludwig/Austin para el que se llevaron a cabo ensayos qPCR utilizando los cinco genes mas poderosamente predictivo. El predictor correctamente clasifico a los cinco de los "buenos" tumores pronostico, pero clasifico mal una de las cinco muestras "malas" (Figura 9). La muestra "mala" clasificada incorrectamente representaba a un paciente
5
10
15
20
25
30
35
40
45
en el que la TTP era breve, pero que tema una supervivencia global prolongada de seis anos con enfermedad metastasica.
El gen cinco qPS tambien se aplico a un tercer grupo independiente de la etapa 3 de las muestras de melanoma. Estas muestras se compoman de 19 pacientes con supervivencia de menos de 18 meses despues del diagnostico de la enfermedad en estadio 3 y otros 18 pacientes que sobrevivieron mas de cuatro anos a partir del diagnostico de estadio 3. Las distribuciones de las puntuaciones de qPS de estos buenos y malos grupos pronostico fueron significativamente diferentes (p = 0,02) y se muestran en la Figura 10.
Discusion
Este ejemplo muestra la prediccion exitosa del resultado clmico en un grupo indistinguible de pacientes de melanoma de estadio III utilizando un perfil de expresion derivado de datos de expresion genica de micromatrices y qPCR. En dos conjuntos independientes se ha establecido que los dos algoritmos de puntaje predictivo desarrollados, que se basan en 15 genes expresados diferencialmente, se pueden aplicar a los datos de micromatrices y qPCR para predecir prospectivamente el resultado clmico en pacientes con melanoma en estadio IIIB/C.
Estos pacientes fueron seleccionados para una enfermedad en estadio similar y varios estudios han demostrado mas similitudes en la expresion genica entre muestras autologas tomadas en diferentes etapas que entre pacientes con enfermedad en estadio similar27,31,32. La observacion de que hay genes expresados diferencialmente entre los grupos que pueden usarse para predecir prospectivamente el resultado con un 92% de precision, subraya su importancia. Ademas, la correlacion del predictor con TTP y la supervivencia general tambien resaltan la utilidad del predictor de tal manera que la magnitud de la diferencia en las puntuaciones se correlaciona directamente con el resultado clmico.
Aunque la invencion se ha descrito a modo de ejemplo y con referencia a posibles realizaciones de la misma, debe apreciarse que pueden realizarse mejoras y/o modificaciones sin apartarse del alcance de la misma.
Referencias
1. Australian Institute of Health and Welfare (AIHW): Cancer in Australia 2001. Canberra, Australian Institute of Health and Welfare Australasian Association of Cancer Registries (AACR), 2004.
2. Florez A, Cruces M: Melanoma epidemic: true or false? Int J Dermatol 43:405-7, 2004.
3. Thursfield V, Farrugia H, Giles G: Cancer in Victoria 2004, Canstat. Victoria, Cancer Epidemiology Centre, 2006, pp 32.
4. Thompson JF, Scolyer RA, Kefford RF: Cutaneous melanoma. Lancet 365:687-701,2005.
5. Verma S, Quirt I, McCready D, et al: Systematic review of systemic adjuvant therapy for patients at high risk for recurrent melanoma. Cancer 106:1431-42, 2006.
6. Hersey P: Adjuvant therapy for high-risk primary and resected metastatic melanoma. Intern Med J 33:33-43, 2003.
7. Kirkwood JM, Manola J, Ibrahim J, et al: A pooled analysis of eastern cooperative oncology group and intergroup trials of adjuvant high-dose interferon for melanoma. Clin Cancer Res 10:1670-7, 2004.
8. Sondak VK, Sabel MS, Mule JJ: Allogeneic and autologous melanoma vaccines: where have we been and where are we going? Clin Cancer Res 12:2337s-2341s, 2006.
9. Balch CM, Sober AJ, Soong SJ, et al: The new melanoma staging system. Semin Cutan Med Surg 22:42-54, 2003
10. Kirkwood JM, Strawderman MH, Ernstoff MS, et al: Interferon alfa-2b adjuvant therapy of high-risk resected cutaneous melanoma: the Eastern Cooperative Oncology Group Trial EST 1684. J Clin Oncol 14:7-17, 1996.
11. Kirkwood JM, Ibrahim JG, Sondak VK, et al: High- and low-dose interferon alfa-2b in high-risk melanoma: first analysis of intergroup trial E1690/S9111/C9190. J Clin Oncol 18:2444-58, 2000.
12. Efron, B. and Tibshirani, R. An Introduction to the Bootstrap. Chapman & Hall. 2005.
13. McLaughlan GJ, Do K, Ambroise C Analyzing Microarray Gene Expression Data (Wiley Series in Probability and Statistics) 2004.
14. Wright GW, Simon RM A random variance model for detection of differential gene expression in small microarray experiments. Bioinformatics 2003;19:2448-2455.
15. Smyth GK. Linear models and empirical Bayes methods for assessing differential expression in microarray experiments. Statistical Applications in Genetics and Molecular Biology 2004; 3:Article 3.
5
10
15
20
25
30
16. Lonnstedt I. and Speed TP. Replicated microarray data. Statistica Sinica 2002;12:31-46.
17. Ihaka R, Gentleman R. R: A language for data analysis and graphics. Journal of Computational and Graphical Statistics 1996;5:299-314.
18. Becker RA, Chambers, JM and Wilks AR The New S Language. Wadsworth & Brooks/Cole 1988.
19. Hastie T, Tibshirani R, Friedman J The Elements of Statistical Learning Data Mining, Inference and Prediction Springer 2003.
20. Gentleman R., Carey VJ, Huber W., Irizarry RA, Dudoit S. Bioinformatics and Computational Biology Solutions Using R and Bioconductor. Springer 2005.
21. Neter J, Kutner MH, Wasserman W, Nachtsheim CJ, Applied Linear Statistical Models McGraw-Hill/Irwin 1996 22. Venables, WN, Ripley, BD Modern Applied Statistics with S. 4th ed.. Springer 2002.
23. Ripley, B. D. Pattern Recognition and Neural Networks Cambridge University Press 1996.
24. Cristianini N, Shawe-Taylor J An Introduction to Support Vector Machines (and other kernel-based learning methods) Cambridge University Press 2000.
25. Breiman L, Friedman J, Stone CJ, Olshen RA Classification and Regression Trees Chapman & Hall/CRC 1984.
26. Good, PI Resampling Methods: A Practical Guide to Data Analysis Birkhauser 1999.
27. Winnepenninckx V, Lazar V, Michiels S, et al: Gene expression profiling of primary cutaneous melanoma and clinical outcome. J Natl Cancer Inst 98:472-82, 2006.
28. Benjamini Y, Hochberg Y: Controlling the false discovery rate: a practical and powerful approach to multiple testing. Journal of the Royal Statistical Society 57:289-300, 1995.
29. Livak KJ, Schmittgen TD: Analysis of relative gene expression data using real-time quantitative PCR and the 2(- Delta Delta C(T)) Method. Methods 25:402-8, 2001.
30. Balch CM, Sober AJ, Soong SJ, et al: The new melanoma staging system. Semin Cutan Med Surg 22:42-54, 2003.
31. Wang E, Miller LD, Ohnmacht GA, et al: Prospective molecular profiling of melanoma metastases suggests classifiers of immune responsiveness. Cancer Res 62:3581-6, 2002.
32. Ramaswamy S, Ross KN, Lander ES, et al: A molecular signature of metastasis in primary solid tumors. Nat Genet 33:49-54, 2003
Aplicabilidad industrial
Los metodos, composiciones, kits y dispositivos descritos en este documento, que estan basados en marcadores de cancer pronosticos, espedficamente marcadores de pronostico de melanoma, son utiles para el pronostico y tratamiento del cancer, particularmente del melanoma.

Claims (13)

  1. 5
    10
    15
    20
    25
    30
    35
    40
    45
    REIVINDICACIONES
    1. Un metodo para determinar el pronostico del melanoma en un paciente, comprendiendo el metodo:
    (i) determinar el nivel de expresion de un marcador pronostico del melanoma (MPM) que es la protema factor 8 del globulo de la grasa de la leche-EGF (MFGE8), o de una firma de pronostico que comprende dos o mas MPMs, al menos uno de los cuales es MFGE8 en una muestra del melanoma tumoral del paciente,
    (ii) aplicar un modelo predictivo, establecido mediante la aplicacion de un metodo predictivo a los niveles de expresion del MPM o de la firma pronostica en muestras tumorales con buen y mal pronostico,
    (iii) establecer un pronostico.
  2. 2. Un metodo para determinar la idoneidad de un paciente con melanoma para un ensayo clmico, comprendiendo el metodo:
    (I) determinar el nivel de expresion de un MPM que es la protema factor 8 del globulo de la grasa de la leche-EGF (MFGE8), o de una firma pronostica que comprende dos o mas MPMs, al menos uno de los cuales es MFGE8, en una muestra del melanoma tumoral del paciente,
    (ii) aplicar un modelo predictivo, establecido mediante la aplicacion de un metodo predictivo a los niveles de expresion del MPM o de la firma pronostica en muestras tumorales con buen y mal pronostico,
    (iii) establecer la idoneidad del paciente para el ensayo.
  3. 3. El metodo de la reivindicacion 1 o de la reivindicacion 2, en el que uno de los otros MPMs se selecciona de la Tabla 1.
  4. 4. El metodo de la reivindicacion 1, en el que dicho metodo predictivo se selecciona del grupo que consiste en modelos lineales, maquinas de vectores de soporte, redes neuronales, arboles de clasificacion y regresion, metodos de aprendizaje en conjunto, analisis discriminante, metodo del vecino mas cercano, redes bayesianas o analisis de componentes independientes.
  5. 5. El metodo de una cualquiera de las reivindicaciones 1 a 4, en el que la etapa de determinar el nivel de expresion de un MPM o de una firma pronostica se lleva a cabo detectando el nivel de expresion del ARNm de cada gen o el ADNc de cada gen.
  6. 6. El metodo de la reivindicacion 5, en el que la etapa de determinar el nivel de expresion de un MPM o de una firma pronostica se lleva a cabo utilizando un oligonucleotido complementario a al menos una porcion de dicho ADNc o se lleva a cabo usando un metodo qPCR usando un cebador directo y un cebador inverso.
  7. 7. El metodo de la reivindicacion 5, en el que la etapa de determinar el nivel de expresion de un MPM o de una firma de pronostico se lleva a cabo utilizando un dispositivo segun la reivindicacion 12 o la reivindicacion 13.
  8. 8. El metodo de una cualquiera de las reivindicaciones 1 a 4, en el que la etapa de determinar el nivel de expresion de un MPM o de una firma pronostica se lleva a cabo detectando el nivel de expresion de la protema de cada marcador o se lleva a cabo detectando el nivel de expresion de la protema o del peptido de cada marcador.
  9. 9. El metodo de la reivindicacion 7 o de la reivindicacion 8, en el que dicha etapa de deteccion se lleva a cabo utilizando un anticuerpo dirigido contra cada marcador.
  10. 10. El metodo de las reivindicaciones 7 u 8, en el que dicha etapa de deteccion se lleva a cabo utilizando un metodo de inmunoensayo tipo sandwich.
  11. 11. El metodo de una cualquiera de las reivindicaciones 9 o 10, en el que dicho anticuerpo es un anticuerpo monoclonal o es un antisuero policlonal.
  12. 12. El uso de un dispositivo para determinar el pronostico del melanoma mediante la determinacion del nivel de expresion de MFGE8 o de una firma pronostica que comprende dos o mas MPM, al menos uno de los cuales es MFGE8, comprendiendo el dispositivo:
    un sustrato que tiene una o mas localizaciones sobre el mismo, teniendo cada localizacion dos o mas oligonucleotidos sobre el mismo, seleccionado cada oligonucleotido de uno o mas MPM, en el que al menos uno de los MPMs es la protema factor 8 del globulo de la grasa de la leche-EGF (MFGE8).
  13. 13. El uso segun la reivindicacion 12, en el que el dispositivo es una matriz (por ejemplo, micromatriz) o en el que uno de los otros MPMs se selecciona de la Tabla 1.
    |Nombre de sonda
    valor P
    Comun
    Genbank
    Descripcion
    "Dominio de la tiorredoxina que contiene 5
    mwghumen30K#B’3667
    0.040 TXNDCS MM_030&10
    mwghuman30K#A 06694
    0.049 PILRA NM_013439
    imwghuman30K#A:06347
    0.049 HLA-E NM_005516
    imwgtnjniaii30K#B:2443
    0,049 XW 036173
    mwghuman30K#A:09174
    0.049 ITPA NM_033453
    mvugtuimanJOKflRI347
    0 0482 OMN N2_14572a
    mwghuman30K#A:07569
    0.0429 GTPBP2 NM_019096
    mwghuman30K#A 09053
    0 0429 MFGF8 I\JM_005928
    mwghuman30K#A:06363
    0 0365 1DH1 MM_OO5096
    mwghuman30K#8 9466
    0.0365 MRPS5 MM 031902
    mwghuman30K#A 04768
    0 0307 LGALS7 MM 002307
    mwghuman3OK#0-5919
    0 0295 KCNIP2 .AF347114
    mwghuman30K#A 04955
    0.0295 CHST4 MM_005769
    mwghuman30K#C:4262
    0.0295 AL451139 11 67295 95669 1
    mwytiuman30K#8 5235
    0 023 OSIL; A170, p02G J467S2
    mwghuman3UK#A 03491
    0 023 MFKBIB MM_002503
    mwghuman30K#A 00049
    0,023 MTCH2 NM 014342
    mwghurnan30K#A.04349
    00136 ARFRP1 NM_003224
    mwghu man3QK#C: 0720
    0.0136 BADI-L AJ131063
    mwghuman30K#B:4873
    0.0136 TUBA1B NM_0OGQ02
    mwghuman30l4#R 7713
    0 00371 AJZ429602
    mwghuman30Ktf B 0031
    0.000756 PLXNB2 AB002313
    Receptor alfa de tipo 2 de tipo inmunoglobina pareado Complejo mayor de histocompatibilidad, clase I, E Kiaa1067; Kiaa1067
    Inosina trifosfatasa (nucleosido trifosfato pirofosfatasa)
    Desmuslin*
    Proteina de union a GTP 2
    Proteina del factor 8 del globulo de la grasa de leche EGF Isocitrato deshidrogenasa 1 (NADP+), soluble Proteina mitocondrial ribosomica S5 Lectina, union a galactosido, soluble, 7 (galectina 7)
    Kv canal que interactua con la proteina 2 Carbohidrato (N-acetilglucosamina 6-0) sulfotransferasa 4 Ensembl genscan prediccion Ligando independiente de fosfotirosina humana
    Factor nuclear del potenciador del gen polipeptido ligero kappa en el inhibidor de las celulas B, beta Flomologo de soporte mitocondrial 2 (C. elegans)
    Proteina relacionada con el factor ADP-ribosilacion 1
    cadena gamma de inmunoglobulina especifica de alergeno del polen de abedul**
    Tubulina alfa 1b***
    Exon parcial n-myc 3 Plexin B2
    * Este marcadorse conocia previamente como kiaa0353; dmn (XM_031031).
    ** Este marcador se conocia anteriormente como inmunoglobulina kappa variable 1-5 (IGKC; AJ131063). *** Este marcador se conocia previamente como similar a tubulina alfa 6; loci 43712 (XM_084610).
    Clasificacion GO de genes expresados diferencialmente
    i\j
    cn
    GO 9108: biosintesis de coenzima
    GO 9177: metabolismo de nucleotido
    GO 6687: metabolismo de glicoesfingolipido
    GO 42254: biogenesis de ribosomas y ensamblaje
    GO 51188: biosinteis de cofactor
    GO 30333: procesamiento de antigeno
    GO 51185: metabolismo de cofactor
    GO 7051: organizacion del husillo y biogenesis
    GO 51258. Polimerizacion de proteina
    GO 43123: regulacion positiva de la cascada 1-kappa p quinasa/NF-kappa p GO 40029: regulacion de la expresion genica, epigenesis GO 15674: transporte de cation inorganico trivalente GO 8544: desarrollo de epidermis
    GO 45892: regulacion negativa de transcripcion, dependiente de ADN
    GO 8152: metabolismo
    GO 6766: metabolismo de vitaminas
    GO 7222: ruta de senalizacion de Frizzled
    GO 7249: cascada l-kappaB quinasa/NF.kappaB
    GO 6732: metabolismo de coenzima
    GO 6812: trasnporte de cationes
    GO 9967: regulacion positiva de transduccion de serial
    GO 9688: desarrollo de tejidos
    GO 7093: punto de control mitotico
    GO 41: trasnporte de iones de metales de transicion
    GO 15992: transporte de protones
    GO 6767: metabolismo de vitaminas solubles en agua
    GO 6333: ensamblaje o desemsamblaje de cromatina
    GO 7398: desarrollo de ectodermo
    GO 7028: organizacion y biogenesis del citoplasma
    GO 43122: regulacion de la cascada de -kappaB quinasa/NF-kappaB
    GO 46785: polimerizacion de microtubulos
    GO 6818: transporte de hidrogenos
    GO 1906: eliminacion de celulas
    GO 19362: metabolismo de nucleotidos de piridina
    GO 6733: metabolismo de coenzima de oxidorreduccion
    P<0.UU3
    D%
    10% 20%
    30%
    -10%
    50%
    00%
    pc 0.047
    70%
    % genes implicados en el proceso
    FIGURA 2
    Conjunto de instruccion: 29 pacientes
    t
    Desarrollar predictor de 15 genes de los 22 genes expresados diferencialmente
    imagen1
    FIGURA 3
    Conjunto de validacion B: 14 pacientes Estudio EORTC Usar aPS
    Conjunto de validacion A: Hospital Austin Usar qPS
    Linea celular o tipo de tejido Fuente peso (g)
    Volumen (mL) Concentracion (mg/ml) Total (mg> Volumen cargado
    786
    Cancer de rinon - 7.25 0.71 . 5.2 ■ 2.8
    Qvcar3
    Cancer de ovario - 5 0 82 4 1 2,4
    Dvcar
    Cancer de ovario - 4.5 2.21 10 0.9
    JB2
    Cancer de vejiga - 5 111 5.6 1.8
    AGS
    Cancer gastrico - 4 5 1,2 5.4 1.7
    CCRF-CEM
    Leucemia de cel. T - 2,5 034 0.9 5
    NCI-H460
    Cancer de pulmon - 7.5 1.2 9 1.7
    U251
    Cancer de cerebro 4 2.27 9.1 0.8
    COLO
    Cancer de colon - 4 1.55 6.2 1.3
    M14
    Melanoma - 8 0.15 1.2 5
    T24
    Cancer de vejiga - 7 1.15 8 1.7
    MCF7
    Cancer de mama - 4 5 2 8 12.6 0.7
    PC3
    Cancer de prostata - 9.5 1 9.5 2
    HL60
    AML - 5 0.58 2.9 3.4
    CAC06
    Cancer de colon - 4.5 0.9 4.1 2.2
    KATO HI
    Cancer gastrico - 4 0 58 2 3 3.5
    C33A
    Cancer cervical - 4.5 1.41 6,3 1.4
    Tejido gastrico
    Estomago normal 1.5 2 0.36 0 7 5
    Wilms Rhabdo
    Rinon/sarcoma 9 45 03 1.4 5
    FIGURA 4
    Comun
    Genbank Descripcion Cebador izquierdo Sec. numero Cebador derecho Sec. numero Sonda de Roche N°
    TKNCC5
    NM_0308t[) Dominio de la tiorredoxina que contiene 5 goacfloyk.iSlgttrUtTj 1 actrggcalcllccatgct 2 14
    PILRA
    NMjQm39 Receptor alfa de tipo 2 de tipo inmunoglobina pareado sggjpaccaaactclocalc 3 tecaggtggtngtesgctg 4 M
    HLA E
    WM_OOS51S Complejo mayor de histocompatibilidad, clase 1, E ggaagaeacalgcglggag 5 gtg agtcsorXgtgtctttgg 6 SO
    ITPA
    NM_033453 Inosina trifosfatasa (nucleosido trifosfato pirofosfatasa) lotjij hjgaagttaaagcciga ag 7 nggctgacltg Icctcgaac A 17
    G11 flP?
    MI/1_01B09G Proteina de union a GTP 2 fftQdnag tcaccca a(g 9 ggagglcsag adclctcca 10 17
    MFGE«
    NM_OQ5928 Proteina del factor 8 del globulo de la agTacpglaajcgatcagitgg 11 ocllgtaggailgccacaaacl 12 21
    IDHI
    NM_p065M grasa de leche EGF Isocitrato deshidrogenasa 1 (NADP+), soluble gig acalacct^gtacsta a c tltyas 13 gigtgcasaalcticaaugacn 14 77
    IU1KKS*
    NMJ'MIHOJ Proteina mitocondrial ribosomica S5 cgttrjitggigyrJgiy 13 gLalocdituuciluEHUtiigu 13 IT
    KCMIP2
    AF347114 Kv canal que interactua con la proteina 2 aaggagagtttglccgaltoc 17 ftaatcg1coa«jo:qto 18 85
    CHSU
    NM_nQ57$9 Carbohidrato (N-acetilglucosamina 6-0) sulfotransferasa 4 gynyoyBulycltltlcaag 19 W^agaatagagccaagalgo 20 18
    OSIL; A170.p62B
    U45752 Ligando independiente de fosfotirosina humana ccdggacaccalccagtat 21 atggylgagcaaacslcytc , 22 73
    NFKBIB
    NM_002503 Factor nuclear del potenciador del gen polipeptido ligero kappa en el inhibidor de las celulas B, beta gplscgtcsclgaggslgg 23 aggaagggltcatgctgatg 24 76
    MTCH2
    NM 014342 Flomologo de soporte mitocondrial 2 (C. elegans) agggcatxlaq gattittcg 25 tgaogaggtiggooagtga 26 5
    ARFRP1
    NM_C03224 Proteina relacionada con el factor ADP- ribosilacion 1 gdcstgtkigggadtagge 27 ogtyaqacucgoaiaaiacLi 28 4
    XM_084S13 Similar a tubulina alfa 6, loci 43712 atccctagcca la tgqj tga 29 ggcatlgccaatriggac 30 64
    AJ24255C 2 Exon parcial n-myc 3 ggccLaccateggacctcgt 31 cdqqcctaqaiqcagtsqaoq 32 18
    PLXHB?
    ABOD23I3 Plexin B2 c^gcMooogctqctgiocq 33 cqgot;-ix>^tatoQt»1tc 34 33
    Grupo de instruccion n=29 Valor P Grupo de validacion A n=10 Valor P
    Bueno (n=13) Malo (n=16) Bueno (n=5) Malo (n=16)
    Edad media (anos) Etapa AJCC
    35(19-09) 35 (24-73) 49 (43-72) ,81251
    IIIB
    4 8 0, 3 4 ,5547;!
    111C
    7 7 1 1
    mu
    1 1 1 0
    IV
    1 0 0 0
    Genero
    Hombre'
    5 8 4 5 0,27221
    Mujer
    8 - 6 1 0
    TTP media (meses)
    40,2 (24-72 i ■-0,001 § 52,2 (73-108: c, ,0255s
    Linfocitos infiltrantes del tumor
    Rapido
    3 0 n 0 0 0 7 523*
    No rapido
    A 8 3 3
    Ausente
    1 1 1 0
    No disponible
    5 7 1 2
    Adyuvante Interferon-a
    1 1 1 0
    IIIU=datos incompletos al menos IIIB tPrueba de rango- suma de Wilcoxon tPrueba exacta de Fisher §Riesgos
    proporcionales de Cox
    FIGURA 6
    imagen2
    imagen3
    FIGURA 7
    imagen4
    imagen5
    8/10
    (b)
    m
    ft.
    25-
    20-
    15-
    10-
    S-
    -10- -15- k
    20->
    R=0^94-, p<0,TO>1
    * ^ >
    ft 30 40 s5
    Supervivencia (meses)
    —r~
    GO
    (d)
    GOD- 500- 400- 300- 200- 100* 0-
    -100* VI -200- o- -300-
    -400- -500- 1 600- -700*
    -800- * -900- i -1000- 4 -1100J
    R=aefl79, p-^aoooi
    "t 'i t-
    4 A10‘
    Tii i rm
    20 30 40 50
    Supervivencia (meses)
    GO
    FIGURA 8
    -i
    70
    70
    Bueno
    Malo
    Grupo de instmccion (n=29) Grupo de validation A (n=10)
    imagen6
    - Bueno * Malo
    Bueno Malo Bueno Malo
    FIGURA 9
    CO
    CL
    cr
    2,000u 1,000= 0
    -i,ooa
    -2,000
    imagen7
    imagen8
    Resultado bueno Resultado malo
    FIGURA 10
ES08766967.7T 2007-05-24 2008-05-23 Predicción del pronóstico para el cáncer de melanoma Active ES2622858T3 (es)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
NZ55536307 2007-05-24
NZ555363A NZ555363A (en) 2007-05-24 2007-05-24 Prognosis prediction for melanoma cancer
PCT/NZ2008/000118 WO2008143533A1 (en) 2007-05-24 2008-05-23 Prognosis prediction for melanoma cancer

Publications (1)

Publication Number Publication Date
ES2622858T3 true ES2622858T3 (es) 2017-07-07

Family

ID=40032133

Family Applications (2)

Application Number Title Priority Date Filing Date
ES16203301T Active ES2821300T3 (es) 2007-05-24 2008-05-23 Predicción de pronóstico para el melanoma de cáncer
ES08766967.7T Active ES2622858T3 (es) 2007-05-24 2008-05-23 Predicción del pronóstico para el cáncer de melanoma

Family Applications Before (1)

Application Number Title Priority Date Filing Date
ES16203301T Active ES2821300T3 (es) 2007-05-24 2008-05-23 Predicción de pronóstico para el melanoma de cáncer

Country Status (17)

Country Link
US (3) US8822149B2 (es)
EP (2) EP3176270B1 (es)
JP (5) JP5943315B2 (es)
CN (1) CN101743327B (es)
AR (1) AR066725A1 (es)
AU (1) AU2008253836B2 (es)
CA (1) CA2725602A1 (es)
CL (1) CL2008001517A1 (es)
DK (2) DK2158332T3 (es)
ES (2) ES2821300T3 (es)
HK (1) HK1145342A1 (es)
NZ (1) NZ555363A (es)
PT (2) PT2158332T (es)
SG (2) SG10201912289SA (es)
TW (2) TWI582236B (es)
UY (1) UY31105A1 (es)
WO (1) WO2008143533A1 (es)

Families Citing this family (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20120135415A1 (en) * 2002-11-15 2012-05-31 Morehouse School Of Medicine Detecting cancer with anti-cxcl13 and anti-cxcr5 antibodies
CA2681899C (en) 2007-03-27 2018-06-19 Immunovia Ab Methods for diagnosis of pancreatic adenocarcinoma, and biomarkers and arrays for use in the same
JP5683280B2 (ja) * 2011-01-04 2015-03-11 株式会社日立製作所 診療支援システム
CN102617734B (zh) * 2011-12-28 2013-09-04 暨南大学 抗FGF-2抗体Dab-2及其应用
US9336302B1 (en) 2012-07-20 2016-05-10 Zuci Realty Llc Insight and algorithmic clustering for automated synthesis
US9355105B2 (en) * 2012-12-19 2016-05-31 International Business Machines Corporation Indexing of large scale patient set
BR112015022977B1 (pt) 2013-03-14 2022-06-21 Castle Biosciences, Inc Métodos para predição de risco de metástase em melanoma cutâneo
US10687711B2 (en) * 2015-05-05 2020-06-23 Medizinische Universität Wien Computerized device and method for processing image data
WO2018009887A1 (en) * 2016-07-08 2018-01-11 University Of Hawaii Joint analysis of multiple high-dimensional data using sparse matrix approximations of rank-1
US11205103B2 (en) 2016-12-09 2021-12-21 The Research Foundation for the State University Semisupervised autoencoder for sentiment analysis
US10692605B2 (en) 2018-01-08 2020-06-23 International Business Machines Corporation Library screening for cancer probability
TW202018727A (zh) 2018-11-09 2020-05-16 財團法人工業技術研究院 整體式學習預測方法與系統
CA3128973A1 (en) 2019-03-04 2020-09-10 Bhaskar Bhattacharyya Data compression and communication using machine learning
GB202010970D0 (en) 2020-07-16 2020-09-02 Immunovia Ab Methods, arrays and uses thereof
CN112200391B (zh) * 2020-11-17 2023-07-04 国网陕西省电力公司经济技术研究院 基于k-近邻互信息特征简化的配电网边缘侧负荷预测方法

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101142172A (zh) 2005-01-05 2008-03-12 艾博特公司 11-β-羟甾类脱氢酶1型酶的抑制剂
CA2614946A1 (en) * 2005-01-07 2006-07-13 The Johns Hopkins University Biomarkers for melanoma
US7615349B2 (en) * 2006-09-07 2009-11-10 H. Lee Moffitt Cancer Center And Research Institute, Inc. Melanoma gene signature
US9492518B2 (en) * 2006-10-04 2016-11-15 Dana-Farber Cancer Institute, Inc. Tumor immunity

Also Published As

Publication number Publication date
NZ555363A (en) 2009-11-27
JP2015061528A (ja) 2015-04-02
US8822149B2 (en) 2014-09-02
SG10201509568QA (en) 2015-12-30
TW201500553A (zh) 2015-01-01
JP2020150949A (ja) 2020-09-24
PT3176270T (pt) 2020-10-08
AR066725A1 (es) 2009-09-09
CL2008001517A1 (es) 2009-01-09
US10266902B2 (en) 2019-04-23
SG10201912289SA (en) 2020-02-27
JP5943315B2 (ja) 2016-07-05
WO2008143533A1 (en) 2008-11-27
UY31105A1 (es) 2009-01-05
TWI582236B (zh) 2017-05-11
AU2008253836B2 (en) 2014-11-27
EP2158332B1 (en) 2017-01-18
EP3176270B1 (en) 2020-07-08
JP6404304B2 (ja) 2018-10-10
DK3176270T3 (da) 2020-10-12
EP3176270A1 (en) 2017-06-07
US20170107583A1 (en) 2017-04-20
TW200914623A (en) 2009-04-01
US20150031578A1 (en) 2015-01-29
DK2158332T3 (en) 2017-05-01
US9534258B2 (en) 2017-01-03
JP2019004907A (ja) 2019-01-17
US20100136553A1 (en) 2010-06-03
JP2010527604A (ja) 2010-08-19
CN101743327B (zh) 2013-04-24
CN101743327A (zh) 2010-06-16
EP2158332A4 (en) 2011-01-05
HK1145342A1 (en) 2011-04-15
EP2158332A1 (en) 2010-03-03
PT2158332T (pt) 2017-04-26
JP2017079765A (ja) 2017-05-18
TWI609967B (zh) 2018-01-01
CA2725602A1 (en) 2008-11-27
AU2008253836A1 (en) 2008-11-27
ES2821300T3 (es) 2021-04-26

Similar Documents

Publication Publication Date Title
ES2622858T3 (es) Predicción del pronóstico para el cáncer de melanoma
US11180815B2 (en) Methods for treating colorectal cancer using prognostic genetic markers
KR102055305B1 (ko) 위식도경계부선암의 진단 및 표적 치료를 위한 마커
AU2018200973B2 (en) Prognosis prediction for colorectal cancer
NZ555353A (en) TNF antagonists