ES2857953T3 - Pronóstico médico y predicción de la respuesta al tratamiento usando las actividades de múltiples rutas de señalización celular - Google Patents

Pronóstico médico y predicción de la respuesta al tratamiento usando las actividades de múltiples rutas de señalización celular Download PDF

Info

Publication number
ES2857953T3
ES2857953T3 ES15785099T ES15785099T ES2857953T3 ES 2857953 T3 ES2857953 T3 ES 2857953T3 ES 15785099 T ES15785099 T ES 15785099T ES 15785099 T ES15785099 T ES 15785099T ES 2857953 T3 ES2857953 T3 ES 2857953T3
Authority
ES
Spain
Prior art keywords
pathway
target genes
risk
activity
pi3k
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
ES15785099T
Other languages
English (en)
Inventor
Ooijen Hendrik Jan Van
Wilhelmus Franciscus Johannes Verhaegh
Brussel Anne Godefrida Catharina Van
Janneke Wrobel
Gog Robert Van
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Koninklijke Philips NV
Original Assignee
Koninklijke Philips NV
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Koninklijke Philips NV filed Critical Koninklijke Philips NV
Application granted granted Critical
Publication of ES2857953T3 publication Critical patent/ES2857953T3/es
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/20ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for computer-aided diagnosis, e.g. based on medical expert systems
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6876Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
    • C12Q1/6883Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6876Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
    • C12Q1/6883Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material
    • C12Q1/6886Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material for cancer
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B20/00ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B20/00ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
    • G16B20/20Allele or variant detection, e.g. single nucleotide polymorphism [SNP] detection
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B20/00ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
    • G16B20/30Detection of binding sites or motifs
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B25/00ICT specially adapted for hybridisation; ICT specially adapted for gene or protein expression
    • G16B25/10Gene or protein expression profiling; Expression-ratio estimation or normalisation
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B30/00ICT specially adapted for sequence analysis involving nucleotides or amino acids
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B5/00ICT specially adapted for modelling or simulations in systems biology, e.g. gene-regulatory networks, protein interaction networks or metabolic networks
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B5/00ICT specially adapted for modelling or simulations in systems biology, e.g. gene-regulatory networks, protein interaction networks or metabolic networks
    • G16B5/20Probabilistic models
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/30ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for calculating health indices; for individual health risk assessment
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/112Disease subtyping, staging or classification
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/118Prognosis of disease development
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/158Expression markers
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/16Primer sets for multiplex assays

Landscapes

  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Chemical & Material Sciences (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • General Health & Medical Sciences (AREA)
  • Medical Informatics (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Genetics & Genomics (AREA)
  • Biotechnology (AREA)
  • Biophysics (AREA)
  • Analytical Chemistry (AREA)
  • Molecular Biology (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Evolutionary Biology (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Theoretical Computer Science (AREA)
  • Organic Chemistry (AREA)
  • Pathology (AREA)
  • Wood Science & Technology (AREA)
  • Zoology (AREA)
  • Public Health (AREA)
  • Immunology (AREA)
  • Biomedical Technology (AREA)
  • Microbiology (AREA)
  • Biochemistry (AREA)
  • General Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Epidemiology (AREA)
  • Primary Health Care (AREA)
  • Physiology (AREA)
  • Hospice & Palliative Care (AREA)
  • Oncology (AREA)
  • Probability & Statistics with Applications (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
  • Investigating Or Analysing Biological Materials (AREA)

Abstract

Un método implementado por ordenador para determinar una puntuación de riesgo que indica un riesgo de que un sujeto experimente un evento clínico asociado a una enfermedad dentro de un periodo de tiempo definido realizado por un dispositivo de procesamiento digital, en el que la determinación comprende: inferir la actividad de cada una de dos o más rutas de señalización celular en el sujeto basándose en la evaluación de un modelo de ruta matemático calibrado que relaciona los niveles de expresión de tres o más genes diana de la ruta de señalización celular respectiva medida en una muestra del sujeto a un nivel de actividad del elemento de factor de transcripción (TF) respectivo de la ruta de señalización celular respectiva en la muestra del sujeto, controlando el elemento TF la transcripción de los tres o más genes diana de la ruta de señalización celular respectiva, estando la actividad de la ruta de señalización celular respectiva definida por el nivel de actividad del elemento TF respectivo, siendo el modelo de ruta matemático calibrado un modelo que se calibra utilizando un conjunto de datos de verdad fundamental que incluye muestras en las que la transcripción de los tres o más genes diana de la ruta de señalización celular respectiva se induce por el elemento TF respectivo y muestras en las que la transcripción de los tres o más genes diana no se induce por el elemento TF respectivo, y determinar la puntuación de riesgo basándose en una combinación de las actividades inferidas, en el que el evento clínico es la recidiva de la enfermedad, en el que la enfermedad es cáncer de mama, en el que las rutas de señalización celular comprenden una ruta de PI3K y una o más de una ruta de Wnt, una ruta de ER y una ruta de HH, en el que la ruta de PI3K, la ruta de Wnt, la ruta de ER y la ruta de HH se definen como la ruta de señalización celular que finalmente conduce a la actividad transcripcional del elemento TF respectivo, en el que el elemento TF de PI3K consiste en un miembro de la familia FOXO, el elemento TF de Wnt consiste en β-catenina/TCF4, el elemento TF de ER consiste en el dímero ERα, y el elemento TF de HH consiste en un miembro de la familia GLI, en el que: los tres o más genes diana de PI3K se seleccionan del grupo que consiste en: AGRP, BCL2L11, BCL6, BNIP3, BTG1, CAT, CAV1, CCND1, CCND2, CCNG2, CDKN1A, CDKN1B, ESR1, FASLG, FBXO32, GADD45A, INSR, MXI1, NOS3, PCK1, POMC, PPARGC1A, PRDX3, RBL2, SOD2, TNFSF10, y/o los tres o más genes diana de Wnt se seleccionan del grupo que consiste en: CEMIP, AXIN2, CD44, RNF43, MYC, TBX3, TDGF1, SOX9, ASCL2, CXCL8, SP5, ZNRF3, EPHB2, LGR5, EPHB3, KLF6, CCND1, DEFA6 y FZD7, y/o los tres o más genes diana de ER se seleccionan del grupo que consiste en: CDH26, SGK3, PGR, GREB1, CA12, XBP1, CELSR2, WISP2, DSCAM, ERBB2, CTSD, TFF1, PDZK1, IGFBP4, ESR1, SOD1, AP1B1 y NRIP1, y/o los tres o más genes diana de HH se seleccionan del grupo que consiste en: GLI1, PTCH1, PTCH2, IGFBP6, SPP1, CCND2, FST, FOXL1, CFLAR, TSC22D1, RAB34, S100A9, S100A7, MYCN, FOXM1, GLI3, TCEA2, FYN y CTSL1, en el que la puntuación de riesgo se basa en una puntuación de múltiples rutas (MPS) que comprende una suma que incluye el término wp · Pp y uno o más de los términos ww · Pw, we · Pe, y wh · Ph, en la que Pp, Pw, Pe y Ph representan la actividad inferida de la ruta de PI3K, la ruta de Wnt, la ruta de ER y la ruta de HH, respectivamente, y en la que wp, ww, we y wh son coeficientes de ponderación constantes que representan una correlación entre el riesgo de que el sujeto experimente el evento clínico dentro del periodo de tiempo definido y la actividad de la ruta de PI3K, la ruta de Wnt, la ruta de ER y la ruta de HH, respectivamente.

Description

DESCRIPCIÓN
Pronóstico médico y predicción de la respuesta al tratamiento usando las actividades de múltiples rutas de señalización celular
Campo de la invención
La materia objeto descrita en el presente documento se refiere principalmente a la bioinformática, técnicas de procesamiento genómico, técnicas de procesamiento proteómico y técnicas relacionadas. Más particularmente, la presente invención se refiere a un método implementado por ordenador para determinar una puntuación de riesgo que indica un riesgo de que un sujeto experimente un evento clínico asociado a una enfermedad dentro de un periodo de tiempo definido realizado por un dispositivo de procesamiento digital, en el que el riesgo la puntuación se determina basándose en una combinación de actividades inferidas para dos o más rutas de señalización celular en el sujeto. La presente invención se refiere además a un aparato para determinar una puntuación de riesgo que indica un riesgo de que un sujeto experimente un evento clínico asociado a una enfermedad dentro de un periodo de tiempo definido que comprende un procesador digital configurado para realizar el método, a un medio de almacenamiento no transitorio para determinar una puntuación de riesgo que indica un riesgo de que un sujeto experimente un evento clínico asociado a una enfermedad dentro de un periodo de tiempo definido que almacena instrucciones que son ejecutables por un dispositivo de procesamiento digital para realizar el método, y a un programa informático para determinar una puntuación de riesgo que indica un riesgo de que un sujeto experimente un evento clínico asociado a una enfermedad dentro de un periodo de tiempo definido que comprende medios de código de programa para hacer que un dispositivo de procesamiento digital realice el método, cuando el programa informático se ejecuta en el dispositivo de procesamiento digital. La presente invención se refiere además a un kit para medir los niveles de expresión de tres o más genes diana de cada una de dos o más rutas de señalización celular en una muestra de un sujeto, a kits para determinar una puntuación de riesgo que indica un riesgo de que un sujeto experimente un evento clínico asociado a una enfermedad dentro de un periodo de tiempo definido, y a usos de los kits en la realización del método.
Antecedentes de la invención
Los análisis genómicos y proteómicos se han realizado sustancialmente y son una promesa potencial para la aplicación clínica en campos médicos tales como la oncología, donde se sabe que diversos cánceres están asociados a combinaciones específicas de mutaciones/variaciones genómicas/patrones de metilación anormales y/o niveles de expresión altos o bajos para genes específicos, que desempeñan un papel en el crecimiento y la evolución del cáncer, por ejemplo, la proliferación celular y la metástasis. Por ejemplo, la ruta de señalización de Wnt afecta a la regulación de la proliferación celular y está altamente regulada. La alta actividad de la ruta de Wnt debido a la pérdida de regulación se ha correlacionado con el cáncer, entre los que se encuentran los tumores de colon malignos. Aunque sin limitarse a ninguna teoría particular de funcionamiento, se cree que la desregulación de la ruta de Wnt en las células de colon neoplásicas conduce a una alta actividad de la ruta de Wnt que a su vez provoca la proliferación celular de las células de colon neoplásicas, es decir, la diseminación del cáncer de colon. Por otro lado, la actividad de la ruta anormalmente baja también podría ser de interés, por ejemplo, en el caso de la osteoporosis. Otras rutas que desempeñan papeles similares en la división, la función y/o la diferenciación celular en la salud y la enfermedad son las rutas de señalización celular (por ejemplo, ER, PR, AR, PPAR, GR, VitD, TGF-p, Notch, Hedgehog, FGF, NFkB, VEGF y PDGF).
Las tecnologías para adquirir datos genómicos y proteómicos se han vuelto fácilmente disponibles en entornos clínicos. Por ejemplo, las mediciones mediante micromatrices se emplean de forma rutinaria para evaluar los niveles de expresión génica, niveles de proteínas, metilación, etc. La secuenciación génica automatizada permite la identificación rentable de variaciones genéticas/mutaciones/patrones de metilación anormales en el ADN y el ARNm. La evaluación cuantitativa de los niveles de ARNm durante la secuenciación génica es prometedora como herramienta clínica para evaluar los niveles de expresión génica.
Uno de los principales desafíos para un terapeuta, por ejemplo, un oncólogo, es realizar una conjetura fundamentada sobre el pronóstico del paciente, ya que esta información influye en las elecciones de tratamiento. Los análisis genómicos, transcriptómicos y proteómicos (y otros "ómicos") basados en muestras de tejido canceroso de pacientes individuales proporcionan información que puede contribuir potencialmente a la evaluación pronóstica del paciente. Sin embargo, la interpretación de estos datos complejos para extraer la información clínica relevante ha demostrado ser un desafío, pero en gran parte sin resolver. El pronóstico de un paciente puede indicarse de manera cuantitativa de varias formas, como por ejemplo: "tiempo hasta la recidiva (de una enfermedad)", "tiempo hasta la progresión (de una enfermedad)", "tiempo de aparición (de una enfermedad)", o "tiempo hasta la muerte (enfermedad)".
El documento WO 2012/154567 A2 divulga un método para determinar si un sujeto que tiene un tumor está en riesgo de metástasis del tumor, o en riesgo de recidiva del tumor después del tratamiento del tumor usando una firma genética. El documento WO 2013/075059 A1 divulga firmas genéticas para subtipificar el cáncer de mama triple negativo (TNBC). El documento WO 2013/003384 A1 divulga firmas genéticas asociadas al cáncer, en particular cáncer de próstata.
Sumario de la invención
De acuerdo con un aspecto principal de la presente invención, el problema anterior se resuelve, o al menos se reduce, mediante un método implementado por ordenador para determinar una puntuación de riesgo que indica un riesgo de que un sujeto experimente un evento clínico asociado a una enfermedad dentro de un periodo de tiempo definido, en el que la determinación comprende:
inferir la actividad de cada una de dos o más rutas de señalización celular en el sujeto basándose en la evaluación de un modelo de ruta matemático calibrado que relaciona los niveles de expresión de tres o más, por ejemplo, tres, cuatro, cinco, seis, siete, ocho, nueve, diez, once, doce o más, genes diana de la ruta de señalización celular respectiva medidos en una muestra del sujeto a un nivel de actividad del elemento de factor de transcripción (TF) respectivo de la ruta de señalización celular respectiva en la muestra del sujeto, controlando el elemento TF la transcripción de los tres o más genes diana de la ruta de señalización celular respectiva, estando la actividad de la ruta de señalización celular respectiva definida por el nivel de actividad del elemento TF respectivo, siendo el modelo de ruta matemático calibrado un modelo que se calibra usando un conjunto de datos de verdad fundamental que incluye muestras en las que la transcripción de los tres o más genes diana de la ruta de señalización celular respectiva se induce por el elemento TF respectivo y muestras en las que la transcripción de los tres o más genes diana no se induce por el elemento TF respectivo, y
determinar la puntuación de riesgo basándose en una combinación de las actividades inferidas,
en el que el evento clínico es la recidiva de la enfermedad, en la que la enfermedad es cáncer de mama, en el que las rutas de señalización celular comprenden una ruta de fosfatidilinositida 3-cinasa (PI3K) y una o más de una ruta de Wnt, una ruta del receptor de estrógeno (ER) y una ruta de hedgehog (HH),
en el que la ruta de PI3K, la ruta de Wnt, la ruta de ER y la ruta de HH se definen como la ruta de señalización celular que finalmente conduce a la actividad transcripcional del elemento TF respectivo,
en el que el elemento TF de PI3K consiste en un miembro de la familia FOXO, el elemento TF de Wnt consiste en p-catenina/TCF4, el elemento TF de ER consiste en el dímero ERa, y el elemento TF de HH consiste en un miembro de la familia GLI,
en el que:
los tres o más genes diana de PI3K se seleccionan del grupo que consiste en: AGRP, BCL2L11, BCL6, BNIP3, BTG1, CAT, CAV1, CCND1, CCND2, CCNG2, CDKN1A, CDKN1B, ESR1, FASLG, FBXO32, GADD45A, INSR, MXI1, NOS3, PCK1, POMC, PPARGC1A, PRDX3, RBL2, SOD2, TNFSF10,
y/o
los tres o más genes diana de Wnt se seleccionan del grupo que consiste en: CEMIP, AXIN2, CD44, RNF43, MYC, TBX3, TDGF1, SOX9, ASCL2, CXCL8, SP5, ZNRF3, EPHB2, LGR5, EPHB3, KLF6, CCND1, DEFA6 y FZD7,
y/o
los tres o más genes diana de ER se seleccionan del grupo que consiste en: CDH26, SGK3, PGR, GREB1, CA12, XBP1, CELSR2, WISP2, DSCAM, ERBB2, CTSD, TFF1, PDZK1, IGFBP4, ESR1, SOD1, AP1B1 y NRIP1,
y/o
los tres o más genes diana de HH se seleccionan del grupo que consiste en: GLI1, PTCH1, PTCH2, IGFBP6, SPP1, CCND2, FST, FOXL1, CFLAR, TSC22D1, RAB34, S100A9, S100A7, MYCN, FOXM1, GLI3, TCEA2, FYN y CTSL1,
en el que la puntuación de riesgo se basa en una puntuación de múltiples rutas (MPS) que comprende una suma que incluye el término Wp Pp y uno o más de los términos Ww Pw, We Pe, y Wh Ph, en la que Pp, Pw, Pe y Ph representan la actividad inferida de la ruta de PI3K, la ruta de Wnt, la ruta de ER y la ruta de HH, respectivamente, y en la que Wp, W w, We y Wh son coeficientes de ponderación constantes que representan una correlación entre el riesgo de que el sujeto experimente el evento clínico dentro del periodo de tiempo definido y la actividad de la ruta de PI3K, la ruta de Wnt, la ruta de ER y la ruta de HH, respectivamente.
La presente invención permite preferentemente la identificación de sujetos en riesgo de experimentar un evento clínico asociado a una enfermedad dentro de un periodo de tiempo definido, por ejemplo, en 3 meses, en 6 meses, en 1 año, en 18 meses, en 2 años, en 30 meses, en 3 años, en 42 meses, en 4 años, en 5 años, en 6 años, en 7 años, en 8 años, en 9 años, o en 10 años o más.
El término "sujeto", como se usa en el presente documento, se refiere a cualquier ser vivo. En algunas realizaciones, el sujeto es un animal, preferentemente, un mamífero. En determinadas realizaciones, el sujeto es un ser humano, preferentemente un sujeto médico.
La expresión "elemento de factor de transcripción", como se usa en el presente documento, se refiere preferentemente a una proteína precursora o complejo de proteínas del factor de transcripción activo, o una proteína o complejo de proteínas del factor de transcripción activo que controla la expresión del gen diana especificada.
La expresión "gen diana", como se usa en el presente documento, significa un gen cuya transcripción está directa o indirectamente controlada por un elemento de factor de transcripción respectivo. El "gen diana" puede ser un "gen diana directo" y/o un "gen diana indirecto" (como se describe en el presente documento).
La inferencia de la actividad de una ruta de señalización celular en el sujeto se puede realizar, por ejemplo, entre otros, (i) evaluando una porción de un modelo de ruta probabilística calibrado, preferentemente una red bayesiana, que representa las rutas de señalización celular para un conjunto de entradas que incluyen los niveles de expresión de los tres o más genes diana de la ruta de señalización celular medidos en una muestra del sujeto, (ii) estimando un nivel de actividad en el sujeto de un elemento de factor de transcripción (TF), controlando el elemento TF la transcripción de los tres o más genes diana de la ruta de señalización celular, basándose la estimación en probabilidades condicionales que relacionan el nivel de actividad del elemento TF y los niveles de expresión de los tres o más genes diana de la ruta de señalización celular medidos en la muestra del sujeto, e (iii) infiriendo la actividad de la ruta de señalización celular basándose en el nivel de actividad estimado del elemento TF en la muestra del sujeto. Esto se describe en detalle en la solicitud de patente internacional publicada WO 2013/011479 A2 ("Assessment of cellular signaling pathway activity using probabilistic modeling of target gene expression").
En una alternativa de ejemplo, la inferencia de la actividad de una ruta de señalización celular en el sujeto puede realizarse, entre otros, (i) determinando un nivel de actividad de un elemento de factor de transcripción (TF) en la muestra del sujeto, controlando el elemento TF la transcripción de los tres o más genes diana de la ruta de señalización celular, basándose la determinación en la evaluación de un modelo de ruta matemático calibrado que relaciona los niveles de expresión de los tres o más genes diana de la ruta de señalización celular con el nivel de actividad del elemento TF, basándose el modelo de ruta matemático en una o más combinaciones lineales de niveles de expresión de los tres o más genes diana, e (ii) infiriendo la actividad de la ruta de señalización celular en el sujeto basándose en el nivel de actividad determinado del elemento TF en la muestra del sujeto. Esto se describe en detalle en la solicitud de patente internacional publicada WO 2014/102668 A2 ("Assessment of cellular signaling pathway activity using linear combination(s) of target gene expressions").
De acuerdo con una realización preferida, las rutas de señalización celular comprenden la ruta de Wnt, la ruta de ER y la ruta de HH.
Cada una de la ruta de PI3K, la ruta de Wnt, la ruta de ER y la ruta de HH se define como la ruta de señalización celular que finalmente conduce a la actividad transcripcional de los complejos de factor de transcripción (TF) asociados con la ruta. Estos consisten en al menos un miembro de la familia FOXO, p-catenina/TCF4, el dímero ERa y un miembro de la familia GLI, respectivamente.
La presente invención se concentra en la ruta de PI3K y la familia TF de FOXO, cuya actividad se correlaciona sustancialmente de forma negativa con la actividad de la ruta de PI3K, es decir, la actividad de FOXO está sustancialmente correlacionada con la inactividad de la ruta de PI3K, mientras que la inactividad de FOXO está sustancialmente correlacionada con la actividad de la ruta de PI3K.
Se prefiere que las rutas de señalización celular comprendan la ruta de Wnt y/o la ruta de ER y/o la ruta de HH, en las que la puntuación de riesgo se define de manera que el riesgo indicado aumenta monótonamente con una actividad inferida creciente de la ruta de Wnt y/o una actividad inferida creciente de la ruta de HH y/o disminuye monótonamente con una actividad inferida creciente de la ruta de ER.
También se prefiere que la puntuación de riesgo se defina de manera que el riesgo indicado aumente monótonamente con una actividad inferida creciente de la ruta de PI3K.
Se prefiere además que los coeficientes de ponderación constantes wp, Ww, We y Wh sean o se hayan determinado cada uno basándose en el valor del coeficiente de Cox resultante del ajuste de un modelo de riesgo proporcional de Cox para la ruta de señalización celular respectiva con respecto a los datos clínicos.
La presente invención se basa en la innovación de los inventores de que una forma adecuada de identificar los efectos que ocurren en las rutas de señalización celular descritas en el presente documento puede basarse en una medición de la salida de señalización de las rutas de señalización celular, es decir, entre otros, la transcripción de genes diana únicos descritos en el presente documento, que se controla por los elementos de factor de transcripción (TF) que están controlados por las rutas de señalización celular. Esta innovación de los inventores supone que el nivel de actividad de TF se encuentra en un estado cuasi-estacionario en la muestra que puede detectarse mediante, entre otros, los valores de expresión de los genes diana identificados de forma única.
En particular, se han identificado conjuntos únicos de genes diana de la ruta de señalización celular cuyos niveles de expresión se analizan en los modelos de ruta matemáticos. Para su uso en los modelos de ruta matemáticos, tres o más, por ejemplo, tres, cuatro, cinco, seis, siete, ocho, nueve, diez, once, doce o más, genes diana de cada ruta de señalización celular evaluada se pueden analizar para desarrollar la puntuación de riesgo.
Se prefiere además que:
los tres o más genes diana de PI3K se seleccionen del grupo que consiste en: FBXO32, BCL2L11, SOD2, TNFSF10, BCL6, BTG1, CCNG2, CDKN1B, BNIP3, GADD45A, INSR y MXI1,
y/o
los tres o más genes diana de Wnt se seleccionen del grupo que consiste en: AXIN2, CD44, LGR5, CEMIP, MYC, CXCL8, SOX9, EPHB3, RNF43, TDGF1, ZNRF3 y DEFA6,
y/o
los tres o más genes diana de ER se seleccionen del grupo que consiste en: TFF1, GREB1, PGR, SGK3, PDZK1, IGFBP4, NRIP1, CA12, XBP1, ERBB2, ESR1 y CELSR2,
y/o
los tres o más genes diana de HH se seleccionen del grupo que consiste en: GLI1, PTCH1, PTCH2, CCND2, IGFBP6, MYCN, FST, RAB34, GLI3, CFLAR, S100A7 y S100A9.
Se prefiere particularmente que:
los tres o más genes diana de PI3K sean FBXO32, BCL2L11, SOD2, TNFSF10, BCL6, BTG1, CCNG2, CDKN1B, BNIP3, GADD45A, INSR y MXI1, y/o
los tres o más genes diana de Wnt sean AXIN2, CD44, LGR5, CEMIP, MYC, CXCL8, SOX9, EPHB3, RNF43, TDGF1, ZNRF3 y DEFA6, y/o
los tres o más genes diana de ER sean TFF1, GREB1, PGR, SGK3, PDZK1, IGFBP4, NRIP1, CA12, XBP1, ERBB2, ESR1 y CELSR2, y/o
los tres o más genes diana de HH sean GLl1, PTCH1, PTCH2, CCND2, IGFBP6, MYCN, FST, RAB34, GLI3, CFLAR, S100A7 y S100A9.
Otro aspecto de la presente invención, el método comprende además:
asignar al sujeto al menos a uno de una pluralidad de grupos de riesgo asociados a diferentes riesgos indicados de que el sujeto experimente el evento clínico dentro del período de tiempo definido,
y/o
decidir un tratamiento recomendado para el sujeto basándose en el riesgo indicado de que el sujeto experimente el evento clínico dentro del periodo de tiempo definido.
La muestra o muestras a usar de acuerdo con la presente invención pueden ser una muestra extraída, es decir, una muestra que se ha extraído del sujeto. Los ejemplos de la muestra incluyen, pero sin limitación, un tejido, células, sangre y/o un fluido corporal de un sujeto. Puede ser, por ejemplo, una muestra obtenida de una lesión cancerosa, o de una lesión que se sospecha de cáncer, o de un tumor metastásico, o de una cavidad corporal en la que hay líquido contaminado con células cancerosas (por ejemplo, cavidad pleural o abdominal o cavidad vesical) o de otros fluidos corporales que contienen células cancerosas, etc., preferentemente mediante un procedimiento de biopsia u otro procedimiento de extracción de muestras. Las células de las que se extrae una muestra también pueden ser células tumorales de neoplasias hematológicas (tales como leucemia o linfoma). En algunos casos, la muestra de células también pueden ser células tumorales circulantes, es decir, células tumorales que han entrado en el torrente sanguíneo y pueden extraerse mediante técnicas de aislamiento adecuadas, por ejemplo, aféresis o extracción de sangre venosa convencional. Aparte de la sangre, un fluido corporal del que se extrae una muestra puede ser orina, contenido gastrointestinal o un extravasado. El término "muestra", como se usa en el presente documento, también abarca el caso en que, por ejemplo, se han tomado del sujeto un tejido y/o células y/o un fluido corporal del sujeto y, por ejemplo, se han colocado en un portaobjetos de microscopio o fijador y, para realizar el método reivindicado, se extrae una parte de esta muestra, por ejemplo, por medio de microdisección por captura láser (LCM) o por perforación, o raspando las células de interés del portaobjetos, o mediante técnicas de clasificación de células activadas por fluorescencia. Además, el término "muestra", como se usa en el presente documento, también abarca el caso en el que, por ejemplo, se ha tomado del sujeto un tejido y/o células y/o un fluido corporal del sujeto y se ha colocado en un portaobjetos de microscopio y el método reivindicado se realiza en el portaobjetos.
Se prefiere que el método comprenda además combinar la puntuación de riesgo y/o al menos una de las actividades inferidas con una o más puntuaciones de riesgo adicionales obtenidas de una o más pruebas de pronóstico adicionales para obtener una puntuación de riesgo combinada, en la que la puntuación de riesgo combinada indica un riesgo de que el sujeto experimente el evento clínico dentro del periodo de tiempo definido. La una o más pruebas de pronóstico adicionales pueden comprender, en particular, la prueba de cáncer de mama Oncotype DX®, la prueba de cáncer de mama Mammostrat®, la prueba de cáncer de mama MammaPrint®, la prueba de cáncer de mama EndoPredict®, la prueba de cáncer de mama BluePrint™, la prueba de cáncer de mama CompanDx®, el Breast Cáncer IndexSM (HOXB 13/IL17BR), la prueba de cáncer de colon OncotypeDX®, y/o una prueba de proliferación realizada midiendo la expresión del gen/proteína Ki67.
Como se ha mencionado anteriormente, el evento clínico es la recidiva de la enfermedad, en la que la enfermedad es cáncer de mama. El riesgo de que el evento clínico ocurra dentro del periodo de tiempo definido es entonces preferentemente el riesgo de recidiva, es decir, el regreso del cáncer, ya sea después de un tratamiento dado (también llamado "predicción de la respuesta a la terapia del cáncer") o sin ningún tratamiento (también llamado "pronóstico del cáncer"). La recidiva puede ser local (es decir, en el lado del tumor original) o distante (es decir, metástasis, más allá del lado original).
De acuerdo con otro aspecto divulgado, un aparato para determinar una puntuación de riesgo que indica un riesgo de que un sujeto experimente un evento clínico asociado a una enfermedad dentro de un periodo de tiempo definido comprende un procesador digital configurado para realizar el método de la presente invención como se describe en el presente documento.
De acuerdo con otro aspecto divulgado, un medio de almacenamiento no transitorio para determinar una puntuación de riesgo que indica un riesgo de que un sujeto experimente un evento clínico asociado a una enfermedad dentro de un periodo de tiempo definido almacena instrucciones que son ejecutables por un dispositivo de procesamiento digital para realizar el método de la presente invención como se describe en el presente documento. El medio de almacenamiento no transitorio puede ser un medio de almacenamiento legible por ordenador, tal como un disco duro u otro medio de almacenamiento magnético, un disco óptico u otro medio de almacenamiento óptico, una memoria de acceso aleatorio (RAM), una memoria de solo lectura (ROM), una memoria flash u otro medio de almacenamiento electrónico, un servidor de red, etc. El dispositivo de procesamiento digital puede ser un dispositivo portátil (por ejemplo, un asistente de datos personales o un teléfono inteligente), un ordenador portátil, un ordenador de sobremesa, un ordenador o dispositivo de tableta, un servidor de red remoto, etc.
De acuerdo con otro aspecto divulgado, un programa informático para determinar una puntuación de riesgo que indica un riesgo de que un sujeto experimente un evento clínico asociado a una enfermedad dentro de un periodo de tiempo definido comprende medios de código de programa para hacer que un dispositivo de procesamiento digital realice el método de la presente invención como se describe en el presente documento, cuando el programa informático se ejecuta en el dispositivo de procesamiento digital. El dispositivo de procesamiento digital puede ser un dispositivo portátil (por ejemplo, un asistente de datos personales o un teléfono inteligente), un ordenador portátil, un ordenador de sobremesa, un ordenador o dispositivo de tableta, un servidor de red remoto, etc.
De acuerdo con otro aspecto divulgado, un kit para medir los niveles de expresión de tres o más genes diana de cada una de dos o más rutas de señalización celular en una muestra de un sujeto y para determinar una puntuación de riesgo que indica un riesgo de que un sujeto experimente un evento clínico asociado a una enfermedad dentro de un periodo de tiempo definido comprende:
uno o más componentes para determinar los niveles de expresión de tres o más, por ejemplo, tres, cuatro, cinco, seis, siete, ocho, nueve, diez, once, doce o más, genes diana de cada una de dos o más rutas de señalización celular en una muestra del sujeto,
en el que el uno o más componentes se seleccionan preferentemente del grupo que consiste en: un chip de micromatriz (por ejemplo, un chip de matriz de ADN, un chip de matriz de oligonucleótidos, un chip de matriz de proteínas), un anticuerpo, una pluralidad de sondas, por ejemplo, sondas marcadas, un conjunto de componentes de secuenciación de transcriptasa inversa de ARN, y/o ARN o ADN, incluyendo ADNc, cebadores de amplificación, y
en el que las rutas de señalización celular comprenden una ruta de señalización celular de PI3K y una o más de una ruta de señalización celular de Wnt, una ruta de señalización celular de ER y una ruta de señalización celular de HH, y
el aparato de la presente invención como se describe en el presente documento, el medio de almacenamiento no transitorio de la presente invención como se describe en el presente documento o el programa informático de la presente invención como se describe en el presente documento,
en el que:
los tres o más genes diana de PI3K se seleccionan del grupo que consiste en: AGRP, BCL2L11, BCL6, BNIP3, BTG1, CAT, CAV1, CCND1, CCND2, CCNG2, CDKN1A, CDKN1B, ESR1, FASLG, FBXO32, GADD45A, INSR, MXI1, NOS3, PCK1, POMC, PPARGC1A, PRDX3, RBL2, SOD2, TNFSF10,
y/o
los tres o más genes diana de Wnt se seleccionan del grupo que consiste en: CEMIP, AXIN2, CD44, RNF43, MYC, TBX3, TDGF1, SOX9, ASCL2, CXCL8, SP5, ZNRF3, EPHB2, LGR5, EPHB3, KLF6, CCND1, DEFA6 y FZD7,
y/o
los tres o más genes diana de ER se seleccionan del grupo que consiste en: CDH26, SGK3, PGR, GREB1, CA12, XBP1, CELSR2, WISP2, DSCAM, ERBB2, CTSD, TFF1, PDZK1, IGFBP4, ESR1, SOD1, AP1B1 y NRIP1,
y/o
los tres o más genes diana de HH se seleccionan del grupo que consiste en: GLI1, PTCH1, PTCH2, IGFBP6, SPP1, CCND2, FST, FOXL1, CFLAR, TSC22D1, RAB34, S100A9, S100A7, MYCN, FOXM1, GLI3, TCEA2, FYN y CTSL1.
Se prefiere además que:
los tres o más genes diana de PI3K se seleccionan del grupo que consiste en: FBXO32, BCL2L11, SOD2, TNFSF10, BCL6, BTG1, CCNG2, CDKN1B, BNIP3, GADD45A, INSR y MXI1,
y/o
los tres o más genes diana de Wnt se seleccionan del grupo que consiste en: AXIN2, CD44, LGR5, CEMIP, MYC, CXCL8, SOX9, EPHB3, RNF43, TDGF1, ZNRF3 y DEFA6,
y/o
los tres o más genes diana de ER se seleccionan del grupo que consiste en: TFF1, GREB1, PGR, SGK3, PDZK1, IGFBP4, NRIP1, CA12, XBP1, ERBB2, ESR1 y CELSR2,
y/o
los tres o más genes diana de HH se seleccionan del grupo que consiste en: GLI1, PTCH1, PTCH2, CCND2, IGFBP6, MYCN, FST, RAB34, GLI3, CFLAR, S100A7 y S100A9.
Se prefiere particularmente que:
los tres o más genes diana de PI3K sean FBXO32, BCL2L11, SOD2, TNFSF10, BCL6, BTG1, CCNG2, CDKN1B, BNIP3, GADD45A, INSR y MXI1, y/o
los tres o más genes diana de Wnt sean AXIN2, CD44, LGR5, CEMIP, MYC, CXCL8, SOX9, EPHB3, RNF43, TDGF1, ZNRF3 y DEFA6, y/o
los tres o más genes diana de ER sean TFF1, GREB1, PGR, SGK3, PDZK1, IGFBP4, NRIP1, CA12, XBP1, ERBB2, ESR1 y CELSR2, y/o
los tres o más genes diana de HH sean GLl1, PTCH1, PTCH2, CCND2, IGFBP6, MYCN, FST, RAB34, GLI3, CFLAR, S100A7 y S100A9.
De acuerdo con otro aspecto divulgado, el kit de la presente invención como se describe en el presente documento se usa para realizar el método de la presente invención como se describe en el presente documento.
Una ventaja reside en un sistema de apoyo a la decisión clínica (CDS) que está adaptado para proporcionar recomendaciones clínicas, por ejemplo, al decidir un tratamiento para un sujeto, basándose en un análisis de dos o más rutas de señalización celular, por ejemplo, usando un modelo probabilístico u otro modelo de ruta matemático de la ruta de PI3K, la ruta de Wnt, la ruta de ER y la ruta de HH, en particular, basándose en el riesgo de que el sujeto experimente un evento clínico (recidiva de la enfermedad) asociado al cáncer de mama dentro de un periodo de tiempo, como lo indica una puntuación de riesgo que se determina basándose en una combinación de actividades inferidas de las rutas de señalización celular.
Otra ventaja reside en un sistema CDS que está adaptado para asignar un sujeto al menos a uno de una pluralidad de grupos de riesgo asociados a diferentes riesgos de que el sujeto experimente un evento clínico (recidiva de la enfermedad) asociado al cáncer de mama dentro de un periodo de tiempo definido, como lo indica una puntuación de riesgo que se determina basándose en una combinación de actividades inferidas de dos o más rutas de señalización celular.
Otra ventaja reside en combinar una puntuación de riesgo que indica un riesgo de que un sujeto experimente un evento clínico (recidiva de la enfermedad) asociado al cáncer de mama dentro de un periodo de tiempo definido y que se determina basándose en una combinación de actividades inferidas de dos o más rutas de señalización celular con una o más puntuaciones de riesgo adicionales obtenidas de una o más pruebas de pronóstico adicionales.
La presente invención, como se describe en el presente documento, puede usarse también ventajosamente, por ejemplo, en relación con un pronóstico y/o predicción basados en una combinación de actividades inferidas de dos o más rutas de señalización celular, y/o una predicción de la eficacia del fármaco de, por ejemplo, quimioterapia y/o un tratamiento hormonal basándose en una combinación de actividades inferidas de dos o más rutas de señalización celular, y/o
la monitorización de la eficacia del fármaco basándose en una combinación de actividades inferidas de dos o más rutas de señalización celular, y/o la decisión sobre una frecuencia de monitorización o, más particularmente, sobre una frecuencia de monitorización de la respuesta a la terapia basándose en una combinación de actividades inferidas de dos o más rutas de señalización celular, y/o
el desarrollo de fármacos basado en una combinación de actividades inferidas de dos o más rutas de señalización celular, y/o el desarrollo de ensayos basado en una combinación de actividades inferidas de dos o más rutas de señalización celular, y/o la estadificación del cáncer basada en una combinación de actividades inferidas de dos o más rutas de señalización celular, en la que, en cada caso, las rutas de señalización celular comprenden una ruta de PI3K y una o más de una ruta de Wnt, una ruta de ER y una ruta de HH.
Las ventajas adicionales serán evidentes para los expertos en la técnica tras leer y comprender las figuras adjuntas, la siguiente descripción y, en particular, después de leer los ejemplos detallados que se proporcionan a continuación en el presente documento.
Debe entenderse que el método de la reivindicación 1, el aparato de la reivindicación 7, el medio de almacenamiento no transitorio de la reivindicación 8, el programa informático de la reivindicación 9, el kit de la reivindicación 10 y el uso del kit de la reivindicación 11 tienen realizaciones preferidas similares y/o idénticas, en particular, como se define en las reivindicaciones dependientes.
Se entenderá que una realización preferida de la presente invención también puede ser cualquier combinación de las reivindicaciones dependientes o realizaciones anteriores con la respectiva reivindicación independiente.
Estos y otros aspectos de la invención serán evidentes a partir de y se aclararán con referencia a las realizaciones descritas en lo sucesivo en el presente documento.
La presente invención utiliza los análisis de los niveles de expresión de conjuntos únicos de genes diana. Los genes diana particularmente adecuados se describen en los siguientes pasajes de texto, así como en los ejemplos a continuación (véanse, por ejemplo, las Tablas 1 a 13 a continuación).
Por lo tanto, en una realización, los genes diana se seleccionan del grupo que consiste en los genes diana enumerados en la Tabla 1, Tabla 2, Tabla 3, Tabla 4, Tabla 5, Tabla 6, Tabla 7, Tabla 8, Tabla 9, Tabla 10, Tabla 11, Tabla 12 o Tabla 13.
Breve descripción de los dibujos
La figura 1 muestra esquemáticamente y a modo de ejemplo un modelo matemático, en el presente documento, un modelo de red bayesiana, usado para modelar el programa transcripcional de la ruta de PI3K, la ruta de Wnt, la ruta de ER y la ruta de HH, respectivamente.
La figura 2 muestra un gráfico de Kaplan-Meier de la supervivencia libre de enfermedad en pacientes con cáncer de mama de E-MTAB-365, GSE20685 y GSE21653. Los tres grupos de pacientes se separan basándose en los terciles de la puntuación de riesgo MPSpw , que es una combinación de las actividades inferidas de la ruta de PI3K y la ruta de Wnt. La diferencia entre las curvas de supervivencia de los pacientes de alto y bajo riesgo es claramente significativa (prueba de rango logarítmico: p = 6,1e-4).
La figura 3 muestra un gráfico de Kaplan-Meier de la supervivencia libre de enfermedad en pacientes con cáncer de mama de E-MTAB-365, GSE20685 y GSE21653. Los tres grupos de pacientes se separan basándose en los terciles de la puntuación de riesgo MPSpe, que es una combinación de las actividades inferidas de la ruta de PI3K y la ruta de e R. La diferencia entre las curvas de supervivencia de los pacientes de alto y bajo riesgo es claramente significativa (prueba de rango logarítmico: p = 9,2e-8).
La figura 4 muestra un gráfico de Kaplan-Meier de la supervivencia libre de enfermedad en pacientes con cáncer de mama de E-MTAB-365, GSE20685 y GSE21653. Los tres grupos de pacientes se separan basándose en los terciles de la puntuación de riesgo MPSph, que es una combinación de las actividades inferidas de la ruta de PI3K y la ruta de HH. La diferencia entre las curvas de supervivencia de los pacientes de alto y bajo riesgo es claramente significativa (prueba de rango logarítmico: p = 1,4e-8).
La figura 5 muestra un gráfico de Kaplan-Meier de la supervivencia libre de enfermedad en pacientes con cáncer de mama de E-MTAB-365, GSE20685 y GSE21653. Los tres grupos de pacientes se separan basándose en los terciles de la puntuación de riesgo MPSpwe, que es una combinación de las actividades inferidas de la ruta de PI3K, la ruta de Wnt y la ruta de ER. La diferencia entre las curvas de supervivencia de los pacientes de alto y bajo riesgo es claramente significativa (prueba de rango logarítmico: p = 1,7e-9).
La figura 6 muestra un gráfico de Kaplan-Meier de la supervivencia libre de enfermedad en pacientes con cáncer de mama de E-MTAB-365, GSE20685 y GSE21653. Los tres grupos de pacientes se separan basándose en los terciles de la puntuación de riesgo MPSpwh, que es una combinación de las actividades inferidas de la ruta de PI3K, la ruta de Wnt y la ruta de HH. La diferencia entre las curvas de supervivencia de los pacientes de alto y bajo riesgo es claramente significativa (prueba de rango logarítmico: p = 5,4e-6).
La figura 7 muestra un gráfico de Kaplan-Meier de la supervivencia libre de enfermedad en pacientes con cáncer de mama de E-MTAB-365, GSE20685 y GSE21653. Los tres grupos de pacientes se separan basándose en los terciles de la puntuación de riesgo MPSpeh, que es una combinación de las actividades inferidas de la ruta de PI3K, la ruta de ER y la ruta de HH. La diferencia entre las curvas de supervivencia de los pacientes de alto y bajo riesgo es claramente significativa (prueba de rango logarítmico: p = 2,4e-9).
La figura 8 muestra un gráfico de Kaplan-Meier de la supervivencia libre de enfermedad en pacientes con cáncer de mama de E-MTAB-365, GSE20685 y GSE21653. Los tres grupos de pacientes se separan basándose en los terciles de la puntuación de riesgo MPSpweh, que es una combinación de las actividades inferidas de la ruta de PI3K, la ruta de Wnt, la ruta de ER y la ruta de Hh . La diferencia entre las curvas de supervivencia de los pacientes de alto y bajo riesgo es claramente significativa (prueba de rango logarítmico: p = 1,8e-9).
La figura 9 muestra un gráfico de Kaplan-Meier de la supervivencia libre de enfermedad en pacientes con cáncer de mama de E-MTAB-365, GSE20685 y GSE21653. Los tres grupos de pacientes se separan basándose en los terciles de la puntuación de riesgo MPSconjuntosdesondas, que es una combinación de los conjuntos de sondas asociados a los genes diana seleccionados de la ruta de PI3K, la ruta de Wnt, la ruta de ER y la ruta de HH. La diferencia entre las curvas de supervivencia de los pacientes de alto y bajo riesgo es claramente significativa (prueba de rango logarítmico: p = 3,0e-6).
La figura 10 muestra la probabilidad de supervivencia libre de enfermedad a los cinco (línea continua inferior) y a los diez años (líneas discontinuas superiores) utilizando como ejemplo la MPSpweh sin escala.
La figura 11 muestra esquemáticamente un sistema de apoyo a la decisión clínica (CDS) configurado para determinar una puntuación de riesgo que indica un riesgo de que un sujeto experimente un evento clínico dentro de un cierto periodo de tiempo, como se divulga en el presente documento. La figura 12 muestra un diagrama de flujo que ilustra a modo de ejemplo un proceso para determinar la puntuación de riesgo basándose en la medición de los niveles de expresión de genes diana de la ruta de PI3K y rutas de señalización celular adicionales.
La figura 13 muestra un diagrama de flujo que ilustra a modo de ejemplo un proceso para calibrar un modelo de puntuación de múltiples rutas (MPS) con datos de supervivencia.
La figura 14 muestra un diagrama de flujo que ilustra a modo de ejemplo un proceso para calcular una puntuación de riesgo a partir de un modelo de puntuación de múltiples rutas (MPS) calibrado.
La figura 15 muestra un diagrama de flujo que ilustra a modo de ejemplo un proceso para determinar los valores de Cq a partir del análisis de RT-qPCR de los genes diana de las rutas de señalización celular.
Descripción detallada de las realizaciones
Los siguientes ejemplos meramente ilustran métodos particularmente preferidos y aspectos seleccionados en relación con los mismos. La enseñanza proporcionada en los mismos puede usarse para construir varias pruebas y/o kits. Los siguientes ejemplos no han de interpretarse como limitantes del alcance de la presente invención.
Ejemplo 1: Inferencia de la actividad de dos o más rutas de señalización celular
Como se describe en detalle en la solicitud de patente internacional publicada WO 2013/011479 A2 ("Assessment of cellular signaling pathway activity using probabilistic modeling of target gene expression"), mediante la construcción de un modelo probabilístico, por ejemplo, un modelo bayesiano, e incorporando relaciones probabilísticas condicionales entre los niveles de expresión de varios genes diana diferentes y la actividad de la ruta de señalización celular, tal modelo puede usarse para determinar la actividad de la ruta de señalización celular con un alto grado de precisión. Además, el modelo probabilístico puede actualizarse fácilmente para incorporar conocimientos adicionales obtenidos por estudios clínicos posteriores, ajustando las probabilidades condicionales y/o añadiendo nuevos nodos al modelo para representar fuentes de información adicionales. De esta manera, el modelo probabilístico puede actualizarse según sea apropiado para incorporar los conocimientos médicos más recientes.
Cuando se usa este enfoque, los genes diana de Wnt, los genes diana de ER y los genes diana de HH se seleccionan preferentemente de acuerdo con los métodos descritos en las secciones "Ejemplo 3: Selección de genes diana" y "Ejemplo 4: Comparación de lista curada por pruebas y lista de bibliografía amplia" del documento WO 2013/011479 A2 y el modelo probabilístico se entrena preferentemente de acuerdo con los métodos descritos en el "Ejemplo 5: Entrenamiento y uso de la red bayesiana" del documento WO 2013/011479 A2. En las reivindicaciones adjuntas se define una elección adecuada del gen o genes diana que se utilizan para determinar la actividad de la ruta de Wnt, la ruta de ER y la ruta de AR.
En otro enfoque fácil de comprender e interpretar descrito en detalle en la solicitud de patente internacional publicada WO 2014/102668 A2 ("Assessment of cellular signaling pathway activity using linear combination(s) of target gene expressions"), la actividad de un determinada ruta de señalización celular se determina mediante la construcción de un modelo matemático (por ejemplo, un modelo lineal o (pseudo)lineal) que incorpora relaciones entre los niveles de expresión de uno o más genes diana de una ruta de señalización celular y el nivel de actividad de un elemento de factor de transcripción (TF), controlando el elemento TF la transcripción de uno o más genes diana de la ruta de señalización celular, estando el modelo basado en una o más combinaciones lineales de niveles de expresión de uno o más genes diana.
Cuando se usa este enfoque, los genes diana de Wnt, los genes diana de ER y los genes diana de HH se seleccionan preferentemente de acuerdo con los métodos descritos en las secciones "Ejemplo 2: Selección de genes diana" y "Ejemplo 3: Comparación de lista curada por pruebas y lista de bibliografía amplia" del documento WO 2014/102668 A2 y el modelo matemático se entrena preferentemente de acuerdo con los métodos descritos en el "Ejemplo 4: Entrenamiento y uso del modelo matemático" del documento WO 2014/102668 A2. La elección del gen o genes diana definidos en las reivindicaciones adjuntas también es útil para determinar la actividad de la ruta de Wnt, la ruta de ER y la ruta de HH con este enfoque posterior.
Con respecto a los dos enfoques diferentes, los niveles de expresión de uno o más genes diana pueden ser preferentemente mediciones del nivel de ARNm, que puede ser el resultado de, por ejemplo, (RT)-PCR y técnicas de micromatrices que usan sondas asociadas a las secuencias de ARNm del gen o genes diana, y de secuenciación de ARN. En otra realización, los niveles de expresión del uno o más genes diana pueden medirse mediante niveles de proteína, por ejemplo, las concentraciones de las proteínas codificadas por los genes diana.
Los niveles de expresión mencionados anteriormente pueden convertirse opcionalmente de muchas formas que podrían adaptarse o no mejor a la solicitud. Por ejemplo, cuatro transformaciones diferentes de los niveles de expresión, por ejemplo, niveles de ARNm basados en micromatrices, pueden ser:
- "datos continuos", es decir, niveles de expresión obtenidos después del preprocesamiento de micromatrices usando algoritmos bien conocidos tales como MAS5.0 y fRMA,
- "puntuación z", es decir, niveles de expresión continuos escalados de manera que el promedio de todas las muestras sea 0 y la desviación estándar sea 1,
- "discreto", es decir, cada expresión por encima de un cierto umbral se establece en 1 y por debajo de él en 0 (por ejemplo, el umbral para un conjunto de sondas puede elegirse como la mediana de su valor en un conjunto de un número de positivos y el mismo número de muestras clínicas negativas),
- "difuso", es decir, los niveles de expresión continua se convierten en valores entre 0 y 1 usando una función sigmoidea del siguiente formato: 1/(1 exp((thr- expr)/se)), siendo expr los niveles de expresión continuos, siendo thr el umbral que se ha mencionado anteriormente y siendo se un parámetro de suavizado que influye en la diferencia entre 0 y 1.
Uno de los modelos más sencillos que se puede construir es un modelo que tiene un nodo que representa el elemento de factor de transcripción (TF) en una primera capa y nodos ponderados que representan mediciones directas de los niveles de intensidad de expresión del gen o genes diana, por ejemplo, por un conjunto de sondas que está particularmente altamente correlacionado con el gen diana particular, por ejemplo, en experimentos de micromatrices o (q)PCR, en una segunda capa. Las ponderaciones pueden basarse en cálculos de un conjunto de datos de entrenamiento o en conocimientos de expertos. Este enfoque de usar, en el caso de que posiblemente se midan múltiples niveles de expresión por gen diana (por ejemplo, en el caso de experimentos de micromatrices, donde un gen diana puede medirse con múltiples conjuntos de sondas), solo un nivel de expresión por gen diana es particularmente sencillo. Una forma específica de seleccionar el nivel de expresión que se usa para un gen diana particular es usar el nivel de expresión del conjunto de sondas que es capaz de separar mejor las muestras activas y pasivas de un conjunto de datos de entrenamiento. Un método para determinar este conjunto de sondas es realizar una prueba estadística, por ejemplo, la prueba t, y seleccionar el conjunto de sondas con el valor p más bajo. Los niveles de expresión del conjunto de datos de entrenamiento de la sonda con el valor p más bajo es, por definición, la sonda con la menor probabilidad de que los niveles de expresión de las muestras activas y pasivas (conocidas) se superpongan. Otro método de selección se basa en razones de probabilidades. En tal modelo, se proporcionan uno o más niveles de expresión para cada uno del uno o más genes diana y la una o más combinaciones lineales comprenden una combinación lineal que incluye para cada uno del uno o más genes diana un término ponderado, basándose cada término ponderado en solo un nivel de expresión del uno o más niveles de expresión proporcionados para el gen diana respectivo. Si solo se elige un nivel de expresión por gen diana como se ha descrito anteriormente, el modelo puede denominarse modelo de "conjuntos de sondas más discriminantes".
En una alternativa al modelo de "conjuntos de sondas más discriminantes", es posible, en el caso de que posiblemente se midan múltiples niveles de expresión por gen diana, aprovechar todos los niveles de expresión que se proporcionan por gen diana. En tal modelo, se proporcionan uno o más niveles de expresión para cada uno del uno o más genes diana y la una o más combinaciones lineales comprenden una combinación lineal de todos los niveles de expresión del uno o más niveles de expresión proporcionado para uno o más genes diana. En otras palabras, para cada uno del uno o más genes diana, cada uno del uno o más niveles de expresión proporcionados para el gen diana respectivo puede ponderarse en la combinación lineal por su propia ponderación (individual). Esta variante puede denominarse modelo de "todos los conjuntos de sondas". Tiene la ventaja de ser relativamente sencillo y al mismo tiempo aprovechar todos los niveles de expresión proporcionados.
Ambos modelos descritos anteriormente tienen en común que son lo que pueden considerarse modelos de "capa única", en los que el nivel de actividad del elemento TF se calcula basándose en una combinación lineal de niveles de expresión.
Una vez que se ha determinado el nivel de actividad del elemento TF mediante la evaluación del modelo respectivo, el nivel de actividad del elemento TF determinado puede establecerse como umbral para inferir la actividad de la ruta de señalización celular. Un método para calcular tal umbral apropiado es comparando el nivel de actividad del elemento TF determinado wlc de muestras de entrenamiento que se sabe que tienen una ruta pasiva y muestras de entrenamiento con una ruta activa. Un método que lo hace y también tiene en cuenta la varianza en estos grupos se da mediante el uso de un umbral
Figure imgf000010_0001
donde a y p son la desviación estándar y la media de las muestras de entrenamiento. En caso de que solo haya una pequeña cantidad de muestras disponibles en las muestras de entrenamiento activo y/o pasivo, puede añadirse un pseudorrecuento a las varianzas calculadas basándose en el promedio de las varianzas de los dos grupos:
VwlCf, •t+ vwlCn
V = ■
2
x v (n act- l ) v wlCa
v w lc„rt x n act- 1 (2)
xv (n p a s - 1)v wlCp ¡
^WÍCpas X V p a s 1
donde v es la varianza de los niveles de actividad del elemento TF determinados wlc de los grupos, x es un pseudorrecuento positivo, por ejemplo, 1 o 10, y nact y npas son el número de muestras activas y pasivas, respectivamente. La desviación estándar a puede obtenerse tomando la raíz cuadrada de la varianza v.
El umbral se puede restar del nivel de actividad determinado del elemento TF w/c para facilitar la interpretación, lo que da como resultado la puntuación de actividad de la ruta de señalización celular, de modo que los valores negativos corresponden a una ruta de señalización celular pasiva y los valores positivos a una ruta de señalización celular activa.
Como alternativa a los modelos de "capa única" descritos, se puede utilizar un modelo de "dos capas" que represente la determinación experimental de la señalización activa de una ruta. Para cada gen diana, se calcula un nivel de resumen utilizando una combinación lineal basada en las intensidades medidas de sus conjuntos de sondas asociados ("primera capa (inferior)"). El valor de resumen calculado se combina posteriormente con los valores de resumen de los otros genes diana de la ruta usando una combinación lineal adicional ("segunda capa (superior)"). Las ponderaciones pueden aprenderse de un conjunto de datos de entrenamiento o basarse en el conocimiento de expertos o una combinación de los mismos. Expresado de manera diferente, en el modelo de "dos capas", se proporcionan uno o más niveles de expresión para cada uno del uno o más genes diana y la una o más combinaciones lineales comprenden para cada uno del uno o más genes diana una primera combinación lineal de todos los niveles de expresión del uno o más niveles de expresión proporcionados para el gen diana respectivo ("primera capa (inferior)"). El modelo se basa además en una combinación lineal adicional que incluye para cada uno del uno o más genes diana un término ponderado, basándose cada término ponderado en la primera combinación lineal para el gen diana respectivo ("segunda capa (superior)").
El cálculo de los valores de resumen puede, en una versión preferida del modelo de "dos capas", incluir la definición de un umbral para cada gen diana utilizando los datos de entrenamiento y restando el umbral de la combinación lineal calculada, produciendo el resumen de genes. En este caso, el umbral puede elegirse de manera que un nivel de resumen de gen negativo se corresponda con un gen diana regulado negativamente y que un nivel de resumen de gen positivo se corresponda con un gen diana regulado positivamente. Además, es posible que los valores de resumen de genes se transformen usando, por ejemplo, una de las transformaciones mencionadas anteriormente (difusa, discreta, etc.) antes de que se combinen en la "segunda capa (superior)".
Una vez que se ha determinado el nivel de actividad del elemento TF mediante la evaluación del modelo de "dos capas", el nivel de actividad del elemento TF determinado puede establecerse como umbral para inferir la actividad de la ruta de señalización celular, como se ha descrito anteriormente.
En el presente documento, los modelos descritos anteriormente con referencia al documento WO 2014/102668 A2 se denominan colectivamente "modelos (pseudo)lineales".
Si bien la descripción anterior con respecto a la construcción del modelo matemático también se aplica a la inferencia de la actividad de la ruta de PI3K, la selección de los genes diana y el entrenamiento y uso del modelo matemático se modificaron en cierta medida para la ruta de PI3K en comparación con la ruta de Wnt, la ruta de ER y la ruta de HH. Por lo tanto, estas etapas se describirán para la ruta de PI3K con más detalle a continuación:
(A) Ruta de PI3K
(i) Selección de genes diana
Un factor de transcripción (TF) es un complejo de proteínas (es decir, una combinación de proteínas unidas en una estructura específica) o una proteína que es capaz de regular la transcripción de genes diana al unirse a secuencias de ADN específicas, controlando de esta manera la transcripción de información genética de ADN a ARNm. El ARNm producido directamente debido a esta acción del complejo de transcripción se denomina en el presente documento un "gen diana directo" (del factor de transcripción). La activación de la ruta de señalización celular también puede dar como resultado una mayor transcripción de genes secundarios, denominados "genes diana indirectos". En lo sucesivo, se prefieren los modelos de red bayesiana (como modelos matemáticos de ejemplo) que comprenden o consisten en genes diana directos como enlaces directos entre la actividad de la ruta de señalización celular y el nivel de ARNm, sin embargo, la distinción entre genes diana directos e indirectos no siempre es evidente. En el presente documento, se presenta un método para seleccionar genes diana directos usando una función de puntuación basada en los datos de la bibliografía científica disponible. No obstante, no puede descartarse una selección accidental de genes diana indirectos debido a la información limitada, así como a las variaciones biológicas e incertidumbres. Para seleccionar los genes diana, se emplearon dos repositorios de la bibliografía científica actualmente disponible para generar dos listas de genes diana.
La primera lista de genes diana se generó basándose en la bibliografía científica recuperada de la base de datos MEDLINE del National Institute of Health accesible en "www.ncbi.nlm.nih.gov/pubmed" y denominada en lo sucesivo en el presente documento "Pubmed". Las publicaciones que contenían genes diana de FOXO putativos se buscaron mediante consultas tales como (FOXO Y "gen diana") en el periodo del primer trimestre de 2013. Las publicaciones resultantes se analizaron posteriormente de forma manual siguiendo la metodología que se describe con más detalle a continuación.
Se seleccionaron genes diana de ARNm de la ruta de señalización celular específica de la bibliografía científica, mediante el uso de un sistema de clasificación en el que se dio una clasificación a la evidencia científica para un gen diana específico, dependiendo del tipo de experimentos científicos en los que se acumuló la evidencia. Si bien algunas pruebas experimentales sugieren simplemente que un gen es un gen diana, como por ejemplo un ARNm que aumenta en una micromatriz de una línea celular en la que se sabe que el eje de señalización celular de PI3K está activo, otras pruebas pueden ser muy sólidas, como la combinación de un sitio de unión de TF de la ruta de señalización celular identificada y la recuperación de este sitio en un ensayo de inmunoprecipitación de cromatina (ChIP) después de la estimulación de la ruta de señalización celular específica en la célula y el aumento de ARNm después de la estimulación específica de la ruta de señalización celular en una línea celular.
En la bibliografía científica pueden identificarse varios tipos de experimentos para encontrar genes diana de rutas de señalización celular específicos:
1. Experimentos ChIP en los que se muestra la unión directa de una ruta de señalización celular-TF a su sitio de unión en el genoma. Ejemplo: Mediante el uso de la tecnología de inmunoprecipitación de cromatina (ChIP), se identificaron posteriormente sitios de unión de TF de FOXO funcionales putativos en el ADN de líneas celulares con y sin inducción activa de la ruta de PI3K, como un subconjunto de los sitios de unión reconocidos puramente basándose en la secuencia de nucleótidos. La funcionalidad putativa se identificó como evidencia derivada de ChIP de que se encontró que el TF se unía al sitio de unión del ADN.
2. Ensayos de cambio de movilidad electroforética (EMSA) que muestran la unión in vitro de un TF a un fragmento de ADN que contiene la secuencia de unión. En comparación con la evidencia basada en ChIP, la evidencia basada en EMSA es menos sólida, ya que no puede traducirse a la situación in vivo.
3. Estimulación de la ruta de señalización celular y medición de perfiles de ARNm en una micromatriz o mediante secuenciación de ARN, utilizando líneas celulares inducibles por la ruta de señalización celular y midiendo los perfiles de ARNm medidos en varios puntos de tiempo después de la inducción, en presencia de cicloheximida, que inhibe la traducción a proteína, por lo tanto, se supone que los ARNm inducidos son genes diana directos.
4. Similar a 3, pero usando PCR cuantitativa para medir las cantidades de ARNm.
5. Identificación de sitios de unión de TF en el genoma mediante un enfoque bioinformático. Ejemplo para el elemento TF de FOXO: Usando el motivo de unión a FOXO conservado 5'-TTGTTTAC-3', se ejecutó un programa de software en la secuencia del genoma humano y se identificaron los sitios de unión potenciales, tanto en regiones promotoras de genes como en otras regiones genómicas.
6. Similar a 3, solo en ausencia de cicloheximida.
7. Similar a 4, solo en ausencia de cicloheximida.
8. Perfiles de expresión de ARNm de muestras de tejido o células específicas de las que se sabe que la ruta de señalización celular está activa, sin embargo, en ausencia de la condición de control negativo adecuada.
En la forma más sencilla, se puede dar a cada ARNm diana potencial 1 punto para cada uno de estos enfoques experimentales en los que se identificó el ARNm diana.
Como alternativa, los puntos se pueden gradualmente, lo que significa una tecnología un punto, una segunda tecnología suma un segundo punto, etc. Usando esta estrategia de clasificación relativamente sencilla, puede hacerse una lista de los genes diana más fiables.
Como alternativa, la clasificación de otra manera puede usarse para identificar los genes diana que tienen más probabilidades de ser genes diana directos, dando un mayor número de puntos a la tecnología que proporciona la mayor evidencia de un gen diana directo in vivo, en la lista anterior significaría 8 puntos para el enfoque experimental 1), 7 para 2) y bajar a 1 punto para el enfoque experimental 8). Tal lista puede denominarse "lista general de genes diana".
A pesar de las variaciones biológicas e incertidumbres, los inventores supusieron que los genes diana directos son los que tienen más probabilidades de inducirse de forma independiente del tejido. Una lista de estos genes diana puede denominarse una "lista de genes diana curada por pruebas". Tal lista de genes diana curada por pruebas se ha utilizado para construir modelos computacionales de la ruta de PI3K que se pueden aplicar a muestras procedentes de diferentes fuentes de tejidos.
Lo siguiente ilustrará a modo de ejemplo cómo se construyó específicamente la selección de una lista de genes diana curada por pruebas para la ruta de PI3K.
Con el fin de seleccionar los genes diana de PI3K utilizados como entrada para el "modelo", se utilizaron los tres criterios siguientes:
1. La región promotora/potenciadora del gen contiene un motivo de unión a FOXO:
a. Se debe demostrar que el motivo de unión a FOXO responde a una actividad de la ruta de PI3K, por ejemplo, por medio de un ensayo de transfección transitoria en el que el motivo FOXO específico está unido a un gen indicador, y
b. La presencia del motivo FOXO debe confirmarse mediante, por ejemplo, un análisis de motivo enriquecido de la región promotora/potenciadora del gen.
2. FOXO (diferencialmente) se une in vivo a la región promotora/potenciadora del gen en cuestión, demostrado mediante, por ejemplo, un experimento ChIP/CHIP u otra técnica de inmunoprecipitación de cromatina:
a. Se ha demostrado que FOXO se une a la región promotora/potenciadora del gen cuando la ruta de PI3K no está activa, y
b. (preferentemente) no se une (o se une débilmente) a la región promotora/potenciadora del gen cuando la ruta de PI3K está activa.
3. El gen se transcribe diferencialmente cuando se cambia la actividad de la ruta de PI3K, demostrado mediante, por ejemplo,
a. un grado de enriquecimiento del ARNm del gen en cuestión a través de PCR en tiempo real o experimento de micromatrices, o
b. la demostración de que el ARN Pol II se une a la región promotora del gen a través de un ensayo de inmunoprecipitación.
La selección se realizó definiendo como genes diana de PI3K los genes para los que se recopiló una evidencia experimental suficiente y bien documentada que probaba que se cumplían los tres criterios mencionados anteriormente. Un experimento adecuado para recopilar una evidencia de la unión diferencial de PI3K es comparar los resultados de, por ejemplo, un experimento ChIP-Seq en una línea celular de cáncer que expresa la actividad de la ruta de PI3K en respuesta al tamoxifeno (por ejemplo, una línea celular transfectada con una construcción FOXO inducible por tamoxifeno, tal como FOXO.a 3.ER), cuando se expone o no al tamoxifeno. Lo mismo se aplica a la recopilación de evidencia de la transcripción de ARNm.
Lo anterior analiza el enfoque genérico y un ejemplo más específico del procedimiento de selección de genes diana que se ha empleado para seleccionar varios genes diana basándose en la evidencia encontrada usando el enfoque mencionado anteriormente. Las listas de genes diana utilizados en los modelos de red bayesiana para la ruta de PI3K se muestran en la Tabla 1.
Tabla 1: "Lista curada por pruebas de genes diana" de la ruta de PI3K usada en los modelos de red bayesiana y conjunto es diana.
Figure imgf000013_0001
continuación
Figure imgf000014_0002
La segunda lista de genes diana se generó usando la base de datos curada manualmente de publicaciones científicas proporcionadas en Metacore de Thomson-Reuters (última consulta el 14 de mayo de 2013). Se consultaron en la base de datos genes que están regulados transcripcionalmente directamente cadena abajo de la familia de factores de transcripción FOXO humanos (es decir, FOXO1, FOXO3A, FOXO4 y FOXO6). Esta consulta dio como resultado 336 genes diana de FOXO putativos que se analizaron adicionalmente de la siguiente manera. En primer lugar, se eliminaron todos los genes diana de FOXO putativos que solo tenían una publicación de apoyo. A continuación, se introdujo una función de puntuación que daba un punto para cada tipo de evidencia experimental, tales como ChIP, EMSA, expresión diferencial, atenuación/inactivación génica, ensayo del indicador del gen de la luciferasa, análisis de secuencia, que se informó en una publicación. La misma evidencia experimental a veces se menciona en múltiples publicaciones, lo que da como resultado un número correspondiente de puntos, por ejemplo, dos publicaciones que mencionan un resultado de ChIP dan como resultado el doble de la puntuación que se da para un solo resultado de ChIP. Se realizaron análisis adicionales para permitir solo genes que tenían diversos tipos de evidencia experimental y no solo un tipo de evidencia experimental, por ejemplo, expresión diferencial. Por último, se calculó una puntuación de evidencia para todos los genes diana de FOXO putativos y se seleccionaron todos los genes diana de FOXO putativos con una puntuación de evidencia de 6 o más (mostrado en la Tabla 2). El nivel de corte de 6 se eligió heurísticamente, ya que se demostró previamente que aproximadamente 30 genes diana son suficientes en gran medida para determinar la actividad de la ruta.
Una lista de estos genes diana puede denominarse "lista de genes diana basada en bases de datos". Tal lista de genes diana curada se ha utilizado para construir modelos computacionales que pueden aplicarse a muestras procedentes de diferentes fuentes de tejidos.
Tabla 2: "Lista de genes diana basada en bases de datos" de la ruta de PI3K usada en los modelos de red bayesiana y con n n i r m ir l niv l x r i n ARNm l s genes diana.
Figure imgf000014_0001
continuación
Figure imgf000015_0001
La tercera lista de genes diana se generó sobre la base de las dos listas mencionadas anteriormente, es decir, la lista curada por pruebas (véase la Tabla 1) y la lista basada en bases de datos (véase la Tabla 2). Se han utilizado tres criterios para seleccionar más genes de estas dos listas. El primer criterio está relacionado con la función atribuida a los genes diana. Las funciones atribuidas a los genes se pueden encontrar en la bibliografía científica, pero a menudo están disponibles en bases de datos públicas tal como la base de datos OMIM de los NIH (accesible a través de "http://www.ncbi.nlm.nih.gov/omim"). Los genes diana de la lista curada por pruebas en la Tabla 1 y la lista basada en bases de datos en la Tabla 2 que se encontró que estaban involucrados en procesos esenciales para el cáncer, tales como apoptosis, ciclo celular, supresión/progresión tumoral, reparación del ADN, diferenciación, se seleccionaron en la tercera lista. Finalmente, se seleccionaron genes diana que se encontró que tenían una expresión diferencial alta en experimentos de líneas celulares con una actividad de PI3K alta/FOXO baja conocida frente a una actividad de PI3K baja/FOXO alta conocida. En el presente documento, los genes diana que tenían una diferencia de expresión mínima de 205 (en el presente documento: en un nivel de conjunto de sondas) entre el estado "activado" y "desactivado" de la transcripción de FOXO promediado sobre varias muestras se incluyeron en la tercera lista. El tercer criterio estaba especialmente dirigido a la selección de los genes diana más discriminativos. Basándose en los niveles de expresión en experimentos de líneas celulares con múltiples muestras con una actividad de PI3K alta/FOXO baja conocida y múltiples muestras con una actividad PI3K baja/FOXO alta conocida, se calculó una razón de probabilidades (OR). En el presente documento, la razón de probabilidades se calculó por conjunto de sondas utilizando el valor de la mediana como punto de corte y un límite suave que representa la incertidumbre en la medición. Los genes diana de la lista curada por pruebas y la lista basada en bases de datos se clasificaron de acuerdo con la razón de probabilidades "suave" y los genes diana con la clasificación más alta (OR >2) y la clasificación más baja (OR <1/2, es decir, genes diana regulados negativamente) se seleccionaron para la tercera lista de genes diana.
Teniendo en cuenta la función del gen, la expresión diferencial en la señalización "activada" frente a la "desactivada" y una razón de probabilidades más alta, se encontró un conjunto de genes diana (mostrado en la Tabla 3) que se consideró más probatorio en la determinación de la actividad de la ruta de señalización de PI3K. Tal lista de genes diana puede denominarse una "lista corta de genes diana". Por lo tanto, los genes diana informados en la Tabla 3 son particularmente preferidos de acuerdo con la presente invención. No obstante, dada la relativa facilidad con la que la tecnología de adquisición, tal como las micromatrices, puede adquirir niveles de expresión para grandes conjuntos de genes, se contempla utilizar algunos o todos los genes diana de la Tabla 3 y, opcionalmente, usar adicionalmente uno, dos, algunos o todos los genes diana restantes de la Tabla 1 y la Tabla 2.5*10
Tabla 3: "Lista corta de genes diana" de la ruta de PI3K basada en la lista de genes diana curada por pruebas y la
Figure imgf000016_0001
Los inventores realizaron una selección adicional de la lista de genes diana curada por pruebas (véase la Tabla 1). Se seleccionaron los genes diana de la lista curada por pruebas que demostraron ser más probatorios para determinar la actividad de la ruta de PI3K a partir de las muestras de entrenamiento. Los genes diana se seleccionaron basándose en la razón de probabilidades "suave" con los 12 genes principales seleccionados para la "lista corta de 12 genes diana" (véase la Tabla 4).
Tabla 4: "Lista corta de 12 genes diana" de genes diana de PI3K basada en la lista de genes diana curada por
Figure imgf000016_0002
Antes de que el modelo de ruta matemático pueda usarse para inferir la actividad de la ruta de señalización celular, en este caso, la ruta de PI3K, en un sujeto, el modelo debe estar apropiadamente entrenado.
Si el modelo de ruta matemático es un modelo probabilístico, por ejemplo, un modelo de red bayesiana, basado en probabilidades condicionales que relacionan el elemento TF de FOXO y los niveles de expresión de los tres o más genes diana de la ruta de PI3K medidos en la muestra del sujeto, el entrenamiento puede realizarse preferentemente como se describe en detalle en la solicitud de patente internacional publicada WO 2013/011479 A2 ("Assessment of cellular signaling pathway activity using probabilistic modeling of target gene expression").
Si el modelo de ruta matemático se basa en una o más combinaciones lineales de niveles de expresión de los tres o más genes diana de la ruta de PI3K medidos en la muestra del sujeto, el entrenamiento se puede realizar preferentemente como se describe en detalle en la solicitud de patente provisional de EE.UU. no publicada 61/745839 ("Assessment of cellular signaling pathway activity using linear combination(s) of target gene expressions").
En el presente documento, se usó un modelo de red bayesiana ejemplar como se muestra en la figura 1 para modelar el programa transcripcional de la ruta de PI3K de una manera sencilla. El modelo consiste en tres tipos de nodos: (a) un elemento de factor de transcripción (TF) (con estados "ausente" y "presente") en una primera capa 1; (b) genes diana TG1, TG2 , TGn (con estados "activo" e "inactivo") en una segunda capa 2, y, en una tercera capa 3; (c) nodos de medición vinculados a los niveles de expresión de los genes diana. Estos pueden ser conjuntos de sondas de micromatrices PS1,1, PS1,2, PS1,3, PS2,1, PSn,1, PDn,m (con estados "bajo" y "alto"), como se usa preferentemente en el presente documento, pero también podrían ser otras medidas de expresión génica tales como RNAseq o RT-qPCR.
Una implementación adecuada del modelo de ruta matemático, en el presente documento, el modelo de red bayesiana de ejemplo, se basa en datos de micromatrices. El modelo describe (i) cómo los niveles de expresión de los genes diana dependen de la activación del elemento TF y (ii) cómo las intensidades de conjuntos de sondas, a su vez, dependen de los niveles de expresión de los genes diana respectivos. Por último, las intensidades del conjunto de sondas pueden tomarse de micromatrices Affymetrix HG-U133Plus2.0 preprocesadas con fRMA, que están ampliamente disponibles en Gene Expression Omnibus (GEO, www.ncbi.nlm.nih.gov/geo) y ArrayExpress (www. ebi.ac.uk/arrayexpress).
Como el modelo de red bayesiana de ejemplo es una simplificación de la biología de una ruta de señalización celular, en el presente documento, la ruta de PI3K, y como las mediciones biológicas típicamente son ruidosas, se optó por un enfoque probabilístico, es decir, las relaciones entre (i) el elemento TF y los genes diana, y (ii) los genes diana y sus respectivos conjuntos de sondas, se describen en términos probabilísticos. Además, se asumió que la actividad de la ruta de señalización celular oncogénica que impulsa el crecimiento tumoral no se altera de forma transitoria y dinámica, sino a largo plazo o incluso se altera irreversiblemente. Por lo tanto, se desarrolló el modelo de red bayesiana de ejemplo para la interpretación de una condición celular estática. Por esta razón, las características complejas de la ruta de señalización celular dinámica no se incorporaron al modelo.
Una vez que se construye y se calibra el modelo de red bayesiana de ejemplo (véase a continuación), el modelo puede usarse en datos de micromatrices de una nueva muestra introduciendo las mediciones del conjunto de sondas como observaciones en la tercera capa 3, e infiriendo hacia atrás en el modelo cuál debe haber sido la probabilidad de que el elemento TF esté "presente". En este caso, se considera "presente" el fenómeno de que el elemento TF está unido al ADN y controla la transcripción de los genes diana de la ruta de señalización celular, y "ausente" el caso de que el elemento TF no controle la transcripción. Esta última probabilidad es, por lo tanto, la lectura primaria que puede usarse para indicar la actividad de la ruta de señalización celular, en el presente documento, la ruta de PI3K, que a continuación se puede traducir en las probabilidades de que la ruta de señalización celular esté activa tomando la relación de la probabilidad de que esté activa frente a la de estar inactiva (es decir, las probabilidades vienen dadas por p/(1-p) si p es la probabilidad predicha de que la ruta de señalización celular esté activa).
En el modelo de red bayesiana de ejemplo, las relaciones probabilísticas se han hecho cuantitativas para permitir un razonamiento probabilístico cuantitativo. Para mejorar el comportamiento de generalización entre tipos de tejidos, los parámetros que describen las relaciones probabilísticas entre (i) el elemento TF y los genes diana se han seleccionado cuidadosamente. Si el elemento TF está "ausente", lo más probable es que el gen diana esté "inactivo", por lo que se elige una probabilidad de 0,95 para esto y una probabilidad de 0,05 para que el gen diana esté "activo". La última probabilidad (distinta de cero) es para tener en cuenta la posibilidad (rara) de que el gen diana esté regulado por otros factores o se observe accidentalmente "activo" (por ejemplo, debido al ruido de medición). Si el elemento TF está "presente", entonces con una probabilidad de 0,70, el gen diana se considera "activo", y con una probabilidad de 0,30 el gen diana se considera "inactivo". Los últimos valores se eligen de esta manera, debido a que puede haber varias razones por las que un gen diana no se expresa en gran medida aunque el elemento TF esté presente, por ejemplo, porque la región promotora del gen está metilada. En el caso de que un gen diana no esté regulado positivamente por el elemento TF, sino regulado negativamente, las probabilidades se eligen de manera similar, pero reflejando la regulación negativa en presencia del elemento TF. Los parámetros que describen las relaciones entre (ii) los genes diana y sus respectivos conjuntos de sondas se han calibrado con datos experimentales. Por último, en este ejemplo, se utilizaron datos de micromatrices de experimentos de líneas celulares con configuraciones de rutas activas e inactivas definidas, pero esto también podría realizarse utilizando muestras de pacientes con un estado conocido de actividad de la ruta de señalización celular. Las tablas de probabilidad condicional resultantes vienen dadas por:
A: r n i n r l iiv m n
Figure imgf000017_0001
continuación
Figure imgf000018_0002
B r n i n r l n iv m n
Figure imgf000018_0001
En estas tablas, las variables AL j AH j PL, j y PH¡ j indican el número de muestras de calibración con un complejo de transcripción "ausente" (A) o "presente" (P) que tienen una intensidad del conjunto de sondas "baja" (L) o "alta" (H), respectivamente. Se han añadido recuentos ficticios para evitar probabilidades extremas de 0 y 1.
Para discretizar las intensidades del conjunto de sondas observadas, para cada conjunto de sondas PS, j se usó un umbral tj por debajo del cual la observación se denomina "baja" y por encima del cual se denomina "alta". Este umbral se ha elegido para que sea la intensidad media (ponderada) del conjunto de sondas en el conjunto de datos de calibración usado. Debido al ruido de los datos de micromatrices, se usó un método difuso al comparar la intensidad de un conjunto de sonda observado con su umbral, asumiendo una distribución normal con una desviación estándar de 0,25 (en una escala de 2 logaritmos) alrededor de la intensidad informada, y determinando la masa de probabilidad por debajo y por encima del umbral.
Si en lugar de la red bayesiana de ejemplo descrita anteriormente, se empleó un modelo (pseudo)lineal como se ha descrito anteriormente, las ponderaciones que indican el signo y la magnitud de la correlación entre los nodos y un umbral para indicar si un nodo está "ausente" o "presente" deberían determinarse antes de que el modelo pueda usarse para inferir la actividad de la ruta de señalización celular en una muestra de prueba. Podría usarse el conocimiento experto para completar las ponderaciones y el umbral a priori, pero típicamente el modelo se entrenaría usando un conjunto representativo de muestras de entrenamiento, de los cuales preferentemente se conoce la verdad fundamental, por ejemplo, datos de expresión de conjuntos de sondas en muestras con un complejo de factor de transcripción "presente" conocido (= ruta de señalización celular activa) o complejo de factor de transcripción "ausente" (= ruta de señalización celular pasiva).
Se conoce en el campo una multitud de algoritmos de entrenamiento (por ejemplo, regresión) que toman en cuenta la topología del modelo y cambian los parámetros del modelo, en este caso, las ponderaciones y el umbral, de tal manera que la salida del modelo, en este caso, una puntuación lineal ponderada, se optimiza. Como alternativa, también es posible calcular las ponderaciones directamente a partir de los niveles de expresión observados sin la necesidad de un algoritmo de optimización.
Un primer método, denominado método "blanco y negro" en el presente documento, se reduce a un sistema ternario, en el que cada ponderación es un elemento del conjunto {-1,0, 1}. Si esto se pone en un contexto biológico, el -1 y el 1 corresponden a genes diana o conjuntos de sondas que están regulados negativa y positivamente en caso de actividad de la ruta de señalización celular, respectivamente. En caso de que no se pueda demostrar estadísticamente que un conjunto de sondas o un gen diana esté regulado positiva o negativamente, recibe una ponderación de 0. En un ejemplo, puede usarse una prueba t de dos muestras de lado izquierdo y de lado derecho de los niveles de expresión de las muestras de la ruta de señalización celular activa frente a los niveles de expresión de las muestras con una ruta de señalización celular pasiva para determinar si una sonda o gen está regulado positiva o negativamente dados los datos de entrenamiento utilizados. En los casos en los que el promedio de las muestras activas sea estadísticamente mayor que las muestras pasivas, es decir, el valor p está por debajo de un cierto umbral, por ejemplo, 0,3, se determina que el gen o conjunto de sondas diana está regulado positivamente. Por el contrario, en los casos en los que el promedio de las muestras activas sea estadísticamente menor que las muestras pasivas, se determina que el gen o conjunto de sondas diana está regulado negativamente tras la activación de la ruta de señalización celular. En caso de que el valor p más bajo (del lado izquierdo o derecho) exceda el umbral mencionado anteriormente, la ponderación del gen diana o el conjunto de sondas puede definirse como 0.
Un segundo método, denominado "probabilidades logarítmicas" - ponderaciones en el presente documento, se basa en el logaritmo (por ejemplo, en base e) de la razón de probabilidades. La razón de probabilidades para cada gen diana o conjunto de sondas se calcula basándose en el número de muestras de entrenamiento positivas y negativas para las que el nivel del conjunto de sondas/gen diana está por encima y por debajo de un umbral correspondiente, por ejemplo, la mediana (ponderada) de todas las muestras de entrenamiento. Puede añadirse un pseudorrecuento para eludir las divisiones entre cero. Otro refinamiento es contar las muestras por encima o por debajo del umbral de una manera algo más probabilística, asumiendo que los niveles del conjunto de sondas/gen diana están, por ejemplo, normalmente distribuidos alrededor de su valor observado con una cierta desviación estándar especificada (por ejemplo, 0,25 en una escala de 2 logaritmos) y contando la masa de probabilidad por encima y por debajo del umbral.
En el presente documento, una razón de probabilidades calculada en combinación con un pseudorrecuento y usando masas de probabilidad en lugar de valores de medición deterministas se denomina razón de probabilidades "suave".
Pueden encontrarse detalles adicionales sobre la inferencia de la actividad de la ruta de señalización celular usando modelos matemáticos de la expresión de genes diana en Verhaegh W. et al., "Selection of personalized patient therapy through the use of knowledge-based computational models that identify tumor-driving signal transduction pathways", Cancer Research, Vol. 74, N.° 11, 2014, páginas 2936 a 2945.
En el presente documento, los datos disponibles públicamente sobre la expresión de una línea celular HUVEC con una transfección estable de una construcción FOXO que es inducible tras la estimulación con 4OHT (GSE16573 disponible en Gene Expression Omnibus, consultado por última vez el 6 de octubre de 2014) se utilizaron como un ejemplo para entrenar el modelo de ruta de PI3K. Las líneas celulares con la construcción FOXO inducible que se estimularon durante 12 horas con 4OHT se consideraron como muestras activas de FOXO (n = 3), mientras que las muestras pasivas de FOXO fueron las líneas celulares con la construcción sin estimulación con 4OHT (n = 3).
(B) Ruta de Wnt
La selección de genes diana de Wnt se ha descrito previamente en los documentos WO 2013/011479 A2 y WO 2014/102668 A2. La "Lista curada por pruebas de genes diana" (véase la Tabla 5) para la ruta de Wnt se usó como se describe en este Ejemplo anterior para los genes diana de PI3K con el fin de generar la "Lista corta de genes diana" (véase la Tabla 6) de la ruta de Wnt y la "lista corta de 12 genes diana" (véase la Tabla 7) de genes diana de Wnt.
T l : "Li r r r n i n " l r Wn iliz n l m l r i n .
Figure imgf000019_0001
T l : "Li r n i n " l r Wn n l li r r r n i n .
Figure imgf000019_0002
continuación
Figure imgf000020_0002
Tabla 7: "Lista corta de 12 genes diana" de los genes diana de Wnt basada en la lista curada por pruebas de genes diana.
Figure imgf000020_0001
(C) Ruta de ER
Cabe apreciar que, con respecto a los documentos WO 2013/011479 A2 y WO 2014/102668 A2, en el presente documento, el orden de clasificación de los genes diana de ER cambia ligeramente debido a que se añadió nueva evidencia en la bibliografía. Los genes diana de ER se seleccionaron y se clasificaron de una manera similar a la descrita en el Ejemplo 3 del documento WO 2014/102668 A2. Los genes se clasificaron mediante la combinación de la puntuación de evidencia de la bibliografía y la capacidad individual de cada gen para diferenciar entre una ruta activa e inactiva dentro del modelo. Esta clasificación se basó en una combinación lineal de tasas ponderadas de falsos positivos y falsos negativos obtenidas para cada gen al entrenar el modelo con un conjunto de entrenamiento de muestras de líneas celulares MCF7, que se agotaron de estrógeno y posteriormente permanecieron agotadas o estuvieron expuestas a 1 nM de estrógeno durante 24 horas (GSE35428) y al probar el modelo con el conjunto de entrenamiento y otros dos conjuntos de entrenamiento en los que las células MCF7 se agotaron de estrógeno y posteriormente permanecieron agotadas o se expusieron a 10 nM o 25 nM de estrógeno (GSE11352 y GSE8597, respectivamente).
(Cabe apreciar que se utilizó una combinación de falsos positivos y falsos negativos ponderados (en lugar de razones de probabilidades) para tener en cuenta las diferentes condiciones experimentales utilizadas en los diversos conjuntos. Las diferentes ponderaciones se establecieron de acuerdo con la confianza del inventor de que los falsos positivos (negativos) fueron una consecuencia del modelo y no de las diferentes condiciones experimentales a las que se había sometido la muestra. Por ejemplo, en todos los experimentos, las muestras de la línea celular MCF7 se agotaron primero en estrógeno durante un periodo de tiempo antes de exponerse a estrógeno o se agotaron adicionalmente durante 24 horas más. Un tiempo de agotamiento más corto podría hacer que la ruta aún estuviera activa a pesar del agotamiento de estrógenos, en este caso, un falso positivo tendría menos ponderación que cuando las muestras tanto de prueba como de entrenamiento se agotaron durante la misma cantidad de tiempo).
Basándose en la revisión de la bibliografía adicional y al examen de la magnitud de la expresión diferencial entre las muestras activas e inactivas, como se analiza con más detalle a continuación, se seleccionó PDZK1 como un gen diana directo de la ruta de ER. Después de evaluar manualmente los artículos científicos adicionales en busca de pruebas experimentales de genes diana de ER putativos utilizando una metodología análoga a la descrita en este ejemplo (para PI3K), se identificaron varios genes diana de ER putativos adicionales.
Se analizaron genes diana de ER putativos para determinar la presencia de una región promotora/potenciadora del gen que contenía un motivo de elemento de respuesta a estrógenos (ERE). Debe demostrarse que el motivo ERE responde a los estrógenos, por ejemplo, mediante un ensayo de transfección transitoria en el que el motivo ERE específico está ligado a un gen indicador. La presencia del motivo ERE debe confirmarse mediante, por ejemplo, un análisis de motivo enriquecido de la región promotora/potenciadora del gen. Además, ER (diferencialmente) se une in vivo a la región promotora/potenciadora del gen en cuestión, demostrado mediante, por ejemplo, un experimento ChIP/CHIP o un ensayo de inmunoprecipitación de cromatina. Por ejemplo, se debe demostrar que ER está unido a la región promotora/potenciadora del gen cuando la ruta de ER está activa y, por ejemplo, no está unido (o solo está unido débilmente) a la región promotora/potenciadora del gen si la ruta de ER no está activa. Por último, el gen se transcribe diferencialmente cuando la ruta de ER está activa, demostrado mediante, por ejemplo, un grado de enriquecimiento del ARNm del gen en cuestión mediante PCR en tiempo real, o un experimento de micromatrices, o la demostración de que el ARN Pol II se une a la región promotora del gen a través de un ensayo de inmunoprecipitación.
La selección se realizó definiendo como genes diana de ER los genes para los que se recopiló una evidencia experimental suficiente y bien documentada de la bibliografía que probaba que se cumplían los tres criterios mencionados anteriormente. Un experimento adecuado para recopilar una evidencia de unión diferencial de ER es comparar los resultados de, por ejemplo, un experimento ChIP/CHIP en una línea celular de cáncer que responde al estrógeno (por ejemplo, la línea celular MCF-7), cuando se expone o no se expone a estrógeno. Después de evaluar todos los artículos científicos adicionales, una nueva clasificación para todos los genes diana putativos se basó en la solidez de la evidencia experimental encontrada en la bibliografía. En consecuencia, un gen diana putativo de la ruta de señalización celular de ER, PDZK1, logró una puntuación de evidencia experimental por encima del umbral establecido. Por lo tanto, se consideró que PDZK1 era un gen diana directo genuino de la ruta de ER.
En la selección original de genes diana de ER solo se consideró la capacidad de diferenciar muestras activas frente a inactivas, calculada usando la razón de probabilidades "suave". En el análisis actual, la magnitud de la expresión diferencial también se incluyó en la evaluación. Dado que la magnitud de la señal de expresión diferencial está próxima a la razón de probabilidades "suave" como una característica importante de un ensayo bien diseñado, se prevé que este nuevo método de selección sea una mejora con respecto a los criterios originales. La magnitud de la expresión génica diferencial se estimó promediando la diferencia de la expresión génica media entre las muestras activas (activadas) de ER y las muestras inactivas (inactivadas) de ER en una selección de conjuntos de datos de Affymetrix HG1133Plus2, concretamente, GSE35427, GSE11352, GSE21618, GSE8597 y dos conjuntos de datos generados internos que incluyen múltiples líneas celulares de cáncer de mama estimuladas con estradiol (E2) o un control. La expresión génica media se calculó por separado para cada conjunto de sondas de Affymetrix relacionado con el gen para cada conjunto de datos. Solo se tuvieron en cuenta en el promedio los conjuntos de sondas que se expresaron significativamente de manera diferente. La expresión diferencial promedio entre las muestras estimuladas con estradiol, es decir, muestras activas de ER, y muestras de control/no estimuladas, es decir, muestras pasivas de ER, de PDZK1 fue 2,08. Esta expresión diferencial es excepcionalmente alta (el promedio de todos los genes regulados positivamente es 0,88) y es comparable a los genes diana con la expresión diferencial más alta, por ejemplo, PGR con una expresión diferencial promedio de 2,14. Además, la razón de posibilidades "suave" de PDZK1 (promedio 26,6) también es superior al promedio (19,03).
En los siguientes ejemplos se compara el modelo original de la lista de 13 genes diana de ER (GREB1, PGR, XBP1, CA12, SOD1, CTSD, IGFBP4, TFF1, SGK3, NRIP1, CELSR2, WISP2 y AP1B1) (en lo sucesivo, modelo de lista corta) con un nuevo modelo de 14 genes diana de ER construido usando PDZK1 y la lista original de 13 genes diana de ER (en lo sucesivo denominada modelo de lista corta PDZK1). Ambos modelos de red bayesiana se entrenaron exactamente de la misma manera (utilizando el conjunto de datos de Affymetrix HGU133Plus2 GSE8597) siendo la única diferencia la lista de genes diana de ER.
En el ejemplo 1, se calculó la actividad de la ruta de ER para una selección de conjuntos de datos de Affymetrix HGU133Plus2 que ilustran muestras de cáncer de mama típicas y muestras de tejido mamario normal (conjuntos de datos públicos GSE12276, GSE10870 y GSE21653) que contienen 256 muestras de cáncer de mama ER positivas, 195 muestras de cáncer de mama ER negativas, 27 muestras de tejido mamario normal y 94 muestras de cáncer de mama con estado de ER desconocido. Si bien se espera que la ruta de ER esté inactiva en el cáncer de mama ER negativo y la mama normal, se espera que entre el 50 y el 70 % de los cánceres de mama ER positivos estén activos, basándose en la respuesta a los datos de la terapia hormonal. La proporción de muestras de cáncer de mama ER positivo que se predice que estarán activas por el modelo de lista corta (74 %) y por el modelo de lista corta PDZK1 (73 %) es comparable y similar a la proporción de pacientes con cáncer de mama ER positivo que responden a la terapia hormonal. Además, el promedio de la probabilidad de activación de ER, sobre todas las muestras ER positivas, calculado por el modelo de lista de lista corta PDZK1 (razón de probabilidades de 2 logaritmos promedio: 2,73) es ligeramente mayor que la probabilidad promedio de activación predicha por el modelo de lista corta (razón de probabilidades de 2 logaritmos promedio: 2,70, con una diferencia de 0,03 en la escala de razón de probabilidades de 2 logaritmos) haciéndolos comparables para este tipo de muestra. Un efecto técnico beneficioso inesperado de la inclusión de PDZK1 ocurre cuando se analizan muestras de cáncer de mama ER negativo y de tejido normal: el promedio de la probabilidad de activación de ER calculado por el modelo de lista corta PDZK1 (razón de probabilidades de 2 logaritmos promedio: -7,3) es considerablemente menor que la probabilidad promedio de activación predicha por el modelo de lista corta (razón de probabilidades de 2 logaritmos promedio: 6,8, con una diferencia de 0,5 en la escala de razón de probabilidades de 2 logaritmos, prueba de clasificación de Wilcoxon bilateral pv = 0,02), lo que hace que el modelo de lista corta PDZK1 sea técnicamente mejor que el modelo corto en esta situación. Además, esta mejora es un escalado de más de un minuto de las actividades de la ruta predichas que se anticipa en caso de que se agregue un gen diana más al modelo, por lo que la adición de PDZK1 produce un efecto técnico ventajoso inesperado.
En el ejemplo 2, se calculó la actividad de la ruta de ER para los conjuntos de datos públicos de Affymetrix HGU133Plus2 GSE8597, GSE35428, GSE11352, que ilustran experimentos en los que las líneas de células mamarias sensibles al estrógeno (en este caso MCF7) se exponen o se privan de estimulación con estrógenos. Es bien sabido que la exposición al estrógeno activa la ruta de ER en las líneas celulares MCF7 y la privación de estrógeno cierra la ruta de ER en las líneas celulares MCF7. Además, en este caso, el modelo de lista corta PDZK1 parece ser técnicamente superior al modelo de lista corta, tanto para el caso en el que las líneas celulares MCF7 están expuestas a estrógeno, donde la actividad predicha calculada por el modelo de lista corta PDKZ1 (razón de probabilidades de 2 logaritmos promedio: 14,7) es mayor que la actividad predicha calculada por el modelo de lista corta (razón de probabilidades de 2 logaritmos promedio: 14,0, una diferencia de 0,7 en la escala de razón de probabilidades de 2 logaritmos). La actividad predicha calculada para todas las muestras privadas de estimulación estrogénica por el modelo de lista corta PDKZ1 (razón de probabilidades de 2 logaritmos promedio: 7,7) es menor que la actividad predicha calculada por el modelo de lista corta (razón de probabilidades de 2 logaritmos promedio: -7,3, una diferencia de 0,4 en la escala de razón de probabilidades de 2 logaritmos) para el 85 % de las 27 muestras que fueron privadas de estrógeno. Además, esta mejora es un escalado de más de un minuto de las actividades de la ruta predichas que se anticipa en caso de que se agregue un gen diana más al modelo, por lo que la adición de PDZK1 produce un efecto técnico ventajoso inesperado.
Para probar el efecto del nuevo gen en los ensayos de PCR, en los siguientes ejemplos se compara una lista de 11 genes diana de ER (GREB1, PGR, XBP1, CA12, SOD1, CTSD, IGFBP4, TFF1, SGK3, NRIP1, CELSR2, ERBB2 y ESR1) (en lo sucesivo modelo de lista de PCR) con un nuevo modelo de 12 genes diana de ER construido utilizando PDZK1 y la lista de 11 genes diana de ER mencionada anteriormente (en lo sucesivo denominada modelo de lista de PCR+PDZK1). Ambos modelos de red bayesiana se entrenaron exactamente de la misma manera (utilizando datos de expresión génica generados por RT-qPCR, a partir de un experimento interno de privación/estimulación de estrógenos en líneas celulares MCF7) con la única diferencia de que se añadió el gen diana de ER PDZK1 en el modelo de lista de PCR PDZK1. La actividad de la ruta de ER se calculó para un total de 12 muestras: 6 privadas de estrógeno y 6 estimuladas con estrógeno. Aquí de nuevo el modelo que contiene PDZK1 (modelo de lista de PCR PDZK1) parece ser técnicamente superior al modelo sin PDZK1 (modelo de lista de PCR), tanto para el caso de exposición a estrógenos, donde la actividad predicha calculada por el modelo de lista de PCR PDKZ1 (razón de probabilidades de 2 logaritmos promedio: 4,7) es mayor que la actividad predicha calculada por el modelo de lista de PCR (razón de probabilidades de 2 logaritmos promedio: 3,9, una diferencia de 0,8 en la escala de razón de probabilidades de 2 logaritmos). La actividad predicha para las muestras privadas de estrógeno calculadas por el modelo de lista de PCR PDKZ1 (razón de probabilidades de 2 logaritmos promedio: -5,1) es menor que la actividad predicha calculada por el modelo de lista corta (razón de probabilidades de 2 logaritmos promedio: -4,5, una diferencia de 0,6 en la escala de razón de probabilidades de 2 logaritmos). Esta diferencia es muy importante en modelos que usan una pequeña cantidad de "sondas" para medir el perfil del gen diana de ER de muestra, ya que normalmente tienen menos poder de discriminación (cabe apreciar las bajas actividades predichas promedio). En conclusión, esta mejora es un escalado de más de un minuto de las actividades de la ruta predichas que se anticipa en caso de que se agregue un gen diana más al modelo, por lo que la adición de PDZK1 produce un efecto técnico ventajoso inesperado.
Como se ha analizado anteriormente, la selección de genes diana de ER se ha descrito previamente en los documentos WO 2013/011479 A2 y WO 2014/102668 A2. La "Lista curada por pruebas de genes diana" para la ruta de HH se usó como se describe en este Ejemplo anterior para los genes diana de PI3K con el fin de generar la "Lista corta de genes diana" de la ruta de ER y la "lista corta de 12 genes diana" de genes diana de ER, basándose en la revisión de la bibliografía adicional y la inclusión del gen diana PDZK1.
T l : "Li r r r n i n " l r ER iliz n l m l r i n .
Figure imgf000022_0001
Figure imgf000023_0001
T l : "Li r n i n" l r ER n l li r r r n i n .
Figure imgf000023_0003
Tabla 10: "Lista corta de 12 genes diana" de los genes diana de ER basada en la lista curada por pruebas de genes diana.
Figure imgf000023_0002
(D) Ruta de HH
La selección de genes diana de HH se ha descrito previamente en los documentos WO 2013/011479 A2 y WO 2014/102668 A2. La "Lista curada por pruebas de genes diana" para la ruta de HH se usó como se describe en este Ejemplo anterior para los genes diana de PI3K con el fin de generar la "Lista corta de genes diana" de la ruta de HH y la "lista corta de 12 genes diana" de genes diana de HH.
T l 11: "Li r r r n i n" l r HH iliz n l m l r i n .
Figure imgf000024_0001
" "
Figure imgf000024_0002
Tabla 13: "Lista corta de 12 genes diana" de los genes diana de HH basada en la lista curada por pruebas de genes diana.
Figure imgf000025_0001
Ejemplo 2: Determinación de la puntuación de riesgo
En general, se pueden idear muchas fórmulas diferentes para determinar una puntuación de riesgo que indica un riesgo de que un sujeto experimente un evento clínico dentro de un cierto periodo de tiempo y que se basa en una combinación de actividades inferidas de dos o más células rutas de señalización en un sujeto, es decir:
MPS = F(Pi) X, siendo i = 1...N, (3)
en la que MPS representa la puntuación de riesgo (el término "MPS" se usa en el presente documento como una abreviatura de "Puntuación de múltiples rutas" para indicar que la puntuación de riesgo está influenciada por las actividades inferidas de dos o más rutas de señalización celular), Pi representa la actividad de la ruta de señalización celular i, N representa el número total de rutas de señalización celular utilizadas para calcular la puntuación de riesgo, y X es un marcador de posición para posibles factores y/o parámetros adicionales que pueden entrar en la ecuación. Tal fórmula puede ser más específicamente un polinomio de cierto grado en las variables dadas, o una combinación lineal de las variables. Los coeficientes de ponderación y las potencias en dicho polinomio se pueden establecer basándose en el conocimiento de un experto, pero típicamente se utiliza un conjunto de datos de entrenamiento con una verdad fundamental conocida, por ejemplo, datos de supervivencia, para obtener estimaciones de los coeficientes de ponderación y las potencias de la Ec. (3). Las actividades inferidas se combinan usando la Ec. (3) y posteriormente generarán una MPS. A continuación, los coeficientes de ponderación y las potencias de la función de puntuación se optimizan de modo que una MPS alta se correlacione con una mayor probabilidad de que el paciente experimente el evento clínico, y viceversa. La optimización de la correlación de la función de puntuación con los datos de supervivencia se puede realizar utilizando una multitud de técnicas de análisis, por ejemplo, una prueba de riesgos proporcionales de Cox (como se usa preferentemente en el presente documento), una prueba de rango logarítmico, un estimador de Kaplan-Meier junto con técnicas de optimización estándar, tal como el descenso de gradientes o la adaptación manual, etc.
En sus experimentos, los inventores no encontraron ninguna razón para anticipar una respuesta de la ley de potencia entre las actividades de las rutas de señalización celular y el riesgo de recidiva, por lo tanto, la Ec. (3) se puede simplificar:
MPS = wi ■ Pi+ W2 ■ P2+ ...+ wn Pn + X, (4)
en la que wi, ..., wn representan coeficientes de ponderación.
En este ejemplo, el evento clínico es cáncer, en particular, cáncer de mama, y se consideran las actividades inferidas de la ruta de PI3K, la ruta de Wnt, la ruta de ER, la ruta de HH, como se analiza en detalle en el presente documento, así como en la solicitud de patente internacional publicada WO 2013/011479 A2 ("Assessment of cellular signaling pathway activity using probabilistic modeling of target gene expression") y/o en la solicitud de patente internacional publicada WO 2014/102668 A2 ("Assessment of cellular signaling pathway activity using linear combination(s) of target gene expressions").
Las fórmulas que se usan preferentemente en el presente documento tienen en cuenta las actividades de la ruta de PI3K y una o más de la ruta de Wnt, la ruta de ER y la ruta de HH. Estas fórmulas se basan en las observaciones de los inventores derivadas de la investigación en biología del cáncer, así como de las correlaciones descubiertas por los inventores en conjuntos de datos disponibles públicamente entre la supervivencia y las actividades de la ruta de PI3K, la ruta de Wnt, la ruta de ER y la ruta de HH. Se cree que las rutas de desarrollo temprano, como la ruta de Wnt y la ruta de HH, desempeñan un papel en la metástasis causada por las células cancerosas que han revertido a un fenotipo más parecido a las células madre, llamadas células madre cancerosas. De hecho, los inventores creen que hay suficientes indicaciones disponibles para que las rutas de desarrollo temprano, tales como la ruta de Wnt, desempeñen un papel en la metástasis del cáncer, permitiendo que las células cancerosas metastásicas comiencen a dividirse en el lugar de siembra en otro órgano o tejido. La metástasis se asocia con un peor pronóstico y representa una forma de recidiva del cáncer, por lo que los inventores esperan que la actividad de las rutas de desarrollo temprano, tales como la ruta de Wnt y la ruta de HH, en las células cancerosas sea predictiva de un peor pronóstico. El presunto papel de la ruta de Wnt y la ruta de HH en la progresión del cáncer y la metástasis se basa en investigaciones preclínicas y no se ha demostrado en sujetos, ya que no se dispone de métodos para medir su actividad. Además, los inventores descubrieron suficientes indicaciones en conjuntos de datos disponibles públicamente que muestran una correlación entre la actividad de la ruta de ER como un mecanismo (relativamente) protector para la supervivencia y la actividad de la ruta de PI3K, que se correlaciona con un peor pronóstico. Por consiguiente, los inventores encontraron que la pasividad de la ruta de ER y la actividad de la ruta de PI3K estaban correlacionadas con un mal resultado en pacientes con cáncer de mama.
Las observaciones de estos inventores de la investigación en biología y las correlaciones clínicas de que las actividades de la ruta de PI3K, la ruta de Wnt y la ruta de HH pueden desempeñar un papel en la recidiva del cáncer y la supervivencia general y que la actividad de la ruta de ER parece estar vinculada a un buen resultado clínico, se combinan en el presente en la siguiente fórmula preferida, que es un caso especial de la Ec. (4):
MPS = Wp • Pp + Ww Pw + We ' Pe + Wh ' Ph + X, (5)
en la que Pp, Pw, Pe y Ph representan la actividad inferida de la ruta de PI3K, la ruta de Wnt, la ruta de ER y la ruta de HH, respectivamente (por ejemplo, en el intervalo entre 0 y 1), Wp es un coeficiente de ponderación constante positiva, Ww y Wh son coeficientes de ponderación constantes no negativos, y We es un coeficiente de ponderación constante no positivo. Con esta fórmula, el riesgo indicado de que el sujeto experimente el evento clínico dentro de un cierto periodo de tiempo aumenta monótonamente con un valor creciente de la suma.
En los siguientes ejemplos, los inventores han utilizado de manera ejemplar las actividades inferidas de las redes bayesianas de la ruta de PI3K usando la lista corta de genes diana mostrada en la Tabla 3 y el entrenamiento como se analiza en el presente documento, la ruta de Wnt usando la lista curada por prueba de genes diana que se muestran en la Tabla 1 del documento WO 2013/011479 A2 y el entrenamiento como se analiza en el mismo, la ruta de ER usando la lista curada por pruebas de genes diana que se muestran en la Tabla 2 del documento WO 2013/011479 A2 y el entrenamiento que se analiza en el mismo, y la ruta de HH usando la lista curada por pruebas de genes diana que se muestran en la Tabla 3 del documento WO 2013/011479 A2 y el entrenamiento analizado en el mismo. Como alternativa, las actividades de la ruta se pueden inferir por medio de métodos alternativos tales como el uso de modelos (pseudo)lineales como se analiza en el presente documento y con más detalle en el documento WO 2014/102668 A2 o, como alternativa, las listas de genes diana utilizadas de manera ejemplar en el presente documento se pueden reemplazar por un una mayor selección de los genes diana de las listas curadas por pruebas basándose en su naturaleza probatoria que demostraron obtener resultados comparables con respecto a las actividades de la ruta inferidas. Las listas alternativas se analizan en el presente documento para la ruta de PI3K (véanse las Tablas 1 y 2) y se analizan en el documento WO 2013/011479 A2 para la ruta de Wnt (véase la Tabla 6 del documento W o 2013/011479 A2), la ruta de ER (véase la Tabla 7 del documento WO 2013/011479 A2), y la ruta de HH (véase la Tabla 8 del documento WO 2013/011479 A2).
En el presente documento, se describe un método preferido para inferir valores apropiados para los coeficientes de ponderación Wp , Ww, We, y Wh usando modelos de riesgos proporcionales de Cox. Un modelo de riesgo proporcional de Cox se ajusta a un conjunto de entrenamiento que consiste en un número adecuado (preferentemente >100, preferentemente que representa los diversos subconjuntos de tipos de cáncer) de muestras con actividades inferidas Pp , Pw, Pe y Ph y datos de supervivencia, es decir, el tiempo de supervivencia e información censurada utilizando, por ejemplo, MATLAB, (MATLAB R2014a, The MathWorks Inc., Natick, MA) o R (v3.0.3, R Core Team (2014). R: A language and environment for statistical computing. R Foundation for Statistical Computing, Viena, Austria). A modo de ejemplo, las muestras de cáncer de mama disponibles públicamente de GSE6532 procedentes del Guy's hospital (n = 87) y las muestras de GSE9195 (n = 77), accesibles en http://www.ncbi.nlm.nih.gov/geo/, última consulta el 20 de julio de 2014, se utilizaron como conjunto de datos de entrenamiento. Un modelo de regresión de riesgos proporcionales de Cox se ajusta para la actividad de cada ruta, lo que da como resultado un coeficiente de Cox por actividad de la ruta, su error estándar (EE) asociado de la estimación del coeficiente, un índice de riesgo (HR), que es el exponente del coeficiente de Cox, un intervalo de confianza del 95 % del índice de riesgo y un valor p derivado del coeficiente de Cox y el error estándar como se puede ver en la Tabla 14. El signo de la estimación del coeficiente indica si la actividad de la ruta es protectora para el evento clínico en caso de un coeficiente negativo o predice un mal pronóstico en caso de un coeficiente positivo. El módulo del coeficiente indica la fuerza de la puntuación de riesgo con respecto al pronóstico.
Tabla 14: Resultados de la regresión de riesgo proporcional de Cox en los conjuntos de entrenamiento combinados
GSE6532 GSE9195.
Figure imgf000026_0001
continuación
Figure imgf000027_0001
Los inventores han encontrado que los coeficientes de Cox ajustados para las actividades de las rutas de señalización celular respectivas en un conjunto de datos de entrenamiento, como se muestra, por ejemplo, en la Tabla 14, son buenos valores para usar como coeficientes de ponderación lineal para las puntuaciones de riesgo. Por lo tanto, estos coeficientes de Cox se utilizan preferentemente como coeficientes de ponderación en la Ec. (5). Su idoneidad para su uso en la determinación de una puntuación de riesgo se ha evaluado con gran detalle, como se describe a continuación: Primero, la actividad de la ruta de PI3K se combinó con la actividad de la ruta de Wnt, la ruta de ER y la ruta de HH, respectivamente, dando como resultado las siguientes ecuaciones:
MPSpw = 0,80 (±0,41) ■ Pp+1,30 (±0,85)- Pw (6)
MPSpe = 0,80 (±0,41)-Pp + (-1,02(±0,52))- Pe (7)
MPSph = 0,80 (±0,41 )■ Pp + 0,83 (±0,54) ■ Ph (8)
A continuación, la actividad de la ruta de PI3K se combinó con las actividades de otras dos rutas del grupo que consta de la ruta de Wnt, la ruta de ER y la ruta de HH, dando como resultado las siguientes ecuaciones:
MPSpwe = 0,80 (±0,41) ■ Pp + 1,30 (±0,85)- Pw (9)
(-1,02 (+0,52)) ■ Pe
MPSpwh = 0,80 (+ 0,41) • Pp + 1,30 (+ 0,85) ■ Pw (10)
0,83 (+ 0,54) ■ Ph
MPSpeh = 0,80 (± 0,41) ■ Pp + (-1,02 (± 0,52)V Pe (11)
0,83 (± 0,54) Ph
Se prefiere particularmente que los coeficientes de Cox se utilicen para parametrizar la combinación lineal de las actividades de la ruta de PI3K, la ruta de Wnt, la ruta de ER y la ruta de HH enumeradas en la Ec. (5), lo que dio como resultado la siguiente ecuación:
MPSpweh = 0,80 (± 0,41) ■ Pp + 1,30 (± 0,85) ■ Pw (12)
(-1,02 (± 0,52)) ■ Pe + 0,83 (± 0,54) ■ Ph
en la que los errores estándar de los coeficientes se enumeran entre paréntesis.
Como alternativa, se pueden usar modelos (pseudo)lineales para inferir la actividad de la ruta como se describe en el presente documento y con más detalle en el documento W o 2014/102668 A2 ("Assessment of cellular signaling pathway activity using linear combination(s) of target gene expressions") y utilizar estas actividades inferidas de una manera similar a como se ha analizado anteriormente con las actividades de ruta inferidas con un modelo probabilístico. La inserción de estos modelos lineales para la actividad de la ruta en las Ec. (6) a (12) finalmente culmina, después de la expansión de las sumas, en una combinación lineal que se puede generalizar en una ecuación con una sola suma:
MPSconjuntosdesondas—Y_Wij Eij (13)
en la que Y es la suma de todos los conjuntos de sondas i de todas las rutas j, aquí las rutas son de forma ejemplar PI3K, Wnt, ER y HH, w¡ es la ponderación asociada con el conjunto de sondas, que equivale al producto de la ponderación asociada con la ruta y el conjunto de sondas o ruta, gen diana y conjunto de sondas, para los modelos lineales de "una capa" y "dos capas", respectivamente. En el presente documento, la ponderación w¡ se elige de forma ejemplar igual al coeficiente de Cox estimado a partir del conjunto de datos de entrenamiento, del i-ésimo conjunto de sondas de la j-ésima ruta, y Ej es el i-ésimo conjunto de sondas de la j-ésima ruta. Un experto en la materia podrá adaptar esta ecuación a otras plataformas de medición tales como (RT-q)PCR, secuenciación, FISH de ARNm y otros métodos adecuados para detectar los niveles de expresión de los genes diana en lugar de los conjuntos de sondas que se originan en el Affymetrix HG-U133Plus2.0 a modo de ejemplo usado en el presente documento.
A continuación, las puntuaciones de riesgo descritas en el presente documento se probaron en una combinación de otros tres conjuntos de datos: GSE20685 y GSE21653 están disponibles en el gene expression omnibus, accesible en http://www.ncbi.nlm.nih.gov/geo/, última consulta el 20 de julio de 2014, mientras que E-MTAB-365 está disponible en ArrayExpress, accesible en http://www.ebi.ac.uk/arrayexpress/ experiments/, consultado por última vez el 20 de julio de 2014. Los tres conjuntos de datos combinan un conjunto diverso de un total de 1005 pacientes con cáncer de mama con un tiempo de supervivencia completo y datos censurados. Las puntuaciones de riesgo para estos pacientes se calcularon de acuerdo con las Ec. (6) a (13) y a continuación se investigó el valor pronóstico de las puntuaciones de riesgo utilizando dos métodos que cuantifican tal valor pronóstico. Estos son los modelos de regresión de riesgos proporcionales de Cox y los gráficos de Kaplan-Meier junto con la prueba estadística de rango logarítmico:
El primer método ajusta un modelo de riesgo proporcional de Cox a los datos de supervivencia con una o más covariables. En resumen, tal modelo de riesgo explica la variación en la supervivencia (evento clínico) dentro de la población basándose en el valor (numérico) de las covariables. Como resultado del ajuste, a cada covariable incluida se le asignará un índice de riesgo (HR), que es el exponente del coeficiente de Cox, que cuantifica el riesgo asociado del evento clínico basándose en el valor de la covariable, por ejemplo, un HR de dos corresponde a un riesgo dos veces mayor del evento clínico de interés para los pacientes con un aumento de uno en el valor de la covariable. De forma detallada, un valor de HR = 1 significa que esta covariable no tiene impacto en la supervivencia, mientras que para HR <1, un aumento en el número de covariables significa un riesgo menor y una disminución en el número de covariables significa un riesgo más alto, y para HR >1, un aumento en el número de covariables significa un mayor riesgo y una disminución en el número de covariables significa un riesgo menor. Junto con los índices de riesgo, se informan el intervalo de confianza del 95 % y los valores p (es decir, la probabilidad unilateral de que el índice de riesgo sea significativamente menor o mayor de uno). Todas las puntuaciones de riesgo se escalan de manera que la escala (valor mínimo a máximo) de la puntuación de riesgo sea uno para hacer una comparación directa de los índices de riesgo directamente.
El último método implica trazar una curva de Kaplan-Meier que representa la probabilidad de sobrevivir al evento clínico en función del tiempo. Por ejemplo, al trazar las curvas de Kaplan-Meier para diferentes grupos de riesgo en la población basándose en una prueba de pronóstico de ejemplo, se puede visualizar la calidad de la separación del riesgo del evento clínico de ejemplo. Es decir, los grupos de riesgo más divergentes indican que una puntuación de riesgo es mejor para estratificar a los pacientes de riesgo. Esta calidad se puede cuantificar aún más mediante una prueba de rango logarítmico, que calcula la probabilidad (valor p) de que dos curvas de supervivencia sean iguales teniendo en cuenta el periodo de seguimiento completo.
Los resultados de las puntuaciones de riesgo utilizando al menos la actividad inferida de la ruta de PI3K y una o más de la ruta de Wnt, la ruta de ER y la ruta de HH, como se presentan en el presente documento, se compararon con las actividades inferidas individuales Pp, Pw, Pe y Ph, es decir, las actividades inferidas de la ruta de PI3K, la ruta de Wnt, la ruta de ER y la ruta de HH, respectivamente, y como se describe en el presente documento, una combinación no lineal de Pe, Pw, Ph, y la prueba de cáncer de mama Oncotype DX® de Genomic Health. La combinación no lineal de Pe, Pw y Ph se calcula de la siguiente manera:
MPSewh = -Pe + máx(Pw, Ph). (14)
Se demostró que la MPSewh es un buen predictor de recidiva en pacientes con cáncer de mama. Se calculó usando la Ec. (14) y los pacientes se estratificaron en pacientes de riesgo bajo, riesgo intermedio y riesgo alto utilizando umbrales para la MPSewh como se describe en la misma, es decir, en -0,1 y 0,1, respectivamente. Se demostró que la prueba Oncotype DX® es un buen predictor de recidiva en pacientes con cáncer de mama ER positivo. La prueba Oncotype DX® arroja una puntuación de riesgo o recidiva (RS) entre 0 y 100, que se escala aquí entre 0 y 1 para la comparación directa de los índices de riesgo, que se calcula basándose en una combinación de niveles de expresión medidos para un panel de genes (véase S. Paik et al.: "A multi-gene assay to predict recurrence of Tamoxifen-treated, node-negative breast cancer", The New England Journal of Medicine, Vol. 351, N.° 27, 2004, páginas 2817 a 2826; C. Fan et al.: "Concordance among gene-expression-based predictors for breast cancer", The New England Journal of Medicine, Vol. 355, N.° 6, 2006, páginas 560 a 569). La RS está optimizada con respecto a la supervivencia a 10 años en pacientes con cáncer de mama con ganglios negativos ER positivo, HER2 negativo (tinción de proteínas o FISH). La RS se calculó utilizando los datos de expresión de micromatrices informados en los conjuntos de datos mencionados siguiendo el procedimiento informado por Fan et al. (véase C. Fan et al. (2006)) y los pacientes se dividieron posteriormente en pacientes de bajo riesgo, riesgo intermedio y alto riesgo de acuerdo con el algoritmo de estratificación de riesgo Oncotype DX® (véase S. Paik et al. (2004)).
Al principio, la regresión de riesgos proporcionales de Cox se realizó en las puntuaciones de riesgo escaladas utilizando las pacientes con cáncer de mama de E-MTAB365, GSE20685 y GSE21653. El coeficiente de Cox univariado calculado, su error estándar, índices de riesgo, el intervalo de confianza del 95 % asociado y el valor p se muestran en la Tabla 15. Sorprendentemente, todas las puntuaciones de riesgo que combinan la actividad de la ruta de PI3K con la actividad de una de las otras rutas de señalización celular tienen un mejor rendimiento que las actividades de la ruta individual, como se representa un módulo más alto de los coeficientes de Cox, que indican que una combinación de la actividad de la ruta de PI3K junto con la actividad de otra u otras rutas de señalización celular tuvo un mejor rendimiento que las actividades de la ruta individual con respecto al pronóstico de un evento clínico, en este caso, la supervivencia libre de enfermedad. Además, los valores p de las actividades de combinación de dos rutas de señalización celular también demuestran esta superioridad, ya que típicamente son más pequeños para las combinaciones de la actividad de la ruta de PI3K con la actividad de otra ruta de señalización celular que las de las actividades de la ruta individual. La combinación de la actividad de la ruta de PI3K con las actividades de otras dos rutas de señalización celular también mejoró los coeficientes de Cox (y los valores p) en comparación con las puntuaciones de riesgo basadas en dos actividades de ruta. La puntuación de riesgo MPSpweh que combina las actividades de la ruta de PI3K, la ruta de Wnt, la ruta de ER y la ruta de HH, como se describe en la Ec. (12), tiene un mejor rendimiento, mejor que las actividades de la ruta individual, así como las combinaciones de la actividad de la ruta de PI3K con las actividades de dos o tres rutas de señalización celular, como es visible en el coeficiente, error estándar, HR y valor p. Además, la puntuación de riesgo MPSconjuntosdesondas que incluye los mismos conjuntos de sondas que se utilizan en la puntuación MPSpweh supera a las puntuaciones de riesgo, incluida la actividad de la ruta de PI3K y la actividad de otra ruta de señalización celular, como es evidente a partir de los resultados de regresión de Cox. No obstante, el rendimiento de la MPSconjuntosdesondas es peor que el de MpSpeh y MPSpw eh , lo que probablemente sea el resultado de un "sobreajuste" de la puntuación de riesgo en los datos de entrenamiento debido a la gran cantidad de coeficientes ajustados (276 coeficientes en MPSconjuntosdesondas frente a tres y cuatro coeficientes en MPSpeh y MPSpweh, respectivamente). Todas las puntuaciones de riesgo que combinan la actividad de la ruta de PI3K y las actividades de una o más rutas tienen un mejor rendimiento que las puntuaciones de riesgo MPSewh y RS, como resulta evidente a partir del coeficiente de Cox respectivo.
Tabla 15: Resultados de la regresión de riesgo proporcional de Cox en los conjuntos de prueba combinados E-MTAB-365, GSE20685 y GSE21653. Todas las puntuaciones de riesgo están normalizadas para una comparación directa de los resultados de regresión. El coeficiente de Cox calculado en el conjunto de prueba da la "fuerza" (y la dirección) de la puntuación de riesgo con respecto a la supervivencia. Un valor alto (absoluto) corresponde a un r i r f r . P r l n l "f rz " n n ifi i n l r r n i l n i n ri .
Figure imgf000029_0001
A continuación, se analizó la estratificación pronóstica de las puntuaciones de riesgo de interés usando gráficos de Kaplan-Meier en combinación con la prueba de rango logarítmico. Un algoritmo simplista se utiliza a modo de ejemplo para las nuevas puntuaciones de riesgo descritas en el presente documento para estratificar a los pacientes según su puntuación de riesgo. Los 1005 pacientes se dividen en tres grupos de igual tamaño (n = 335) de puntuaciones de riesgo crecientes, es decir, los puntos de corte se encuentran en los terciles de las puntuaciones de riesgo respectivos de todos los pacientes. Los expertos en la técnica pueden comprender y realizar otras variaciones de la estratificación de riesgo con respecto al método mencionado anteriormente utilizando técnicas de optimización conocidas. Por ejemplo, se pueden utilizar las estadísticas J de Youden para inferir umbrales de riesgo. La estratificación de riesgo de las demás puntuaciones de riesgo incluidas con fines comparativos se realiza según lo descrito por sus inventores. Es decir, las actividades de la ruta de PI3K, la ruta de Wnt, la ruta de ER y la ruta de HH se utilizan para estratificar a los pacientes según si la ruta respectiva está activa, es decir, una actividad de más de 0,5 en una escala de 0 a 1, o pasiva, es decir, una actividad de 0,5 o menos en una escala de 0 a 1. Los pacientes con una MPSewh de -0,1 o menos se consideran de bajo riesgo, los pacientes con una MPSewh mayor o igual a 0,1 se consideran de alto riesgo, y todos los pacientes restantes (con una MPSewh entre -0,1 y 0,1) se consideran de riesgo intermedio. Por otro lado, los pacientes con una RS menor de 18 se consideran de bajo riesgo, los pacientes con una RS de 31 o superior se consideran de alto riesgo, y todos los pacientes restantes (con una RS entre 18 y 31) son considerados de riesgo intermedio. Los gráficos de Kaplan-Meier se proporcionan en las figuras 2 a 9 para las nuevas puntuaciones de riesgo como se describe en el presente documento, es decir, MPSpw (véase la figura 2), MPSpe (véase la figura 3), MPSph (véase la figura 4), MPSpwe (véase la figura 5), MPSpwh (véase la figura 6), MPSpeh (véase la figura 7), MPSpweh (véase la figura 8) y MPSconjuntosdesondas (véase la figura 9). En estos gráficos, el eje vertical indica la supervivencia libre de recidiva como una fracción del grupo de pacientes y el eje horizontal indica un tiempo en años. Los grupos de riesgo bajo, intermedio y alto (cada uno con 335 pacientes) se ilustran con una línea continua (característicamente la línea superior), una línea discontinua de puntos (característicamente la línea media), y una línea discontinua (característicamente la línea inferior), respectivamente. Estos gráficos muestran una clara discriminación del riesgo de que un sujeto pueda experimentar un evento clínico dentro de un cierto periodo de tiempo entre los diferentes grupos. Esta diferencia en la estratificación del riesgo se puede cuantificar mediante la prueba de rango logarítmico. Aquí se eligió comparar la curva de Kaplan-Meier del grupo de mayor riesgo frente al grupo de menor riesgo (en el caso de las actividades de la ruta individual, es decir, activa frente a pasiva). Los valores p de rango logarítmico se muestran en la última columna de la Tabla 15. Los gráficos de Kaplan-Meier y las estadísticas de rango logarítmico asociadas ilustran adicionalmente la ventaja de las puntuaciones de riesgo, incluida la actividad de la ruta de PI3K y la actividad de una ruta de señalización celular adicional, ya que se pueden utilizar para estratificar a los pacientes con menor o mayor riesgo de recidiva de la enfermedad.
La figura 10 muestra la probabilidad de supervivencia libre de enfermedad a los cinco (línea continua) y a los diez años (líneas discontinuas) utilizando como ejemplo la M P S p w e h sin escala. La curva por partes muestra un fuerte aumento (monótono) en la probabilidad/riesgo de recidiva de la enfermedad para un valor superior a -0,5, por debajo de este valor, el riesgo parece estabilizarse, por lo que tendría sentido colocar puntos de corte cerca de este valor. Además, para facilitar el uso del usuario, las puntuaciones de múltiples rutas se pueden reescalar para comenzar en cero y alcanzar un determinado número positivo, por ejemplo, una puntuación entre 0 y 15 o 0 y 100, en lugar de cubrir un intervalo que incluye valores negativos. Por ejemplo, una M P S p w e h reescalada que incluya estos umbrales podría verse así:
f 0 60 (M PSpweh 0,5) < 0 (15)
M PS;cweh = < 60 {M PSpweh + 0,5) 0 < 60 (iMPSpweh + 0,5) < 100
( 100 60 (M PSpweh + 0,5) > 100
Las puntuaciones de riesgo M P S p w , M P S p e , M P S p h , M P S p w e h y M PSconjuntosdesondas entrenadas en el conjunto de entrenamiento inicial de pacientes con cáncer de mama en GSE6532 y GSE9195 se generalizaban bien en otros conjuntos de datos de muestras de cáncer de mama. Como alternativa, las puntuaciones de riesgo se pueden entrenar en los conjuntos de datos descritos previamente, es decir, GSE6532, GSE9195, E-MTAB-365, GSE20685 y GSE21653 simultáneamente (en total 1169 pacientes con datos de supervivencia) utilizando los coeficientes de Cox estimados como se ha analizado anteriormente. Esto da como resultado las siguientes puntuaciones de riesgo:
M P S p w = 0,70 (±0,17)Pp + 0,38 (±0,26)- P w (16)
M P S p e = 0,70 (±0,17)- P p (-0,87 (±0,18))- P e (17)
M P S p h = 0,70 (± 0,17)- P p 0,90 (±0,20)- P h (18)
M P S p w e = 0,70 (± 0,17) • P p + 0,38 (± 0,26)- P w (19)
(-0,87 (+0,18)) ■ P e
M P S p w h = 0,70 (+ 0,17) P p + 0,38 (+ 0,26) P w (20)
0,90 (+ 0,20) ■ P h
M P S p e h = 0,70 (+ 0,17) P p + (-0,87 (+ 0,18)) P e (21)
0,90 (+ 0,20) ■ P h
M P S p w e h = 0,70 (± 0,17) ■ P p + 0,38 (+ 0,26) P w (22)
(-0,87 (+ 0,18)) P e + 0,90 (+ 0,20) P h
Como alternativa, los coeficientes de las puntuaciones de riesgo se pueden determinar combinando los coeficientes de Cox estimados en los conjuntos de datos de forma independiente. Los coeficientes de Cox determinados de forma independiente junto con su error estándar se utilizan para estimar el coeficiente verdadero para la actividad de cada ruta utilizando la estimación de máxima verosimilitud. Los pacientes de ambos conjuntos de datos del Guy's hospital, GSE6532 y GSE9195, se combinaron en un conjunto de datos de entrenamiento debido a su pequeño tamaño. Los valores de los coeficientes más probables se determinaron ponderando las estimaciones de los coeficientes determinados individualmente con el número de pacientes incluidos en el conjunto de datos sobre el error estándar de la estimación del coeficiente:
Figure imgf000030_0001
en la que rn es el número de pacientes incluidos en el conjunto de datos i , b es el estimador del valor del coeficiente verdadero, b i es el coeficiente de Cox del conjunto de datos i, y a es el error estándar del coeficiente de Cox estimado a partir del conjunto de datos i . Esta minimización se realizó para la actividad de la ruta de PI3K, la ruta de Wnt, la ruta de ER y la ruta de HH, respectivamente. Las varianzas de las estimaciones de los coeficientes verdaderos se determinaron utilizando la matriz de información de Fisher. El uso de estos valores para parametrizar las combinaciones lineales de actividades de la ruta mencionadas anteriormente da como resultado las siguientes puntuaciones de riesgo:
MPSpw = 0,65 (± 0,09) ■ 0,12 (± 0,09) ■ Pw (24)
MPSpe = 0,65 (± 0,09) ■ Pp + (-0,85 (± 0,06)) ■ Pe (25)
MPSph = 0,65 (± 0,09)^ Pp + 0,68(±0,16)- Ph (26)
MPSpwe = 0,65 (± 0,09) ■ Pp + 0,12 (± 0,09) ■ Pw (27)
(-0,85 (± 0,06)) ■ Pe
MPSpwh = 0,65 (± 0,09) Pp + 0,12 (± 0,09) ■ Pw (28)
0,68 (±0,16)- Ph
MPSpwh = 0,65 (+ 0,09) ■ Pp + (-0,85 (+ 0,06)) ■ Pe (29)
0,68 (+0,16^ Ph
MPSpweh = 0,65 (+ 0,09) ■ Pp + 0,12 (+ 0,09) P w (30)
(-0,85 (+ 0,06)) ■ Pe + 0,68 (+ 0,16) ■ Ph
Ejemplo 3: Aplicación de CDS
Con referencia a la figura 11 (que muestra esquemáticamente un sistema de apoyo a la decisión clínica (CDS) configurado para determinar una puntuación de riesgo que indica un riesgo de que un sujeto experimente un evento clínico dentro de un cierto periodo de tiempo, como se divulga en el presente documento), se implementa un sistema de apoyo a la decisión clínica (CDS) 10 como un ordenador configurado adecuadamente 12. El ordenador 12 puede configurarse para operar como el sistema CDS 10 mediante la ejecución de un software, firmware u otras instrucciones adecuadas almacenadas en un medio de almacenamiento no transitorio (no mostrado), tal como un disco duro u otro medio de almacenamiento magnético, un disco óptico u otro medio de almacenamiento óptico, una memoria de acceso aleatorio (RAM), una memoria de solo lectura (ROM), una memoria flash u otro medio de almacenamiento electrónico, un servidor de red, etc. Si bien el sistema CDS ilustrativo 10 está incorporado por el ordenador 12 ilustrativo, más generalmente el sistema CDS puede incorporarse por un dispositivo de procesamiento digital o un aparato que comprenda un procesador digital configurado para realizar métodos de apoyo a la decisión clínica como se expone en el presente documento. Por ejemplo, el dispositivo de procesamiento digital puede ser un dispositivo portátil (por ejemplo, un asistente de datos personales o un teléfono inteligente que ejecuta una aplicación CDS), un ordenador portátil, un ordenador de sobremesa, un ordenador o dispositivo de tableta, un servidor de red remoto, etc. El ordenador 12 u otro dispositivo de procesamiento digital típicamente incluye o está conectado operativamente con un dispositivo de visualización 14 a través del cual se muestra al personal médico información que incluye recomendaciones de apoyo a la decisión clínica. El ordenador 12 u otro dispositivo de procesamiento digital típicamente también incluye o está conectado operativamente con uno o más dispositivos de entrada de usuario, tales como un teclado 16 ilustrativo, o un ratón, una rueda de desplazamiento, un panel táctil, una pantalla sensible al tacto (posiblemente integrada con el dispositivo de visualización 14), u otro dispositivo de entrada de usuario basado en puntero, a través del cual el personal médico puede introducir información tal como comandos operativos para controlar el sistema CDS 10, datos para su uso por el sistema CDS 10, etc.
El sistema CDS 10 recibe como entrada información perteneciente a un sujeto (por ejemplo, un paciente del hospital o un paciente ambulatorio que está siendo tratado por un oncólogo, especialista u otro personal médico, o una persona que se somete a detección de cáncer o algún otro diagnóstico médico que se sabe o se sospecha que tiene cierto tipo de cáncer, tal como cáncer de colon, cáncer de mama o cáncer de hígado, etc.). El sistema CDS 10 aplica diversos algoritmos de análisis de datos a esta información de entrada para generar recomendaciones de apoyo a la decisión clínica que se presentan al personal médico mediante el dispositivo de visualización 14 (o a través de un sintetizador de voz u otro dispositivo que proporcione una salida perceptible por humanos). En algunas realizaciones, estos algoritmos pueden incluir la aplicación de una guía clínica al paciente. Una guía clínica es un conjunto almacenado de recomendaciones de tratamiento estándar o "canónico", típicamente construido basándose en las recomendaciones de un panel de expertos médicos y opcionalmente formateado en forma de un "diagrama de flujo" clínico para facilitar la navegación a través de la guía clínica. En diversas realizaciones, los algoritmos de procesamiento de datos del CDS 10 pueden incluir adicionalmente o como alternativa, diversos algoritmos de pruebas clínicas o de diagnóstico que se realizan sobre la información de entrada para extraer recomendaciones de decisión clínica, tales como métodos de aprendizaje automático divulgados en el presente documento.
En los sistemas CDS ilustrativos divulgados en el presente documento (por ejemplo, el sistema CDS 10), los algoritmos de análisis de datos CDS incluyen uno o más algoritmos de pruebas de diagnóstico o clínicas que se realizan sobre la información genómica y/o proteómica de entrada adquirida por uno o más laboratorios médicos 18. Estos laboratorios pueden estar ubicados de diversas formas "in situ", es decir, en el hospital u otro lugar donde el sujeto se somete a un examen médico y/o tratamiento, o "externos", por ejemplo, un laboratorio especializado y centralizado que recibe (por correo u otro servicio de entrega) una muestra del sujeto que se ha extraído del sujeto (por ejemplo, una muestra obtenida de una lesión cancerosa, o de una lesión que se sospecha de cáncer, o de un tumor metastásico, o de una cavidad corporal en la que hay líquido contaminado con células cancerosas (por ejemplo, cavidad pleural o abdominal o cavidad vesical) o de otros fluidos corporales que contienen células cancerosas, etc., preferentemente mediante un procedimiento de biopsia u otro procedimiento de extracción de muestras). Las células de las que se extrae una muestra también pueden ser células tumorales de neoplasias hematológicas (tales como leucemia o linfoma). En algunos casos, la muestra de células también pueden ser células tumorales circulantes, es decir, células tumorales que han entrado en el torrente sanguíneo y pueden extraerse mediante técnicas de aislamiento adecuadas, por ejemplo, aféresis o extracción de sangre venosa convencional. Aparte de la sangre, el fluido corporal del que se extrae una muestra puede ser orina, contenido gastrointestinal o un extravasado.
La muestra es procesada por el laboratorio para generar información genómica o proteómica. Por ejemplo, la muestra puede procesarse usando una micromatriz (también conocida en la técnica como un chip de gen, chip de ADN, biochip, etc.) o mediante el procesamiento cuantitativo de la reacción en cadena de la polimerasa (qPCR) para medir información probatoria genómica o proteómica, tales como los niveles de expresión de genes de interés, por ejemplo, en forma de un nivel de ácido ribonucleico mensajero (ARNm) que se transcribe del gen, o un nivel de una proteína que se traduce del ARNm transcrito del gen. Como otro ejemplo, la muestra puede procesarse por un laboratorio de secuenciación génica para generar secuencias para ácido desoxirribonucleico (ADN), o para generar una secuencia de ARN, variación del número de copias, metilación, etc. Otros enfoques de medición contemplados incluyen inmunohistoquímica (IHC), citología, hibridación in situ fluorescente (FISH), ensayo de ligadura de proximidad, etc., realizados en un portaobjetos de patología. Otra información que se puede generar mediante el procesamiento de micromatrices, espectrometría de masas, secuenciación génica, u otras técnicas de laboratorio incluye información de metilación. También se pueden realizar diversas combinaciones de dichas medidas genómicas y/o proteómicas.
En algunas realizaciones, los laboratorios médicos 18 realizan una serie de adquisiciones de datos estandarizadas en la muestra del sujeto, para generar una gran cantidad de datos genómicos y/o proteómicos. Por ejemplo, las técnicas de adquisición de datos estandarizadas pueden generar una secuencia de ADN (opcionalmente alineada) para uno o más cromosomas o porciones de cromosomas, o para todo el genoma. La aplicación de una micromatriz estándar puede generar miles o decenas de miles de elementos de datos, tales como niveles de expresión para una gran cantidad de genes, diversos datos de metilación, etc. De manera similar, las mediciones basadas en PCR se pueden usar para medir el nivel de expresión de una selección de genes. Esta plétora de datos genómicos y/o proteómicos, o porciones seleccionadas de los mismos, se introducen en el sistema CDS 10 para ser procesados a fin de desarrollar información clínicamente útil para formular recomendaciones de apoyo a la decisión clínica.
Los sistemas CDS divulgados y los métodos relacionados se refieren al procesamiento de datos genómicos y/o proteómicos para evaluar la actividad de diversas rutas de señalización celular y para determinar una puntuación de riesgo que indica un riesgo de que un sujeto experimente un evento clínico (por ejemplo, cáncer) dentro de un cierto periodo de tiempo. Sin embargo, debe entenderse que los sistemas CDS divulgados (por ejemplo, el sistema CDS 10) pueden incluir opcionalmente además diversas capacidades adicionales, tales como la generación de recomendaciones de apoyo a la decisión clínica de acuerdo con las guías clínicas almacenadas basadas en diversos datos de paciente, tales como datos de monitorización de signos vitales, datos del historial del paciente, datos demográficos del paciente (por ejemplo, sexo, edad, etc.), datos de imágenes médicas del paciente, etc. Como alternativa, en algunas realizaciones, las capacidades del sistema CDS 10 pueden limitarse a realizar únicamente análisis de datos genómicos y/o proteómicos para evaluar la actividad de las rutas de señalización celular y para determinar una puntuación de riesgo que indique un riesgo de que un sujeto experimente un evento clínico (por ejemplo, cáncer) dentro de un cierto periodo de tiempo, como se divulga en el presente documento.
Continuando con la referencia a la figura 11 de ejemplo, el sistema CDS 10 infiere la actividad 22 de una o más rutas de señalización celular, en este caso, la ruta de PI3K y una o más de la ruta de Wnt, la ruta de ER y la ruta de HH, en el sujeto basándose en, pero sin limitación, los niveles de expresión 20 de uno o más genes diana de las rutas de señalización celular medidas en la muestra del sujeto. La ruta de PI3K, la ruta de Wnt, la ruta de ER y la ruta de HH son de interés en diversas áreas de la oncología porque la pérdida de regulación de estas rutas puede ser una causa de proliferación de un cáncer. Existen de aproximadamente 10 a 15 rutas de señalización relevantes, y cada cáncer es impulsado por al menos una ruta dominante que está desregulada. Sin limitarse a ninguna teoría particular de funcionamiento, estas rutas regulan la proliferación celular y, en consecuencia, una pérdida de regulación de estas rutas en las células cancerosas puede llevar a que la ruta esté "siempre activa", acelerando así la proliferación de células cancerosas, los que a su vez se manifiesta como un crecimiento, invasión o metástasis (diseminación) del cáncer.
La medición de los niveles de expresión de ARNm de genes que codifican proteínas reguladoras de la ruta de señalización celular, tal como una proteína intermedia que forma parte de una cascada de proteínas que forma la ruta de señalización celular, es una medida indirecta del nivel de expresión de proteínas reguladoras y puede o no correlacionarse fuertemente con el nivel real de expresión de proteínas reguladoras (mucho menos con la actividad general de la ruta de señalización celular). La ruta de señalización celular regula directamente la transcripción de los genes diana; por lo tanto, los niveles de expresión de ARNm transcrito de los genes diana es un resultado directo de esta actividad reguladora. Por lo tanto, el sistema CDS 10 infiere la actividad de una o más rutas de señalización celular (en este caso, la ruta de PI3K y una o más de la ruta de Wnt, la ruta de ER y la ruta de HH) basándose en los niveles de expresión de uno o más genes diana (nivel de ARNm o proteína como medida sustituía) de las rutas de señalización celular. Esto asegura que el sistema CDS 10 infiera la actividad de la ruta basándose en información directa proporcionada por los niveles de expresión medidos del gen o genes diana.
Las actividades inferidas, en este ejemplo, Pp, Pw, Pe y Ph, es decir, las actividades inferidas de la ruta de PI3K, la ruta de Wnt, la ruta de ER y la ruta de HH, se utilizan entonces para determinar 24 un riesgo puntuación que indica un riesgo de que el sujeto experimente el evento clínico, en este ejemplo, cáncer, en particular, cáncer de mama, dentro de un cierto periodo de tiempo, como se describe en detalle en el presente documento. La puntuación de riesgo se basa en una combinación de las actividades inferidas. Por ejemplo, la puntuación de riesgo puede ser la "Puntuación de múltiples rutas" (MPS) calculada como se describe en detalle con referencia a la Ec. (4) o (5).
Basándose en la MPS determinada, el sistema CDS 10, en este ejemplo, asigna 26 al sujeto al menos a uno de una pluralidad de grupos de riesgo asociados a diferentes riesgos indicados de que el sujeto experimente el evento clínico dentro del cierto periodo de tiempo, y/o decide 28 un tratamiento recomendado para el sujeto basándose en el riesgo indicado de que el sujeto experimente el evento clínico dentro de un cierto periodo de tiempo.
La determinación de la MPS y/o la clasificación de riesgo para un paciente en particular mediante el sistema CDS o una implementación independiente de la MPS y la clasificación de riesgo como se describe en el presente documento permitirá al oncólogo, especialista u otro personal médico involucrado en el diagnóstico o tratamiento o monitorización/seguimiento del paciente para adaptar el tratamiento de tal manera que el paciente tenga la mejor posibilidad de supervivencia a largo plazo mientras que los efectos secundarios no deseados, especialmente los de la quimioterapia agresiva y/o terapia dirigida y/o inmunoterapia y/o radioterapia y/o cirugía, se minimizan. Por lo tanto, por ejemplo, los pacientes con bajo riesgo de recidiva del cáncer, es decir, es decir, aquellos con una baja MPS y/o aquellos clasificados como de bajo riesgo según el algoritmo de estratificación de riesgo como se describe en el presente documento, actualmente se tratan típicamente con tratamiento hormonal en solitario o una combinación de tratamiento hormonal, por ejemplo, inhibidores anti-estrógenos y/o de aromatasa, y un agente quimioterapéutico menos tóxico. Por otro lado, los pacientes con un riesgo intermedio o alto de recidiva del cáncer, es decir, es decir, aquellos con una MPS alta y/o aquellos clasificados como de riesgo intermedio o alto según el algoritmo de estratificación de riesgo como se describe en el presente documento, actualmente serán tratados típicamente con quimioterapia más agresiva, tales como regímenes de tratamiento a base de antraciclina y/o taxano. Además, la MPS, posiblemente en combinación con los resultados de las pruebas de otros pacientes y/o los resultados de otras pruebas de pronóstico o predicción (por ejemplo, de diagnóstico complementario), puede dar lugar a la decisión de tratar al paciente con fármacos dirigidos tales como tamoxifeno, trastuzumab, bevacizumab y/u otros fármacos terapéuticos (por ejemplo, inmunoterapia) que actualmente no forman parte del protocolo de tratamiento de línea principal para el cáncer particular del paciente, y/u otras opciones de tratamiento, tales como radioterapia, por ejemplo, braquiterapia, y/o diferentes horarios para el tratamiento, por ejemplo, antes y/o después del tratamiento primario.
Se observa que en lugar de usar directamente la puntuación de riesgo determinada (MPS) como una indicación del riesgo de que el sujeto experimente un evento clínico (por ejemplo, cáncer) dentro de un cierto periodo de tiempo, es posible que el sistema CDS 10 esté configurado para combinar la puntuación de riesgo con una o más puntuaciones de riesgo adicionales obtenidas de una o más pruebas de pronóstico adicionales para obtener una puntuación de riesgo combinada, en la que la puntuación de riesgo combinada indica un riesgo de que el sujeto experimente el evento clínico dentro del cierto periodo de tiempo. La una o más pruebas de pronóstico adicionales pueden comprender, en particular, la prueba de cáncer de mama Oncotype DX®, la prueba de cáncer de mama Mammostrat®, la prueba de cáncer de mama MammaPrint®, la prueba de cáncer de mama EndoPredict®, la prueba de cáncer de mama Blueprint™, la prueba de cáncer de mama CompanDx®, el Breast Cáncer IndexSM (HOXB 13/IL17BR), la prueba de cáncer de colon OncotypeDX®, y/o una prueba de proliferación realizada midiendo la expresión del gen/proteína Ki67.
Ejemplo 4: Información adicional para ilustrar la presente invención
(1) Medir los niveles de expresión génica
Los datos derivados del conjunto único de genes diana descritos en el presente documento se usan además para inferir actividades de las rutas de señalización celular usando los métodos descritos en el presente documento.
Los métodos para analizar los niveles de expresión génica en muestras extraídas se conocen generalmente. Por ejemplo, los métodos tales como transferencia de Northern, el uso de PCR, PCR anidada, PCR cuantitativa en tiempo real (qPCR), RNA-seq o micromatrices, pueden usarse para derivar datos del nivel de expresión génica. Todos los métodos conocidos en la técnica para analizar la expresión génica de los genes diana se contemplan en el presente documento.
Los métodos para determinar el producto de expresión de un gen usando métodos basados en PCR pueden ser de uso particular.
Para cuantificar el nivel de expresión génica mediante PCR, la cantidad de cada producto de PCR de interés se estima típicamente usando PCR cuantitativa en tiempo real (qPCR) convencional para medir la acumulación de productos de PCR en tiempo real después de cada ciclo de amplificación. Esto típicamente utiliza un indicador detectable, tal como un tinte intercalante, un tinte de unión al surco menor o una sonda fluorogénica mediante la cual la aplicación de luz excita al indicador a emitir fluorescencia y la fluorescencia resultante se detecta típicamente usando una cámara CCD o un sistema de detección de fotomultiplicador, tales como el divulgado en la Pat. de EE.UU. N.° 6.713.297.
En algunas realizaciones, las sondas usadas en la detección de productos de PCR en el ensayo de PCR cuantitativa en tiempo real (qPCR) pueden incluir un marcador fluorescente. Están disponibles en el mercado numerosos marcadores fluorescentes. Por ejemplo, Molecular Probes, Inc. (Eugene, Oreg.) vende una amplia diversidad de tintes fluorescentes. Los ejemplos no limitantes incluyen Cy5, Cy3, TAMRA, R6G, R110, ROX, JOE, FAM, Texas Red™ y Oregon Green™. Los marcadores fluorescentes adicionales pueden incluir sondas de doble extinción IDT ZEN con sondas de hidrólisis 5' tradicionales en ensayos de qPCR. Estas sondas pueden contener, por ejemplo, un tinte FAM de 5' con un extintor TAMRA de 3', un extintor Black Hole 3' (BHQ, Biosearch Technologies), o un extintor ZEN interno y un extintor fluorescente lowa Black 3' (IBFQ).
Los tintes fluorescentes útiles de acuerdo con la invención pueden unirse a cebadores oligonucleotídicos usando métodos bien conocidos en la técnica. Por ejemplo, una forma común de añadir un marcador fluorescente a un oligonucleótido es hacer reaccionar un éster de N-hidroxisuccinimida (NHS) del tinte con un grupo amino reactivo en la diana. Los nucleótidos pueden modificarse para que porten un grupo amino reactivo mediante, por ejemplo, inclusión de un grupo alil amina en la nucleobase. Se describe el marcaje mediante alil amina, por ejemplo, en las Pat. de EE.UU. N.° 5.476.928 y 5.958.691. Otros medios de marcaje fluorescente de nucleótidos, oligonucleótidos y polinucleótidos se conocen bien por los expertos en la técnica.
Otros enfoques fluorogénicos incluyen el uso de sistemas de detección genéricos tales como el tinte SYBR-green, que emite fluorescencia cuando se intercala con el ADN amplificado de cualquier producto de expresión génica como se describe en las Pat. de EE.UU. N.° 5.436.134 y 5.658.751.
Otro método útil para determinar los niveles de expresión de genes diana incluye RNA-seq, una poderosa herramienta analítica usada para análisis de transcriptomas, incluyendo la diferencia del nivel de expresión génica entre diferentes condiciones fisiológicas o cambios que ocurren durante el desarrollo o durante el curso de la progresión de la enfermedad.
Otro enfoque para determinar los niveles de expresión génica incluye el uso de micromatrices, por ejemplo, micromatrices de ARN y ADN, que se conocen bien en la técnica. Las micromatrices pueden usarse para cuantificar la expresión de un gran número de genes simultáneamente.
(2) Flujo de trabajo generalizado para determinar la actividad de la señalización celular de PI3K, Wnt, ER y HH
La presente invención proporciona métodos y aparatos nuevos y mejorados como se divulga en el presente documento, para evaluar el estado funcional o la actividad de las rutas de PI3K, Wnt, ER y HH con el fin de calcular una puntuación de riesgo de un sujeto que experimenta un evento clínico particular.
En la figura 12 se muestra un diagrama de flujo que ilustra a modo de ejemplo un proceso para determinar la actividad de la señalización celular de PI3K y otra señalización celular de una muestra extraída de un sujeto. En primer lugar, se aísla el ARNm de una muestra (11). En segundo lugar, los niveles de expresión de ARNm de un conjunto único de al menos tres o más genes diana de PI3K, como se describe en el presente documento, se miden (12) usando métodos para medir la expresión génica que se conocen en la técnica. A continuación, se determina un nivel de actividad de un elemento de factor de transcripción (TF) de PI3K (13) usando un modelo de ruta matemático calibrado (14) que relaciona los niveles de expresión de los tres o más genes diana con el nivel de actividad del elemento TF de PI3K. A continuación, la actividad de la ruta de PI3K en el sujeto se infiere (15) basándose en el nivel de actividad determinado del elemento TF de PI3K en la muestra del sujeto.
Como se muestra en el lado derecho de la figura 12, después de determinar el nivel de actividad del elemento TF de PI3K, se determina un nivel de actividad de un elemento TF para al menos una ruta de señalización celular adicional (es decir, una o más de Wnt, ER y HH). Como ejemplo, los niveles de expresión de ARNm de un conjunto único de tres o más genes diana de la ruta de señalización celular adicional, como se describe en el presente documento, se miden (16) usando métodos para medir la expresión génica que se conocen en la técnica. A continuación, se determina el nivel de actividad del elemento TF (17) usando un modelo de ruta matemático calibrado (14) que relaciona los niveles de expresión de los tres o más genes diana de la ruta de señalización celular adicional con el nivel de actividad del elemento TF. A continuación, la actividad de la ruta de señalización celular adicional en el sujeto se infiere (18) basándose en el nivel de actividad determinado del elemento TF en la muestra del sujeto. A continuación, las actividades de PI3K y la ruta o rutas de señalización celular adicionales se convierten en una puntuación de múltiples rutas (MPS) que indica un riesgo de que el sujeto experimente un evento clínico asociado a una enfermedad dentro de un periodo de tiempo definido (19). La determinación de la puntuación de riesgo como la MPS puede entenderse como la evaluación de un modelo de puntuación de múltiples rutas (MPS) calibrado, donde los parámetros del modelo comprenden, por ejemplo, los coeficientes de ponderación (por ejemplo, we, ww, Wh y wp), como se describe en el presente documento. Por último, a la muestra se le asigna una puntuación de riesgo para experimentar un evento clínico basado en la MPS calculada (20).
(3) Calibración del modelo de puntuación de múltiples rutas (MPS) y determinación de la puntuación de múltiples rutas (MPS)
Como se contempla en el presente documento, se puede determinar una puntuación de riesgo correspondiente al riesgo de que ocurra un evento clínico utilizando un modelo de puntuación de múltiples rutas (MPS) calibrado que contiene actividades de las rutas de señalización celular asociadas al evento clínico, como se describe con detalle más adelante.
Un modelo de puntuación de múltiples rutas (MPS) calibrado como se usa en la presente invención puede calibrarse con datos clínicos fácilmente disponibles sobre el evento clínico de interés y las actividades de la ruta inferida. En la figura 13 se muestra un diagrama de flujo que ilustra a modo de ejemplo un proceso para calibrar un modelo de MPS con datos de supervivencia. Como etapa inicial, las actividades de las rutas relevantes inferidas utilizando modelos de ruta matemáticos calibrados se recuperan de una base de datos de actividades de ruta (201). La base de datos de actividades de ruta contiene actividades de la ruta de PI3K (205) y las actividades de ruta para al menos una ruta adicional. Por ejemplo, la base de datos de actividades de ruta contiene actividades de la ruta de ER (202), actividades de la ruta de Wnt (203), actividades de la ruta de HH (204) y actividades de la ruta de PI3K (205). A continuación, las identificaciones de un conjunto de muestras de entrenamiento en particular (218) se emplean para recibir las actividades de ruta relevantes (219) y, por ejemplo, los datos de supervivencia (220) (si la supervivencia es el evento clínico que se analiza) que se reciben de un evento de una base de datos de datos de supervivencia (221). A continuación, se seleccionan las actividades de ruta (222) con una salida de Pe, Pw, Ph y Pp en el caso de actividades de la ruta de ER, actividades de la ruta de Wnt, actividades de la ruta de HH y actividades de la ruta de PI3K, respectivamente. Los datos de supervivencia se convierten en las variables Surv y cens (223) que reflejan el tiempo de supervivencia y los datos censurados dentro de un periodo de tiempo determinado durante el que se utilizará la MPS. Las actividades de ruta y los datos de supervivencia se ajustan a continuación al modelo de riesgo proporcional de Cox (224) que da como resultado un modelo de riesgo proporcional de Cox ajustado (225). A partir del modelo de riesgo proporcional de Cox, se recopilan los coeficientes de Cox (226) y a continuación se asignan a las ponderaciones (227) con la salida we, Ww, Wh y wp. La estructura de la MPS (228) y las ponderaciones se toman juntas para calibrar el modelo de MPS (229) generando un modelo de MPS calibrado (210).
En la figura 14 se muestra un diagrama de flujo que ilustra a modo de ejemplo un proceso para determinar una puntuación de riesgo a partir de un modelo de MPS calibrado. Como etapa inicial, las actividades de las rutas relevantes inferidas utilizando modelos de ruta calibrados se recuperan de una base de datos de actividades de ruta (201). La base de datos de actividades de ruta contiene actividades de la ruta de PI3K (205) y las actividades de ruta para al menos una ruta adicional. Por ejemplo, la base de datos de actividades de ruta contiene actividades de la ruta de ER (202), actividades de la ruta de Wnt (203), actividades de la ruta de HH (204) y actividades de la ruta de PI3K (205). A continuación, se identifica la muestra del paciente (206) y las actividades de la ruta inicial se recopilan de la muestra y la base de datos como una medida de factores de transcripción o niveles de expresión génica, para las rutas relevantes (207). A continuación, se infieren las actividades totales de cada una de las rutas relevantes (208) con una salida de Pe, Pw, Ph y Pp. A continuación, estas actividades se convierten en una puntuación de riesgo (209) utilizando un modelo de MPS calibrado (210). Esta puntuación de riesgo inicial se puede ajustar adicionalmente con otros datos relevantes para producir una puntuación de riesgo final para el paciente (211), que a continuación se puede usar para mostrar (212), asignar (213) o decidir sobre un tratamiento (214), producir los resultados de una puntuación de riesgo mostrada (215), una puntuación de riesgo asignada (216) o un tratamiento decidido (217), respectivamente.
La inferencia de la actividad de una ruta de señalización celular en el sujeto se puede realizar, por ejemplo, entre otros, (i) evaluando una porción de un modelo de ruta probabilística calibrado, preferentemente una red bayesiana, que representa la ruta de señalización celular para un conjunto de entradas que incluyen los niveles de expresión de los tres o más genes diana de la ruta de señalización celular medidos en una muestra del sujeto, (ii) estimando un nivel de actividad en el sujeto de un elemento de factor de transcripción (TF), controlando el elemento TF la transcripción de los tres o más genes diana de la ruta de señalización celular, basándose la estimación en probabilidades condicionales que relacionan el nivel de actividad del elemento TF y los niveles de expresión de los tres o más genes diana de la ruta de señalización celular medidos en la muestra del sujeto, e (iii) infiriendo la actividad de la ruta de señalización celular basándose en el nivel de actividad estimado del elemento TF en la muestra del sujeto. Esto se describe en detalle en la solicitud de patente internacional publicada WO 2013/011479 A2 ("Assessment of cellular signaling pathway activity using probabilistic modeling of target gene expression").
En una alternativa de ejemplo, la inferencia de la actividad de una ruta de señalización celular en el sujeto puede realizarse, entre otros, (i) determinando un nivel de actividad de un elemento de factor de transcripción (TF) en la muestra del sujeto, controlando el elemento TF la transcripción de los tres o más genes diana de la ruta de señalización celular, basándose la determinación en la evaluación de un modelo de ruta matemático calibrado que relaciona los niveles de expresión de los tres o más genes diana de la ruta de señalización celular con el nivel de actividad del elemento TF, basándose el modelo de ruta matemático en una o más combinaciones lineales de niveles de expresión de los tres o más genes diana, e (ii) infiriendo la actividad de la ruta de señalización celular en el sujeto basándose en el nivel de actividad determinado del elemento TF en la muestra del sujeto. Esto se describe en detalle en la solicitud de patente internacional publicada WO 2014/102668 A2 ("Assessment of cellular signaling pathway activity using linear combination(s) of target gene expressions").
Una realización proporciona un método en el que las rutas de señalización celular comprenden la ruta de Wnt y/o la ruta de ER y/o la ruta de HH, y en el que la puntuación de riesgo se define de manera que el riesgo indicado aumenta monótonamente con una actividad inferida creciente de la ruta de Wnt y/o una actividad inferida creciente de la ruta de HH y/o disminuye monótonamente con una actividad inferida creciente de la ruta de ER.
En una realización, se proporciona un método en el que la puntuación de riesgo se define de manera que el riesgo indicado aumente monótonamente con una actividad inferida creciente de la ruta de PI3K.
En una realización, la combinación de las actividades inferidas comprende una suma que incluye el término Wp Pp y uno o más de los términos Ww Pw, We Pe, y Wh Ph, en la que Pp, Pw Pe y Ph representan la actividad inferida de la ruta de PI3K, la ruta de Wnt, la ruta de ER y la ruta de Hh , respectivamente, Wp, Ww y Wh son coeficientes de ponderación constantes positivas, We es un coeficiente de ponderación constante negativo, y el riesgo indicado de que el sujeto experimente el evento clínico dentro de un cierto periodo de tiempo aumenta monótonamente con un valor creciente de la suma.
En determinadas realizaciones, los coeficientes de ponderación constantes Wp, Ww, We y Wh son o se han determinado cada uno basándose en el valor del coeficiente de Cox resultante del ajuste de un modelo de riesgo proporcional de Cox para la ruta de señalización celular respectiva con respecto a los datos clínicos. Por ejemplo, el signo de la estimación del coeficiente indica si la actividad de la ruta es protectora para el evento clínico en caso de un coeficiente negativo o predice un mal o peor pronóstico en caso de un coeficiente positivo. El módulo del coeficiente indica la fuerza de la puntuación de riesgo con respecto al pronóstico.
En una realización, el evento clínico es metástasis de cáncer y Wp, Ww y Wh son coeficientes de ponderación constantes no negativos, y We es un coeficiente de ponderación constante no positivo. Con estos coeficientes, la MPS muestra el riesgo indicado de que el sujeto experimente el evento clínico dentro de un cierto periodo de tiempo que aumenta monótonamente con un valor creciente de la suma.
(4) Procedimiento de determinación del nivel de expresión del gen diana
En la figura 15 se muestra un diagrama de flujo de ejemplo que ilustra un proceso para derivar los niveles de expresión del gen diana a partir de una muestra extraída de un sujeto. En una realización ejemplar, las muestras se reciben y se registran en un laboratorio. Las muestras pueden incluir, por ejemplo, muestras fijadas en formalina, incorporadas en parafina (FFPE) (181) o muestras frescas congeladas (FF) (180). Las muestras de FF pueden lisarse directamente (183). Para muestras FFPE, la parafina puede eliminarse con una etapa de incubación calentada tras la adición de Proteinasa K (182). Después, las células se lisan (183), lo que destruye las membranas celulares y nucleares, lo que hace que el ácido nucleico (AN) esté disponible para su procesamiento posterior. El ácido nucleico está unido a una fase sólida (184) que podrían, por ejemplo, ser perlas o un filtro. A continuación, el ácido nucleico se lava con tampones de lavado para eliminar todos los restos celulares que están presentes después de la lisis (185). A continuación, el ácido nucleico limpio se separa de la fase sólida con un tampón de elución (186). El ADN se elimina mediante un tratamiento con DNAsa para garantizar que solo haya ARN presente en la muestra (187). A continuación, la muestra de ácido nucleico puede usarse directamente en la mezcla de muestras RT-qPCR (188). Las mezclas de muestras de RT-qPCR contienen la muestra de ARN, la enzima RT para preparar ADNc a partir de la muestra de ARN y una enzima de PCR para amplificar el ADNc, una solución tampón para asegurar el funcionamiento de las enzimas y potencialmente puede contener agua de calidad molecular para establecer un volumen fijo de concentración. A continuación, la mezcla de muestra puede añadirse a una placa de múltiples pocillos (es decir, una placa de 96 pocillos o de 384 pocillos) que contiene ensayos de RT-qPCR secos (189). A continuación, el análisis por RT-qPCR puede ejecutarse en una máquina de PCR de acuerdo con un protocolo específico (190). Un ejemplo de protocolo de PCR incluye i) 30 minutos a 50 °C; ii) 5 minutos a 95 °C; iii) 15 segundos a 95 °C; iv) 45 segundos a 60 °C; v) 50 ciclos repitiendo las etapas iii e iv. A continuación, los valores de Cq se determinan con los datos brutos usando el método de la segunda derivada (191). Los valores de Cq se exportan para su análisis (192).
(5) Enfermedades, trastornos y métodos de tratamiento
Como se contempla en el presente documento, los métodos y aparatos de la presente invención se pueden utilizar para evaluar la actividad de la ruta de señalización celular de PI3K, Wnt, ER y/o HH en un sujeto, por ejemplo, un sujeto que se sospecha que tiene, o que tiene, una enfermedad o trastorno en el que el estado de una de las rutas de señalización es probatorio, ya sea total o parcialmente, de la presencia o progresión de la enfermedad. En una realización, en el presente documento se proporciona un método para tratar a un sujeto que comprende recibir información sobre el estado de actividad de una ruta de señalización celular de PI3K, Wnt, ER y/o HH derivada de una muestra aislada del sujeto usando los métodos descritos en el presente documento y administrar al sujeto un inhibidor de PI3K, Wnt, ER y/o HH si la información relativa a la actividad de las rutas de señalización celular es indicativa de una ruta de señalización activa de PI3K, Wnt, ER y/o HH.
Los inhibidores de PI3K que pueden usarse en la presente invención son bien conocidos. Ejemplos de PI3K incluyen, pero sin limitación, wortmanina, demetioxiviridina, perifosina, idelalisib, pictilisib, Palomid 529, ZSTK474, PWT33597, CUDC-907 y AEZS-136, duvelisib, GS-9820, BKM120, GDC-0032 (Taselisib) (2-[4-[2-(2-isopropil-5-metil-1,2,4-triazol-3- il)-5,6-dihidroimidazo[1,2-d][1,4]benzoxazepin-9-il]pirazol-1-il]-2-metilpropanamida), MLN-1117 (hidrógeno (S)-metil fosfonato de (2R)-1-fenoxi-2-butanilo; o metil (oxo) {[(2R)-1-fenoxi-2-butanil]oxi}fosfonio)), BYL-719 ((2S)-N1-[4-metil-5-[2-(2,2,2-trifluoro-1, 1 -dimetiletil)-4-piridinil]-2-tiazolil]-1,2-pirrolidindicarboxamida), GSK2126458 (2,4-difluoro-N-{2-(metiloxi)-5-[4-(4-piridazinil)-6-quinolinil]-3-piridinil}bencenosulfonamida) (omipalisib), TGX-221 ((±)-7-metil-2-(morfolin-4-il)-9-(1-fenilaminoetil)-pirido[1,2-a]-pirimidin-4-ona), GSK2636771 (diclorhidrato del ácido 2-metil-1-(2-metil-3-(trifluorometil)bencil)-6-morfolino-1 H-benzo[d]imidazol-4-carboxílico), KIN-193 (ácido (R)-2-((1-(7-metil-2-morfolino-4-oxo-4H-pirido[1,2-a]pirimidin-9-il)etil)amino)benzoico), TGR-1202/RP5264, GS-9820 ((S)-1-(4-((2-(2-aminopirimidin-5-il)-7-metil-4-mohidroxipropan-1-ona), GS-1101 (5-fluoro-3-fenil-2-([S)]-1-[9H-purin-6-ilamino]-propil)-3H-quinazolin-4-ona), AMG-319, GSK-2269557, SAR245409 (N-(4-(N-(3-((3,5-dimetoxifenil)amino)quinoxalin-2-il)sulfamoil)fenil)-3-metoxi-4 metilbenzamida), BAY80-6946 (2-amino-N-(7-metoxi-8-(3-morfolinopropoxi)-2,3-dihidroimidazo[1,2-c]quinaz), AS 252424 (5-[1-[5-(4-Fluoro-2-hidroxi-fenil)-furan-2-il]-met-(Z)-ilideno]-tiazolidin-2,4-diona), CZ 24832 (5-(2-amino-8-fluoro-[1,2,4]triazolo[1,5-a]piridin-6-il)-N-terc-butilpiridin-3-sulfonamida), buparlisib (5-[2,6-Di(4-morfolinil)-4-pirimidinil]-4-(trifluorometil)-2-piridinamina), g Dc -0941 (2-(1H-Ind azo l-4-il )-6-[[4-(metilsulfonil)-1-piperazinil]metil]-4-(4-morfolinil)tieno[3,2-d]pirimidina), GDC-0980 ((S)-1-(4-((2-(2-aminopirimidin-5-il)-7-metil-4-morfolinotieno[3,2-d]pirimidin-6-il)metil)piperazin-1-il)-2-hidroxipropan-1-ona (también conocida como RG7422)), SF1126 ((8S,14S,17S)-14-(carboximetil)-8-(3-guanidinopropil)-17-(hidroximetil)-3,6,9,12,15-pentaoxo-1-(4-(4-oxo-8-fenil-4H-cromen-2-il)morfolino-4-io)-2-oxa-7,10,13,16-tetraazaoctadecan-18-oato), PF-05212384 (N-[4-[[4-(Dimetilamino)-1-piperidinil]carbonil]fenil]-N'-[4-(4,6-di-4-morfolinil-1,3,5-triazin-2-il)fenil]urea) (gedatolisib), LY3023414, BEZ235 (2-Metil-2-{4-[3-metil-2-oxo-8-(quinolin-3-il)-2,3-dihidro-1H-imidazo[4,5-c]quinolin-1-il]fenil}propanonitrilo) (dactolisib), XL-765 (N-(3-(N-(3-(3,5-dimetoxifenilamino)quinoxalin-2-il)sulfamoil)fenil)-3-metoxi-4- metil benzamida), y GSK1059615 (5-[[4-(4-piridinil)-6-quinolinil]metilen]-2,4-tiazolidendiona), PX886 (acetato de [(3aR,6E,9S,9aR,10R,11aS)-6-[[bis(prop-2-enil)amino]metiliden]-5-hidroxi-9-(metoximetil)-9a,11a-dimetil-1,4,7-trioxo-2,3,3a,9,10,11-hexahidroindeno[4,5h]isocromen-10-ilo] (también conocido como sonolisib)), LY294002, AZD8186, PF-4989216, pilaralisib, GNE-317, PI-3065, PI-103, NU7441 (KU-57788), HS 173, VS-5584 (SB2343), CZC24832, TG100-115, A66, YM201636, CAY10505, PIK-75, PIK-93, AS-605240, BGT226 (NVP-BGT226), AZD6482, voxtalisib, alpelisib, IC-87114, TGI100713, CH5132799, PKI-402, copanlisib (BAY 80-6946), XL 147, PIK-90, PIK-293, PIK-294, 3-MA (3-metiladenina), AS-252424, AS-604850, apitolisib (GDC-0980; RG7422), y las estructuras descritas en el documento WO2014/071109. Como alternativa, los inhibidores del complejo mTOR cadena abajo de PI3K son inhibidores valiosos de la actividad aberrante de PI3K. Ejemplos de inhibidores de mTOR incluyen, pero sin limitación, everolimus, temsirolimus, ridaforolimus. Como alternativa, los inhibidores del complejo HER2 cadena arriba de PI3K son inhibidores valiosos de la actividad aberrante de PI3K. Ejemplos de inhibidores de HER2 incluyen, pero sin limitación, trastuzumab, lapatinib, pertuzmab.
La terapia endocrina se puede administrar en cánceres de mama que son positivos a los receptores de estrógeno. Los tratamientos de terapia endocrina que pueden usarse en la presente invención son bien conocidos. La terapia endocrina consiste en la administración de i) supresores de la función ovárica, obtenidos normalmente usando agonistas de la hormona liberadora de gonadotropina (GnRHa), ii) moduladores o reguladores negativos selectivos del receptor de estrógeno (SERM o SARD), o iii) inhibidores de la aromatasa (IA), o una combinación de los mismos. Los supresores de la función ovárica incluyen, por ejemplo, agonistas de la hormona liberadora de gonadotropina (GnRHa). Ejemplos de agonistas de la hormona liberadora de gonadotropina (GnRHa) pueden incluir buserelina, deslorelina, gonadorelina, goserelina, histrelina, leuprorelina, nafarelina y triptorelina. Los moduladores selectivos del receptor de estrógeno (SERM) incluyen, por ejemplo, tamoxifeno, toremifeno, raloxifeno, lasofoxifeno, bazedoxifeno, clomifeno, ormeloxifeno, ospemifeno, afimoxifeno y arzoxifeno. Los reguladores negativos selectivos del receptor de estrógeno (SERD) incluyen, por ejemplo, fulvestrant, SR16234 y ZK191703. Los inhibidores de aromatasa incluyen, por ejemplo, anastrozol, letrozol, vorozol, exemestano, aminoglutetimida, testolactona, formestano, fadrozol, androstenodiona, 4-hidroxiandrostendiona, 1,4,6-androstatrien-3,17-diona, o 4-androsten-3,6,17-triona. En una realización, el inhibidor de la aromatasa es un inhibidor de la aromatasa no esteroideo.
Los inhibidores de Wnt son bien conocidos e incluyen, pero sin limitación, pirvinio, IWR-1-endo, IWP-2, FH535, WIKI4, IWP-L6, KY02111, LGK-974, Wnt-C59, XAV929, 3289-8625, FJ9, NSC 668036, PFK115-584, CGP049090, iCRT3, iCRT5, iCRT14, ICG-001, demetoxi curcumina, CCT036477, KY02111, PNU-74654 o PRI-724.
Los inhibidores de HH son bien conocidos e incluyen, pero sin limitación, ciclopiamina, SANT1-SANT4, CUR-61414, HhAntag-691, GDC-0449, MK4101, IPI-926, BMS-833923, robotnikinina, itraconazol, erivedge, odomzo, calcitriol, colecalciferol, IPI-906, RU-SKI 39, o KAAD-ciclopamina. NVP-LDE225, TAK-441, XL-139, LY2940680, NVP-LEQ506, itraconazol, MRT-10, MRT 83, PF-04449913, GANT-61, GANT-58, HPI-1, HPI-3 o HPI-4.
En una realización, la enfermedad o trastorno es uno de un trastorno autoinmunitario y otros trastornos inmunitarios, cáncer, asma bronquial, cardiopatía, diabetes, telangiectasia hemorrágica hereditaria, síndrome de Marfan, síndrome de Ehlers-Danlos vascular, síndrome de Loeys-Dietz, enfermedad de Parkinson, enfermedad renal crónica, esclerosis múltiple, enfermedades fibróticas tales como fibrosis hepática, pulmonar o renal, enfermedad de Dupuytren o enfermedad de Alzheimer.
En una realización particular, el sujeto padece o se sospecha que tiene, un cáncer, por ejemplo, pero sin limitación, un tumor primario o un tumor metastásico, un tumor sólido, por ejemplo, melanoma, cáncer de pulmón (incluyendo adenocarcinoma de pulmón, carcinoma de células basales, carcinoma de células escamosas, carcinoma macrocítico, carcinoma bronquioloalveolar, carcinoma broncogénico, carcinoma no microcítico, carcinoma microcítico, mesotelioma); cáncer de mama (incluyendo carcinoma ductal, carcinoma lobular, cáncer de mama inflamatorio, carcinoma de células claras, carcinoma mucinoso, carcinoma de mama de cavidades serosas); cáncer colorrectal (cáncer de colon, cáncer de recto, adenocarcinoma colorrectal); cáncer anal; cáncer de páncreas (incluyendo adenocarcinoma pancreático, carcinoma de células de los islotes, tumores neuroendocrinos); cáncer de próstata; adenocarcinoma de próstata; carcinoma de ovario (carcinoma epitelial de ovario o tumor del estroma epitelial de superficie, incluyendo tumor seroso, tumor endometrioide y cistadenocarcinoma mucinoso, tumor del estroma del cordón sexual); carcinoma de hígado y conductos biliares (incluyendo carcinoma hepatocelular, colangiocarcinoma, hemangioma); carcinoma de esófago (incluyendo adenocarcinoma de esófago y carcinoma de células escamosas); carcinoma de células escamosas oral y orofaríngeo; carcinoma adenoide quístico de glándula salival; cáncer de vejiga; carcinoma de vejiga; carcinoma de útero (incluyendo adenocarcinoma de endometrio, ocular, carcinoma seroso papilar uterino, carcinoma uterino de células claras, sarcomas uterinos y leiomiosarcomas, tumores mullerianos mixtos); glioma, glioblastoma, meduloblastoma y otros tumores del cerebro; cánceres de riñón (incluyendo carcinoma de células renales, carcinoma de células claras, tumor de Wilm); cáncer de cabeza y cuello (incluyendo carcinomas de células escamosas); cáncer de estómago (cánceres gástricos, adenocarcinoma de estómago, tumor estromal gastrointestinal); cáncer testicular; tumor de las células germinales; tumor neuroendocrino; cáncer cervicouterino; carcinoides del tracto gastrointestinal, mama y otros órganos; carcinoma de células de anillo de sello; tumores mesenquimales, incluyendo sarcomas, fibrosarcomas, hemangioma, angiomatosis, hemangiopericitoma, hiperplasia estromal seudoangiomatosa, miofibroblastoma, fibromatosis, tumor miofibroblástico inflamatorio, lipoma, angiolipoma, tumor de células granulares, neurofibroma, schwannoma, angiosarcoma, liposarcoma, rabdomiosarcoma, osteosarcoma, leiomioma, leiomisarcoma, de piel, incluyendo melanoma, de cuello del útero, retinoblastoma, cáncer de cabeza y cuello, de páncreas, cerebro, tiroides, testicular, renal, vejiga, tejido blando, glándula adrenal, uretra, cánceres del pene, mixosarcoma, condrosarcoma, osteosarcoma, cordoma, histiocitoma fibroso maligno, linfangiosarcoma, mesotelioma, carcinoma de células escamosas; carcinoma epidermoide, tumores malignos de los anexos cutáneos, adenocarcinoma, hepatoma, carcinoma hepatocelular, carcinoma de células renales, hipernefroma, colangiocarcinoma, carcinoma de células transicionales, coriocarcinoma, seminoma, carcinoma de células embrionarias, glioma anaplásico; glioblastoma multiforme, neuroblastoma, meduloblastoma, meningioma maligno, schwannoma maligno, neurofibrosarcoma, carcinoma de paratiroides, carcinoma medular de tiroides, carcinoide bronquial, feocromocitoma, carcinoma de células de los islotes, carcinoma maligno, paraganglioma maligno, melanoma, neoplasia de células de Merkel, cistosarcoma filoide, cánceres salivales, carcinomas tímicos y cánceres de vagina entre otros.
En una realización, los métodos descritos en el presente documento son útiles para tratar a un huésped que padece un linfoma o un trastorno o anomalía de proliferación linfocítica o mielocítica. Por ejemplo, el sujeto que padece un linfoma de Hodgkin o un linfoma no Hodgkiniano. Por ejemplo, el sujeto puede padecer un linfoma no Hodgkiniano tal como, pero sin limitación: un linfoma relacionado con el SIDA; linfoma anaplásico de células grandes; linfoma angioinmunoblástico; linfoma blástico de linfocitos NK; linfoma de Burkitt; linfoma tipo Burkitt (linfoma de células pequeñas no escindidas); leucemia linfocítica crónica/linfoma linfocítico pequeño; linfoma cutáneo de linfocitos T; linfoma difuso de linfocitos B grandes; linfoma de linfocitos T de tipo enteropatía; linfoma folicular; linfoma hepatoesplénico de linfocitos T gama-delta; linfoma linfoblástico; linfoma de células del manto; linfoma de la zona marginal; linfoma nasal de linfocitos T; linfoma pediátrico; linfomas periféricos de linfocitos T; linfoma del sistema nervioso central primario; leucemias de linfocitos T; linfomas transformados; linfomas de linfocitos T relacionados con el tratamiento; o macroglobulinemia de Waldenstrom.
Como alternativa, el sujeto puede padecer un linfoma de Hodgkin, tal como, pero sin limitación: linfoma de Hodgkin clásico con esclerosis nodular (CHL); CHL de celularidad mixta; CHL con depleción linfocitaria; CHL rico en linfocitos; linfoma de Hodgkin con predominio de linfocitos; o HL con predominio de linfocitos nodulares.
En una realización, el sujeto puede padecer un linfoma, un trastorno proliferativo o una anomalía específicos basados en linfocitos T, linfocitos B o linfocitos NK. Por ejemplo, el sujeto puede padecer un linfoma específico de linfocitos T o NK, por ejemplo, pero sin limitación: linfoma periférico de linfocitos T, por ejemplo, linfoma periférico de linfocitos T y linfoma periférico de linfocitos T no especificado de otra manera (PTCL-NOS); linfoma anaplásico de células grandes, por ejemplo, linfoma anaplásico cinasa (ALK) positivo, linfoma anaplásico de células grandes ALK negativo o linfoma anaplásico cutáneo primario de células grandes; linfoma angioinmunoblástico; linfoma cutáneo de linfocitos T, por ejemplo micosis fungoide, síndrome de Sezary, linfoma anaplásico cutáneo primario de células grandes, trastorno linfoproliferativo de linfocitos T CD30+ cutáneo primario; linfoma cutáneo primario agresivo epidermitrópico de linfocitos T citotóxicos CD8+; linfoma cutáneo primario de linfocitos T gamma-delta; linfoma cutáneo primario de linfocitos T CD4+ pequeños/medianos y papulosis linfomatoide; linfoma/leucemia de linfocitos T en adultos (ATLL); linfoma blástico de linfocitos NK; linfoma de linfocitos T de tipo enteropatía; linfoma hepatoesplénico de linfocitos T gamadelta; linfoma linfoblástico; linfomas nasales de linfocitos NK/T; linfomas de linfocitos T relacionados con el tratamiento; por ejemplo, linfomas que aparecen después de un trasplante de órganos sólidos o de médula ósea; leucemia prolinfocítica de linfocitos T; leucemia linfocítica granular de linfocitos T grandes; trastorno linfoproliferativo crónico de linfocitos NK; leucemia agresiva de linfocitos NK; enfermedad sistémica linfoproliferativa de linfocitos T VEB+ de la infancia (asociada a infección crónica activa por VEB); linfoma de tipo hidroa vacciniforme; leucemia/linfoma de linfocitos T del adulto; linfoma de linfocitos T asociado a enteropatía; linfoma hepatosplénico de linfocitos T; o linfoma subcutáneo de linfocitos T de tipo paniculitis.
Como alternativa, el sujeto puede padecer un linfoma de linfocitos B específico o un trastorno proliferativo tal como, pero sin limitación: mieloma múltiple; linfoma difuso de linfocitos B grandes; linfoma folicular; linfoma de tejido linfático asociado a mucosas (MALT); linfoma linfocítico microcítico; linfoma de células del manto (LCM); linfoma de Burkitt; linfoma mediastínico de linfocitos B grandes; macroglobulinemia de Waldenstrom; linfoma nodal de la zona marginal de linfocitos B (NMZL); linfoma esplénico de la zona marginal (SMZL); linfoma intravascular de linfocitos B grandes; linfoma primario con derrame; o granulomatosis linfomatoide; leucemia linfocítica crónica/linfoma linfocítico pequeño; leucemia prolinfocítica de linfocitos B; tricoleucemia; linfoma/leucemia esplénica, no clasificable; linfoma esplénico de linfocitos B pequeños con infiltración difusa de la pulpa roja; variante de tricoleucemia; linfoma linfoplasmacítico; enfermedades de la cadena pesada, por ejemplo, enfermedad de la cadena pesada alfa, enfermedad de la cadena pesada gamma, enfermedad de la cadena pesada Mu; mieloma de células plasmáticas; plasmacitoma solitario del hueso; plasmacitoma extraóseo; linfoma cutáneo primario del centro folicular; linfoma de linfocitos B grandes rico en linfocitos T/histiocitos; DLBCL asociado a inflamación crónica; virus de Epstein-Barr (VEB) DLBCL de los ancianos; linfoma primario de mediastino (tímico) de linfocitos B grandes; DLBCL primario cutáneo, tipo pierna; ALK+ linfoma de linfocitos B grandes; linfoma plasmablástico; linfoma de linfocitos B grandes originado en enfermedad de Castleman multicéntrica asociada a HHV8; enfermedad de Castleman; linfoma de linfocitos B, no clasificable, con características intermedias entre el linfoma difuso de linfocitos B grandes y el linfoma de Burkitt; linfoma de linfocitos B, no clasificable, con características intermedias entre el linfoma difuso de linfocitos B grandes y el linfoma de Hodgkin clásico; linfoma de Hodgkin clásico de esclerosis nodular; linfoma de Hodgkin clásico rico en linfocitos; linfoma de Hodgkin clásico de celularidad mixta; o linfoma de Hodgkin clásico con depleción linfocitaria.
En una realización, el sujeto padece una leucemia. Por ejemplo, el sujeto puede padecer una leucemia aguda o crónica de origen linfocítico o mielógeno, tal como, pero sin limitación: leucemia linfoblástica aguda (ALL); leucemia mielógena aguda (AML); leucemia linfocítica crónica (CLL); leucemia mielógena crónica (CML); leucemia mielomonocítica juvenil (JMML); tricoleucemia (HCL); leucemia promielocítica aguda (un subtipo de AML); leucemia prolinfocítica de linfocitos T (TPLL); leucemia linfocítica granular grande; o leucemia crónica de linfocitos T del adulto; leucemia linfocítica granular grande (LGL). En una realización, el sujeto padece una leucemia mielógena aguda, por ejemplo, una AML indiferenciada (MO); leucemia mieloblástica (M1; con/sin maduración celular mínima); leucemia mieloblástica (M2; con maduración celular); leucemia promielocítica (M3 o variante de M3 [M3V]); leucemia mielomonocítica (M4 o variante de M4 con eosinofilia [M4E]); leucemia monocítica (M5); eritroleucemia (M6); o leucemia megacarioblástica (M7).
En una realización particular, el sujeto padece, o se sospecha que padece, un cáncer de mama, cáncer de pulmón, un cáncer de colon, cáncer de páncreas o cáncer de cerebro. En una realización particular, el sujeto padece, o se sospecha que padece, un cáncer de mama.
En la realización particular del cáncer, los pacientes con alto riesgo de experimentar el evento clínico pueden recibir quimioterapia o terapia dirigida además de las modalidades de tratamiento estándar de atención, tales como, pero sin limitación, cirugía, radioterapia, terapia farmacológica (dirigida). Como alternativa, los pacientes con bajo riesgo de experimentar el evento clínico pueden abstenerse de las modalidades de atención estándar tales como, pero sin limitación, cirugía, radioterapia, quimioterapia.
En una realización, la determinación de si administrar un agente terapéutico, o abstenerse de administrar un agente terapéutico, puede basarse en una puntuación MPS umbral, por ejemplo, un umbral establecido para asignar a un paciente a un grupo de bajo riesgo o un umbral establecido para asignar a un paciente a un grupo de alto riesgo. Por ejemplo, en una realización, el umbral para asignar pacientes al grupo de bajo riesgo puede basarse en el riesgo de que el evento clínico a los 5, 6, 7, 8, 9, 10 o más años sea menor o igual al 5 %, 10 %, 15 %, 20 %, mientras que el umbral para asignar pacientes al grupo de alto riesgo puede basarse en el riesgo de que el evento clínico a los 5, 6, 7, 8, 9, 10 o más años sea mayor o igual al 20 %, 25 %, 30 %, 35 %, 40 %, 45 %, 50 %, o más. Por ejemplo, utilizando la ilustración anterior, en el caso particular de MPStpweh, esto da como resultado un umbral para el grupo de pacientes de bajo riesgo que es de -0,5, -0,4, -0,3, -0,2, -0,1, 0, siendo el umbral para el grupo de pacientes de alto riesgo 0, 0,1, 0,2, 0,3, 0,4, 0,5, 0,6, 0,7, 0,8, 0,9, 1, 1,1, 1,2.
En un aspecto de la presente invención, el evento clínico por el cual un sujeto puede ser asignado a un grupo de bajo o alto riesgo puede incluir una recidiva, progresión, metástasis, muerte por cáncer o un evento clínico como se describe en otras partes del presente documento.
En la realización particular, la asignación de un riesgo alto o bajo es para un sujeto con cáncer de mama, las pacientes con un subtipo de tumor ER+ o HR+ o luminal A o luminal B y con alto riesgo de experimentar el evento clínico pueden recibir quimioterapia (neo)adyuvante además del tratamiento hormonal tal como, pero sin limitación, tamoxifeno o inhibidores de aromatasa. El subtipo de tumor ER+ o luminal A o luminal B y con bajo riesgo de experimentar el evento clínico pueden recibir tratamiento hormonal (neo)adyuvante (y abstenerse de recibir quimioterapia). Las pacientes con un subtipo de tumor HER2+/HR- o enriquecido con HER2 y con alto riesgo de experimentar el evento clínico pueden recibir quimioterapia (neo)adyuvante además del tratamiento anti-HER2 tal como, pero sin limitación, trastuzumab, mientras que el subtipo de tumor HER2+/HR- o enriquecido con HER2 y con bajo riesgo de experimentar el evento clínico pueden recibir tratamiento (neo)adyuvante anti-HER2 (y abstenerse de recibir quimioterapia). Los pacientes con un tumor HER2+/HR+ y con un alto riesgo de experimentar el evento clínico pueden recibir quimioterapia (neo)adyuvante con tratamiento anti-HER2 además del tratamiento hormonal tal como, pero sin limitación, tamoxifeno o inhibidores de aromatasa, mientras que las pacientes con un tumor HER2+/HR+ y un riesgo bajo de experimentar el evento clínico pueden recibir tratamiento hormonal (neo)adyuvante (y abstenerse de recibir quimioterapia y/o tratamiento anti-HER2). Las pacientes con un subtipo basal o tumor triple negativo (HER2-/ER-/PR- o HER2-/HR-) y con un alto riesgo de experimentar el evento clínico pueden recibir quimioterapia (neo)adyuvante además de la terapia dirigida tal como, pero sin limitación, lo descrito en el presente documento, mientras que las pacientes con un subtipo basal o tumor triple negativo y un riesgo bajo de experimentar el evento clínico pueden recibir terapia dirigida (neo)adyuvante (y abstenerse de recibir quimioterapia).
Ejemplo 5: Un kit y herramientas de análisis para determinar una puntuación de riesgo
El conjunto de genes diana que se encuentra que indican mejor la actividad de la ruta de señalización celular respectiva, basándose en la investigación basada en micromatrices/secuenciación de ARN utilizando, por ejemplo, el modelo bayesiano o el modelo (pseudo)lineal, se puede traducir en, por ejemplo, un ensayo de PCR cuantitativa múltiplex o biochips de micromatrices dedicados a realizar en una muestra de un sujeto. Puede usarse una selección de la secuencia génica como se describe en el presente documento para seleccionar, por ejemplo, un conjunto de cebador-sonda para RT-PCR u oligonucleótidos para el desarrollo de micromatrices. Para desarrollar tal prueba aprobada por la FDA para la determinación de la actividad de la ruta y la puntuación de riesgo, se requiere el desarrollo de un kit de prueba normalizado, que debe validarse clínicamente en ensayos clínicos para obtener la aprobación regulatoria.
Esta solicitud describe varias realizaciones preferidas. Pueden producirse modificaciones y alteraciones a otras al leer y comprender la descripción detallada anterior. Se pretende que la solicitud se construya incluyendo todas estas modificaciones y alteraciones en la medida en que estén dentro del alcance de las reivindicaciones adjuntas o equivalentes de las mismas.
Otras variaciones de las realizaciones divulgadas pueden entenderse y realizarse por los expertos en la técnica al poner en práctica la invención reivindicada, a partir de un estudio de los dibujos, la divulgación y las reivindicaciones adjuntas.
En las reivindicaciones, la expresión "que comprende" no excluye otros elementos o etapas y el artículo indefinido "un" o "una" no excluye una pluralidad.
Una única unidad o dispositivo puede cumplir las funciones de varios elementos enunciados en las reivindicaciones. El mero hecho de que determinadas medidas se enuncien en reivindicaciones dependientes mutuamente diferentes no indica que una combinación de estas medidas no se pueda aprovechar.
Los cálculos como la determinación de la puntuación de riesgo realizado por una o varias unidades o dispositivos pueden realizarse por cualquier otro número de unidades o dispositivos.
Un programa informático puede almacenarse/distribuirse en un medio adecuado, tal como un medio de almacenamiento óptico o un medio de estado sólido, suministrado junto con o como parte de otro hardware, pero también puede distribuirse en otras formas, tal como a través de Internet u otros sistemas de telecomunicaciones por cable o inalámbricos.
No se debería interpretar ningún signo de referencia en las reivindicaciones como limitante del alcance.
Ejemplo 6: Listados de secuencias usados en la solicitud
LISTADO DE SECUENCIAS:
Sec. N.° Gen:
Sec. 1 ADRA2C
Sec. 2 AGRP
Sec. 3 AP1B1
Sec. 4 ASCL2
Sec. 5 ATG14
Sec. 6 ATP5J
Sec. 7 ATP8A1
Sec. 8 AXIN2
Sec. 9 BCL2
Sec. 10 BCL2L11
Sec. 11 BCL6
Sec. 12 BIRC5
(continuación)
Sec. N.° Gen:
Sec. 13 BMP7
Sec. 14 BNIP3
Sec. 15 BTG1
Sec. 16 C10orf10
Sec. 17 CA12
Sec. 18 CAT
Sec. 19 CAV1
Sec. 20 CBLB
Sec. 21 CCND1
Sec. 22 CCND2
Sec. 23 CCNG2
Sec. 24 CD44
Sec. 25 CDH26
Sec. 26 CDKN1A
Sec. 27 CDKN1B
Sec. 28 CELSR2
Sec. 29 CFLAR
Sec. 30 COL18A1
Sec. 31 COX7A2L
Sec. 32 CTSD
Sec. 33 CTSL
Sec. 34 DDB1
Sec. 35 DEFA6
Sec. 36 DKK1
Sec. 37 DSCAM
Sec. 38 DYRK2
Sec. 39 EBAG9
Sec. 40 EPHB2
Sec. 41 EPHB3
Sec. 42 ERBB2
Sec. 43 ERBB3
Sec. 44 EREG
Sec. 45 ESR1
Sec. 46 EXT1
Sec. 47 FASLG
Sec. 48 FAT1
Sec. 49 FBXO32
Sec. 50 FGFR2
Sec. 51 FOXA2
Sec. 52 FOXF1
Sec. 53 FOXL1
Sec. 54 FOXM1
Sec. 55 FST
Sec. 56 FYN
Sec. 57 FZD7
Sec. 58 GADD45A
Sec. 59 GLI1
Sec. 60 GLI3
Sec. 61 GLUL
Sec. 62 GREB1
Sec. 63 H19
Sec. 64 HHIP
Sec. 65 HNF1A
Sec. 66 HSPB1
Sec. 67 IGF1R
Sec. 68 IGFBP1
Sec. 69 IGFBP3
Sec. 70 IGFBP4
Sec. 71 IGFBP6
Sec. 72 IL1R2
Sec. 73 CXCL8 (previamente conocido como IL8) Sec. 74 INSR
Sec. 75 JAG2
(continuación)
Sec. N.° Gen:
Sec. 76 JUP
Sec. 77 CEMIP (previamente conocido como
KIAA1199)
Sec. 78 KLF2
Sec. 79 KLF4
Sec. 80 KLF6
Sec. 81 KRT19
Sec. 82 LECT2
Sec. 83 LEF1
Sec. 84 LGMN
Sec. 85 LGR5
Sec. 86 MIF
Sec. 87 MXI1
Sec. 88 MYC
Sec. 89 MYCN
Sec. 90 MYLK
Sec. 91 MYOD1
Sec. 92 NDUFV3
Sec. 93 NKD1
Sec. 94 NKX2-2
Sec. 95 NKX2-8
Sec. 96 NOS3
Sec. 97 NRIP1
Sec. 98 OAT
Sec. 99 PCK1
Sec. 100 PDK4
Sec. 101 PGR
Sec. 102 PISD
Sec. 103 PITRM1
Sec. 104 POMC
Sec. 105 PPARG
Sec. 106 PPARGC1A
Sec. 107 PPM1D
Sec. 108 PRDM15
Sec. 109 PRDX3
Sec. 110 PTCH1
Sec. 111 PTCH2
Sec. 112 PTMA
Sec. 113 RAB34
Sec. 114 RAG1
Sec. 115 RAG2
Sec. 116 RARA
Sec. 117 RBL2
Sec. 118 REG1B
Sec. 119 RNF43
Sec. 120 S100A7
Sec. 121 S100A9
Sec. 122 SEMA3C
Sec. 123 SEPP1
Sec. 124 SESN1
Sec. 125 SGK3
Sec. 126 SIRT1
Sec. 127 SLC1A2
Sec. 128 SLC5A3
Sec. 129 SMAD4
Sec. 130 SOD1
Sec. 131 SOD2
Sec. 132 SOX9
Sec. 133 SP5
Sec. 134 SPP1
Sec. 135 STK11
Sec. 136 TBX3
Sec. 137 TCEA2
Sec. 138 TCF7L2
(continuación)
Sec. N.° Gen:
Sec.139 TDGF1
Sec.140 TFF1
Sec.141 TLE4
Sec.142 TNFSF10
Sec.143 TOM1
Sec.144 TRIM25
Sec.145 TSC22D1
Sec.146 TXNIP
Sec.147 WISP2
Sec.148 XBP1
Sec.149 ZNRF3
Sec.150 SERPINE1
Sec.151 PDZK1
T l 1: n i li r n i n PI K
Figure imgf000043_0001
continuación
Figure imgf000044_0002
T l 17: n i li r n i n Wn
Figure imgf000044_0001
continuación
Figure imgf000045_0001
T l 1: n i li r n i n ER
Figure imgf000045_0002
continuación
Figure imgf000046_0001
T l 1: n i li r n i n HH
Figure imgf000046_0002
continuación
Figure imgf000047_0001
T l 2: n i li r n r f r ni
Figure imgf000047_0002

Claims (11)

REIVINDICACIONES
1. Un método implementado por ordenador para determinar una puntuación de riesgo que indica un riesgo de que un sujeto experimente un evento clínico asociado a una enfermedad dentro de un periodo de tiempo definido realizado por un dispositivo de procesamiento digital, en el que la determinación comprende:
inferir la actividad de cada una de dos o más rutas de señalización celular en el sujeto basándose en la evaluación de un modelo de ruta matemático calibrado que relaciona los niveles de expresión de tres o más genes diana de la ruta de señalización celular respectiva medida en una muestra del sujeto a un nivel de actividad del elemento de factor de transcripción (TF) respectivo de la ruta de señalización celular respectiva en la muestra del sujeto, controlando el elemento TF la transcripción de los tres o más genes diana de la ruta de señalización celular respectiva, estando la actividad de la ruta de señalización celular respectiva definida por el nivel de actividad del elemento TF respectivo, siendo el modelo de ruta matemático calibrado un modelo que se calibra utilizando un conjunto de datos de verdad fundamental que incluye muestras en las que la transcripción de los tres o más genes diana de la ruta de señalización celular respectiva se induce por el elemento TF respectivo y muestras en las que la transcripción de los tres o más genes diana no se induce por el elemento TF respectivo, y
determinar la puntuación de riesgo basándose en una combinación de las actividades inferidas,
en el que el evento clínico es la recidiva de la enfermedad, en el que la enfermedad es cáncer de mama, en el que las rutas de señalización celular comprenden una ruta de PI3K y una o más de una ruta de Wnt, una ruta de ER y una ruta de HH,
en el que la ruta de PI3K, la ruta de Wnt, la ruta de ER y la ruta de HH se definen como la ruta de señalización celular que finalmente conduce a la actividad transcripcional del elemento TF respectivo,
en el que el elemento TF de PI3K consiste en un miembro de la familia FOXO, el elemento TF de Wnt consiste en p-catenina/TCF4, el elemento TF de ER consiste en el dímero ERa, y el elemento TF de HH consiste en un miembro de la familia GLI,
en el que:
los tres o más genes diana de PI3K se seleccionan del grupo que consiste en: AGRP, BCL2L11, BCL6, BNIP3, BTG1, CAT, CAV1, CCND1, CCND2, CCNG2, CDKN1A, CDKN1B, ESR1, FASLG, FBXO32, GADD45A, INSR, MXI1, NOS3, PCK1, POMC, PPARGC1A, PRDX3, RBL2, SOD2, TNFSF10,
y/o
los tres o más genes diana de Wnt se seleccionan del grupo que consiste en: CEMIP, AXIN2, CD44, RNF43, MYC, TBX3, TDGF1, SOX9, ASCL2, CXCL8, SP5, ZNRF3, EPHB2, LGR5, EPHB3, KLF6, CCND1, DEFA6 y FZD7,
y/o
los tres o más genes diana de ER se seleccionan del grupo que consiste en: CDH26, SGK3, PGR, GREB1, CA12, XBP1, CELSR2, WISP2, DSCAM, ERBB2, CTSD, TFF1, PDZK1, IGFBP4, ESR1, SOD1, AP1B1 y NRIP1,
y/o
los tres o más genes diana de HH se seleccionan del grupo que consiste en: GLI1, PTCH1, PTCH2, IGFBP6, SPP1, CCND2, FST, FOXL1, CFLAR, TSC22D1, RAB34, S100A9, S100A7, MYCN, FOXM1, GLI3, TCEA2, FYN y CTSL1,
en el que la puntuación de riesgo se basa en una puntuación de múltiples rutas (MPS) que comprende una suma que incluye el término Wp Pp y uno o más de los términos Ww Pw, We Pe, y Wh Ph, en la que Pp, Pw, Pe y Ph representan la actividad inferida de la ruta de PI3K, la ruta de Wnt, la ruta de ER y la ruta de HH, respectivamente, y en la que Wp, W w, We y Wh son coeficientes de ponderación constantes que representan una correlación entre el riesgo de que el sujeto experimente el evento clínico dentro del periodo de tiempo definido y la actividad de la ruta de PI3K, la ruta de Wnt, la ruta de ER y la ruta de HH, respectivamente.
2. El método de la reivindicación 1, en el que las rutas de señalización celular comprenden la ruta de Wnt y/o la ruta de ER y/o la ruta de HH, y en el que la puntuación de riesgo se define de manera que el riesgo indicado aumenta monótonamente con una actividad inferida creciente de la ruta de Wnt y/o una actividad inferida creciente de la ruta de HH y/o disminuye monótonamente con una actividad inferida creciente de la ruta de ER.
3. El método de cualquiera de las reivindicaciones 1 o 2, en el que la puntuación de riesgo se define de tal manera que el riesgo indicado aumenta monótonamente con una actividad inferida creciente de la ruta de señalización celular de PI3K.
4. El método de la reivindicación 3, en el que los coeficientes de ponderación constantes Wp, W w, We y Wh son o se han determinado cada uno basándose en el valor del coeficiente de Cox resultante del ajuste de un modelo de riesgo proporcional de Cox para la ruta de señalización celular respectiva con respecto a los datos clínicos.
5. El método de cualquiera de las reivindicaciones 1 a 4, en el que:
los tres o más genes diana de PI3K se seleccionan del grupo que consiste en: FBX032, BCL2L11, SOD2, TNFSF10, BCL6, BTG1, CCNG2, CDKN1B, BNIP3, GADD45A, INSR y MXI1,
y/o
los tres o más genes diana de Wnt se seleccionan del grupo que consiste en: AXIN2, CD44, LGR5, CEMIP, MYC, CXCL8, SOX9, EPHB3, RNF43, TDGF1, ZNRF3 y DEFA6,
y/o
los tres o más genes diana de ER se seleccionan del grupo que consiste en: TFF1, GREB1, PGR, SGK3, PDZK1, IGFBP4, NRIP1, CA12, XBP1, ERBB2, ESR1 y CELSR2,
y/o
los tres o más genes diana de HH se seleccionan del grupo que consiste en: GLI1, PTCH1, PTCH2, CCND2, IGFBP6, MYCN, FST, RAB34, GLI3, CFLAR, S100A7 y S100A9.
6. El método de cualquiera de las reivindicaciones 1 a 5, que comprende además:
asignar al sujeto al menos a uno de una pluralidad de grupos de riesgo asociados a diferentes riesgos indicados de que el sujeto experimente el evento clínico dentro del período de tiempo definido,
y/o
decidir un tratamiento recomendado para el sujeto basándose en el riesgo indicado de que el sujeto experimente el evento clínico dentro del periodo de tiempo definido.
7. Un aparato para determinar una puntuación de riesgo que indica un riesgo de que un sujeto experimente un evento clínico asociado a una enfermedad dentro de un periodo de tiempo definido que comprende un procesador digital configurado para realizar el método de cualquiera de las reivindicaciones 1 a 6.
8. Un medio de almacenamiento no transitorio para determinar una puntuación de riesgo que indica un riesgo de que un sujeto experimente un evento clínico asociado a una enfermedad dentro de un periodo de tiempo definido que almacena instrucciones que son ejecutables por un dispositivo de procesamiento digital para realizar el método de cualquiera de las reivindicaciones 1 a 6.
9. Un programa informático para determinar una puntuación de riesgo que indica un riesgo de que un sujeto experimente un evento clínico asociado a una enfermedad dentro de un periodo de tiempo definido que comprende medios de código de programa para hacer que un dispositivo de procesamiento digital realice el método de cualquiera de las reivindicaciones 1 a 6, cuando el programa informático se ejecuta en el dispositivo de procesamiento digital.
10. Un kit para medir los niveles de expresión de tres o más genes diana de cada una de dos o más rutas de señalización celular en una muestra de un sujeto y para determinar una puntuación de riesgo que indica un riesgo de que un sujeto experimente un evento clínico asociado a una enfermedad dentro de un periodo de tiempo definido, que comprende:
uno o más componentes para determinar los niveles de expresión de tres o más genes diana de cada una de dos o más rutas de señalización celular en una muestra del sujeto,
en el que el uno o más componentes se seleccionan preferentemente del grupo que consiste en: un chip de micromatriz, un anticuerpo, una pluralidad de sondas, por ejemplo, sondas marcadas, un conjunto de componentes de secuenciación de transcriptasa inversa de ARN, y/o ARN o ADN, incluyendo ADNc, cebadores de amplificación, en el que las rutas de señalización celular comprenden una ruta de PI3K y una o más de una ruta de Wnt, una ruta de ER y una ruta de HH, y
en el que el kit comprende además el aparato de la reivindicación 7, el medio de almacenamiento no transitorio de la reivindicación 8 o el programa informático de la reivindicación 9,
en el que:
los tres o más genes diana de PI3K se seleccionan del grupo que consiste en: AGRP, BCL2L11, BCL6, BNIP3, BTG1, CAT, CAV1, CCND1, CCND2, CCNG2, CDKN1A, CDKN1B, ESR1, FASLG, FBXO32, GADD45A, INSR, MXI1, NOS3, PCK1, POMC, PPARGC1A, PRDX3, RBL2, SOD2, TNFSF10,
y/o
los tres o más genes diana de Wnt se seleccionan del grupo que consiste en: CEMIP, AXIN2, CD44, RNF43, MYC, TBX3, TDGF1, SOX9, ASCL2, CXCL8, SP5, ZNRF3, EPHB2, LGR5, EPHB3, KLF6, CCND1, DEFA6 y FZD7,
y/o
los tres o más genes diana de ER se seleccionan del grupo que consiste en: CDH26, SGK3, PGR, GREB1, CA12, XBP1, CELSR2, WISP2, DSCAM, ERBB2, CTSD, TFF1, PDZK1, IGFBP4, ESR1, SOD1, AP1B1 y NRIP1,
y/o
los tres o más genes diana de HH se seleccionan del grupo que consiste en: GLI1, PTCH1, PTCH2, IGFBP6, SPP1, CCND2, FST, FOXL1, CFLAR, TSC22D1, RAB34, S100A9, S100A7, MYCN, FOXM1, GLI3, TCEA2, FYN y CTSL1.
11. Uso de un kit para realizar el método de cualquiera de las reivindicaciones 1 a 6, comprendiendo el kit: uno o más componentes para determinar los niveles de expresión de tres o más genes diana de cada una de dos o más rutas de señalización celular en una muestra del sujeto,
en el que el uno o más componentes se seleccionan preferentemente del grupo que consiste en: un chip de micromatriz, un anticuerpo, una pluralidad de sondas, por ejemplo, sondas marcadas, un conjunto de componentes de secuenciación de transcriptasa inversa de ARN, y/o ARN o ADN, incluyendo ADNc, cebadores de amplificación, en el que las rutas de señalización celular comprenden una ruta de PI3K y una o más de una ruta de Wnt, una ruta de ER y una ruta de HH,
en el que:
los tres o más genes diana de PI3K se seleccionan del grupo que consiste en: AGRP, BCL2L11, BCL6, BNIP3, BTG1, CAT, CAV1, CCND1, CCND2, CCNG2, CDKN1A, CDKN1B, ESR1, FASLG, FBXO32, GADD45A, INSR, MXI1, NOS3, PCK1, POMC, PPARGC1A, PRDX3, RBL2, SOD2, TNFSF10,
y/o
los tres o más genes diana de Wnt se seleccionan del grupo que consiste en: CEMIP, AXIN2, CD44, RNF43, MYC, TBX3, TDGF1, SOX9, ASCL2, CXCL8, SP5, ZNRF3, EPHB2, LGR5, EPHB3, KLF6, CCND1, DEFA6 y FZD7,
y/o
los tres o más genes diana de ER se seleccionan del grupo que consiste en: CDH26, SGK3, PGR, GREB1, CA12, XBP1, CELSR2, WISP2, DSCAM, ERBB2, CTSD, TFF1, PDZK1, IGFBP4, ESR1, SOD1, AP1B1 y NRIP1,
y/o
los tres o más genes diana de HH se seleccionan del grupo que consiste en: GLI1, PTCH1, PTCH2, IGFBP6, SPP1, CCND2, FST, FOXL1, CFLAR, TSC22D1, RAB34, S100A9, S100A7, MYCN, FOXM1, GLI3, TCEA2, FYN y CTSL1.
ES15785099T 2014-10-24 2015-10-26 Pronóstico médico y predicción de la respuesta al tratamiento usando las actividades de múltiples rutas de señalización celular Active ES2857953T3 (es)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
EP14190273 2014-10-24
PCT/EP2015/074701 WO2016062892A1 (en) 2014-10-24 2015-10-26 Medical prognosis and prediction of treatment response using multiple cellular signaling pathway activities

Publications (1)

Publication Number Publication Date
ES2857953T3 true ES2857953T3 (es) 2021-09-29

Family

ID=51846475

Family Applications (1)

Application Number Title Priority Date Filing Date
ES15785099T Active ES2857953T3 (es) 2014-10-24 2015-10-26 Pronóstico médico y predicción de la respuesta al tratamiento usando las actividades de múltiples rutas de señalización celular

Country Status (8)

Country Link
US (1) US11640845B2 (es)
EP (1) EP3210143B1 (es)
JP (1) JP7065609B6 (es)
CN (1) CN108064311B (es)
AU (1) AU2015334841B2 (es)
CA (1) CA2965217A1 (es)
ES (1) ES2857953T3 (es)
WO (1) WO2016062892A1 (es)

Families Citing this family (30)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10925889B2 (en) 2014-05-12 2021-02-23 Gholam A. Peyman Method of treating, reducing, or alleviating a medical condition in a patient
US11045352B2 (en) * 2014-05-12 2021-06-29 Gholam A. Peyman Methods for treatment of dry eye and other acute or chronic inflammatory processes
US11648261B2 (en) 2014-05-12 2023-05-16 Gholam A. Peyman Method of treating, reducing, or alleviating a medical condition in a patient
RU2019100441A (ru) * 2016-06-13 2020-07-14 Конинклейке Филипс Н.В. Способ логического вывода об активности транскрипционного фактора пути сигнальной трансдукции у субъекта
US10621236B2 (en) * 2016-09-16 2020-04-14 At&T Intellectual Property I, L.P. Concept based querying of graph databases
EP3763732A1 (en) * 2016-11-25 2021-01-13 Koninklijke Philips N.V. Method to distinguish tumor suppressive foxo activity from oxidative stress
EP3431582A1 (en) 2017-07-18 2019-01-23 Koninklijke Philips N.V. Cell culturing materials
US20190051389A1 (en) * 2017-08-11 2019-02-14 Eric Meittunen Primary care patient panel management
EP3462348A1 (en) * 2017-09-28 2019-04-03 Koninklijke Philips N.V. Bayesian inference
JP7257405B2 (ja) * 2017-10-02 2023-04-13 コーニンクレッカ フィリップス エヌ ヴェ 免疫細胞型及び免疫応答の機能状況の決定
EP3503118A1 (en) * 2017-12-21 2019-06-26 Koninklijke Philips N.V. Methods and apparatus for reducing risk to a subject undergoing radiotherapy-based treatment
CN110557808A (zh) * 2018-06-01 2019-12-10 北京嘀嘀无限科技发展有限公司 Tbox控制方法、装置及设备
CN109243535A (zh) * 2018-09-13 2019-01-18 河南财经政法大学 同步编程模型Hama BSP下基于蝶形网络的双聚类挖掘方法
CN109439753B (zh) * 2018-11-28 2022-05-06 四川大学华西医院 检测基因表达水平的试剂的应用以及乳腺癌患者nac疗效预测模型的构建方法
US20220117920A1 (en) * 2019-02-14 2022-04-21 University Of Kentucky Research Foundation N-Aryl Benzenesulfonamides as Protonophores for the Treatment of Cancers, Metabolic Diseases and Traumatic Brain Injury
US11707518B2 (en) 2019-04-28 2023-07-25 Gholam A. Peyman Method of treating, reducing, or alleviating a medical condition in a patient
CN113785075A (zh) 2019-05-03 2021-12-10 皇家飞利浦有限公司 高级别浆液性卵巢癌的预后方法
EP3812474A1 (en) 2019-10-22 2021-04-28 Koninklijke Philips N.V. Methods of prognosis in high-grade serous ovarian cancer
EP3739588A1 (en) 2019-05-13 2020-11-18 Koninklijke Philips N.V. Assessment of multiple signaling pathway activity score in airway epithelial cells to predict airway epithelial abnormality and airway cancer risk
EP3882363A1 (en) 2020-03-17 2021-09-22 Koninklijke Philips N.V. Prognostic pathways for high risk sepsis patients
EP4136261A1 (en) 2020-04-16 2023-02-22 InnoSIGN B.V. Prognostic pathways for viral infections
EP3978628A1 (en) 2020-10-01 2022-04-06 Koninklijke Philips N.V. Prognostic pathways for viral infections
EP3940704A1 (en) 2020-07-14 2022-01-19 Koninklijke Philips N.V. Method for determining the differentiation state of a stem cell
EP3965119A1 (en) 2020-09-04 2022-03-09 Koninklijke Philips N.V. Methods for estimating heterogeneity of a tumour based on values for two or more genome mutation and/or gene expression related parameter, as well as corresponding devices
EP3974540A1 (en) 2020-09-25 2022-03-30 Koninklijke Philips N.V. Method for predicting immunotherapy resistance
US20230416831A1 (en) * 2020-12-07 2023-12-28 Foundation Medicine, Inc. Comprehensive genomic profiling (cgp) of metastatic invasive lobular carcinomas reveals heterogeneity
EP4015651A1 (en) 2020-12-17 2022-06-22 Koninklijke Philips N.V. Treatment prediction and effectiveness of anti-tnf alpha treatment in ibd patients
CN112646864A (zh) * 2020-12-30 2021-04-13 杭州联川基因诊断技术有限公司 一种检测esr1基因表达的引物、探针、试剂盒和检测方法
EP4039825A1 (en) 2021-02-09 2022-08-10 Koninklijke Philips N.V. Comparison and standardization of cell and tissue culture
JP2024514404A (ja) 2021-03-11 2024-04-02 コーニンクレッカ フィリップス エヌ ヴェ 高リスク敗血症患者のための予後経路

Family Cites Families (52)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4711955A (en) 1981-04-17 1987-12-08 Yale University Modified nucleotides and methods of preparing and using same
US6004761A (en) 1986-11-19 1999-12-21 Sanofi Method for detecting cancer using monoclonal antibodies to new mucin epitopes
US5660985A (en) 1990-06-11 1997-08-26 Nexstar Pharmaceuticals, Inc. High affinity nucleic acid ligands containing modified nucleotides
US5436134A (en) 1993-04-13 1995-07-25 Molecular Probes, Inc. Cyclic-substituted unsymmetrical cyanine dyes
US5658751A (en) 1993-04-13 1997-08-19 Molecular Probes, Inc. Substituted unsymmetrical cyanine dyes with selected permeability
US5545531A (en) 1995-06-07 1996-08-13 Affymax Technologies N.V. Methods for making a device for concurrently processing multiple biological chip assays
US6720149B1 (en) 1995-06-07 2004-04-13 Affymetrix, Inc. Methods for concurrently processing multiple biological chip assays
US6146897A (en) 1995-11-13 2000-11-14 Bio-Rad Laboratories Method for the detection of cellular abnormalities using Fourier transform infrared spectroscopy
US6391550B1 (en) 1996-09-19 2002-05-21 Affymetrix, Inc. Identification of molecular sequence signatures and methods involving the same
NZ516848A (en) 1997-06-20 2004-03-26 Ciphergen Biosystems Inc Retentate chromatography apparatus with applications in biology and medicine
US6308170B1 (en) 1997-07-25 2001-10-23 Affymetrix Inc. Gene expression and evaluation system
US6953662B2 (en) 1997-08-29 2005-10-11 Human Genome Sciences, Inc. Follistatin-3
US6020135A (en) 1998-03-27 2000-02-01 Affymetrix, Inc. P53-regulated genes
US6884578B2 (en) 2000-03-31 2005-04-26 Affymetrix, Inc. Genes differentially expressed in secretory versus proliferative endometrium
JP2004536276A (ja) 2000-11-16 2004-12-02 シファーゲン バイオシステムズ, インコーポレイテッド 質量スペクトルを分析する方法
WO2002079491A2 (en) 2001-02-16 2002-10-10 Ciphergen Biosystems, Inc. Method for correlating gene expression profiles with protein expression profiles
DK2258872T3 (da) 2002-03-13 2013-11-18 Genomic Health Inc Genekspressionsprofilering i biopsier af tumorvæv
US7097976B2 (en) 2002-06-17 2006-08-29 Affymetrix, Inc. Methods of analysis of allelic imbalance
EP1570080A4 (en) 2002-11-15 2006-03-01 Genomic Health Inc GENE EXPRESSION PROFILING OF EGFR-POSITIVE CANCER DISEASE
US20040231909A1 (en) 2003-01-15 2004-11-25 Tai-Yang Luh Motorized vehicle having forward and backward differential structure
EP3170906B1 (en) 2003-06-24 2018-08-22 Genomic Health, Inc. Prediction of likelihood of cancer recurrence
WO2005008213A2 (en) 2003-07-10 2005-01-27 Genomic Health, Inc. Expression profile algorithm and test for cancer prognosis
CA2563074C (en) 2004-04-09 2014-05-20 Genomic Health, Inc. Gene expression markers for predicting response to chemotherapy
PL1836629T3 (pl) 2004-11-05 2020-06-15 Genomic Health, Inc. Przewidywanie odpowiedzi na chemioterapię z zastosowaniem markerów ekspresji genu
US7754861B2 (en) 2005-03-23 2010-07-13 Bio-Rad Laboratories, Inc. Method for purifying proteins
US20060234911A1 (en) 2005-03-24 2006-10-19 Hoffmann F M Method of reversing epithelial mesenchymal transition
CA2608359A1 (en) * 2005-05-13 2006-11-23 Duke University Gene expression signatures for oncogenic pathway deregulation
KR100806274B1 (ko) 2005-12-06 2008-02-22 한국전자통신연구원 멀티 쓰레디드 프로세서 기반의 병렬 시스템을 위한 적응형실행 방법
EP1974058B1 (en) 2006-01-11 2014-06-11 Genomic Health, Inc. Gene expression markers for colorectal cancer prognosis
WO2007123772A2 (en) 2006-03-31 2007-11-01 Genomic Health, Inc. Genes involved in estrogen metabolism
US8518639B2 (en) 2006-04-11 2013-08-27 Bio-Rad Innovations HPV detection and quantification by real-time multiplex amplification
CA2680591A1 (en) * 2007-03-15 2008-09-25 Genomic Health, Inc. Gene expression markers for prediction of patient response to chemotherapy
US7816084B2 (en) 2007-11-30 2010-10-19 Applied Genomics, Inc. TLE3 as a marker for chemotherapy
US8067178B2 (en) 2008-03-14 2011-11-29 Genomic Health, Inc. Gene expression markers for prediction of patient response to chemotherapy
US20110053804A1 (en) 2008-04-03 2011-03-03 Sloan-Kettering Institute For Cancer Research Gene Signatures for the Prognosis of Cancer
AU2009268659A1 (en) 2008-07-08 2010-01-14 Genomic Health, Inc. Gene expression profiling for predicting the survivability of prostate cancer subjects
CN102272325B (zh) 2008-11-17 2015-07-22 威拉赛特公司 用于疾病诊断的分子表达谱的方法和组合物
US8765383B2 (en) 2009-04-07 2014-07-01 Genomic Health, Inc. Methods of predicting cancer risk using gene expression in premalignant tissue
SG175832A1 (en) * 2009-05-01 2011-12-29 Genomic Health Inc Gene expression profile algorithm and test for likelihood of recurrence of colorectal cancer and response to chemotherapy
EP2460005A4 (en) 2009-07-31 2012-11-21 Translational Genomics Res Inst METHOD FOR ASSESSING A CANCER PROGRESSION RISK
US8451450B2 (en) 2009-09-14 2013-05-28 Bio-Rad Laboratories, Inc. Near real time optical phase conjugation
WO2011146619A2 (en) 2010-05-19 2011-11-24 The Regents Of The University Of California Systems and methods for identifying drug targets using biological networks
US8703736B2 (en) 2011-04-04 2014-04-22 The Translational Genomics Research Institute Therapeutic target for pancreatic cancer cells
US9970057B2 (en) * 2011-05-06 2018-05-15 Albert Einstein College Of Medicine, Inc. Human invasion signature for prognosis of metastatic risk
US9458510B2 (en) 2011-06-27 2016-10-04 Mietamark Genetics, Inc. Signatures and determinants associated with prostate cancer progression and methods of use thereof
EP2549399A1 (en) 2011-07-19 2013-01-23 Koninklijke Philips Electronics N.V. Assessment of Wnt pathway activity using probabilistic modeling of target gene expression
CA2856295A1 (en) * 2011-11-18 2013-05-23 Vanderbilt University Markers of triple-negative breast cancer and uses thereof
US9324927B2 (en) 2011-12-08 2016-04-26 Koninklijke Philips N.V. Semiconductor light emitting device with thick metal layers
MX351626B (es) 2012-01-31 2017-10-23 Genomic Health Inc Algoritmo de perfil de expresion genica y prueba para determinar la prognosis de cancer de prostata.
CN111961726A (zh) 2012-12-26 2020-11-20 皇家飞利浦有限公司 使用靶基因表达的线性组合评价细胞信号传导途径活性
WO2014174003A1 (en) 2013-04-26 2014-10-30 Koninklijke Philips N.V. Medical prognosis and prediction of treatment response using multiple cellular signalling pathway activities
CA2923092C (en) 2014-01-03 2019-12-17 Koninklijke Philips N.V. Assessment of the pi3k cellular signaling pathway activity using mathematical modelling of target gene expression

Also Published As

Publication number Publication date
JP7065609B2 (ja) 2022-05-12
EP3210143A1 (en) 2017-08-30
US11640845B2 (en) 2023-05-02
CA2965217A1 (en) 2016-04-28
EP3210143B1 (en) 2020-12-09
AU2015334841A1 (en) 2017-06-15
WO2016062892A1 (en) 2016-04-28
US20160117443A1 (en) 2016-04-28
CN108064311A (zh) 2018-05-22
JP7065609B6 (ja) 2022-06-06
AU2015334841B2 (en) 2022-02-03
CN108064311B (zh) 2022-10-28
JP2018502553A (ja) 2018-02-01

Similar Documents

Publication Publication Date Title
ES2857953T3 (es) Pronóstico médico y predicción de la respuesta al tratamiento usando las actividades de múltiples rutas de señalización celular
ES2838923T3 (es) Pronóstico médico y predicción de la respuesta a tratamiento usando múltiples actividades de la ruta de señalización celular
US20220259666A1 (en) Assessment of the p13k cellular signaling pathway activity using mathematical modelling of target gene expression
ES2833543T3 (es) Evaluación de la actividad de la ruta de señalización celular de TGF usando modelos matemáticos de la expresión de genes diana
JP7186700B2 (ja) 腫瘍抑制foxo活性を酸化ストレスから区別する方法
EP3372695B1 (en) Medical prognosis and prediction of treatment response using multiple cellular signaling pathway activities
ES2878196T3 (es) Evaluación de la actividad de la vía de señalización celular mediante el uso de una o más combinaciones lineales de expresiones de genes diana
JP6704861B2 (ja) 癌処置のための個別化三剤治療を選択するための方法
ES2946681T3 (es) Genes y firmas génicas para el diagnóstico y tratamiento del melanoma