ES2700617T3 - Evaluación de la actividad de la ruta de señalización celular utilizando un modelo probabilístico de la expresión del gen objetivo - Google Patents

Evaluación de la actividad de la ruta de señalización celular utilizando un modelo probabilístico de la expresión del gen objetivo Download PDF

Info

Publication number
ES2700617T3
ES2700617T3 ES16192584T ES16192584T ES2700617T3 ES 2700617 T3 ES2700617 T3 ES 2700617T3 ES 16192584 T ES16192584 T ES 16192584T ES 16192584 T ES16192584 T ES 16192584T ES 2700617 T3 ES2700617 T3 ES 2700617T3
Authority
ES
Spain
Prior art keywords
tissue
activity
target genes
wnt
medical subject
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
ES16192584T
Other languages
English (en)
Inventor
Wilhelmus Verhaegh
De Stolpe Anja Van
Ooijen Hendrik Jan Van
Kalyana Dulla
De Inda Marcia Alves
Ralf Hoffmann
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Koninklijke Philips NV
Original Assignee
Koninklijke Philips NV
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Koninklijke Philips NV filed Critical Koninklijke Philips NV
Application granted granted Critical
Publication of ES2700617T3 publication Critical patent/ES2700617T3/es
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6809Methods for determination or identification of nucleic acids involving differential detection
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6876Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
    • C12Q1/6883Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material
    • C12Q1/6886Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material for cancer
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N5/00Computing arrangements using knowledge-based models
    • G06N5/04Inference or reasoning models
    • G06N5/048Fuzzy inferencing
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B20/00ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B20/00ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
    • G16B20/20Allele or variant detection, e.g. single nucleotide polymorphism [SNP] detection
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B20/00ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
    • G16B20/30Detection of binding sites or motifs
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B25/00ICT specially adapted for hybridisation; ICT specially adapted for gene or protein expression
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B40/00ICT specially adapted for biostatistics; ICT specially adapted for bioinformatics-related machine learning or data mining, e.g. knowledge discovery or pattern finding
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B40/00ICT specially adapted for biostatistics; ICT specially adapted for bioinformatics-related machine learning or data mining, e.g. knowledge discovery or pattern finding
    • G16B40/20Supervised data analysis
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B5/00ICT specially adapted for modelling or simulations in systems biology, e.g. gene-regulatory networks, protein interaction networks or metabolic networks
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B5/00ICT specially adapted for modelling or simulations in systems biology, e.g. gene-regulatory networks, protein interaction networks or metabolic networks
    • G16B5/20Probabilistic models
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/106Pharmacogenomics, i.e. genetic variability in individual responses to drugs and drug metabolism
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/112Disease subtyping, staging or classification
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/158Expression markers

Landscapes

  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Chemical & Material Sciences (AREA)
  • Biotechnology (AREA)
  • General Health & Medical Sciences (AREA)
  • Biophysics (AREA)
  • Medical Informatics (AREA)
  • Theoretical Computer Science (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Molecular Biology (AREA)
  • Evolutionary Biology (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Analytical Chemistry (AREA)
  • Genetics & Genomics (AREA)
  • Organic Chemistry (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Data Mining & Analysis (AREA)
  • Immunology (AREA)
  • Software Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Evolutionary Computation (AREA)
  • Artificial Intelligence (AREA)
  • Physiology (AREA)
  • Microbiology (AREA)
  • Biochemistry (AREA)
  • Bioethics (AREA)
  • Public Health (AREA)
  • Epidemiology (AREA)
  • Databases & Information Systems (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Pathology (AREA)
  • Probability & Statistics with Applications (AREA)
  • Hospice & Palliative Care (AREA)
  • Oncology (AREA)
  • Mathematical Physics (AREA)

Abstract

Un método que comprende: inferir la actividad de una o más rutas de señalización celular en tejido de un sujeto médico con base al menos en el nivel o niveles (20) de expresión de uno o más genes objetivo de las rutas de señalización celular medidos en una muestra extraída del tejido del sujeto médico, en donde la inferencia comprende: inferir la actividad de las rutas de señalización celular en el tejido del sujeto médico evaluando al menos una porción de un modelo probabilístico (40-1, ..., 40-7), preferiblemente una red Bayesiana (40-1, ..., 40-7), que representan las rutas de señalización celular para un conjunto de entradas que incluyen al menos los niveles (20) de expresión del uno o más genes objetivo de las rutas de señalización celular medidas en la muestras extraída del tejido del sujeto médico; estimar un nivel (46) en el tejido del sujeto médico de al menos un elemento de factor de transcripción (TF), el al menos un elemento TF que controla la transcripción del uno o más genes objetivo de las rutas de señalización celular, estando basada la estimación al menos en parte en probabilidades condicionales que relacionan el al menos un elemento TF y los niveles (20) de expresión de uno o más genes objetivo de las rutas de señalización celular medidas en la muestra extraída del tejido del sujeto médico; e inferir la actividad de la ruta de señalización celular con base en el nivel estimado en la muestra de tejido del elemento de factor de transcripción; en el que la inferencia se realiza mediante un dispositivo (12) de procesamiento digital que utiliza el modelo probabilístico (40-1, ..., 40-7) de las rutas de señalización celular,

Description

DESCRIPCIÓN
Evaluación de la actividad de la ruta de señalización celular utilizando un modelo probabilístico de la expresión del gen objetivo
El objeto descrito en el presente documento se refiere principalmente a bioinformática, a técnicas de procesamiento genómico, a técnicas de procesamiento proteómico y a técnicas relacionadas.
Los análisis genómicos y proteómicos tienen perspectivas sustanciales realizadas y potenciales para la aplicación clínica en campos médicos tales como la oncología, donde se sabe que diversos cánceres están asociados con combinaciones específicas de mutaciones/variaciones genómicas y/o niveles de expresión altos o bajos para genes específicos, que juegan un papel en el crecimiento y la evolución del cáncer, por ejemplo proliferación celular y metástasis. Por ejemplo, la ruta de señalización de Wnt afecta a la regulación de la proliferación celular, y está altamente regulada. La alta actividad de la ruta Wnt debida a la pérdida de la regulación se ha correlacionado con el cáncer, entre ellos con tumores malignos de colon. Sin limitación a ninguna teoría en particular de operación, se cree que la desregulación de la ruta Wnt en células de colon maligno conduce a la alta actividad de la ruta Wnt que a su vez provoca la proliferación celular de las células malignas de colon, es decir, la propagación del cáncer de colon. Por otro lado, la actividad anormalmente baja de la ruta también podría ser de interés, por ejemplo en el caso de la osteoporosis.
Las tecnologías para la adquisición de datos genómicos y proteómicos se han hecho fácilmente disponibles en entornos clínicos. Por ejemplo, las mediciones por microarreglos se emplean rutinariamente para evaluar los niveles de expresión génica, niveles de proteína, metilación, y así sucesivamente. La secuenciación automatizada de genes permite una identificación efectiva en costes de las variaciones genéticas en ADN y ARNm. La evaluación cuantitativa de los niveles de ARNm durante la secuenciación de genes promete ser otra herramienta clínica para evaluar los niveles de expresión génica.
A pesar de (o, tal vez, debido a) estos avances, la aplicación clínica de los análisis genómicos y proteómicos se enfrenta a un obstáculo sustancial: la sobrecarga de datos. Por ejemplo, el número de mutaciones identificables en una sola muestra clínica puede ser de cientos o miles. Muchas de estas mutaciones son denominadas mutaciones circunstantes sin una contribución específica al crecimiento del cáncer, y solo unas pocas contribuyen al crecimiento del cáncer y a la evolución funcional, y éstas presentan las dianas para un tratamiento eficaz. Un microarreglo único puede generar niveles de expresión génica para decenas de miles de genes. El procesamiento de estas grandes cantidades de datos para identificar información clínicamente útil, como por ejemplo en la aplicación de la elección de la terapia adecuada, es difícil.
Un enfoque consiste en limitar el análisis a unas pocas pruebas canónicas o estandarizadas, como las pruebas aprobadas por la U.S. Food and Drug Administration (FDA). En este enfoque, se detecta un indicador específico o una combinación de indicadores (por ejemplo, mutaciones y/o niveles de expresión génica altos o bajos especificados) para probar como "positivo" para la condición de enfermedad indicada (por ejemplo, un tipo particular de cáncer). La prueba canónica es apoyada por estudios clínicos que han demostrado una fuerte correlación con la condición de la enfermedad o con la eficacia del tratamiento. Este enfoque es útil solo para aquellas condiciones clínicas para las que se ha desarrollado una prueba canónica, por ejemplo el diagnóstico específico de una enfermedad o la predicción de la respuesta a un fármaco en un tipo específico de cáncer en una etapa específica, y también es rígida, ya que solo es aplicable para las condiciones canónicas.
Otro enfoque se basa en la identificación de grupos funcionalmente relacionados de indicadores genómicos o proteómicos. Por ejemplo, la ruta Wnt comprende una cascada de reacciones proteómicas. Los componentes principales de esta cadena incluyen (pero no se limitan a) la unión de la proteína de señalización Wnt a un receptor de superficie rizado de la célula que provoca la activación de proteínas de la familia de proteínas Dsh que a su vez afectan el nivel de agentes de transcripción tales como p-catenina/TCF4 en el núcleo celular. Estos agentes de transcripción, a su vez, controlan la transcripción de moléculas de ARNm objetivo que a su vez se traducen en proteínas objetivo de la ruta Wnt. Los estudios clínicos han mostrado algunas correlaciones entre las proteínas reguladoras de la ruta Wnt y la actividad de la ruta Wnt.
Sin embargo, la aplicación de tales resultados del estudio clínico para el diagnóstico y la evaluación clínica de un paciente específico es difícil debido a la complejidad de las rutas de señalización, por ejemplo, el camino Wnt. Como un ejemplo simple, la medición del nivel de expresión de una proteína que está "corriente arriba" en la ruta Wnt puede no detectar el comportamiento anormal de una proteína que está "corriente abajo" en la ruta Wnt. Se cree que la ruta Wnt incluye numerosos mecanismos de retroalimentación y el concepto simplificado de "corriente arriba" y "corriente abajo" puede ser inaplicable para una porción sustancial de la ruta Wnt; más generalmente, el comportamiento anormal en una porción de la cascada de proteínas que comprende la ruta Wnt puede tener más o menos efecto sobre otras porciones de la cascada de proteínas y sobre la actividad de la ruta Wnt en su conjunto. Además, en algunos estudios clínicos, los niveles de expresión de proteína para las proteínas reguladoras de la cascada de señalización se evalúan midiendo los niveles de expresión de ARNm de los genes que codifican para las proteínas reguladoras. Esta es una medida indirecta que puede no evaluar con precisión el nivel de expresión de la proteína reguladora, y casi nunca refleja la cantidad de proteínas activas (después de una modificación postraducción específica como la fosforilación).
Charles J. Vaske et al., " Interference of patient-specific pathway activities from multi-dimensional cancer genomics data using PARADIGM", Bioinformatics, Vol. 26, No. 12, Junio de 2010, páginas i237 a i245 divulga un método para inferir actividades genéticas específicas del paciente que incorporan interacciones de rutas curadas entre genes. Un gen es modelado por un gráfico de factores como un conjunto de variables interconectadas que codifican la expresión y la actividad conocida de un gen y sus productos, permitiendo la incorporación de muchos tipos de datos ómicos como evidencia. El método predice el grado en que las actividades de una ruta (por ejemplo, estados génicos internos, interacciones o "salidas" de alto nivel) se alteran en el paciente utilizando la inferencia probabilística.
El principal problema subyacente a la presente invención era por lo tanto proporcionar métodos y medios adecuados para realizar análisis genómicos y, respectivamente, proteómicos. Los aspectos específicos del problema subyacente, así como otras objeciones relacionadas con la presente invención, se hacen evidentes cuando se estudia la descripción, los ejemplos proporcionados aquí y, en particular, cuando se estudian las reivindicaciones adjuntas.
La presente invención proporciona métodos y aparatos nuevos y mejorados como se describe en el presente documento.
De acuerdo con un aspecto principal de la presente invención, el problema anterior se resuelve mediante un método específico para evaluar la actividad de la ruta de señalización celular utilizando un modelo probabilístico de expresión génica objetivo, a saber, un procedimiento que comprende:
actividad de inferencia de una o más rutas de señalización celular en el tejido de un sujeto médico con base al menos en el nivel o niveles de expresión (en particular en el nivel de ARNm y/o proteína) de uno o más genes objetivo de las rutas de señalización celular medida en una muestra extraída del tejido del sujeto médico, en la que la inferencia comprende:
inferir la actividad de la(s) ruta(s) de señalización celular en el tejido del sujeto médico mediante la evaluación de al menos una porción de un modelo probabilístico, preferiblemente una red bayesiana, que representa las rutas de señalización celular para un conjunto de entradas que incluyen al menos el nivel o niveles de expresión de uno o más genes objetivo de las rutas de señalización celular medida en la muestra extraída del tejido del sujeto médico;
estimar un nivel en el tejido del sujeto médico de al menos un elemento de factor de transcripción (TF), controlando el al menos un elemento Tf la transcripción del uno o más genes objetivo de las rutas de señalización celular, con base al menos en parte en probabilidades condicionales que relacionan al menos un elemento TF y el nivel o niveles de expresión del uno o más genes objetivo de las rutas de señalización celular medido en la muestra extraída del tejido del sujeto médico; y
inferir la actividad de la ruta de señalización celular con base en el nivel estimado en la muestra de tejido del elemento de factor de transcripción;
en el que la inferencia se realiza mediante un dispositivo de procesamiento digital que utiliza el modelo probabilístico de la(s) ruta(s) de señalización celular,
El "gen o genes objetivo" pueden ser "genes objetivo directos" y/o "genes objetivo indirectos" (como se describe en el presente documento).
Preferiblemente, la inferencia comprende estimar un nivel en el tejido del sujeto médico de al menos un elemento de factor de transcripción (TF) representado por un nodo TF del modelo probabilístico, controlando el elemento TF la transcripción del uno o más genes objetivo de la ruta de señalización celular, estando basada la estimación al menos en parte en probabilidades condicionales del modelo probabilístico que relaciona el nodo TF y los nodos en el modelo probabilístico que representa el uno o más genes objetivo de las rutas de señalización celular medida en la muestra extraída del tejido del sujeto médico.
El modelo probabilístico puede ser un modelo de red Bayesiana. De este modo, de acuerdo con una realización preferida, la inferencia se lleva a cabo utilizando una red Bayesiana que comprende nodos que representan información sobre las rutas de señalización y relaciones de probabilidad condicional entre nodos conectados de la red Bayesiana.
Las rutas de señalización celular pueden ser una ruta Wnt, una ruta ER (receptor de estrógeno), una ruta AR (receptor de andrógeno) y/o una ruta Hedgehog. Por lo tanto, de acuerdo con una realización preferida, las rutas de señalización celular comprenden una ruta Wnt, una ruta ER, una ruta AR y/o una ruta Hedgehog.
Los genes objetivo particularmente adecuados se describen en los siguientes pasajes de texto, así como en los ejemplos a continuación (véase, por ejemplo, las Tablas 1- 9).
De este modo, de acuerdo con una realización preferida, el gen o genes objetivo se seleccionan del grupo que comprende o consiste en los genes objetivo enumerados en la Tabla 1 o Tabla 6 (para la ruta Wnt), los genes objetivo enumerados en la Tabla 2, Tabla 5 o la Tabla 7 (para la ruta ER), los genes objetivo enumerados en la Tabla 3 o la Tabla 8 (para la ruta Hedgehog) y los genes objetivo enumerados en la Tabla 4 o la Tabla 9 (para la ruta AR).
Se prefiere particularmente un método en el que la inferencia comprende:
inferir la actividad de una ruta Wnt en el tejido del sujeto médico con base en al menos en los niveles de expresión de uno o más, preferiblemente al menos tres, genes de la ruta Wnt medidos en la muestra extraída del tejido del sujeto médico seleccionado del grupo que comprende o consiste en: KIAA1199, AXIN2, RNF43, TBX3, TDGF1, SOX9, ASCL2, IL8, SP5, ZNRF3, KLF6, CCND1, DEFA6 y FZD7.
Se prefiere además un método en el que la inferencia se basa adicionalmente en los niveles de expresión de al menos un gen objetivo de la ruta Wnt medidos en la muestra extraída del tejido del sujeto médico seleccionado del grupo que comprende o consiste en: NKD1, OAT, FAT1, LEF1, GLUL, REG1B, TCF7L2, COL18A1, BMP7, SLC1A2, ADRA2C, PPARG, DKK1, HNF1A y LECT2.
Particularmente preferido es un método en el que la inferencia (también) comprende:
inferir la actividad de una ruta ER en el tejido del sujeto médico con base en al menos en los niveles de expresión de uno o más, preferiblemente al menos tres genes objetivo de la ruta ER medidos en la muestra extraída del tejido del sujeto médico seleccionado del grupo que comprende o consiste en: CDH26, SGK3, PGR, GREB1, CA12, XBP1, CELSR2, WISP2, DSCAM, ERBB2, CTSD, TFF1 y NRIP1.
Se prefiere además un método, en el que la inferencia se basa adicionalmente en los niveles de expresión de al menos un gen objetivo de la ruta ER medidos en la muestra extraída del tejido del sujeto médico seleccionado del grupo que comprende o consiste en: AP1B1, ATP5J, COL18A1, COX7A2L, EBAG9, ESR1, HSPB1, IGFBP4, KRT19, MYC, NDUFV3, PISD, PRDM15, PTMA, RARA, SOD1 y TRIM25.
Un método en el que la inferencia (también) comprende
inferir la actividad de una ruta Hedgehog en el tejido del sujeto médico con base en al menos en los niveles de expresión de uno o más, preferiblemente al menos tres, genes objetivo de la ruta Hedgehog medidos en la muestra extraída del tejido del sujeto médico seleccionado del grupo que comprende o consiste en: GLI1, PTCH1, PTCH2, IGFBP6, SPP1, CCND2, FST, FOXL1, CFLAR, TSC22D1, RAB34, S100A9, S100A7, MYCN, FOXM1, GLI3, TCEA2, FYN y CTSL1, también se prefiere.
Se prefiere además un método, en el que la inferencia se basa adicionalmente en los niveles de expresión de al menos un gen objetivo de la ruta Hedgehog medidos en la muestra extraída del tejido del sujeto médico seleccionado del grupo que comprende o consiste en: BCL2, FOXA2, FOXF1, H19, HHIP, IL1R2, JAG2, JUP, MIF, MYLK, NKX2-2, NKX2-8, PITRM1 y TOM1.
Un método en el que la inferencia (también) comprende
inferir la actividad de una ruta AR en el tejido del sujeto médico con base en al menos en los niveles de expresión de uno o más, preferiblemente al menos tres, genes de la ruta AR medidos en la muestra extraída del tejido del sujeto médico seleccionado del grupo que comprende o consiste en: KLK2, PMEPA1, TMPRSS2, NKX3_1, Ab CC4, KLK3, FKBP5, ELL2, UGT2B15, DHCR24, PPAP2A, NDRG1, LRIG1, CREB3L4, LCP1, GUCY1A3, AR y EAF2, también se prefiere.
Se prefiere además un método en el que la inferencia se basa adicionalmente en los niveles de expresión de al menos un gen objetivo de la ruta AR medidos en la muestra extraída del tejido del sujeto médico seleccionado del grupo que comprende o consiste en: APP, NTS, PLAU, CDKN1A, DRG1, FGF8, IGF1, PRKACB, PTPN1, SGK1 y TACC2.
Se prefiere además un método, en el que el método comprende además:
determinar si las rutas de señalización celular está operando anormalmente en el tejido del sujeto médico con base en la actividad inferida de las rutas de señalización celular en el tejido del sujeto médico.
Otro aspecto de la presente invención se refiere a un método (como se describe en el presente documento), que comprende además:
recomendar la prescripción de un fármaco para el sujeto médico que corrige el funcionamiento anormal de las rutas de señalización celular;
en el que la recomendación se realiza solo si se determina que las rutas de señalización celular está funcionando anormalmente en el tejido del sujeto médico con base en la actividad inferida de las rutas de señalización celular. La presente invención se refiere también a un método (como se describe en el presente documento) que comprende: inferir la actividad de una ruta Wnt en tejido de un sujeto médico con base al menos en los niveles de expresión de dos, tres o más genes objetivo de un conjunto de genes objetivo de la ruta Wnt medida en una muestra extraída del tejido del sujeto médico
y/o
inferir la actividad de una ruta ER en tejido de un sujeto médico con base al menos en los niveles de expresión de dos, tres o más genes objetivo de un conjunto de genes objetivo de la ruta ER medida en una muestra extraída del tejido del sujeto médico
y/o
inferir la actividad de una ruta Hedgehog en el tejido de un sujeto médico con base al menos en los niveles de expresión de dos, tres o más genes objetivo de un conjunto de genes objetivo de la ruta Hedgehog medida en una muestra extraída del tejido del sujeto médico
y/o
inferir la actividad de una ruta AR en el tejido de un sujeto médico con base al menos en los niveles de expresión de dos, tres o más genes objetivo de un conjunto de genes objetivo de la ruta AR medida en una muestra extraída del tejido del sujeto médico.
Preferiblemente,
el conjunto de genes objetivo de la ruta Wnt incluye al menos nueve, preferiblemente todos los genes objetivo seleccionados del grupo que comprende o consiste en: KIAA1199, AXIN2, Rn F43, TBX3, TDGF1, SOX9, ASCL2, IL8, SP5, ZNRF3, KLF6, CCND1, DEFA6 y FZD7,
y/o
el conjunto de genes objetivo de la ruta ER incluye al menos nueve, preferiblemente todos los genes objetivo seleccionados del grupo que comprende o consiste en: CDH26, SGK3, Pg R, GREB1, CA12, XBP1, CELSR2, WISP2, DSCAM, ERBB2, CTSD, TFF1 y NRIP1,
y/o
el conjunto de genes objetivo de la ruta Hedgehog incluye al menos nueve, preferiblemente todos los genes objetivo seleccionados del grupo que comprende o que consiste en: GLI1, PTCH1, PTCH2, IGFBP6, SPP1, CCND2, FST, FOXL1, CFLAR, TSC22D1, RAB34, S100A9, S100A7, MYCN, FOXM1, GLI3, TCEA2, FYN y CTSL1,
y/o
el conjunto de genes objetivo de la ruta AR incluye al menos nueve, preferiblemente todos los genes objetivo seleccionados del grupo que comprende o consiste en: KLK2, PMEPA1, t Mp RSS2, NKX3-1, ABCC4, KLK3, FKBP5, ELL2, UGT2B15, DHCR24, PPAP2A, NDRG1, LRIG1, CREB3L4, LCP1, GUCY1A3, AR y EAF2.
Un método, en el que
el conjunto de genes objetivo de la ruta Wnt incluye además al menos un gen objetivo seleccionado del grupo que comprende o consiste en: NKD1, OAT, FAT1, LEF1, GLUL, REG1B, TCF7L2, COL18A1, BMP7, SLC1A2, ADRA2C, PPARG, DKK1, HNF1A y LECT2,
y/o
el conjunto de genes objetivo de la ruta ER incluye además al menos un gen objetivo seleccionado del grupo que comprende o consiste en: AP1B1, ATP5J, COL18A1, COX7A2L, EBAG9, ESR1, HSPB1, IGFBP4, KRT19, MYC, NDUFV3, PISD, PRDM15, PTMA, RARA, SOD1 y TRIM25,
y/o
el conjunto de genes objetivo de la ruta Hedgehog incluye además al menos un gen objetivo seleccionado del grupo que comprende o consiste en: BCL2, FOXA2, FOXF1, H19, HHIP, IL1R2, JAG2, JUP, MIF, MYLK, NKX2-2, NKX2-8, PITRM1 y TOM1,
y/o
se prefiere particularmente el conjunto de genes objetivo de la ruta AR que incluye además al menos un gen objetivo seleccionado del grupo que comprende o que consiste en: APP, NTS, PLAU, Cd Kn 1A, DRG1, FGF8, IGF1, PRKACB, PTPN1, SGK1 y TACC2.
La muestra o muestras para usar de acuerdo con la presente invención pueden ser, por ejemplo, una muestra obtenida a partir de una lesión de mama, o de un colon de un sujeto médico conocido por o sospechoso de tener cáncer de colon, o de un hígado de un sujeto médico conocido por o sospechoso de tener cáncer de hígado, etc., preferiblemente mediante un procedimiento de biopsia u otro procedimiento de extracción de muestras. El tejido del que se extrae una muestra puede ser también tejido metastásico, por ejemplo tejido maligno (sospechoso) procedente de colon, mama, hígado u otro órgano que se ha diseminado fuera del colon, la mama, el hígado u otro órgano. En algunos casos, la muestra de tejido puede ser células tumorales circulantes, es decir, células tumorales que han entrado en el torrente sanguíneo y pueden extraerse como la muestra de tejido extraída usando técnicas de aislamiento adecuadas.
Otro aspecto divulgado de la presente invención se refiere al uso de un medio de almacenamiento no transitorio tal como se describe en el presente documento o a un programa informático como se describe aquí para el diagnóstico específico de una enfermedad o la predicción de la respuesta a un fármaco en un tipo específico de cáncer en una etapa específica.
De acuerdo con otro aspecto divulgado, un aparato comprende un procesador digital configurado para realizar un método según la invención tal como se describe en el presente documento.
De acuerdo con otro aspecto divulgado, un medio de almacenamiento no transitorio almacena instrucciones que son ejecutables mediante un dispositivo de procesamiento digital para llevar a cabo un método según la invención tal como se describe en el presente documento. El medio de almacenamiento no transitorio puede ser un medio de almacenamiento legible por ordenador, tal como un disco duro u otro medio de almacenamiento magnético, un disco óptico u otro medio de almacenamiento óptico, una memoria de acceso aleatorio (RAM), memoria de solo lectura (ROM), memoria instantánea u otro medio de almacenamiento electrónico, un servidor de red, etc. El dispositivo de procesamiento digital puede ser un dispositivo de mano (por ejemplo, un asistente de datos personales o un teléfono inteligente), un ordenador portátil, un ordenador de escritorio, un ordenador o dispositivo de tableta, un servidor de red remoto, etc.
De acuerdo con otro aspecto divulgado, un programa de ordenador comprende medios de código de programa para hacer que un dispositivo de procesamiento digital realice un método de acuerdo con la invención tal como se describe en el presente documento. El dispositivo de procesamiento digital puede ser un dispositivo de mano (por ejemplo, un asistente de datos personales o un teléfono inteligente), un ordenador portátil, un ordenador de escritorio, un ordenador o dispositivo de tableta, un servidor de red remoto, etc.
Una ventaja reside en un sistema de soporte de decisión clínica (CDS) que proporciona recomendaciones clínicas con base en el análisis probabilístico de una o más rutas de señalización celular, por ejemplo utilizando un modelo de red Bayesiana de una ruta Wnt, una ruta ER, una ruta AR y/o una ruta Hedgehog.
Otra ventaja reside en una evaluación mejorada de la actividad de la ruta de señalización celular que es menos susceptible al error.
Otra ventaja reside en proporcionar un sistema CDS que recomiende un tratamiento dirigido para la pérdida de la regulación de una ruta de señalización celular.
Otra ventaja reside en proporcionar un sistema CDS que está diseñado para detectar la pérdida de regulación para una ruta de señalización celular particular, tal como una ruta Wnt, una ruta ER, una ruta a R o una ruta Hedgehog y se adapta fácilmente para proporcionar recomendaciones para diferentes tipos de cáncer obtenidas por esa ruta de señalización celular particular.
La presente invención tal como se describe en el presente documento puede, también ventajosamente, por ejemplo, utilizarse en conexión con
- diagnóstico con base en la actividad predicha (inferida);
- pronóstico con base en la actividad predicha (inferida);
- prescripción de fármacos con base en la actividad predicha (inferida);
- predicción de la eficacia del fármaco con base en la actividad predicha (inferida);
- predicción de efectos adversos con base en la actividad predicha (inferida);
- control de la eficacia de los fármacos;
- desarrollo de fármacos;
- desarrollo del ensayo;
- investigación de rutas;
- estadificación del cáncer;
- inscripción del sujeto en un ensayo clínico con base en la actividad predicha (inferida);
- selección de la prueba posterior por realizar, y/o;
- selección de pruebas de diagnóstico complementarias.
Otras ventajas resultarán evidentes para los expertos en la materia tras la lectura y comprensión de las figuras adjuntas, de la siguiente descripción y, en particular, de la lectura de los ejemplos detallados proporcionados más adelante.
La Figura 1 muestra una red Bayesiana simple que representa parte de una ruta de señalización celular. La ruta de señalización celular está simbolizada por un complejo de factor de transcripción (TF) y los genes objetivo producidos como resultado de la presencia del complejo de factor de transcripción. La relación probabilística entre el elemento TF y un gen objetivo en caso de discretización binaria puede representarse mediante una tabla de probabilidad condicional como se representa en el diagrama.
La Figura 2 muestra una red Bayesiana ilustrativa que describe una ruta de señalización celular hipotética. En el diagrama se representan tanto las proteínas corriente arriba como los nodos de ARNm objetivo corriente abajo. Las proteínas corriente arriba sirven como entrada en el complejo de factor de transcripción, mientras que los ARNm objetivo son los nodos de salida del complejo del factor de transcripción.
La Figura 3 muestra un ejemplo ilustrativo de una representación de red Bayesiana de una única ruta de señalización celular con complejo de múltiples factores de transcripción o múltiples rutas de señalización celular con su propio complejo de factor de transcripción combinado en una red Bayesiana o una combinación de las mismas.
La Figura 4 muestra un ejemplo de una red Bayesiana que ilustra una representación simple de una ruta de señalización celular similar a la Figura 1. Ahora se han unido otros nodos para representar la traducción del ARNm objetivo en proteínas objetivo.
La Figura 5 muestra un ejemplo de una red Bayesiana que ilustra otra representación simple de una ruta de señalización celular. La ruta se representa utilizando el factor de transcripción complejo y sus niveles de proteína objetivo.
La Figura 6 muestra la red Bayesiana ilustrativa de la Figura 1 con una capa adicional de nodos que representan los conjuntos de sondas en un chip de microarreglos que conecta las intensidades de las sondas con los correspondientes niveles de ARNm objetivo.
La Figura 7 muestra un ejemplo ilustrativo de una variante de realización de la red Bayesiana de la Figura 1 que incluye nodos que representan variaciones en metilación y número de copias como ejemplos para nodos de información adicionales para, en este ejemplo particular, cualquiera de los niveles de ARNm objetivo incluidos.
La Figura 8 muestra una actividad de la ruta de Wnt predicha de la red Bayesiana y el método de centroide más cercano como se describe aquí en un conjunto de datos de muestras de colon (GSE20916).
La Figura 9 muestra una actividad de la ruta de Wnt predicha de la red Bayesiana y el método de centroide más cercano como se describe aquí en un conjunto de datos de muestras de colon (GSE4183).
La Figura 10 muestra una actividad de la ruta de Wnt predicha de la red Bayesiana y el método de centroide más cercano como se describe aquí en un conjunto de datos de muestras de colon (GSE15960).
La Figura 11 muestra una actividad de la ruta de Wnt predicha de la red Bayesiana y el método de centroide más cercano como se describe aquí en un conjunto de datos de muestras de cáncer de mama (GSE12777).
La Figura 12 muestra una actividad de la ruta de Wnt predicha de la red Bayesiana y el método de centroide más cercano como se describe aquí en un conjunto de datos de muestras de cáncer de mama (GSE21653).
La Figura 13 muestra una actividad de la ruta de Wnt pronosticada de la red Bayesiana y el método de centroide más cercano como se describe aquí en un conjunto de datos de muestras de cáncer de hígado (GSE9843).
La Figura 14 muestra una actividad de la ruta de Wnt predicha utilizando una red Bayesiana usando los genes objetivo de la lista de curado de evidencia en comparación con los genes objetivo de la lista de literatura amplia como se describe en el presente documento en un conjunto de datos de muestras de colon (GSE20916).
La Figura 15 muestra una actividad de la ruta de Wnt predicha utilizando una red Bayesiana usando los genes objetivo de la lista de curado de evidencia en comparación con los genes objetivo de la lista de literatura amplia como se describe aquí en un conjunto de datos de muestras de colon (GSE4183).
La Figura 16 muestra una actividad de la ruta de Wnt predicha utilizando una red Bayesiana usando los genes objetivo de la lista de curado de evidencia en comparación con los genes objetivo de la lista de literatura amplia como se describe aquí en un conjunto de datos de muestras de colon (GSE15960).
La Figura 17 muestra una actividad de la ruta de Wnt predicha utilizando una red Bayesiana usando los genes objetivo de la lista de curado de evidencia en comparación con los genes objetivo de la lista de literatura amplia como se describe en el presente documento en un conjunto de datos de muestras de cáncer de mama (GSE12777).
La Figura 18 muestra una actividad de la ruta de Wnt predicha utilizando una red Bayesiana utilizando los genes objetivo de la lista de curado de evidencia en comparación con los genes objetivo de la lista de literatura amplia como se describe en el presente documento en un conjunto de datos de muestras de cáncer de hígado (GSE9843).
La Figura 19 muestra una actividad de la ruta de Wnt predicha utilizando una red Bayesiana utilizando los genes objetivo de la lista de curado de evidencia en comparación con los genes objetivo de la lista de literatura amplia como se describe en el presente documento en un conjunto de datos de muestras de meduloblastoma (GSE10327).
La Figura 20 muestra esquemáticamente un sistema de soporte de decisión clínica (CDS) configurado para evaluar una o más rutas de señalización celular tal como se describe aquí (ejemplar mostrado para la ruta Wnt).
La Figura 21 muestra una actividad prevista de la ruta de Wnt en muestras de colon de GSE4183.
La Figura 22 muestra una actividad prevista de la ruta Wnt en muestras de meduloblastoma de GSE10327.
La Figura 23 muestra una actividad prevista de la ruta Wnt en muestras de cáncer de hígado de GSE9843.
La Figura 24 muestra una actividad prevista de la ruta Wnt en líneas celulares de cáncer de mama de GSE12777. La Figura 25 muestra una actividad prevista de la ruta ER en las líneas celulares de cáncer de mama de GSE12777. La Figura 26 muestra una actividad prevista de la ruta ER en muestras de cáncer de mama de GSE12276.
La Figura 27 muestra una actividad prevista de la ruta ER en las líneas celulares de cáncer de GSE36133.
La Figura 28 muestra una actividad de la ruta prevista de Hedgehog en líneas celulares de cáncer de GSE34211. La Figura 29 muestra una actividad prevista de la ruta Hedgehog en muestras de meduloblastoma de GSE10327. La Figura 30 muestra una actividad prevista de la ruta Hedgehog en muestras de cáncer de mama de GSE12276. La Figura 31 muestra una actividad de ruta ER esperada en MCF7 y líneas de células resistentes a tamoxifeno de GSE21618.
La Figura 32 muestra una actividad predicha de la ruta ER en una serie temporal de muestras de células MCF7 estimuladas con estrógenos de GSE11324.
La Figura 33 muestra la actividad de la ruta Wnt, ER y Hedgehog en muestras de luminal A de GSE12276.
La Figura 34 muestra la actividad de las rutas Wnt, ER y Hedgehog en muestras basales de GSE12276.
La Figura 35 muestra una actividad prevista de la ruta Wnt en muestras de colon de GSE20916.
La Figura 36 muestra una actividad de la ruta ER esperada en líneas celulares MCF7 estimuladas con estrógeno (E2) o un control negativo (EtOH) (GSE9253).
La Figura 37 muestra las curvas de supervivencia de Kaplan-Meier de los pacientes del conjunto de datos GSE12276 agrupados de acuerdo con la actividad de la ruta.
La Figura 38 muestra una actividad de ruta AR predicha en líneas celulares LNCaP tratadas con diferentes regímenes de tratamiento de GSE7708.
La Figura 39 muestra una actividad predicha de ruta AR en muestras de cáncer de próstata de GSE17951.
La Figura 40 muestra una actividad de ruta AR predicha en muestras de cáncer de mama de GSE12276.
La Figura 41 muestra una actividad de ruta AR predicha en el conjunto de datos GSE36133 que contiene muestras de líneas celulares que representan diversos tipos de cáncer.
La Figura 42 muestra una actividad de ruta AR predicha en el conjunto de datos GSE34211 que contiene muestras de líneas celulares que representan diversos tipos de cáncer.
Los siguientes ejemplos solamente ilustran métodos y aspectos particularmente preferidos seleccionados en conexión con los mismos. La enseñanza proporcionada en los mismos puede ser usada para construir varios ensayos y/o kits, por ejemplo para detectar, predecir y/o diagnosticar la actividad anormal de una o más rutas de señalización celular. Además, al utilizar métodos como se describen aquí, se puede guiar ventajosamente la prescripción de fármacos, se puede predecir el fármaco y monitorizar la eficacia (y/o efectos adversos) del fármaco, se puede predecir y controlar la resistencia a fármacos, por ejemplo para seleccionar las pruebas posteriores por realizar (como una prueba de diagnóstico complementaria). Los siguientes ejemplos no deben interpretarse como limitativos del alcance de la presente invención.
Ejemplo 1: Construcción de la red Bayesiana
Tal como se describe en el presente documento, construyendo un modelo probabilístico (por ejemplo, el modelo Bayesiano ilustrativo mostrado en la Figura 6) e incorporando relaciones probabilísticas condicionales entre los niveles de expresión de un número de diferentes genes objetivo y la actividad de la ruta de señalización celular, tal modelo puede usarse para determinar la actividad de la ruta de señalización celular con un alto grado de precisión. Además, el modelo probabilístico puede actualizarse fácilmente para incorporar conocimientos adicionales obtenidos en estudios clínicos posteriores, ajustando las probabilidades condicionales y/o añadiendo nuevos nodos al modelo para representar fuentes de información adicionales. De esta manera, el modelo probabilístico puede ser actualizado como apropiado para incorporar el conocimiento médico más reciente.
Uno de los modelos de red Bayesiana más simples para representar una ruta de señalización celular sería un modelo de dos niveles que incluyera el elemento de factor de transcripción y los genes objetivo asociados (véase la Figura 1). El elemento complejo del factor de transcripción es una representación del nivel del complejo del factor de transcripción. El nivel de proteína del elemento de factor de transcripción está conectado a un número de niveles de ARNm de los genes objetivo del factor de transcripción (en esta red Bayesiana ejemplar solo se representan tres genes objetivo que se sabe que se expresan en el tejido en caso de que el factor de transcripción esté disponible). Debe entenderse que muchos, la mayoría o todos los genes objetivo de la ruta (en el caso de las rutas Wnt, ER, Hedgehog y AR particularmente los genes objetivo mencionados en Tabla 1, Tabla 2, Tabla 3 y Tabla 4 respectivamente) son regulados de manera análoga por el elemento TF. Las relaciones entre el nivel del elemento TF y los niveles de ARNm de los genes objetivo se modelan en la red Bayesiana por los bordes. Para cada uno de los genes objetivo, una distribución probabilística condicional especifica cómo el nivel de ARNm del gen depende del nivel del elemento TF.
Los niveles del elemento TF y los genes objetivo pueden estar representados de diversas maneras. Una opción es usar una discretización binaria, en estados "ausentes" y "presentes" para el elemento TF, y "abajo" y "arriba" para el nivel de ARNm de un gen objetivo (ver Figura 1). La relación probabilística entre el elemento TF y un gen objetivo puede entonces representarse mediante una tabla de probabilidad condicional (como se indica en la misma Figura).
En lugar de una discretización binaria, los niveles también pueden representarse como valores de nivel continuo, o como valores cuantificados que tienen tres o más niveles de cuantificación (por ejemplo, "abajo", "normal" y "arriba" para genes objetivo).
La ilustración anterior de una red Bayesiana simple es solo una realización ilustrativa del modelo de red Bayesiana (Figura 1). En general, un modelo de red Bayesiana comprende un grafo acíclico dirigido que comprende nodos conectados por bordes. Cada nodo representa un elemento de información perteneciente a la ruta a mano (o, más generalmente, a la ruta de señalización celular). Cada uno de los nodos de los elementos de la ruta representa un elemento genómico o proteómico de la ruta de señalización celular. A modo de ejemplo ilustrativo, un nodo de elemento de ruta puede representar uno de entre, pero no restringiéndose a: una proteína, un complejo de proteína, una molécula de ARNm transcrita a partir de un gen objetivo de la ruta de señalización celular, un gen metilado, una proteína fosforilada, un complejo de proteína fosforilada, o así sucesivamente. Como se describe más adelante en este documento, pueden incluirse en la red Bayesiana otros tipos de nodos, pero no se limitan a los ejemplos dados, para representar otros tipos de información tales como elementos de referencia de medición específicos, ocurrencias de variación génica, etc.
Típicamente, se añaden niveles adicionales "corriente arriba" que representan las proteínas reguladoras (en estado activo o inactivo) si el conocimiento del nivel de dicha proteína pudiera ser probatorio para determinar la recomendación de soporte de decisión clínica. Por ejemplo, podría ser útil la inclusión de las proteínas elementales en el factor de transcripción o en las proteínas esenciales antes del factor de transcripción en la red Bayesiana (véase la Figura 2) si se dispone de un fármaco que específicamente apunte a dichas proteínas y no a la ruta como un todo. Se cree que el factor de transcripción (TF) es un complejo proteico (es decir, una combinación de proteínas unidas entre sí en una estructura específica que realiza la función de regular la transcripción a partir de los genes objetivo) en la mayoría de las rutas de señalización. Para otras rutas, el elemento TF puede ser una sola proteína. Además, las rutas de señalización pueden ejercer su actividad a través de más de un factor de transcripción, resultando en una más compleja red Bayesiana con múltiples factores de transcripción de alimentación en los genes objetivo (véase la Figura 3 para una ilustración hipotética de múltiples elementos de factor de transcripción que influyen en la transcripción del gen objetivo). Esta red Bayesiana de múltiples factores de transcripción puede ser también el resultado de una combinación de rutas combinadas en una red Bayesiana.
También se pueden incluir nodos de información adicionales más abajo de los genes objetivo en la red Bayesiana. Un ejemplo ilustrativo de esto es la traducción del ARNm del gen objetivo en proteínas (Figura 4) o nodos de nivel de proteína del gen objetivo como nodo sustituto del nivel del ARNm del gen objetivo (Figura 5). Las moléculas de ARNm del gen objetivo se traducen por interacción con moléculas de ribosomas para formar proteínas que corresponden a las moléculas de ARNm y que corresponden a los genes objetivo. Esta es la expresión de los genes objetivo en el nivel de proteína. La medición del nivel de proteína mediante, pero sin limitarse a, por ejemplo espectrometría de masas, inmunohistoquímica, técnicas de electroforesis en gel, puede actuar como evidencia para estos niveles de proteína objetivo.
El nivel de expresión de un gen objetivo se puede calcular con base en la intensidad medida de conjuntos de sondas correspondientes de un microarreglo, por ejemplo, promediando o por otros medios de otras técnicas (por ejemplo, secuenciación de ARN). En algunas realizaciones este cómputo se integra en la red Bayesiana, extendiendo la red Bayesiana con un nodo para cada conjunto de sondas que se utiliza e incluyendo un recorrido de borde a cada uno de estos nodos de "medición" desde el nodo de gen objetivo correspondiente, como se describe en el presente documento con referencia a la Figura 6.
Opcionalmente, el modelo probabilístico también puede incorporar información genómica adicional, tal como información sobre mutaciones, variaciones de número de copias, expresión génica, metilación, información de translocación, etc., que cambian secuencias genómicas que están relacionadas con la cascada de señalización de la ruta para inferir la actividad de la ruta y para localizar el defecto en la ruta Wnt que provoca el funcionamiento aberrante (ya sea activación o inactividad), como se describe por referencia ilustrativa a la Figura 7 para el caso ilustrativo de la metilación y el número de copias de datos. Sin embargo, debe entenderse que otros tipos de información con respecto al gen objetivo se traducen análogamente en nodos de información. T al información genómica puede estar disponible a través, pero no limitándose a, secuenciación de ARN y análisis de SNP.
Además, debe entenderse que mientras que los ejemplos tal como se describen más adelante en este documento pertenecen a la ruta Wnt, ER, AR y Hedgehog se proporcionan como ejemplos ilustrativos, los enfoques para el análisis de la ruta de señalización celular descritos aquí se aplican fácilmente a otras rutas de señalización celular además de estas (por ejemplo, las rutas de señalización celular Notch, HER2/PI3K, TGFbeta, EGF, VEGF y TNF-NFkappaB), y rutas de señalización intracelular con receptores dentro de la célula (por ejemplo, rutas de señalización celular de progesterona, ácido retinoico y vitamina D).
Ejemplo 2: Comparación de métodos de aprendizaje de máquina
Aquí se compara el rendimiento de dos tipos de técnicas de aprendizaje de máquina entre sí tomando la ruta Wnt como ejemplo: la predicción de la actividad Wnt mediante el método centroide más próximo se compara con el método de elección según la presente invención, que por ejemplo utiliza una red Bayesiana.
Como se discutió anteriormente, el enfoque de la red Bayesiana se seleccionó con base en sus ventajas que residen en el enfoque probabilístico, pudiendo incorporar la información disponible en forma "blanda", por ejemplo porcentajes de sujetos de estudio que muestran características probatorias, y en forma "dura", usando relaciones probabilísticas condicionales. Además, el modelo probabilístico también permite incorporar información a partir del conocimiento parcial (más que integral) de la ruta de señalización celular subyacente, también mediante el uso de tablas de probabilidad condicional.
Aquí se demuestra que los inventores añadieron valor en la forma en que incluían propiedades biológicas conocidas y la disponibilidad de pruebas blandas utilizando una red Bayesiana en comparación con otros métodos de aprendizaje de máquina, por ejemplo clasificación centroide más cercana, un método bien conocido. La clasificación centroide más cercana es un método de aprendizaje de máquina donde para cada clase de muestras de entrenamiento se calcula un perfil medio (= centroide), y luego, para que una muestra sea clasificada, la etiqueta se predice en base al centroide más cercano (la etiqueta centroide más cercana es por tanto el resultado de la predicción). Los dos centroides se calculan en la misma lista de conjuntos de sonda utilizados en la red Bayesiana, y para el “Wnt en” y “Wnt fuera” del centroide se basan en las muestras de adenoma y las muestras normales de colon, respectivamente, de los mismos datos procesados fRMA de GSE8671. La relación log2 de las dos distancias euclidianas entre una muestra y los dos centroides se utilizó posteriormente para clasificar las muestras de diversos conjuntos de datos para inferir la clasificación de las muestras. Esto significa que una relación log2 de 0 corresponde a una distancia igual de la muestra a los dos centroides, un valor> 0 corresponde a una muestra clasificada como señalización Wnt activa mientras que un valor <0 corresponde a una muestra identificada por tener una ruta de señalización Wnt inactiva.
La red Bayesiana se construyó similar a la Figura 6 y al procedimiento descrito en el presente documento. De forma similar a esta descripción de la red Bayesiana Wnt, las tablas de probabilidad condicional de los bordes entre conjuntos de sonda y sus respectivos genes fueron entrenados utilizando datos procesados fRMA de 32 muestras de colon normal y 32 muestras de adenoma del conjunto de datos GSE8671 de Gene Expression Omnibus (accesible en http://www.ncbi.nlm.nih.gov/geo/, visitado por última vez el 13 de julio de 2011). La red Bayesiana entrenada fue entonces probada en diversos conjuntos de datos para inferir la probabilidad P (Wnt habilitada) de que la ruta Wnt está "habilitada", es decir, activa, lo que se toma igual a la probabilidad deducida de que el complejo de transcripción de la ruta Wnt está “presente".
La red Bayesiana entrenada y el modelo de centroide más cercano se ensayaron entonces en varios conjuntos de datos de microarreglos procesados con fRMA para inferir la probabilidad de que la ruta de Wnt esté "habilitada", medida por P (Wnt Habilitada) y relación log2 de las distancias. Los resúmenes de los resultados de la red Bayesiana y el modelo de centroide más cercano se muestran en las Figuras 8 a 13. El lector debe tener en cuenta que las métricas de salida de los dos métodos no son una relación uno a uno, sin embargo el signo y la magnitud relativa de las métricas de salida dentro de un método son comparables.
La gran mayoría de las muestras de colon (cáncer) (GSE20916, GSE4183) se clasifican por igual entre la ruta Wnt activa e inactiva, excepto GSE15960 que tenía una fracción elevada de muestras negativas clasificadas erróneamente en el método centroide más cercano (falsos negativos). Esta percepción de una mayor fracción de falsos negativos se mantiene en los otros tipos de cáncer también. Esto es especialmente cierto para muestras de cáncer de mama (GSE12777, GSE21653) y cáncer de hígado (GSE9843); salvo algunas excepciones, se prevé que todas las muestras tengan una ruta de Wnt inactiva que se sabe que es incorrecta en el caso de muestras de cáncer de mama de tipo basal y de cáncer de hígado CTNNB1. En algunos casos, evidente en, por ejemplo, GSE15960, la clasificación se podría corregir bajando y aumentando el umbral de la clasificación centroide más cercana. La idea detrás de esto sería que el umbral de la actividad Wnt podría ser alterado en diferentes tipos de tejido. Sin embargo, esto implicaría una formación adicional del método centroide más cercano para que sea aplicable a otros tipos de tejidos. Una de las fortalezas del modelo de la red Bayesiana es que este entrenamiento específico del tejido no es necesario ya que se establece que no es específico en cuanto al tipo de tejido.
Ejemplo 3: Selección de genes objetivo
Un factor de transcripción (TF) es un complejo de proteínas (es decir, una combinación de proteínas unidas entre sí en una estructura específica) o una proteína que es capaz de regular la transcripción a partir de genes objetivo mediante la unión a secuencias de ADN específicas, controlando por lo tanto la transcripción de información genética de ADN a ARNm. El ARNm producido directamente debido a esta acción del complejo de transcripción se denomina en el presente documento como un "gen objetivo directo". La activación de la ruta también puede resultar en más transcripción de genes secundarios, denominados "genes objetivo indirectos". En lo que sigue, se prefieren los modelos de red Bayesiana (como modelos probabilísticos ejemplares) que comprenden o consisten en genes objetivo directos, como enlaces directos entre la actividad de la ruta y el nivel de ARNm, sin embargo la distinción entre genes objetivo directos e indirectos no es siempre evidente. Aquí se presenta un método para seleccionar genes objetivo directos usando una función de puntuación con base en datos de literatura disponible. Sin embargo, la selección accidental de genes objetivo indirectos no puede descartarse debido a la información limitada y a las variaciones e incertidumbres biológicas.
Se seleccionaron genes de ARNm de ruta específica a partir de la bibliografía científica, utilizando un sistema de clasificación en el que se daba una calificación a la evidencia científica de un gen objetivo específico, dependiendo del tipo de experimentos científicos en los que se acumulaba la evidencia. Aunque algunas pruebas experimentales son meramente indicativas de que un gen es un gen objetivo, como por ejemplo un ARNm que aumenta en un microarreglo de un embrión en el que se sabe que la ruta Hedgehog está activa, otras pruebas pueden ser muy fuertes, como la combinación de un sitio de unión del factor de transcripción de la ruta identificada y la recuperación de este sitio en un ensayo de inmunoprecipitación de cromatina (ChIP) después de la estimulación de la ruta específica en la célula y el aumento de ARNm después de la estimulación específica de la ruta en una línea celular.
En la literatura científica pueden identificarse varios tipos de experimentos para encontrar genes objetivo específicos de la ruta de acceso:
1. Experimentos ChIP en los que se muestra la unión directa de un factor de transcripción de ruta a su sitio de unión en el genoma. Ejemplo: Mediante el uso de la tecnología de cromatinainmunoprecipitación (ChIP), se identificaron posteriores sitios de unión a factores de transcripción TCF4 funcionales en el ADN de las líneas celulares de colon con y sin ruta Wnt activa, como un subconjunto de los sitios de unión reconocidos puramente con base en la secuencia de nucleótidos. La funcionalidad putativa se identificó como la evidencia derivada de ChIP de que se encontró que el factor de transcripción se unía al sitio de unión al ADN.
2. Ensayos de Desplazamiento de Movilidad Electroforética (EMSA) que muestran la unión in vitro de un factor de transcripción a un fragmento de ADN que contiene la secuencia de unión. En comparación con la evidencia con base ChIP, la evidencia con base en EMSA es menos fuerte, ya que no puede trasladarse a la situación in vivo.
3. Estimulación de la ruta y medición de los perfiles de ARNm en un microarreglo o utilizando secuenciación de ARN, utilizando líneas celulares inducibles por las rutas y la medición de los perfiles ARNm medidos en varios puntos de tiempo después de la inducción en presencia de cicloheximida, lo que inhibe la traducción a la proteína, suponiéndose así que los ARNm inducidos son genes objetivo directos.
4. Similar a 3, pero utilizando la PCR cuantitativa para medir las cantidades de ARNm.
5. Identificación de los sitios de unión al factor de transcripción en el genoma utilizando un enfoque bioinformático. Ejemplo para la ruta Wnt: Usando la secuencia conocida de unión al ADN del factor de transcripción de la catenina TCF4-beta, se ejecutó un programa de software sobre la secuencia del genoma humano, y se identificaron sitios potenciales de unión, tanto en regiones promotoras de gen como en otras regiones genómicas.
6. Semejante a 3, solo en ausencia de cicloheximida.
7. Similar a 4, solo en ausencia de cicloheximida.
8. Perfil de expresión de ARNm de muestras de tejidos o células específicas de las que se sabe que la ruta es activa, sin embargo en ausencia de la condición de control negativo apropiada.
En la forma más sencilla se puede dar a cada ARNm objetivo potencial 1 punto para cada uno de estos enfoques experimentales en los que se identificó el ARNm objetivo.
Alternativamente, los puntos se pueden dar de forma incremental, es decir, una tecnología 1 punto, la segunda tecnología añade un segundo punto, y así sucesivamente. Usando esta estrategia relativamente clasificadora, se puede hacer una lista más confiable de los genes objetivo.
Alternativamente, la clasificación de otra manera puede usarse para identificar los genes objetivo que tienen más probabilidades de ser genes objetivo directos, proporcionando un mayor número de puntos a la tecnología que proporciona la mayor evidencia de un gen objetivo directo in vivo; en la lista anterior significaría 8 puntos para el enfoque experimental 1), 7 a 2), y bajando a un punto para la metodología experimental 8. Tal lista puede denominarse "lista de genes objetivo general".
A pesar de las variaciones e incertidumbres biológicas, los inventores asumieron que los genes objetivo directos son los que tienen más probabilidades de ser inducidos de una manera independiente de los tejidos. Una lista de estos genes objetivo puede ser llamada "lista de genes objetivo curada con evidencia". Estas listas de objetivos curados se han utilizado para construir modelos computacionales que se pueden aplicar a muestras procedentes de diferentes fuentes de tejido.
La "lista general de genes objetivo" probablemente contiene genes que son más específicos de tejido, y pueden usarse potencialmente para optimizar y aumentar la sensibilidad y especificidad del modelo para aplicación en muestras de un tejido específico, como muestras de cáncer de mama.
A continuación se ilustra un ejemplo de cómo se construyó específicamente la selección de una lista de genes objetivo curada con evidencia para la ruta ER.
Con el fin de seleccionar los genes objetivo ER usados como entrada para el "modelo", se usaron los tres criterios siguientes:
1. La región promotora/potenciadora de gen contiene un motivo de elemento de respuesta a estrógenos (ERE):
a. Se debe demostrar que el motivo ERE responde al estrógeno, por ejemplo, mediante un ensayo de transfección transitoria en el que el motivo ERE específico está unido a un gen informador y
b. La presencia del motivo ERE debe confirmarse, por ejemplo, mediante un análisis de motivo enriquecido de la región promotora/potenciadora del gen.
2. ER (diferencialmente) se une in vivo a la región promotora/potenciadora del gen en cuestión, demostrado, por ejemplo, mediante un experimento de ChIP/CHIP o un ensayo de inmunoprecipitación de cromatina:
a. Se ha demostrado que ER se une a la región promotora/potenciadora del gen cuando la ruta ER es activa, y
b. (preferiblemente) no se une (o se une débilmente) a la región promotora/potenciadora del gen si la ruta ER no está activa.
3. El gen es transcrito diferencialmente cuando la ruta ER es activa, demostrada por, por ejemplo,
a. enriquecimiento del ARNm del gen en cuestión mediante PCR en tiempo real, o experimento con microarreglos, o
b. la demostración de que el ARN Pol II se une a la región promotora del gen a través de un ensayo de inmunoprecipitación.
La selección se realizó mediante la definición como genes ER objetivo de los genes para los que se reunieron pruebas experimentales suficientes y bien documentadas que demostraban que los tres criterios mencionados anteriormente se cumplieron. Un experimento adecuado para recopilar evidencia de unión diferencial ER es comparar los resultados de, por ejemplo, un experimento ChIP/CHIP en una línea celular cancerosa que responde a estrógeno (por ejemplo, la línea celular MCF-7), cuando se expone o no se expone a estrógeno. Lo mismo ocurre con la recolección de pruebas de la transcripción de ARNm.
La metodología anterior discute el enfoque genérico y un ejemplo más específico del procedimiento de selección de genes objetivo que se ha empleado para seleccionar un número de genes objetivo con base en la evidencia encontrada usando la metodología mencionado anteriormente. En la Tabla 1, Tabla 2, Tabla 3 y Tabla 4 se muestran las listas de genes objetivo utilizados en los modelos de red Bayesiana para rutas ejemplares, a saber, las rutas Wnt, ER, Hedgehog y AR.
Los genes objetivo de la ruta ER usados para el modelo de red Bayesiana de la ruta ER descrita en este documento (mostrada en la Tabla 2) contienen una selección de genes objetivo con base en su puntuación de evidencia bibliográfica; Solo se añadieron a esta breve lista los genes objetivo con las puntuaciones de evidencia más altas (genes objetivo preferidos de acuerdo con la invención). En la Tabla 5 se muestra la lista completa de genes objetivo ER, incluyendo también aquellos genes con una puntuación de evidencia menor.
Se llevó a cabo otra subselección o clasificación de los genes objetivo de las rutas Wnt, ER, Hedgehog y AR mostrados en la Tabla 1, Tabla 2, Tabla 3 y Tabla 4 con base en una combinación del puntaje de evidencia de la literatura y las relaciones de probabilidades calculadas usando las tablas de probabilidad condicional entrenadas que enlazan los nodos de sondas con los nodos de genes objetivo correspondientes. La relación de probabilidades es una evaluación de la importancia del gen objetivo en la actividad de inferencia de las rutas. En general, se espera que sea probable que el nivel de expresión de un gen objetivo con una relación de probabilidades mayor que sea más informativo en cuanto a la actividad global de la ruta en comparación con genes objetivo con menores relaciones de probabilidades. Sin embargo, debido a la complejidad de las rutas de señalización celular debe entenderse que pueden existir interrelaciones más complejas entre los genes objetivo y la actividad de la ruta -por ejemplo, considerando los niveles de expresión de diversas combinaciones de genes objetivo con relaciones de probabilidad bajas quizás más probables que considerando los genes objetivo con mayores relaciones de probabilidades en aislamiento. En los modelos Wnt, Er , Hedgehog y AR, se ha encontrado que los genes objetivo mostrados en la Tabla 6, Tabla 7, Tabla 8 y Tabla 9 son de naturaleza probatoria superior para predecir la ruta Wnt, ER, Hedgehog y las actividades de ruta AR en comparación con los genes objetivo de menor rango (por lo tanto, los genes objetivo mostrados en las Tablas 6 a 9 son particularmente preferidos de acuerdo con la presente invención). No obstante, dada la relativa facilidad con la que la tecnología de adquisición tal como la de microarreglos puede adquirir niveles de expresión para grandes conjuntos de genes, se contempla utilizar algunos o todos los genes objetivo de la Tabla 6, Tabla 7, Tabla 8 y Tabla 9 y opcionalmente de forma adicional, usar uno, dos, algunos o todos los genes objetivo adicionales de los rangos mostrados en la Tabla 1, Tabla 2, Tabla 3 y Tabla 4, en el modelo Bayesiano como se representa en la Figura 6.
Tabla 1. Lista curada con evidencia de los genes objetivo de la ruta Wnt utilizados en la red bayesiana y conjuntos de sondas asociados usados para medir el nivel de expresión ARNm de los genes objetivo (# = número de secuencia en la lista de s n i n .
Figure imgf000014_0001
Tabla 2. Lista curada con evidencia de los genes objetivo de la ruta ER utilizados en la red bayesiana y los conjuntos de sonda asociados usados para medir el nivel de expresión ARNm de los genes objetivo (# = número de secuencia en la lista de secuencias adunta .
Figure imgf000014_0002
Figure imgf000015_0001
Tabla 3. Lista curada con evidencia de los genes objetivo de la ruta Hedgehog utilizados en la red bayesiana y los conjuntos de sonda asociados usados para medir el nivel de expresión ARNm de los genes objetivo (# = número de secuencia en l li n i n .
Figure imgf000015_0002
Figure imgf000016_0001
Tabla 4. Lista curada con evidencia de los genes objetivo de la ruta AR utilizados en la red bayesiana y los conjuntos de sonda asociados usados para medir el nivel de expresión ARNm de los genes objetivo (# = número de secuencia en la lista de secuencias adunta .
Figure imgf000016_0002
Figure imgf000017_0001
Tabla 5. Símbolos genéticos de los genes objetivo ER que se encontraron con evidencia significativa en literatura (= lista de genes iv ER = n m r n i n l li ^ n i n .
Figure imgf000017_0002
Tabla 6. Lista corta de los genes objetivo de Wnt con base en la puntuación de evidencia y relación de probabilidades en la literatura (# = número de secuenci n l li n i nta).
Figure imgf000017_0003
Tabla 7. Lista corta de los genes objetivo de ER con base en la puntuación de evidencia y relación de probabilidades en la literatura (# = número de secuenci n l li n i nta).
Figure imgf000017_0004
Figure imgf000018_0001
Tabla 8. Lista corta de los genes objetivo de Hedgehog con base en la puntuación de evidencia y relación de probabilidades en la literatura (# = número de secuencia en la lista de secuencias adjunta).
Figure imgf000018_0002
Tabla 9. Lista corta de los genes objetivo de AR con base en la puntuación de evidencia y relación de probabilidades en la literatura (# = número de secuenci n l li n i nta).
Figure imgf000018_0003
Ejemplo 4: Comparación de la lista curada de evidencia y la lista de literatura amplia
La lista de genes objetivo Wnt construidos con base en la evidencia de la literatura siguiendo el procedimiento descrito aquí (Tabla 1) se compara con otra lista de genes objetivo que no siguen el procedimiento mencionado anteriormente. La lista alternativa es una compilación de genes indicados por una variedad de datos de diversos enfoques experimentales para ser un gen Wnt objetivo publicado en tres fuentes públicas por reconocidos laboratorios, conocidos por su experiencia en el área de biología molecular y la ruta Wnt. La lista alternativa es una combinación de los genes mencionados en la tabla S3 de Hatzis et al. (Hatzis P, 2008), el texto y la tabla S1A de Sousa e Melo (de Sousa E Melo F, 2011) y la lista de genes objetivo recogidos y mantenidos por Roel Nusse, pionero en el campo de la señalización Wnt (Nusse, 2012). La combinación de estas tres fuentes dio lugar a una lista de 124 genes (=lista de literatura amplia, véase la Tabla 10). Aquí se discute la cuestión de si el rendimiento en la predicción de la actividad Wnt en muestras clínicas por el algoritmo derivado de esta lista alternativa está funcionando de manera similar o mejor en comparación con el modelo construido sobre la base de la lista existente de genes (=lista de curanderos probados, Tabla 1).
Tabla 10. Lista alternativa de genes objetivo de Wnt (= lista de literatura amplia) (# = número de secuencia en la lista n i n .
Figure imgf000019_0001
Figure imgf000020_0001
El siguiente paso consistió en encontrar los conjuntos de sonda de la matriz Affymetrix® GeneChip Human Genome U133 Plus 2.0 que corresponden con los genes. Este proceso se realizó utilizando el complemento Bioconductor en R y curado manual en cuanto a la relevancia de conjuntos de sonda con base en el navegador de genoma de UCSC, eliminando por lo tanto, por ejemplo, conjuntos de sonda en las cadenas opuestas o fuera de las regiones de exón del gen. Para dos de los 124 genes no hay conjuntos de sonda disponibles en este microarreglo chip y por lo tanto no podrían ser insertados en la red Bayesiana, siendo estos LOC283859 y WNT3A. Se encontró que en total 287 conjuntos de sonda corresponden a los restantes 122 genes (Tabla 11].
Tabla 11. Conjuntos de sonda asociados con los genes objetivo Wnt en la lista genética amplia de la literatura (# = número de secuencia en la lista de secuencias adunta .
Figure imgf000020_0002
Figure imgf000021_0001
Posteriormente, la red Bayesiana se construyó de forma similar a la Figura 6 y el procedimiento se explica en el presente documento. De forma similar a la descripción de la red bayesiana de Wnt con base en la lista de curado de evidencia, las tablas de probabilidad condicional de los bordes entre conjuntos de sonda y sus genes respectivos, tanto la lista de curado de evidencia como la lista de literatura general, fueron entrenadas usando datos procesados por fRMA de 32 muestras de colon normales y 32 muestras de adenoma del conjunto de datos GSE8671 de la Gene Expression Omnibus (accesible en http://www.ncbi.nlm.nih.gov/geo/, visitado por última vez el 13 de julio de 2011).
Las redes Bayesianas entrenadas fueron probadas en varios conjuntos de datos para inferir la probabilidad P (Wnt Habilitada) de que la ruta Wnt está "habilitada", es decir, activa, la cual se toma igual a la probabilidad inferida de que el complejo de transcripción de la ruta Wnt está "presente". En las Figuras 14-19 se muestran los resultados resumidos del modelo de literatura amplia y el modelo curado de evidencia.
Evidentemente, podría deducirse que el modelo de literatura general predice generalmente probabilidades más extremas para que la señalización de Wnt sea activada o desactivada. Además, el modelo alternativo predice resultados similares para los conjuntos de datos de cáncer de colon (GSE20916, GSE4183, GSE15960), pero muestras más que esperadas con conjuntos de datos de predicción de la señalización Wnt activa en cáncer de mama (GSE12777), cáncer de hígado (GSE9843) y muestra de meduloblastoma (GSE10327 ).
En conclusión, la lista amplia de la literatura de genes da como resultado predicciones aproximadamente igual de buenas de actividad Wnt en el cáncer de colon, por un lado, pero peores predicciones (demasiados falsos positivos) en otros tipos de cáncer, por otro lado. Esto podría ser un resultado de que la lista alternativa de los genes objetivo está demasiado sesgada hacia células de colon específicamente, por lo tanto, demasiado específicas para tejidos; el interés principal, tanto de de Sousa E Melo et al. como de Hatzis et al. era el cáncer colorrectal aunque se pueden incluir genes de Wnt no específicos de colon. Además, los genes objetivo no específicos de Wnt posiblemente incluidos en estas listas pueden ser una fuente de las predicciones empeoradas de la actividad de Wnt en otros tipos de cáncer. Es probable que la lista alternativa contenga genes objetivo más regulados indirectamente, lo que probablemente la haga más específica para tejidos. La lista original está ajustada para contener genes objetivo directos, los cuales son más propensos a representar genes que son sensibles a Wnt en todos los tejidos, reduciendo así la especificidad para tejidos.
Ejemplo 5: Entrenamiento y uso de la red Bayesiana
Antes de que se pueda utilizar la red Bayesiana para inferir la actividad de la ruta en una muestra de ensayo, se han de determinar los parámetros que describen las relaciones probabilísticas entre los elementos de la red. Además, en el caso de estados discretos de las mediciones de entrada, deben establecerse umbrales que describen cómo realizar la discretización.
Típicamente, las redes Bayesianas son entrenadas usando un conjunto representativo de muestras de entrenamiento, de las cuales se conocen preferentemente todos los estados de todos los nodos de la red. Sin embargo, no es práctico obtener muestras de entrenamiento de muchos tipos diferentes de cánceres, de los cuales se sabe cuál es el estado de activación de la ruta que va a ser modelada. Como resultado, los conjuntos de entrenamiento disponibles consisten en un número limitado de muestras, típicamente de un tipo de cáncer solamente. Para permitir que la red Bayesiana se genere bien a otros tipos de muestras, se debe prestar especial atención a la forma en que se determinan los parámetros, lo que se realiza preferiblemente de la siguiente manera en el enfoque descrito en el presente documento.
Para el nodo TF, la probabilidad (incondicional) de estar en estado "ausente" y "presente" es dada por la aparición esperada en un gran conjunto de muestras. Alternativamente, se puede establecer a 0.5, como se hace en la Figura 1, con el fin de no tener sesgo para un resultado positivo o negativo.
Para los nodos de genes objetivo, las probabilidades condicionales se establecen como en la Figura 1. Si el elemento TF está "ausente", es más probable que el gen objetivo esté "abajo", por lo tanto se elige una probabilidad de 0.95 para este y probabilidad de 0.05 para el gen objetivo que está "arriba". Esta última probabilidad (no nula) es para tener en cuenta la (rara) posibilidad de que el gen objetivo sea regulado por otros factores u observado accidentalmente "hacia arriba" (por ejemplo debido al ruido de medición). Si el elemento TF está "presente", entonces con una probabilidad justa de 0.70 el gen objetivo está "arriba", y con una probabilidad de 0.30 el gen objetivo está "abajo". Estos últimos valores se eligen de esta manera, porque puede haber varias razones por las que un gen objetivo no esté muy expresado aunque el elemento TF esté presente, por ejemplo porque la región promotora del gen está metilada. En el caso de que un gen objetivo no esté regulado por el elemento TF, pero regulado a la baja, las probabilidades se eligen de manera similar, pero reflejan la regulación a la baja ante la presencia del elemento TF.
Para el modelo de red Bayesiana, tal como se muestra en la Figura 6, donde las intensidades de los conjuntos de sonda forman las mediciones de entrada, finalmente se tienen que determinar los parámetros para la discretización y para las tablas de probabilidad condicional que relacionan las intensidades de los conjuntos de sonda con los niveles de ARNm de Los respectivos genes objetivo. Ambos se basan en datos de entrenamiento en la presente invención. Para la discretización del nivel de intensidad de un conjunto de sondas en los estados "bajo" y "alto", se determina un umbral adecuado que mejor separa los valores de intensidad en un conjunto de muestras de entrenamiento donde se activa la ruta (muestras "habilitadas") de los valores de intensidad en un conjunto de muestras de entrenamiento en el que no está. Muestras deshabilitadas). Por último, las tablas de probabilidades condicionales que describen las probabilidades de un conjunto de sondas para tener una intensidad "baja" o "alta" dependiendo del estado "bajo" o "alto" del gen objetivo respectivo, se realizan contando el número de muestras "habilitadas" y "deshabilitadas" con un valor de intensidad del conjunto de sondas por debajo y por encima del umbral respectivo. Esto se conoce en la literatura como el enfoque de frecuencias. Se agrega un conteo ficticio a cada grupo para evitar entradas en las tablas de probabilidad condicional con un valor de cero, para evitar un comportamiento extremo de la red Bayesiana.
Después de que la red Bayesiana ha sido entrenada, puede aplicarse en una muestra de prueba de la siguiente manera, considerando la red Bayesiana de la Figura 6, y asumiendo que las mediciones por microarreglos relacionadas con los conjuntos de sonda están disponibles. El primer paso es discretizar las mediciones de entrada, comparando la intensidad de cada conjunto de sondas en la muestra de prueba con el umbral respectivo como se ha descrito anteriormente. Esta comparación puede hacerse de una manera difícil, poniendo cada conjunto de sondas a una intensidad "baja" o "alta" (llamada "evidencia dura"), o puede hacerse de una manera suave, asumiendo cierta incertidumbre (ruido) en la medición, estableciendo para cada conjunto de sondas una probabilidad de ser "baja" o "alta" (llamada "evidencia suave"). Por ejemplo, la prueba suave de un conjunto de sondas con una intensidad justo debajo del umbral puede ser una probabilidad de 0.8 de ser "baja" y una probabilidad de 0.2 de ser "alta", con base en una estimación adecuada del ruido y la diferencia con respecto al umbral.
A continuación, esta evidencia dura o suave se suministra a un motor de inferencia adecuado para redes Bayesianas, por ejemplo, con base en un algoritmo de árbol de cruce (véase (Napolitano, 2004)). Dicho motor puede deducir la probabilidad actualizada de que el elemento TF esté "ausente" o "presente", dada la evidencia proporcionada. La probabilidad deducida de que el elemento TF esté "presente" se interpreta entonces como la probabilidad estimada de que la ruta respectiva esté activa.
Preferiblemente, el entrenamiento de los modelos de red Bayesiana de las rutas Wnt, ER, Hedgehog y AR se realiza utilizando datos públicos disponibles en el Gene Expression Omnibus (accesible en http://www.ncbi.nlm.nih.gov/ geo/, ver arriba).
La red Bayesiana Wnt fue entrenada como ejemplo utilizando 32 muestras normales de colon consideradas como una ruta Wnt inactiva y 32 muestras confirmadas de adenoma que se sabe que tienen una ruta Wnt activa (conjunto de datos GSE8671).
El modelo de red Bayesiana de la ruta ER fue entrenado como ejemplo usando 4 muestras de MCF7 desprovistas de estrógenos, que se sabe que tienen una ruta ER inactiva, y 4 muestras de MCF7 estimuladas con estrógenos, las que se considerada que tienen una ruta ER activa, a partir del conjunto de datos de GSE8597 también accesible en la Gene Expression Omnibus.
El modelo de red Bayesiana de la ruta Hedgehog fue entrenado como ejemplo usando 15 muestras de carcinoma de células basales de las que se confirmó que tenían una ruta Hedgehog activa y 4 muestras de células de piel normales representando muestras con una ruta Hedgehog inactiva disponible en el conjunto de datos de GSE7553.
El modelo de la red Bayesiana de la ruta AR fue entrenado como ejemplo usando 3 muestras con actividad AR positiva, líneas celulares LNCaP estimuladas con dihidrotestosterona (DHT), un potente activador de la ruta AR y 3 líneas celulares LNCaP no estimuladas que representan la AR inactiva caso de ruta.
Con referencia a la Figura 35 y la Figura 36, los modelos de la red Bayesiana entrenados de la ruta Wnt y ER fueron utilizados para predecir las actividades de la ruta en muestras similares (muestras de colon y MCF7 para la red Wnt y ER Bayesiana respectivamente) no utilizados en el procedimiento de entrenamiento como se describe aquí (no se encontró ningún conjunto de datos apropiado para la red Bayesiana de Hedgehog). Las actividades previstas de la ruta de la gran mayoría de las muestras deben estar en línea con las actividades clínicamente esperadas de la ruta para que el modelo sea validado.
La Figura 35 muestra las actividades Wnt previstas, representadas como el logit de P (Wnt habilitada) sobre el eje vertical, para las muestras, ilustradas por las barras en el eje horizontal, de las muestras de colon agrupadas por clasificación, indicadas por el color de la barra, en el conjunto de datos GSE20916. Se ha predicho correctamente que todas las muestras normales de colon tienen una ruta inactiva (puntuación <0), sobre la base de que es una muestra de tejido sano. Se prevé que todas las muestras, excepto cuatro, que tienen una ruta activa, tienen una ruta Wnt activa.
En la Figura 36 se muestran los resultados de validación del modelo de red Bayesiana ER ensayado para dos microarreglos medidos utilizando una línea de células de cáncer de mama MCF7, una estimulada con estrógeno (E2) y la otra con un control negativo (EtOH), procedente del conjunto de datos GSE9253. De acuerdo con la supuesta actividad de ER, se prevé que la muestra estimulada con estrógeno tenga una ruta ER activa, mientras que el control negativo predice una ruta ER inactiva.
Más detalles y ejemplos para usar redes Bayesianas entrenadas (por ejemplo, Wnt, ER, AR y ruta Hedgehog) para predecir las respectivas actividades de la ruta se explican en el Ejemplo 6 a continuación.
El procedimiento de formación mencionado anteriormente puede emplearse para otras redes Bayesianas de aplicaciones clínicas. Aquí está demostrado y probado que funciona para los modelos de red Bayesiana construidos utilizando el método descrito en el presente documento que representa rutas de señalización celular, más específicamente las rutas Wnt, ER, AR y Hedgehog.
Ejemplo 6: Diagnóstico de la actividad de la ruta (anormal)
A continuación se ilustrará a manera de ejemplo cómo usar por ejemplo modelos de red Bayesiana para diagnosticar la actividad de una ruta de señalización celular.
Las redes Bayesianas de la ruta Wnt, ER, Hedgehog y AR, construidas utilizando un nodo para la presencia del factor de transcripción, una capa de nodos que representan el ARNm de los genes objetivo y una capa de nodos que representan las intensidades de los conjuntos de sonda correspondientes a los genes objetivo (Tabla 1, Tabla 2, Tabla 3 y Tabla 4), análogos a la Figura 6 descrita aquí, y entrenados como se describe en este documento, fueron utilizadas para predecir la actividad de las rutas como “habilitadas”, esto es, activas, o “inhabilitadas”, esto es, inactivas, en conjuntos de datos diversos, previamente no utilizados para entrenamiento, para inferir cómo funciona bien el componente de inferencia. Los puntajes de la actividad de la ruta prevista se correlacionan con el conocimiento clínico. Los resúmenes de los resultados para una selección de los ensayos se muestran en las Figuras 21 sec.
Con referencia a las Figuras 21 sec., se muestran resultados de inferencia de actividad de trayectoria para muestras de tejido médico usando el modelo de red Bayesiana descrito aquí.
La Figura 21 muestra los resultados de las pruebas de actividad de Wnt en el conjunto de datos de muestras de colon GSE4183. El modelo de la red Bayesiana arrojó valores altos de P (Wnt habilitada) para las muestras de adenoma y valores bajos para muestras normales, lo que corresponde con la (pato)fisiología del adenoma y el tejido sano. El tejido sano tiene una proliferación celular lenta y por lo tanto una actividad baja de Wnt con relación al tejido adenomatoso que tiene una proliferación celular rápida y por lo tanto una alta actividad de Wnt. Para las muestras IBD, el modelo de la red Bayesiana mostró baja actividad de la ruta Wnt (P (Wnt habilitada) ~0) para todas las muestras excepto una. De nuevo, esto es consistente con las muestras de IBD que no experimentan proliferación celular rápida. Para las muestras de células de cáncer colorrectal los resultados se mezclaron, con alta actividad de la ruta Wnt que se detecta en aproximadamente la mitad de estas muestras, pero esto puede ser el resultado de otras rutas que asumen el papel de conductoras del tumor cuando el tejido adenomatoso benigno se convierte en tejido canceroso maligno, o análisis de muestras, por ejemplo, conteniendo la muestra demasiado tejido no tumoral, o estando parcialmente degradado el ARNm.
El modelo de red Bayesiana utilizado en los experimentos aquí informados se formó utilizando el conjunto de datos de muestras de colon GSE8671. Sin embargo, la ruta Wnt está presente (aunque posiblemente inactiva) en otros tipos de células. Por lo tanto, se consideró posible que la red Bayesiana podría ser aplicable para inferir anormalmente alta actividad de la ruta Wnt correlativa con otros tipos de cánceres. La razón de esto es que, aunque el modelo de la red Bayesiana fue entrenado usando muestras de colon, se basa en los primeros principios de la operación de la ruta Wnt presente (aunque posiblemente inactiva) en otros tipos de células. Las Figuras 22-24 muestran algunos resultados que investigan tales inferencias “tipo tejido cruzado".
La Figura 22 muestra los resultados de las pruebas utilizando el modelo de red Bayesiana entrenado usando muestras de colon que se aplican para inferir la actividad de la ruta Wnt en muestras de meduloblastoma (conjunto de datos GSE10327). Las muestras incluidas en este conjunto de datos se han caracterizado adicionalmente en varios subconjuntos, siendo uno de ellos muestras con la ruta Wnt activa. La red bayesiana de la ruta Wnt predice el grupo de Wnt activo muestras que tienen una ruta Wnt activa, mientras que se predijo correctamente que las otras muestras tenían un ruta Wnt inactiva.
En la Figura 23 se muestran los resultados de las pruebas utilizando el modelo de red Bayesiana Wnt en un conjunto de datos que contiene muestras de cáncer de hígado (GSE9843). Aquí las muestras se agrupan mediante las siguientes anotaciones a priori asignadas por el conjunto de datos GSE9843: "CTNNB1", " Inflamación", "Polisomía chr7", "Proliferación" y "Sin anotación". Se infieren uniformemente que las muestras del grupo de "Inflamación" no tienen una actividad anormalmente alta de la ruta Wnt, como se esperaba ya que la condición de inflamación no implica proliferación celular rápida. T ambién se infiere uniformemente que las muestras etiquetadas "Polisomía chr7" no tienen una actividad de ruta Wnt anormalmente alta. La polisomía del cromosoma número 7 significa que hay más de dos cromosomas número 7. Como no hay razón para esperar esta condición de polisomía para impactar la ruta Wnt, no es inesperado que estas muestras no tengan actividad de ruta Wnt anormalmente alta.
Aproximadamente una de cada cinco de las muestras marcadas con "Proliferación" tiene P (Wnt habilitada) >0,5. La proliferación sugiere un estado de rápida multiplicación celular. Tal estado puede estar asociado con una actividad anormalmente alta de la ruta Wnt, pero también puede estar asociado con numerosas otras posibles causas de proliferación celular. Por consiguiente, aproximadamente una de cada cinco de estas muestras que tienen una actividad de ruta Wnt anormalmente alta no es un resultado irrazonable.
Aproximadamente para la mitad de las muestras del grupo "CTNNB 1" la red Bayesiana infiere que tienen una actividad de la ruta Wnt anormalmente alta. El gen CTNNB 1 codifica la proteína beta-catenina, que es una proteína reguladora de la ruta Wnt, y las mutaciones activadoras en este gen causan la activación anormal de Wnt. Por lo tanto, una correlación entre el grupo "CTNNB 1" y actividad alta de la ruta Wnt es la expectativa de conformidad.
La Figura 24 representa los resultados de ensayo del modelo de red Bayesiana de Wnt descrito aquí para un conjunto de muestras de cáncer de mama. En este caso, se ensayan tres grupos de líneas celulares de cáncer de mama: un grupo para el cual se conoce a priori que la ruta Wnt funciona a un nivel anormalmente alto (grupo con Wnt habilitada); un grupo para el cual la ruta Wnt es a priori conocida por no estar operando a un nivel anormalmente alto (grupo con Wnt deshabilitada); y otro grupo para el cual la actividad de la ruta Wnt no se conoce a priori (grupo desconocido); además hay una muestra que se sospecha que tiene un bajo nivel de activación Wnt (Wnt sospechoso), aunque hay un informe contradictorio en la literatura de que puede tener una ruta Wnt activa (pero este es un informe minoritario, más artículos reportan una ruta Wnt inactiva). Como se ve en la Figura 24, la correlación de las inferencias proporcionadas por la red Bayesiana con el conocimiento a priori es fuerte para los grupos de Wnt habilitada y deshabilitada. También la muestra más a la derecha del gráfico (Wnt sospechoso) muestra una inferencia que corresponde a la mayoría de los informes en la literatura que indican que la ruta Wnt está inhabilitada. En el caso del grupo desconocido que se muestra en la Figura 24, para el cual no hay conocimiento a priori de la actividad de la ruta Wnt, la red Bayesiana infiere baja actividad para la ruta Wnt excepto para una instancia para la cual P (Wnt habilitada) >0,5; la literatura muestra que esta línea celular tiene una alta expresión del correceptor LRP6, lo que puede explicar que la ruta Wnt esté habilitada.
La Figura 25 muestra los resultados para el mismo conjunto de datos de líneas celulares de cáncer de mama, pero ahora se ensaya la actividad ER utilizando la red Bayesiana ER entrenada usando líneas celulares de cáncer de mama MCF7 como se describe en el presente documento. Se predijo que las muestras a priori conocidas por tener una ruta de Wnt activa tenían una ruta ER inactiva, lo cual no es sorprendente ya que la ruta de Wnt ya está impulsando la multiplicación rápida de células. Las muestras positivas para ER, por otro lado se encuentran entre las muestras con Wnt deshabilitadas y las muestras desconocidas. En vista de la Figura 24, esto no es sorprendente.
En la Figura 26 se muestran los resultados de las predicciones de la red Bayesiana ER entrenada en líneas celulares de cáncer de mama para un conjunto de muestras de cáncer (GSE12276). Las muestras de cáncer de mama se subdividieron en las clasificaciones bien conocidas: Luminal A (LumA), Luminal B (LumB), receptor del factor de crecimiento epidérmico humano 2 positivo (HER2) y subtipo basal de cáncer de mama. Se sabe que las muestras de tejido en los subtipos luminal A y luminal B expresan ER. Es también en estos subtipos que se prevé que la mayoría de las muestras tengan una actividad de ruta Er alta. Por otro lado, se sabe que las muestras que se clasifican como del subtipo basal tienen una expresión baja o inexistente de ER, lo que se correlaciona bien con una ruta ER no activa predicha en las muestras del grupo basal. En el grupo HER2 solo tres muestras tienen un P (ER habilitada) >0,5, mientras que se prevé que la mayoría de las muestras tienen una ruta ER inactiva. Esto se correlaciona bien con el hecho de que la clasificación se hace sobre el hecho de que estas muestras tienen una expresión amplificada de HER2; la replicación celular no controlada es presumiblemente conducida a través de la señalización de HER2 a través de otras rutas de señalización celular diferentes a la ruta ER (véanse por ejemplo las líneas celulares de cáncer de mama activas Wnt en la Figura 24 o las muestras activas de cáncer de mama Hedgehog en la Figura 30).
El modelo de red Bayesiana ER construido y entrenado como se describe en el presente documento se utiliza para predecir la actividad de la ruta ER en un gran panel de líneas celulares de diversos cánceres, cuyos resultados se muestran en la Figura 27. Como era de esperar, las muestras con predicción de ER se encontraron en las líneas de células de cáncer de mama. Se predijo que todos los otros tipos de líneas celulares de cáncer tenían una ruta ER inactiva, que es como se esperaba.
El modelo de la red Bayesiana construido y entrenado para la ruta Hedgehog como se describe aquí se utiliza para predecir la actividad de la ruta Hedgehog para las líneas celulares de diversos tipos de cáncer en el conjunto de datos GSE34211. Las predicciones de actividad de Hedgehog se muestran en la Figura 28. Las más altas fracciones de la actividad de Hedgehog pronosticada se encuentran en los tipos de cáncer del sistema nervioso central (SNC), piel, endometrio y útero, lo que está de acuerdo con el conocimiento de la literatura con respecto a la proliferación celular dependiente de Hedgehog en estos tipos de células.
La Figura 29 muestra la actividad de Hedgehog pronosticada de las muestras de meduloblastoma (GSE10327) que ya se analizó usando el modelo de red Bayesiana de Wnt como se describe en el presente documento. Las muestras de meduloblastoma se han caracterizado en subclases, teniendo una de ellas una ruta de señalización activa de Hedgehog (identificador: SHH). Se prevé que todas las muestras en el subtipo SHH tengan una señalización activa de Hedgehog. Además, se predijo que las muestras de meduloblastoma en el subtipo Wnt también tenían una ruta Hedgehog activa. Esto está de acuerdo con la evidencia clínica que demuestra que a menudo ambas rutas son activas en estos tumores. Sin embargo, la red Bayesiana de Wnt fue claramente capaz de predecir correctamente la actividad Wnt solo en el subtipo Wnt. Así, la combinación de la red Bayesiana Wnt y Hedgehog es capaz de hacer una clasificación correcta de estos dos subtipos.
En la Figura 30 se muestra la predicción de la actividad de Hedgehog en las muestras de cáncer de mama GSE12276, utilizada anteriormente para predecir la actividad de ER usando el modelo de red Bayesiana ER, utilizando el modelo de red Bayesiana Hedgehog. Se prevé que la ruta Hedgehog esté activa en una fracción de las muestras de cada subtipo. Esto parece extraño, pero en concordancia con la predicción de la ruta ER mostrada en la Figura 26, se puede ver que la actividad de Hedgehog solo se predice en muestras que no tienen una ruta ER activa. Esto está en buen acuerdo con la hipótesis de que la proliferación celular no controlada en el tejido (de mama) puede ser impulsada por diferentes rutas de señalización.
En resumen, los resultados de las pruebas para varias muestras de tejido canceroso y células presentadas en las Figuras 21-30 sugieren fuertemente que las redes Bayesianas de los modelos Wnt, e R y Hedgehog entrenadas en muestras específicas de tejido/ruta son aplicables al análisis de muestras de otros tipos de tejido. Esto puede permitir que el análisis de la ruta de señalización celular se aplique al "tipo de tejido cruzado". Por lo tanto, el sistema CDS 10 (como se describe en el presente documento) se aplica fácilmente para evaluar la actividad de la ruta en un intervalo de tipos de tejidos distintos del tipo de tejido de las muestras utilizadas para formar el modelo de red Bayesiana 40 (véase, por ejemplo, (CDS) configurado para evaluar una o más rutas de señalización celular como se describe aquí (mostrado como ejemplo para la ruta Wnt)). En los casos en que los componentes de inferencia 40, 44, 46, 48 indiquen que el tejido analizado exhibe una actividad de rutas Wnt, ER o Hedgehog anormalmente alta, pero no hay fármaco específico de tejido disponible, el médico puede considerar un fármaco general de supresión de rutas Wnt, ER o Hedgehog con base en la recomendación 28 o en la recomendación 26, respectivamente, según lo dispuesto por el sistema CDS 10.
Aunque los resultados de las Figuras 21-30 indican la aplicabilidad del tipo de tejido cruzado del modelo de red Bayesiana para las rutas Wnt, ER y Hedgehog, se espera que para aplicaciones clínicas los modelos de red Bayesiana se puedan actualizar o adaptar opcionalmente para maximizar su aplicabilidad al tipo de tejido específico bajo análisis (por ejemplo, tejido mamario o tejido hepático). Tal actualización o adaptación podría, por ejemplo, implicar el ajuste de las probabilidades condicionales con base en estudios clínicos del tipo de tejido bajo análisis o enriquecer la lista de genes objetivo curada con evidencia, descrita en el presente documento, con genes objetivo específicos de tejido de la ruta investigada. Adicionalmente, pueden eliminarse o agregarse nodos para ajustar mejor el modelo de la red Bayesiana al tejido bajo análisis. Alternativamente, pueden entrenarse diferentes modelos de redes Bayesianas ab initio usando diferentes conjuntos de entrenamiento para los diferentes tipos de tejidos. Además, los resultados de las Figuras 21-30 ilustran la capacidad del procedimiento descrito en el presente documento para desarrollar y entrenar modelos de red Bayesiana usando listas de genes objetivo curadas con evidencia de rutas diferentes a Wnt, ER y Hedgehog para predecir y diagnosticar la actividad de la ruta.
Los resultados de ensayo del modelo de red Bayesiana AR construido y entrenado como se describe aquí se usaron a manera de ejemplo para predecir la actividad de AR en líneas celulares de cáncer de próstata LNCaP tratadas con diferentes regímenes de tratamiento (GSE7708) (véase la Figura 38). Como se esperaba, las células LNCaP no estimuladas con DHT resultan en una ruta AR predecible inactiva, mientras que se predijo correctamente que las células estimuladas con LNCaP tenían una ruta A r activa y las células LNCaP tratadas con Bicalutamida, un fármaco antiandrogénico, tenían una ruta AR inhibida.
La red Bayesiana entrenada de la ruta AR como se describe aquí también se usó para predecir la probabilidad de que la ruta AR sea activa en muestras de cáncer de próstata del conjunto de datos GSE17951 (los resultados se muestran en la Figura 39). Inesperadamente no se predijo que la mayoría de las biopsias y los tumores de próstata tenían una mayor probabilidad de actividad AR en comparación con las muestras de los controles.
El modelo de la red Bayesiana AR también se aplicó a una prueba de tejidos cruzados, a saber, las muestras de cáncer de mama incluidas en el conjunto de datos GSE12276. Los resultados de esta prueba se muestran en la Figura 40. Se prevé que una pequeña fracción de las muestras, que se encuentran en cada subgrupo, tiene una ruta activa, mientras que la gran mayoría de las muestras tenían una ruta AR inactiva. Sorprendentemente, el porcentaje más alto de muestras con una ruta AR activa se encuentra en el subgrupo HER2, lo cual no es inesperado ya que se sabe de la literatura que hay interferencia entre la ruta HER2 y AR y la ruta AR también puede ser inducida por la señalización de HER2-.
El modelo de red Bayesiana AR antes mencionado también se usó para predecir la actividad de la ruta AR en dos conjuntos de muestras de líneas celulares de diversos tipos de cáncer (GSE36133 y GSE34211), como se representa en la Figura 41 y Figura 42. Como era de esperar, se encontró que la mayoría de las líneas celulares tenían una ruta AR inactiva. Las excepciones a esto son las muestras de cáncer de próstata con varias muestras de líneas celulares de cáncer que expresan la actividad de la ruta AR. En la Tabla 12 se muestra que todas las predicciones de la actividad de la ruta AR de las muestras de cáncer de próstata están de acuerdo con la actividad AR conocida.
Tabla 12. Actividad AR conocida y predicha en líneas celulares de cáncer de próstata en conjuntos de datos GSE36133 GSE34211.
Figure imgf000026_0001
Figure imgf000027_0001
Ejemplo 7: Pronóstico con base en la actividad de la ruta
Se cree que las rutas de desarrollo temprano, como Wnt y Hedgehog, juegan un papel en la metástasis causada por las células cancerosas que han revertido a un fenotipo más similar a células madre, llamado células madre de cáncer. De hecho, existen pruebas suficientes de que las rutas de desarrollo precoces, como la ruta Wnt, juegan un papel en las metástasis del cáncer, permitiendo que las células cancerosas metastásicas comiencen a dividirse en la localización de siembra en otro órgano o tejido. La metástasis está asociada con un mal pronóstico, por lo que se espera que la actividad de las rutas de desarrollo precoces, como la ruta Wnt y Hedgehog, en las células cancerosas sea predictiva del mal pronóstico. Esto es apoyado por el hecho de que los pacientes con cáncer de mama, del conjunto de datos GSE12276, que fueron identificados con una ruta e R activa, pero que no tienen una ruta Wnt o Hedgehog activa utilizando los modelos de red Bayesiana descritos en este documento, tenía un mejor pronóstico que los pacientes identificados que tienen una ruta Hedgehog Wnt o ambas activa, como se ilustra en la gráfica de Kaplan-Meier de la Figura 37.
Ejemplo 8: Planificación de la terapia, predicción de la eficacia del fármaco, predicción de efectos adversos y monitorización de la eficacia del fármaco
El ejemplo siguiente ilustra cómo utilizar los modelos probabilísticos, en particular los modelos de red Bayesiana, para la planificación de la terapia, la predicción de la eficacia del fármaco, la supervisión de la eficacia del fármaco y las actividades relacionadas.
El modelo de la red bayesiana de la ruta ER, construido utilizando un nodo para la presencia del factor de transcripción, una capa de nodos que representan los niveles de ARNm de los genes objetivo (Tabla 2) y una capa de nodos que representan las intensidades de los sondas correspondientes a los genes objetivo (Tabla 2), análogo a la Figura 6 descrita en este documento, y entrenado como se describe en el presente documento, se usaron para predecir la actividad de la ruta. Posteriormente, se demuestra que la actividad de la ruta está correlacionada con la eficacia del fármaco o la eficacia del fármaco de control. Los resúmenes de los resultados se muestran en las Figuras 31 y 32.
El tamoxifeno es un fármaco utilizado actualmente para el tratamiento del cáncer de mama ER+ (receptor de estrógeno positivo). Actúa como un antagonista parcial del receptor de estrógenos que inhibe la proliferación celular incontrolada que se cree que es inducida por la señalización ER. Desafortunadamente, no todos los cánceres de mama responden al tratamiento con tamoxifeno, a pesar de la demostración de la presencia de proteína ER en células cancerosas mediante el análisis histopatológico de rutina de secciones de tejido de cáncer. Se han realizado muchos estudios para investigar esta llamada resistencia al tamoxifeno. El conjunto de datos GSE21618 disponible públicamente es el resultado de uno de dichos estudios y contiene datos de microarreglos de líneas de células MCF7 resistentes a tamoxifeno y de tipo salvaje bajo diferentes regímenes de tratamiento. El modelo de red Bayesiana ER construido y entrenado como se describe aquí se usa para analizar las líneas celulares resistentes a tamoxifeno y MCF7 bajo diferentes regímenes de tratamiento, cuyos resultados se muestran en la Figura 31.
Se prevé que la línea celular resistente a tamoxifeno, indicada por TamR.Ctrl, tenga una ruta ER inactiva para cada punto de tiempo después de la adición de tamoxifeno (1, 2, 3, 6, 12, 24 y 48 h). No es de extrañar que el tratamiento de la línea celular resistente al tamoxifeno, que es insensible al tratamiento con Tamoxifeno, con Tamoxifeno, indicado por TamR.Tam, es ineficaz, lo cual también se ilustra por la inactividad prevista de la ruta ER para este grupo sobre los mismos puntos de tiempo. De acuerdo con el análisis de la línea de células resistentes al tamoxifeno (TamR.Ctrl), la fuerza motriz de la proliferación celular no controlada no se debe a la señalización ER activa; por lo tanto, el tratamiento con un antagonista de ER no inhibe la proliferación celular. Esto ilustra que el tratamiento con tamoxifeno no se recomienda en el caso de una actividad de ruta ER predecible.
Por otra parte, la línea celular MCF7 de tipo salvaje, conocida como sensible al tamoxifeno, tratada con 17betaestradiol (wt1.E2) reacciona lentamente al tratamiento hormonal que es visible en las predicciones crecientes de actividad positiva de ER. El tratamiento de dicha línea celular con inhibidores de la aromatasa que se sabe que inhiben la producción de estrógenos, inhibirá la ruta ER, que se ilustra por la disminución de la predicción de la ruta ER en el tiempo. Apoyan esto las predicciones de ruta ER hechas con base en los datos de microarreglos de muestras MCF7 tratadas con estrógeno para aumentar el tiempo en el conjunto de datos GSE11324, mostrándose los resultados en la Figura 32.
Lo anterior ilustra la capacidad de los modelos probabilísticos, en particular los modelos de red Bayesiana, para ser utilizados en la planificación de la terapia, la predicción de la eficacia del fármaco y la monitorización de la eficacia del fármaco. Sin embargo, debe entenderse que la misma metodología también se aplicaría para predecir y controlar los efectos adversos.
Ejemplo 9: Desarrollo de fármacos
Similar a la monitorización de la respuesta a la terapia, puede utilizarse un modelo de ruta en el desarrollo de fármacos para evaluar la eficacia de diversos compuestos putativos. Por ejemplo, al escanear muchos compuestos para un posible efecto sobre una cierta ruta en una línea celular de cáncer, el modelo de ruta respectiva puede usarse para determinar si la actividad de la ruta sube o baja después de la aplicación del compuesto o no. A menudo, esta comprobación se realiza utilizando solo uno o algunos de los marcadores putativos de la actividad de la ruta, lo que aumenta la probabilidad de un seguimiento ineficaz del efecto del tratamiento. Además, en los estudios de seguimiento en animales o sujetos pacientes, los modelos de ruta pueden usarse de manera similar para evaluar la eficacia de los fármacos candidatos y para determinar una dosis óptima para afectar al máximo la actividad de la ruta.
Un ejemplo de monitorización ineficaz de nuevos compuestos de fármaco se ilustra mediante la actividad de la ruta AR predicha en las muestras de GSE7708 como se muestra en la Figura 38. En este estudio se han desarrollado dos posibles compuestos de fármacos para inhibir la actividad de la ruta AR, denominados Poliamida 1 y Poliamida 2. Se ha demostrado que estas dos poliamidas son capaces de inhibir la ruta AR con base en los hallazgos de que las poliamidas se unen al elemento de respuesta a los andrógenos (ARE) e inhiben la expresión de KLK3 (= PSA), un marcador bien conocido para la actividad AR también incluidos en la selección de genes objetivo tal como se describe en este documento, así como “ 35% de los transcritos que fueron inducidos por DHT. En contraste, el modelo de la red Bayesiana de la ruta AR predijo que estas muestras todavía tienen una ruta AR activa. La investigación de las probabilidades inferidas de los genes objetivo que se sobrerregulan utilizando el modelo de red Bayesiana para AR indicó que KLK3 en contraste con los otros genes objetivo fue subregulado de acuerdo con los hallazgos, mientras que todos los otros genes objetivo (excepto AR, GUCY1A3 y TMPRSS2 en el caso de la poliamida 1) se expresaron claramente diferencialmente en las muestras tratadas con poliamida 1 y poliamida 2. En otras palabras, solo un marcador para la actividad de AR, KLK3, fue subregulado, mientras que la mayoría de los genes objetivo identificados todavía se sobrerregularon indicando que la ruta AR sigue estando en gran medida intacta y, por tanto, activa. Teniendo en cuenta un mayor número de genes objetivo con base en la evidencia bibliográfica, los inventores fueron capaces de demostrar que la inhibición de la actividad AR de las poliamidas es limitada y que solo la expresión KLK3 está claramente subregulada usando estas poliamidas. Por otra parte, esto ilustra el valor de un enfoque sistemático utilizando un modelo de red Bayesiana en comparación con un enfoque reduccionista en el desarrollo de fármacos.
Ejemplo 10: Desarrollo de ensayo
En lugar de aplicar las redes Bayesianas mencionadas en los datos de entrada de ARNm procedentes de microarreglos o secuenciación de a Rn , puede ser beneficioso en aplicaciones clínicas desarrollar ensayos dedicados para realizar las mediciones de muestra, por ejemplo en una plataforma integrada usando qPCR para determinar los niveles de ARNm de genes objetivo. Las secuencias de ARN/ADN de los genes objetivo descritos pueden usarse entonces para determinar qué cebadores y sondas se seleccionan en dicha plataforma.
La validación de tal ensayo dedicado se puede hacer usando las redes Bayesianas con base en microarreglos como un modelo de referencia y verificando si el ensayo desarrollado da resultados similares en un conjunto de muestras de validación. Junto a un ensayo dedicado, esto también se puede hacer para construir y calibrar modelos de red Bayesiana similares usando datos de secuenciación de ARNm como medidas de entrada.
Ejemplo 11: Investigación de la ruta y investigación de la fisiopatología del cáncer
A continuación se ilustra cómo pueden emplearse modelos de redes Bayesianas en la investigación (clínica) de rutas, esto es, la investigación interesada en descubrir qué rutas están implicadas en ciertas enfermedades, las cuales pueden ser seguidas para una investigación más detallada, por ejemplo para vincular las mutaciones en las proteínas de señalización a los cambios en la activación de la ruta (medida con el modelo). Esto es relevante para investigar la iniciación, el crecimiento y la evolución y la metástasis de los cánceres específicos (la fisiopatología).
Los modelos de la red Bayesiana de las rutas Wnt, ER, Hedgehog y AR, construidos utilizando un nodo para la presencia del factor de transcripción, una capa de nodos que representan los niveles de ARNm de los genes objetivo (Tabla 1, Tabla 2, Tabla 3 y Tabla 4) y una capa de nodos que representan las intensidades de las sondas que corresponden a los genes objetivo (Tabla 1, Tabla 2, Tabla 3 y Tabla 4), análogas a la Figura 6 descritas aquí y entrenadas como se describe en el presente documento, se usó para predecir la actividad de la ruta de un conjunto de datos consistente en muestras de cáncer de mama (GSE12276).
Supongamos que el investigador está interesado en investigar la ruta o caminos de señalización celular y la(s) desregulación(es) específica(s) que impulsa(n) la proliferación celular incontrolada. El investigador puede analizar los datos de microarreglos utilizando los modelos probabilísticos antes mencionados, en particular los modelos de red Bayesiana, para encontrar qué rutas son presumiblemente la causa de la proliferación celular incontrolada. Se muestra en la Figura 33 y en la Figura 34 una ilustración de dicho análisis para el caso de la actividad de Wnt, ER y Hedgehog (muestras basales y luminal A del conjunto de datos GSE12276). Posteriormente, el investigador puede buscar en más detalle para encontrar la causa exacta de la desregulación de la ruta.
Con referencia a la Figura 34, se sabe que las muestras basales tienen un estado de receptor triple negativo (ER, PR y HER2), por lo tanto no es sorprendente ver que se predice que todas las muestras tienen una ruta ER inactiva. Por otra parte, se prevé que algunas de las muestras tienen tanto Wnt como Hedgehog o ambas activas como se muestra en la Figura 34. Estas actividades de la ruta predicha persuaden al investigador a investigar estas muestras con más detalle para, por ejemplo, mutaciones conocidas u otras desregulaciones conocidas en las rutas Wnt y/o Hedgehog.
Otro ejemplo se da en la Figura 33, en la que se ilustran las actividades Wnt, ER y Hedgehog en las muestras luminal A del conjunto de datos GSE12276. Se sabe que las muestras de Luminal A expresan ER, sin embargo esto no significa necesariamente que las propiedades cancerosas se deban a señalización ER activa. De las actividades de la ruta prevista se puede inferir que menos de la mitad de las muestras tienen una señalización ER activa. Sin embargo, se encuentran que algunas de las muestras que no tienen una señalización ER activa tienen una ruta Wnt y/o Hedgehog activa. Esto podría dar lugar a que el investigador explore estas muestras en detalles más cercanos en cuanto a los defectos en la ruta de señalización Wnt y/o Hedgehog, respectivamente. Algunas de las muestras no predicen ninguna de las tres rutas incluidas que son activas; tal vez otros caminos están causando las proliferaciones no controladas de células. También esto da al investigador información adicional para buscar defectos en otras rutas.
En resumen, las ilustraciones aquí descritas indican la capacidad de modelos de red Bayesiana entrenados (como se ha descrito anteriormente) para apoyar el proceso de encontrar la causa de la proliferación celular no controlada en un método más dirigido. Mediante el empleo de las redes Bayesianas para cribar las muestras con respecto a las actividades de la ruta, las actividades de la ruta prevista pueden identificar las rutas posibles para la proliferación celular, que pueden ser seguidas para una investigación más detallada, por ejemplo para vincular las mutaciones en las proteínas de señalización u otras desregulaciones conocidas a los cambios en la activación (medida con el modelo).
Tal como se describe en el presente documento, el proceso para desarrollar y formar una red Bayesiana de rutas de señalización celular puede usarse para construir un modelo de red Bayesiana para otras rutas que también podrían emplearse en relación con la presente invención.
Ejemplo 12: Inscripción del sujeto en un ensayo clínico con base en la actividad prevista
Si un fármaco candidato se desarrolla para, por ejemplo, bloquear la actividad de una determinada ruta que impulsa el crecimiento tumoral, y este fármaco está entrando en ensayos clínicos, resulta entonces esencial una selección adecuada de los sujetos que van a ser inscritos en tal ensayo es esencial para probar la efectividad potencial del fármaco. En tal caso, los pacientes que no tienen la ruta respectiva activada en sus tumores deben ser excluidos del ensayo, ya que es obvio que el fármaco no puede ser eficaz si la ruta no se activa en primer lugar. Por lo tanto, un modelo de ruta que puede predecir la actividad de la ruta se puede utilizar como una herramienta de selección, para seleccionar solo los pacientes que se prevé que tienen activada la ruta respectiva.
Ejemplo 13: Selección de las pruebas posteriores por realizar
Si se analiza un tumor utilizando diferentes modelos de rutas y los modelos predicen la desregulación de una cierta ruta, lo cual puede guiar entonces la selección de las pruebas posteriores por realizar. Por ejemplo, se puede ejecutar un ensayo de ligación de proximidad (PLA) para confirmar la presencia del respectivo complejo de transcripción (Soderberg O, 2006). Tal PLA puede diseñarse para dar un resultado positivo si dos proteínas clave en un complejo TF se han unido, por ejemplo, betacatenina y TCF4 en el complejo TF de la ruta Wnt.
Otro ejemplo es que la ruta cuya desregulación se ha predicho se analiza con más detalle con respecto a la cascada de señalización. Por ejemplo, se pueden analizar proteínas clave en esta ruta para determinar si hay mutaciones en las regiones de ADN que codifican para sus respectivos genes, o se puede probar la abundancia de estas proteínas para ver si son más alta o más baja de lo normal. Tales pruebas pueden indicar cuál es la causa raíz detrás de la desregulación de la ruta y dar una idea de los fármacos disponibles que podrían utilizarse para reducir la actividad de la ruta.
Estos ensayos se seleccionan para confirmar la actividad de la ruta identificada utilizando el modelo Bayesiano. Sin embargo, también es posible la selección de pruebas de diagnóstico complementarias. Después de la identificación de la ruta utilizando el modelo, para la elección de terapia dirigida solo deben realizarse las pruebas de diagnóstico complementario (la selección), que son aplicables a la ruta identificada.
Ejemplo 14: Selección de pruebas de diagnóstico asociadas
De manera similar al ejemplo anterior, si se analiza un tumor y los modelos de ruta predicen la desregulación de una determinada ruta, y opcionalmente se han realizado una serie de pruebas adicionales para investigar la causa de la desregulación, entonces un oncólogo puede seleccionar un número de fármacos candidatos para tratar al paciente. Sin embargo, el tratamiento con dicho fármaco puede requerir una prueba diagnóstica complementaria que se debe ejecutar primero, por ejemplo, para cumplir con las pautas clínicas o para asegurar el reembolso de los costes del tratamiento, o porque se requiere regulación (FDA) para llevar a cabo la prueba de diagnóstico acompañante para suministrar el fármaco. Un ejemplo de esta prueba de diagnóstico complementaria es la prueba Her2 para el tratamiento de pacientes con cáncer de mama con el fármaco Herceptin (Trastuzumab). Por lo tanto, el resultado de los modelos de ruta se puede utilizar para seleccionar los fármacos candidatos y las respectivas pruebas de diagnóstico complementarias que se han de realizar.
Ejemplo 15: Aplicación del CDS
Haciendo referencia a la Figura 20 (que muestra esquemáticamente un sistema de soporte de decisión clínica (CDS) configurado para evaluar una o más rutas de señalización celular como se describe aquí (mostrado como ejemplo para la ruta Wnt)), se implementa un sistema 10 de soporte de decisión clínica (CDS) como un ordenador 12 adecuadamente configurado. El ordenador 12 puede estar configurado para funcionar como el sistema CDS 10 ejecutando un software, un firmware u otras instrucciones adecuados almacenados en un medio de almacenamiento no transitorio (no mostrado) tal como un disco duro u otro medio de almacenamiento magnético, un disco óptico u otro medio de almacenamiento óptico, una memoria de acceso aleatorio (RAM), memoria de solo lectura (ROM), memoria instantánea u otro medio de almacenamiento electrónico, un servidor de red, etc. Aunque el sistema 10 CDS ilustrativo es ejecutado por el ordenador 12 ilustrativo, más generalmente el sistema CDS puede ser ejecutado por un dispositivo de procesamiento digital o un aparato que comprende un procesador digital configurado para llevar a cabo métodos de soporte de decisión clínica como se expone aquí. Por ejemplo, el dispositivo de procesamiento digital puede ser un dispositivo portátil (por ejemplo, un asistente de datos personales o un teléfono inteligente que ejecuta una aplicación CDS), un ordenador portátil, un ordenador de escritorio, un ordenador o dispositivo de tableta, un servidor de red remoto, etc. El ordenador 12 u otro dispositivo de procesamiento digital típicamente incluye o está conectado operativamente con un dispositivo 14 de visualización a través del cual se muestra información que incluye recomendaciones de soporte de decisión clínica al personal médico. El ordenador 12 u otro dispositivo de procesamiento digital típicamente también incluye o está conectado operativamente con uno o más dispositivos de entrada de usuario, tal como un teclado 16 ilustrativo, o un ratón, bola de desplazamiento, alfombrilla de desplazamiento, pantalla táctil (posiblemente integrada con el dispositivo 14 de visualización), u otro dispositivo de entrada de usuario con base en puntero, a través del cual el personal médico puede introducir información tal como órdenes operacionales para controlar el sistema CDS 10, datos para su uso por el sistema CDS 10, etc.
El sistema CDS 10 recibe como información de entrada perteneciente a un sujeto médico (por ejemplo, un paciente del hospital o un paciente ambulatorio que está siendo tratado por un oncólogo, médico u otro personal médico o una persona sometida a cribado de cáncer o algún otro diagnóstico médico conocido, o de quien se sospecha que tiene cierto tipo de cáncer, como cáncer de colon, cáncer de mama o cáncer de hígado, etc.). El sistema CDS 10 aplica diversos algoritmos de análisis de datos a esta información de entrada para generar recomendaciones de soporte de decisión clínica que son presentadas al personal médico a través del dispositivo 14 de visualización (o a través de un sintetizador de voz u otro dispositivo que proporcione una salida perceptible por el usuario). En algunas realizaciones, estos algoritmos pueden incluir la aplicación de una guía clínica al paciente. Una guía clínica es un conjunto almacenado de recomendaciones de tratamiento estándar o "canónicas", construidas típicamente sobre la base de recomendaciones de un panel de expertos médicos y opcionalmente formateadas en forma de un "diagrama de flujo" clíni
En los sistemas CDS ilustrativos descritos en el presente documento (por ejemplo, el sistema CDS 10), los algoritmos de análisis de datos de CDS incluyen uno o más algoritmos de diagnóstico o de prueba clínica que se ejecutan con la información genómica y/o proteómica de entrada adquirida por uno o más laboratorios 18 médicos. Los laboratorios pueden ubicarse de forma diversa "en el lugar", es decir, en el hospital u otro lugar donde el sujeto médico está siendo sometido a un examen y/o tratamiento médico, o "fuera del sitio", por ejemplo un laboratorio especializado y centralizado que recibe (por correo u otro servicio de entrega) una muestra de tejido del sujeto médico que se ha extraído del sujeto médico (por ejemplo, una muestra obtenida de una lesión de mama o de un colon de un sujeto médico de quien se sabe o sospecha que tiene cáncer de colon, o de un hígado de un sujeto médico de quien se sabe o sospecha que tiene cáncer de hígado, etc., mediante un procedimiento de biopsia u otro procedimiento de extracción de muestras). El tejido del que se extrae una muestra puede ser también tejido metastásico, por ejemplo tejido maligno (sospechado) procedente del colon, mama, hígado u otro órgano, que se ha diseminado fuera del colon, la mama, el hígado u otro órgano. En algunos casos, la muestra de tejido puede ser células tumorales circulantes, es decir, células tumorales que han entrado en el torrente sanguíneo y pueden extraerse como la muestra de tejido extraída usando técnicas de aislamiento adecuadas. La muestra extraída es procesada por el laboratorio para generar información genómica o proteómica. Por ejemplo, la muestra extraída puede ser procesada usando un microarreglo (también denominado en la técnica como un chip genético, chip de ADN, biochip, etc.) o mediante un procesamiento cuantitativo de reacción en cadena de la polimerasa (qPCR) para medir la información genómica o proteómica probatoria tal como los niveles de expresión de los genes de interés, por ejemplo en forma de un nivel de ácido ribonucleico mensajero (ARNm) que se transcribe a partir del gen, o un nivel de una proteína que se traduce del ARNm transcrito del gen. Como otro ejemplo, la muestra extraída puede ser procesada por un laboratorio de secuenciación génica para generar secuencias de ácido desoxirribonucleico (ADN), o para generar una secuencia de ARN, variación de número de copias, etc. Otros enfoques de medición contemplados incluyen inmunohistoquímica (IHC), citología, hibridación in situ por fluorescencia (FISH), ensayo de ligación de proximidad, etc., realizados en una sección patológica. Otra información que puede ser generada por el procesamiento de microarreglos, espectrometría de masas, secuenciación de genes u otras técnicas de laboratorio incluye información de metilación. También se pueden realizar diversas combinaciones de tales mediciones genómicas y/o proteómicas.
En algunas realizaciones, los laboratorios 18 médicos realizan una serie de adquisiciones de datos estandarizadas sobre la muestra extraída del tejido del sujeto médico, con el fin de generar una gran cantidad de datos genómicos y/o proteómicos. Por ejemplo, las técnicas de adquisición de datos estandarizadas pueden generar una secuencia de ADN (opcionalmente alineada) para uno o más cromosomas o porciones cromosómicas, o para todo el genoma del tejido. La aplicación de un microarreglo estándar puede generar miles o decenas de miles de elementos de datos, como niveles de expresión para un gran número de genes, varios datos de metilación, y así sucesivamente. Esta plétora de datos genómicos y/o proteómicos, o partes seleccionadas de los mismos, se introducen en el sistema CDS 10 para ser procesados de manera que se desarrolle información útil desde el punto de vista clíni
recomendaciones de soporte de decisión clínica.
Los sistemas CDS descritos y los métodos relacionados se refieren al procesamiento de datos genómicos y/o proteómicos para evaluar la actividad de diversas rutas de señalización celular. Sin embargo, debe entenderse que los sistemas CDS descritos (por ejemplo, el sistema CDS 10) opcionalmente pueden incluir adicionalmente diversas capacidades adicionales, tales como generar recomendaciones de soporte de decisión clínica de acuerdo con guías clínicas almacenadas con base en diversos datos de pacientes tales como monitorización de signos vitales, datos del paciente, datos demográficos del paciente (por ejemplo, sexo, edad, etc.), datos de imágenes médicas del paciente, etc. Alternativamente, en algunas realizaciones las capacidades del sistema CDS 10 pueden limitarse solamente a realizar análisis de datos genómicos y/o proteómicos para evaluar rutas de señalización celular como se describe en el presente documento.
Continuando con referencia a la Figura 20 de ejemplo, el sistema CDS 10 infiere la actividad de una ruta de señalización celular en el tejido del sujeto médico con base al menos en, pero sin limitarse a, niveles de expresión de genes objetivo de la ruta de señalización celular medida en la muestra y determina si la ruta de señalización celular está funcionando anormalmente en el tejido del sujeto médico con base en esta actividad inferida. Los ejemplos descritos en el presente documento se refieren a las rutas Wnt, ER, AR y Hedgehog como rutas de señalización celular ilustrativas. Estas rutas son de interés en diversas áreas de la oncología porque la pérdida de la regulación de las rutas puede ser una causa de la proliferación de un cáncer. Hay aproximadamente 10-15 rutas de señalización relevantes, y cada cáncer es impulsado por, en principio, una ruta dominante que está siendo desregulada. Sin limitarse a ninguna teoría particular de la operación, estas rutas regulan la proliferación celular y, consecuentemente, una pérdida de regulación de estas rutas en las células cancerosas puede conducir a que la ruta esté "siempre habilitada", acelerando así la proliferación de células cancerosas, que a su vez se manifiesta como un crecimiento, invasión o metástasis (propagación) del cáncer.
La medición de los niveles de expresión de ARNm de genes que codifican para proteínas reguladoras de la ruta de señalización celular, tal como una proteína intermedia que forma parte de una cascada de proteínas que forma la ruta de señalización celular, es una medida indirecta del nivel de expresión de la proteína reguladora y puede o puede no correlacionarse fuertemente con el nivel real de expresión de la proteína reguladora (mucho menos con la actividad global de la ruta de señalización celular). La ruta de señalización celular regula directamente la transcripción de los genes objetivo -por lo tanto, los niveles de expresión de ARNm transcritos a partir de los genes objetivo son un resultado directo de esta actividad reguladora-. Por lo tanto, el sistema CDS 10 infiere la actividad de la ruta de señalización celular (por ejemplo, las rutas Wnt, ER, AR y Hedgehog) con base al menos en los niveles de expresión de genes objetivo (nivel de ARNm o proteína como medida sustituta) de la ruta de señalización celular. Esto asegura que el sistema CDS 10 infiere la actividad de la ruta con base en información directa proporcionada por los niveles de expresión medidos a partir de los genes objetivo.
Sin embargo, si bien, como se describe en el presente documento, son eficaces para evaluar la actividad de las rutas globales, los niveles 20 de expresión medidos de los genes objetivo de las rutas no son especialmente informativos en cuanto a por qué las rutas están funcionando anormalmente (si es así). Dicho de otro modo, los niveles 20 de expresión medidos de los genes objetivo de una ruta pueden indicar que la ruta está funcionando anormalmente, pero no indican qué parte de la ruta está funcionando mal (por ejemplo, carece de regulación suficiente) para hacer que la ruta general funcione anormalmente.
Por consiguiente, si el sistema CDS 10 detecta una actividad anormal de una ruta particular, el sistema CDS 10 hace uso opcionalmente de otra información proporcionada por los laboratorios 18 médicos para la muestra extraída, tal como secuencias 22 genéticas alineadas y/o medidas(s) de expresión para uno o más genes reguladores de la ruta 24, o seleccionar la prueba diagnóstica que se va a realizar a continuación para evaluar qué parte de la ruta está funcionando mal. Para maximizar la eficacia, en algunas realizaciones esta evaluación opcional de por qué la ruta está funcionando incorrectamente se lleva a cabo solamente si el análisis de los niveles 20 de expresión medidos de los genes objetivo de la ruta indica que la ruta está funcionando anormalmente. En otras realizaciones, esta evaluación se integra en el análisis probabilístico de la ruta de señalización celular descrita en el presente documento.
En las realizaciones en las que el sistema CDS 10 evalúa qué parte de la ruta está funcionando mal y tiene éxito al hacerlo, la información adicional permite al sistema CDS 10 recomendar la prescripción de un fármaco dirigido al mal funcionamiento específico (recomendación 26 mostrada en la Figura 20). Si no se identifica ningún mal funcionamiento específico de la ruta (ya sea porque la evaluación adicional opcional no se realiza o porque esa evaluación no identifica ninguna porción particular de la ruta que está funcionando mal), entonces el sistema CDS 10 puede proporcionar una recomendación 28 por defecto recomendando la prescripción de un fármaco de supresión general para esta ruta particular (suponiendo que la actividad de la ruta anormal es actividad excesivamente alta).
Ejemplo 16: Un kit y herramientas de análisis para medir la actividad de la ruta
El conjunto de genes objetivo que han mostrado una mejor indicación de la actividad de la ruta específica, con base en la investigación con base en la secuenciación de microarreglos/ARN utilizando el modelo Bayesiano, puede traducirse en un ensayo de PCR cuantitativo multiplex para ser realizado en una muestra de tejido o célula. Para desarrollar una prueba aprobada por la FDA para la actividad de la ruta, se requiere el desarrollo de un kit de prueba estandarizado, que debe ser validado clínicamente en ensayos clínicos para obtener la aprobación regulatoria.
En general, debe entenderse que mientras que los ejemplos que son pertinentes a las rutas Wnt, ER, AR y Hedgehog se proporcionan como ejemplos ilustrativos, los enfoques para el análisis de la ruta de señalización celular descritos aquí se aplican fácilmente a otras rutas de señalización celular además de estas rutas, tales como las rutas de señalización intracelular con receptores en la membrana celular (ver más arriba) y las rutas de señalización intracelular con receptores dentro de la célula (ver más arriba). Además: Esta solicitud describe varias realizaciones preferidas. Pueden colegirse por otros modificaciones y alteraciones al leer y entender la descripción detallada precedente. Se pretende que la solicitud se interprete con la inclusión de todas las dichas modificaciones y alteraciones en la medida en que entren dentro del alcance de las reivindicaciones adjuntas o sus equivalentes.
Literatura:
de Sousa E Melo F, C. S. (2011). Methylation of cancer-stem-cell-associated Wnt target genes predicts poor prognosis in colorectal cancer patients. Cell Stem Cell., 476-485
Hatzis P, v. d. (2008). Genome-wide pattern of TCF7L2/TCF4 chromatin occupancy in colorectal cancer cells. Mol Cell Biol., 2732-2744
Neapolitan, R. (2004). Learning Bayesian networks. Pearson Prentice Hall
Nusse, R. (2012, May 1). Wnt target genes. Retrieved from The Wnt homepage: http://www. stanford.edu/group/nusselab/cgi-bin/wnt/target_genes
Soderberg O, G. M. (2006). Direct observation of individual endogenous protein complexes in situ by proximity ligation. Nat Methods., 995-1000
van de Wetering M, S. E.-P.-F. (2002). The beta-catenin/TCF-4 complex imposes a crypt progenitor phenotype on colorectal cancer cells. Cell, 241-250.

Claims (16)

REIVINDICACIONES
1. Un método que comprende:
inferir la actividad de una o más rutas de señalización celular en tejido de un sujeto médico con base al menos en el nivel o niveles (20) de expresión de uno o más genes objetivo de las rutas de señalización celular medidos en una muestra extraída del tejido del sujeto médico, en donde la inferencia comprende:
inferir la actividad de las rutas de señalización celular en el tejido del sujeto médico evaluando al menos una porción de un modelo probabilístico (40-1, ..., 40-7), preferiblemente una red Bayesiana (40-1, ..., 40-7), que representan las rutas de señalización celular para un conjunto de entradas que incluyen al menos los niveles (20) de expresión del uno o más genes objetivo de las rutas de señalización celular medidas en la muestras extraída del tejido del sujeto médico;
estimar un nivel (46) en el tejido del sujeto médico de al menos un elemento de factor de transcripción (TF), el al menos un elemento TF que controla la transcripción del uno o más genes objetivo de las rutas de señalización celular, estando basada la estimación al menos en parte en probabilidades condicionales que relacionan el al menos un elemento TF y los niveles (20) de expresión de uno o más genes objetivo de las rutas de señalización celular medidas en la muestra extraída del tejido del sujeto médico; e
inferir la actividad de la ruta de señalización celular con base en el nivel estimado en la muestra de tejido del elemento de factor de transcripción;
en el que la inferencia se realiza mediante un dispositivo (12) de procesamiento digital que utiliza el modelo probabilístico (40-1, ..., 40-7) de las rutas de señalización celular,
2. Un método de acuerdo con la reivindicación 1, en el que la inferencia comprende:
estimar un nivel (46) en el tejido del sujeto médico de al menos un elemento de factor de transcripción (TF) representado por un nodo TF del modelo probabilístico, controlando el elemento TF la transcripción del uno o más genes objetivo de las rutas de señalización celular, estando basada la estimación al menos en parte en las probabilidades condicionales del modelo probabilístico (40-1, ..., 40-7) relacionando el nodo TF y los nodos en el modelo probabilístico que representa el uno o más genes objetivo de las rutas de señalización celular, medidos en la muestra extraída del tejido del sujeto médico,
y en el que la inferencia se realiza preferiblemente utilizando una red Bayesiana (40-1, ..., 40-7) que comprende nodos que representan información sobre la ruta de señalización y relaciones de probabilidad condicional entre nodos conectados de la red Bayesiana.
3. El método de una cualquiera de las reivindicaciones 1 o 2, en el que las rutas de señalización celular comprenden una ruta Wnt, una ruta ER, una ruta AR y/o una ruta Hedgehog.
4. El método de la reivindicación 3, en el que la inferencia comprende:
inferir la actividad de una ruta Wnt en el tejido del sujeto médico con base en al menos en los niveles (20) de expresión de uno o más, preferiblemente al menos tres, genes objetivos de la ruta Wnt medida en la muestra extraída del tejido del sujeto médico seleccionado del grupo que comprende: KIAA1199, AXIN2, RNF43, TBX3, TDGF1, SOX9, ASCL2, IL8, SP5, ZNRF3, KLF6, CCND1, DEFA6 y FZD7.
5. El método de la reivindicación 3 o 4, en el que la inferencia (también) comprende:
inferir la actividad de una ruta ER en el tejido del sujeto médico con base en al menos en los niveles (20) de expresión de uno o más, preferiblemente al menos tres, genes objetivo de la ruta ER medidos en la muestra extraída del tejido del sujeto médico seleccionado del grupo que comprende: CDH26, SGK3, PGR, GREB1, CA12, XBP1, CELSR2, WISP2, DSCAM, ERBB2, CTSD, TFF1 y NRIP1.
6. El método de cualquiera de las reivindicaciones 3-5, en el que la inferencia (también) comprende:
inferir la actividad de una ruta Hedgehog en el tejido del sujeto médico con base en al menos en los niveles (20) de expresión de uno o más, preferiblemente al menos tres, genes objetivo de la ruta Hedgehog medidos en la muestra extraída del tejido del sujeto médico seleccionado del grupo que comprende: GLI1, PTCH1, PTCH2, IGFBP6, SPP1, CCND2, FST, FOXL1, CFLAR, TSC22D1, RAB34, S100A9, S100A7, MYCN, FOXM1, GLI3, TCEA2, FYN y CTSL1.
7. El método de cualquiera de las reivindicaciones 3-6, en el que la inferencia (también) comprende: inferir la actividad de una ruta AR en el tejido del sujeto médico con base en al menos en los niveles (20) de expresión de uno o más, preferiblemente al menos tres, genes objetivo de la ruta AR medidos en la muestra extraída del tejido del sujeto médico seleccionado del grupo que comprende: KLK2, PMEPA1, TMPRSS2, NKX3-1, ABCC4, KLK3, FKBP5, ELL2, UGT2B15, DHCR24, PPAP2A, NDRG1, LRIG1, CREB3L4, LCP1, GUCY1A3, AR y EAF2.
8. El método de la reivindicación 4, en el que la inferencia se basa adicionalmente en los niveles (20) de expresión de al menos un gen objetivo de la ruta Wnt medidos en la muestra extraída del tejido del sujeto médico seleccionados del grupo que comprende: NKD1, OAT, FAT1, LEF1, GLUL, REG1B, TCF7L2, COL18A1, BMP7, SLC1A2, ADRA2C, PPARG, DKK1, HNF1A y LECT2.
9. El método de la reivindicación 5, en el que la inferencia se basa adicionalmente en los niveles (20) de expresión de al menos un gen objetivo de la ruta ER medidos en la muestra extraída del tejido del sujeto médico seleccionados del grupo que comprende: AP1B1, ATP5J, COL18A1, COX7A2L, EBAG9, ESR1, HSPB1, IGFBP4, KRT19, MYC, NDUFV3, PISD, PRDM15, PTMA, RARA, SOD1 y TRIM25.
10. El método de la reivindicación 6, en el que la inferencia se basa adicionalmente en los niveles (20) de expresión de al menos un gen objetivo de la ruta Hedgehog medidos en la muestra extraída del tejido del sujeto médico seleccionados del grupo que comprende: BCL2, FOXA2, FOXF1, H19, HHIP, IL1R2, JAG2, JUP, MIF, MYLK, NKX2-2, NKX2-8, PITRM1 y TOM1.
11. El método de la reivindicación 7, en el que la inferencia se basa adicionalmente en los niveles (20) de expresión de al menos un gen objetivo de la ruta AR medidos en la muestra extraída del tejido del sujeto médico seleccionados del grupo que comprende: APP, NTS, PLAU, CDKN1A, DRG1, FGF8, IGF1, PRKACB, PTPN1, SGK1 y TACC2.
12. El método de una cualquiera de las reivindicaciones 1-11 que comprende:
inferir la actividad de una ruta Wnt en el tejido de un sujeto médico con base en al menos en los niveles (20) de expresión de dos, tres o más genes objetivo de un conjunto de genes objetivo de la ruta Wnt medidos en una muestra extraída del tejido del sujeto médico
y/o
inferir la actividad de una ruta ER en el tejido de un sujeto médico con base en al menos en los niveles (20) de expresión de dos, tres o más genes objetivo de un conjunto de genes objetivo de la ruta ER medidos en una muestra extraída del tejido del sujeto médico
y/o
inferir la actividad de una ruta Hedgehog en el tejido de un sujeto médico con base en al menos en los niveles (20) de expresión de dos, tres o más genes objetivo de un conjunto de genes objetivo de la ruta Hedgehog medidos en una muestra extraída del tejido del sujeto médico,
y/o
inferir la actividad de una ruta AR en el tejido de un sujeto médico con base en al menos en los niveles (20) de expresión de dos, tres o más genes objetivo de un conjunto de genes objetivo de la ruta AR medidos en una muestra extraída del tejido del sujeto médico.
13. El método de la reivindicación 12, en el que
el conjunto de genes objetivo de la ruta Wnt incluye al menos nueve, preferiblemente todos los genes objetivo seleccionados del grupo que comprende: KIAA1199, AXIN2, RNF43, TBX3, TDGF1, SOX9, ASCL2, IL8, SP5, ZNRF3, KLF6, CCND1, DEFA6 y FZD7,
y/o
el conjunto de genes objetivo de la ruta ER incluye al menos nueve, preferiblemente todos los genes objetivo seleccionados del grupo que comprende: CDH26, Sg K3, PGR, GREB1, CA12, XBP1, CELSR2, WISP2, DSCAM, ERBB2, CTSD, TFF1 y NRIP1,
y/o
el conjunto de genes objetivo de la ruta Hedgehog incluye al menos nueve, preferiblemente todos los genes objetivo seleccionados del grupo que comprende: GLI1, PTCH1, PTCH2, IGFBP6, SPP1, CCND2, FST, FOXL1, CFLAR, TSC22D1, RAB34, S100A9, S100A7, MYCN, FOXM1, GLI3, TCEA2, FYN y CTSL1,
y/o
el conjunto de genes objetivo de la ruta AR incluye al menos nueve, preferiblemente todos los genes objetivo seleccionados del grupo que comprende: KLK2, PMEPA1, TMPRSS2, NKX3-1, ABCC4, KLK3, FKBP5, ELL2, UGT2B15, DHCR24, PPAP2A, NDRG1, LRIG1, CREB3L4, LCP1, GUCY1A3, AR y EAF2.
14. El método de la reivindicación 13, en el que
el conjunto de genes objetivo de la ruta Wnt incluye además al menos un gen objetivo seleccionado del grupo que comprende: NKD1, OAT, FAT1, LEF1, GLUL, REG1B, TCF7L2, COL18A1, BMP7, SLC1A2, ADRA2C, PPARG, DKK1, HNF1A, y LECT2,
y/o
el conjunto de genes objetivo de la ruta ER incluye además al menos un gen objetivo seleccionado del grupo que comprende: AP1B1, ATP5J, COL18A1, COX7A2L, EBAG9, ESR1, HSPB1, IGFBP4, KRT19, MYC, NDUFV3, PISD, PRDM15, PTMA, RARA, SOD1 y TRIM25,
y/o
el conjunto de genes objetivo de la ruta Hedgehog incluye además al menos un gen objetivo seleccionado del grupo que comprende: BCL2, FOXA2, FOXF1, H19, HHIP, IL1R2, JAG2, JUP, MIF, MYLK, NKX2-2, NKX2-8, PITRM1 y TOM1,
y/o
el conjunto de genes objetivo de la ruta AR incluye además al menos un gen objetivo seleccionado del grupo que comprende:APP, NTS, PLAU, CDKN1A, DRG1, FGF8, IGF1, PRKACB, PTPN1, SGK1 y TACC2.
15. El método de cualquiera de las reivindicaciones 1-14, que comprende además:
determinar si las rutas de señalización celular está funcionando anormalmente en el tejido del sujeto médico con base en la actividad inferida de las rutas de señalización celular en el tejido del sujeto médico.
16. Un aparato que comprende un procesador (12) digital configurado para llevar a cabo un método según se expone en una cualquiera de las reivindicaciones 1-15 o un medio de almacenamiento no transitorio que almacena instrucciones que son ejecutables por un dispositivo (12) de procesamiento digital para realizar un método como el expuesto en una cualquiera de las reivindicaciones 1-15 o un programa de ordenar que comprende medios de código de programa para hacer que un dispositivo (12) de procesamiento digital realice un método como el expuesto en una cualquiera de las reivindicaciones 1-15.
ES16192584T 2011-07-19 2012-07-19 Evaluación de la actividad de la ruta de señalización celular utilizando un modelo probabilístico de la expresión del gen objetivo Active ES2700617T3 (es)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US201161509137P 2011-07-19 2011-07-19
EP11178148A EP2549399A1 (en) 2011-07-19 2011-08-19 Assessment of Wnt pathway activity using probabilistic modeling of target gene expression

Publications (1)

Publication Number Publication Date
ES2700617T3 true ES2700617T3 (es) 2019-02-18

Family

ID=44582424

Family Applications (3)

Application Number Title Priority Date Filing Date
ES12751371.1T Active ES2617195T3 (es) 2011-07-19 2012-07-19 Evaluación de la actividad de la ruta de señalización celular utilizando un modelo probabilístico de la expresión del gen objetivo
ES16192584T Active ES2700617T3 (es) 2011-07-19 2012-07-19 Evaluación de la actividad de la ruta de señalización celular utilizando un modelo probabilístico de la expresión del gen objetivo
ES18180343T Active ES2874452T3 (es) 2011-07-19 2012-07-19 Evaluación de la actividad de la ruta de señalización celular usando modelos probabilísticos de la expresión del gen diana

Family Applications Before (1)

Application Number Title Priority Date Filing Date
ES12751371.1T Active ES2617195T3 (es) 2011-07-19 2012-07-19 Evaluación de la actividad de la ruta de señalización celular utilizando un modelo probabilístico de la expresión del gen objetivo

Family Applications After (1)

Application Number Title Priority Date Filing Date
ES18180343T Active ES2874452T3 (es) 2011-07-19 2012-07-19 Evaluación de la actividad de la ruta de señalización celular usando modelos probabilísticos de la expresión del gen diana

Country Status (12)

Country Link
US (2) US11443831B2 (es)
EP (6) EP2549399A1 (es)
JP (3) JP6204354B2 (es)
KR (1) KR102064004B1 (es)
CN (2) CN103649337B (es)
BR (1) BR112014000965B8 (es)
DK (3) DK3173489T3 (es)
ES (3) ES2617195T3 (es)
IN (1) IN2014CN00675A (es)
MX (1) MX352827B (es)
RU (1) RU2719194C2 (es)
WO (1) WO2013011479A2 (es)

Families Citing this family (73)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11660317B2 (en) 2004-11-08 2023-05-30 The Johns Hopkins University Compositions comprising cardiosphere-derived cells for use in cell therapy
EP2549399A1 (en) 2011-07-19 2013-01-23 Koninklijke Philips Electronics N.V. Assessment of Wnt pathway activity using probabilistic modeling of target gene expression
RU2636000C2 (ru) 2012-02-28 2017-11-17 Новартис Аг ОТБОР БОЛЬНЫХ РАКОМ ДЛЯ ВВЕДЕНИЯ ИНГИБИТОРОВ СИГНАЛЬНОГО ПУТИ Wnt НА ОСНОВАНИИ СТАТУСА МУТАЦИИ RNF43
EP3563859B1 (en) 2012-08-13 2021-10-13 Cedars-Sinai Medical Center Cardiosphere-derived exosomes for tissue regeneration
KR102279844B1 (ko) * 2012-12-26 2021-07-21 코닌클리케 필립스 엔.브이. 타깃 유전자 발현의 선형 조합(들)을 사용한 세포 시그널링 경로 활성의 평가
TWI582239B (zh) * 2013-03-11 2017-05-11 諾華公司 與wnt抑制劑相關之標記
CA2909991A1 (en) * 2013-04-26 2014-10-30 Koninklijke Philips N.V. Medical prognosis and prediction of treatment response using multiple cellular signalling pathway activities
CN105706097A (zh) * 2013-06-28 2016-06-22 南托米克斯有限责任公司 用于诊断检测的识别的途径分析
JP2017502983A (ja) * 2013-10-02 2017-01-26 スリ テクノロジーズ エルティーディー. 不均一な腫瘍を処置するための患者特異的免疫療法
US11261495B2 (en) 2014-01-03 2022-03-01 Koninklijke Philips N.V. Assessment of the PI3K cellular signaling pathway activity using mathematical modelling of target gene expression
US9838847B2 (en) 2014-09-11 2017-12-05 Google LLP Data driven evaluation and rejection of trained Gaussian process-based wireless mean and standard deviation models
US9880257B2 (en) * 2014-09-11 2018-01-30 Google Llc Gaussian process-based approach for identifying correlation between wireless signals
US9810762B2 (en) * 2014-09-11 2017-11-07 Google Inc. Calculating mean wireless signal strengths using a gaussian process approach incorporating predictive standard deviations
CA2961725C (en) 2014-09-19 2023-04-04 The Provost, Fellows, Foundation Scholars, & The Other Members Of Board, Of The College Of The Holy And Undiv. Trinity Of Queen Elizabeth, Near Dublin A method of predicting risk of recurrence of cancer
JP6878274B2 (ja) 2014-10-03 2021-05-26 シーダーズ−サイナイ・メディカル・センターCedars−Sinai Medical Center 筋ジストロフィーの処置における心筋球由来細胞およびこのような細胞によって分泌されたエキソソーム
ES2857953T3 (es) 2014-10-24 2021-09-29 Koninklijke Philips Nv Pronóstico médico y predicción de la respuesta al tratamiento usando las actividades de múltiples rutas de señalización celular
AU2015334840B2 (en) 2014-10-24 2021-10-21 Innosign B.V. Assessment of TGF-beta cellular signaling pathway activity using mathematical modelling of target gene expression
EP3210144B1 (en) * 2014-10-24 2020-10-21 Koninklijke Philips N.V. Medical prognosis and prediction of treatment response using multiple cellular signaling pathway activities
CN105760707B (zh) * 2014-12-18 2018-07-31 中国科学院大连化学物理研究所 细胞基因翻译过程建模方法
JP7028763B2 (ja) * 2015-08-14 2022-03-02 コーニンクレッカ フィリップス エヌ ヴェ 標的遺伝子発現の数学的モデリングを使用するNFkB細胞シグナリング経路活性の評価
US20180247010A1 (en) * 2015-08-27 2018-08-30 Koninklijke Philips N.V. Integrated method and system for identifying functional patient-specific somatic aberations using multi-omic cancer profiles
CN106897578B (zh) * 2015-12-15 2020-02-14 中国科学院大连化学物理研究所 一种细胞基因翻译过程建模方法
WO2017123662A1 (en) 2016-01-11 2017-07-20 Cedars-Sinai Medical Center Cardiosphere-derived cells and exosomes secreted by such cells in the treatment of heart failure with preserved ejection fraction
US20170329914A1 (en) * 2016-05-11 2017-11-16 International Business Machines Corporation Predicting Personalized Cancer Metastasis Routes, Biological Mediators of Metastasis and Metastasis Blocking Therapies
US11351200B2 (en) 2016-06-03 2022-06-07 Cedars-Sinai Medical Center CDC-derived exosomes for treatment of ventricular tachyarrythmias
US10621236B2 (en) * 2016-09-16 2020-04-14 At&T Intellectual Property I, L.P. Concept based querying of graph databases
EP3515459A4 (en) 2016-09-20 2020-08-05 Cedars-Sinai Medical Center CELLS DERIVED FROM CARDIOSPHERES AND THEIR EXTRACELLULAR VESICLES TO DELAY OR REVERSE AGING AND AGE-RELATED DISORDERS
US11990209B2 (en) 2016-11-11 2024-05-21 University of Pittsburgh—Of the Commonwealth System of Higher Educat Identification of instance-specific somatic genome alterations with functional impact
US20190376142A1 (en) 2016-11-25 2019-12-12 Koninklijke Philips N.V. Method to distinguish tumor supressive foxo activity from oxidative stress
CN106755464A (zh) * 2017-01-11 2017-05-31 上海易毕恩基因科技有限公司 用于筛选肠癌和/或胃癌的基因标志物的方法、用该方法筛选的基因标志物及其用途
CN108300783A (zh) * 2017-01-11 2018-07-20 上海易毕恩基因科技有限公司 用于筛选肠癌和/或胃癌的基因标志物的方法、用该方法筛选的基因标志物及其用途
US11759482B2 (en) 2017-04-19 2023-09-19 Cedars-Sinai Medical Center Methods and compositions for treating skeletal muscular dystrophy
CN107184991B (zh) * 2017-05-03 2020-05-26 武汉爱博泰克生物科技有限公司 PRDM15基因序列在制备NF-κB抑制剂中的应用
CN107164508A (zh) * 2017-06-16 2017-09-15 上海易毕恩基因科技有限公司 用于检测肝癌的基因标志物及其用途
EP3431582A1 (en) 2017-07-18 2019-01-23 Koninklijke Philips N.V. Cell culturing materials
CN107201411A (zh) * 2017-07-27 2017-09-26 上海市长宁区妇幼保健院 Mylk基因作为诊断子宫内膜癌的标志物
CN107385051A (zh) * 2017-08-04 2017-11-24 上海易毕恩生物技术有限公司 用于检测肝肿瘤良恶性的基因标志物、试剂盒及检测方法
EP3462348A1 (en) * 2017-09-28 2019-04-03 Koninklijke Philips N.V. Bayesian inference
EP3692170A1 (en) 2017-10-02 2020-08-12 Koninklijke Philips N.V. Determining functional status of immune cells types and immune response
EP3461916A1 (en) 2017-10-02 2019-04-03 Koninklijke Philips N.V. Assessment of jak-stat3 cellular signaling pathway activity using mathematical modelling of target gene expression
EP3462349A1 (en) 2017-10-02 2019-04-03 Koninklijke Philips N.V. Assessment of notch cellular signaling pathway activity using mathematical modelling of target gene expression
EP3461915A1 (en) * 2017-10-02 2019-04-03 Koninklijke Philips N.V. Assessment of jak-stat1/2 cellular signaling pathway activity using mathematical modelling of target gene expression
EP3727351A4 (en) 2017-12-20 2021-10-06 Cedars-Sinai Medical Center MODIFIED EXTRACELLULAR VESICLES FOR IMPROVED TISSUE DELIVERY
EP3502279A1 (en) * 2017-12-20 2019-06-26 Koninklijke Philips N.V. Assessment of mapk-ap 1 cellular signaling pathway activity using mathematical modelling of target gene expression
US11475995B2 (en) * 2018-05-07 2022-10-18 Perthera, Inc. Integration of multi-omic data into a single scoring model for input into a treatment recommendation ranking
CN108875009B (zh) * 2018-06-16 2021-10-22 上海豹云网络信息服务有限公司 一种用于对数据文件进行动态处理的方法及系统
US11354591B2 (en) 2018-10-11 2022-06-07 International Business Machines Corporation Identifying gene signatures and corresponding biological pathways based on an automatically curated genomic database
CN111602201B (zh) * 2018-12-21 2023-08-01 北京哲源科技有限责任公司 获得细胞内确定性事件的方法、电子设备及存储介质
EP3963108A1 (en) 2019-05-03 2022-03-09 Koninklijke Philips N.V. Methods of prognosis in high-grade serous ovarian cancer
EP3812474A1 (en) 2019-10-22 2021-04-28 Koninklijke Philips N.V. Methods of prognosis in high-grade serous ovarian cancer
JP2022532161A (ja) * 2019-05-08 2022-07-13 シーダーズ―シナイ メディカル センター 治療活性細胞およびエクソソーム
EP3739588A1 (en) 2019-05-13 2020-11-18 Koninklijke Philips N.V. Assessment of multiple signaling pathway activity score in airway epithelial cells to predict airway epithelial abnormality and airway cancer risk
AU2020334901A1 (en) 2019-08-16 2022-03-24 Tempus Ai, Inc. Systems and methods for detecting cellular pathway dysregulation in cancer specimens
EP3822368A1 (en) 2019-11-14 2021-05-19 Koninklijke Philips N.V. Assessment of pr cellular signaling pathway activity using mathematical modelling of target gene expression
EP3835433A1 (en) 2019-12-12 2021-06-16 Koninklijke Philips N.V. Notch signaling pathway activity as prognostic marker in bladder cancer
US20210209478A1 (en) * 2019-12-12 2021-07-08 Tempus Labs, Inc. Real-World Evidence of Diagnostic Testing and Treatment Patterns in U.S. Breast Cancer Patients with Implications for Treatment Biomarkers from RNA-Sequencing Data
CN111139300B (zh) * 2020-02-19 2021-08-17 伯克利南京医学研究有限责任公司 一组结肠癌预后相关基因的应用
EP3882363A1 (en) 2020-03-17 2021-09-22 Koninklijke Philips N.V. Prognostic pathways for high risk sepsis patients
EP3978628A1 (en) 2020-10-01 2022-04-06 Koninklijke Philips N.V. Prognostic pathways for viral infections
EP4136261A1 (en) 2020-04-16 2023-02-22 InnoSIGN B.V. Prognostic pathways for viral infections
CN111739586B (zh) * 2020-06-17 2024-04-05 浙江大学 以87个基因作为生物标志物预测细胞增殖活性的模型
EP3940704A1 (en) 2020-07-14 2022-01-19 Koninklijke Philips N.V. Method for determining the differentiation state of a stem cell
EP3960875A1 (en) 2020-08-28 2022-03-02 Koninklijke Philips N.V. Pcr method and kit for determining pathway activity
EP3965119A1 (en) 2020-09-04 2022-03-09 Koninklijke Philips N.V. Methods for estimating heterogeneity of a tumour based on values for two or more genome mutation and/or gene expression related parameter, as well as corresponding devices
EP3974540A1 (en) 2020-09-25 2022-03-30 Koninklijke Philips N.V. Method for predicting immunotherapy resistance
EP4015651A1 (en) 2020-12-17 2022-06-22 Koninklijke Philips N.V. Treatment prediction and effectiveness of anti-tnf alpha treatment in ibd patients
EP4039825A1 (en) 2021-02-09 2022-08-10 Koninklijke Philips N.V. Comparison and standardization of cell and tissue culture
CN117295824A (zh) 2021-03-11 2023-12-26 皇家飞利浦有限公司 用于高风险脓毒症患者的预后通路
CN113278700B (zh) * 2021-06-04 2022-08-09 浙江省肿瘤医院 一种用于乳腺癌分型及预后预测的引物组及试剂盒
WO2023084039A1 (en) 2021-11-15 2023-05-19 Innosign B.V. Assessment of gr cellular signaling pathway activity using mathematical modelling of target gene expression
CN113963745A (zh) * 2021-12-07 2022-01-21 国际竹藤中心 一种构建植物发育分子调控网络的方法及其应用
WO2024033063A1 (en) 2022-08-12 2024-02-15 Innosign B.V. Prediction and monitoring of immunotherapy in cancer
CN116083590B (zh) * 2023-03-23 2024-03-22 雄安妙心医学检验有限公司 一种基因检测试剂盒及其制备方法和应用

Family Cites Families (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6566130B1 (en) * 2000-01-28 2003-05-20 Henry M. Jackson Foundation For The Advancement Of Military Medicine Androgen-regulated gene expressed in prostate tissue
US7371736B2 (en) 2001-11-07 2008-05-13 The Board Of Trustees Of The University Of Arkansas Gene expression profiling based identification of DKK1 as a potential therapeutic targets for controlling bone loss
EP1380644A1 (en) 2002-07-08 2004-01-14 Kylix B.V. The use of specified TCF target genes to identify drugs for the treatment of cancer, in particular colorectal cancer, in which TCF/beta-catenin/WNT signalling plays a central role
AU2003260973A1 (en) 2002-09-05 2004-03-29 Toolgen, Inc. Bioinformatics analysis of cellular effects of artificial transcription factors
CA2593355A1 (en) * 2005-01-24 2006-07-27 The Board Of Trustees Of The Leland Stanford Junior University Method for modeling cell signaling systems by means of bayesian networks
EP1910564A1 (en) * 2005-05-13 2008-04-16 Duke University Gene expression signatures for oncogenic pathway deregulation
EP1952326A4 (en) 2005-11-07 2010-08-04 Scanscout Inc TECHNIQUES FOR RENDERING ADVERTISEMENTS TO ENRICHED MEDIA
WO2007136787A2 (en) 2006-05-17 2007-11-29 The Trustees Of Boston University Method to determine transcriptional regulation pathways in organisms
WO2008086182A2 (en) * 2007-01-04 2008-07-17 University Of Rochester Use of gene signatures to design novel cancer treatment regimens
JP2010178650A (ja) 2009-02-04 2010-08-19 Univ Of Tokyo 固形癌の再発予測のための試験方法および再発予防剤
US20120252689A1 (en) 2011-04-01 2012-10-04 Zhong Wu Gene expression signature for wnt/b-catenin signaling pathway and use thereof
CN103874768A (zh) 2011-05-05 2014-06-18 临床基因组学股份有限公司 诊断肿瘤的方法
EP2549399A1 (en) 2011-07-19 2013-01-23 Koninklijke Philips Electronics N.V. Assessment of Wnt pathway activity using probabilistic modeling of target gene expression

Also Published As

Publication number Publication date
JP6204354B2 (ja) 2017-09-27
DK3173489T3 (en) 2018-12-10
EP3831957B1 (en) 2022-09-07
EP2549399A1 (en) 2013-01-23
RU2014106026A (ru) 2015-08-27
JP2019129850A (ja) 2019-08-08
JP2017205129A (ja) 2017-11-24
KR102064004B1 (ko) 2020-01-08
EP3173489B1 (en) 2018-09-19
CN103649337A (zh) 2014-03-19
IN2014CN00675A (es) 2015-04-03
KR20140046464A (ko) 2014-04-18
WO2013011479A3 (en) 2013-03-14
EP4130291C0 (en) 2024-01-10
MX352827B (es) 2017-12-11
US20140156200A1 (en) 2014-06-05
DK2734643T3 (en) 2017-03-20
ES2617195T3 (es) 2017-06-15
BR112014000965B1 (pt) 2021-08-24
EP4130291A1 (en) 2023-02-08
EP2734643B1 (en) 2016-12-07
EP3418396B1 (en) 2021-03-24
CN103649337B (zh) 2018-11-13
RU2719194C2 (ru) 2020-04-17
US11443831B2 (en) 2022-09-13
EP3831957A1 (en) 2021-06-09
EP2734643A2 (en) 2014-05-28
JP6807430B2 (ja) 2021-01-06
WO2013011479A2 (en) 2013-01-24
CN109852671A (zh) 2019-06-07
DK3418396T3 (da) 2021-05-25
JP2014520566A (ja) 2014-08-25
JP6783729B2 (ja) 2020-11-11
US20230105263A1 (en) 2023-04-06
BR112014000965A2 (pt) 2017-06-13
MX2014000557A (es) 2014-05-01
BR112014000965B8 (pt) 2022-11-08
EP3418396A1 (en) 2018-12-26
EP4130291B1 (en) 2024-01-10
ES2874452T3 (es) 2021-11-05
EP3173489A1 (en) 2017-05-31

Similar Documents

Publication Publication Date Title
ES2700617T3 (es) Evaluación de la actividad de la ruta de señalización celular utilizando un modelo probabilístico de la expresión del gen objetivo
AU2020202706B2 (en) Assessment of cellular signaling pathway activity using linear combination(s) of target gene expressions
AU2014259459B2 (en) Medical prognosis and prediction of treatment response using multiple cellular signalling pathway activities