ES2874452T3 - Evaluación de la actividad de la ruta de señalización celular usando modelos probabilísticos de la expresión del gen diana - Google Patents

Evaluación de la actividad de la ruta de señalización celular usando modelos probabilísticos de la expresión del gen diana Download PDF

Info

Publication number
ES2874452T3
ES2874452T3 ES18180343T ES18180343T ES2874452T3 ES 2874452 T3 ES2874452 T3 ES 2874452T3 ES 18180343 T ES18180343 T ES 18180343T ES 18180343 T ES18180343 T ES 18180343T ES 2874452 T3 ES2874452 T3 ES 2874452T3
Authority
ES
Spain
Prior art keywords
pathway
target genes
wnt
group
activity
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
ES18180343T
Other languages
English (en)
Inventor
Wilhelmus Franciscus Johannes Verhaegh
De Stolpe Anja Van
Ooijen Hendrik Jan Van
Kalyana Dulla
De Inda Marcia Alves
Ralf Hoffmann
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Koninklijke Philips NV
Original Assignee
Koninklijke Philips NV
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Koninklijke Philips NV filed Critical Koninklijke Philips NV
Application granted granted Critical
Publication of ES2874452T3 publication Critical patent/ES2874452T3/es
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6809Methods for determination or identification of nucleic acids involving differential detection
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6876Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
    • C12Q1/6883Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material
    • C12Q1/6886Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material for cancer
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N5/00Computing arrangements using knowledge-based models
    • G06N5/04Inference or reasoning models
    • G06N5/048Fuzzy inferencing
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B20/00ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B20/00ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
    • G16B20/20Allele or variant detection, e.g. single nucleotide polymorphism [SNP] detection
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B20/00ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
    • G16B20/30Detection of binding sites or motifs
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B25/00ICT specially adapted for hybridisation; ICT specially adapted for gene or protein expression
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B40/00ICT specially adapted for biostatistics; ICT specially adapted for bioinformatics-related machine learning or data mining, e.g. knowledge discovery or pattern finding
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B40/00ICT specially adapted for biostatistics; ICT specially adapted for bioinformatics-related machine learning or data mining, e.g. knowledge discovery or pattern finding
    • G16B40/20Supervised data analysis
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B5/00ICT specially adapted for modelling or simulations in systems biology, e.g. gene-regulatory networks, protein interaction networks or metabolic networks
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B5/00ICT specially adapted for modelling or simulations in systems biology, e.g. gene-regulatory networks, protein interaction networks or metabolic networks
    • G16B5/20Probabilistic models
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/106Pharmacogenomics, i.e. genetic variability in individual responses to drugs and drug metabolism
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/112Disease subtyping, staging or classification
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/158Expression markers

Landscapes

  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Chemical & Material Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Biotechnology (AREA)
  • Medical Informatics (AREA)
  • Biophysics (AREA)
  • Theoretical Computer Science (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Molecular Biology (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Evolutionary Biology (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Analytical Chemistry (AREA)
  • Genetics & Genomics (AREA)
  • Organic Chemistry (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Data Mining & Analysis (AREA)
  • Immunology (AREA)
  • Software Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Computation (AREA)
  • Physiology (AREA)
  • Microbiology (AREA)
  • Biochemistry (AREA)
  • Databases & Information Systems (AREA)
  • Bioethics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Epidemiology (AREA)
  • Public Health (AREA)
  • Pathology (AREA)
  • Probability & Statistics with Applications (AREA)
  • Hospice & Palliative Care (AREA)
  • Oncology (AREA)
  • Mathematical Physics (AREA)

Abstract

Un producto que comprende cebadores para inferir la actividad de las rutas de señalización celular mediante la determinación de los niveles de expresión de conjuntos de genes diana de las respectivas rutas de señalización celular en el que las rutas de señalización celular comprenden una ruta Wnt, una ruta ER, una ruta AR y una ruta Hedgehog, en el que el conjunto de genes diana de la ruta Wnt comprende más de tres genes diana seleccionados del grupo que comprende: KIAA1199, AXIN2, RNF43, TBX3, TDGF1, SOX9, ASCL2, IL8, SP5, ZNRF3, KLF6, CCND1, DEFA6 y FZD7, en el que el conjunto de genes diana de la ruta ER comprende al menos tres genes diana seleccionados del grupo que comprende: CDH26, SGK3, PGR, GREB1, CA12, XBP1, CELSR2, WISP2, DSCAM, ERBB2, CTSD, TFF1 y NRIP1, en el que el conjunto de genes diana de la ruta Hedgehog comprende al menos tres genes diana seleccionados del grupo que comprende: GLI1, PTCH1, PTCH2, IGFBP6, SPP1, CCND2, FST, FOXL1, CFLAR, TSC22D1, RAB34, S100A9, S100A7, MYCN, FOXM1, GLI3, TCEA2, FYN y CTSL1, en el que el conjunto de genes diana de la ruta AR comprende al menos tres genes diana seleccionados del grupo que comprende: KLK2, PMEPA1, TMPRSS2, NKX3-1, ABCC4, KLK3, FKBP5, ELL2, UGT2B15, DHCR24, PPAP2A, NDRG1, LRIG1, CREB3L4, LCP1, GUCY1A3, AR y EAF2, y en el que el producto es un kit de PCR.

Description

DESCRIPCIÓN
Evaluación de la actividad de la ruta de señalización celular usando modelos probabilísticos de la expresión del gen diana
El tema descrito en este documento se refiere principalmente a bioinformática, artes de procesamiento genómico, artes de procesamiento proteómico y artes relacionadas.
Los análisis genómicos y proteómicos se han realizado sustancialmente y son potencialmente prometedores para la aplicación clínica en campos médicos tales como la oncología, donde se sabe que diversos cánceres están asociados con combinaciones específicas de mutaciones/variaciones genómicas y/o niveles de expresión altos o bajos para genes específicos, que juegan un papel en el crecimiento y la evolución del cáncer, por ejemplo, proliferación celular y metástasis. Por ejemplo, la ruta de señalización de Wnt afecta la regulación de la proliferación celular y está altamente regulada. La alta actividad de la ruta Wnt debido a la pérdida de regulación se ha correlacionado con cáncer, entre los cuales con tumores de colon malignos. Aunque no se limita a ninguna teoría particular de funcionamiento, se cree que la desregulación de la ruta Wnt en las células de colon malignas conduce a una alta actividad de la ruta de Wnt que a su vez provoca la proliferación celular de las células de colon malignas, es decir, la propagación del cáncer de colon. Por otro lado, la actividad de la ruta anormalmente baja también podría ser de interés, por ejemplo, en el caso de la osteoporosis.
Las tecnologías para adquirir datos genómicos y proteómicos se han vuelto fácilmente disponibles en entornos clínicos. Por ejemplo, las mediciones mediante micromatrices se emplean de forma rutinaria para evaluar los niveles de expresión génica, los niveles de proteínas, la metilación, etc. La secuenciación de genes automatizada permite la identificación rentable de variaciones genéticas en el ADN y el ARNm. La evaluación cuantitativa de los niveles de ARNm durante la secuenciación de genes es prometedora como otra herramienta clínica más para evaluar los niveles de expresión de genes.
A pesar de (o, quizás, debido a) estos avances, la aplicación clínica de los análisis genómicos y proteómicos se enfrenta a un obstáculo sustancial: la sobrecarga de datos. Por ejemplo, el número de mutaciones identificables en una sola muestra clínica puede ascender a cientos de miles o más. La mayoría de estas mutaciones son las llamadas mutaciones transeúntes sin una contribución específica al crecimiento del cáncer, y solo unas pocas contribuyen al crecimiento del cáncer y la evolución funcional, y estas presentan los objetivos para un tratamiento eficaz. Una sola micromatriz puede generar niveles de expresión génica para decenas de miles de genes. Procesar estas grandes cantidades de datos para identificar información clínicamente útil, como por ejemplo en la aplicación de la elección de la terapia adecuada, es difícil.
Un enfoque consiste en limitar el análisis a unas pocas pruebas canónicas o estandarizadas, tales como las pruebas aprobadas por the U.S. Food and Drug Administration (FDA). En dicho enfoque, se detecta un indicador específico o una combinación de indicadores (por ejemplo, mutaciones y/o niveles específicos de expresión génica altos o bajos) para dar un resultado "positivo" para la enfermedad indicada (por ejemplo, un tipo particular de cáncer). La prueba canónica está respaldada por estudios clínicos que han mostrado una fuerte correlación con la enfermedad o con la eficacia del tratamiento. Este enfoque es útil solo para aquellas condiciones clínicas para las que se ha desarrollado una prueba canónica, por ejemplo diagnóstico específico de una enfermedad, o predecir la respuesta a un fármaco en un tipo de cáncer específico en una etapa específica, y también es rígido ya que solo es aplicable para las condiciones canónicas.
Otro enfoque se basa en la identificación de grupos funcionalmente relacionados de indicadores genómicos o proteómicos. Por ejemplo, la ruta Wnt comprende una cascada de reacciones proteómicas. Los componentes principales de esta cadena incluyen (pero no se limitan a) la unión de la proteína de señalización Wnt a un receptor de superficie frizzled de la célula que causa la activación de proteínas de la familia desordenada de proteínas que a su vez impactan el nivel de agentes de transcripción tales como complejos proteicos basados en p-catenina/TCF4 en el núcleo celular. Estos agentes de transcripción, a su vez, controlan la transcripción de moléculas de ARNm diana que a su vez se traducen en proteínas diana de la ruta Wnt. Los estudios clínicos han demostrado algunas correlaciones entre las proteínas reguladoras de la ruta Wnt y la actividad de la ruta Wnt.
Sin embargo, aplicar tales resultados de estudios clínicos al diagnóstico y evaluación clínica de un paciente específico es difícil debido a la complejidad de las rutas de señalización, por ejemplo la ruta Wnt. Como ejemplo simple, la medición del nivel de expresión de una proteína que está "aguas arriba" en la ruta Wnt puede no detectar el comportamiento anormal de una proteína que está "corriente abajo" en la ruta Wnt. Se cree que la ruta Wnt incluye numerosos mecanismos de retroalimentación y el concepto simplificado de "aguas arriba" y "corriente abajo" puede ser inaplicable para una parte sustancial de la ruta Wnt; más generalmente, el comportamiento anormal en una porción de la cascada de proteínas que comprende la ruta Wnt puede tener más o menos efecto sobre otras porciones de la cascada de proteínas y sobre la actividad de la ruta Wnt en su conjunto. Además, en algunos estudios clínicos, los niveles de expresión de proteínas para las proteínas reguladoras de la cascada de señalización se evalúan midiendo los niveles de expresión de ARNm de los genes que codifican las proteínas reguladoras. Esta es una medición indirecta que puede no evaluar con precisión el nivel de expresión de la proteína reguladora y casi nunca refleja la cantidad de proteínas activas (después de una modificación postraduccional específica como la fosforilación).
El principal problema subyacente a la presente invención fue, de este modo, proporcionar medios apropiados para realizar análisis genómicos y, respectivamente, proteómicos. Los aspectos específicos del problema subyacente, así como las objeciones adicionales en relación con la presente invención, se hacen evidentes al estudiar la descripción, los ejemplos proporcionados en este documento y, en particular, al estudiar las reivindicaciones adjuntas.
El análisis de expresión de micromatrices se conoce generalmente en la técnica. Por ejemplo, el documento US 2007/112630 A1 describe un análisis de expresión de micromatrices para perfilar el mieloma múltiple. El documento WO 2006/124836 A1 describe un análisis de expresión de micromatrices para identificar rutas desreguladas en el cáncer. El documento WO 2012/135845 A1 es una solicitud pospublicada de conformidad con el art. 54(3) EPC y describe una firma de expresión génica para una ruta WNT/beta-catenina, así como una micromatriz que proporciona la detección de la misma.
La presente invención proporciona productos nuevos y mejorados y sus usos como se describe en las reivindicaciones independientes. Las reivindicaciones dependientes definen realizaciones ventajosas. Los productos son útiles para ser empleados en métodos y aparatos como se describe en este documento.
De acuerdo con un aspecto principal de la presente invención, el problema anterior se resuelve mediante un producto que comprende cebadores para inferir la actividad de una o más rutas de señalización celular determinando los niveles de expresión de uno o más conjunto (s) de genes diana de la (s) ruta (s) de señalización celular respectiva (s), en el que la (s) ruta (s) de señalización celular comprende (n) una ruta Wnt, una ruta ER, una ruta AR y una ruta Hedgehog, en el que el conjunto de genes diana de la ruta Wnt comprende más de tres genes diana seleccionados del grupo que comprende: KIAA1199, AXIN2, RNF43, TBX3, TDGF1, SOX9, ASCL2, IL8, SP5, ZNRF3, KLF6, CCND1, DEFA6 y FZD7, en el que el conjunto de genes diana de la ruta ER comprende al menos tres genes diana seleccionados del grupo que comprende: CDH26, SGK3, PGR, GREB1, CA12, XBP1, CELSR2, WISP2, DSCAM, ERBB2, CTSD, TFF1 y NRIP1, en el que el conjunto de genes diana de la ruta Hedgehog comprende al menos tres genes diana seleccionados del grupo que comprende: GLI1, PTCH1, PTCH2, IGFBP6, SPP1, CCND2, FST, FOXL1, CFLAR, TSC22D1, RAB34, S100A9, S100A7, MYCN, FOXM1, GLI3, TCEA2, FYN y CTSL1, en el que el conjunto de genes diana de la ruta AR comprende al menos tres genes diana seleccionados del grupo que comprende: KLK2, PMEPA1, TMPRSS2, NKX3-1, ABCC4, KLK3, FKBP5, ELL2, UGT2B15, DHCR24, PPAP2A, NDRG1, LRIG1, CREB3L4, LCP1, GUCY1A3, AR y EAF2, y en el que el producto es un kit de PCR.
Un aspecto adicional de la presente invención se refiere al uso de un producto para inferir la actividad de una o más rutas de señalización celular determinando los niveles de expresión de al menos tres genes diana (como se describe a continuación), en el que la ruta de señalización celular comprende una ruta Wnt, una ruta ER, una ruta AR y una ruta Hedgehog, y en la que los al menos tres genes diana de la ruta Wnt se seleccionan del grupo que comprende: KIAA1199, AXIN2, RNF43, TBX3, TDGF1, SOX9, ASCL2, IL8, SP5, ZNRF3, KLF6, CCND1, DEFA6 y FZD7, en el que los al menos tres genes diana de la ruta ER se seleccionan del grupo que comprende: CDH26, SGK3, PGR, GREB1, CA12, XBP1, CELSR2, WISP2, DSCAM, ERBB2, CTSD, TFF1 y NRIP1, en el que al menos tres genes diana de la ruta Hedgehog se seleccionan del grupo que comprende: GLI1, PTCH1, PTCH2, IGFBP6, SPP1, CCND2, FST, FOXL1, CFLAR, TSC22D1, RAB34, S100A9, S100A7, MYCN, FOXM1, GLI3, TCEA2, FYN y CTSL1, en el que los al menos tres genes diana de la ruta AR se seleccionan del grupo que comprende: KLK2, PMEPA1, TMPRSS2, NKX3-1, ABCC4, KLK3, FKBP5, ELL2, UGT2B15, DHCR24, PPAP2A, NDRG1, LRIG1, CREB3L4, LCP1, GUCY1A3, AR y EAF2.
El producto se puede emplear en un método específico para evaluar la actividad de la ruta de señalización celular usando un modelo probabilístico de la expresión del gen diana, a saber, un método que comprende:
inferir la actividad de una o más rutas de señalización celular en el tejido de un sujeto médico basado al menos en el (los) nivel (es) de expresión (en particular en el nivel de ARNm y/o proteína) del uno o más genes diana de la (s) ruta (s) de señalización celular medidos en una muestra extraída del tejido del sujeto médico, en el que la inferencia comprende:
inferir la actividad de la (s) ruta (s) de señalización celular en el tejido del sujeto médico mediante la evaluación de al menos una porción de un modelo probabilístico, preferiblemente una red bayesiana, que representa la (s) ruta (s) de señalización celular para un conjunto de entradas que incluyen al menos el (los) nivel (es) de expresión del uno o más genes diana de la (s) ruta (s) de señalización celular medidas en la muestra extraída del tejido del sujeto médico;
estimar un nivel en el tejido del sujeto médico de al menos un elemento de factor de transcripción (TF), controlando el al menos un elemento de TF la transcripción del uno o más genes diana de la (s) ruta (s) de señalización celular, la estimación que se basa, al menos en parte, en probabilidades condicionales que relacionan el al menos un elemento TF y el (los) nivel (es) de expresión del uno o más genes diana de la (s) ruta (s) de señalización celular medidas en la muestra extraída del tejido del sujeto médico; e
inferir la actividad de la (s) ruta (s) de señalización celular en base a el nivel estimado en la muestra de tejido del factor de transcripción; y
determinar si la (s) ruta (s) de señalización celular está/están operando anormalmente en el tejido del sujeto médico se basa en la actividad inferida de la (s) ruta (s) de señalización celular en el tejido del sujeto médico; en el que la inferencia se realiza mediante un dispositivo de procesamiento digital usando el modelo probabilístico de la (s) ruta (s) de señalización celular.
El (los) "gen (es) diana" puede (n) ser "genes diana directos" y/o "genes diana indirectos" (como se describe en este documento).
Preferiblemente, la inferencia comprende estimar un nivel en el tejido del sujeto médico de al menos un elemento de factor de transcripción (TF) representado por un nodo TF del modelo probabilístico, controlando el elemento TF la transcripción del uno o más gene (s) diana de la (s) ruta (s) de señalización celular, la estimación se basa, al menos en parte, en probabilidades condicionales del modelo probabilístico que relaciona el nodo TF y los nodos en el modelo probabilístico que representa uno o más genes diana de la señalización celular ruta (s) medida en la muestra extraída del tejido del sujeto médico.
El modelo probabilístico puede ser un modelo de red bayesiana. De este modo, la inferencia se realiza preferiblemente usando una red bayesiana que comprende nodos que representan información sobre la (s) ruta (s) de señalización y las relaciones de probabilidad condicionales entre los nodos conectados de la red bayesiana. La (s) ruta (s) de señalización celular es una ruta Wnt, una ruta ER (receptor de estrógeno), una ruta AR (receptor de andrógenos) y/o una ruta Hedgehog. De este modo, la (s) ruta (s) de señalización celular comprenden (n) una ruta Wnt, una ruta ER, una ruta AR y/o una ruta Hedgehog.
En este texto se describen genes diana particularmente apropiados, así como en los ejemplos siguientes (véanse, por ejemplo, las tablas 1 - 9).
De este modo, según una realización preferida, el (los) genes diana se selecciona (n) del grupo que comprende o consiste en genes diana enumerados en la tabla 1 o la tabla 6 (para la ruta Wnt), genes diana enumerados en la tabla 2, tabla 5 o tabla 7 (para la ruta ER), genes diana enumerados en la tabla 3 o tabla 8 (para la ruta Hedgehog) y genes diana enumerados en la tabla 4 o Tabla 9 (para la ruta AR).
En una realización preferida, los al menos tres genes diana de la ruta Wnt se seleccionan además del grupo que comprende o consiste en: NKD1, OAT, FAT1, LEF1, GLUL, REG1B, TCF7L2, COL18A1, BMP7, SLC1A2, ADRA2C, PPARG, DKK1, HNF1A y LECT2.
En una realización preferida, los al menos tres genes diana de la ruta ER se seleccionan además del grupo que comprende o consiste en: AP1B1, ATP5J, COL18A1, COX7A2L, EBAG9, ESR1, HSPB1, IGFBP4, KRT19, MYC, NDUFV3, PISD, PREDM15, PTMA, RARA, SOD1 y TRIM25.
En una realización preferida, los al menos tres genes diana de la ruta Hedgehog se seleccionan además del grupo que comprende o consiste en: BCL2, FOXA2, FOXF1, H19, HHIP, ILIR2, JAG2, JUP, MIF, MYLK, NKX2.2, NKX2.8, PITRM1 y TOM1.
En una realización preferida, los al menos tres genes diana de la ruta AR se seleccionan además del grupo que comprende o consiste en: APP, NTS, PLAU, CDKN1A, DRG1, FGF8, IGF1, PRKACB, PTPN1, SGK1 y TACC2. Preferiblemente,
el conjunto de genes diana de la ruta Wnt incluye al menos nueve, preferiblemente todos los genes diana seleccionados del grupo que comprende o consiste en: KIAA1199, AXIN2, RNF43, TBX3, TDGF1, SOX9, ASCL2, IL8, SP5, ZNRF3, KLF6, CCND1, DEFA6 y FZD7,
y/o
el conjunto de genes diana de la ruta ER incluye al menos nueve, preferiblemente todos los genes diana seleccionados del grupo que comprende o consiste en: CDH26, SGK3, PGR, GREB1, CA12, XBP1, CELSR2, WISP2, DSCAM, ERBB2, CTSD, TFF1 y NRIP1,
y/o
el conjunto de genes diana de la ruta Hedgehog incluye al menos nueve, preferiblemente todos los genes diana seleccionados del grupo que comprende o consiste en: GLI1, PTCH1, PTCH2, IGFBP6, SPP1, CCND2, FST, FOXL1, CFLAR, TSC22D1, RAB34, S100A9, S100A7, MYCN, FOXM1, GLI3, TCEA2, FYN y CTSL1,
y/o
el conjunto de genes diana de la ruta AR incluye al menos nueve, preferiblemente todos los genes diana seleccionados del grupo que comprende o consiste en: KLK2, PMEPA1, TMPRSS2, NKX3_1, ABCC4, KLK3, FKBP5, ELL2, UGT2B15, DHCR24, PPAP2A, NDRG1, LRIG1, CREB3L4, LCP1, GUCY1A3, AR y EAF2.
La (s) muestra (s) que se usarán de acuerdo con la presente invención pueden ser, por ejemplo, una muestra obtenida de una lesión mamaria o del colon de un sujeto médico que se sabe o se sospecha que tiene cáncer de colon, o de un hígado de un sujeto médico que se sabe o se sospecha que tiene cáncer de hígado, o así sucesivamente, preferiblemente mediante un procedimiento de biopsia u otro procedimiento de extracción de muestras. El tejido del que se extrae una muestra también puede ser tejido metastásico, por ejemplo, (sospecha de) tejido maligno que se origina en el colon, la mama, el hígado u otro órgano que se ha extendido fuera del colon, la mama, el hígado u otro órgano. En algunos casos, la muestra de tejido puede ser células tumorales circulantes, es decir, células tumorales que han entrado en el torrente sanguíneo y se pueden extraer como muestra de tejido extraída usando técnicas de aislamiento apropiadas.
Otro aspecto descrito se refiere al uso de un medio de almacenamiento no transitorio como se describe en este documento o un programa informático como se describe en este documento para el diagnóstico específico de una enfermedad o predecir la respuesta a un fármaco en un tipo de cáncer específico en una etapa específica.
De acuerdo con otro aspecto descrito, un aparato que comprende un procesador digital está configurado para realizar un método como se describe en este documento.
De acuerdo con otro aspecto descrito, un medio de almacenamiento no transitorio almacena instrucciones que son ejecutables por un dispositivo de procesamiento digital para realizar un método como se describe en este documento. El medio de almacenamiento no transitorio puede ser un medio de almacenamiento legible por computadora, tal como un disco duro u otro medio de almacenamiento magnético, un disco óptico u otro medio de almacenamiento óptico, una memoria de acceso aleatorio (RAM), una memoria de solo lectura (ROM), memoria flash u otro medio de almacenamiento electrónico, un servidor de red, etc. El dispositivo de procesamiento digital puede ser un dispositivo portátil (por ejemplo, un asistente de datos personales o un teléfono inteligente), un ordenador portátil, un ordenador de escritorio, una tableta o dispositivo, un servidor de red remoto, etc.
De acuerdo con otro aspecto descrito, un programa informático comprende medios de código de programa para hacer que un dispositivo de procesamiento digital realice un método como se describe en este documento. El dispositivo de procesamiento digital puede ser un dispositivo portátil (por ejemplo, un asistente de datos personales o un teléfono inteligente), un ordenador portátil, un ordenador de escritorio, una tableta o dispositivo, un servidor de red remoto, etc.
Una ventaja reside en un sistema de apoyo a la decisión clínica (CDS) que proporciona recomendaciones clínicas en base al análisis probabilístico de una o más rutas de señalización celular, por ejemplo, usando un modelo de red bayesiana de una ruta Wnt, una ruta ER, una Vía AR y/o ruta Hedgehog.
Otra ventaja reside en la evaluación mejorada de la actividad de la ruta de señalización celular que es menos susceptible a errores.
Otra ventaja reside en proporcionar un sistema CDS que recomienda un tratamiento dirigido para la pérdida de regulación de una ruta de señalización celular.
Otra ventaja reside en proporcionar un sistema CDS que está diseñado para detectar la pérdida de regulación para una ruta de señalización celular particular, tal como una ruta Wnt, una ruta ER, una ruta Ar o una ruta Hedgehog, y se adapta fácilmente para proporcionar recomendaciones para diferentes tipos de cáncer originados por esa ruta de señalización celular en particular.
La presente invención, tal como se describe en este documento, puede, por ejemplo, usarse también ventajosamente en relación con
- diagnóstico en base a la actividad predicha (inferida);
- pronóstico en base a la actividad predicha (inferida);
- prescripción de fármacos en base a la actividad prevista (inferida);
- predicción de la eficacia del fármaco en base a la actividad predicha (inferida);
- predicción de efectos adversos en base a la actividad predicha (inferida);
- seguimiento de la eficacia del fármaco;
- desarrollo de fármacos;
- desarrollo de ensayos;
- investigación de las rutas;
- estadificación del cáncer;
- inscripción del sujeto en un ensayo clínico en base a la actividad predicha (inferida);
- selección de la prueba posterior que se va a realizar, y/o;
- selección de pruebas de diagnóstico complementarias.
Las ventajas adicionales serán evidentes para los expertos en la técnica al leer y comprender las figuras adjuntas, la siguiente descripción y, en particular, al leer los ejemplos detallados que se proporcionan a continuación en este documento.
La figura 1 muestra una red bayesiana simple que representa parte de una ruta de señalización celular. La ruta de señalización celular está simbolizada por un complejo de factor de transcripción (TF) y los genes diana producidos como resultado de la presencia del complejo de factor de transcripción. La relación probabilística entre el elemento TF y un gen diana en caso de discretización binaria se puede representar mediante una tabla de probabilidad condicional como se muestra en el diagrama.
La figura 2 muestra una red bayesiana ilustrativa que describe una ruta de señalización celular hipotética. En el diagrama se representan tanto las proteínas aguas arriba como los nodos de ARNm diana aguas abajo. Las proteínas aguas arriba sirven como entrada en el complejo del factor de transcripción, mientras que los ARNm diana son los nodos de salida del complejo del factor de transcripción.
La figura 3 muestra un ejemplo ilustrativo de una representación de red bayesiana de una única ruta de señalización celular con un complejo de múltiples factores de transcripción o unas rutas de señalización celular múltiple con su propio complejo de factores de transcripción combinados en una red bayesiana o una combinación de los mismos. La figura 4 muestra un ejemplo de una red bayesiana que ilustra una representación simple de una ruta de señalización celular similar a la figura 1. Ahora se han unido nodos adicionales para representar la traducción del ARNm diana en proteínas diana.
La figura 5 muestra una ilustración de una red bayesiana que ilustra otra representación simple de una ruta de señalización celular. La ruta se representa usando el complejo de factores de transcripción y sus niveles de proteína diana.
La figura 6 muestra la red bayesiana ilustrativa de la figura 1 con una capa adicional de nodos que representan los conjuntos de sondas en un chip de micromatrices que conecta las intensidades de las sondas con los niveles de ARNm diana correspondientes.
La figura 7 muestra un ejemplo ilustrativo de una realización variante de la red bayesiana de la figura 1 que incluye nodos que representan variaciones de metilación y número de copias como ejemplos de nodos de información adicional para en este ejemplo particular cualquiera de los niveles de ARNm diana incluidos.
La figura 8 muestra una actividad de la ruta Wnt predicha de la red bayesiana y el método del centroide más cercano como se describe en este documento en un conjunto de datos de muestras de colon (GSE20916).
La figura 9 muestra una actividad de la ruta Wnt predicha de la red bayesiana y el método del centroide más cercano como se describe en este documento en un conjunto de datos de muestras de colon (GSE4183).
La figura 10 muestra una actividad de la ruta Wnt predicha de la red bayesiana y el método del centroide más cercano como se describe en este documento en un conjunto de datos de muestras de colon (GSE15960).
La figura 11 muestra una actividad de la ruta Wnt predicha de la red bayesiana y el método del centroide más cercano como se describe en este documento en un conjunto de datos de muestras de cáncer de mama (GSE12777).
La figura 12 muestra una actividad de la ruta Wnt predicha de la red bayesiana y el método del centroide más cercano como se describe en este documento en un conjunto de datos de muestras de cáncer de mama (GSE21653).
La figura 13 muestra una actividad de la ruta Wnt predicha de la red bayesiana y el método del centroide más cercano como se describe en este documento en un conjunto de datos de muestras de cáncer de hígado (GSE9843).
La figura 14 muestra una actividad de la ruta Wnt predicha usando una red bayesiana usando los genes diana de la lista de pruebas curadas en comparación con los genes diana de la lista de bibliografía amplia como se describe en este documento en un conjunto de datos de colon simples (GSE20916).
La figura 15 muestra una actividad de la ruta Wnt predicha usando una red bayesiana usando los genes diana de la lista de pruebas curadas en comparación con los genes diana de la amplia lista de bibliografía como se describe en este documento en un conjunto de datos de colon simples (GSE4183).
La figura 16 muestra una actividad de la ruta Wnt predicha usando una red bayesiana usando los genes diana de la lista de pruebas curadas en comparación con los genes diana de la lista de bibliografía amplia como se describe en este documento en un conjunto de datos de colon simples (GSE15960).
La figura 17 muestra una actividad de la ruta Wnt predicha usando una red bayesiana usando los genes diana de la lista de pruebas curadas en comparación con los genes diana de la amplia lista de bibliografía como se describe en este documento en un conjunto de datos de muestras de cáncer de mama (GSE12777).
La figura 18 muestra una actividad de la ruta Wnt predicha usando una red bayesiana usando los genes diana de la lista de pruebas curadas en comparación con los genes diana de la amplia lista de bibliografía como se describe en este documento en un conjunto de datos de muestras de cáncer de hígado (GSE9843).
La figura 19 muestra una actividad de la ruta Wnt predicha usando una red bayesiana usando los genes diana de la lista de pruebas curadas en comparación con los genes diana de la amplia lista de bibliografía como se describe en este documento en un conjunto de datos de muestras de meduloblastoma (GSE10327).
La figura 20 muestra esquemáticamente un sistema de apoyo a las decisiones clínicas (CDS) configurado para evaluar una o más rutas de señalización celular como se describe en este documento (se muestra un ejemplo para la ruta Wnt).
La figura 21 muestra una actividad de la ruta Wnt predicha en muestras de colon de GSE4183.
La figura 22 muestra una actividad de la ruta Wnt predicha en muestras de meduloblastoma de GSE10327.
La figura 23 muestra una actividad de la ruta Wnt predicha en muestras de cáncer de hígado de GSE9843.
La figura 24 muestra una actividad de la ruta Wnt predicha en líneas celulares de cáncer de mama de GSE12777.
La figura 25 muestra una actividad de la ruta
Figure imgf000007_0001
predicha en líneas celulares de cáncer de mama de GSE12777. La figura 26 muestra una actividad de la ruta
Figure imgf000007_0002
predicha en muestras de cáncer de mama de GSE12276. La figura 27 muestra una actividad de la ruta
Figure imgf000007_0003
predicha en líneas de células cancerosas de GSE36133.
La figura 28 muestra una actividad de la ruta
Figure imgf000007_0004
Hedgehog predicha en líneas de células cancerosas de GSE34211. La figura 29 muestra una actividad de la ruta Hedgehog predicha en muestras de meduloblastoma de GSE10327.
La figura 30 muestra una actividad de la ruta Hedgehog predicha en muestras de cáncer de mama de GSE12276.
La figura 31 muestra una actividad de la ruta ER predicha en líneas celulares resistentes a MCF7 y tamoxifeno de GSE21618.
La figura 32 muestra una actividad de la ruta ER predicha en una serie temporal de muestras de la línea celular MCF7 estimuladas por estrógenos de GSE11324.
La figura 33 muestra la actividad de las rutas Wnt, ER y Hedgehog en muestras luminal A de GSE12276.
La figura 34 muestra la actividad de las rutas Wnt, ER y Hedgehog en muestras basales de GSE12276.
La figura 35 muestra una actividad de la ruta Wnt predicha en muestras de colon de GSE20916.
La figura 36 muestra una actividad de la ruta ER predicha en líneas celulares MCF7 estimuladas con estrógeno (E2) o un control negativo (EtOH) (GSE9253).
La figura 37 muestra las curvas de supervivencia de Kaplan-Meier de pacientes del conjunto de datos GSE12276 agrupados según la actividad de la ruta.
La figura 38 muestra una actividad de la ruta AR predicha en líneas celulares LNCaP tratadas con diferentes regímenes de tratamiento de GSE7708.
La figura 39 muestra una actividad de la ruta AR predicha en muestras de cáncer de próstata de GSE17951.
La figura 40 muestra una actividad de la ruta AR predicha en muestras de cáncer de mama de GSE12276.
La figura 41 muestra una actividad de la ruta AR predicha en el conjunto de datos de GSE36133 que contiene muestras de líneas celulares que representan diversos tipos de cáncer.
La figura 42 muestra una actividad de la ruta AR predicha en el conjunto de datos de GSE34211 que contiene muestras de líneas celulares que representan diversos tipos de cáncer.
Los siguientes ejemplos simplemente ilustran métodos particularmente preferidos y aspectos seleccionados en relación con los mismos. La enseñanza proporcionada en el mismo puede usarse para construir varias pruebas y/o kits, por ejemplo, para detectar, predecir y/o diagnosticar la actividad anormal de una o más rutas de señalización celular. Adicionalmente, al usar métodos como se describen en este documento, la prescripción de fármacos puede guiarse ventajosamente, se puede realizar la predicción del fármaco y el seguimiento de la eficacia del fármaco (y/o los efectos adversos), se puede predecir y monitorizar la resistencia al fármaco, por ejemplo, para seleccionar la (s) prueba (s) posterior (es) que se va (n) a realizar (como una prueba de diagnóstico complementaria). Los siguientes ejemplos no se deben interpretar como limitantes del alcance de la presente invención.
Ejemplo 1: construcción de una red bayesiana
Como se describe en este documento, mediante la construcción de un modelo probabilístico (por ejemplo, el modelo bayesiano ilustrativo que se muestra en la figura 6) e incorporando relaciones probabilísticas condicionales entre los niveles de expresión de un número de genes diana diferentes y la actividad de la ruta de señalización celular, se puede usar dicho modelo para determinar la actividad de la ruta de señalización celular con un alto grado de precisión. Además, el modelo probabilístico se puede actualizar fácilmente para incorporar conocimientos adicionales obtenidos por estudios clínicos posteriores, ajustando las probabilidades condicionales y/o agregando nuevos nodos al modelo para representar fuentes de información adicionales. De esta manera, el modelo probabilístico se puede actualizar según corresponda para incorporar los conocimientos médicos más recientes. Uno de los modelos de red bayesiana más simples para representar una ruta de señalización celular sería un modelo de dos niveles que incluye el elemento del factor de transcripción y los genes diana asociados (véase la figura 1). El elemento del complejo del factor de transcripción es una representación del nivel del complejo del factor de transcripción. El nivel de proteína del elemento del factor de transcripción está conectado un número de niveles de ARNm de los genes diana del factor de transcripción (en esta red bayesiana de ejemplo solo se representan tres genes diana, que se sabe que se expresan en el tejido en caso de que el factor de transcripción sea disponible). Se debe entender que muchos, la mayoría o todos los genes diana de la ruta (en el caso de las rutas Wnt, ER, Hedgehog y a R, particularmente los genes diana mencionados en la tabla 1, tabla 2, tabla 3 y tabla 4 respectivamente) son análogamente regulado por el elemento TF. Las relaciones entre el nivel del elemento TF y los niveles de ARNm de los genes diana se modelan en la red bayesiana por los bordes. Para cada uno de los genes diana, una distribución probabilística condicional especifica cómo el nivel de ARNm del gen depende del nivel del elemento TF.
Los niveles del elemento TF y los genes diana se pueden representar de diversas formas. Una opción es usar una discretización binaria, en estados "ausente" y "presente" para el elemento TF, y "abajo" y "arriba" para el nivel de ARNm de un gen diana (véase la figura 1). La relación probabilística entre el elemento TF y un gen diana se puede representar luego mediante una tabla de probabilidad condicional (como se indica en la misma figura). En lugar de una discretización binaria, los niveles también se pueden representar como valores de nivel continuo o como valores cuantificados que tienen tres o más niveles de cuantificación (por ejemplo, "abajo", "normal" y "arriba" para los genes diana).
La ilustración anterior de una red bayesiana simple es solo una realización ilustrativa del modelo de red bayesiana (figura 1). En general, un modelo de red bayesiana comprende un gráfico acíclico dirigido que comprende nodos conectados por bordes. Cada nodo representa un elemento de información perteneciente a la ruta en cuestión (o, más generalmente, a la ruta de señalización celular). Cada uno de los nodos de los elementos de la ruta representa un elemento genómico o proteómico de la ruta de señalización celular. A modo de ejemplo ilustrativo, un nodo de un elemento de la ruta puede representar uno de, pero no restringido a: una proteína, un complejo proteico, una molécula de ARNm transcrita de un gen diana de la ruta de señalización celular, un gen metilado, una proteína fosforilada, un complejo de proteína fosforilada, etc. Como se analiza más adelante en este documento, se pueden incluir varios otros tipos de nodos, pero sin limitarse a los ejemplos dados, en la red bayesiana para representar otros tipos de información tales como elementos de datos de medición específicos, ocurrencias de variación genética, etc.
Por lo general se agregan niveles adicionales "aguas arriba" que representan proteínas reguladoras (en estado activo o inactivo) de la ruta si el conocimiento del nivel de dicha proteína pudiera ser probatorio para determinar la recomendación de apoyo a la decisión clínica. Por ejemplo, la inclusión de las proteínas elementales del factor de transcripción o proteínas esenciales aguas arriba del factor de transcripción en la red bayesiana (véase la figura 2) podría ser útil si hay un fármaco disponible que se dirija específicamente a tales proteínas, en lugar de la ruta como un todo. Se cree que el factor de transcripción (TF) es un complejo de proteínas (es decir, una combinación de proteínas unidas en una estructura específica que realiza la función de regular la transcripción de los genes diana) en la mayoría de las rutas de señalización. Para otras rutas, el elemento TF puede ser una sola proteína. Además, las rutas de señalización pueden ejercer su actividad a través de más de un factor de transcripción, lo que da como resultado una red bayesiana más compleja con múltiples factores de transcripción que se alimentan de los genes diana (véase la figura 3 para una ilustración hipotética de múltiples elementos de factores de transcripción que influyen en la transcripción del gen diana). Dicha red bayesiana de múltiples factores de transcripción también puede ser el resultado de una combinación de rutas combinadas en una red bayesiana.
También se pueden incluir en la red bayesiana nodos de información adicionales aguas abajo de los genes diana. Un ejemplo ilustrativo de esto es la traducción del ARNm del gen diana en proteínas (Figura 4) o nodos a nivel de proteína del gen diana como nodo sustituto del nivel de ARNm del gen diana (Figura 5). Las moléculas de ARNm del gen diana se traducen por interacción con moléculas de ribosoma para formar proteínas correspondientes a las moléculas de ARNm y correspondientes a los genes diana. Esta es la expresión de los genes diana a nivel de proteínas. La medición del nivel de proteína mediante, pero no se limita a, por ejemplo, espectrometría de masas, inmunohistoquímica, técnicas de electroforesis en gel puede actuar como evidencia de estos niveles de proteína diana.
El nivel de expresión de un gen diana se puede calcular en base a la intensidad medida de los conjuntos de sondas correspondientes de una micromatriz, por ejemplo, promediando o por otros medios de otras técnicas (por ejemplo, secuenciación de ARN). En algunas realizaciones, este cálculo se integra en la red bayesiana, extendiendo la red bayesiana con un nodo para cada conjunto de sondas que se usa e incluyendo un borde que se ejecuta a cada uno de estos nodos de "medición" desde el nodo del gen diana correspondiente, como se describe en este documento con referencia a la figura 6.
El modelo probabilístico también puede incorporar opcionalmente información genómica adicional, tal como información sobre mutaciones, variaciones en el número de copias, expresión génica, metilación, información de translocación, etc., que cambian las secuencias genómicas que están relacionadas con la cascada de señalización de la ruta para inferir la actividad de la ruta y localizar el defecto en la ruta Wnt que causa el funcionamiento aberrante (ya sea activación o inactividad), como se describe mediante referencia ilustrativa a la figura 7 para el caso ilustrativo de metilación y datos de número de copias. Sin embargo, se debe entender que otros tipos de información con respecto al gen diana se traducen de forma análoga en nodos de información. Tal información genómica puede estar disponible a través, pero sin limitarse a, secuenciación de ARN y análisis de SNP.
Además, se debe entender que si bien los ejemplos que se describen más adelante en este documento pertenecen a la ruta Wnt, ER, AR y Hedgehog se proporcionan como ejemplos ilustrativos, los enfoques para el análisis de la ruta de señalización celular descritos en este documento se aplican fácilmente a otras rutas de señalización celular además de estas rutas, tales como las rutas de señalización intracelular con receptores en la membrana celular (por ejemplo, las rutas de señalización celular Notch, HER2/PI3K, TGFbeta, EGF, VEGF y TNF-NFkappaB) y rutas de señalización intracelular con receptores dentro de la célula (por ejemplo, rutas de señalización celular de progesterona, ácido retinoico y vitamina D).
Ejemplo 2: Comparación de métodos de aprendizaje automático
Aquí, el rendimiento de dos tipos de técnicas de aprendizaje automático se compara entre sí con la ruta Wnt tomada como un caso de ejemplo: la predicción de la actividad Wnt mediante un método de centroide más cercano se compara con el método de elección según l presente divulgación, que, por ejemplo, usa una red bayesiana.
Como se discutió anteriormente, el enfoque de red bayesiana se seleccionó en base a sus ventajas que residen en el enfoque probabilístico que es capaz de incorporar la información disponible en "suave", por ejemplo, porcentajes de sujetos de estudio que exhiben características probativas y forma "dura", usando relaciones probabilísticas condicionales. Además, el modelo probabilístico también permite incorporar información en base a un conocimiento parcial (en lugar de exhaustivo) de la ruta de señalización celular subyacente, nuevamente mediante el uso de tablas de probabilidad condicional.
Aquí se demuestra que los inventores agregaron valor en la forma en que incluyeron propiedades biológicas conocidas y la disponibilidad de evidencia suave usando una red bayesiana en comparación con otros métodos de aprendizaje automático, por ejemplo, clasificación centroide más cercana, un método bien conocido. La clasificación del centroide más cercano es un método de aprendizaje automático en el que para cada clase de muestras de entrenamiento se calcula un perfil promedio (= centroide) y, a continuación, para clasificar una muestra, la etiqueta se predice en base al centroide más cercano (la etiqueta del centroide más cercano es entonces el resultado de la predicción). Los dos centroides se calculan en la misma lista de conjuntos de sondas usados en la red bayesiana, y para el centroide “Wnt activado” y “Wnt desactivado” se basan en las muestras de adenoma y las muestras de colon normal, respectivamente, de los mismos datos procesados por fRMA de GSE8671. La razón log2 de las dos distancias euclidianas entre una muestra y los dos centroides se usó posteriormente para clasificar muestras de diversos conjuntos de datos para inferir la clasificación de las muestras. Esto significa que una relación log2 de 0 corresponde a una distancia igual de la muestra a los dos centroides, un valor > 0 corresponde a una muestra clasificada como señalización Wnt activa, mientras que un valor < 0 corresponde a una muestra identificada con una ruta de señalización Wnt inactiva
La red bayesiana se construyó de forma similar a la figura 6 y el procedimiento se describe en este documento. De manera similar a esta descripción de la red bayesiana Wnt, las tablas de probabilidad condicional de los bordes entre conjuntos de sondas y sus genes respectivos se entrenaron usando datos procesados con fRMA de 32 muestras de colon normal y 32 muestras de adenoma del conjunto de datos GSE8671 del Gene Expression Omnibus (accesible en http://www.ncbi.nlm.nih.gov/geo/, consultado por última vez el 13 de julio de 2011). Luego, la red bayesiana entrenada se probó en diversos conjuntos de datos para inferir la probabilidad P (Wnt activada) de que la ruta Wnt esté "activada", es decir, activa, que se toma igual a la probabilidad inferida de que el complejo de transcripción de la ruta Wnt está "presente".
La red bayesiana entrenada y el modelo de centroide más cercano se probaron luego en diversos conjuntos de datos de micromatrices procesados con fRMA para inferir la probabilidad de que la ruta Wnt esté "activada", medida por P (Wnt Activada) y la proporción log2 de las distancias. Los resúmenes de los resultados de la red bayesiana y el modelo de centroide más cercano se muestran en las figuras 8 a 13. El lector debe tener en cuenta que las métricas de salida de los dos métodos no son una relación uno a uno; sin embargo, el signo y la magnitud relativa de las métricas de salida dentro de un método son comparables.
La gran mayoría de las muestras de colon (cáncer) (GSE20916, GSE4183) se clasifican por igual entre la ruta Wnt activa e inactiva, a excepción de GSE15960 que tenía una alta fracción de simples negativos clasificados erróneamente en el método del centroide más cercano (falsos negativos). Esta percepción de una mayor fracción de falsos negativos se mantiene también en los otros tipos de cáncer. Esto es especialmente cierto para las muestras de cáncer de mama (GSE12777, GSE21653) y cáncer de hígado (GSE9843); salvo unas pocas excepciones, se predice que todas las muestras tendrán una ruta Wnt inactiva que se sabe que es incorrecta en el caso de cáncer de mama de tipo basal y las muestras de cáncer de hígado CTNNB1. En algunos casos, evidente en, por ejemplo, GSE15960, la clasificación se podría corregir reduciendo y aumentando el umbral de la clasificación del centroide más cercana. La idea detrás de esto sería que el umbral de actividad de Wnt se podría alterar en diferentes tipos de tejidos. Sin embargo, esto implicaría un entrenamiento adicional del método de centroide más cercano para que sea aplicable a otros tipos de tejidos. Una de las fortalezas del modelo de red bayesiana es que no se requiere este entrenamiento específico de tejido, ya que se establece que no es específico con respecto al tipo de tejido.
Ejemplo 3: selección de genes diana
Un factor de transcripción (TF) es un complejo de proteínas (es decir, una combinación de proteínas unidas entre sí en una estructura específica) o una proteína que es capaz de regular la transcripción de genes diana mediante la unión a secuencias de ADN específicas, controlando así la transcripción de información genética de ADN a ARNm. El ARNm producido directamente debido a esta acción del complejo de transcripción se denomina en este documento "gen diana directo". La activación de la ruta también puede dar como resultado una transcripción de genes más secundarios, denominados "genes diana indirectos". A continuación, se prefieren los modelos de redes bayesianas (como modelos probabilísticos de ejemplo) que comprenden o consisten en genes diana directos, como enlaces directos entre la actividad de la ruta y el nivel de ARNm, sin embargo, la distinción entre genes diana directos e indirectos no siempre es evidente. Aquí se presenta un método para seleccionar genes diana directos usando una función de puntuación en base a los datos de la bibliografía disponible. No obstante, no se puede descartar la selección accidental de genes diana indirectos debido a la información limitada y las variaciones e incertidumbres biológicas.
Se seleccionaron genes diana de ARNm de ruta específica de la bibliografía científica, usando un sistema de clasificación en el que se dio una clasificación a la evidencia científica para un gen diana específico, dependiendo del tipo de experimentos científicos en los que se acumuló la evidencia. Si bien algunas pruebas experimentales sugieren simplemente que un gen es un gen diana, como, por ejemplo, un ARNm que aumenta en una micromatriz de un embrión en el que se sabe que la ruta Hedgehog está activa, otra evidencia puede ser muy sólida, como la combinación de un sitio de unión del factor de transcripción de la ruta identificada y la recuperación de este sitio en un ensayo de inmunoprecipitación de cromatina (ChIP) después de la estimulación de la ruta específica en la célula y el aumento de ARNm después de la estimulación específica de la ruta en una línea celular.
En la bibliografía científica se pueden identificar varios tipos de experimentos para encontrar genes diana de rutas específicas:
1. Experimentos de ChIP en los que se muestra la unión directa de un factor de transcripción de la ruta a su sitio de unión en el genoma. Ejemplo: mediante el uso de la tecnología de inmunoprecipitación de cromatina (ChIP), se identificaron posteriormente los sitios de unión del factor de transcripción TCF4 funcional putativo en el ADN de las líneas celulares de colon con y sin la ruta Wnt activa, como un subconjunto de los sitios de unión reconocidos puramente en base a la secuencia de nucleótidos. La funcionalidad putativa se identificó como evidencia derivada de ChIP de que se encontró que el factor de transcripción se unía al sitio de unión del ADN.
2. Ensayos de desplazamiento de movilidad electroforética (EMSA) que muestran la unión in vitro de un factor de transcripción a un fragmento de ADN que contiene la secuencia de unión. En comparación con la evidencia en base a ChIP, la evidencia en base a EMSA es menos fuerte, ya que no se puede traducir a la situación in vivo.
3. Estimulación de la ruta y medición de perfiles de ARNm en un micromatriz o usando secuenciación de ARN, usando líneas celulares inducibles por la ruta y midiendo perfiles de ARNm medidos en varios puntos de tiempo después de la inducción - en presencia de cicloheximida, que inhibe la traducción a proteína, de este modo se supone que los ARNm inducidos son genes diana directos.
4. Similar a 3, pero usando PCR cuantitativa para medir las cantidades de ARNm.
5. Identificación de sitios de unión de factores de transcripción en el genoma usando un enfoque bioinformático. Ejemplo de la ruta Wnt: usando la secuencia de unión de ADN del factor de transcripción TCF4-beta catenina conocida, se ejecutó un programa de software en la secuencia del genoma humano y se identificaron los sitios de unión potenciales, tanto en las regiones promotoras de genes como en otras regiones genómicas.
6. Similar a 3, solo en ausencia de cicloheximida.
7. Similar a 4, solo en ausencia de cicloheximida.
8. Perfiles de expresión de ARNm de muestras de tejido o células específicas de las que se sabe que la ruta está activa, sin embargo, en ausencia de la condición de control negativo adecuada.
En la forma más simple, se puede dar a cada ARNm diana potencial 1 punto para cada uno de estos enfoques experimentales en los que se identificó el ARNm diana.
Alternativamente, los puntos se pueden dar de forma incremental, lo que significa que una tecnología 1 punto, la segunda tecnología agrega un segundo punto, y así sucesivamente. Usando esta estrategia de clasificación relativa, se puede hacer una lista de los genes diana más confiables.
Alternativamente, la clasificación de otra manera se puede usar para identificar los genes diana que tienen más probabilidades de ser genes diana directos, dando un mayor número de puntos a la tecnología que proporciona la mayor evidencia de un gen diana directo in vivo, en la lista anterior significaría 8 puntos para el enfoque experimental 1), 7 a 2), y bajar a un punto para el enfoque experimental 8. Dicha lista se puede denominar "lista general de genes diana".
A pesar de las variaciones e incertidumbres biológicas, los inventores supusieron que los genes diana directos son los que tienen más probabilidades de inducirse de manera independiente del tejido. Una lista de estos genes diana se puede denominar "lista de genes diana curada por evidencia". Estas listas diana curadas se han usado para construir modelos computacionales que se pueden aplicar a muestras procedentes de diferentes fuentes de tejidos. La "lista general de genes diana" probablemente contiene genes que son más específicos de tejido, y se puede usar potencialmente para optimizar y aumentar la sensibilidad y especificidad del modelo para su aplicación en muestras de un tejido específico, como muestras de cáncer de mama.
Lo siguiente ilustrará a modo de ejemplo cómo se construyó la selección de una lista de genes diana curada por evidencia específicamente para la ruta ER.
Con el fin de seleccionar los genes diana de ER utilizados como entrada para el "modelo", se usaron los siguientes tres criterios:
1. La región promotora/potenciadora de genes contiene un motivo de elemento de respuesta a estrógenos (ERE): a. Se debe demostrar que el motivo ERE responde a los estrógenos, por ejemplo, mediante un ensayo de transfección transitoria en el que el motivo ERE específico está ligado a un gen indicador, y
b. La presencia del motivo ERE debe confirmarse mediante, por ejemplo, un análisis de motivo enriquecido de la región promotora/potenciadora del gen.
2. ER (diferencialmente) se une in vivo a la región promotora/potenciadora del gen en cuestión, demostrado mediante, por ejemplo, un experimento de ChIP/CHIP o un ensayo de inmunoprecipitación de cromatina:
a. Se ha demostrado que ER se une a la región promotora/potenciadora del gen cuando la ruta ER está activa, y b. (preferiblemente) no se une (o se une débilmente) a la región promotora/potenciadora del gen del gen si la ruta ER no está activa.
3. El gen se transcribe diferencialmente cuando la ruta ER está activa, lo que se demuestra mediante, por ejemplo, a. multiplicar el enriquecimiento del ARNm del gen en cuestión a través de PCR en tiempo real o experimento de micromatrices, o
b. la demostración de que el ARN Pol II se une a la región promotora del gen mediante un ensayo de inmunoprecipitación.
La selección se realizó definiendo como genes diana de ER, los genes para los que se recopiló evidencia experimental suficiente y bien documentada que probaba que se cumplían los tres criterios mencionados anteriormente. Un experimento apropiado para recopilar evidencia de unión diferencial de ER es comparar los resultados de, por ejemplo, un experimento de ChIP/CHIP en una línea celular cancerosa que responde al estrógeno (por ejemplo, la línea celular m CF-7), cuando se expone o no se expone a estrógeno. Lo mismo se aplica a la recopilación de evidencia de transcripción de ARNm.
Lo anterior discute el enfoque genérico y un ejemplo más específico del procedimiento de selección de genes diana que se ha empleado para seleccionar un número de genes diana en base a la evidencia encontrada usando el enfoque mencionado anteriormente. Las listas de genes diana usados en los modelos de redes bayesianas para rutas de ejemplo, a saber, las rutas Wnt, ER, Hedgehog y AR se muestran en la tabla 1, tabla 2, tabla 3 y tabla 4, respectivamente.
Los genes diana de la ruta ER usados para el modelo de red bayesiana de la ruta ER descrito en este documento (que se muestra en la tabla 2) contienen una selección de genes diana en base a su puntuación de evidencia bibliográfica; sólo los genes diana con las puntuaciones de evidencia más altas (genes diana preferidos según la invención) se agregaron a esta lista corta. La lista completa de genes diana de ER, incluidos también los genes con una puntuación de evidencia más baja, se muestra en la tabla 5.
Se realizó una subselección o clasificación adicional de los genes diana de las rutas Wnt, ER, Hedgehog y AR mostradas en la tabla 1, tabla 2, tabla 3 y tabla 4 en base a una combinación de la puntuación de evidencia en la bibliografía y las razones de probabilidad calculadas usando las tablas de probabilidad condicional entrenadas que vinculan los nodos del conjunto de sondas con los nodos de genes diana correspondientes. La razón de probabilidad es una evaluación de la importancia del gen diana para inferir la actividad de las rutas. En general, se espera que el nivel de expresión de un gen diana con una razón de probabilidad más alta probablemente sea más informativo en cuanto a la actividad general de la ruta en comparación con los genes diana con razones de probabilidad más bajas. Sin embargo, debido a la complejidad de las rutas de señalización celular, se debe entender que pueden existir interrelaciones más complejas entre los genes diana y la actividad de la ruta; por ejemplo, considerar los niveles de expresión de diversas combinaciones de genes diana con razones de probabilidad bajas puede ser más probatorio. que considerar genes diana con mayores razones de probabilidad de forma aislada. En el modelado de Wnt, ER, Hedgehog y AR informado en este documento, se ha encontrado que los genes diana que se muestran en la tabla 6, tabla 7, tabla 8 y tabla 9 son de naturaleza probatoria más alta para predecir las actividades ruta Wnt, ER, Hedgehog y AR actividades en comparación con los genes diana de rango inferior (de este modo, los genes diana mostrados en las tablas 6 a 9 son particularmente preferidos de acuerdo con la presente invención). No obstante, dada la relativa facilidad con la que la tecnología de adquisición, tales como las micromatrices, puede adquirir niveles de expresión para grandes conjuntos de genes, se contempla usar algunos o todos los genes diana de la tabla 6, tabla 7, tabla 8 y tabla 9, y para opcionalmente, usar adicionalmente uno, dos, algunos o todos los genes diana adicionales de los rangos mostrados en la tabla 1, tabla 2, tabla 3 y tabla 4, en el modelo bayesiano como se muestra en la figura 6.
Tabla 1. Lista curada por evidencia de genes diana de la ruta Wnt usados en la red bayesiana y conjuntos de sondas asociados usados para medir el nivel de expresión de ARNm de los genes diana (# = número de secuencia en el listado de secuencias adjunto).
Figure imgf000013_0001
Figure imgf000014_0001
Figure imgf000015_0001
Tabla 2. Lista curada por evidencia de genes diana de la ruta ER usados en la red bayesiana y conjuntos de sondas asociados usados para medir el nivel de expresión de ARNm de los genes diana (# = número de secuencia en el listado de secuencias adjunto).
Figure imgf000015_0002
Figure imgf000016_0002
Tabla 3. Lista curada por evidencia de genes diana de la ruta Hedgehog usados en la red bayesiana y conjuntos de sondas asociados usados para medir el nivel de expresión de ARNm de los genes diana (# = número de secuencia en el listado de secuencias adjunto).
Figure imgf000016_0001
Figure imgf000017_0001
Figure imgf000018_0002
Tabla 4. Lista curada por evidencia de genes diana de la ruta AR usados en la red bayesiana y conjuntos de sondas asociados usados para medir el nivel de expresión de ARNm de los genes diana (# = número de secuencia en el listado de secuencias adjunto).
Figure imgf000018_0001
Figure imgf000019_0002
Tabla 5. Símbolos genéticos de los genes diana de ER que tienen evidencia significativa en la bibliografía (= lista larga de genes diana de ER) (# = número de secuencia en la lista de secuencias adjunta).
Figure imgf000019_0001
Figure imgf000020_0001
Tabla 6. Lista corta de genes diana Wnt en base a la puntuación de evidencia en la bibliografía y la razón de probabilidad (# = número de secuencia en la lista de secuencias adjunta).
Figure imgf000020_0002
Tabla 7. Lista corta de genes diana de ER en base a la puntuación de evidencia en la bibliografía y la razón de probabilidad (# = número de secuencia en la lista de secuencias adjunta).
Figure imgf000021_0001
Tabla 8. Lista corta de genes diana Hedgehog en base a la puntuación de evidencia en la bibliografía y la razón de probabilidad (# = número de secuencia en la lista de secuencias adjunta).
Figure imgf000021_0002
Figure imgf000022_0002
Tabla 9. Lista corta de genes diana de AR en base a la puntuación de evidencia en la bibliografía y la razón de probabilidad (# = número de secuencia en la lista de secuencias adjunta).
Figure imgf000022_0001
Ejemplo 4: Comparación de la lista de evidencias curadas y la lista de bibliografía amplia
La lista de genes diana de Wnt construida en base a la evidencia en la bibliografía siguiendo el procedimiento descrito en este documento (Tabla 1) se compara con otra lista de genes diana que no siguen el procedimiento mencionado anteriormente. La lista alternativa es una compilación de genes indicados por una variedad de datos de diversos enfoques experimentales para ser un gen diana Wnt publicado en tres fuentes públicas por laboratorios de renombre, conocidos por su experiencia en el área de biología molecular y la ruta Wnt. La lista alternativa es una combinación de los genes mencionados en la tabla S3 de Hatzis et al. (Hatzis P, 2008), el texto y la tabla S1A de de Sousa e Melo (de Sousa E Melo F, 2011) y la lista de genes diana recopilados y mantenidos por Roel Nusse, pionero en el campo de la señalización Wnt (Nusse, 2012). La combinación de estas tres fuentes dio como resultado una lista de 124 genes (= lista de bibliografía amplia, véase la tabla 10). En este caso, se discuta la cuestión de si el rendimiento en la predicción de la actividad de Wnt en muestras clínicas mediante el algoritmo derivado de esta lista alternativa está funcionando de manera similar o mejor en comparación con el modelo construido sobre la base de la lista existente de genes (= lista curada por evidencia, tabla 1).
Tabla 10. Lista alternativa de genes diana Wnt (= amplia lista de bibliografía) (# = número de secuencia en la lista de secuencias adjunta).
Figure imgf000023_0001
Figure imgf000024_0001
Figure imgf000025_0002
La siguiente etapa consistió en encontrar los conjuntos de sondas de la matriz Affymetrix® GeneChip Human Genome U133 Plus 2.0 que se corresponde con los genes. Este procedimiento se realizó usando el complemento Bioconductor en R y la curación manual para la relevancia del conjunto de sondas en base al navegador del genoma UCSC, eliminando, por ejemplo, conjuntos de sondas en cadenas opuestas o regiones externas de exón de genes. Para dos de los 124 genes, no hay conjuntos de sondas disponibles en este chip de micromatriz y, por lo tanto, no se pudieron insertar en la red bayesiana, estos son LOC283859 y WNT3A. En total, se encontró que 287 conjuntos de sondas corresponden a los 122 genes restantes (Tabla 11).
Tabla 11. Conjuntos de sondas asociados con los genes diana Wnt en la amplia lista de genes de la bibliografía (# = número de secuencia en la lista de secuencias adjunta).
Figure imgf000025_0001
Figure imgf000026_0001
Figure imgf000027_0001
Figure imgf000028_0001
Posteriormente, la red bayesiana se construyó de forma similar a la figura 6 y el procedimiento se explica en este documento. De manera similar a la descripción de la red Wnt Bayesiana en base a la lista de evidencia curada, las tablas de probabilidad condicional de los bordes entre conjuntos de sondas y sus respectivos genes, tanto la lista de evidencias curadas como la lista de bibliografía amplia, se entrenaron usando datos procesados por fRMA de 32 muestras de colon normales. y 32 muestras de adenoma del conjunto de datos GSE8671 del Gene Expression Omnibus (accesible en http://www.ncbi.nlm.nih.gov/geo/, consultado por última vez el 13 de julio de 2011).
Las redes bayesianas entrenadas se probaron luego en diversos conjuntos de datos para inferir la probabilidad P (Wnt Activa) de que la ruta Wnt esté "activada", es decir, activa, que se toma igual a la probabilidad inferida de que el complejo de transcripción de la ruta Wnt está “presente". Los resultados resumidos del modelo de bibliografía amplia entrenado y el modelo curado de evidencia se muestran en las figuras 14-19.
Evidentemente, se podría deducir que el modelo de la amplia bibliografía generalmente predice probabilidades más extremas de que la señalización de Wnt esté activada o desactivada. Además, el modelo alternativo predice resultados similares para los conjuntos de datos de cáncer de colon (GSE20916, GSE4183, GSE15960), pero más muestras de las esperadas con señalización Wnt activa predicha en conjuntos de datos de cáncer de mama (GSE12777), cáncer de hígado (GSE9843) y muestra de meduloblastoma (GSE10327).
En conclusión, la amplia lista de genes diana de la bibliografía da como resultado predicciones aproximadamente igualmente buenas de la actividad de Wnt en el cáncer de colon por un lado, pero peores predicciones (demasiados falsos positivos) en otros tipos de cáncer por otro lado. Esto podría deberse a que la lista alternativa de genes diana está demasiado sesgada hacia las células del colon específicamente, de este modo es demasiado específica de tejido; tanto de Sousa E Melo et al. y Hatzis et al. el interés principal fue el cáncer colorrectal, aunque se pueden incluir genes diana Wnt no específicos de colon. Además, los genes diana no específicos de Wnt posiblemente incluidos en estas listas pueden ser una fuente de predicciones empeoradas de la actividad de Wnt en otros tipos de cáncer. Es probable que la lista alternativa contenga más genes diana regulados indirectamente, lo que probablemente la haga más específica de tejido. La lista original está sintonizada para contener genes diana directos, que es más probable que representen genes que son sensibles a Wnt en todos los tejidos, reduciendo de este modo la especificidad del tejido.
Ejemplo 5: entrenamiento y uso de la red bayesiana
Antes de que la red bayesiana se pueda usar para inferir la actividad de la ruta en una muestra de prueba, se deben determinar los parámetros que describen las relaciones probabilísticas entre los elementos de la red. Adicionalmente, en el caso de estados discretos de las medidas de entrada, se deben establecer umbrales que describan cómo realizar la discretización.
Por lo general, las redes bayesianas se entrenan usando un conjunto representativo de muestras de entrenamiento, de las cuales preferiblemente se conocen todos los estados de todos los nodos de la red. Sin embargo, no es práctico obtener muestras de entrenamiento de muchos tipos diferentes de cánceres, de los cuales se sabe cuál es el estado de activación de la ruta que se va a modelar. Como resultado, los conjuntos de entrenamiento disponibles consisten en un número limitado de muestras, por lo general de un solo tipo de cáncer. Por lo tanto, para permitir que la red bayesiana se generalice bien a otros tipos de muestras, se debe prestar especial atención a la forma en que se determinan los parámetros, que se hace preferiblemente de la siguiente manera en el enfoque descrito en este documento.
Para el nodo TF, la probabilidad (incondicional) de estar en el estado "ausente" y "presente" viene dada por la ocurrencia esperada en un gran conjunto de muestras. Alternativamente, se pueden establecer en 0.5, como se hace en la figura 1, para no tener sesgos por un resultado positivo o negativo.
Para los nodos de genes diana, las probabilidades condicionales se establecen como en la figura 1. Si el elemento TF está "ausente", lo más probable es que el gen diana esté "bajo", por lo que se elige una probabilidad de 0.95 para esto, y una probabilidad de 0.05 para que el gen diana esté "arriba". La última probabilidad (distinta de cero) es para tener en cuenta la posibilidad (rara) de que el gen diana esté regulado por otros factores o se observe accidentalmente "arriba" (por ejemplo, debido al ruido de medición). Si el elemento TF está "presente", entonces con una probabilidad razonable de 0.70 el gen diana está "arriba", y con una probabilidad de 0.30 el gen diana está "bajo". Los últimos valores se eligen de esta manera, porque puede haber varias razones por las que un gen diana no se expresa en gran medida aunque el elemento TF esté presente, por ejemplo, porque la región promotora del gen está metilada. En el caso de que un gen diana no esté regulado al alza por el elemento TF, sino regulado a la baja, las probabilidades se eligen de manera similar, pero reflejando la regulación a la baja ante la presencia del elemento TF.
Para el modelo de red bayesiana como se muestra en la figura 6, donde las intensidades de los conjuntos de sondas forman las medidas de entrada, finalmente se deben determinar los parámetros para la discretización y para las tablas de probabilidad condicional que relacionan las intensidades de los conjuntos de sondas con los niveles de ARNm de los genes diana respectivos. Ambos se basan en datos de entrenamiento de la presente invención. Para la discretización del nivel de intensidad de un conjunto de sondas en estados "bajo" y "alto", se determina un umbral apropiado que separa mejor los valores de intensidad en un conjunto de muestras de entrenamiento donde la ruta está activada (muestras "activadas") de los valores de intensidad en un conjunto de muestras de entrenamiento en las que no está (muestras "desactivadas"). Finalmente, las tablas de probabilidad condicional que describen las probabilidades de que un conjunto de sondas tenga una intensidad "baja" o "alta" dependiendo del estado "bajo" o "alto" del gen diana respectivo se realiza contando el número de muestras "activadas" y "desactivadas" con un valor de intensidad del conjunto de sondas por debajo y por encima del umbral respectivo. Esto se conoce en la bibliografía como el enfoque frecuentista. Se agrega un recuento ficticio a cada grupo para evitar entradas en las tablas de probabilidad condicional con un valor de cero, para evitar un comportamiento extremo de la red bayesiana.
Una vez que se ha entrenado la red bayesiana, se puede aplicar en una muestra de prueba de la siguiente manera, considerando la red bayesiana de la figura 6, y asumiendo que las mediciones de micromatrices relacionadas con los conjuntos de sondas están disponibles. La primera etapa es discretizar las medidas de entrada, comparando la intensidad de cada conjunto de sondas en la muestra de prueba con el umbral respectivo como se describe anteriormente. Esta comparación se puede hacer de manera difícil, configurando cada conjunto de sondas en intensidad "baja" o "alta" (llamada "evidencia sólida"), o se puede hacer de manera suave, asumiendo cierta incertidumbre (ruido) en la medición, el establecimiento de cada conjunto de sondas establece una probabilidad de ser "baja" o "alta" (lo que se denomina "evidencia suave"). Por ejemplo, la evidencia suave de un conjunto de sondas con una intensidad justo por debajo del umbral puede ser una probabilidad de 0.8 de ser "baja" y una probabilidad de 0.2 de ser "alta", en base a una estimación apropiada del ruido y la diferencia con el umbral.
A continuación, esta evidencia sólida o suave se suministra a un motor de inferencia apropiado para redes bayesianas, por ejemplo, en base a un algoritmo de árbol de unión (véase (Neapolitan, 2004)). Dicho motor puede inferir la probabilidad actualizada de que el elemento TF esté "ausente" o "presente", dada la evidencia proporcionada. La probabilidad inferida de que el elemento TF esté "presente" se interpreta entonces como la probabilidad estimada de que la ruta respectiva esté activa.
Preferiblemente, el entrenamiento de los modelos de red bayesiana de las rutas Wnt, ER, Hedgehog y AR se realiza usando datos públicos disponibles en la expresión génica Omnibus (accesible en http://www.ncbi.nlm.nih.gov/geo/, cf. arriba).
La red bayesiana de Wnt se entrenó a modo de ejemplo usando 32 muestras de colon normal que se considera que tienen una ruta Wnt inactiva y 32 muestras de adenoma confirmadas que se sabe que tienen una ruta Wnt activa (conjunto de datos GSE8671).
El modelo de red bayesiana de la ruta ER se entrenó a modo de ejemplo usando 4 muestras de MCF7 privadas de estrógeno, que se sabe que tienen una ruta ER inactiva, y 4 muestras de MCF7 estimuladas con estrógeno, que se considera que tienen una ruta ER activa, a partir del conjunto de los datos de GSE8597 también accesible en la expresión génica Omnibus.
El modelo de red bayesiana de la ruta Hedgehog se entrenó a modo de ejemplo usando 15 muestras de carcinoma de células basales confirmadas para tener una ruta Hedgehog activa y 4 muestras de células cutáneas normales que representan muestras con una ruta Hedgehog inactiva disponible en el conjunto de datos GSE7553.
El modelo de red bayesiana de la ruta AR se entrenó a modo de ejemplo usando 3 muestras con actividad AR positiva, líneas celulares LNCaP estimuladas con dihidrotestosterona (DHT), un potente activador de la ruta AR y 3 líneas celulares LNCaP no estimuladas que representan el caso de ruta AR inactiva.
Con referencia a la figura 35 y la figura 36, los modelos de red bayesiana entrenados de la ruta Wnt y ER se usaron para predecir las actividades de la ruta en muestras similares (muestras de colon y línea celular de cáncer de mama MCF7 para la red bayesiana Wnt y ER, respectivamente) no se usa en el procedimiento de entrenamiento como se describe en este documento (no se encontró un conjunto de datos apropiado para la red Hedgehog bayesiana). Las actividades de la ruta predichas de la gran mayoría de las muestras deben estar en línea con las actividades de la ruta clínicamente esperadas para que el modelo sea validado.
La figura 35 muestra las actividades Wnt predichas, representadas como el logit de P(Wnt activada) en el eje vertical, para las muestras, ilustradas por las barras en el eje horizontal, de las muestras de colon agrupadas por clasificación, indicadas por el color de la barra, en el conjunto de datos GSE20916. Se predice legítimamente que todas las muestras de colon normal tienen una ruta inactiva (puntuación < 0), en base a que sea una muestra de tejido sano. Se predice que todas menos cuatro muestras que supuestamente tienen una ruta activa tendrán una ruta Wnt activa.
En la figura 36 se muestran los resultados de validación del modelo de red bayesiana ER entrenado para dos micromatrices medidos usando una muestra de línea celular de cáncer de mama MCF7, una estimulada con estrógeno (E2), la otra con un control negativo (EtOH), procedente del conjunto de datos GSE9253. De acuerdo con la supuesta actividad de ER, se predice que la muestra estimulada con estrógeno tiene una ruta ER activa, mientras que el control negativo predice una ruta ER inactiva.
En el ejemplo 6 a continuación se explican más detalles y ejemplos para el uso de redes bayesianas entrenadas (por ejemplo, de la ruta Wnt, ER, AR y Hedgehog) para predecir las actividades de la ruta respectiva.
El procedimiento de entrenamiento mencionado anteriormente se puede emplear en otras redes bayesianas de aplicaciones clínicas. Aquí se muestra y se demuestra que funciona para los modelos de red bayesiana construidos usando el método descrito en este documento que representa las rutas de señalización celular, más específicamente las rutas Wnt, ER, AR y Hedgehog.
Ejemplo 6: diagnóstico de la actividad de la ruta (anormal)
Lo siguiente ilustrará a modo de ejemplo cómo usar, por ejemplo, Modelos de redes bayesianas para diagnosticar la actividad de una ruta de señalización celular.
Las redes bayesianas de la ruta Wnt, ER, Hedgehog y AR, construidas usando un nodo para la presencia del factor de transcripción, una capa de nodos que representan el ARNm de los genes diana y una capa de nodos que representan las intensidades de los conjuntos de sondas correspondientes a los genes diana (tabla 1, tabla 2, tabla 3 y tabla 4), análogos a la figura 6 descrita en este documento, y entrenados como se describe en este documento, se usaron para predecir la actividad de las rutas como "activada", que está activa o "desactivada"., que está inactivo, en diversos conjuntos de datos, no utilizados anteriormente para el entrenamiento, para inferir qué tan bien opera el componente de inferencia. Las puntuaciones de actividad de la ruta predichas se correlacionan con el conocimiento clínico. Los resúmenes de resultados para una selección de las pruebas se muestran en las seq. de la figura 21 Con referencia a las seq. de la figura 21, se muestran los resultados de inferencia de la actividad de la ruta para muestras de tejido médico usando el modelo de red bayesiana descrito en este documento.
La figura 21 muestra los resultados de las pruebas de actividad de Wnt en el conjunto de datos de muestras de colon GSE4183. El modelo de red bayesiana arrojó valores altos de P(Wnt activa) para las muestras de adenoma y valores bajos para las muestras normales, lo que se corresponde con la (pato)fisiología del adenoma y el tejido sano. El tejido sano tiene una proliferación celular lenta y, de este modo, una actividad Wnt baja en relación con el tejido adenomatoso que tiene una proliferación celular rápida y, de este modo, una actividad Wnt alta. Para las muestras de IBD, el modelo de red bayesiana mostró una baja actividad de la ruta Wnt (P(Wnt activada) ~0) para todas menos una muestra. Nuevamente, esto es consistente con las muestras de IBD que no experimentan una rápida proliferación celular. Para las muestras de células de cáncer colorrectal, los resultados se mezclaron, y se detectó una alta actividad de la ruta Wnt en aproximadamente la mitad de estas muestras, pero esto puede ser el resultado de que otras rutas asuman el papel de impulsores del tumor cuando el tejido adenomatoso benigno se convierte en tejido canceroso maligno o problemas de análisis de muestras, por ejemplo la muestra contiene demasiado tejido no tumoral, o el ARNm está parcialmente degradado
El modelo de red bayesiana usado en los experimentos descritos en este documento se entrenó usando el conjunto de datos de colon simples GSE8671. Sin embargo, la ruta Wnt está presente (aunque posiblemente inactiva) en otros tipos de células. Por lo tanto, se consideró posible que la red bayesiana pudiera ser aplicable para inferir una actividad de la ruta Wnt anormalmente alta correlativa con otros tipos de cánceres. El motivo de esto es que, aunque el modelo de red bayesiana se entrenó usando muestras de colon, se basa en los primeros principios del funcionamiento de la ruta Wnt presente (aunque posiblemente inactiva) en otros tipos de células. Las figuras 22-24 muestran algunos resultados que investigan tales inferencias de "tipo de tejido cruzado".
La figura 22 muestra los resultados de las pruebas que utilizan el modelo de red bayesiana entrenado usando muestras de colon que se aplican para inferir la actividad de la ruta Wnt en muestras de meduloblastoma (conjunto de datos GSE10327). Las muestras incluidas en este conjunto de datos se han caracterizado además en varios subconjuntos, uno de ellos es las muestras con la ruta Wnt que está activa. La red bayesiana de la ruta Wnt predice el grupo de muestras activas de Wnt que tienen una ruta Wnt activa, mientras que las otras muestras se predijeron correctamente que tendrían una ruta Wnt inactiva.
Los resultados de la prueba usando el modelo de red bayesiana de Wnt en un conjunto de datos que contiene muestras de cáncer de hígado (GSE9843) se muestran en la figura 23. Aquí las muestras se agrupan por las siguientes anotaciones a priori asignadas por el conjunto de datos "GSE9843", “ Inflamación", "Polisomía chr7", "Proliferación" y "Sin anotaciones". Se infiere uniformemente que las muestras del grupo "Inflamación" no tienen una actividad de la ruta Wnt anormalmente alta, como se esperaba, ya que la condición de inflamación no implica una proliferación celular rápida. También se infiere uniformemente que las muestras etiquetadas como "Polisomía chr7" no tienen una actividad de la ruta Wnt anormalmente alta. La polisomía del cromosoma número 7 significa que hay más de dos cromosomas número 7. Como no hay razón para esperar que esta condición de polisomía afecte la ruta Wnt, no es inesperado que estas muestras no tengan una actividad de la ruta Wnt anormalmente alta.
Aproximadamente una de cada cinco de las muestras etiquetadas como "Proliferación" tiene P (Wnt Activada > 0.5. La proliferación sugiere un estado de rápida multiplicación celular. Dicho estado puede estar asociado con una actividad de la ruta Wnt anormalmente alta, pero también puede estar asociado con otras numerosas causas posibles de proliferación celular. De acuerdo con lo anterior, aproximadamente uno de cada cinco de estos simples que tienen una actividad de la ruta Wnt anormalmente alta no es un resultado irrazonable.
La red bayesiana infiere que aproximadamente la mitad de las muestras del grupo "CTNNB1" tienen una actividad de la ruta Wnt anormalmente alta. El gen CTNNB1 codifica la proteína beta-catenina, que es una proteína reguladora de la ruta Wnt, y la activación de mutaciones en este gen causa una activación anormal de Wnt. De este modo, una correlación entre el grupo "CTNNB1" y la alta actividad de la ruta Wnt es la expectativa conforme.
La figura 24 representa los resultados de la prueba del modelo de red bayesiana de Wnt descrito en este documento para un conjunto de muestras de cáncer de mama. En este caso, se prueban tres grupos de líneas celulares de cáncer de mama: un grupo para el que se sabe a priori que la ruta Wnt está operando a un nivel anormalmente alto (grupo Wnt activada); un grupo para el que se sabe a priori que la ruta Wnt no está operando a un nivel anormalmente alto (grupo Wnt desactivada); y otro grupo para el que la actividad de la ruta Wnt no se conoce a priori (grupo desconocido); Además, también hay una muestra que se sospecha que tiene un nivel bajo de activación de Wnt (Wnt sospechosa), aunque hay un informe contradictorio en la bibliografía de que puede tener una ruta Wnt activa (pero este es un informe minoritario; más artículos informan una ruta Wnt inactiva). Como se ve en la figura 24, la correlación de las inferencias proporcionadas por la red bayesiana con el conocimiento a priori es fuerte para los grupos Wnt activada- y desactivada. Además, la muestra más a la derecha del gráfico (Wnt sospechoso) muestra una inferencia que corresponde a la mayoría de los informes en la bibliografía que indican que la ruta Wnt está desactivada. En el caso del grupo desconocido que se muestra en la figura24, para el cual no existe un conocimiento a priori de la actividad de la ruta Wnt, la red bayesiana infiere una baja actividad para la ruta Wnt excepto en un caso en el que P (Wnt activa)> 0.5; la bibliografía muestra que esta línea celular tiene una alta expresión del correceptor LRP6, lo que puede explicar que la ruta Wnt esté activa.
La figura 25 muestra los resultados para el mismo conjunto de datos de líneas celulares de cáncer de mama pero ahora analizado para la actividad de ER usando la red bayesiana ER entrenada usando líneas celulares de cáncer de mama MCF7 como se describe en este documento. Se predijo que las muestras que a priori se sabía que tenían una ruta Wnt activa tenían una ruta ER inactiva, lo que no es sorprendente ya que la ruta Wnt ya está impulsando la multiplicación celular rápida. Las muestras ER positivas, por otro lado, se encuentran entre las muestras Wnt desactivada y las muestras desconocidas. A la vista de la figura 24, esto no es sorprendente.
Los resultados de las pruebas de las predicciones de la red bayesiana ER entrenada en líneas celulares de cáncer de mama para un conjunto de muestras de cáncer (GSE12276) se muestran en la figura 26. Las muestras de cáncer de mama se subdividieron en las clasificaciones bien conocidas: Luminal A (LumA), Luminal B (LumB), Receptor del factor de crecimiento epidérmico humano 2 positivo (HER2) y subtipo de cáncer de mama basal. Se sabe que las muestras de tejido de los subtipos luminal A y luminal B expresan ER. También es en estos subtipos donde se predice que la mayoría de las muestras tienen una alta actividad en la ruta ER. Por otro lado, se sabe que las muestras que se clasifican como del subtipo basal tienen una expresión baja o nula de ER, lo que se correlaciona muy bien con ninguna ruta ER activa predicha en las muestras del grupo basal. En el grupo HER2, solo tres muestras tienen un P(ER activada) > 0.5, mientras que se predice que la mayoría de las muestras tendrán una ruta ER inactiva. Esto se correlaciona bien con el hecho de que la clasificación se realiza sobre el hecho de que estas muestras tienen una expresión de HER2 amplificada; la replicación celular incontrolada es presumiblemente impulsada a través de la señalización de HER2 a través de otras rutas de señalización celular distintas de la ruta ER (véanse, por ejemplo, las líneas celulares de cáncer de mama activas Wnt en la figura 24 o las muestras de cáncer de mama activo Hedgehog en la figura 30).
El modelo de red bayesiana de ER construido y entrenado como se describe en este documento se usa para predecir la actividad de la ruta ER en un gran panel de líneas celulares de diversos cánceres, los resultados se muestran en la figura 27. Como era de esperar, solo las muestras predichas activas de ER fueron que se encuentra en las líneas celulares de cáncer de mama. Se predijo que todos los demás tipos de líneas de células cancerosas tendrían una ruta ER inactiva, que es como se esperaba.
El modelo de red bayesiana construido y entrenado para la ruta Hedgehog como se describe en este documento se usa para predecir la actividad de la ruta Hedgehog para líneas celulares de diversos tipos de cáncer en el conjunto de datos GSE34211. Las predicciones de la actividad de Hedgehog se muestran en la figura 28. Las fracciones más altas de actividad de Hedgehog predicha positiva se encuentran en los tipos de cáncer del sistema nervioso central (SNC), piel, endometrio y útero, lo que concuerda con el conocimiento de la bibliografía sobre proliferación celular dependiente de Hedgehog en estos tipos de células.
La figura 29 muestra la actividad Hedgehog predicha de las muestras de meduloblastoma (GSE10327) que ya se analizó usando el modelo de red Wnt Bayesiana como se describe en este documento. Las muestras de meduloblastoma se han caracterizado en subclases, y una de ellas tiene una ruta de señalización Hedgehog activa (identificador: SHH). Se predice que todas las muestras en el subtipo SHH tienen una señalización Hedgehog activa. Además, también se predijo que los meduloblastomas simples en el subtipo Wnt tenían una ruta Hedgehog activa. Esto está de acuerdo con la evidencia clínica que muestra que a menudo ambas rutas están activas en estos tumores. Sin embargo, la red bayesiana de Wnt fue de manera clara capaz de predecir correctamente la actividad de Wnt solo en el subtipo Wnt. De este modo, la combinación de la red bayesiana Wnt y Hedgehog permite hacer una clasificación correcta de estos dos subtipos.
La actividad de Hedgehog predicha en las muestras de cáncer de mama GSE12276, usada anteriormente para predecir la actividad de ER usando el modelo de red bayesiana de ER, usando el modelo de red de Hedgehog bayesiana se muestra en la figura 30. Se predice que la ruta de Hedgehog está activa en una fracción de las muestras de cada subtipo. Esto parece extraño, pero si se compara con la predicción de la ruta ER que se muestra en la figura 26, se puede ver que la actividad de Hedgehog solo se predice en muestras que no tienen una ruta ER activa. Esto concuerda bien con la hipótesis de que la proliferación celular incontrolada en el tejido (mamario) puede ser impulsada por diferentes rutas de señalización.
En resumen, los resultados de la prueba para diversas muestras de tejido canceroso y células presentados en las figuras 21 - 30 sugieren fuertemente que las redes bayesianas de los modelos Wnt, e R y Hedgehog entrenados en muestras específicas de tejido/ruta son aplicables al análisis de muestras de otros tipos de tejido. Esto puede permitir que se aplique el análisis de la ruta de señalización celular "tipo tejido cruzado". De este modo, el sistema CDS 10 (como se describe en este documento) se aplica fácilmente para evaluar la actividad de la ruta en una variedad de tipos de tejido distintos del tipo de tejido de las muestras usada para entrenar el modelo 40 de red bayesiana (véase, por ejemplo, la figura 20 que muestra esquemáticamente un sistema de apoyo de decisiones clínicas (CDS) configurado para evaluar una o más rutas de señalización celular como se describe en este documento (se muestra un ejemplo para la ruta Wnt)). En los casos en los que los componentes de inferencia 40, 44, 46, 48 indican que el tejido bajo análisis exhibe una actividad anormalmente alta de la ruta Wnt, ER o Hedgehog, pero no hay un fármaco específico de tejido disponible, un fármaco general de supresión de la ruta Wnt, ER o Hedgehog, o un fármaco específico para mal funcionamiento, puede ser considerado por el médico en base a la recomendación 28 o la recomendación 26, respectivamente, según lo dispuesto por el sistema CDS 10.
Aunque los resultados de las figuras 21-30 indican la aplicabilidad de tipos de tejidos cruzados del modelo de red bayesiana para las rutas Wnt, ER y Hedgehog, se espera que para aplicaciones clínicas los modelos de red bayesiana se puedan actualizar o adaptar opcionalmente para maximizar su aplicabilidad al tipo de tejido específico bajo análisis (por ejemplo, tejido mamario o tejido hepático). Tal actualización o adaptación podría implicar, por ejemplo, ajustar las probabilidades condicionales en base a estudios clínicos del tipo de tejido bajo análisis o enriquecer la lista de genes diana curada por evidencia, descrita en este documento, con genes diana específicos de tejido de la (s) ruta (s) bajo investigación. Adicionalmente, se pueden agregar o eliminar nodos para ajustar mejor el modelo de red bayesiana al tejido que se está analizando. Alternativamente, se pueden entrenar ab initio diferentes modelos de redes bayesianas usando diferentes conjuntos de entrenamiento para los diferentes tipos de tejidos. Adicionalmente, los resultados de las figuras 21-30 ilustran la capacidad del procedimiento descrito en este documento para desarrollar y entrenar modelos de redes bayesianas usando listas de genes diana curadas por evidencia de rutas distintas de Wnt, ER y Hedgehog para predecir y diagnosticar la actividad de la ruta.
Los resultados de la prueba del modelo de red bayesiana AR construido y entrenado como se describe en este documento se usó a modo de ejemplo para predecir la actividad AR en líneas celulares de cáncer de próstata LNCaP tratadas con diferentes regímenes de tratamiento (GSE7708) (véase la figura 38). Como se esperaba, las células LNCaP no estimuladas con DHT dan como resultado una ruta AR inactiva predicha, mientras que se predijo correctamente que las células estimuladas con LNCaP tendrían una ruta AR activa y que las células LNCaP tratadas con Bicalutamida, un fármaco antiandrógeno, tenían una ruta AR inhibida. La red bayesiana entrenada de la ruta AR como se describe en este documento también se usó para predecir la probabilidad de que la ruta AR esté activa en muestras de cáncer de próstata del conjunto de datos GSE17951 (los resultados se muestran en la figura 39). No se predijo inesperadamente que la mayoría de las biopsias de próstata y los tumores tuvieran una mayor probabilidad de actividad AR en comparación con las muestras de control.
El modelo de red bayesiana AR también se aplicó a una prueba de tejido cruzado, a saber. las muestras de cáncer de mama incluidas en el conjunto de datos GSE12276. Los resultados de esta prueba se muestran en la figura 40. Se predice que una pequeña fracción de las muestras, que se encuentran en cada subgrupo, tienen una ruta activa, mientras que la gran mayoría de las muestras tienen una ruta AR inactiva. Sorprendentemente, el porcentaje más alto de muestras con una ruta AR activa se encuentra en el subgrupo HER2, lo que no es inesperado, ya que se sabe por la bibliografía que existe diafonía entre las rutas HER2 y AR y que la ruta AR también puede ser inducida por señalización de HER2.
El modelo de red bayesiana AR mencionado anteriormente también se usó para predecir la actividad de la ruta AR en dos conjuntos de muestras de líneas celulares de diversos tipos de cáncer (GSE36133 y GSE34211) como se muestra en la figura 41 y la figura 42. Como era de esperar, Se encontró que la mayoría de las líneas celulares tenían una ruta AR inactiva. Las excepciones a esto son las muestras de cáncer de próstata con varias muestras de líneas de células cancerosas que expresan la actividad de la ruta AR. En la tabla 12 se muestra que todas las predicciones de la actividad de la ruta AR de las muestras de cáncer de próstata están de acuerdo con la actividad AR conocida.
Tabla 12. Actividad AR conocida y predicha en líneas celulares de cáncer de próstata en conjuntos de datos GSE36133 y GSE34211.
Figure imgf000033_0001
Ejemplo 7: pronóstico en base a la actividad de la ruta
Se cree que las rutas de desarrollo tempranas, como Wnt y Hedgehog, juegan un papel en la metástasis causada por células cancerosas que han revertido a un fenotipo más parecido a las células madre, llamadas células madre cancerosas. De hecho, hay suficiente evidencia disponible para que las rutas de desarrollo temprano, tales como la ruta Wnt, jueguen un papel en la metástasis del cáncer, permitiendo que las células cancerosas metastásicas comiencen a dividirse en el lugar de siembra en otro órgano o tejido. La metástasis se asocia con un mal pronóstico, se espera de este modo que la actividad de las rutas del desarrollo temprano, tales como la ruta Wnt y Hedgehog, en las células cancerosas sea predictiva de un mal pronóstico. Esto está respaldado por el hecho de que los pacientes con cáncer de mama, del conjunto de datos GSE12276, que se identificaron con una ruta ER activa pero sin una ruta Wnt o Hedgehog activa usando los modelos de red bayesiana descritos en este documento, tuvieron un mejor pronóstico que los pacientes identificados ya sea con una ruta Hedgehog activa o Wnt o ambas, como se ilustra en el gráfico de Kaplan-Meier en la figura 37.
Ejemplo 8: planificación de la terapia, predicción de la eficacia del fármaco, predicción de efectos adversos y seguimiento de la eficacia del fármaco
El siguiente ejemplo ilustra cómo usar los modelos probabilísticos, en particular los modelos de red bayesiana, para la planificación de la terapia, la predicción de la eficacia del fármaco, el seguimiento de la eficacia del fármaco y actividades relacionadas.
El modelo de red bayesiana de la ruta ER, construido usando un nodo para la presencia del factor de transcripción, una capa de nodos que representa los niveles de ARNm de los genes diana (Tabla 2) y una capa de nodos que representan las intensidades de los conjuntos de sondas correspondientes a los genes diana (Tabla 2), análogos a la figura 6 descrita en este documento, y entrenados como se describe en este documento, se usaron para predecir la actividad de la ruta. Posteriormente se demuestra que la actividad de la ruta está correlacionada con la eficacia del fármaco o con el seguimiento de la eficacia del fármaco. Los resúmenes de resultados se muestran en las figuras 31 y 32.
El tamoxifeno es un fármaco utilizado actualmente para el tratamiento del cáncer de mama ER+ (receptor de estrógeno positivo). Actúa como un antagonista parcial del receptor de estrógeno que inhibe la proliferación celular descontrolada que se cree que es inducida por la señalización del ER. Desafortunadamente, no todos los cánceres de mama responden al tratamiento con tamoxifeno, a pesar de la demostración de la presencia de proteína ER en las células cancerosas mediante el análisis histopatológico de rutina de los portaobjetos de tejido canceroso. Se han realizado muchos estudios para investigar esta denominada resistencia al tamoxifeno. El conjunto de datos de GSE21618 disponible públicamente es el resultado de uno de tales estudios y contiene datos de micromatrices de líneas celulares MCF7 resistentes al tamoxifeno y de tipo salvaje bajo diferentes regímenes de tratamiento.
El modelo de red bayesiana ER construido y entrenado como se describe en este documento se usa para analizar las líneas celulares MCF7 y resistentes al Tamoxifeno bajo diferentes regímenes de tratamiento; los resultados se muestran en la figura 31.
Se predice que la línea celular de control resistente al tamoxifeno, indicada por TamR.Ctrl, tiene una ruta ER inactiva para cada punto de tiempo después de la adición de tamoxifeno (1,2, 3, 6, 12, 24 y 48 h). No es sorprendente que el tratamiento de la línea celular resistente al tamoxifeno, que es insensible al tratamiento con tamoxifeno, con tamoxifeno, indicado por TamR.Tam, sea ineficaz, lo que también se ilustra por la inactividad predicha de la ruta ER para este grupo sobre los mismos puntos de tiempo. Según el análisis de la línea celular resistente al tamoxifeno (TamR.Ctrl), la fuerza impulsora de la proliferación celular descontrolada no se debe a la señalización activa del ER; por lo tanto, tratarlo con un antagonista de ER no inhibirá la proliferación celular. Esto ilustra que no se recomienda el tratamiento con tamoxifeno en caso de una actividad de la ruta ER predicha negativa.
Por otro lado, la línea celular MCF7 de tipo salvaje, conocida por ser sensible al tamoxifeno, tratada con 17betaestradiol (wt1.E2) reacciona lentamente al tratamiento hormonal que es visible en las predicciones de actividad positiva de ER en aumento. El tratamiento de una línea celular de este tipo con inhibidores de aromatasa que se sabe que inhiben la producción de estrógenos inhibirá la ruta ER, que se ilustra mediante la predicción de la ruta ER decreciente en el tiempo. Para respaldar esto, están las predicciones de la ruta ER realizadas en base a los datos de micromatrices de muestras de MCF7 tratadas con estrógeno para aumentar el tiempo en el conjunto de datos GSE11324, los resultados se muestran en la figura 32.
Lo mencionado anteriormente ilustra la capacidad de los modelos probabilísticos, en particular los modelos de red bayesiana, para usarse para la planificación de la terapia, la predicción de la eficacia del fármaco y el seguimiento de la eficacia del fármaco. Sin embargo, se debe entender que la misma metodología también se aplicaría para predecir y monitorear los efectos adversos.
Ejemplo 9: desarrollo de fármacos
De manera similar al seguimiento de la respuesta a la terapia, se puede usar un modelo de ruta en el desarrollo de fármacos para evaluar la eficacia de diversos compuestos putativos. Por ejemplo, cuando se criban muchos compuestos para un posible efecto sobre una determinada ruta en una línea celular cancerosa, el modelo de ruta respectivo se puede usar para determinar si la actividad de la ruta aumenta o disminuye después de la aplicación del compuesto o no. A menudo, esta verificación se realiza usando solo uno o algunos de los marcadores putativos de la actividad de la ruta, lo que aumenta la posibilidad de un seguimiento ineficaz del efecto del tratamiento. Adicionalmente, en estudios de seguimiento en animales o pacientes, los modelos de ruta se pueden usar de manera similar para evaluar la efectividad de los fármacos candidatos y para determinar una dosis óptima para impactar al máximo la actividad de la ruta.
Un ejemplo de seguimiento ineficaz de nuevos compuestos farmacológicos se ilustra mediante la actividad de la ruta AR predicha en las muestras de GSE7708 como se muestra en la figura 38. En este estudio, dos posibles compuestos farmacológicos para inhibir la actividad de la ruta AR, indicados por Poliamida 1 y Poliamida 2, han sido desarrollados. Se ha demostrado que estas dos poliamidas son capaces de inhibir la ruta AR en base a los hallazgos de que las poliamidas se unen al elemento de respuesta a los andrógenos (ARE) e inhiben la expresión de KLK3 (= PSA), un marcador bien conocido de la actividad AR también incluido en la selección del gen diana como se describe en este documento, así como = el 35% de las transcripciones que fueron inducidas por DHT. Por el contrario, el modelo de red bayesiana de la ruta AR predijo que estas muestras seguirían teniendo una ruta AR activa. La investigación de las probabilidades inferidas de que los genes diana se regulen al alza usando el modelo de red bayesiana AR indicó que KLK3, en contraste con los otros genes diana, estaba regulado a la baja de acuerdo con los hallazgos, mientras que todos los demás genes diana (excepto AR, GUCY1A3 y TMPRSS2 en el caso de poliamida 1) se expresaron claramente diferencialmente en las muestras tratadas con Poliamida 1 y Poliamida 2. En otras palabras, solo un marcador para la actividad de AR, KLK3, se reguló a la baja, mientras que la mayoría de los genes diana identificados todavía estaban regulados al alza, lo que indica que la ruta AR todavía está en gran parte intacta y, de este modo, activa. Teniendo en cuenta un mayor número de genes diana en base a la evidencia en la bibliografía, los inventores pudieron demostrar que la inhibición de la actividad AR de las poliamidas es limitada y que solo la expresión de KLK3 está claramente regulada a la baja usando estas poliamidas. Además, esto ilustra el valor de un enfoque sistemático que usa un modelo de red bayesiana en comparación con un enfoque reduccionista en el desarrollo de fármacos.
Ejemplo 10: Desarrollo de un ensayo
En lugar de aplicar las redes bayesianas mencionadas en los datos de entrada de ARNm que provienen de micromatrices o secuenciación de ARN, puede ser beneficioso en aplicaciones clínicas desarrollar ensayos dedicados para realizar las mediciones de muestras, por ejemplo, en una plataforma integrada usando qPCR para determinar los niveles de ARNm de genes diana. Las secuencias de ARN/ADN de los genes diana descritos se pueden usar luego para determinar qué cebadores y sondas para seleccionar en dicha plataforma.
La validación de dicho ensayo dedicado se puede realizar usando las redes bayesianas en base a micromatrices como modelo de referencia y verificando si el ensayo desarrollado da resultados similares en un conjunto de muestras de validación. Además de un ensayo dedicado, esto también se puede hacer para construir y calibrar modelos de red bayesiana similares usando datos de secuenciación de ARNm como medidas de entrada.
Ejemplo 11: Investigación de rutas e investigación de fisiopatología del cáncer
Lo siguiente ilustrará cómo los modelos de redes bayesianas se pueden emplear en la investigación de rutas (clínicas), es decir, investigación interesada en descubrir qué rutas están implicadas en determinadas enfermedades, que pueden seguirse para una investigación más detallada, por ejemplo, para vincular mutaciones en las proteínas de señalización con cambios en la activación de la ruta (medida con el modelo). Esto es relevante para investigar el inicio, crecimiento y evolución y metástasis de cánceres específicos (la fisiopatología).
Los modelos de red bayesiana de la ruta Wnt, ER, Hedgehog y AR, construidos usando un nodo para la presencia del factor de transcripción, una capa de nodos que representan los niveles de ARNm de los genes diana (tabla 1, tabla 2, tabla 3 y tabla 4) y una capa de nodos que representan las intensidades de los conjuntos de sondas correspondientes a los genes diana (tabla 1, tabla 2, tabla 3 y tabla 4), análoga a la figura 6 descrita en este documento, y entrenada como se describe en este documento, se usaron para predecir la actividad de la ruta de un conjunto de datos que consta de muestras de cáncer de mama (GSE12276).
Supongamos que el investigador está interesado en investigar la ruta o rutas de señalización celular y la (s) desregulación (es) específica (s) que impulsa (n) la proliferación celular descontrolada. El investigador puede analizar los datos de micromatrices usando los modelos probabilísticos mencionados anteriormente, en particular los modelos de red bayesiana, para encontrar qué rutas son presumiblemente la causa de la proliferación celular descontrolada. En la figura 33 y la figura 34 se puede ver una ilustración de dicho análisis para el caso de la actividad Wnt, ER y Hedgehog (muestras A basal y luminal del conjunto de datos GSE12276). Posteriormente, el investigador puede buscar con más detalle para encontrar la causa exacta de la desregulación de la ruta.
Con referencia a la figura 34, se sabe que las muestras basales tienen un estado de receptor triple negativo (ER, PR y HER2), por lo tanto no es sorprendente ver que se predice que todas las muestras tienen una ruta ER inactiva. Por otro lado, se predice que algunas de las muestras tendrán ya sea Wnt o Hedgehog o ambas activas, como se muestra en la figura 34. Estas actividades de la ruta predicha persuaden al investigador a investigar estas muestras con más detalle, por ejemplo, mutaciones conocidas u otras desregulaciones conocidas en las rutas Wnt y/o Hedgehog.
Se da otro ejemplo en la figura 33, donde se ilustran las actividades Wnt, ER y Hedgehog en las muestras luminal A del conjunto de datos GSE12276. Se sabe que las muestras de Luminal A expresan ER, sin embargo, esto no significa necesariamente que las propiedades cancerosas se deban a la señalización activa de ER. A partir de las actividades de la ruta predicha, se puede inferir que menos de la mitad de las muestras tienen una señalización ER activa. Sin embargo, algunas de las muestras que no tienen una señalización ER activa tienen una ruta Wnt y/o Hedgehog activa. Esto podría dar lugar a que el investigador investigue estas muestras con más detalle para detectar defectos en la ruta de señalización Wnt y/o Hedgehog, respectivamente. Algunas de las muestras no predicen que ninguna de las tres rutas incluidas esté activa; tal vez otras rutas estén causando las proliferaciones celulares incontroladas. Además, esto le da al investigador información adicional para buscar defectos en otras rutas.
En resumen, las ilustraciones descritas en este documento indican la capacidad de los modelos de redes bayesianas entrenados (como se describió anteriormente) para apoyar el procedimiento de encontrar la causa de la proliferación celular descontrolada en un método más dirigido. Al emplear las redes bayesianas para cribar las muestras en busca de actividades de la ruta, las actividades de la ruta predichas pueden señalar las posibles rutas para la proliferación celular, que pueden seguirse para una investigación más detallada, por ejemplo para vincular mutaciones en proteínas de señalización u otras desregulaciones conocidas con cambios en la activación (medidos con el modelo). Al emplear las redes bayesianas para seleccionar las muestras en busca de actividades de la vía, las actividades de la vía predichas pueden señalar las posibles vías para la proliferación celular, que pueden seguirse para una investigación más detallada, por ejemplo, para vincular mutaciones en proteínas de señalización u otras desregulaciones conocidas con cambios en la activación (según lo medido con el modelo)
Como se describe en este documento, el procedimiento para desarrollar y entrenar una red bayesiana de rutas de señalización celular se puede usar para construir un modelo de red bayesiana para otras rutas que también podrían emplearse en conexión con la presente invención.
Ejemplo 12: Inscripción de un sujeto en un ensayo clínico en base a la actividad prevista
Si se desarrolla un fármaco candidato para, por ejemplo, bloquear la actividad de una determinada ruta que impulsa el crecimiento del tumor, y este fármaco se va a someter a un ensayo clínico, entonces es esencial una selección adecuada de los sujetos que se inscribirán en dicho ensayo para probar la eficacia potencial del fármaco. En dicho caso, los pacientes que no tienen la ruta respectiva activada en sus tumores deben ser excluidos del ensayo, ya que es obvio que el fármaco no puede ser eficaz si la ruta no se activa en primer lugar. Por consiguiente, un modelo de ruta que puede predecir la actividad de la ruta se puede usar como una herramienta de selección, para seleccionar solo aquellos pacientes que se predice que tendrán activada la ruta respectiva.
Ejemplo 13: Selección de pruebas posteriores que se van a realizar
Si un tumor se analiza usando diferentes modelos de rutas, y los modelos predicen la desregulación de una determinada ruta, entonces esto puede guiar la selección de las pruebas posteriores que se van a realizar. Por ejemplo, se puede ejecutar un ensayo de ligadura de proximidad (PLA) para confirmar la presencia del complejo de transcripción respectivo (Soderberg O, 2006). Dicha PLA se puede diseñar para dar un resultado positivo si dos proteínas clave en un complejo TF se han unido juntas, por ejemplo, betacatenina y TCF4 en el complejo TF de la ruta Wnt.
Otro ejemplo es que la ruta que se predice que se desregulará se analiza con más detalle con respecto a la cascada de señalización. Por ejemplo, se pueden analizar proteínas clave en esta ruta para determinar si existen mutaciones en las regiones de a Dn que codifican sus genes respectivos, o se puede probar la abundancia de estas proteínas para ver si son más altas o más bajas de lo normal. Tales pruebas pueden indicar cuál es la causa raíz detrás de la desregulación de la ruta y dar información sobre qué medicamentos disponibles podrían usarse para reducir la actividad de la ruta.
Estas pruebas se seleccionan para confirmar la actividad de la ruta identificada usando el modelo bayesiano. Sin embargo, también es posible la selección de pruebas de diagnóstico complementarias. Después de la identificación de la ruta mediante el modelo, para la elección de la terapia dirigida solo es necesario realizar las pruebas de diagnóstico complementarias (la selección), que son aplicables a la ruta identificada.
Ejemplo 14: Selección de pruebas de diagnóstico complementarias
De manera similar al ejemplo anterior, si se analiza un tumor y los modelos de ruta predicen la desregulación de una determinada ruta y, opcionalmente, se han realizado un número de pruebas adicionales para investigar la causa de la desregulación, entonces un oncólogo puede seleccionar un número de fármacos candidatos para tratar al paciente. Sin embargo, el tratamiento con dicho fármaco puede requerir que se ejecute primero una prueba de diagnóstico complementaria, por ejemplo, para cumplir con las pautas clínicas o para garantizar el reembolso de los costos del tratamiento, o porque la normativa (FDA) requiere realizar la prueba de diagnóstico complementaria antes de administrar el fármaco. Un ejemplo de dicha prueba de diagnóstico complementaria es la prueba Her2 para el tratamiento de pacientes con cáncer de mama con el fármaco Herceptin (Trastuzumab). Por consiguiente, el resultado de los modelos de ruta se puede usar para seleccionar los fármacos candidatos y las respectivas pruebas de diagnóstico complementarias que se van a realizar.
Ejemplo 15: aplicación CDS
Con referencia a la figura 20 (que muestra esquemáticamente un sistema de apoyo a las decisiones clínicas (CDS) configurado para evaluar una o más rutas de señalización celular como se describe en este documento (se muestra un ejemplo para la ruta Wnt)), un sistema de apoyo a las decisiones clínicas (CDS) 10 se implementa como un ordenador 12 configurada adecuadamente. El ordenador 12 se puede configurar para operar como el sistema CDS 10 mediante la ejecución de software, firmware u otras instrucciones apropiadas almacenadas en un medio de almacenamiento no transitorio (no mostrado) tal como un disco duro u otro medio de almacenamiento magnético, un disco óptico u otro medio de almacenamiento óptico, una memoria de acceso aleatorio (RAM), una memoria de solo lectura (ROM), una memoria flash u otro medio de almacenamiento electrónico, un servidor de red, etc. Si bien el sistema de CDS 10 ilustrativo está representado por el ordenador 12 ilustrativo, más generalmente el sistema de CDS se puede realizar mediante un dispositivo de procesamiento digital o un aparato que comprende un procesador digital configurado para realizar métodos de apoyo de decisiones clínicas como se establece en este documento. Por ejemplo, el dispositivo de procesamiento digital puede ser un dispositivo portátil (por ejemplo, un asistente de datos personales o un teléfono inteligente que ejecuta una aplicación CDS), un ordenador portátil, un ordenador de escritorio, una tableta o dispositivo, un servidor de red remoto, etc. El ordenador 12 u otro dispositivo de procesamiento digital incluye por lo general o está conectado operativamente con un dispositivo 14 de visualización a través del cual la información que incluye recomendaciones de apoyo a la decisión clínica se muestra al personal médico. El ordenador 12 u otro dispositivo de procesamiento digital por lo general también incluye o está conectado operativamente con uno o más dispositivos de entrada de usuario, tales como un teclado 16 ilustrativo, o un ratón, trackball, trackpad, pantalla sensible al tacto (posiblemente integrado con el dispositivo 14 de visualización), u otro dispositivo de entrada de usuario en base a punteros, a través del cual el personal médico puede introducir información tal como comandos operativos para controlar el sistema CDS 10, datos para su uso por el sistema CDS 10, etc.
El sistema CDS 10 recibe como entrada información perteneciente a un sujeto médico (por ejemplo, un paciente de un hospital o un paciente ambulatorio que está siendo tratado por un oncólogo, médico u otro personal médico, o una persona que se somete a detección de cáncer o algún otro diagnóstico médico que se sabe o se sospecha que tiene cierto tipo de cáncer, tal como cáncer de colon, cáncer de mama o cáncer de hígado, etc.). El sistema CDS 10 aplica diversos algoritmos de análisis de datos a esta información de entrada para generar recomendaciones de apoyo a la decisión clínica que se presentan al personal médico a través del dispositivo 14 de visualización (o mediante un sintetizador de voz u otro dispositivo que proporcione una salida perceptible por el ser humano). En algunas realizaciones, estos algoritmos pueden incluir la aplicación de una guía clínica al paciente. Una guía clínica es un conjunto almacenado de recomendaciones de tratamiento estándar o "canónico", por lo general construido en base a las recomendaciones de un panel de expertos médicos y opcionalmente formateado en forma de un "diagrama de flujo" clíni
algoritmos de procesamiento de datos del CDS 10 pueden incluir adicional o alternativamente diversos algoritmos de pruebas clínicas o de diagnóstico que se realizan con información de entrada para extraer recomendaciones de decisiones clínicas, tales como métodos de aprendizaje automático descritos en este documento.
En los sistemas CDS ilustrativos descritos en este documento (por ejemplo, el sistema CDS 10), los algoritmos de análisis de datos CDS incluyen uno o más algoritmos de pruebas diagnósticas o clínicas que se realizan con información genómica y/o proteómica de entrada adquirida por uno o más laboratorios 18 médicos. Estos laboratorios pueden estar ubicados de diversas formas "en el lugar", es decir, en el hospital u otro lugar donde el sujeto médico se somete a un examen y/o tratamiento médicos, o "fuera del lugar", por ejemplo, un laboratorio especializado y centralizado que recibe (por correo u otro servicio de entrega) una muestra de tejido del sujeto médico que se ha extraído del sujeto médico (por ejemplo, una muestra obtenida de una lesión en la mama o del colon de un sujeto médico que se sabe o se sospecha que tiene cáncer de colon, o del hígado de un sujeto médico que se sabe o se sospecha que tiene cáncer de hígado, o etc, mediante un procedimiento de biopsia u otro procedimiento de extracción de muestras). El tejido del que se extrae una muestra también puede ser tejido metastásico, por ejemplo, (sospecha de) tejido maligno que se origina en el colon, la mama, el hígado u otro órgano que se ha extendido fuera del colon, la mama, el hígado u otro órgano. En algunos casos, la muestra de tejido puede ser células tumorales circulantes, es decir, células tumorales que han entrado en el torrente sanguíneo y se pueden extraer como muestra de tejido extraída usando técnicas de aislamiento apropiadas. La muestra extraída es procesada por el laboratorio para generar información genómica o proteómica. Por ejemplo, la muestra extraída se puede procesar usando una micromatriz (también conocido en la técnica como un chip de gen, chip de ADN, biochip, etc.) o mediante el procesamiento de la reacción en cadena de la polimerasa cuantitativa (qPCR) para medir pruebas genómicas o información proteómica tal como niveles de expresión de genes de interés, por ejemplo en forma de un nivel de ácido ribonucleico mensajero (ARNm) que se transcribe del gen, o un nivel de una proteína que se traduce del ARNm transcrito del gen. Como otro ejemplo, la muestra extraída puede ser procesada por un laboratorio de secuenciación de genes para generar secuencias para ácido desoxirribonucleico (ADN), o para generar una secuencia de ARN, variación del número de copias, etc. Otros enfoques de medición contemplados incluyen inmunohistoquímica (IHC), citología, hibridación in situ de fluorescencia (FISH), ensayo de ligadura de proximidad, etc., realizado en un portaobjetos de patología. Otra información que se puede generar mediante el procesamiento de micromatrices, espectrometría de masas, secuenciación de genes u otras técnicas de laboratorio incluye información de metilación. También se pueden realizar diversas combinaciones de tales medidas genómicas y/o proteómicas.
En algunas realizaciones, los laboratorios 18 médicos realizan un número de adquisiciones de datos estandarizados sobre la muestra extraída del tejido del sujeto médico, para generar una gran cantidad de datos genómicos y/o proteómicos. Por ejemplo, las técnicas de adquisición de datos estandarizadas pueden generar una secuencia de ADN (opcionalmente alineada) para uno o más cromosomas o porciones de cromosomas, o para todo el genoma del tejido. La aplicación de una micromatriz estándar puede generar miles o decenas de miles de elementos de datos, tales como niveles de expresión para una gran cantidad de genes, diversos datos de metilación, etc. Esta plétora de datos genómicos y/o proteómicos, o porciones seleccionadas de los mismos, se introducen en el sistema CDS 10 para ser procesados con el fin de desarrollar información clínicamente útil para formular recomendaciones de apoyo a la decisión clínica.
Los sistemas CDS descritos y los métodos relacionados se refieren al procesamiento de datos genómicos y/o proteómicos para evaluar la actividad de diversas rutas de señalización celular. Sin embargo, se debe entender que los sistemas CDS descritos (por ejemplo, el sistema CDS 10) pueden incluir opcionalmente además diversas capacidades adicionales, tales como la generación de recomendaciones de apoyo a la decisión clínica de acuerdo con las pautas clínicas almacenadas en base a diversos datos del paciente, tales como los datos de seguimiento de signos vitales, datos del historial del paciente, datos demográficos del paciente (por ejemplo, sexo, edad, etc.), datos de imágenes médicas del paciente, etc. Alternativamente, en algunas realizaciones, las capacidades del sistema CDS 10 se pueden limitar para realizar únicamente análisis de datos genómicos y/o proteómicos para evaluar las rutas de señalización celular como se describe en este documento.
Con continua referencia a la figura 20 de ejemplo, el sistema CDS 10 infiere la actividad de una ruta de señalización celular en el tejido del sujeto médico basándose al menos en, pero sin limitarse a, los niveles de expresión de genes diana de la ruta de señalización celular medidos en la muestra extraída, y determina si la ruta de señalización celular está funcionando anormalmente en el tejido del sujeto médico en base a esta actividad inferida. Los ejemplos descritos en este documento se refieren a las rutas Wnt, ER, AR y Hedgehog como rutas de señalización celular ilustrativas. Estas rutas son de interés en diversas áreas de la oncología porque la pérdida de regulación de las rutas puede ser una causa de la proliferación de un cáncer. Hay alrededor de 10-15 rutas de señalización relevantes, y cada cáncer está impulsado, en principio, por una ruta dominante que está desregulada. Sin limitarse a ninguna teoría particular de funcionamiento, estas rutas regulan la proliferación celular y, en consecuencia, una pérdida de regulación de estas rutas en las células cancerosas puede llevar a que la ruta esté "siempre activa", acelerando de este modo, la proliferación de células cancerosas, que a su vez se manifiesta como un crecimiento, invasión o metástasis (propagación) del cáncer.
La medición de los niveles de expresión de ARNm de genes que codifican proteínas reguladoras de la ruta de señalización celular, tal como una proteína intermedia que forma parte de una cascada de proteínas que forma la ruta de señalización celular, es una medida indirecta del nivel de expresión de la proteína reguladora y puede o no tener una fuerte correlación con el nivel real de expresión de la proteína reguladora (mucho menos con la actividad general de la ruta de señalización celular). La ruta de señalización celular regula directamente la transcripción de los genes diana; por consiguiente, los niveles de expresión de ARNm transcrito de los genes diana es un resultado directo de esta actividad reguladora. Por lo tanto, el sistema CDS 10 infiere la actividad de la ruta de señalización celular (por ejemplo, las rutas Wnt, ER, AR y Hedgehog) basándose al menos en los niveles de expresión de los genes diana (ARNm o nivel de proteína como medida sustituta) de la ruta de señalización celular. Esto asegura que el sistema CDS 10 infiera la actividad de la ruta en base a información directa proporcionada por los niveles de expresión medidos de los genes diana.
Sin embargo, aunque, como se describe en este documento, es eficaz para evaluar la actividad de las rutas generales, los niveles 20 de expresión medidos de los genes diana de las rutas no son especialmente informativos sobre por qué las rutas funcionan de forma anormal (si es que ese es la caso). Dicho de otra manera, los niveles 20 de expresión medidos de los genes diana de una ruta pueden indicar que la ruta está operando de manera anormal, pero no indican qué parte de la ruta está funcionando mal (por ejemplo, Carece de regulación suficiente) para hacer que la ruta general funcione de forma anormal.
De acuerdo con lo anterior, si el sistema CDS 10 detecta una actividad anormal de una ruta particular, el sistema CDS 10 entonces opcionalmente hace uso de otra información proporcionada por los laboratorios 18 médicos para la muestra extraída, tal como secuencias 22 genéticas alineadas y/o medidas del (los) nivel (es) de expresión para uno o más genes reguladores de la ruta 24, o seleccionar la prueba de diagnóstico que se va a realizar a continuación para evaluar qué parte de la ruta no funciona correctamente. Para maximizar la eficacia, en algunas realizaciones, esta evaluación opcional de por qué la ruta no funciona correctamente se realiza solo si el análisis de los niveles 20 de expresión medidos de los genes diana de la ruta indica que la ruta está funcionando de forma anormal. En otras realizaciones, esta evaluación se integra en el análisis probabilístico de la ruta de señalización celular descrita en este documento.
En las realizaciones en las que el sistema CDS 10 evalúa qué parte de la ruta está funcionando mal, y tiene éxito al hacerlo, la información adicional permite que el sistema CDS 10 recomiende prescribir un fármaco dirigido para el mal funcionamiento específico (recomendación 26 mostrada en la figura 20). Si no se identifica un mal funcionamiento de una ruta específica (ya sea porque no se realiza la evaluación adicional opcional o porque la evaluación no identifica una parte particular de la ruta que está funcionando mal), entonces el sistema CDS 10 puede proporcionar una recomendación 28 predeterminada recomendando la prescripción de un fármaco de supresión general para esta ruta en particular (asumiendo que la actividad de la ruta anormal es una actividad demasiado alta).
Ejemplo 16: un kit y herramientas de análisis para medir la actividad de la ruta
El conjunto de genes diana que se encuentra que indican mejor la actividad de la ruta específica, en base a la investigación en base a secuenciación de micromatrices/ARN usando el modelo bayesiano, se puede traducir en un ensayo de PCR cuantitativa multiplex que se va a realizar en una muestra de tejido o célula. Para desarrollar dicha prueba aprobada por la FDA para la actividad de la ruta, se requiere el desarrollo de un kit de prueba estandarizado, que debe ser validado clínicamente en ensayos clínicos para obtener la aprobación regulatoria.
En general, se debe entender que si bien los ejemplos pertenecientes a la (s) ruta (s) Wnt, ER, AR y/o Hedgehog se proporcionan como ejemplos ilustrativos, los enfoques para el análisis de la ruta de señalización celular descritos en este documento se pueden aplicar fácilmente a otras rutas de señalización celular además de estas rutas, tales como rutas de señalización intracelular con receptores en la membrana celular (cf. arriba) y rutas de señalización intracelular con receptores dentro de la célula (cf. arriba). Además: Esta solicitud describe varias realizaciones preferidas. Otros pueden realizar modificaciones y alteraciones al leer y comprender la descripción detallada anterior. Se pretende que la solicitud se interprete como que incluye todas esas modificaciones y alteraciones en la medida en que entren dentro del alcance de las reivindicaciones adjuntas o las equivalentes de las mismas.
Bibliografía:
de Sousa E Melo F, C. S. (2011). Methylation of cancer-stem-cell-associated Wnt target genes predicts poor prognosis in colorectal cancer patients. Cell Stem Cell., 476-485
Hatzis P, v. d. (2008). Genome-wide pattern of TCF7L2/TCF4 chromatin occupancy in colorectal cancer cells. Mol Cell Biol., 2732-2744
Neapolitan, R. (2004). Learning Bayesian networks. Pearson Prentice Hall
Nusse, R. (2012, May 1). Wnt target genes. Retrieved from The Wnt homepage: http://www.stanford.edu/group/nusselab/ cgi-bin/wnt/target_genes
Soderberg O, G. M. (2006). Direct observation of individual endogenous protein complexes in situ by proximity ligation. Nat Methods., 995-1000
van de Wetering M, S. E.-P.-F. (2002). The beta-catenin/TCF-4 complex imposes a crypt progenitor phenotype on colorectal cancer cells. Cell, 241-250.

Claims (9)

REIVINDICACIONES
1. Un producto que comprende cebadores para inferir la actividad de las rutas de señalización celular mediante la determinación de los niveles de expresión de conjuntos de genes diana de las respectivas rutas de señalización celular en el que las rutas de señalización celular comprenden una ruta Wnt, una ruta ER, una ruta AR y una ruta Hedgehog,
en el que el conjunto de genes diana de la ruta Wnt comprende más de tres genes diana seleccionados del grupo que comprende: KIAA1199, AXIN2, RNF43, TBX3, TDGF1, SOX9, ASCL2, IL8, SP5, ZNRF3, KLF6, CCND1, DEFA6 y FZD7,
en el que el conjunto de genes diana de la ruta ER comprende al menos tres genes diana seleccionados del grupo que comprende: CDH26, SGK3, PGR, GREB1, CA12, XBP1, CELSR2, WISP2, DSCAM, ERBB2, CTSD, TFF1 y NRIP1,
en el que el conjunto de genes diana de la ruta Hedgehog comprende al menos tres genes diana seleccionados del grupo que comprende: GLI1, PTCH1, PTCH2, IGFBP6, SPP1, CCND2, FST, FOXL1, CFLAR, TSC22D1, RAB34, S100A9, S100A7, MYCN, FOXM1, GLI3, TCEA2, FYN y CTSL1,
en el que el conjunto de genes diana de la ruta AR comprende al menos tres genes diana seleccionados del grupo que comprende: KLK2, PMEPA1, TMPRSS2, NKX3-1, ABCC4, KLK3, FKBP5, ELL2, UGT2B15, DHCR24, PPAP2A, NDRG1, LRIG1, CREB3L4, LCP1, GUCY1A3, AR y EAF2, y
en el que el producto es un kit de PCR.
2. Uso de un producto para inferir la actividad de las rutas de señalización celular que determinan los niveles de expresión de conjuntos de al menos tres genes diana, en el que las rutas de señalización celular comprenden una ruta Wnt, una ruta ER, una ruta AR y una ruta Hedgehog,
en el que el al menos tres genes diana de la ruta Wnt se seleccionan del grupo que comprende: KIAA1199, AXIN2, RNF43, TBX3, TDGF1, SOX9, ASCL2, IL8, SP5, ZNRF3, KLF6, CCND1, DEFA6 y FZD7,
en el que los al menos tres genes diana de la ruta ER se seleccionan del grupo que comprende: CDH26, SGK3, PGR, GREB1, CA12, XBP1, CELSR2, WISP2, DSCAM, ERBB2, CTSD, TFF1 y NRIP1,
en el que los al menos tres genes diana de la ruta Hedgehog se seleccionan del grupo que comprende: GLI1, PTCH1, PTCH2, IGFBP6, SPP1, CCND2, FST, FOXL1, CFLAR, TSC22D1, RAB34, S100A9, S100A7, MYCN, FOXM1, GLI3, TCEA2, FYN y CTSL1,
en el que los al menos tres genes diana de la ruta AR se seleccionan del grupo que comprende: KLK2, PMEPA1, TMPRSS2, NKX3-1, ABCC4, KLK3, FKBP5, ELL2, UGT2B15, DHCR24, PPAP2A, NDRG1, LRIG1, CREB3L4, LCP1, GUCY1A3, AR y EAF2.
3. El producto de la reivindicación 1 o el uso de la reivindicación 2, en el que los al menos tres genes diana de la ruta Wnt se seleccionan además del grupo que comprende: NKD1, Oa T, FAT1, LEF1, GLUL, REG1B, TCF7L2, COL18A1, BMP7, SLC1A2, ADRA2C, PPARG, DKK1, HNF1A y LECT2.
4. El producto de la reivindicación 1 o el uso de la reivindicación 2, en el que los al menos tres genes diana de la ruta ER se seleccionan además del grupo que comprende: AP1B1, ATp5j , COL18A1, COX7A2L, EBAG9, ESR1, HSPB1, IGFBP4, KRT19, MYC, NDUFV3, PISD, PRDM15, PTMA, RARA, SOD1 y TRIM25.
5. El producto de la reivindicación 1 o el uso de la reivindicación 2, en el que los al menos tres genes diana de la ruta Hedgehog se seleccionan además del grupo que comprende: BCL2, FOXA2, FOXF1, H19, HHIP, IL1R2, JAG2, JUP, MIF, MYLK, NKX2-2, NKX2-8, PITRM1 y TOM1.
6. El producto de la reivindicación 1 o el uso de la reivindicación 2, en el que los al menos tres genes diana de la ruta AR se seleccionan además del grupo que comprende: APP, NTS, PLAU, CDKN1A, DRG1, FGF8, IGF1, PRKACB, PTPN1, SGK1 y TACC2.
7. El producto de la reivindicación 1 o el uso de la reivindicación 2, en el que
- el conjunto de genes diana de la ruta Wnt incluye al menos nueve, preferiblemente todos los genes diana seleccionados del grupo que comprende: KIAA1199, AXIN2, RNF43, TBX3, TDGF1, SOX9, ASCL2, IL8, SP5, ZNRF3, KLF6, CCND1, DEFA6 y FZD7, y/o
- el conjunto de genes diana de la ruta ER incluye al menos nueve, preferiblemente todos los genes diana seleccionados del grupo que comprende: CDH26, SGK3, PGR, GREB1, CA12, XBP1, CELSR2, WISP2, DSCAM, ERBB2, CTSD, TFF1 y NRIP1, y/o
- el conjunto de genes diana de la ruta Hedgehog incluye al menos nueve, preferiblemente todos los genes diana seleccionados del grupo que comprende: GLI1, PTCH1, PTCH2, IGFBP6, SPP1, CCND2, FST, FOXL1, CFLAR, TSC22D1, RAB34, S100A9, S100A7, MYCN, FOXM1, GLI3, TCEA2, FYN y CTSL1, y/o
- el conjunto de genes diana de la ruta AR incluye al menos nueve, preferiblemente todos los genes diana seleccionados del grupo que comprende: KLK2, PMEPA1, TMPRSS2, NKX3-1, ABCC4, KLK3, FKBP5, ELL2, UGT2B15, DHCR24, PPAP2A, NDRG1, LRIG1, CREB3L4, LCP1, GUCY1A3, AR y EAF2.
8. El producto o uso de la reivindicación 7, en el que
- el conjunto de genes diana de la ruta Wnt incluye además al menos un gen diana seleccionado del grupo que comprende: NKD1, OAT, FAT1, LEF1, GLUL, REG1B, TCF7L2, COL18A1, BMP7, SLC1A2, ADRA2C, PPARG, DKK1, HNF1A, y LECT2, y/o
- el conjunto de genes diana de la ruta ER incluye además al menos un gen diana seleccionado del grupo que comprende: AP1B1, ATP5J, COL18A1, COX7A2L, EBAG9, ESR1, HSPB1, IGFBP4, KRT19, MYC, NDUFV3, PISD, PRDM15, PTMA, RARA, SOD1 y TRIM25, y/o
- el conjunto de genes diana de la ruta Hedgehog incluye además al menos un gen diana seleccionado del grupo que comprende: BCL2, FOXA2, FOXF1, H19, HHIP, ILIR2, JAG2, JUP, MIF, MYLK, NKX2-2, NKX2-8, PITRM1 y TOM1, y/o
- el conjunto de genes diana de la ruta AR incluye además al menos un gen diana seleccionado del grupo que comprende: APP, NTS, PLAU, CDKN1A, DRG1, FGF8, IGF1, PRKACB, PTPN1, SGK1 y TACC2.
9. El uso de una cualquiera de las reivindicaciones 2 a 8, en el que el producto es un kit, preferiblemente un kit de PCR o un kit de secuenciación de ARN, o una micromatriz.
ES18180343T 2011-07-19 2012-07-19 Evaluación de la actividad de la ruta de señalización celular usando modelos probabilísticos de la expresión del gen diana Active ES2874452T3 (es)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US201161509137P 2011-07-19 2011-07-19
EP11178148A EP2549399A1 (en) 2011-07-19 2011-08-19 Assessment of Wnt pathway activity using probabilistic modeling of target gene expression

Publications (1)

Publication Number Publication Date
ES2874452T3 true ES2874452T3 (es) 2021-11-05

Family

ID=44582424

Family Applications (3)

Application Number Title Priority Date Filing Date
ES16192584T Active ES2700617T3 (es) 2011-07-19 2012-07-19 Evaluación de la actividad de la ruta de señalización celular utilizando un modelo probabilístico de la expresión del gen objetivo
ES12751371.1T Active ES2617195T3 (es) 2011-07-19 2012-07-19 Evaluación de la actividad de la ruta de señalización celular utilizando un modelo probabilístico de la expresión del gen objetivo
ES18180343T Active ES2874452T3 (es) 2011-07-19 2012-07-19 Evaluación de la actividad de la ruta de señalización celular usando modelos probabilísticos de la expresión del gen diana

Family Applications Before (2)

Application Number Title Priority Date Filing Date
ES16192584T Active ES2700617T3 (es) 2011-07-19 2012-07-19 Evaluación de la actividad de la ruta de señalización celular utilizando un modelo probabilístico de la expresión del gen objetivo
ES12751371.1T Active ES2617195T3 (es) 2011-07-19 2012-07-19 Evaluación de la actividad de la ruta de señalización celular utilizando un modelo probabilístico de la expresión del gen objetivo

Country Status (12)

Country Link
US (2) US11443831B2 (es)
EP (6) EP2549399A1 (es)
JP (3) JP6204354B2 (es)
KR (1) KR102064004B1 (es)
CN (2) CN109852671A (es)
BR (1) BR112014000965B8 (es)
DK (3) DK3173489T3 (es)
ES (3) ES2700617T3 (es)
IN (1) IN2014CN00675A (es)
MX (1) MX352827B (es)
RU (1) RU2719194C2 (es)
WO (1) WO2013011479A2 (es)

Families Citing this family (73)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11660317B2 (en) 2004-11-08 2023-05-30 The Johns Hopkins University Compositions comprising cardiosphere-derived cells for use in cell therapy
EP2549399A1 (en) 2011-07-19 2013-01-23 Koninklijke Philips Electronics N.V. Assessment of Wnt pathway activity using probabilistic modeling of target gene expression
WO2013130364A1 (en) 2012-02-28 2013-09-06 Novartis Ag Cancer patient selection for administration of wnt signaling inhibitors using rnf43 mutation status
EP2882445B1 (en) 2012-08-13 2019-04-24 Cedars-Sinai Medical Center Exosomes and micro-ribonucleic acids for tissue regeneration
CA2896414C (en) * 2012-12-26 2023-06-20 Koninklijke Philips N.V. Assessment of cellular signaling pathway activity using linear combination(s) of target gene expressions
TWI582239B (zh) * 2013-03-11 2017-05-11 諾華公司 與wnt抑制劑相關之標記
CN105121665B (zh) * 2013-04-26 2019-11-26 皇家飞利浦有限公司 使用多重细胞信号传导途径活性的治疗应答的医学预后和预测
KR20160084363A (ko) * 2013-06-28 2016-07-13 난토믹스, 엘엘씨 진단 검사의 확인을 위한 경로 분석
JP2017502983A (ja) * 2013-10-02 2017-01-26 スリ テクノロジーズ エルティーディー. 不均一な腫瘍を処置するための患者特異的免疫療法
BR112016003868A8 (pt) 2014-01-03 2022-11-08 Koninklijke Philips Nv Método, aparelho, mídia de armazenamento não transitório, e, programa de computador
US9838847B2 (en) 2014-09-11 2017-12-05 Google LLP Data driven evaluation and rejection of trained Gaussian process-based wireless mean and standard deviation models
US9880257B2 (en) * 2014-09-11 2018-01-30 Google Llc Gaussian process-based approach for identifying correlation between wireless signals
US9810762B2 (en) * 2014-09-11 2017-11-07 Google Inc. Calculating mean wireless signal strengths using a gaussian process approach incorporating predictive standard deviations
NZ730124A (en) * 2014-09-19 2023-05-26 Univ College Dublin Nat Univ Ireland Dublin A method of predicting risk of recurrence of cancer
JP6878274B2 (ja) 2014-10-03 2021-05-26 シーダーズ−サイナイ・メディカル・センターCedars−Sinai Medical Center 筋ジストロフィーの処置における心筋球由来細胞およびこのような細胞によって分泌されたエキソソーム
JP7065609B6 (ja) * 2014-10-24 2022-06-06 コーニンクレッカ フィリップス エヌ ヴェ 複数の細胞シグナル伝達経路活性を用いる治療応答の医学的予後及び予測
US10016159B2 (en) 2014-10-24 2018-07-10 Koninklijke Philips N.V. Determination of TGF-β pathway activity using unique combination of target genes
CN108064380A (zh) * 2014-10-24 2018-05-22 皇家飞利浦有限公司 使用多种细胞信号传导途径活性的医学预后和治疗反应的预测
CN105760707B (zh) * 2014-12-18 2018-07-31 中国科学院大连化学物理研究所 细胞基因翻译过程建模方法
WO2017029215A1 (en) * 2015-08-14 2017-02-23 Koninklijke Philips N.V. Assessment of nfkb cellular signaling pathway activity using mathematical modelling of target gene expression
CN108292326B (zh) * 2015-08-27 2022-04-01 皇家飞利浦有限公司 用于识别功能性患者特异性体细胞畸变的整合方法和系统
CN106897578B (zh) * 2015-12-15 2020-02-14 中国科学院大连化学物理研究所 一种细胞基因翻译过程建模方法
WO2017123662A1 (en) 2016-01-11 2017-07-20 Cedars-Sinai Medical Center Cardiosphere-derived cells and exosomes secreted by such cells in the treatment of heart failure with preserved ejection fraction
US20170329914A1 (en) * 2016-05-11 2017-11-16 International Business Machines Corporation Predicting Personalized Cancer Metastasis Routes, Biological Mediators of Metastasis and Metastasis Blocking Therapies
WO2017210652A1 (en) 2016-06-03 2017-12-07 Cedars-Sinai Medical Center Cdc-derived exosomes for treatment of ventricular tachyarrythmias
US10621236B2 (en) * 2016-09-16 2020-04-14 At&T Intellectual Property I, L.P. Concept based querying of graph databases
WO2018057542A1 (en) 2016-09-20 2018-03-29 Cedars-Sinai Medical Center Cardiosphere-derived cells and their extracellular vesicles to retard or reverse aging and age-related disorders
US11990209B2 (en) 2016-11-11 2024-05-21 University of Pittsburgh—Of the Commonwealth System of Higher Educat Identification of instance-specific somatic genome alterations with functional impact
EP3763732A1 (en) 2016-11-25 2021-01-13 Koninklijke Philips N.V. Method to distinguish tumor suppressive foxo activity from oxidative stress
CN108300783A (zh) * 2017-01-11 2018-07-20 上海易毕恩基因科技有限公司 用于筛选肠癌和/或胃癌的基因标志物的方法、用该方法筛选的基因标志物及其用途
CN106755464A (zh) * 2017-01-11 2017-05-31 上海易毕恩基因科技有限公司 用于筛选肠癌和/或胃癌的基因标志物的方法、用该方法筛选的基因标志物及其用途
WO2018195210A1 (en) 2017-04-19 2018-10-25 Cedars-Sinai Medical Center Methods and compositions for treating skeletal muscular dystrophy
CN107184991B (zh) * 2017-05-03 2020-05-26 武汉爱博泰克生物科技有限公司 PRDM15基因序列在制备NF-κB抑制剂中的应用
CN107164508A (zh) * 2017-06-16 2017-09-15 上海易毕恩基因科技有限公司 用于检测肝癌的基因标志物及其用途
EP3431582A1 (en) 2017-07-18 2019-01-23 Koninklijke Philips N.V. Cell culturing materials
CN107201411A (zh) * 2017-07-27 2017-09-26 上海市长宁区妇幼保健院 Mylk基因作为诊断子宫内膜癌的标志物
CN107385051A (zh) * 2017-08-04 2017-11-24 上海易毕恩生物技术有限公司 用于检测肝肿瘤良恶性的基因标志物、试剂盒及检测方法
EP3462348A1 (en) * 2017-09-28 2019-04-03 Koninklijke Philips N.V. Bayesian inference
EP3461916A1 (en) 2017-10-02 2019-04-03 Koninklijke Philips N.V. Assessment of jak-stat3 cellular signaling pathway activity using mathematical modelling of target gene expression
EP3462349A1 (en) 2017-10-02 2019-04-03 Koninklijke Philips N.V. Assessment of notch cellular signaling pathway activity using mathematical modelling of target gene expression
CA3077501A1 (en) 2017-10-02 2019-04-11 Koninklijke Philips N.V. Determining functional status of immune cells types and immune response
EP3461915A1 (en) * 2017-10-02 2019-04-03 Koninklijke Philips N.V. Assessment of jak-stat1/2 cellular signaling pathway activity using mathematical modelling of target gene expression
WO2019126068A1 (en) 2017-12-20 2019-06-27 Cedars-Sinai Medical Center Engineered extracellular vesicles for enhanced tissue delivery
EP3502279A1 (en) 2017-12-20 2019-06-26 Koninklijke Philips N.V. Assessment of mapk-ap 1 cellular signaling pathway activity using mathematical modelling of target gene expression
US11475995B2 (en) * 2018-05-07 2022-10-18 Perthera, Inc. Integration of multi-omic data into a single scoring model for input into a treatment recommendation ranking
CN108875009B (zh) * 2018-06-16 2021-10-22 上海豹云网络信息服务有限公司 一种用于对数据文件进行动态处理的方法及系统
US11354591B2 (en) 2018-10-11 2022-06-07 International Business Machines Corporation Identifying gene signatures and corresponding biological pathways based on an automatically curated genomic database
WO2020124585A1 (zh) * 2018-12-21 2020-06-25 北京哲源科技有限责任公司 获得细胞内确定性事件的方法、电子设备及存储介质
EP3812474A1 (en) 2019-10-22 2021-04-28 Koninklijke Philips N.V. Methods of prognosis in high-grade serous ovarian cancer
EP3963108A1 (en) 2019-05-03 2022-03-09 Koninklijke Philips N.V. Methods of prognosis in high-grade serous ovarian cancer
WO2020227489A1 (en) * 2019-05-08 2020-11-12 Cedars-Sinai Medical Center Therapeutically active cells and exosomes
EP3739588A1 (en) 2019-05-13 2020-11-18 Koninklijke Philips N.V. Assessment of multiple signaling pathway activity score in airway epithelial cells to predict airway epithelial abnormality and airway cancer risk
AU2020334901A1 (en) * 2019-08-16 2022-03-24 Tempus Ai, Inc. Systems and methods for detecting cellular pathway dysregulation in cancer specimens
EP3822368A1 (en) 2019-11-14 2021-05-19 Koninklijke Philips N.V. Assessment of pr cellular signaling pathway activity using mathematical modelling of target gene expression
CA3163492A1 (en) 2019-12-12 2021-06-17 Tempus Labs, Inc. Real-world evidence of diagnostic testing and treatment patterns in u.s. breast cancer patients
EP3835433A1 (en) 2019-12-12 2021-06-16 Koninklijke Philips N.V. Notch signaling pathway activity as prognostic marker in bladder cancer
CN111139300B (zh) * 2020-02-19 2021-08-17 伯克利南京医学研究有限责任公司 一组结肠癌预后相关基因的应用
EP3882363A1 (en) 2020-03-17 2021-09-22 Koninklijke Philips N.V. Prognostic pathways for high risk sepsis patients
EP3978628A1 (en) 2020-10-01 2022-04-06 Koninklijke Philips N.V. Prognostic pathways for viral infections
WO2021209567A1 (en) 2020-04-16 2021-10-21 Koninklijke Philips N.V. Prognostic pathways for viral infections
CN111739586B (zh) * 2020-06-17 2024-04-05 浙江大学 以87个基因作为生物标志物预测细胞增殖活性的模型
EP3940704A1 (en) 2020-07-14 2022-01-19 Koninklijke Philips N.V. Method for determining the differentiation state of a stem cell
EP3960875A1 (en) 2020-08-28 2022-03-02 Koninklijke Philips N.V. Pcr method and kit for determining pathway activity
EP3965119A1 (en) 2020-09-04 2022-03-09 Koninklijke Philips N.V. Methods for estimating heterogeneity of a tumour based on values for two or more genome mutation and/or gene expression related parameter, as well as corresponding devices
EP3974540A1 (en) 2020-09-25 2022-03-30 Koninklijke Philips N.V. Method for predicting immunotherapy resistance
EP4015651A1 (en) 2020-12-17 2022-06-22 Koninklijke Philips N.V. Treatment prediction and effectiveness of anti-tnf alpha treatment in ibd patients
EP4039825A1 (en) 2021-02-09 2022-08-10 Koninklijke Philips N.V. Comparison and standardization of cell and tissue culture
KR20230155549A (ko) 2021-03-11 2023-11-10 코닌클리케 필립스 엔.브이. 고위험 패혈증 환자를 위한 예측 경로
CN113278700B (zh) * 2021-06-04 2022-08-09 浙江省肿瘤医院 一种用于乳腺癌分型及预后预测的引物组及试剂盒
WO2023084039A1 (en) * 2021-11-15 2023-05-19 Innosign B.V. Assessment of gr cellular signaling pathway activity using mathematical modelling of target gene expression
CN113963745A (zh) * 2021-12-07 2022-01-21 国际竹藤中心 一种构建植物发育分子调控网络的方法及其应用
WO2024033063A1 (en) 2022-08-12 2024-02-15 Innosign B.V. Prediction and monitoring of immunotherapy in cancer
CN116083590B (zh) * 2023-03-23 2024-03-22 雄安妙心医学检验有限公司 一种基因检测试剂盒及其制备方法和应用

Family Cites Families (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6566130B1 (en) * 2000-01-28 2003-05-20 Henry M. Jackson Foundation For The Advancement Of Military Medicine Androgen-regulated gene expressed in prostate tissue
US7371736B2 (en) 2001-11-07 2008-05-13 The Board Of Trustees Of The University Of Arkansas Gene expression profiling based identification of DKK1 as a potential therapeutic targets for controlling bone loss
EP1380644A1 (en) 2002-07-08 2004-01-14 Kylix B.V. The use of specified TCF target genes to identify drugs for the treatment of cancer, in particular colorectal cancer, in which TCF/beta-catenin/WNT signalling plays a central role
WO2004022575A2 (en) 2002-09-05 2004-03-18 Toolgen, Inc. Bioinformatics analysis of cellular effects of artificial transcription factors
CN101194260A (zh) * 2005-01-24 2008-06-04 利兰·斯坦福青年大学托管委员会 使用贝叶斯网络建立细胞信号传导系统模型的方法
WO2006124836A1 (en) 2005-05-13 2006-11-23 Duke University Gene expression signatures for oncogenic pathway deregulation
JP2009521736A (ja) 2005-11-07 2009-06-04 スキャンスカウト,インコーポレイテッド リッチメディアと共に広告をレンダリングするための技術
CA2651929A1 (en) 2006-05-17 2007-11-29 Timothy S. Gardner Method to determine transcriptional regulation pathways in organisms
WO2008086182A2 (en) * 2007-01-04 2008-07-17 University Of Rochester Use of gene signatures to design novel cancer treatment regimens
JP2010178650A (ja) 2009-02-04 2010-08-19 Univ Of Tokyo 固形癌の再発予測のための試験方法および再発予防剤
EP2694963B1 (en) * 2011-04-01 2017-08-02 Qiagen Gene expression signature for wnt/b-catenin signaling pathway and use thereof
BR112013028310A2 (pt) * 2011-05-05 2017-06-27 Clinical Genomics Pty Ltd método de rastreio do aparecimento ou predisposição para o aparecimento de tumor grande no intestino de um indivíduo
EP2549399A1 (en) 2011-07-19 2013-01-23 Koninklijke Philips Electronics N.V. Assessment of Wnt pathway activity using probabilistic modeling of target gene expression

Also Published As

Publication number Publication date
CN103649337A (zh) 2014-03-19
WO2013011479A3 (en) 2013-03-14
US11443831B2 (en) 2022-09-13
JP6807430B2 (ja) 2021-01-06
JP2019129850A (ja) 2019-08-08
CN109852671A (zh) 2019-06-07
DK3418396T3 (da) 2021-05-25
EP4130291B1 (en) 2024-01-10
EP3173489A1 (en) 2017-05-31
BR112014000965A2 (pt) 2017-06-13
IN2014CN00675A (es) 2015-04-03
KR102064004B1 (ko) 2020-01-08
EP2734643B1 (en) 2016-12-07
CN103649337B (zh) 2018-11-13
EP3173489B1 (en) 2018-09-19
EP3831957B1 (en) 2022-09-07
JP6783729B2 (ja) 2020-11-11
ES2700617T3 (es) 2019-02-18
EP4130291A1 (en) 2023-02-08
RU2719194C2 (ru) 2020-04-17
BR112014000965B8 (pt) 2022-11-08
RU2014106026A (ru) 2015-08-27
JP6204354B2 (ja) 2017-09-27
EP3831957A1 (en) 2021-06-09
MX2014000557A (es) 2014-05-01
DK3173489T3 (en) 2018-12-10
EP3418396A1 (en) 2018-12-26
WO2013011479A2 (en) 2013-01-24
JP2014520566A (ja) 2014-08-25
BR112014000965B1 (pt) 2021-08-24
EP4130291C0 (en) 2024-01-10
MX352827B (es) 2017-12-11
ES2617195T3 (es) 2017-06-15
EP2549399A1 (en) 2013-01-23
US20230105263A1 (en) 2023-04-06
KR20140046464A (ko) 2014-04-18
EP2734643A2 (en) 2014-05-28
JP2017205129A (ja) 2017-11-24
DK2734643T3 (en) 2017-03-20
EP3418396B1 (en) 2021-03-24
US20140156200A1 (en) 2014-06-05

Similar Documents

Publication Publication Date Title
ES2874452T3 (es) Evaluación de la actividad de la ruta de señalización celular usando modelos probabilísticos de la expresión del gen diana
AU2020202706B2 (en) Assessment of cellular signaling pathway activity using linear combination(s) of target gene expressions
AU2014259459B2 (en) Medical prognosis and prediction of treatment response using multiple cellular signalling pathway activities