ES2878196T3 - Evaluación de la actividad de la vía de señalización celular mediante el uso de una o más combinaciones lineales de expresiones de genes diana - Google Patents

Evaluación de la actividad de la vía de señalización celular mediante el uso de una o más combinaciones lineales de expresiones de genes diana Download PDF

Info

Publication number
ES2878196T3
ES2878196T3 ES13831865T ES13831865T ES2878196T3 ES 2878196 T3 ES2878196 T3 ES 2878196T3 ES 13831865 T ES13831865 T ES 13831865T ES 13831865 T ES13831865 T ES 13831865T ES 2878196 T3 ES2878196 T3 ES 2878196T3
Authority
ES
Spain
Prior art keywords
pathway
target genes
tissue
cells
expression levels
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
ES13831865T
Other languages
English (en)
Inventor
Ooijen Hendrik Jan Van
Wilhelmus Franciscus Johannes Verhaegh
De Wiel Paul Arnold Van
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Koninklijke Philips NV
Original Assignee
Koninklijke Philips NV
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Koninklijke Philips NV filed Critical Koninklijke Philips NV
Application granted granted Critical
Publication of ES2878196T3 publication Critical patent/ES2878196T3/es
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6876Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
    • C12Q1/6883Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material
    • C12Q1/6886Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material for cancer
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N5/00Computing arrangements using knowledge-based models
    • G06N5/04Inference or reasoning models
    • G06N5/048Fuzzy inferencing
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B20/00ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B25/00ICT specially adapted for hybridisation; ICT specially adapted for gene or protein expression
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B25/00ICT specially adapted for hybridisation; ICT specially adapted for gene or protein expression
    • G16B25/10Gene or protein expression profiling; Expression-ratio estimation or normalisation
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B5/00ICT specially adapted for modelling or simulations in systems biology, e.g. gene-regulatory networks, protein interaction networks or metabolic networks
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/106Pharmacogenomics, i.e. genetic variability in individual responses to drugs and drug metabolism
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/118Prognosis of disease development
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/158Expression markers
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/16Primer sets for multiplex assays
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B40/00ICT specially adapted for biostatistics; ICT specially adapted for bioinformatics-related machine learning or data mining, e.g. knowledge discovery or pattern finding

Landscapes

  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Chemical & Material Sciences (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Genetics & Genomics (AREA)
  • Theoretical Computer Science (AREA)
  • Biophysics (AREA)
  • Biotechnology (AREA)
  • General Health & Medical Sciences (AREA)
  • Molecular Biology (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Organic Chemistry (AREA)
  • Medical Informatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Evolutionary Biology (AREA)
  • Wood Science & Technology (AREA)
  • Zoology (AREA)
  • Analytical Chemistry (AREA)
  • Immunology (AREA)
  • General Engineering & Computer Science (AREA)
  • Pathology (AREA)
  • Software Systems (AREA)
  • Microbiology (AREA)
  • Biochemistry (AREA)
  • Physiology (AREA)
  • Oncology (AREA)
  • Hospice & Palliative Care (AREA)
  • Data Mining & Analysis (AREA)
  • Evolutionary Computation (AREA)
  • Artificial Intelligence (AREA)
  • Fuzzy Systems (AREA)
  • Mathematical Physics (AREA)
  • General Physics & Mathematics (AREA)
  • Computing Systems (AREA)
  • Computational Linguistics (AREA)
  • Automation & Control Theory (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)

Abstract

Un procedimiento que comprende: - inferir la actividad de una vía de señalización celular en un tejido y/o células de un sujeto médico en base al menos en los niveles de expresión (20) de uno o más genes diana de la vía de señalización celular medidos en una muestra extraída del tejido y/o las células del sujeto médico, en el que la inferencia comprende: determinar un nivel (46) de un elemento de factor de transcripción (TF) en la muestra extraída del tejido y/o las células del sujeto médico, el elemento TF controla la transcripción del uno o más genes diana de la vía de señalización celular, la determinación se basa al menos en parte en la evaluación de un modelo matemático (40-1,...,40-3) que relaciona los niveles de expresión del uno o más genes diana de la vía de señalización celular con el nivel del elemento TF, el modelo se basa en una o más combinaciones lineales de los niveles de expresión del uno o más genes diana; e inferir la actividad de la vía de señalización celular en el tejido y/o las células del sujeto médico en base al nivel determinado del elemento TF en la muestra extraída del tejido y/o las células del sujeto médico; en el que la inferencia se realiza mediante un dispositivo de procesamiento digital (12) mediante el uso del modelo de la vía de señalización celular, en el que para cada uno de los uno o más genes diana se proporcionan uno o más niveles de expresión medidos en la muestra extraída del tejido y/o las células del sujeto médico, y en el que la una o más combinaciones lineales comprenden una combinación lineal de todos los niveles de expresión del uno o más niveles de expresión proporcionados para el uno o más genes diana, o en el que para cada uno de los uno o más genes diana se proporcionan uno o más niveles de expresión medidos en la muestra extraída del tejido y/o las células del sujeto médico, y en el que la una o más combinaciones lineales comprenden una combinación lineal que incluye para cada uno de los uno o más genes diana un término ponderado, cada término ponderado se basa en un solo nivel de expresión del uno o más niveles de expresión proporcionados para el gen diana respectivo, o en el que para cada uno de los uno o más genes diana se proporcionan uno o más niveles de expresión medidos en la muestra extraída del tejido y/o las células del sujeto médico, en el que la una o más combinaciones lineales comprenden para cada uno de los uno o más genes diana una primera combinación lineal de todos los niveles de expresión del uno o más niveles de expresión proporcionados para el gen diana respectivo, y en el que el modelo se basa además al menos en parte en una combinación lineal adicional que incluye para cada uno de los uno o más genes diana un término ponderado, cada término ponderado se basa en la primera combinación lineal para el gen diana respectivo, en el que la vía de señalización celular comprende una vía de Wnt, una vía de ER, una vía de AR o una vía de HH.

Description

DESCRIPCIÓN
Evaluación de la actividad de la vía de señalización celular mediante el uso de una o más combinaciones lineales de expresiones de genes diana
El tema descrito en la presente memoria se refiere principalmente a la bioinformática, las artes de procesamiento genómico, las artes de procesamiento proteómico y las artes relacionadas.
Los análisis genómicos y proteómicos se han realizado sustancialmente y son potencialmente prometedores para la aplicación clínica en campos médicos tales como la oncología, donde se sabe que varios cánceres están asociados con combinaciones específicas de mutaciones/variaciones genómicas y/o niveles de expresión altos o bajos para genes específicos, que juegan un papel en el crecimiento y evolución del cáncer, por ejemplo, proliferación celular y metástasis. Por ejemplo, la vía de señalización de Wnt afecta la regulación de la proliferación celular y está altamente regulada. La alta actividad de la vía de Wnt debido a la pérdida de regulación se ha correlacionado con el cáncer, entre los que se encuentran los tumores de colon malignos. Aunque no se limita a ninguna teoría de funcionamiento particular, se cree que la desregulación de la vía de Wnt en las células de colon malignas conduce a una alta actividad de la vía de Wnt que a su vez provoca la proliferación celular de las células de colon malignas, es decir, la propagación del cáncer de colon. Por otro lado, la actividad anormalmente baja de la vía también podría ser de interés, por ejemplo, en el caso de la osteoporosis.
Las tecnologías para adquirir datos genómicos y proteómicos se han vuelto fácilmente disponibles en entornos clínicos. Por ejemplo, las mediciones mediante micromatrices se emplean de forma rutinaria para evaluar los niveles de expresión génica, los niveles de proteínas, la metilación, y demás. La secuenciación de genes automatizada permite la identificación rentable de variaciones genéticas en el ADN y el ARNm. La evaluación cuantitativa de los niveles de ARNm durante la secuenciación de genes es prometedora como otra herramienta clínica más para evaluar los niveles de expresión de genes.
A pesar de (o, quizás, debido a) estos avances, la aplicación clínica de los análisis genómicos y proteómicos enfrenta un obstáculo sustancial: la sobrecarga de datos. Por ejemplo, el número de mutaciones identificables en una sola muestra clínica puede ascender a cientos de miles o más. La mayoría de estas mutaciones son las llamadas mutaciones por efecto de vecindad sin una contribución específica al crecimiento del cáncer, y solo unas pocas contribuyen al crecimiento del cáncer y la evolución funcional, y estas presentan los objetivos para un tratamiento eficaz. Una sola micromatriz puede generar niveles de expresión génica para decenas de miles de genes. Procesar estas grandes cantidades de datos para identificar información clínicamente útil, como por ejemplo en la aplicación de la elección de la terapia adecuada, es difícil.
Un enfoque consiste en limitar el análisis a unas pocas pruebas canónicas o estandarizadas, tales como las pruebas aprobadas por la Administración de Drogas y Alimentos de los Estados Unidos (FDA). En tal enfoque, se detecta un indicador específico o una combinación de indicadores (por ejemplo, mutaciones y/o niveles específicos de expresión génica altos o bajos) para dar un resultado "positivo" para la condición de enfermedad indicada (por ejemplo, un tipo particular de cáncer). La prueba canónica está respaldada por estudios clínicos que han mostrado una fuerte correlación con la enfermedad o con la eficacia del tratamiento. Este enfoque es útil solo para aquellas condiciones clínicas para las que se ha desarrollado una prueba canónica, por ejemplo, el diagnóstico específico de una enfermedad o la predicción de la respuesta a un fármaco en un tipo de cáncer específico en una etapa específica, y también es rígido ya que solo es aplicable para las condiciones canónicas. La publicación de la revista Enjung Lee y otros, 2008, propone un nuevo procedimiento de clasificación en base a las actividades de las vías inferidas para cada paciente. Para cada vía, se resume un nivel de actividad a partir de los niveles de expresión génica de sus genes sensibles a la condición (CORG), definidos como el subconjunto de genes en la vía cuya expresión combinada proporciona un poder discriminativo óptimo para el fenotipo de la enfermedad.
Otro enfoque se basa en la identificación de grupos de indicadores genómicos o proteómicos relacionados funcionalmente. Por ejemplo, la vía de Wnt comprende una cascada de reacciones proteómicas. Los componentes principales de esta cadena incluyen (pero no se limitan a) la unión de la proteína de señalización Wnt a un receptor de superficie frizzled de la célula que causa la activación de proteínas de la familia desordenada de proteínas que a su vez impactan el nivel de agentes de transcripción tales como complejos proteicos basados en |3-catenina/TCF4 en el núcleo celular. Estos agentes de transcripción, a su vez, controlan la transcripción de moléculas de ARNm diana que a su vez se traducen en proteínas diana de la vía de Wnt. Los estudios clínicos han demostrado algunas correlaciones entre las proteínas reguladoras de la vía de Wnt y la actividad de la vía de Wnt.
Sin embargo, la aplicación de tales resultados de estudios clínicos al diagnóstico y la evaluación clínica de un paciente específico es difícil debido a la complejidad de las vías de señalización, por ejemplo, la vía de Wnt. Como ejemplo simple, la medición del nivel de expresión de una proteína que está "aguas arriba" en la vía de Wnt puede no detectar el comportamiento anormal de una proteína que está "aguas abajo" en la vía de Wnt. Se cree que la vía de Wnt incluye numerosos mecanismos de retroalimentación y el concepto simplificado de "aguas arriba" y "aguas abajo" puede ser inaplicable para una parte sustancial de la vía de Wnt; de manera más general, el comportamiento anormal en una parte de la cascada de proteínas que comprende la vía de Wnt puede tener más o menos efecto sobre otras partes de la cascada de proteínas y sobre la actividad de la vía de Wnt en su conjunto. Además, en algunos estudios clínicos, los niveles de expresión de proteínas para las proteínas reguladoras de la cascada de señalización se evalúan por la medición de los niveles de expresión de ARNm de los genes que codifican las proteínas reguladoras. Esta es una medición indirecta que puede no evaluar con precisión el nivel de expresión de la proteína reguladora y casi nunca refleja la cantidad de proteínas activas (después de una modificación postraduccional específica como la fosforilación).
El principal problema subyacente a la presente invención fue, por tanto, proporcionar métodos y medios adecuados para realizar análisis genómicos y, respectivamente, proteómicos. Los aspectos específicos del problema subyacente, así como también las objeciones adicionales en relación con la presente invención, se hacen evidentes al estudiar la descripción, los ejemplos proporcionados en la presente memoria y, en particular, al estudiar las reivindicaciones adjuntas.
La presente invención proporciona métodos y aparatos nuevos y mejorados como se divulga en la presente memoria.
De acuerdo con un aspecto principal de la presente invención, el problema anterior se resuelve mediante un procedimiento específico para evaluar la actividad de la vía de señalización celular mediante el uso de combinaciones lineales de expresiones de genes diana, a saber, un método que comprende:
- inferir la actividad de una vía de señalización celular en tejido y/o células de un sujeto médico con base al menos en los niveles de expresión (en particular en el nivel de ARNm y/o proteína (actividad)) de uno o más genes diana de la vía de señalización celular medida en una muestra extraída del tejido y/o las células del sujeto médico, en el que la inferencia comprende:
determinar un nivel de un elemento de factor de transcripción (TF) en la muestra extraída del tejido y/o las células del sujeto médico, el elemento TF controla la transcripción del uno o más genes diana de la vía de señalización celular, la determinación se basa al menos en parte en la evaluación de un modelo matemático que relaciona los niveles de expresión del uno o más genes diana de la vía de señalización celular con el nivel del elemento TF, el modelo se basa en una o más combinaciones lineales de los niveles de expresión del uno o más genes diana; y
inferir la actividad de la vía de señalización celular en el tejido y/o las células del sujeto médico en base al nivel determinado del elemento TF en la muestra extraída del tejido y/o las células del sujeto médico; en el que la inferencia se realiza mediante un dispositivo de procesamiento digital mediante el uso del modelo de la vía de señalización celular,
en el que para cada uno de los uno o más genes diana se proporcionan uno o más niveles de expresión medidos en la muestra extraída del tejido y/o las células del sujeto médico, y en el que la una o más combinaciones lineales comprenden una combinación lineal de todos los niveles de expresión del uno o más niveles de expresión proporcionados para el uno o más genes diana, o
en el que para cada uno de los uno o más genes diana se proporcionan uno o más niveles de expresión medidos en la muestra extraída del tejido y/o las células del sujeto médico, y en el que la una o más combinaciones lineales comprenden una combinación lineal que incluye para cada uno de los uno o más genes diana un término ponderado, cada término ponderado se basa en un solo nivel de expresión del uno o más niveles de expresión proporcionados para el gen diana respectivo, o
en el que para cada uno de los uno o más genes diana se proporcionan uno o más niveles de expresión medidos en la muestra extraída del tejido y/o las células del sujeto médico, en el que la una o más combinaciones lineales comprenden para cada uno de los uno o más genes diana una primera combinación lineal de todos los niveles de expresión del uno o más niveles de expresión proporcionados para el gen diana respectivo, y en el que el modelo se basa además al menos en parte en una combinación lineal adicional que incluye para cada uno de los uno o más genes diana un término ponderado, cada término ponderado se basa en la primera combinación lineal para el gen diana respectivo,
en el que la vía de señalización celular comprende una vía de Wnt, una vía de ER, una vía de AR o una vía de HH.
El sujeto médico puede ser un ser humano o un animal. Además, el "gen o genes diana" pueden ser "genes diana directos" y/o "genes diana indirectos" (como se describe en la presente memoria).
Los genes diana particularmente adecuados se describen en los siguientes pasajes de texto, así como también en los ejemplos más abajo (véase, por ejemplo, las Tablas 1 - 9).
Por lo tanto, de acuerdo con una realización preferente, los genes diana son los seleccionados del grupo que comprende o que consiste en genes diana enumerados en la Tabla 1 o Tabla 6 (para la vía de Wnt), genes diana enumerados en la Tabla 2, Tabla 5 o Tabla 7 (para la vía de ER), genes diana enumerados en la Tabla 3 o Tabla 8 (para la vía de HH) y genes diana enumerados en la Tabla 4 o Tabla 9 (para la vía de AR).
Es particularmente preferido un procedimiento en el que la inferencia comprende:
inferir en la actividad de una vía de Wnt en el tejido y/o las células del sujeto médico con base al menos en los niveles de expresión de uno o más, preferentemente al menos tres, genes diana de la vía de Wnt medidos en la muestra extraída del tejido y/o las células del sujeto médico que son seleccionadas del grupo que comprende o que consiste en: KIAA1199, AXIN2, RNF43, TBX3, TDGF1, SOX9, ASCL2, IL8, SP5, ZNRF3, KLF6, CCND1, DEFA6 y FZD7.
Se prefiere además un procedimiento, en el que la inferencia se basa además en los niveles de expresión de al menos un gen diana de la vía de Wnt medido en la muestra extraída del tejido y/o las células del sujeto médico seleccionado del grupo que comprende o que consiste en: NKD1, OAT, fAt 1, LEF1, GLUL, REG1B, TCF7L2, COL18A1, BMP7, SLC1A2, ADRA2C, PPARG, DKK1, HNF1A y LECT2.
Es particularmente preferido un procedimiento en el que la inferencia comprende:
inferir la actividad de una vía de ER en el tejido y/o las células del sujeto médico con base al menos en los niveles de expresión de uno o más, preferentemente al menos tres, genes diana de la vía de ER medidos en la muestra extraída del tejido y/o las células del sujeto médico seleccionadas del grupo que comprende o que consiste en: CDH26, SGK3, PGR, GREB1, CA12, XBP1, CELSR2, WISP2, DSCAM, ERBB2, CTSD, TFF1 y NRIP1.
Se prefiere además un procedimiento, en el que la inferencia es además en base a los niveles de expresión de al menos un gen diana de la vía de ER medido en la muestra extraída del tejido y/o las células del sujeto médico seleccionado del grupo que comprende o que consiste en: AP1B1, ATP5J, COL18A1, COX7A2L, EbAg 9, ESR1, HSPB1, IGFBP4, KRT19, MYC, NDUFV3, PISD, PRDM15, PTMA, RARA, SOD1 y TRIM25.
Un procedimiento en el que inferir comprende
inferir la actividad de una vía de HH en el tejido y/o las células del sujeto médico con base al menos en los niveles de expresión de uno o más, preferentemente al menos tres, genes diana de la vía de HH medidos en la muestra extraída del tejido y/o las células del sujeto médico seleccionadas del grupo que comprende o que consiste en: También se prefiere GLI1, PTCH1, PTCH2, IGFBP6, SPP1, CCND2, FST, FOXL1, CFLAR, TSC22D1, RAB34, S100A9, S100A7, MYCN, FOXM1, GLI3, TCEA2, FYN y CTSL1.
Se prefiere además un procedimiento, en el que la inferencia se basa además en los niveles de expresión de al menos un gen diana de la vía de HH medido en la muestra extraída del tejido y/o las células del sujeto médico seleccionado del grupo que comprende o que consiste en: BCL2, FOXA2, fOx F1, H19, HHIP, IL1R2, JAG2, JUP, MIF, MYLK, NKX2.2, NKX2.8, PITRM1 y TOM1.
Un procedimiento en el que inferir comprende
inferir la actividad de una vía de AR en el tejido y/o las células del sujeto médico con base al menos en los niveles de expresión de uno o más, preferentemente al menos tres, genes diana de la vía de AR medidos en la muestra extraída del tejido y/o las células del sujeto médico seleccionadas del grupo que comprende o que consiste en: También se prefiere KLK2, PMEPA1, TMPRSS2, NKX3_1, ABCC4, KLK3, FKBP5, ELL2, UGT2B15, DHCR24, PPAP2A, NDRG1, LRIG1, CREB3L4, LCP1, GUCY1A3, AR y EAF2.
Se prefiere además un procedimiento, en el que la inferencia se basa además en los niveles de expresión de al menos un gen diana de la vía de AR medido en la muestra extraída del tejido y/o las células del sujeto médico seleccionado del grupo que comprende o que consiste en: APP, NTS, PLAU, CDKN1A, DRG1, FGF8, IGF1, PRKACB, PTPN1, SGK1 y TACC2.
Otro aspecto de la presente invención se refiere a un procedimiento (como se describe en la presente memoria), que comprende, además:
determinar si la vía de señalización celular funciona de forma anormal en el tejido y/o las células del sujeto médico en base a la actividad inferida de la vía de señalización celular en el tejido y/o las células del sujeto médico; y, opcionalmente;
recomendar la prescripción de un fármaco para el sujeto médico que corrige el funcionamiento anormal de la vía de señalización celular;
en el que la recomendación se realiza solo si se determina que la vía de señalización celular funciona de forma anormal en el tejido y/o las células del sujeto médico en base a la actividad inferida de la vía de señalización celular.
La presente invención también se refiere a un procedimiento (como se describe en la presente memoria) que comprende:
inferir la actividad de una vía de Wnt en tejido y/o células de un sujeto médico con base al menos en los niveles de expresión de dos, tres o más genes diana de un conjunto de genes diana de la vía de Wnt medidos en una muestra extraída del tejido y/o las células del sujeto médico
y/o
inferir la actividad de una vía de ER en tejido y/o células de un sujeto médico con base al menos en los niveles de expresión de dos, tres o más genes diana de un conjunto de genes diana de la vía de ER medidos en una muestra extraída del tejido y/o las células del sujeto médico
y/o
inferir la actividad de una vía de HH en tejido y/o células de un sujeto médico con base al menos en los niveles de expresión de dos, tres o más genes diana de un conjunto de genes diana de la vía de HH medidos en una muestra extraída del tejido y/o las células del sujeto médico,
y/o
inferir la actividad de una vía de AR en tejido y/o células de un sujeto médico con base al menos en los niveles de expresión de dos, tres o más genes diana de un conjunto de genes diana de la vía de AR medidos en una muestra extraída del tejido y/o las células del sujeto médico.
Preferentemente, el conjunto de genes diana de la vía de Wnt incluye al menos nueve, preferentemente todos los genes diana seleccionados del grupo que comprende o que consiste en: KIAA1199, AXIN2, RNF43, TBX3, TDGF1, SOX9, ASCL2, IL8, SP5, ZNRF3, KLF6, CCND1, DEFA6 y FZD7,
y/o
el conjunto de genes diana de la vía de ER incluye al menos nueve, preferentemente todos los genes diana seleccionados del grupo que comprende o que consiste en: CDH26, SGk3, PGR, GREB1, CA12, XBP1, CELSR2, WISP2, DSCAM, ERBB2, CTSD, TFF1 y NRIP1,
y/o
el conjunto de genes diana de la vía de HH incluye al menos nueve, preferentemente todos los genes diana seleccionados del grupo que comprende o que consiste en: GLI1, PTCH1, PTCH2, IGFBP6, SPP1, CCND2, FST, FOXL1, CFLAR, TSC22D1, RAB34, S100A9, S100A7, MYCN, FOXM1, GLI3, TCEA2, FYN y CTSL1,
y/o
el conjunto de genes diana de la vía de AR incluye al menos nueve, preferentemente todos los genes diana seleccionados del grupo que comprende o que consiste en: KLK2, PMEPA1, TMPRSS2, NKX3_1, ABCC4, KLK3, FKBP5, ELL2, UGT2B15, DHCR24, PPAP2A, NDRG1, LRIG1, CREB3L4, LCP1, GUCY1A3, AR y EAF2.
Un método, en el que
el conjunto de genes diana de la vía de Wnt incluye además al menos un gen diana seleccionado del grupo que comprende o que consiste en: NKD1, OAT, FAT1, LEF1, GLUL, REG1B, TCF7L2, COL18A1, BMP7, SLC1A2, ADRA2C, PPARG, DKK1, HNF1A y LECT2,
y/o
el conjunto de genes diana de la vía de ER incluye además al menos un gen diana seleccionado del grupo que comprende o que consiste en: AP1B1, ATP5J, COL18A1, COX7A2L, EBAG9, ESR1, HSPB1, IGFBP4, KRT19, MYC, NDUFV3, PISD, PRDM15, PTMA, RARA, SOD1 y TRIM25,
y/o
el conjunto de genes diana de la vía de HH incluye además al menos un gen diana seleccionado del grupo que comprende o que consiste en: BCL2, FOXA2, FOXF1, H19, HHIP, IL1R2, JAG2, JUP, MIF, MYLK, NKX2.2, NKX2.8, PITRM1 y TOM1,
y/o
el conjunto de genes diana de la vía de AR incluye además al menos un gen diana seleccionado del grupo que comprende o que consiste en: Se prefiere particularmente APP, NTS, PLAU, CDKN1A, DRG1, FGF8, IGF1, PRKACB, PTPN1, SGK1 y TACC2.
Las muestras que se usarán de acuerdo con la presente invención pueden ser, por ejemplo, una muestra obtenida de una lesión mamaria, o del colon de un sujeto médico que se sabe o se sospecha que tiene cáncer de colon, o del hígado de un sujeto médico que se sabe o se sospecha que tiene cáncer de hígado, o demás, preferentemente mediante un procedimiento de biopsia u otro procedimiento de extracción de muestras. El tejido del que se extrae una muestra también puede ser tejido metastásico, por ejemplo, tejido maligno (sospechoso) que se origina en el colon, la mama, el hígado u otro órgano que se haya extendido fuera del colon, la mama, el hígado u otro órgano. Las células de las que se extrae una muestra también pueden ser células tumorales de neoplasias hematológicas (tal como la leucemia). En algunos casos, la muestra de células también puede ser células tumorales circulantes, es decir, células tumorales que han entrado en el torrente sanguíneo y pueden extraerse como muestra de tejido extraída mediante el uso de técnicas de aislamiento adecuadas. El término "muestra extraída", como se usa en la presente memoria, también abarca el caso en el que se han tomado tejido y/o células del sujeto médico y, por ejemplo, se han colocado en un portaobjetos de microscopio y en el que, para realizar el procedimiento reivindicado, una porción de esta muestra es extraída, por ejemplo, mediante microdisección por captura láser (LCM) o raspando las células de interés del portaobjetos.
La frase "la vía de señalización celular funciona de forma anormal" se refiere al caso en el que la "actividad" de la vía no es la esperada, en el que el término "actividad" puede referirse a la actividad del complejo del factor de transcripción para conducir los genes diana a expresión, es decir, la velocidad a la que se transcriben los genes diana. Normal puede ser cuando está inactivo en el tejido donde se espera que esté inactivo y activo donde se espera que esté activo. Además, puede haber un cierto nivel de actividad que se considera normal y cualquier nivel más alto o más bajo puede considerarse anormal.
De acuerdo con otro aspecto divulgado, un aparato comprende un procesador digital configurado para realizar un procedimiento de acuerdo con la invención como se describe en la presente memoria.
De acuerdo con otro aspecto divulgado, un medio de almacenamiento no transitorio almacena instrucciones que son ejecutables por un dispositivo de procesamiento digital para realizar un método de acuerdo con la invención como se describe en la presente memoria. El medio de almacenamiento no transitorio puede ser un medio de almacenamiento legible por computadora, tal como un disco duro u otro medio de almacenamiento magnético, un disco óptico u otro medio de almacenamiento óptico, una memoria de acceso aleatorio (RAM), una memoria de solo lectura (ROM), una memoria flash u otro medio de almacenamiento electrónico, un servidor de red, o demás. El dispositivo de procesamiento digital puede ser un dispositivo de mano (por ejemplo, un asistente de datos personales o un teléfono inteligente), una computadora portátil, una computadora de escritorio, una tableta o dispositivo, un servidor de red remoto, o demás.
De acuerdo con otro aspecto divulgado, un programa informático comprende medios de código de programa para hacer que un dispositivo de procesamiento digital realice un método de acuerdo con la invención como se describe en la presente memoria. El dispositivo de procesamiento digital puede ser un dispositivo de mano (por ejemplo, un asistente de datos personales o un teléfono inteligente), una computadora portátil, una computadora de escritorio, una tableta o dispositivo, un servidor de red remoto, o demás.
Una ventaja reside en un sistema de apoyo a la decisión clínica (CDS) que proporciona recomendaciones clínicas en base a un análisis matemático de una o más vías de señalización celular, por ejemplo, mediante el uso de un modelo matemático de una vía de Wnt, una vía de ER, una vía de AR y/o una vía de HH.
Otra ventaja reside en una transparencia mejorada de un modelo matemático que se basa, al menos en parte, en una o más combinaciones lineales.
Otra ventaja reside en proporcionar un sistema CDS que recomienda un tratamiento dirigido para la pérdida de regulación de una vía de señalización celular.
Otra ventaja reside en proporcionar un sistema CDS que está diseñado para detectar la pérdida de regulación para una vía de señalización celular particular, tal como una vía de Wnt, una vía de ER, una vía de AR o una vía de HH, y se adapta fácilmente para proporcionar recomendaciones para diferentes tipos de cáncer originados por esa vía de señalización celular en particular.
La presente invención como se describe en la presente memoria, por ejemplo, también puede usarse ventajosamente en relación con
- el diagnóstico en base a la actividad predicha (inferida);
- el pronóstico en base a la actividad predicha (inferida);
- la prescripción del fármaco en base a la actividad predicha (inferida);
- la predicción de la eficacia del fármaco en base a la actividad predicha (inferida);
- predicción de efectos adversos en base a la actividad predicha (inferida);
- seguimiento de la eficacia del fármaco;
- desarrollo del fármaco;
- desarrollo del ensayo;
- investigación de la vía;
- estadificación del cáncer;
- inscripción del sujeto en un ensayo clínico en base a la actividad predicha (inferida);
- selección de la prueba posterior a realizar, y/o;
- selección de pruebas de diagnóstico complementarias.
Las ventajas adicionales serán evidentes para los expertos en la técnica al leer y comprender las figuras adjuntas, la siguiente descripción y, en particular, al leer los ejemplos detallados que se proporcionan más bajo en la presente memoria.
Figura 1 muestra un modelo ilustrativo que representa parte de una vía de señalización celular. La vía de señalización celular está simbolizada por un complejo de factor de transcripción (TF) y los genes diana producidos como resultado de la presencia del complejo de transcripción en el núcleo celular. Los pesos que conectan los nodos de la expresión de los genes diana y el nodo TF, representados aquí por w1, w2 y w3, indican la fuerza de correlación entre el factor de transcripción presente y la expresión del gen diana en base a, por ejemplo, los datos de entrenamiento o conocimiento del experto.
Figura 2 muestra un modelo simple que representa parte de una vía de señalización celular como en la Figura 1. Aquí los nodos de expresión del gen diana del complejo de factores de transcripción se reemplazan por mediciones directas de los niveles de intensidad de expresión de los genes diana, en este caso por un conjunto de sondas que está particularmente altamente correlacionada con el gen diana particular, por ejemplo, en experimentos de micromatriz o (q)PCR. Los pesos se basan en el cálculo de un conjunto de datos de entrenamiento o en base al conocimiento de los expertos. Figura 3 muestra un modelo ilustrativo de dos capas que representa la determinación experimental de la señalización activa de una vía con más detalle. Para cada gen diana se calcula un nivel sumario mediante el uso de una combinación lineal en base a las intensidades medidas de sus conjuntos de sondas asociados. El valor sumario calculado se combina posteriormente con los valores sumario de los otros genes diana de la vía mediante el uso de una combinación lineal. Los pesos pueden aprenderse de un conjunto de datos de entrenamiento o en base al conocimiento de expertos o una combinación de los mismos.
Figura 4 muestra esquemáticamente un sistema de soporte de decisiones clínicas (CDS) configurado para evaluar una o más vías de señalización celular como se divulga en la presente memoria (se muestra un ejemplo para la vía de Wnt).
Figura 5 Resultados de entrenamiento Wnt mediante el uso de los datos de expresión continua de GSE8671, "todos los conjuntos de sondas" mencionados en la Tabla 1 y pesos "en blanco y negro". El grupo de la izquierda muestra las combinaciones lineales calculadas de muestras normales, en las que Wnt es pasivo, y el grupo de la derecha muestra las puntuaciones de actividad calculadas de las muestras de adenoma, que se sabe que tienen una vía de Wnt activa. Figura 6 Resultados de validación de Wnt de las muestras de cáncer de colon de GSE20916 (datos continuos). El modelo se entrenó mediante el uso de datos de expresión continua de GSE8671, "todos los conjuntos de sondas" mencionados en la Tabla 1 y los pesos "en blanco y negro" (véanse los resultados de entrenamiento en la Figura 5). El modelo predice correctamente que todas las muestras tendrán una vía de Wnt activa o inactiva, excepto una muestra de carcinoma que se predijo que tendría una vía de Wnt ligeramente pasiva.
Figura 7 Resultados de la prueba Wnt en muestras de meduloblastoma (GSE10327, datos continuos). El modelo se entrenó mediante el uso de datos de expresión continua de GSE8671, "todos los conjuntos de sondas" mencionados en la Tabla 1 y los pesos "en blanco y negro" (véanse los resultados de entrenamiento en la Figura 5). El modelo puede predecir que todas las muestras de meduloblastoma Wnt positivas (último grupo) tienen una vía de Wnt ligeramente activa. Todas las muestras positivas de Wnt tienen una puntuación de actividad de Wnt positiva relativamente baja en comparación con todas las muestras negativas de Wnt. Esto puede ser una indicación de que en las muestras de meduloblastoma el umbral debería ser más bajo que en las muestras de colon, posiblemente debido a diferencias específicas de tejido en la expresión génica.
Figura 8 Resultados del entrenamiento de HH mediante el uso de datos de expresión continua de GSE7553, el modelo de "dos capas" con resúmenes de genes mediante el uso de todos los conjuntos de sondas mencionados en la Tabla 3 y los pesos de "probabilidades logarítmicas". El 1er y 5to grupo de muestras (desde la izquierda) se han usado como muestras de entrenamiento positivas y negativas, respectivamente.
Figura 9 Resultados de la prueba de HH mediante el uso de los datos de expresión continua de muestras de meduloblastoma (GSE10327). El modelo se entrenó mediante el uso de los datos de expresión continua de GSE7553, el modelo de "dos capas", todos los conjuntos de sondas mencionados en la Tabla 3 y los pesos de las "probabilidades logarítmicas" (véanse los resultados del entrenamiento en la Figura 8). El modelo predice que aproximadamente la mitad de las muestras en el grupo HH positivo (indicado por shh) tienen una vía activa.
Figura 10 Resultados del entrenamiento ER mediante el uso de los datos de expresión continua de GSE8597, los "conjuntos de sondas más discriminantes" (conjuntos de sondas subrayados en la Tabla 2) y los pesos de "probabilidades logarítmicas". El 3er y 4to grupo de muestras (desde la izquierda) se han usado como muestras de entrenamiento positivas y negativas, respectivamente. Figura 11 Resultados de la prueba ER mediante el uso de los datos continuos de muestras de cáncer de mama (GSE12276). El modelo se entrena mediante el uso de los datos de expresión continua de GSE8597, los "conjuntos de sondas más discriminativos" (conjuntos de sondas subrayados en la Tabla 2) y los pesos de "probabilidades logarítmicas" (véanse los resultados del entrenamiento en la Figura 10). Se predice que aproximadamente el 25 % de las muestras de ER+ tienen una vía de ER activa que puede explicarse en parte por el tratamiento hormonal relativamente alto que no es efectivo en estos tipos de cánceres de mama de 50 - 60 %. Se predice correctamente que la vía de ER tendrá una vía de ER pasiva en las muestras-ER.
Figura 12 Predicción de la vía de ER en los datos de respuesta de la estimulación de células MCF7 tratadas con el agente estimulante de ER (E2) o con el control durante varios intervalos de tratamiento (GSE11352, datos continuos). El modelo se entrena mediante el uso de los datos de expresión continua de GSE8597, los "conjuntos de sondas más discriminativos" (conjuntos de sondas subrayados en la Tabla 2) y los pesos de "probabilidades logarítmicas" (véanse los resultados del entrenamiento en la Figura 10). Se predice adecuadamente que la actividad de la vía de ER aumentará durante tiempos de exposición más prolongados al agente estimulante ER y disminuirá en caso de inanición prolongada en el control.
Figura 13 Resultados de entrenamiento de AR mediante el uso de los datos de expresión de transformada difusa de GSE7868, "todos los conjuntos de sondas" como se menciona en la Tabla 4 y los pesos "en blanco y negro". El 1er y 2do grupo de muestras (desde la izquierda) se han usado como muestras de entrenamiento negativas y positivas, respectivamente.
Figura 14 Resultados de la prueba AR de las líneas celulares tratadas con diferentes regímenes de estimulación AR o no (GSE7708, transformada difusa). El modelo se entrenó mediante el uso de los datos de expresión de transformada difusa de GSE7868, "todos los conjuntos de sondas" como se menciona en la Tabla 4 y los pesos "en blanco y negro" (véanse los resultados de entrenamiento que se muestran en la Figura 13). El modelo predice correctamente que las líneas celulares son tratadas con un agente estimulante de AR para tener una vía de AR activa y las otras son no tratadas con un agente estimulante de AR (cuarto grupo de muestras) o tratadas con un agente estimulante y un fármaco antiandrógeno (primer grupo de muestras) para tener una vía de AR pasiva.
Figura 15 Resultados de la prueba AR de muestras de próstata (GSE17951, transformada difusa). El modelo se entrenó mediante el uso de los datos de expresión de transformada difusa de GSE7868, "todos los conjuntos de sondas" como se menciona en la Tabla 4 y los pesos "en blanco y negro" (véanse los resultados de entrenamiento que se muestran en la Figura 13). El modelo predice una frecuencia relativamente alta de vías AR activas tanto en la biopsia como en el tumor extirpado quirúrgicamente y un número relativamente bajo de actividad AR en las muestras de control. Figura 16 Curvas de supervivencia de Kaplan-Meier de pacientes del conjunto de datos GSE12276 agrupados de acuerdo con la actividad de la vía. Las curvas de supervivencia indican que los pacientes con una vía de ER activa tienen un mejor pronóstico en comparación con los pacientes que tienen una vía de ER pasiva, lo que está de acuerdo con la práctica clínica. Además, los pacientes que se predice que tienen una vía de HH o Wnt activa tienen un peor pronóstico, lo que también está respaldado por la literatura científica.
Figura 17 Resultados de la validación de ER de un experimento de estimulación con células MCF7
(GSE9253, datos continuos). El modelo (pseudo-)lineal se entrenó mediante el uso de datos de expresión continua de GSE8597, los "conjuntos de sondas más discriminativos" (conjuntos de sondas subrayados en la Tabla 2) y los pesos de "probabilidades logarítmicas" (véanse los resultados de entrenamiento en la Figura 10). Está claro a partir de las células MCF7 estimuladas con E2, agente estimulante del RE, que el umbral definido se estableció demasiado alto. La razón de esta discrepancia podría ser un régimen de estimulación diferente (es decir, mayor concentración de E2, pero menor tiempo de estimulación, etc.). Sin embargo, la diferencia de las puntuaciones de la actividad ER calculadas de las células estimuladas y no estimuladas es evidente. El control negativo predice adecuadamente que la vía de ER estará inactiva.
Figura 18 muestra la actividad de las vías Wnt, ER, AR y HH en muestras luminales A de GSE12276.
Figura 19 muestra la actividad de las vías Wnt, ER, AR y HH en muestras basales de GSE12276.
Figura 20 muestra una actividad de la vía de ER predicha en líneas celulares MCF7 y MCF7 resistentes al Tamoxifeno de GSE21618. El modelo ER (pseudo-)lineal se entrenó mediante el use de los datos de expresión continua de GSE8597, los "conjuntos de sondas más discriminativos" (conjuntos de sondas subrayados en la Tabla 2) y los pesos de "probabilidades logarítmicas" (véanse los resultados de entrenamiento en la Figura 10). Se aplicaron diferentes regímenes de estimulación, denotados en los diferentes grupos de muestras, y se midió la expresión de ARNm por micromatriz a las 0, 1, 2, 3, 6, 12, 24, 48 horas, denotado por las muestras consecutivas en los grupos.
Figura 21 muestra una puntuación de la actividad de la vía de Wnt predicha calculada mediante el uso de un modelo (pseudo-)lineal mediante el uso de los genes diana de la lista curada de evidencia comparada (Tabla 1) con los genes diana de la lista de literatura amplia (Tabla 11) y los pesos calculados mediante el uso del procedimiento "negro y peso" como se describe en la presente memoria en un conjunto de datos de muestras de colon (GSE20916).
Figura 22 muestra una puntuación de la actividad de la vía de Wnt predicha calculada mediante el uso de un modelo (pseudo-)lineal mediante el uso de los genes diana de la lista curada de evidencia comparada (Tabla 1) con los genes diana de la lista de literatura amplia (Tabla 11) y los pesos calculados mediante el uso del procedimiento "negro y peso" como se describe en la presente memoria en un conjunto de datos de muestras de colon (GSE4183).
Figura 23 muestra una puntuación de la actividad de la vía de Wnt predicha calculada mediante el uso de un modelo (pseudo-)lineal mediante el uso de los genes diana de la lista curada de evidencia comparada (Tabla 1) con los genes diana de la lista de literatura amplia (Tabla 11) y los pesos calculados mediante el uso del procedimiento "negro y peso" como se describe en la presente memoria en un conjunto de datos de muestras de colon (GSE15960).
Figura 24 muestra una puntuación de la actividad de la vía de Wnt predicha calculada mediante el uso de un modelo (pseudo-)lineal mediante el uso de los genes diana de la lista curada de evidencia comparada (Tabla 1) con los genes diana de la lista de literatura amplia (Tabla 11) y los pesos calculados mediante el uso del procedimiento "negro y peso" como se describe en la presente memoria en un conjunto de datos de muestras de cáncer de mama (GSE12777).
Figura 25 muestra una puntuación de la actividad de la vía de Wnt predicha calculada mediante el uso de un modelo (pseudo-)lineal mediante el uso de los genes diana de la lista curada de evidencia comparada (Tabla 1) con los genes diana de la lista de literatura amplia (Tabla 11) y los pesos calculados mediante el uso del procedimiento "negro y peso" como se describe en la presente memoria en un conjunto de datos de muestras de meduloblastoma (GSE10327).
Los siguientes ejemplos simplemente ilustran procedimientos particularmente preferidos y aspectos seleccionados en relación con ellos. La enseñanza proporcionada en el mismo puede usarse para construir varias pruebas y/o kits, por ejemplo, para detectar, predecir y/o diagnosticar la actividad anormal de una o más vías de señalización celular. Además, al usar métodos como los descritos en la presente memoria, la prescripción de fármacos puede guiarse ventajosamente, puede realizarse la predicción del fármaco y el monitoreo de la eficacia del fármaco (y/o los efectos adversos), puede predecirse y monitorearse la resistencia al fármaco, por ejemplo, para seleccionar pruebas posteriores para realizarse (como una prueba de diagnóstico complementaria). Los siguientes ejemplos no pretenden limitar el alcance de la presente invención.
Ejemplo 1: Construcción de modelos matemáticos
Como divulgado en la presente memoria, mediante la construcción de un modelo matemático (por ejemplo, el modelo ilustrativo de "dos capas" que se muestra en la Figura 3) que incorpora las relaciones entre los niveles de expresión de uno o más genes diana de una vía de señalización celular y el nivel de un elemento factor de transcripción (TF), el elemento TF controla la transcripción de uno o más genes diana de la vía de señalización celular, el modelo se basa al menos en parte en una o más combinaciones lineales de niveles de expresión del o más genes diana, tal modelo puede usarse para determinar la actividad de la vía de señalización celular de una manera que sea fácil de comprender e interpretar.
Los niveles de expresión de los genes diana son preferentemente mediciones del nivel de ARNm, que pueden ser el resultado de, por ejemplo, (RT)-PCR y técnicas de micromatriz que usan sondas asociadas con las secuencias de ARNm de los genes diana y de secuenciación de ARN. En otra realización, los niveles de expresión de los genes diana pueden medirse mediante niveles de proteínas, por ejemplo, las concentraciones de las proteínas codificadas por los genes diana.
Los niveles de expresión mencionados anteriormente pueden convertirse opcionalmente de muchas formas que podrían adaptarse mejor o no a la aplicación. Aquí, hemos usado cuatro transformaciones diferentes de los niveles de expresión, en este caso niveles de ARNm basados en micromatriz:
- "datos continuos", es decir, niveles de expresión obtenidos después del procesamiento previo de micromatrices mediante el uso de algoritmos bien conocidos como MAS5.0 y fRMA,
- "puntuación-z", es decir, niveles de expresión continuos escalados de manera que el promedio de todas las muestras sea 0 y la desviación estándar sea 1,
- "discreta", es decir, cada expresión por encima de un cierto umbral se establece en 1 y por debajo de él en 0 (por ejemplo, el umbral para un conjunto de sondas puede elegirse como la mediana de su valor en un conjunto de un número de muestras clínicas positivas y el mismo número muestras clínicas negativas),
- "difuso", es decir, niveles de expresión continuos se convierten a valores entre 0 y 1 mediante el uso de una función sigmoidea del siguiente formato: 1 / (1 exp ((thr - expr) /se)), con expr siendo los niveles de expresión continuos, thr siendo el umbral como se mencionó anteriormente y se siendo un parámetro de suavizado que influye en la diferencia entre 0 y 1.
La Figura 1 muestra un modelo matemático ilustrativo que representa (parte de) una vía de señalización celular. La vía de señalización celular está simbolizada por un elemento de factor de transcripción (TF) y los genes diana producidos como resultado de la presencia del elemento de transcripción en el núcleo celular. Los pesos que conectan los nodos de la expresión de los genes diana y el nodo TF, representados aquí por w1, w2 y w3, indican la fuerza de correlación entre el factor de transcripción presente y la expresión del gen diana en base a, por ejemplo, los datos de entrenamiento o conocimiento del experto.
Uno de los modelos más simples que pueden construirse se muestra en la Figura 2. Aquí, los nodos de expresión del gen diana del elemento factor de transcripción se reemplazan por mediciones directas de los niveles de intensidad de expresión de los genes diana, en este caso por un conjunto de sondas que está particularmente altamente correlacionado con el gen diana particular, por ejemplo, en experimentos de micromatriz o (q)PCR. Los pesos se basan en cálculos de un conjunto de datos de entrenamiento o en base a los conocimientos de los expertos. Este enfoque de uso, en el caso donde posiblemente se midan múltiples niveles de expresión por gen diana (por ejemplo, en el caso de experimentos de micromatriz, donde un gen diana puede medirse con múltiples conjuntos de sondas), solo se prefiere un nivel de expresión por gen diana porque es particularmente simple. Una forma preferida de seleccionar el nivel de expresión que se usa para un gen diana particular es usar el nivel de expresión del conjunto de sondas que es capaz de separar mejor las muestras activas y pasivas de un conjunto de datos de entrenamiento. Un procedimiento para determinar este conjunto de sondas es realizar una prueba estadística, por ejemplo, la prueba t, y seleccionar el conjunto de sondas con el valor p más bajo. Los niveles de expresión del conjunto de datos de entrenamiento de la sonda con el valor p más bajo son, por definición, la sonda con la menor probabilidad de que los niveles de expresión de las muestras activas y pasivas (conocidas) se superpongan. Otro procedimiento de selección se basa en las razones de probabilidades (véase también la sección 4 más abajo). En tal modelo, se proporcionan uno o más niveles de expresión para cada uno de los uno o más genes diana y la combinación o combinaciones lineales comprenden una combinación lineal que incluye para cada uno de los genes dianas un término ponderado, cada término ponderado se basa en un solo nivel de expresión del uno o más niveles de expresión proporcionados para el gen diana respectivo. Si se elige el único nivel de expresión por gen diana como se describe anteriormente, el modelo se denomina modelo de "conjuntos de sondas más discriminantes" a continuación.
Como alternativa al modelo de "conjuntos de sondas más discriminantes", es posible, en el caso donde posiblemente se midan múltiples niveles de expresión por gen diana, hacer uso de todos los niveles de expresión que se proporcionan por gen diana. En tal modelo, se proporcionan uno o más niveles de expresión para cada uno de los uno o más genes diana y la combinación o combinaciones lineales comprenden una combinación lineal de todos los niveles de expresión de uno o más niveles de expresión proporcionados para uno o más genes diana. En otras palabras, para cada uno de los uno o más genes diana, cada uno de los uno o más niveles de expresión proporcionados para el gen diana respectivo puede ponderarse en la combinación lineal por su propio peso (individual). Esta variante se denomina modelo de "todos los conjuntos de sondas" a continuación. Tiene la ventaja de ser relativamente simple y al mismo tiempo hacer uso de todos los niveles de expresión proporcionados.
Ambos modelos descritos anteriormente tienen en común que son lo que pueden considerarse modelos de "una sola capa", en los que el nivel del elemento TF se calcula en base a una combinación lineal de los niveles de expresión.
Una vez que se ha determinado el nivel del elemento TF mediante la evaluación del modelo respectivo, el nivel del elemento TF determinado puede establecerse como umbral para inferir la actividad de la vía de señalización celular. Un procedimiento para calcular un umbral tan apropiado es mediante la comparación del nivel de elemento TF wlc determinado de las muestras de entrenamiento que se sabe que tienen una vía pasiva y de las muestras de entrenamiento con una vía activa. Un procedimiento que lo hace y también tiene en cuenta la varianza en estos grupos se da mediante el uso de un umbral
Figure imgf000010_0001
donde a y p son la desviación estándar y la media de las muestras de entrenamiento. En caso de que solo se disponga de una pequeña cantidad de muestras en las muestras de entrenamiento activo y/o pasivo, puede agregarse una pseudocuenta a las varianzas calculadas en base al promedio de las varianzas de los dos grupos:
Figure imgf000011_0001
donde v es la varianza de los grupos y x una pseudocuenta positiva. A continuación, puede obtenerse la desviación estándar a tomando la raíz cuadrada de la varianza v.
El umbral puede restarse del nivel determinado del elemento TF wlc para facilitar la interpretación, lo que da como resultado la puntuación de actividad de la vía, de manera que los valores negativos corresponden a vías pasivas y los valores positivos a vías activas.
La Figura 3 muestra, como alternativa a los modelos de "una sola capa" descritos, un modelo ilustrativo de "dos capas" que representa la determinación experimental de la señalización activa de una vía con más detalle. Para cada gen diana, se calcula un nivel sumario mediante el uso de una combinación lineal en base a las intensidades medidas de sus conjuntos de sondas asociados ("primera capa (inferior)"). El valor sumario calculado se combina posteriormente con los valores sumario de los otros genes diana de la vía mediante el uso de una combinación lineal adicional ("segunda capa (superior)"). Los pesos pueden aprenderse de un conjunto de datos de entrenamiento o en base al conocimiento de expertos o una combinación de los mismos. Expresado de otra manera, en el modelo de "dos capas", se proporcionan uno o más niveles de expresión para cada uno de los genes diana y la combinación o combinaciones lineales comprenden para cada uno de los o más genes diana una primera combinación lineal de todos los niveles de expresión del uno o más niveles de expresión proporcionados para el gen diana respectivo ("primera capa (inferior)"). El modelo se basa, además, al menos en parte, en una combinación lineal adicional que incluye para cada uno o más genes diana un término ponderado, cada término ponderado se basa en la primera combinación lineal para el gen diana respectivo ("segunda (capa superior").
El cálculo de los valores sumario puede, en una versión preferida del modelo de "dos capas", incluir la definición de un umbral para cada gen diana mediante el uso de los datos de entrenamiento y restando el umbral de la combinación lineal calculada, obteniendo el resumen del gen. Aquí, el umbral puede elegirse de manera que un nivel sumario de genes negativo se corresponda con un gen diana regulado negativamente y que un nivel de resumen de genes positivo se corresponda con un gen diana regulado positivamente. Además, es posible que los valores sumario de genes se transformen mediante el uso, por ejemplo, una de las transformaciones mencionadas anteriormente (difusa, discreta, etc.) antes de que se combinen en la "segunda capa (superior)".
Una vez que se ha determinado el nivel del elemento TF mediante la evaluación del modelo de "dos capas", el nivel del elemento TF determinado puede establecerse como umbral para inferir la actividad de la vía de señalización celular, como se describe anteriormente.
A continuación, los modelos descritos anteriormente se denominan colectivamente como "modelos (pseudo-)lineales".
Ejemplo 2: Selección de genes diana
Un factor de transcripción (TF) es un complejo de proteínas (es decir, una combinación de proteínas unidas en una estructura específica) o una proteína que es capaz de regular la transcripción de genes diana al unirse a secuencias de ADN específicas, controlando así la transcripción de la información genética del ADN al ARNm. El ARNm producido directamente debido a esta acción del complejo de transcripción se denomina en la presente memoria "gen diana directo". La activación de la vía también puede dar como resultado una transcripción de genes más secundarios, denominados "genes diana indirectos". A continuación, se prefieren modelos (pseudo-)lineales que comprenden o que consisten en genes diana directos, como enlaces directos entre la actividad de la vía y el nivel de ARNm, sin embargo, la distinción entre genes diana directos e indirectos no siempre es evidente. Aquí se presenta un procedimiento para seleccionar genes diana directos mediante el uso de una función de puntuación en base a los datos de la literatura disponible. No obstante, no se puede descartar la selección accidental de los genes diana indirectos debido a información limitada y variaciones biológicas e incertidumbres.
El ARNm de los genes diana de las vías específicas se seleccionaron de la literatura científica, mediante el uso de un sistema de clasificación en el que la evidencia científica para un gen diana específico recibió una calificación, en función del tipo de experimentos científicos en los que se acumuló la evidencia. Si bien algunas evidencias experimentales sugieren simplemente que un gen es un gen diana, como por ejemplo un ARNm que aumenta en una micromatriz de un embrión en el que se sabe que la vía de HH está activa, otras pruebas pueden ser muy sólidas, como la combinación de un sitio de unión del factor de transcripción de la vía identificada y la recuperación de este sitio en un ensayo de inmunoprecipitación de cromatina (ChIP) después de la estimulación de la vía específica en la célula y el aumento de ARNm después de la estimulación específica de la vía en una línea celular. En la literatura científica pueden identificarse varios tipos de experimentos para encontrar los genes diana de las vías específicas, tales como (pero que no se limita a):
1. Experimentos ChIP en los que se muestra la unión directa de un factor de transcripción de la vía a su sitio de unión en el genoma. Ejemplo: Mediante el uso de la tecnología de inmunoprecipitación de cromatina (ChIP), se identificaron posteriormente los sitios de unión del factor de transcripción TCF4 funcional putativo en el ADN de las líneas celulares de colon con y sin la vía de Wnt activa, como un subconjunto de los sitios de unión reconocidos puramente en base a la secuencia de nucleótidos. La funcionalidad putativa se identificó como evidencia derivada de ChIP de que se encontró que el factor de transcripción se unía al sitio de unión del ADN.
2. Ensayos de Desplazamiento de Movilidad Electroforética (EMSA) que muestran la unión in vitro de un factor de transcripción a un fragmento de ADN que contiene la secuencia de unión. En comparación con la evidencia basada en ChIP, la evidencia basada en EMSA es menos fuerte, ya que no puede traducirse a la situación in vivo.
3. Estimulación de la vía y la medición de perfiles de ARNm en una micromatriz o mediante el uso de la secuenciación de ARN, mediante el uso de las líneas celulares inducibles por la vía y la medición de los perfiles de ARNm medidos en varios puntos de tiempo después de la inducción - en presencia de cicloheximida, que inhibe la traducción a proteína, por lo que los ARNm inducidos son se supone que genes diana directos.
4. Similar a 3, pero mediante el uso de PCR cuantitativa para medir las cantidades de ARNm.
5. Identificación de sitios de unión de factores de transcripción en el genoma mediante un enfoque bioinformático. Ejemplo de la vía de Wnt: Mediante el uso de la conocida secuencia de unión al ADN del factor de transcripción TCF4-beta catenina, se ejecutó un programa de software en la secuencia del genoma humano y se identificaron los sitios de unión potenciales, tanto en las regiones promotoras de genes como en otras regiones genómicas.
6. Similar a 3, solo en la ausencia de cicloheximida.
7. Similar a 4, solo en la ausencia de cicloheximida.
8. Perfiles de expresión de ARNm de muestras de tejido o células específicas de las que se sabe que la vía está activa, sin embargo, en ausencia de la condición de control negativo adecuada.
En la forma más simple, puede darse a cada ARNm diana potencial 1 punto para cada uno de estos enfoques experimentales en los que se identificó el ARNm diana.
Alternativamente, los puntos se pueden otorgar de forma incremental; es decir, una tecnología 1 punto, la segunda tecnología agrega un segundo punto, y así sucesivamente. Mediante el uso de esta estrategia de clasificación relativa, puede hacerse una lista de los genes diana más confiables.
Alternativamente, la clasificación de otra manera puede usarse para identificar los genes diana que tienen más probabilidades de ser genes diana directos, dando un mayor número de puntos a la tecnología que proporciona la mayor evidencia de un gen diana directo in vivo, en la lista anterior esto significaría 8 puntos para el enfoque experimental 1), 7 para el 2), y bajar a un punto para el enfoque experimental 8. Tal lista puede denominarse "lista general de genes diana".
A pesar de las variaciones e incertidumbres biológicas, los inventores asumieron que los genes diana directos son los que tienen más probabilidades de inducirse de forma independiente del tejido. Una lista de estos genes diana puede denominarse "lista de genes diana curada por evidencia". Estas listas de objetivos seleccionadas se han usado para construir modelos computacionales que pueden aplicarse a muestras procedentes de diferentes fuentes de tejidos y/o células.
La "lista de genes diana general" probablemente contiene genes que son más específicos de tejido, y puede usarse potencialmente para optimizar y aumentar la sensibilidad y la especificidad del modelo para su aplicación en muestras de un tejido específico, como muestras de cáncer de mama.
A continuación, se ilustrará a modo de ejemplo cómo se construyó la selección de una lista de genes diana curada por evidencia específicamente para la vía de ER.
Con el fin de seleccionar los genes diana ER usados como entrada para los modelos (pseudo-)lineales descritos en la presente memoria, se usaron los siguientes tres criterios:
1. La región promotora/potenciadora de genes contiene un motivo de elemento de respuesta de estrógeno (ERE):
a. Debe demostrarse que el motivo ERE responde a los estrógenos, por ejemplo, mediante un ensayo de transfección transitoria en el que el motivo ERE específico está ligado a un gen indicador, y
b. La presencia del motivo ERE debe confirmarse mediante, por ejemplo, un análisis de motivo enriquecido de la región promotora/potenciadora del gen.
2. ER (diferencialmente) se une in vivo a la región promotora/potenciadora del gen en cuestión, demostrado por, por ejemplo, un experimento de ChIP/CHIP o un ensayo de inmunoprecipitación de cromatina:
a. Se ha demostrado que ER se une a la región promotora/potenciadora del gen cuando la vía de ER está activa, y
b. (preferentemente) no se une (o se une débilmente) a la región promotora/potenciadora del gen si la vía de ER no está activa.
3. El gen se transcribe diferencialmente cuando la vía de ER está activa, lo que se demuestra por, por ejemplo, a. multiplicar el enriquecimiento del ARNm del gen en cuestión a través de PCR en tiempo real, o experimento de micromatriz, o
b. la demostración de que la ARN Pol II se une a la región promotora del gen mediante un ensayo de inmunoprecipitación.
La selección se realizó mediante la definición como genes diana ER de los genes para los cuales se reunió evidencia experimental suficiente y bien documentada que probaba que se cumplían los tres criterios mencionados anteriormente. Un experimento adecuado para recopilar evidencia de unión diferencial de ER es comparar los resultados de, por ejemplo, un experimento de ChIP/CHIP en una línea celular de cáncer que responde al estrógeno (por ejemplo, la línea celular m CF-7), cuando se expone o no se expone a estrógeno. Lo mismo se aplica a la recopilación de pruebas de transcripción de ARNm.
Lo anterior discute el enfoque genérico y un ejemplo más específico del procedimiento de selección de genes diana que se ha empleado para seleccionar varios genes diana con base a la evidencia encontrada mediante el uso del enfoque mencionado anteriormente. Las listas de los genes diana usados en los modelos (pseudo-)lineales para vías ilustrativas, a saber, las vías Wnt, ER, HH y AR se muestran en la Tabla 1, Tabla 2, Tabla 3 y Tabla 4, respectivamente.
Los genes diana de la vía de ER usados para los modelos (pseudo-)lineales de la vía de ER descritos en la presente memoria (mostrados en la Tabla 2) contienen una selección de genes diana en base a su puntuación de evidencia bibliográfica; solo los genes diana con las puntuaciones de evidencia más altas (genes diana preferidos de acuerdo con la invención) se agregaron a esta lista corta. La lista completa de los genes diana de ER, incluidos también aquellos genes con una puntuación de evidencia más baja, se muestra en la Tabla 5.
Se realizó una subselección o clasificación adicional de los genes diana de las vías Wnt, ER, HH y AR que se muestran en la Tabla 1, Tabla 2, Tabla 3 y Tabla 4 en base a una combinación de la puntuación de evidencia de la literatura y las razones de probabilidad calculadas mediante el uso de los conjuntos de datos de entrenamiento que vinculan los nodos del conjunto de sondas con los correspondientes nodos del gen objetivo. Las razones de probabilidades se calculan mediante el uso de un valor de corte, por ejemplo, la mediana de todas las muestras de entrenamiento si se usa el mismo número de muestras de entrenamiento activo y pasivo; cada valor por encima del límite se declara alto y por debajo del límite se declara bajo. Esto se hace para las muestras de entrenamiento donde se sabe que la vía es activa o pasiva. Posteriormente, la razón de probabilidades para un gen o conjunto de sondas diana específico puede calcularse de la siguiente manera:
inactivo, bajo) = n(acüvoP bajo) l (nfaetivo, bajo) - reactivo. alto))
flQjasivo. bajo) = nfpasivo, bajo) f (m(pasÍYO, bajo) - ufpasivo, alto))
Relación de probabilidad = flfpaiivo.. bajo) / (1 - flfpasivo, bajo))
*(1- flfactivo. bajo)) / f(activo, bajo)
Con n (activo, bajo) el número de muestras de entrenamiento que se sabe que tienen una vía activa que se encontró que tenían un nivel de expresión por debajo del límite, n(pasivo, bajo) el número de muestras de entrenamiento que se sabe que tienen una vía pasiva que se encontró que tenían un nivel de expresión por debajo del límite, y así sucesivamente. f(activo, bajo) y f(pasivo, bajo) la fracción de muestras que se sabe que tienen una vía activa o pasiva, respectivamente, y que se encuentra que tienen un nivel de expresión por debajo del límite.
Alternativamente, para evitar razones de probabilidades indefinidas (división por cero), puede agregarse, por ejemplo, una pseudocuenta al cálculo de la fracción, por ejemplo:
^activo, bajo);.!™ ^ = (n[aclivo, bajo) — 1)
(4)
/ (nfactivo. bajo) - n(activo, alto) — 2)
fí pasivo, bajojpMMo = (n(pasÍYO. bajo) — 1)
/ ^(pasivo, bajo) - n(pasivo. alto) 2)
Alternativamente, también puede reemplazarse el número absoluto de muestras que exhiben una actividad probatoria asumiendo cierta incertidumbre (ruido) en la configuración de medición y calcular para cada muestra de entrenamiento una probabilidad de ser "baja" o "alta" asumiendo, por ejemplo, una distribución normal (llamada "evidencia suave"). Posteriormente, los cálculos de fracciones pueden calcularse siguiendo los cálculos antes mencionados.
inactivo, bajo)iua-g = (£p(activo, bajo) - 1)
/ (Lp(activo. bajo) £p(activo. alto) - 2)
flfpasivo. bajojuu-g = (Zp(pasivo. bajo) - 1)
/{Lp(pasivo,bajo) Zp(pasivo, alto) - 2)
Con p(activo, bajo) y p(pasivo, bajo), la probabilidad de que la observación esté por debajo del límite de cada muestra, asumiendo una distribución estándar con la media igual al nivel de expresión medido de la muestra de entrenamiento respectiva y una desviación estándar igual a una estimación de la incertidumbre asociada con la medición del nivel de expresión, por ejemplo, 0,25 en una escala log2. Estas probabilidades se suman en todas las muestras de entrenamiento y, a continuación, se agrega la pseudocuenta.
La razón de posibilidades es una evaluación de la importancia del gen objetivo para inferir la actividad de las vías. En general, se espera que el nivel de expresión de un gen diana con una razón de probabilidades más alta probablemente sea más informativo en cuanto a la actividad general de la vía en comparación con los genes diana con razones de probabilidades más bajas. Sin embargo, debido a la complejidad de las vías de señalización celular, debe entenderse que pueden existir interrelaciones más complejas entre los genes diana y la actividad de la vía; por ejemplo, considerar los niveles de expresión de varias combinaciones de genes diana con tasas de probabilidad bajas puede ser más probatorio que considerar genes diana con mayores razones de probabilidad de forma aislada. En los modelos de Wnt, ER, HH y AR presentados en la presente memoria, se ha encontrado que los genes diana que se muestran en la Tabla 6, Tabla 7, Tabla 8 y Tabla 9 son de naturaleza probatoria más alta para predecir las actividades de las vías Wnt, ER, HH y AR en comparación con los genes diana de clasificación inferior (por lo tanto, los genes diana mostrados en las Tablas 6 a 9 son particularmente preferidos de acuerdo con la presente invención). No obstante, dada la relativa facilidad con la que la tecnología de adquisición, tal como las micromatrices, puede adquirir niveles de expresión para grandes conjuntos de genes, se contempla utilizar algunos o todos los genes diana de la Tabla 6, Tabla 7, Tabla 8 y Tabla 9, y para opcionalmente, usar adicionalmente uno, dos, algunos o todos los genes diana adicionales de los rangos mostrados en la Tabla 1, Tabla 2, Tabla 3 y Tabla 4, en los modelos (pseudo-)lineales como se muestra en las Figuras 1 a 3.
Tabla 1. Lista de evidencia curada de los genes diana de la vía de Wnt usada en los modelos (pseudo-)lineales y los conjuntos de sondas asociadas usadas para medir los niveles de expresión de ARNm de los genes diana (# = número de secuencia en la lista de secuencia que acompaña).
Gen diana Conjunto de sondas
Figure imgf000015_0001
Gen diana Conjunto de sondas
Figure imgf000015_0002
#
Figure imgf000015_0003
Figure imgf000016_0002
Tabla 2. Lista de evidencia curada de los genes diana de la vía de ER usada en los modelos (pseudo-) lineales y los conjuntos de sondas asociadas usadas para medir los niveles de expresión de ARNm de los genes diana (# = número de secuencia en la lista de secuencia que acompaña).
Figure imgf000016_0001
Figure imgf000017_0001
Tabla 3. Lista de evidencia curada de los genes diana de la vía de HH usada en los modelos (pseudo-) lineales y los conjuntos de sondas asociadas usadas para medir los niveles de expresión de ARNm de los genes diana (# = número de secuencia en la lista de secuencia que acompaña).
Figure imgf000017_0002
Figure imgf000018_0001
Tabla 4. Lista de evidencia curada de los genes diana de la vía AR usada en los modelos (pseudo-)lineales y los conjuntos de sondas asociadas usadas para medir los niveles de expresión de ARNm de los genes diana (# = número de secuencia en la lista de secuencia que acompaña).
Figure imgf000019_0001
Figure imgf000019_0002
Tabla 5. Símbolos de los genes de los genes diana de ER que se encuentra que tienen evidencia significativa en la bibliografía (= lista larga de los genes diana de ER) (# = número de secuencia en la lista de secuencia que acompaña).
Figure imgf000020_0001
Tabla 6. Lista corta de los genes diana de Wnt en base a la puntuación y la relación de probabilidad de la evidencia en la bibliografía (# = número de secuencia en la lista de secuencia que acompaña).
Figure imgf000021_0002
Figure imgf000021_0001
Tabla 7. Lista corta de los genes diana de ER en base a la puntuación y la relación de probabilidad de la evidencia en la bibliografía (# = número de secuencia en la lista de secuencia que acompaña).
Figure imgf000021_0003
Tabla 8. Lista corta de los genes diana de HH en base a la puntuación y la relación de probabilidad de la evidencia en la bibliografía (# = número de secuencia en la lista de secuencia que acompaña).
Figure imgf000022_0001
Figure imgf000022_0002
Tabla 9. Lista corta de los genes diana de AR en base a la puntuación y la relación de probabilidad de la evidencia en la bibliografía (# = número de secuencia en la lista de secuencia que acompaña).
Figure imgf000023_0001
Ejemplo 3: Comparación de la lista curada de pruebas y la lista amplia de literatura
La lista de genes diana de Wnt construida en base a la evidencia de la literatura siguiendo el procedimiento descrito en la presente memoria (Tabla 1) se compara con otra lista de genes diana que no siguen el procedimiento mencionado anteriormente. La lista alternativa es una compilación de genes indicados por una variedad de datos de varios enfoques experimentales para ser un gen diana Wnt publicado en tres fuentes públicas por laboratorios de renombre, conocidos por su experiencia en el área de biología molecular y la vía de Wnt. La lista alternativa es una combinación de los genes mencionados en la Tabla S3 de Hatzis y otros (Hatzis P, 2008), el texto y la Tabla S1A de Sousa e Melo (de Sousa E Melo F, 2011) y la lista de genes diana recopilados y mantenidos por Roel Nusse, pionero en el campo de la señalización Wnt (Nusse, 2012). La combinación de estas tres fuentes dio como resultado una lista de 124 genes (= lista de literatura amplia, véase la Tabla 10). Aquí, se discute la cuestión de si el rendimiento en la predicción de la actividad de Wnt en muestras clínicas mediante el algoritmo derivado de esta lista alternativa está funcionando de manera similar o mejor en comparación con el modelo construido sobre la base de la lista existente de genes (= lista curada por evidencia, Tabla 1).
Tabla 10. Lista alternativa de los genes diana de Wnt (= lista amplia de la bibliografía) (# = número de secuencia en la lista de secuencia que acompaña).
Figure imgf000024_0001
Figure imgf000025_0001
La siguiente etapa consistió en encontrar los conjuntos de sondas de la matriz Affymetrix® GeneChip Human Genome U133 Plus 2.0 que se corresponde con los genes. Este procedimiento se realizó mediante el uso del complemento Bioconductor en R y la curación manual para la relevancia de los conjuntos de sondas en base al navegador del genoma UCSC, similar a los modelos (pseudo-)lineales descritos en la presente memoria, eliminando así, por ejemplo, los conjuntos de sondas en cadenas opuestas o regiones de exón de genes externos. Para dos de los 124 genes, no hay conjuntos de sondas disponibles en esta micromatriz-chip y, por lo tanto, no se pudieron insertar en el modelo (pseudo-)lineal, estos son LOC283859 y WNT3A. En total, se encontró que 287 conjuntos de sondas corresponden a los 122 genes restantes (Tabla 11).
Tabla 11. Conjunto de sondas asociadas con los genes diana de Wnt en la lista amplia de genes de la bibliografía) (# = número de secuencia en la lista de secuencia que acompaña).
Figure imgf000026_0001
Figure imgf000027_0001
Figure imgf000028_0001
Posteriormente, el modelo (pseudo-)lineal se construyó de manera similar a la Figura 2 mediante el uso del procedimiento "blanco y negro" para calcular los parámetros de peso como se explica en la presente memoria. De manera similar a la descripción del modelo Wnt (pseudo-)lineal en base a la lista curada de evidencia, los pesos asociados con los bordes entre conjuntos de sondas y sus genes respectivos, tanto la lista curada de evidencia como la lista de literatura amplia, se entrenaron mediante el uso de los datos de fRMA procesados de forma continua de 32 muestras de colon normales y 32 muestras de adenoma del conjunto de datos GSE8671 del Gene Expression Omnibus (accesible en http://www.ncbi.nlm.nih.gov/geo/, consultado por última vez el 13 de julio de 2011).
Los modelos entrenados (pseudo-)lineales se probaron luego en varios conjuntos de datos para inferir la puntuación de actividad de la vía de Wnt. La vía de Wnt se designa para estar "activada", es decir, activa, cuando el nivel de actividad es positivo. En las Figuras 21-25 se muestran los resultados resumidos del modelo de literatura amplia entrenado y el modelo curado por evidencia.
Evidentemente, se podría deducir que el modelo de literatura amplia generalmente predice puntuaciones de actividad más extremas para que la señalización de Wnt esté activada o desactivada. Además, el modelo alternativo predice los resultados similares para los conjuntos de datos de cáncer de colon (GSE20916, GSE4183, GSE15960), pero más muestras de las esperadas con señalización Wnt activa predicha en cáncer de mama (GSE12777) y los conjuntos de datos de muestras de meduloblastoma (GSE10327).
En conclusión, la amplia lista de genes diana de la literatura da como resultado predicciones aproximadamente igualmente buenas de la actividad de Wnt en el cáncer de colon, por un lado, pero peores predicciones (más falsos positivos) en otros tipos de cáncer por el otro. Esto podría deberse a que la lista alternativa de genes diana está demasiado sesgada hacia las células del colon específicamente, por lo que es demasiado específica de tejido; tanto de Sousa E Melo y otros y Hatzis y otros el interés principal fue el cáncer colorrectal, aunque pueden incluirse los genes diana Wnt no específicos de colon. Además, los genes diana Wnt no específicos posiblemente incluidos en estas listas pueden ser una fuente de predicciones empeoradas de la actividad de Wnt en otros tipos de cáncer. Es probable que la lista alternativa contenga más genes diana regulados indirectamente, lo que probablemente la haga más específica de tejido. La lista original está sintonizada para contener genes diana directos, que es más probable que representen genes que son sensibles a Wnt en todos los tejidos, reduciendo así la especificidad del tejido.
Ejemplo 4: Entrenamiento y uso del modelo matemático
Antes que los modelos (pseudo-)lineales como se describen a modo de ejemplo en la presente memoria puedan usarse para inferir la actividad de la vía en una muestra de prueba, los pesos que indican el signo y la magnitud de la correlación entre los nodos y un umbral para llamar si un nodo está "ausente" o presente" necesitan ser determinados. Puede usarse el conocimiento experto para completar los pesos y el umbral a priori, pero típicamente los modelos se entrenan mediante el uso de un conjunto representativo de muestras de entrenamiento, de las cuales preferentemente se conoce la verdad básica. Por ejemplo, los datos de expresión de los conjuntos de sondas en muestras con un complejo de factor de transcripción presente conocido (= vía activa) o complejo de factor de transcripción ausente (= vía pasiva). Sin embargo, no es práctico obtener muestras de entrenamiento de muchos tipos diferentes de cánceres, de los cuales se sabe cuál es el estado de activación de la vía a modelar. Como resultado, los conjuntos de entrenamiento disponibles consisten en un número limitado de muestras, generalmente de un solo tipo de cáncer. En la presente memoria se describe un procedimiento para determinar los parámetros necesarios para clasificar las muestras de prueba como que tienen una vía activa o pasiva.
Se conocen en el campo una multitud de algoritmos de entrenamiento (por ejemplo, regresión) que tienen en cuenta la topología del modelo y cambian los parámetros del modelo, aquí el peso y el umbral, de modo que la salida del modelo, aquí la puntuación lineal ponderada, se optimiza. En la presente memoria demostramos dos procedimientos ilustrativos que pueden usarse para calcular los pesos directamente de los niveles de expresión sin la necesidad de un algoritmo de optimización.
Preferentemente, el entrenamiento de los modelos (pseudo-)lineales de las vías Wnt, ER, HH y AR se realiza mediante el uso de los datos públicos disponibles en el Gene Expression Omnibus (accesible en http://www.ncbi.nlm.nih.gov/geo/, cf. arriba).
El primer procedimiento, definido aquí como procedimiento "blanco y negro", se reduce a un sistema ternario en el que los factores de ponderación son un elemento de {-1, 0, 1}. Si pusiéramos esto en el contexto biológico, -1 y 1 corresponden a genes o sondas que están reguladas positiva o negativamente en caso de actividad de la vía, respectivamente. En caso de que no pueda probarse estadísticamente que una sonda o un gen esté regulado positiva o negativamente, recibe un peso de 0. Aquí hemos usado una prueba t de dos muestras del lado izquierdo y del lado derecho de los niveles de expresión de las muestras de la vía activa frente a los niveles de expresión de las muestras con una vía pasiva para determinar si una sonda o gen está regulado positiva o negativamente dados los datos de entrenamiento usados. En los casos en los que el promedio de las muestras activas es estadísticamente mayor que las muestras pasivas, es decir, el valor p está por debajo de un cierto umbral, por ejemplo, 0,3, entonces se determina que el conjunto de sondas o el gen diana está regulado positivamente. A la inversa, en los casos en los que el promedio de las muestras activas es estadísticamente más bajo que las muestras pasivas, se determina que este conjunto de sondas o gen diana está regulado negativamente tras la activación de la vía. En caso de que el valor p más bajo (del lado izquierdo o derecho) supere el umbral mencionado anteriormente, definimos el peso de esta sonda o gen en 0.
En otra realización preferida, se usa un procedimiento alternativo para llegar a pesos y umbrales. Este procedimiento alternativo se basa en el logaritmo (por ejemplo, base e) de la razón de probabilidades y, por lo tanto, se denomina pesos de "probabilidades logarítmicas". La razón de probabilidades para cada sonda o gen se calcula en base al número de muestras de entrenamiento positivas y negativas para las que el nivel de sonda/gen está por encima y por debajo de un umbral correspondiente, por ejemplo, la mediana de todas las muestras de entrenamiento (ecuación 3). Puede agregarse una pseudocuenta para evitar divisiones por cero (ecuación 4). Un perfeccionamiento adicional es contar las muestras por encima/por debajo del umbral de una manera algo más probabilística, asumiendo que los niveles de sonda/gen están, por ejemplo, distribuidos normalmente alrededor de su valor observado con una cierta desviación estándar especificada (por ejemplo, 0,25 en una escala 2-log) y contando la masa de probabilidad por encima y por debajo del umbral (ecuación 5).
Alternativamente, pueden emplearse algoritmos de optimización conocidos en el campo, tales como regresión, para determinar los pesos y umbrales de los modelos (pseudo-)lineales descritos en la presente memoria.
Hay que prestar especial atención a la forma en que se determinan los parámetros para que los modelos (pseudo-)lineales se generalicen bien. Alternativamente, pueden usarse otros procedimientos de aprendizaje automático, tales como las redes Bayesianas, que se conocen en el campo para poder generalizar bastante bien tomando medidas especiales durante los procedimientos de entrenamiento.
Preferentemente, el entrenamiento de los modelos (pseudo-)lineales de las vías Wnt, ER, HH y AR se realiza mediante el uso de los datos públicos disponibles en el Gene Expression Omnibus (accesible en http://www.ncbi.nlm.nih.gov/ geo/). Los modelos fueron entrenados ejemplarmente mediante el uso de tales datos públicos.
La Figura 5 muestra la combinación (pseudo-)lineal calculada en el conjunto de datos de entrenamiento GSE8671 mediante el uso de un modelo (pseudo-)lineal como se muestra en la Figura 2 para la vía de Wnt e incluyendo "todos los conjuntos de sondas" como se menciona en la Tabla 1. Los pesos aplicados al modelo (pseudo-)lineal se calcularon mediante el uso del procedimiento "blanco y negro" como se describe en la presente memoria. El grupo de la izquierda representa las muestras en las que se sabe que Wnt es pasivo, mientras que el grupo de la derecha muestra las puntuaciones de actividad calculadas de las muestras de adenomas que se sabe que tienen una vía de Wnt activa.
Con referencia a la Figura 8, el modelo de "dos capas" de la vía de HH mediante el uso de todos los conjuntos de sondas y genes diana mencionados en la Tabla 3 en la primera y segunda capa, respectivamente, se entrenó mediante el uso de los datos de los niveles de expresión continuos de muestras de carcinoma de células basales (primer grupo) que se sabe que expresa actividad HH y células cutáneas normales que se sabe que tienen una vía pasiva HH. El entrenamiento abarcó el cálculo de los pesos de las conexiones entre los niveles de expresión de los genes diana, aquí representados por medio de intensidades del conjunto de sondas, y los nodos de los genes diana mediante el uso del procedimiento de "probabilidades logarítmicas" como se describe en la presente memoria y, posteriormente, la puntuación de actividad del complejo del factor de transcripción se calculó mediante la suma de la puntuación de expresión de genes diana calculada multiplicada por 1 o -1 para genes diana regulados positiva o negativamente, respectivamente.
La Figura 10 muestra los resultados de entrenamiento del modelo simple (pseudo-)lineal de la vía de ER mediante el uso de los niveles de expresión continua medidos en experimentos de estimulación en líneas celulares MCF7. El modelo solo incluyó el "conjunto de sondas más discriminativo" por gen diana, como se muestra en la Tabla 2. El procedimiento de "probabilidades logarítmicas" se usó en combinación con las muestras de la vía de ER activa (tercer grupo desde la izquierda, células MCF7 estimuladas con E2, un potente activador de ER) y muestras de la vía de ER pasiva (cuarto grupo, células MCF7 tratadas con un control) para llegar a los pesos necesarios para calcular la puntuación de actividad de ER trazada en el eje vertical.
Con referencia a la Figura 13, un modelo (pseudo-)lineal como se muestra en la Figura 2 de la vía de AR se entrenó a modo de ejemplo con el procedimiento "blanco y negro" antes mencionado mediante el uso de 3 muestras con actividad AR positiva, líneas celulares LNCaP estimuladas con dihidrotestosterona (DHT), un potente activador de la vía de AR, y 3 líneas celulares LNCaP no estimuladas que representan el caso de la vía inactiva AR. Los datos de expresión de estos experimentos de estimulación están disponibles públicamente en el conjunto de datos GSE7868 que se ha transformado difusamente como se describe en la presente memoria. En este ejemplo particular se han usado "todos los conjuntos de sondas" de los genes diana AR seleccionados mencionados en la Tabla 4. El resultado del entrenamiento se muestra en la Figura 13. El 1er y 2do grupo de muestras de la izquierda se han usado como muestras de entrenamiento negativas y positivas, respectivamente. Como se esperaba, el control dentro del experimento, la estimulación de LNCaP con DHT durante 4 horas, demuestra actividad AR, aunque niveles de actividad más bajos que las células estimuladas durante 16 horas.
Con referencia a la Figura 6 y la Figura 17, los modelos entrenados (pseudo-)lineales de la vía de Wnt y ER se usaron para predecir las actividades de la vía en muestras similares (muestras de colon y línea celular de cáncer de mama MCF7 para la red Bayesiana Wnt y ER, respectivamente) no se usa en el procedimiento de entrenamiento como se describe en la presente memoria (no se disponía de un conjunto de datos apropiado para los modelos HH y AR (pseudo-)lineales). Las actividades de la vía predichas de la gran mayoría de las muestras deben estar en línea con las actividades de la vía clínicamente esperadas para que el modelo sea validado.
La Figura 6 muestra las actividades Wnt calculadas, representadas como la puntuación de actividad calculada en el eje vertical, para las muestras, ilustradas por las barras en el eje horizontal, de las muestras de colon agrupadas por clasificación, indicadas por el color de la barra, en los datos de GSE20916 conjunto. Se predice legítimamente que todas las muestras de colon normal tienen una vía inactiva (puntuación <0), en base a que es una muestra de tejido sano. Se predice que todas menos una muestra, una muestra de carcinoma en el último grupo, que supuestamente tiene una vía activa, tendrán una vía de Wnt activa.
En la Figura 17 se muestran los resultados de la validación del modelo ER (pseudo-)lineal entrenado para dos micromatrices medidas mediante el uso de una muestra de la línea celular de cáncer de mama MCF7, una estimulada con estradiol (E2) y la otra con un control negativo (EtOH), originando del conjunto de datos GSE9253. La diferencia en la puntuación de la actividad de ER es evidente en la Figura 17. Sin embargo, se predijo que la muestra estimulada con E2 tendría una puntuación de actividad ER ligeramente negativa. Este es el resultado del umbral que define un estado activo o pasivo que se estableció demasiado alto para este experimento en particular. La razón de esta discrepancia podría ser que en este experimento se aplicó un régimen de estimulación diferente; en el conjunto de datos de entrenamiento (GSE8597), las muestras se trataron 8 veces más (24 horas en lugar de 3 horas) con una concentración cuatro veces menor de E2 (100 nM frente a 25 nM). Se sabe en la técnica que, en general, la expresión de genes diana es más óptima después de 24 horas de tratamiento con un agente estimulante que después de solo 3 horas, lo que puede explicar la puntuación de actividad ER más baja en la muestra de MCF7 estimulada en este conjunto de datos. El control negativo predice adecuadamente que la vía de ER estará inactiva.
En el Ejemplo 6 más abajo se explican más detalles y ejemplos para usar modelos (pseudo-)lineales entrenados (por ejemplo, de las vías Wnt, ER, AR y HH) para predecir las actividades de las vías respectivas.
El procedimiento de formación mencionado anteriormente puede emplearse en otros modelos (pseudo-)lineales de aplicaciones clínicas. Aquí se muestra y se demuestra que funciona para los modelos (pseudo-)lineales ilustrativos construidos mediante el uso del procedimiento divulgado en la presente memoria que representa las vías de señalización celular, más específicamente las vías Wnt, ER, AR y HH.
Ejemplo 5: Diagnóstico de la actividad (anormal) de la vía
Lo siguiente ilustrará a modo de ejemplo cómo usar, por ejemplo, los modelos (pseudo-)lineales para diagnosticar la actividad de una vía de señalización celular.
El modelo (pseudo-)lineal ilustrativo de Wnt consiste en un nodo que representa el complejo del factor de transcripción, la lectura seleccionada ilustrativa para la actividad de la vía y "todos los conjuntos de sondas" mencionados en la Tabla 1 que alimentan el nodo del complejo del factor de transcripción se entrena como se describe en la presente memoria, se usó para predecir la puntuación de la actividad de la vía de Wnt y su estado, activo o pasivo, en varios conjuntos de datos, no usados anteriormente para el entrenamiento, para inferir qué tan bien funciona el modelo (pseudo-)lineal entrenado. Las puntuaciones de la actividad de la vía predichas y las llamadas de actividad asociadas calculadas para un conjunto de muestras de cáncer de meduloblastoma (GSE10327, véase la Figura 7) se correlacionan con el conocimiento clínico conocido sobre las muestras clínicas. El modelo (pseudo-)lineal entrenado ilustrativo es capaz de predecir que todas las muestras de meduloblastoma Wnt positivas tienen la vía de Wnt ligeramente activa. Todas las muestras positivas de Wnt tienen una puntuación de Wnt relativamente baja en comparación con todas las demás muestras negativas de Wnt, lo que puede ser una indicación de que en las muestras de meduloblastoma el umbral, definido en las muestras de tejido de colon, debe ser más bajo que en las muestras de colon, posiblemente debido a las diferencias en la expresión génica en el tejido.
El modelo (pseudo-)lineal ilustrativo entrenado de la vía de HH que consiste en dos capas, con todos los conjuntos de sondas y genes diana mencionados en la Tabla 3 en la primera y segunda capa, respectivamente, se usó para predecir la actividad de HH en un conjunto de muestras de cáncer de meduloblastoma. (GSE10327, véase la Figura 9). La puntuación de la actividad de HH se calcula en base a la puntuación de expresión de genes diana en base al procedimiento descrito en la presente memoria. El modelo predice correctamente que la mitad de las muestras en el grupo positivo para HH, como se indica mediante shh en la Figura 9, tienen una vía de HH activa. Se predijo correctamente que todas las demás muestras tendrían una vía de HH inactiva.
El modelo (pseudo-)lineal entrenado ilustrativo de la vía de ER en base a los "conjuntos de sondas más discriminativas" y las "probabilidades logarítmicas" como se muestra en la Tabla 2 como se describe en la presente memoria se usó para predecir la puntuación de la actividad de la vía de ER en un conjunto de muestras de cáncer de mama del conjunto de datos GSE12276. Las puntuaciones resultantes de la actividad de la vía de ER se muestran en la Figura 11. Las muestras de cáncer de mama se agrupan por la expresión de ER (ER+) o la no expresión de ER (ER-). El estado de ER se determina en base al nivel de expresión de ER medido por el experimento de micromatriz. Aunque una muestra clínica puede expresar altos niveles de ER, esto no significa necesariamente que la vía de Er esté activa. Esto también está respaldado por el tratamiento hormonal relativamente alto que no es efectivo en el cáncer de mama ER+ de 50 a 60 %. Por otro lado, se sabe en el campo que la vía de ER no puede estar activa cuando una muestra clínica no expresa ER. Aproximadamente el 25 % de las muestras ER+ se predice por el modelo (pseudo-)lineal para tener una vía de ER activa que puede explicarse en parte por el tratamiento hormonal relativamente alto que no es efectivo en estos tipos de cánceres de mama del 50 -60 %. Se predice correctamente que la vía de ER tendrá una vía de ER pasiva en las muestras-ER.
El modelo AR (pseudo-)lineal entrenado ilustrativo en base a "todos los conjuntos de sondas" mencionado en la Tabla 4 y los pesos calculados mediante el uso del procedimiento "blanco y negro" y los datos de expresión de transformada difusa de las células LNCaP (GSE7868) como se describe en la presente memoria se usó para predecir la actividad de la vía de AR en muestras de próstata (GSE17951, transformada difusa). Las puntuaciones de la actividad AR calculadas para los tres grupos de muestras (de izquierda a derecha: biopsia, control y tumor) se muestran en la Figura 15. Se encontró que la gran mayoría de las biopsias y las muestras tumorales tenían una alta actividad AR, lo que parece correlacionarse con el estado clínico conocido. Por otro lado, un número relativamente bajo de muestras en el grupo de control expresa la actividad AR de acuerdo con las predicciones del modelo como se esperaba.
Ejemplo 6: Pronóstico en base a la actividad de la vía
Se cree que las vías de desarrollo temprano, como Wnt y HH, juegan un papel en la metástasis causada por las células cancerosas que han revertido a un fenotipo más parecido a las células madre, llamadas células madre cancerosas. De hecho, hay suficiente evidencia disponible para que las vías de desarrollo temprano, tal como la vía de Wnt, jueguen un papel en la metástasis del cáncer, lo que permite que las células cancerosas metastásicas comiencen a dividirse en el lugar de siembra en otro órgano o tejido. La metástasis se asocia con un mal pronóstico, por lo que se espera que la actividad de las vías de desarrollo temprano, tal como la vía de Wnt y HH, en las células cancerosas sea predictiva de un mal pronóstico. Esto está respaldado por el hecho de que los pacientes con cáncer de mama, a partir del conjunto de datos GSE12276, que se identificaron que tenían una vía de ER activa pero que no tenían una vía de Wnt o HH activa mediante el uso de los modelos (pseudo-)lineales descritos en la presente memoria tenían un mejor pronóstico que los pacientes identificados que tienen una vía de HH o Wnt activa o ambas, como se ilustra en el gráfico de Kaplan-Meier en la Figura 16.
Ejemplo 7: Planificación de la terapia, predicción de la eficacia del fármaco, predicción de los efectos adversos y seguimiento de la eficacia del fármaco
El siguiente ejemplo ilustra cómo usar modelos (pseudo-)lineales de las vías de señalización celular para la planificación de la terapia, la predicción de la eficacia del fármaco, la monitorización de la eficacia del fármaco y las actividades relacionadas.
El modelo (pseudo-)lineal de la vía de ER, construido mediante el uso de un nodo para la presencia del factor de transcripción y una capa de conjuntos de sondas (Tabla 2) asociados con los genes diana de la vía de ER, análogo a la Figura 2 como se describe en la presente memoria, y entrenado como se describe en la presente memoria, se usó para calcular la puntuación de actividad de la vía de ER. Posteriormente se demuestra que la puntuación de la actividad de la vía está correlacionada con la eficacia del fármaco o con el seguimiento de la eficacia del fármaco. Los resultados resumidos se muestran en las Figuras 20 y 12.
Con respecto a la Figura 20, el Tamoxifeno es un fármaco usado actualmente para el tratamiento del cáncer de mama ER+ (receptor de estrógeno positivo). Actúa como un antagonista parcial del receptor de estrógeno que inhibe la proliferación celular descontrolada que se cree que es inducida por la señalización del ER. Desafortunadamente, no todos los cánceres de mama responden al tratamiento con Tamoxifeno, a pesar de la demostración de la presencia de proteína ER en las células cancerosas mediante el análisis histopatológico de rutina de los portaobjetos de tejido canceroso. Se han realizado muchos estudios para investigar esta denominada resistencia al Tamoxifeno. El conjunto de datos de GSE21618 disponible públicamente es el resultado de uno de tales estudios y contiene datos de micromatriz de líneas celulares MCF7 resistentes al Tamoxifeno y de tipo salvaje bajo diferentes regímenes de tratamiento. El modelo ER (pseudo-)lineal construido y entrenado como se describe en la presente memoria se usa para analizar las líneas celulares MCF7 de tipo salvaje y resistentes al Tamoxifeno bajo diferentes regímenes de tratamiento; los resultados se muestran en la Figura 20.
Se predice que la línea celular control resistente al Tamoxifeno, indicada por TamR.Ctrl, tiene una vía de ER inactiva para cada punto de tiempo después de la adición de tamoxifeno (1, 2, 3, 6, 12, 24 y 48 h). No es sorprendente que el tratamiento de la línea celular resistente al Tamoxifeno estimulada con E2 y tratada con tamoxifeno, indicado por TamR.E2_Tam (cuarto grupo), no sea efectivo, lo que también se ilustra por la inactividad predicha de la vía de ER para este grupo sobre el mismo punto de tiempo. De acuerdo con el análisis de la línea celular resistente al Tamoxifeno (TamR.Ctrl), la fuerza impulsora de la proliferación celular descontrolada no se debe a la señalización activa del ER; por lo tanto, tratarlo con un antagonista de ER no inhibirá la proliferación celular. Esto ilustra que no se recomienda el tratamiento con Tamoxifeno en caso de una actividad de la vía de ER predicha negativa.
Por otro lado, la línea celular MCF7 de tipo salvaje, conocida por ser sensible al Tamoxifeno, tratada con 17betaestradiol (wt1.E2, undécimo grupo) reacciona lentamente al tratamiento hormonal que es visible en las predicciones de actividad positiva de ER creciente. El tratamiento de una línea celular de este tipo con inhibidores de ER como el Tamoxifeno inhibirá la vía de ER, que se ilustra por la puntuación de actividad de la vía de ER decreciente en el tiempo de las muestras de MCF7 estimuladas con E2 y tratadas con Tamoxifeno (wt2.E2_Tam, duodécimo grupo).
En otro ejemplo, un conjunto de datos disponible públicamente de líneas celulares MCF7 estimuladas o privadas de agente estimulante del ER (E2) con niveles de expresión medidos a las 12 horas, 24 horas y 48 horas después de comenzar la estimulación o la privación (GSE11352) se usó para calcular las puntuaciones de la actividad de ER mediante el uso del modelo ER (pseudo-)lineal entrenado como se describe en la presente memoria. La puntuación de la actividad de la vía de ER aumenta para tiempos de exposición más largos al agente estimulante de ER (primeros tres grupos) y disminuye en caso de inanición prolongada en el control (últimos tres grupos), aunque la privación prolongada aumenta ligeramente después de 48 horas nuevamente. Con la excepción de la inanición de 48 horas, las puntuaciones de actividad de ER predichas se correlacionan muy bien con el conocimiento de que la estimulación prolongada da como resultado una actividad de ER más alta y viceversa. A la inversa, este ejemplo implica que la puntuación de la actividad de ER puede usarse para controlar la eficacia o ineficacia de la estimulación o inhibición de los tratamientos de actividad de ER.
Ejemplo 8: Desarrollo de fármacos
De manera similar a la monitorización de la respuesta a la terapia, puede usarse un modelo de la vía en el desarrollo de fármacos para evaluar la eficacia de varios compuestos putativos. Por ejemplo, cuando se seleccionan muchos compuestos para detectar un posible efecto sobre una determinada vía en una línea celular cancerosa, el modelo de la vía respectiva puede usarse para determinar si la actividad de la vía aumenta o disminuye después de la aplicación del compuesto o no. A menudo, esta verificación se realiza mediante el uso de solo uno o algunos de los marcadores putativos de la actividad de la vía, lo que aumenta la posibilidad de un control que no sea efectivo del efecto del tratamiento. Además, en estudios de seguimiento en animales o pacientes, los modelos de la vía pueden usarse de manera similar para evaluar la efectividad de los fármacos candidatos y para determinar una dosis óptima para impactar al máximo la actividad de la vía.
Un ejemplo de monitorización que no sea efectiva de nuevos compuestos farmacológicos se ilustra mediante la actividad de la vía de AR predicha en las muestras de GSE7708, como se muestra en la Figura 14. En este estudio se han desarrollado dos posibles compuestos farmacológicos para inhibir la actividad de la vía de AR, denominados Poliamida 1 y Poliamida 2. Se ha demostrado que estas dos poliamidas son capaces de inhibir la expresión de KLK3 (= PSA), un gen/marcador diana bien conocido de la vía de AR, así como » 35 % de las transcripciones que se indujeron tras la estimulación con DHT (un activador conocido de la vía de AR). En contraste, el modelo (pseudo-)lineal de la vía de AR predijo que las muestras tratadas primero con el agente estimulante DHT y luego con la poliamida 1 (segundo grupo en la Figura 14) y la poliamida 2 (tercer grupo en la Figura 14) todavía tendrían una vía de AR activa. La investigación de las puntuaciones de la actividad de AR inferidas y los niveles de expresión medidos de los genes diana indicaron que KLK3, en contraste con los otros genes diana, estaba regulado negativamente de acuerdo con los hallazgos, mientras que todos los demás genes diana (excepto AR, GUCY1A3 y TMPRSS2 en el caso de la poliamida 1) se expresaron claramente de manera diferencial en las muestras tratadas con Poliamida 1 y Poliamida 2. En otras palabras, solo un número limitado de genes diana para la actividad AR, en particular su marcador de eficacia KLK3, se reguló negativamente, mientras que la mayoría de los genes diana identificados todavía estaban regulados positivamente, lo que indica que la vía de AR todavía está en gran parte intacta y, por lo tanto, activa. Teniendo en cuenta un mayor número de genes diana en base a la evidencia de la literatura, los inventores pudieron demostrar que la inhibición de la actividad AR de las poliamidas es limitada y que solo la expresión de KLK3 está claramente regulada negativamente mediante el uso de estas poliamidas. Además, esto ilustra el valor de un enfoque sistemático mediante el uso de un modelo (pseudo-)lineal de genes de múltiples dianas en comparación con un enfoque reduccionista en el desarrollo de fármacos.
Ejemplo 9: Desarrollo del ensayo
En lugar de aplicar los modelos (pseudo-)lineales mencionados en los datos de entrada de ARNm provenientes de micromatrices o secuenciación de ARN, puede ser beneficioso en aplicaciones clínicas desarrollar ensayos dedicados para realizar las mediciones de muestras, por ejemplo, en una plataforma integrada que utilice qPCR para determinar los niveles de ARNm de los genes diana. Las secuencias de ARN/ADN de los genes diana divulgados pueden usarse luego para determinar qué cebadores y sondas seleccionar en tal plataforma.
La validación de un ensayo dedicado de este tipo puede realizarse mediante el uso de los modelos (pseudo-)lineales basados en micromatriz como modelo de referencia y verificando si el ensayo desarrollado da resultados similares en un conjunto de muestras de validación. Además de un ensayo dedicado, esto también puede hacerse para construir y calibrar modelos (pseudo-)lineales similares mediante el uso de los datos de secuenciación de ARNm como medidas de entrada.
Ejemplo 10: Investigación de las vías e investigación de la fisiopatología del cáncer
A continuación, se ilustrará cómo pueden emplearse modelos (pseudo-)lineales en la investigación de vías (clínicas), es decir, investigaciones interesadas en averiguar qué vías están implicadas en determinadas enfermedades, que pueden seguirse para una investigación más detallada, por ejemplo, para vincular mutaciones en la señalización de proteínas a cambios en la activación de la vía (medida con el modelo). Esto es relevante para investigar el inicio, crecimiento y evolución y metástasis de cánceres específicos (la fisiopatología).
Los modelos (pseudo-)lineales de la vía de Wnt, ER, HH y AR, construidos mediante el uso al menos de un nodo para la presencia del factor de transcripción y una capa de nodos que representan los niveles de expresión de ARNm de los genes diana medidos por sus conjuntos de sondas asociados (Tabla 1, Tabla 2, Tabla 3 y Tabla 4), análogas a las Figuras 2 y 3 descritas en la presente memoria, y entrenadas como se describe en la presente memoria, se usaron para predecir la actividad de la vía de un conjunto de datos que consiste en muestras de cáncer de mama (GSE12276).
Suponga que el investigador está interesado en investigar la vía o vías de señalización celular y las desregulaciones específicas que impulsan la proliferación celular descontrolada. El investigador puede analizar los datos de micromatriz mediante el uso de los modelos (pseudo-)lineales mencionados anteriormente para encontrar qué vías son presumiblemente la causa de la proliferación celular descontrolada. En la Figura 18 y la Figura 19 puede verse una ilustración de tal análisis para el caso de las puntuaciones de la actividad Wnt, ER, a R y HH (muestras A basal y luminal del conjunto de datos GSE12276). Posteriormente, el investigador puede buscar con más detalle para encontrar la causa exacta de la desregulación de la vía.
Con referencia a la Figura 19, se sabe que las muestras basales tienen un estado de receptor triple negativo (ER, PR y HER2), por lo tanto, no es sorprendente ver que se predice que todas las muestras tienen una vía de ER inactiva (véase también la Figura 11). Por otro lado, se predice que algunas de las muestras tendrán activa la vía de Wnt, como se muestra en la Figura 19. Estas actividades predichas de la vía de Wnt persuaden al investigador a investigar estas muestras con más detalle, por ejemplo, para detectar mutaciones conocidas u otras desregulaciones conocidas en la vía de Wnt. Esta metodología también podría aplicarse a otras vías de señalización celular, tal como las vías HH y AR.
Otro ejemplo se da en la Figura 18, donde se ilustran las puntuaciones de la actividad Wnt, ER, AR y HH en las muestras luminales A del conjunto de datos GSE12276. Se sabe que las muestras de Luminales A expresan ER, sin embargo, esto no significa necesariamente que las propiedades cancerosas se deban a la señalización activa de ER. A partir de las actividades de la vía predicha, puede inferirse que no todas las muestras ER+ tienen una señalización de ER activa. Sin embargo, se encuentra que algunas de las muestras que no tienen una señalización ER activa tienen una vía de Wnt, AR y/o HH activa. Esto podría dar lugar a que el investigador investigue estas muestras con más detalle para detectar defectos en la vía de señalización Wnt, AR y/o HH, respectivamente. Algunas de las muestras no predicen que ninguna de las cuatro vías incluidas esté activa; tal vez otras vías estén causando las proliferaciones celulares descontroladas. Además, esto le da al investigador información adicional para buscar defectos en otras vías.
En sumario, las ilustraciones descritas en la presente memoria indican la capacidad de los modelos (pseudo-)lineales entrenados (como se describió anteriormente) para apoyar el procedimiento de encontrar la causa de la proliferación celular incontrolada en un procedimiento más dirigido. Al emplear los modelos (pseudo-)lineales para seleccionar las muestras en busca de las actividades de la vía, las actividades de la vía predichas pueden identificar las posibles vías para la proliferación celular incontrolable, que puede seguirse para una investigación más detallada, por ejemplo, para vincular mutaciones en proteínas de señalización u otras desregulaciones conocidas a cambios en la activación (medidos con el modelo).
Como se describe en la presente memoria, el procedimiento para desarrollar y entrenar un modelo (pseudo-)lineal de las vías de señalización celular puede usarse para construir un modelo (pseudo-)lineal para otras vías que también podrían emplearse en relación con la presente invención.
Ejemplo 11: Inscripción del sujeto en un ensayo clínico en base a la actividad prevista
Si se desarrolla un fármaco candidato para, por ejemplo, bloquear la actividad de una determinada vía que impulsa el crecimiento tumoral, y este fármaco va a someterse a un ensayo clínico, entonces una selección adecuada de los sujetos que se inscribirán en tal ensayo es esencial para demostrar la potencial eficacia del fármaco. En tal caso, los pacientes que no tienen la vía respectiva activada en sus tumores deben ser excluidos del ensayo, ya que es obvio que el fármaco no puede ser efectivo si la vía no se activa en primer lugar. Por lo tanto, un modelo de la vía que puede predecir la actividad de la vía, tal como los modelos (pseudo-)lineales descritos en la presente memoria, puede usarse como una herramienta de selección, para seleccionar solo aquellos pacientes que se predice que tendrán activada la vía respectiva.
Ejemplo 12: Selección de las pruebas posteriores que se realizarán
Si un tumor se analiza mediante el uso de los diferentes modelos de vías y los modelos predicen la desregulación de una determinada vía, esto puede guiar la selección de las pruebas posteriores que se realizarán. Por ejemplo, puede ejecutarse un ensayo de ligadura de proximidad (PLA) para confirmar la presencia del complejo de transcripción respectivo (Soderberg O, 2006). Tal PLA puede diseñarse para dar un resultado positivo si dos proteínas clave en un complejo TF se han unido juntas, por ejemplo, beta-catenina y TCF4 en el complejo TF de la vía de Wnt.
Otro ejemplo es que la vía que se predice que se desregulará se analiza con más detalle con respecto a la cascada de señalización. Por ejemplo, pueden analizarse proteínas clave en esta vía para determinar si existen mutaciones en las regiones de ADN que codifican sus genes respectivos, o puede probarse la abundancia de estas proteínas para ver si son más altas o más bajas de lo normal. Tales pruebas pueden indicar cuál es la causa raíz detrás de la desregulación de la vía y dar información sobre qué fármacos disponibles podrían usarse para reducir la actividad de la vía.
Estas pruebas se seleccionan para confirmar la actividad de la vía identificada mediante el uso de los modelos (pseudo-)lineales. Sin embargo, también es posible la selección de pruebas de diagnóstico complementarias. Después de la identificación de la vía mediante el modelo, para la elección de la terapia dirigida solo es necesario realizar las pruebas de diagnóstico complementarias (la selección), que son aplicables a la vía identificada.
Ejemplo 13: Selección de pruebas de diagnóstico complementarias
Al igual que en el ejemplo anterior, si se analiza un tumor y los modelos de vía predicen la desregulación de una determinada vía y, opcionalmente, se han realizado varias pruebas adicionales para investigar la causa de la desregulación, entonces un oncólogo puede seleccionar varios fármacos candidatos para tratar al paciente. Sin embargo, el tratamiento con tal fármaco puede requerir que se ejecute primero una prueba de diagnóstico complementaria, por ejemplo, para cumplir con las pautas clínicas o para garantizar el reembolso de los costos del tratamiento, o porque la normativa (f Da ) requiere realizar la prueba de diagnóstico complementaria antes de administrar el fármaco. Un ejemplo de una prueba de diagnóstico complementaria de este tipo es la prueba Her2 para el tratamiento de pacientes con cáncer de mama con el fármaco Herceptin (Trastuzumab). Por tanto, el resultado de los modelos de la vía puede usarse para seleccionar los fármacos candidatos y las respectivas pruebas de diagnóstico complementarias que se realizarán.
Ejemplo 15: Aplicación CDS
Con referencia a la Figura 4 (que muestra esquemáticamente un sistema de soporte de decisiones clínicas (CDS) configurado para evaluar una o más vías de señalización celular como se divulga en la presente memoria (se muestra un ejemplo para la vía de Wnt)), un sistema de soporte de decisiones clínicas (CDS) 10 se implementa como una computadora 12 adecuadamente configurada. La computadora 12 puede configurarse para operar como el sistema CDS 10 mediante la ejecución de software, firmware u otras instrucciones adecuadas almacenadas en un medio de almacenamiento no transitorio (no mostrado) tal como un disco duro u otro medio de almacenamiento magnético, un disco óptico u otro medio de almacenamiento óptico, una memoria de acceso aleatorio (RAM), una memoria de solo lectura (ROM), una memoria flash u otro medio de almacenamiento electrónico, un servidor de red, o demás. Si bien el sistema ilustrativo de CDS 10 está representado por el ordenador ilustrativo 12, más generalmente el sistema de CDS puede realizarse mediante un dispositivo de procesamiento digital o un aparato que comprende un procesador digital configurado para realizar métodos de soporte de decisiones clínicas como se establece en la presente memoria. Por ejemplo, el dispositivo de procesamiento digital puede ser un dispositivo de mano (por ejemplo, un asistente de datos personales o un teléfono inteligente que ejecuta una aplicación CDS), una computadora portátil, una computadora de escritorio, una tableta o dispositivo, un servidor de red remoto, o demás. El ordenador 12 u otro dispositivo de procesamiento digital incluye típicamente o está conectado operativamente con un dispositivo de visualización 14 a través del cual se muestra al personal médico información que incluye recomendaciones de apoyo a la decisión clínica. La computadora 12 u otro dispositivo de procesamiento digital típicamente también incluye o está conectado operativamente con uno o más dispositivos de entrada de usuario, tales como un teclado ilustrativo 16, o un ratón, bola de seguimiento, panel táctil, pantalla sensible al tacto (posiblemente integrado con el dispositivo de visualización 14), u otro dispositivo de entrada de usuario basado en punteros, a través del cual el personal médico puede introducir información tal como órdenes operativas para controlar el sistema CDS 10, datos para su uso por el sistema CDS 10, o demás.
El sistema CDS 10 recibe como entrada información perteneciente a un sujeto médico (por ejemplo, un paciente de un hospital o un paciente ambulatorio que está siendo tratado por un oncólogo, médico u otro personal médico, o una persona que se somete a un examen de detección de cáncer o algún otro diagnóstico médico conocido o se sospecha que tiene cierto tipo de cáncer, como cáncer de colon, cáncer de mama o cáncer de hígado, o demás). El sistema CDS 10 aplica varios algoritmos de análisis de datos a esta información de entrada para generar recomendaciones de apoyo a la decisión clínica que se presentan al personal médico mediante el dispositivo de visualización 14 (o mediante un sintetizador de voz u otro dispositivo que proporcione una salida perceptible por el ser humano). En algunas realizaciones, estos algoritmos pueden incluir la aplicación de una guía clínica al paciente. Una guía clínica es un conjunto almacenado de recomendaciones de tratamiento estándar o "canónico", típicamente construido en base a las recomendaciones de un panel de expertos médicos y opcionalmente formateado en forma de un "diagrama de flujo" clíni
algoritmos de procesamiento de datos del CDS 10 pueden incluir adicional o alternativamente varios algoritmos de pruebas clínicas o de diagnóstico que se realizan con información de entrada para extraer recomendaciones de decisiones clínicas, tales como procedimientos de aprendizaje automático divulgados en la presente memoria.
En los sistemas CDS ilustrativos divulgados en la presente memoria (por ejemplo, sistema CDS 10), los algoritmos de análisis de datos CDS incluyen uno o más algoritmos de pruebas diagnósticas o clínicas que se realizan a partir de información genómica y/o proteómica de entrada adquirida por uno o más laboratorios médicos 18. Estos laboratorios pueden estar ubicados de diversas formas "en el lugar", es decir, en el hospital u otro lugar donde el sujeto médico se somete a un examen y/o tratamiento médico, o "fuera del lugar", por ejemplo, un laboratorio especializado y centralizado que recibe (por correo u otro servicio de entrega) una muestra de tejido y/o células del sujeto médico que se ha extraído del sujeto médico (por ejemplo, una muestra obtenida de una lesión en la mama, o del colon de un sujeto médico que se sabe o se sospecha que tiene cáncer de colon, o de un hígado de un sujeto médico que se sabe o se sospecha que tiene cáncer de hígado, o demás, mediante un procedimiento de biopsia u otro procedimiento de extracción de muestras). El tejido del que se extrae una muestra también puede ser tejido metastásico, por ejemplo, tejido maligno (sospechoso) que se origina en el colon, la mama, el hígado u otro órgano que se haya extendido fuera del colon, la mama, el hígado u otro órgano. Las células de las que se extrae una muestra también pueden ser células tumorales de neoplasias hematológicas (tal como la leucemia). En algunos casos, la muestra de células también puede ser células tumorales circulantes, es decir, células tumorales que han entrado en el torrente sanguíneo y pueden extraerse como muestra de tejido extraída mediante el uso de técnicas de aislamiento adecuadas. La muestra extraída es procesada por el laboratorio para generar información genómica o proteómica. Por ejemplo, la muestra extraída puede procesarse mediante el uso de una micromatriz (también denominada en la técnica como un chip de gen, chip de ADN, biochip, o demás) o mediante el procesamiento de la reacción en cadena de la polimerasa cuantitativa (qPCR) para medir la información de las pruebas genómicas o proteómicas como niveles de expresión de genes de interés, por ejemplo, en forma de un nivel de ácido ribonucleico mensajero (ARNm) que se transcribe del gen, o un nivel de una proteína que se traduce del ARNm transcrito del gen. Como otro ejemplo, la muestra extraída puede ser procesada por un laboratorio de secuenciación de genes para generar secuencias para ácido desoxirribonucleico (ADN), o para generar una secuencia de ARN, variación del número de copias, o demás. Otros enfoques de medición contemplados incluyen inmunohistoquímica (IHC), citología, hibridación in situ por fluorescencia (FISH), ensayo de ligadura de proximidad, o demás, realizado en un portaobjetos de patología. Otra información que puede generarse mediante el procesamiento de micromatrices, espectrometría de masas, secuenciación de genes u otras técnicas de laboratorio incluye la información de metilación. También pueden realizarse diversas combinaciones de tales medidas genómicas y/o proteómicas.
En algunas realizaciones, los laboratorios médicos 18 realizan una serie de adquisiciones de datos estandarizados sobre la muestra extraída del tejido y/o las células del sujeto médico, para generar una gran cantidad de datos genómicos y/o proteómicos. Por ejemplo, las técnicas de adquisición de datos estandarizadas pueden generar una secuencia de ADN (opcionalmente alineada) para uno o más cromosomas o porciones de cromosomas, o para todo el genoma del tejido y/o las células. La aplicación de una micromatriz estándar puede generar miles o decenas de miles de elementos de datos, tales como niveles de expresión para una gran cantidad de genes, varios datos de metilación, o demás. Esta plétora de datos genómicos y/o proteómicos, o partes seleccionadas de los mismos, se ingresan al sistema CDS 10 para ser procesados a fin de desarrollar información clínicamente útil para formular recomendaciones de apoyo a la decisión clínica.
Los sistemas CDS divulgados y los procedimientos relacionados se refieren al procesamiento de datos genómicos y/o proteómicos para evaluar la actividad de diversas vías de señalización celular. Sin embargo, debe entenderse que los sistemas CDS divulgados (por ejemplo, el sistema CDS 10) pueden incluir opcionalmente además diversas capacidades adicionales, tal como la generación de recomendaciones de apoyo a la decisión clínica de acuerdo con las pautas clínicas almacenadas en base a varios datos del paciente, tal como el monitoreo de los datos de signos vitales, datos del historial del paciente, datos demográficos del paciente (por ejemplo, sexo, edad, etc.), datos de imágenes médicas del paciente, o demás. Alternativamente, en algunas realizaciones, las capacidades del sistema CDS 10 pueden limitarse a realizar únicamente análisis de datos genómicos y/o proteómicos para evaluar las vías de señalización celular como se divulga en la presente memoria.
Continuando con la referencia a la Figura 4 ilustrativa, el sistema CDS 10 infiere la actividad de una vía de señalización celular en el tejido y/o las células del sujeto médico en base al menos en, pero que no se limita a, los niveles de expresión de los genes diana de la vía de señalización celular medido en la muestra extraída, y determina si la vía de señalización celular funciona de forma anormal en el tejido y/o las células del sujeto médico en base a esta actividad inferida. Los ejemplos divulgados en la presente memoria se refieren a las vías Wnt, ER, AR y HH como vías de señalización celular ilustrativas. Estas vías son de interés en diversas áreas de la oncología porque la pérdida de regulación de las vías puede ser una causa de proliferación de un cáncer. Hay alrededor de 10-15 vías de señalización relevantes, y cada cáncer está impulsado, en principio, por una vía dominante que está desregulada. Sin limitarse a ninguna teoría particular de funcionamiento, estas vías regulan la proliferación celular y, en consecuencia, una pérdida de regulación de estas vías en las células cancerosas puede llevar a que la vía esté "siempre activa", acelerando así la proliferación de células cancerosas, que a su vez se manifiesta como un crecimiento, invasión o metástasis (diseminación) del cáncer.
La medición de los niveles de expresión de ARNm de genes que codifican las proteínas reguladoras de la vía de señalización celular, tal como una proteína intermediaria que forma parte de una cascada de proteínas que forma la vía de señalización celular, es una medida indirecta del nivel de expresión de la proteína reguladora y puede o puede no se correlacionar fuertemente con el nivel real de expresión de la proteína reguladora (mucho menos con la actividad general de la vía de señalización celular). La vía de señalización celular regula directamente la transcripción de los genes diana; por lo tanto, los niveles de expresión de ARNm transcrito de los genes diana es un resultado directo de esta actividad reguladora. Por lo tanto, el sistema CDS 10 infiere la actividad de la vía de señalización celular (por ejemplo, las vías Wnt, ER, AR y HH) en base al menos en los niveles de expresión de los genes diana (nivel de ARNm o proteína como medida sustituta) de la vía de señalización celular. Esto asegura que el sistema CDS 10 infiere la actividad de la vía en base a la información directa proporcionada por los niveles de expresión medidos de los genes diana.
Sin embargo, aunque, como se divulga en la presente memoria, son eficaces para evaluar la actividad de las vías generales, los niveles de expresión en 20 de los genes diana medidos de las vías no son especialmente informativos sobre por qué las vías funcionan de forma anormal (si es que ese es el caso). Dicho de otra forma, los niveles de expresión medidos en 20 de los genes diana de una vía pueden indicar que la vía está funcionando de forma anormal, pero no indican qué parte de la vía está funcionando mal (por ejemplo, carece de regulación suficiente) para causar que la vía general opere anormalmente.
En consecuencia, si el sistema CDS 10 detecta una actividad anormal de una vía particular, el sistema CDS 10 entonces opcionalmente hace uso de otra información proporcionada por los laboratorios médicos 18 para la muestra extraída, tal como secuencias genéticas alineadas 22 y/o nivel de expresión medido para uno o más genes reguladores de la vía 24, o seleccionar la prueba de diagnóstico que se realizará a continuación para evaluar qué parte de la vía no funciona correctamente. Para maximizar la eficacia, en algunas realizaciones, esta evaluación opcional de por qué la vía no funciona correctamente se realiza solo si el análisis de los niveles de expresión medidos en 20 de los genes diana de la vía indica que la vía está funcionando de forma anormal. En otras realizaciones, esta evaluación se integra en el análisis de la vía de señalización celular descrita en la presente memoria.
En realizaciones en las que el sistema CDS 10 evalúa qué parte de la vía está funcionando mal y tiene éxito al hacerlo, la información adicional permite que el sistema CDS 10 recomiende prescribir un fármaco dirigido para el mal funcionamiento específico (recomendación 26 mostrada en la Figura 4). Si no se identifica un mal funcionamiento de una vía específica (ya sea porque no se realiza la evaluación adicional opcional o porque esa evaluación no identifica una porción particular de la vía que está funcionando mal), entonces el sistema CDS 10 puede proporcionar una recomendación predeterminada 28 recomendando la prescripción de un fármaco de supresión general para esta vía en particular (asumiendo que la actividad de la vía anormal es una actividad demasiado alta).
Ejemplo 16: Un kit y herramientas de análisis para medir la actividad de la vía
El conjunto de los genes diana que mejor indica la actividad de una vía específica, en base a una investigación basada en la secuenciación de micromatriz/ARN mediante el uso del modelo (pseudo-)lineal, puede traducirse en un ensayo de PCR cuantitativa en formato múltiple que se realizará en una muestra de tejido o célula. Para desarrollar una prueba aprobada por la FDA para la actividad de la vía, se requiere el desarrollo de un kit de prueba estandarizado, que debe ser validado clínicamente en ensayos clínicos para obtener la aprobación regulatoria. Bibliografía:
de Sousa E Melo F, CS (2011). Methylation of cancer-stem-cell-associated Wnt target genes predicts poor prognosis in colorectal cancer patients. Cell Stem Cell., 476-485
Hatzis P, v. d. (2008). Genome-wide pattern of TCF7L2/TCF4 chromatin occupancy in colorectal cancer cells. Mol Cell Biol., 2732-2744
Nusse, R. (2012, 1 de mayo). Wnt target genes. Obtenido de la página de inicio de The Wnt: http://www.stanford.edu/group/nusselab/cgi-bin/wnt/target_genes
Soderberg O, G. M. (2006). Direct observation of individual endogenous protein complexes in situ by proximity ligation. Nat Methods., 995-1000
van de Wetering M, S. E.-P.-F. (2002). The beta-catenin/TCF-4 complex imposes a crypt progenitor phenotype on colorectal cancer cells. Cell, 241-250

Claims (22)

REIVINDICACIONES
1. Un procedimiento que comprende:
- inferir la actividad de una vía de señalización celular en un tejido y/o células de un sujeto médico en base al menos en los niveles de expresión (20) de uno o más genes diana de la vía de señalización celular medidos en una muestra extraída del tejido y/o las células del sujeto médico, en el que la inferencia comprende: determinar un nivel (46) de un elemento de factor de transcripción (TF) en la muestra extraída del tejido y/o las células del sujeto médico, el elemento TF controla la transcripción del uno o más genes diana de la vía de señalización celular, la determinación se basa al menos en parte en la evaluación de un modelo matemático (40-1,...,40-3) que relaciona los niveles de expresión del uno o más genes diana de la vía de señalización celular con el nivel del elemento TF, el modelo se basa en una o más combinaciones lineales de los niveles de expresión del uno o más genes diana; e
inferir la actividad de la vía de señalización celular en el tejido y/o las células del sujeto médico en base al nivel determinado del elemento TF en la muestra extraída del tejido y/o las células del sujeto médico; en el que la inferencia se realiza mediante un dispositivo de procesamiento digital (12) mediante el uso del modelo de la vía de señalización celular,
en el que para cada uno de los uno o más genes diana se proporcionan uno o más niveles de expresión medidos en la muestra extraída del tejido y/o las células del sujeto médico, y en el que la una o más combinaciones lineales comprenden una combinación lineal de todos los niveles de expresión del uno o más niveles de expresión proporcionados para el uno o más genes diana, o
en el que para cada uno de los uno o más genes diana se proporcionan uno o más niveles de expresión medidos en la muestra extraída del tejido y/o las células del sujeto médico, y en el que la una o más combinaciones lineales comprenden una combinación lineal que incluye para cada uno de los uno o más genes diana un término ponderado, cada término ponderado se basa en un solo nivel de expresión del uno o más niveles de expresión proporcionados para el gen diana respectivo, o
en el que para cada uno de los uno o más genes diana se proporcionan uno o más niveles de expresión medidos en la muestra extraída del tejido y/o las células del sujeto médico, en el que la una o más combinaciones lineales comprenden para cada uno de los uno o más genes diana una primera combinación lineal de todos los niveles de expresión del uno o más niveles de expresión proporcionados para el gen diana respectivo, y en el que el modelo se basa además al menos en parte en una combinación lineal adicional que incluye para cada uno de los uno o más genes diana un término ponderado, cada término ponderado se basa en la primera combinación lineal para el gen diana respectivo,
en el que la vía de señalización celular comprende una vía de Wnt, una vía de ER, una vía de AR o una vía de HH.
2. El procedimiento de la reivindicación 1, en el que la inferencia comprende:
inferir la actividad de una vía de Wnt en el tejido y/o las células del sujeto médico en base al menos en los niveles de expresión (20) de uno o más, preferentemente al menos tres, genes diana de la vía de Wnt medidos en la muestra extraída del tejido y/o las células del sujeto médico seleccionados del grupo que comprende: KIAA1199, AXIN2, RNF43, TBX3, TDGF1, SOX9, ASCL2, IL8, SP5, ZNRF3, KLF6, CCND1, DEFA6 y FZD7.
3. El procedimiento de la reivindicación 1, en el que la inferencia comprende:
inferir la actividad de una vía de ER en el tejido y/o las células del sujeto médico en base al menos en los niveles de expresión (20) de uno o más, preferentemente al menos tres, genes diana de la vía del ER medidos en la muestra extraída del tejido y/o las células del sujeto médico seleccionados del grupo que comprende: CDH26, SGK3, PGR, GREB1, CA12, XBP1, CELSR2, WISP2, DSCAM, ERBB2, CTSD, TFF1 y NRIP1.
4. El procedimiento de la reivindicación 1, en el que la inferencia comprende:
inferir la actividad de una vía de HH en el tejido y/o las células del sujeto médico en base al menos en los niveles de expresión (20) de uno o más, preferentemente al menos tres, genes diana de la vía de HH medidos en la muestra extraída del tejido y/o las células del sujeto médico seleccionados del grupo que comprende: GLI1, PTCH1, PTCH2, IGFBP6, SPP1, CCND2, FST, FOXL1, CFLAR, TSC22D1, RAB34, S100A9, S100A7, MYCN, FOXM1, GLI3, TCEA2, FYN y CTSL1.
5. El procedimiento de la reivindicación 1, en el que la inferencia comprende:
inferir la actividad de una vía de AR en el tejido y/o las células del sujeto médico en base al menos en los niveles de expresión (20) de uno o más, preferentemente al menos tres, genes diana de la vía de la AR medidos en la muestra extraída del tejido y/o las células del sujeto médico seleccionados del grupo que comprende: KLK2, PMEPA1, TMPRSS2, NKX3_1, ABCC4, KLK3, FKBP5, ELL2, UGT2B15, DHCR24, PPAP2A, NDRG1, LRIG1, CREB3L4, LCP1, GUCY1A3, AR y EAF2.
6. El procedimiento de la reivindicación 2, en el que la inferencia se basa además en los niveles de expresión (20) de al menos un gen diana de la vía de Wnt medido en la muestra extraída del tejido y/o las células del sujeto médico seleccionado del grupo que comprende: NKD1, OAT, FAT1, LEF1, GLUL, REG1B, TCF7L2, COL18A1, BMP7, SLC1A2, ADRA2C, PPARG, DKK1, HNF1A y LECT2.
7. El procedimiento de la reivindicación 3, en el que la inferencia se basa además en los niveles de expresión (20) de al menos un gen diana de la vía de ER medido en la muestra extraída del tejido y/o las células del sujeto médico seleccionado del grupo que comprende: AP1B1, ATP5J, COL18A1, COX7A2L, EBAG9, ESR1, HSPB1, IGFBP4, KRT19, MYC, NDUFV3, PISD, PRDM15, PTMA, RARA, SOD1 y TRIM25.
8. El procedimiento de la reivindicación 4, en el que la inferencia se basa además en los niveles de expresión (20) de al menos un gen diana de la vía de HH medido en la muestra extraída del tejido y/o las células del sujeto médico seleccionado del grupo que comprende: BCL2, FOXA2, FOXF1, H19, h HiP, IL1R2, JAG2, JUP, MiF, MYLK, NKX2.2, NKX2.8, PITRM1 y TOM1.
9. El procedimiento de la reivindicación 5, en el que la inferencia se basa además en los niveles de expresión (20) de al menos un gen diana de la vía de AR medido en la muestra extraída del tejido y/o las células del sujeto médico seleccionado del grupo que comprende: APP, NTS, PLAU, CDKN1A, d Rg 1, FGF8, IGF1, PRKACB, PTPN1, SGK1 y TACC2.
10. El procedimiento de una cualquiera de las reivindicaciones 1-9, que comprende, además:
determinar si la vía de señalización celular funciona de forma anormal en el tejido y/o las células del sujeto médico en base a la actividad inferida de la vía de señalización celular en el tejido y/o las células del sujeto médico; y, opcionalmente,
recomendar la prescripción de un fármaco para el sujeto médico que corrige el funcionamiento anormal de la vía de señalización celular;
en el que la recomendación se realiza solo si se determina que la vía de señalización celular funciona de forma anormal en el tejido y/o las células del sujeto médico en base a la actividad inferida de la vía de señalización celular.
11. El procedimiento de una cualquiera de las reivindicaciones 1-9, en el que el método se usa en al menos una de las siguientes actividades:
diagnóstico en base a la actividad inferida de la vía de señalización celular en el tejido y/o las células del sujeto médico;
pronóstico en base a la actividad inferida de la vía de señalización celular en el tejido y/o las células del sujeto médico;
prescripción de fármacos en base a la actividad inferida de la vía de señalización celular en el tejido y/o las células del sujeto médico;
predicción de la eficacia del fármaco en base a la actividad inferida de la vía de señalización celular en el tejido y/o las células del sujeto médico;
predicción de efectos adversos en base a la actividad inferida de la vía de señalización celular en el tejido y/o las células del sujeto médico;
seguimiento de la eficacia del fármaco;
desarrollo del fármaco;
desarrollo del ensayo;
investigación de la vía;
estadificación del cáncer;
inscripción del sujeto médico en un ensayo clínico en base a la actividad inferida de la vía de señalización celular en el tejido y/o las células del sujeto médico;
selección de la prueba posterior que se realizará, y
selección de pruebas de diagnóstico complementarias.
12. El procedimiento de una cualquiera de las reivindicaciones 1-11 que comprende:
inferir la actividad de una vía de Wnt en tejido y/o células de un sujeto médico en base al menos en los niveles de expresión (20) de dos, tres o más genes diana de un conjunto de genes diana de la vía de Wnt medidos en una muestra extraída del tejido y/o las células del sujeto médico
y/o
inferir la actividad de una vía de ER en tejido y/o células de un sujeto médico en base al menos en los niveles de expresión (20) de dos, tres o más genes diana de un conjunto de genes diana de la vía de ER medidos en una muestra extraída del tejido y/o las células del sujeto médico
y/o
inferir la actividad de una vía de HH en tejido y/o células de un sujeto médico en base al menos en los niveles de expresión (20) de dos, tres o más genes diana de un conjunto de genes diana de la vía de HH medidos en una muestra extraída del tejido y/o las células del sujeto médico,
y/o
inferir la actividad de una vía de AR en tejido y/o células de un sujeto médico en base al menos en los niveles de expresión (20) de dos, tres o más genes diana de un conjunto de genes diana de la vía de AR medidos en una muestra extraída del tejido y/o las células del sujeto médico.
13. El procedimiento de la reivindicación 12, en el que
el conjunto de genes diana de la vía de Wnt incluye al menos nueve, preferentemente todos los genes diana seleccionados del grupo que comprende: KIAA1199, AXIN2, RNF43, TBX3, TDGF1, SOX9, ASCL2, IL8, SP5, ZNRF3, KLF6, CCND1, DEFA6 y FZD7,
y/o
el conjunto de genes diana de la vía de ER incluye al menos nueve, preferentemente todos los genes diana seleccionados del grupo que comprende: CDH26, SGK3, PGR, GREB1, CA12, XBP1, CELSR2, WISP2, DSCAM, ERBB2, CTSD, TFF1 y NRIP1,
y/o
el conjunto de genes diana de la vía de HH incluye al menos nueve, preferentemente todos los genes diana seleccionados del grupo que comprende: GLI1, PTCH1, PTCH2, IGFBP6, SPP1, CCND2, FST, FOXL1, CFLAR, TSC22D1, RAB34, S100A9, S100A7, MYCN, FOXM1, GLI3, TCEA2, FYN y CTSL1,
y/o
el conjunto de genes diana de la vía de AR incluye al menos nueve, preferentemente todos los genes diana seleccionados del grupo que comprende: KLK2, PMEPA1, TMPRSS2, NKX3_1, ABCC4, KLK3, FKBP5, ELL2, UGT2B15, DHCR24, PPAP2A, NDRG1, LRIG1, CREB3L4, LCP1, GUCY1A3, AR y EAF2.
14. El procedimiento de la reivindicación 13, en el que
el conjunto de genes diana de la vía de Wnt incluye además al menos un gen diana seleccionado del grupo que comprende: NKD1, OAT, FAT1, LEF1, GLUL, REG1B, TCF7L2, COL18A1, BMP7, SLC1A2, ADRA2C, PPARG, DKK1, HNF1A y LECT2,
y/o
el conjunto de genes diana de la vía de ER incluye además al menos un gen diana seleccionado del grupo que comprende: AP1B1, ATP5J, COL18A1, COX7A2L, EBAG9, ESR1, HSPB1, IGFBP4, KRT19, MYC, NDUFV3, PISD, PRDM15, PTMA, RARA, SOD1 y TRIM25,
y/o
el conjunto de genes diana de la vía de HH incluye además al menos un gen diana seleccionado del grupo que comprende: BCL2, FOXA2, FOXF1, H19, HHIP, IL1R2, JAG2, JUP, MIF, MYLK, NKX2.2, NKX2.8, PITRM1 y TOM1,
y/o
el conjunto de genes diana de la vía de AR incluye además al menos un gen diana seleccionado del grupo que comprende: APP, NTS, PLAU, CDKN1A, DRG1, FGF8, IGF1, PRKACB, PTPN1, SGK1 y TACC2.
15. Un aparato que comprende un procesador digital (12) configurado para realizar un procedimiento como se establece en una cualquiera de las reivindicaciones 1-14.
16. Un medio de almacenamiento no transitorio que almacena instrucciones que son ejecutables por un dispositivo de procesamiento digital (12) para realizar un procedimiento como se establece en una cualquiera de las reivindicaciones 1-14.
17. Un programa informático que comprende los medios de código de programa para hacer que un dispositivo de procesamiento digital (12) realice un procedimiento como se establece en una cualquiera de las reivindicaciones 1-14.
18. Un producto para determinar los niveles de expresión de uno o más genes diana como se menciona en una cualquiera de las reivindicaciones 2-9 y 12-14, en el que el producto comprende un aparato como se menciona en la reivindicación 15, un medio de almacenamiento no transitorio como se menciona en la reivindicación 16, o un programa informático como se menciona en la reivindicación 17.
19. El producto de la reivindicación 18, que comprende además los cebadores y/o las sondas para determinar los niveles de expresión del uno o más genes diana.
20. El producto de la reivindicación 18 o 19, en el que el producto es un kit o una micromatriz.
21. El producto de la reivindicación 20, en el que el kit es un kit de PCR, preferentemente un kit de qPCR, un kit de secuenciación de ARN o un kit de micromatriz.
22. El producto de una cualquiera de las reivindicaciones 18-21, en el que el producto es para su uso para inferir la actividad de una vía de señalización celular.
ES13831865T 2012-12-26 2013-12-18 Evaluación de la actividad de la vía de señalización celular mediante el uso de una o más combinaciones lineales de expresiones de genes diana Active ES2878196T3 (es)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US201261745839P 2012-12-26 2012-12-26
PCT/IB2013/061066 WO2014102668A2 (en) 2012-12-26 2013-12-18 Assessment of cellular signaling pathway activity using linear combination(s) of target gene expressions;

Publications (1)

Publication Number Publication Date
ES2878196T3 true ES2878196T3 (es) 2021-11-18

Family

ID=50156797

Family Applications (1)

Application Number Title Priority Date Filing Date
ES13831865T Active ES2878196T3 (es) 2012-12-26 2013-12-18 Evaluación de la actividad de la vía de señalización celular mediante el uso de una o más combinaciones lineales de expresiones de genes diana

Country Status (13)

Country Link
US (2) US11306360B2 (es)
EP (1) EP2938745B1 (es)
JP (2) JP6449779B2 (es)
KR (1) KR102279844B1 (es)
CN (2) CN105074005A (es)
AU (2) AU2013368945B2 (es)
BR (1) BR112015015131A2 (es)
CA (1) CA2896414C (es)
DK (1) DK2938745T3 (es)
ES (1) ES2878196T3 (es)
MX (1) MX2015008177A (es)
RU (1) RU2721130C2 (es)
WO (1) WO2014102668A2 (es)

Families Citing this family (39)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
TWI648273B (zh) 2013-02-15 2019-01-21 英商葛蘭素史克智慧財產發展有限公司 作為激酶抑制劑之雜環醯胺類(三)
CA2909991A1 (en) 2013-04-26 2014-10-30 Koninklijke Philips N.V. Medical prognosis and prediction of treatment response using multiple cellular signalling pathway activities
CN105492630A (zh) 2014-01-03 2016-04-13 皇家飞利浦有限公司 使用靶基因表达的数学建模评价pi3k细胞信号传导途径活性
BR112017007962A2 (pt) * 2014-10-24 2018-01-23 Koninklijke Philips Nv método implementado por computador, aparelho, mídia de armazenamento, programa de computador, kit, e, uso do kit
EP3210143B1 (en) 2014-10-24 2020-12-09 Koninklijke Philips N.V. Medical prognosis and prediction of treatment response using multiple cellular signaling pathway activities
CA2965442A1 (en) 2014-10-24 2016-04-28 Koninklijke Philips N.V. Assessment of tgf-b cellular signaling pathway activity using mathematical modelling of target gene expression
ES2861400T3 (es) * 2015-08-14 2021-10-06 Koninklijke Philips Nv Evaluación de la actividad de la ruta de señalización celular de NFkB usando modelos matemáticos de la expresión de genes diana
US20190128899A1 (en) * 2016-06-13 2019-05-02 Koninklijke Philips N.V. Method for inferring activity of a transcription factor of a signal transduction pathway in a subject
AU2017360887B2 (en) * 2016-11-17 2023-01-19 Nant Holdings Ip, Llc Validation of inferred anticancer pathways
EP3763732A1 (en) 2016-11-25 2021-01-13 Koninklijke Philips N.V. Method to distinguish tumor suppressive foxo activity from oxidative stress
EP3431582A1 (en) 2017-07-18 2019-01-23 Koninklijke Philips N.V. Cell culturing materials
EP3461915A1 (en) 2017-10-02 2019-04-03 Koninklijke Philips N.V. Assessment of jak-stat1/2 cellular signaling pathway activity using mathematical modelling of target gene expression
EP3461916A1 (en) 2017-10-02 2019-04-03 Koninklijke Philips N.V. Assessment of jak-stat3 cellular signaling pathway activity using mathematical modelling of target gene expression
EP3462349A1 (en) 2017-10-02 2019-04-03 Koninklijke Philips N.V. Assessment of notch cellular signaling pathway activity using mathematical modelling of target gene expression
WO2019068623A1 (en) 2017-10-02 2019-04-11 Koninklijke Philips N.V. DETERMINING THE FUNCTIONAL STATE OF TYPES OF IMMUNE CELLS AND AN IMMUNE RESPONSE
EP3502279A1 (en) * 2017-12-20 2019-06-26 Koninklijke Philips N.V. Assessment of mapk-ap 1 cellular signaling pathway activity using mathematical modelling of target gene expression
CN108187050A (zh) * 2018-01-18 2018-06-22 石河子大学 抑制食管癌细胞增殖的药物
JP2021533787A (ja) * 2018-08-17 2021-12-09 ジェネンテック, インコーポレイテッド 乳がんの処置のための診断的および治療的方法
EP3812474A1 (en) 2019-10-22 2021-04-28 Koninklijke Philips N.V. Methods of prognosis in high-grade serous ovarian cancer
WO2020225155A1 (en) 2019-05-03 2020-11-12 Koninklijke Philips N.V. Methods of prognosis in high-grade serous ovarian cancer
EP3739588A1 (en) 2019-05-13 2020-11-18 Koninklijke Philips N.V. Assessment of multiple signaling pathway activity score in airway epithelial cells to predict airway epithelial abnormality and airway cancer risk
EP3822368A1 (en) 2019-11-14 2021-05-19 Koninklijke Philips N.V. Assessment of pr cellular signaling pathway activity using mathematical modelling of target gene expression
EP3835433A1 (en) 2019-12-12 2021-06-16 Koninklijke Philips N.V. Notch signaling pathway activity as prognostic marker in bladder cancer
CN111166884B (zh) * 2020-01-15 2021-12-03 广州中医药大学第一附属医院 Foxf1基因在制备用于骨质疏松症药物中的应用
EP3882363A1 (en) 2020-03-17 2021-09-22 Koninklijke Philips N.V. Prognostic pathways for high risk sepsis patients
EP3978628A1 (en) 2020-10-01 2022-04-06 Koninklijke Philips N.V. Prognostic pathways for viral infections
WO2021209567A1 (en) 2020-04-16 2021-10-21 Koninklijke Philips N.V. Prognostic pathways for viral infections
EP3940704A1 (en) 2020-07-14 2022-01-19 Koninklijke Philips N.V. Method for determining the differentiation state of a stem cell
EP3960875A1 (en) 2020-08-28 2022-03-02 Koninklijke Philips N.V. Pcr method and kit for determining pathway activity
EP3965119A1 (en) 2020-09-04 2022-03-09 Koninklijke Philips N.V. Methods for estimating heterogeneity of a tumour based on values for two or more genome mutation and/or gene expression related parameter, as well as corresponding devices
EP3974540A1 (en) 2020-09-25 2022-03-30 Koninklijke Philips N.V. Method for predicting immunotherapy resistance
EP4015651A1 (en) 2020-12-17 2022-06-22 Koninklijke Philips N.V. Treatment prediction and effectiveness of anti-tnf alpha treatment in ibd patients
CN112466403B (zh) * 2020-12-31 2022-06-14 广州基迪奥生物科技有限公司 一种细胞通讯分析方法及系统
EP4039825A1 (en) 2021-02-09 2022-08-10 Koninklijke Philips N.V. Comparison and standardization of cell and tissue culture
EP4305206A1 (en) 2021-03-11 2024-01-17 Koninklijke Philips N.V. Prognostic pathways for high risk sepsis patients
CN114015709B (zh) * 2021-11-04 2023-04-25 塔里木大学 绵羊ctsd基因在调控初情期启动中的应用
WO2023084039A1 (en) 2021-11-15 2023-05-19 Innosign B.V. Assessment of gr cellular signaling pathway activity using mathematical modelling of target gene expression
CN114703227B (zh) * 2022-01-27 2023-11-10 中国科学院生态环境研究中心 基于MCF-7细胞系构建的RARα效应物体外筛选方法
WO2024033063A1 (en) 2022-08-12 2024-02-15 Innosign B.V. Prediction and monitoring of immunotherapy in cancer

Family Cites Families (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
AU2003260973A1 (en) 2002-09-05 2004-03-29 Toolgen, Inc. Bioinformatics analysis of cellular effects of artificial transcription factors
EP1668354A2 (en) * 2003-09-24 2006-06-14 Oncotherapy Science, Inc. Method of diagnosing breast cancer
US8594941B2 (en) 2003-11-26 2013-11-26 Selventa, Inc. System, method and apparatus for causal implication analysis in biological networks
CN101194260A (zh) * 2005-01-24 2008-06-04 利兰·斯坦福青年大学托管委员会 使用贝叶斯网络建立细胞信号传导系统模型的方法
CA2651929A1 (en) 2006-05-17 2007-11-29 Timothy S. Gardner Method to determine transcriptional regulation pathways in organisms
WO2008033571A2 (en) * 2006-09-15 2008-03-20 Memorial Sloan Kettering Cancer Center Methods of diagnosing, treating, or preventing plasma cell disorders
US7629125B2 (en) 2006-11-16 2009-12-08 General Electric Company Sequential analysis of biological samples
CA2673133C (en) * 2006-12-22 2016-08-30 Clf Medical Technology Acceleration Program, Inc. Nanoparticle and polymer formulations for thyroid hormone analogs, antagonists, and formulations and uses thereof
AU2008324203A1 (en) * 2007-11-05 2009-05-14 Novartis Ag Methods and compositions for measuring Wnt activation and for treating Wnt-related cancers
US8483970B2 (en) * 2008-09-29 2013-07-09 The Trustees Of Columbia University In The City Of New York Method for identifying aQTL regions whose genotype modulates transcription factor activity
US10192641B2 (en) 2010-04-29 2019-01-29 The Regents Of The University Of California Method of generating a dynamic pathway map
KR101903547B1 (ko) * 2010-04-29 2018-10-04 더 리젠츠 오브 더 유니버시티 오브 캘리포니아 게놈 모델에 대한 데이터 통합을 이용하는 경로 인지 알고리즘 (paradigm)
EP2663323B1 (en) * 2011-01-14 2017-08-16 The General Hospital Corporation Methods targeting mir-128 for regulating cholesterol/lipid metabolism
WO2012147016A1 (en) 2011-04-26 2012-11-01 Koninklijke Philips Electronics N.V. Diagnostic brain imaging
EP2549399A1 (en) 2011-07-19 2013-01-23 Koninklijke Philips Electronics N.V. Assessment of Wnt pathway activity using probabilistic modeling of target gene expression

Also Published As

Publication number Publication date
CN105074005A (zh) 2015-11-18
AU2020202706B2 (en) 2022-06-16
EP2938745B1 (en) 2020-10-07
JP2019076096A (ja) 2019-05-23
US20150347672A1 (en) 2015-12-03
US20230030858A1 (en) 2023-02-02
BR112015015131A2 (pt) 2017-07-11
RU2721130C2 (ru) 2020-05-18
CA2896414A1 (en) 2014-07-03
EP2938745A2 (en) 2015-11-04
JP2016509472A (ja) 2016-03-31
RU2015131009A (ru) 2017-01-30
DK2938745T3 (da) 2020-11-30
WO2014102668A2 (en) 2014-07-03
WO2014102668A3 (en) 2014-08-21
CA2896414C (en) 2023-06-20
KR102279844B1 (ko) 2021-07-21
AU2020202706A1 (en) 2020-05-14
JP6721665B2 (ja) 2020-07-15
CN111961726A (zh) 2020-11-20
AU2013368945B2 (en) 2020-01-23
MX2015008177A (es) 2015-09-16
US11306360B2 (en) 2022-04-19
KR20150100896A (ko) 2015-09-02
AU2013368945A1 (en) 2015-08-13
JP6449779B2 (ja) 2019-01-09

Similar Documents

Publication Publication Date Title
ES2878196T3 (es) Evaluación de la actividad de la vía de señalización celular mediante el uso de una o más combinaciones lineales de expresiones de genes diana
ES2874452T3 (es) Evaluación de la actividad de la ruta de señalización celular usando modelos probabilísticos de la expresión del gen diana
AU2014259459B2 (en) Medical prognosis and prediction of treatment response using multiple cellular signalling pathway activities