BR112014000965B1 - Método, aparelho e meio de armazenamento não transitório - Google Patents

Método, aparelho e meio de armazenamento não transitório Download PDF

Info

Publication number
BR112014000965B1
BR112014000965B1 BR112014000965-1A BR112014000965A BR112014000965B1 BR 112014000965 B1 BR112014000965 B1 BR 112014000965B1 BR 112014000965 A BR112014000965 A BR 112014000965A BR 112014000965 B1 BR112014000965 B1 BR 112014000965B1
Authority
BR
Brazil
Prior art keywords
pathway
tissue
activity
wnt
medical material
Prior art date
Application number
BR112014000965-1A
Other languages
English (en)
Other versions
BR112014000965B8 (pt
BR112014000965A2 (pt
Inventor
Wilhelmus Franciscus Johannes Verhaegh
Anja Van De Stolpe
Hendrik Jan Van Ooijen
Kalyana Chakravarthi Dulla
Marcia Alves De India
Ralf Hoffmann
Original Assignee
Koninklijke Philips N.V.
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Koninklijke Philips N.V. filed Critical Koninklijke Philips N.V.
Publication of BR112014000965A2 publication Critical patent/BR112014000965A2/pt
Publication of BR112014000965B1 publication Critical patent/BR112014000965B1/pt
Publication of BR112014000965B8 publication Critical patent/BR112014000965B8/pt

Links

Images

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B5/00ICT specially adapted for modelling or simulations in systems biology, e.g. gene-regulatory networks, protein interaction networks or metabolic networks
    • G16B5/20Probabilistic models
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B5/00ICT specially adapted for modelling or simulations in systems biology, e.g. gene-regulatory networks, protein interaction networks or metabolic networks
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6809Methods for determination or identification of nucleic acids involving differential detection
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6876Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
    • C12Q1/6883Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material
    • C12Q1/6886Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material for cancer
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N5/00Computing arrangements using knowledge-based models
    • G06N5/04Inference or reasoning models
    • G06N5/048Fuzzy inferencing
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B20/00ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B20/00ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
    • G16B20/20Allele or variant detection, e.g. single nucleotide polymorphism [SNP] detection
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B20/00ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
    • G16B20/30Detection of binding sites or motifs
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B25/00ICT specially adapted for hybridisation; ICT specially adapted for gene or protein expression
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B40/00ICT specially adapted for biostatistics; ICT specially adapted for bioinformatics-related machine learning or data mining, e.g. knowledge discovery or pattern finding
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B40/00ICT specially adapted for biostatistics; ICT specially adapted for bioinformatics-related machine learning or data mining, e.g. knowledge discovery or pattern finding
    • G16B40/20Supervised data analysis
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/106Pharmacogenomics, i.e. genetic variability in individual responses to drugs and drug metabolism
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/112Disease subtyping, staging or classification
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/158Expression markers

Landscapes

  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Chemical & Material Sciences (AREA)
  • Biotechnology (AREA)
  • General Health & Medical Sciences (AREA)
  • Biophysics (AREA)
  • Medical Informatics (AREA)
  • Theoretical Computer Science (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Molecular Biology (AREA)
  • Evolutionary Biology (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Analytical Chemistry (AREA)
  • Genetics & Genomics (AREA)
  • Organic Chemistry (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Data Mining & Analysis (AREA)
  • Immunology (AREA)
  • Software Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Evolutionary Computation (AREA)
  • Artificial Intelligence (AREA)
  • Physiology (AREA)
  • Microbiology (AREA)
  • Biochemistry (AREA)
  • Public Health (AREA)
  • Epidemiology (AREA)
  • Databases & Information Systems (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Bioethics (AREA)
  • Pathology (AREA)
  • Probability & Statistics with Applications (AREA)
  • Oncology (AREA)
  • Hospice & Palliative Care (AREA)
  • Mathematical Physics (AREA)

Abstract

MÉTODO, E APARELHO. O presente pedido de patente principalmente refere-se a métodos específicos para inferir a atividade de uma ou mais via(s) de sinalização celular no tecido de um indivíduo sob avaliação médica, pelo menos com base no(s) nível(is) de expressão de um ou mais gene(s)-alvo da(s) via(s) de sinalização celular medido(s) em uma amostra extraída do tecido do material médico, um aparelho compreendendo um compressor digital configurado para realizar tais métodos e um meio de armazenamento não-transitório armazenando instruções que são executáveis por um dispositivo de processamento digital para realizar tais métodos.

Description

[0001] A matéria descrita neste documento refere-se à bioinformática, técnicas de processamento genômico, técnicas de processamento proteômico, e técnicas relacionadas.
[0002] As análises genômicas e proteômicas possuem aplicações substanciais realizadas e potenciais promessas para aplicação clínica em campos médicos como oncologia, onde diversos cânceres são conhecidos por estarem associados a combinações específicas de mutações/variações genômicas e/ou níveis de expressão altos ou baixos para genes específicos, o que desempenha um papel no crescimento e na evolução do câncer, por exemplo, proliferação celular e metástase. Por exemplo, a via de sinalização Wnt afeta a regulação de proliferação celular, e é altamente regulada. A alta atividade da via Wnt devido à perda de regulação tem sido correlacionada a câncer, dentre os quais com tumores de cólon malignos. Embora não esteja limitada a nenhuma teoria de operação específica, acredita-se que a desregulação da via Wnt em células de cólon malignas leva a alta atividade da via Wnt que, por sua vez, causa a proliferação celular das células de cólon malignas, isto é, propagação do câncer de cólon. Por outro lado, a atividade da via anormalmente baixa pode também ser de interesse, por exemplo, no caso de osteoporose.
[0003] Tecnologias para adquirir dados genômicos e proteômicos têm se tornado prontamente disponíveis na prática clínica. Por exemplo, medições por microarranjos são rotineiramente empregadas para avaliar níveis de expressão gênica, níveis de proteína, metilação, e assim por diante. O sequenciamento de genes automatizado permite umaidentificação de bom custo-benefício de variações genéticas em DNA e mRNA. A avaliação quantitativa dos níveis de mRNA durante o sequenciamento é uma promessa de ainda outra ferramenta clínica para avaliar níveis de expressão gênica.
[0004] Apesar destes (ou, talvez devido a estes)avanços, a aplicação clínica de análises genômicas e proteômicas enfrenta um grande obstáculo - a sobrecarga de dados. Por exemplo, o número de mutações identificáveis em uma única amostra clínica pode estar na casa das centenas ou dos milhares ou mais. A maioria destas mutações são chamadas de mutações de espectador sem contribuição específica ao crescimento do câncer, e apenas poucas contribuem para o crescimento do câncer e a evolução funcional, e estas apresentam os alvos para o tratamento eficaz. Um único microarranjo pode gerar níveis de expressão gênica para dezenas de milhares de genes. O processamento destas grandes quantidades de dados para identificar informações úteis, como, por exemplo, na aplicação da escolha da terapia correta, é difícil.
[0005] Uma abordagem é limitar a análise apoucos testes canônicos ou padronizados, tal como testes aprovados pela U.S. Food and Drug Administration (FDA). Em tal abordagem, um indicador específico ou combinação de indicadores (por exemplo, mutações, e/ou níveis de expressão gênica altos ou baixos é detectado para testar “positivo para a condição de doença indicada (por exemplo, um tipo específico de câncer). O teste canônico é confirmado por estudos clínicos que têm mostrado forte correlação com a condição de doença ou com eficácia de tratamento. Esta abordagem é útil apenas para as condições clínicas para as quais um testes canônico foi desenvolvido, por exemplo, diagnóstico específico de uma doença, ou previsão de uma resposta a um fármaco em um tipo de câncer específico em um estágio específico, e também é rígida, uma vez que é somente aplicável para as condições canônicas.
[0006] Outra abordagem é baseada na identificação de grupos funcionalmente relacionados de indicadores genômicos ou proteômicos. Por exemplo, a via Wnt compreende uma cascata de reações proteômicas. Componentes principais desta cadeia incluem (mas não são limitados a) a ligação da proteína de sinalização Wnt a um receptor de superfície frisada da célula, o que causa a ativação de proteínas da família desgrenhada de proteínas que, por sua vez, impacta o nível de agentes de transcrição, tais como complexos de proteína à base de β-catenina/TCF4 no núcleo da célula. Estes agentes de transcrição, por sua vez, controlam a transcrição de moléculas de mRNA-alvo que, por sua vez, são traduzidas em proteínas-alvo da via Wnt. Estudos clínicos têm mostrado algumas correlações entre proteínas reguladoras da via Wnt e a atividade da via Wnt.
[0007] Entretanto, a aplicação de tais resultados de estudo clínico ao diagnóstico e à avaliação clínica de um paciente específico é difícil devido à complexidade de vias de sinalização, por exemplo, a via Wnt. Como um simples exemplo, a medição do nível de expressão de uma proteína que está a “montante” na via Wnt pode não detectar o comportamento anormal de uma proteína que está a “jusante” na via Wnt. Acredita-se que a via Wnt inclui diversos mecanismos de realimentação, e o conceito simplificado de “montante” e “jusante” pode não ser aplicável para uma porção substancial da via Wnt; mais geralmente, o comportamento anormal em uma porção da cascata de proteína compreendendo a via Wnt pode ter mais ou menos efeito em outras porções da cascata de proteína, e na atividade da via Wnt como um todo. Mais ainda, em alguns estudos clínicos, os níveis de expressão de proteína para proteínas reguladoras da cascata de sinalização são avaliados medindo os níveis de expressão de mRNA dos genes que codificam para as proteínas reguladoras. Esta é uma medição indireta que pode avaliar de maneira imprecisa o nível de expressão de proteína reguladora, e dificilmente reflete a quantidade de proteínas ativas (após uma modificação pós-traducional específica como fosforilação).
[0008] O problema principal subjacente à presente invenção foi, assim, prover métodos e meios adequados para realizar análises genômicas e, respectivamente, proteômicas. Aspectos específicos do problema subjacente, bem como objeções adicionais em conexão com a presente invenção, se tornam aparentes ao estudar a descrição, os exemplos providos neste documento e, em particular, ao estudar as reivindicações apensas.
[0009] A presente invenção provê métodos e aparelhos novos e melhorados conforme revelado neste documento.
[0010] De acordo com um aspecto principal da presente invenção, o problema acima é resolvido por um método específico para avaliar a atividade de via de sinalização celular utilizando modelagem probabilística de expressão de gene-alvo, a saber, um método compreendendo:
[0011] a inferência da atividade de uma ou mais via(s) de sinalização celular no tecido de um material médico, pelo menos com base no(s) nível(is) de expressão (em particular, no mRNA e/ou nível de proteína) de um ou mais gene(s)-alvo da(s) via(s) de sinalização celular medido(s) em uma amostra extraída do tecido do material médico, em que a inferência compreende:
[0012] a inferência da atividade da(s) via(s) de sinalização celular no tecido do material médico através da avaliação de pelo menos uma porção de um modelo probabilístico, preferivelmente uma rede Bayesiana, representando a(s) via(s) de sinalização celular para um conjunto de entradas incluindo pelo menos o(s) nível(is) de expressão de um ou mais genes-alvo da(s) via(s) de sinalização celular medido(s) na amostra extraída do tecido do material médico;
[0013] a estimativa de um nível no tecido do material médico de pelo menos um elemento de fator de transcrição (TF), o pelo menos um elemento de TF controlando a transcrição de um ou mais gene(s)-alvo da(s) via(s) de sinalização celular, a estimativa sendo baseada, pelo menos em parte, em probabilidades condicionais referentes a pelo menos um elemento de TF e o(s) nível(is) de expressão do(s) um ou mais gene(s)-alvo da(s) via(s) de sinalização celular medidas na amostra extraída do tecido do material médico; e
[0014] a inferência da atividade da(s) via(s) de sinalização celular com base no nível estimado na amostra de tecido do fator de transcrição; e
[0015] a determinação da(s) via(s) desinalização celular estar/estarem ou não operando de maneira anormal no tecido do material médico com base na atividade inferida da(s) via(s) de sinalização celular no tecido do material médico;
[0016] em que a inferência é realizada por umdispositivo de processamento digital utilizando o modelo probabilístico da(s) via(s) de sinalização celular.
[0017] O(s) “gene(s)-alvo” podem ser “genes-alvodiretos” e/ou “genes-alvo indiretos” (conforme descrito neste documento).
[0018] Preferivelmente, a inferência compreendea estimativa de um nível no tecido do material médico de pelo menos um elemento de fator de transcrição (TF) representadopor um nó de TF do modelo probabilístico, o elemento de TFcontrolando a transcrição de um ou mais gene(s)-alvo da(s) via(s) de sinalização celular, a estimativa sendo baseada, pelo menos em parte, em probabilidades condicionais do modelo probabilístico relacionadas ao nó de TF e nós no modelo probabilístico representando o(s) um ou mais gene(s)-alvo da(s) via(s) de sinalização celular medidas na amostra extraída do tecido do material médico.
[0019] O modelo probabilístico pode ser ummodelo de rede Bayesiana. Assim, de acordo com uma realização preferida, a inferência é realizada utilizando uma rede Bayesiana compreendendo nós representando informações sobre a(s) via(s) de sinalização e relações de probabilidade condicional entre nós conectados da rede Bayesiana.
[0020] A(s) via(s) de sinalização celularpode(m) ser uma via Wnt, uma via de ER (Receptor de Estrogênio), uma via de AR (Receptor de Andrógeno) e/ou uma via Hedgehog. Assim, de acordo com uma realização preferida, a(s) via(s) de sinalização celular compreende(m) uma via Wnt, uma via de ER, uma via de AR e/ou uma via Hedgehog.
[0021] Genes-alvo particularmente adequados são descritos nas seguintes passagens de texto, bem como nos exemplos abaixo (ver, por exemplo, Tabelas 1 a 9).
[0022] Assim, de acordo com uma realização preferida, o(s) gene(s)-alvo é/são selecionado(s) do grupo que compreende ou consiste em genes-alvo listados na Tabela 1 ou na Tabela 6 (para a via Wnt), genes-alvo listados na Tabela 2, Tabela 5 ou Tabela 7 (para via de ER), genes-alvo listados na Tabela 3 ou Tabela 8 (para via Hedgehog) e genesalvo listados na Tabela 4 ou Tabela 9 (para via de AR).
[0023] É particularmente preferido um método em que a inferência compreende:
[0024] a inferência da atividade de uma via Wnt no tecido do material médico com base pelo menos em níveis de expressão de um ou mais, preferivelmente pelo menos três, gene(s)-alvo da via Wnt medidos na amostra extraída do tecido do material médico selecionado a partir do grupo que compreende ou consiste em: KIAA1199, AXIN2, RNF43, TBX3, TDGF1, SOX9, ASCL2, IL8, SP5, ZNRF3, KLF6, CCND1, DEFA6 e FZD7.
[0025] É também preferido um método em que a inferência é adicionalmente baseada em níveis de expressão de pelo menos um gene-alvo da via Wnt medidos na amostra extraída do tecido do material médico selecionado a partir do grupo que compreende ou consiste em: NKD1, OAT, FAT1, LEF1, GLUL, REG1B, TCF7L2, COL18A1, BMP7, SLC1A2, ADRA2C, PPARG, DKK1, HNF1A e LECT2.
[0026] É particularmente preferido um método emque a inferência (também) compreende:
[0027] a inferência da atividade de uma via deER no tecido do material médico com base pelo menos em níveis de expressão de um ou mais, preferivelmente pelo menos três, gene(s)-alvo da via de ER medidos na amostra extraída do tecido do material médico selecionado a partir do grupo que compreende ou consiste em: CDH26, SGK3, PGR, GREB1, CA12, XBP1, CELSR2, WISP2, DSCAM, ERBB2, CTSD, TFF1 e NRIP1.
[0028] É também preferido um método em que ainferência é adicionalmente baseada em níveis de expressão de pelo menos um gene-alvo da via de ER medidos na amostra extraída do tecido do material médico selecionado a partir do grupo que compreende ou consiste em: AP1B1, ATP5J, COL18A1, COX7A2L, EBAG9, ESR1, HSPB1, IGFBP4, KRT19, MYC, NDUFV3, PISD, PREDM15, PTMA, RARA, SOD1 e TRIM25.
[0029] Um método em que a inferência (também)compreende
[0030] a inferência da atividade de uma viaHedgehog no tecido do material médico com base pelo menos em níveis de expressão de um ou mais, preferivelmente pelo menos três, gene(s)-alvo da via Hedgehog medidos na amostra extraída do tecido do material médico selecionado a partir do grupo que compreende ou consiste em: GLI1, PTCH1, PTCH2,IGFBP6, SPP1, CCND2, FST, FOXL1, CFLAR, TSC22D1, RAB34, S100A9, S100A7, MYCN, FOXM1, GLI3, TCEA2, FYN e CTSL1,
[0031] também é preferido.
[0032] É também preferido um método em que ainferência é adicionalmente baseada em níveis de expressão de pelo menos um gene-alvo da via Hedgehog medidos na amostra extraída do tecido do material médico selecionado a partir do grupo que compreende ou consiste em: BCL2, FOXA2, FOXF1, H19, HHIP, IL1R2, JAG2, JUP, MIF, MYLK, NKX2.2, NKX2.8, PITRM1 eTOM1.
[0033] Um método em que a inferência (também)compreende
[0034] a inferência da atividade de uma via deAR no tecido do material médico com base pelo menos em níveis de expressão de um ou mais, preferivelmente pelo menos três, gene(s)-alvo da via de AR medidos na amostra extraída do tecido do material médico selecionado a partir do grupo que compreende ou consiste em: KLK2, PMEPA1, TMPRSS2, NKX3_1,ABCC4, KLK3, FKBP5, ELL2, UGT2B15, DHCR24, PPAP2A, NDRG1, LRIG1, CREB3L4, LCP1, GUCY1A3, AR e EAF2,
[0035] também é preferido.
[0036] É também preferido um método em que ainferência é adicionalmente baseada em níveis de expressão de pelo menos um gene-alvo da via de AR medidos na amostra extraída do tecido do material médico selecionado a partir do grupo que compreende ou consiste em: APP, NTS, PLAU, CDKN1A, DRG1, FGF8, IGF1, PRKACB, PTPN1, SGK1 e TACC2.
[0037] Outro aspecto da presente invençãorefere-se a um método (conforme descrito neste documento), adicionalmente compreendendo:
[0038] a recomendação de prescrição de umfármaco para o material médico que corrige a operação anormal da(s) via(s) de sinalização celular;
[0039] em que a recomendação é realizada apenas se for determinado que a(s) via(s) de sinalização celular está/estão operando de maneira anormal no tecido do material médico com base na atividade inferida da(s) via(s) de sinalização celular.
[0040] A presente invenção também se refere a um método (conforme descrito neste documento) compreendendo:
[0041] a inferência da atividade de uma via Wnt no tecido de um material médico pelo menos com base em níveis de expressão de dois, três ou mais genes-alvo de um conjunto de genes-alvo da via Wnt medidos em uma amostra extraída do tecido do material médico
[0042] e/ou
[0043] a inferência da atividade de uma via de ER no tecido de um material médico pelo menos com base em níveis de expressão de dois, três ou mais genes-alvo de um conjunto de genes-alvo da via de ER medidos em uma amostra extraída do tecido do material médico
[0044] e/ou
[0045] a inferência da atividade de uma via Hedgehog no tecido de um material médico pelo menos com base em níveis de expressão de dois, três ou mais genes-alvo de um conjunto de genes-alvo da via Hedgehog medidos em uma amostra extraída do tecido do material médico
[0046] e/ou
[0047] a inferência da atividade de uma via de AR no tecido de um material médico pelo menos com base em níveis de expressão de dois, três ou mais genes-alvo de um conjunto de genes-alvo da via de AR medidos em uma amostra extraída do tecido do material médico.
[0048] Preferivelmente,
[0049] o conjunto de genes-alvo da via Wntinclui pelo menos nove, preferivelmente todos os genes-alvo selecionados a partir do grupo que compreende ou consiste em: KIAA1199, AXIN2, RNF43, TBX3, TDGF1, SOX9, ASCL2, IL8, SP5, ZNRF3, KLF6, CCND1, DEFA6 e FZD7,
[0050] e/ou
[0051] o conjunto de genes-alvo da via de ERinclui pelo menos nove, preferivelmente todos os genes-alvo selecionados a partir do grupo que compreende ou consiste em: CDH26, SGK3, PGR, GREB1, CA12, XBP1, CELSR2, WISP2, DSCAM, ERBB2, CTSD, TFF1 e NRIP1,
[0052] e/ou
[0053] o conjunto de genes-alvo da via Hedgehoginclui pelo menos nove, preferivelmente todos os genes-alvo selecionados a partir do grupo que compreende ou consiste em: GLI1, PTCH1, PTCH2, IGFBP6, SPP1, CCND2, FST, FOXL1, CFLAR, TSC22D1, RAB34, S100A9, S100A7, MYCN, FOXM1, GLI3, TCEA2, FYNe CTSL1,
[0054] e/ou
[0055] o conjunto de genes-alvo da via de ARinclui pelo menos nove, preferivelmente todos os genes-alvo selecionados a partir do grupo que compreende ou consiste em: KLK2, PMEPA1, TMPRSS2, NKX3_1, ABCC4, KLK3, FKBP5, ELL2,UGT2B15, DHCR24, PPAP2A, NDRG1, LRIG1, CREB3L4, LCP1, GUCY1A3, AR e EAF2.
[0056] Um método em que
[0057] o conjunto de genes-alvo da via Wntadicionalmente inclui pelo menos um gene-alvo selecionado a partir do grupo que compreende ou consiste em: NKD1, OAT, FAT1, LEF1, GLUL, REG1B, TCF7L2, COL18A1, BMP7, SLC1A2, ADRA2C, PPARG, DKK1, HNF1A e LECT2,
[0058] e/ou
[0059] o conjunto de genes-alvo da via de ERadicionalmente inclui pelo menos um gene-alvo selecionado a partir do grupo que compreende ou consiste em: AP1B1, ATP5J, COL18A1, COX7A2L, EBAG9, ESR1, HSPB1, IGFBP4, KRT19, MYC, NDUFV3, PISD, PREDM15, PTMA, RARA, SOD1 e TRIM25,
[0060] e/ou
[0061] o conjunto de genes-alvo da via Hedgehogadicionalmente inclui pelo menos um gene-alvo selecionado a partir do grupo que compreende ou consiste em: BCL2, FOXA2, FOXF1, H19, HHIP, IL1R2, JAG2, JUP, MIF, MYLK, NKX2.2, NKX2.8, PITRM1 e TOM1,
[0062] e/ou
[0063] o conjunto de genes-alvo da via de ARadicionalmente inclui pelo menos um gene-alvo selecionado a partir do grupo que compreende ou consiste em: APP, NTS, PLAU, CDKN1A, DRG1, FGF8, IGF1, PRKACB, PTPN1, SGK1 e TACC2,
[0064] é particularmente preferido.
[0065] A(s) amostra(s) a ser(em) utilizada(s),de acordo com a presente invenção pode(m) ser, por exemplo, uma amostra obtida de uma lesão mamária, ou de um cólon de um material médico conhecido por, ou com suspeita de, ter câncer de cólon, ou de um fígado de um material médico conhecido por, ou com suspeita de, ter câncer de fígado, ou assim por diante, preferivelmente através de um procedimento de biópsia ou outro procedimento de extração de amostra. O tecido do qual uma amostra é extraída pode também ser tecido metastático, por exemplo, tecido (suspeito por ser) maligno originário do cólon, da mama, do fígado, ou de outro órgão que se propagou para fora do cólon, da mama, do fígado, ou outro órgão. Em alguns casos, a amostra de tecido pode ser células tumorais em circulação, isto é, células tumorais que entraram na corrente sanguínea e podem ser extraídas como a amostra de tecido extraída utilizando técnicas de isolamento adequadas.
[0066] Outro aspecto revelado da presente invenção refere-se ao uso de meio de armazenamento não transitório, conforme descrito neste documento, ou um programa de computador, conforme descrito neste documento, para diagnóstico específico de uma doença ou previsão da resposta a um fármaco em um tipo de câncer específico em um estágio específico.
[0067] De acordo com outro aspecto revelado, um aparelho compreendendo um processador digital configurado para realizar um método de acordo com a invenção conforme descrito neste documento.
[0068] De acordo com outro aspecto revelado, um meio de armazenamento não transitório armazena instruções que são executáveis por um dispositivo de processamento digital para realizar um método de acordo com a invenção conforme descrito neste documento. O meio de armazenamento não transitório pode ser um meio de armazenamento legível por computador, tal como um disco rígido ou outro meio de armazenamento magnético, um disco óptico ou outro meio de armazenamento óptico, uma memória de acesso aleatório (RAM), memória somente de leitura (ROM), memória flash, ou outro meio de armazenamento eletrônico, um servidor de rede, e assim por diante. O dispositivo de processamento digital pode ser um dispositivo portátil (por exemplo, um assistente de dados pessoal ou smartphone), um computador notebook, um computador de mesa, um computador ou dispositivo tablet, um servidor de rede remoto, e assim por diante.
[0069] De acordo com outro aspecto revelado, um programa de computador compreende meios de código de programa para fazer com que um dispositivo de processamento digital realize um método de acordo com a invenção conforme descrito neste documento. O dispositivo de processamento digital pode ser um dispositivo portátil (por exemplo, um assistente de dados pessoal ou smartphone), um computador notebook, um computador de mesa, um computador ou dispositivo tablet, um servidor de rede remoto, e assim por diante.
[0070] Uma vantagem reside em um sistema de apoio a decisões clínicas (CDS) provendo recomendações clínicas com base em análises probabilísticas de uma ou mais via(s) de sinalização celular, por exemplo, utilizando um modelo de rede Bayesiana de via Wnt, uma via de ER, uma via de AR e/ou uma via Hedgehog.
[0071] Outra vantagem reside na melhor avaliação da atividade de via de sinalização celular que é menos suscetível a erros.
[0072] Outra vantagem reside na provisão de um sistema de CDS recomendando tratamento direcionado para perda de regulação de uma via de sinalização celular.
[0073] Outra vantagem reside na provisão de um sistema de CDS que é projetado para detectar perda de regulação para uma via de sinalização celular específica, tal como uma via Ent, uma via de ER, uma via de AR ou uma via Hedgehog, e é prontamente adaptado para prover recomendações para diferentes tipos de câncer originados por essa via desinalização celular específica.
[0074] A presente invenção conforme descritaneste documento pode, por exemplo, ser vantajosamenteutilizada em conexão com
[0075] diagnóstico baseado em atividade prevista(inferida);
[0076] prognóstico baseado em atividade prevista(inferida);
[0077] prescrição de fármaco baseada ematividade prevista (inferida);
[0078] previsão de eficácia de fármaco baseadaem atividade prevista (inferida ) ;
[0079] previsão de efeitos adversos baseada ematividade prevista (inferida);
[0080] monitoramento de eficácia de fármaco;
[0081] desenvolvimento de fármaco ;
[0082] desenvolvimento de ensaio;
[0083] pesquisa de vias;
[0084] estadiamento do câncer;
[0085] inscrição do indivíduo em um ensaioclínico com baseado em atividade prevista (inferida);
[0086] seleção do teste posterior a serrealizado, e/ou;
[0087] seleção de testes de diagnósticosassociados.
[0088] Vantagens adicionais se tornarãoaparentes aos técnicos no assunto após ler e compreender as figuras apensas, a seguinte descrição e, em particular, após ler os exemplos detalhados providos neste documento abaixo.
[0089] A Figura 1 mostra uma rede Bayesiana simples representando parte de uma via de sinalização celular. A via de sinalização celular é simbolizada por um complexo de fator de transcrição (TF) e os genes-alvo produzidos como um resultado do complexo de fator de transcrição estando presente. A relação probabilística entre o elemento de TF e um gene-alvo no caso da discretização binária pode ser representada por uma tabela de probabilidade condicional conforme ilustrado no diagrama.
[0090] A Figura 2 mostra uma rede Bayesiana ilustrativa descrevendo uma via de sinalização celular hipotética. Tanto as proteínas a montante quanto os nós de mRNA-alvo a jusante são ilustrados no diagrama. As proteínas a montante servem como entrada no complexo de fator de transcrição, enquanto que os mRNAs-alvo são os nós de saída do complexo de fator de transcrição.
[0091] A Figura 3 mostra um exemplo ilustrativo de uma representação de rede Bayesiana de uma única via de sinalização celular com múltiplos complexos de fator de transcrição ou múltiplas vias de sinalização celular com seu próprio complexo de fator de transcrição combinado em uma rede Bayesiana ou uma combinação dos mesmos.
[0092] A Figura 4 mostra um exemplo de uma rede Bayesiana ilustrando uma representação simples de uma via de sinalização celular similar à Figura 1. Agora, nós adicionais foram anexados para representar a tradução do mRNA-alvo em proteínas-alvo.
[0093] A Figura 5 mostra uma ilustração de uma rede Bayesiana ilustrando outra representação simples de uma via de sinalização celular. A via é representada utilizando o complexo de fator de transcrição e seus níveis de proteína- alvo .
[0094] A Figura 6 mostra a rede Bayesiana ilustrativa da Figura 1 com uma camada adicional de nós representando os conjuntos de sondas em um chip de microarranjo conectando as intensidades das sondas aos níveis de mRNA-alvo correspondentes.
[0095] A Figura 7 mostra um exemplo ilustrativo de uma realização variante da rede Bayesiana da Figura 1 que inclui nós representando metilação e variações de número de cópia como exemplos para nós de informação adicionais para, neste exemplo específico, qualquer um dos níveis de mRNA-alvo incluídos.
[0096] A Figura 8 mostra uma atividade de via de Wnt da rede Bayesiana e método centroide mais próximo conforme descrito neste documento em um conjunto de dados de amostras de cólon (GSE20916).
[0097] A Figura 9 mostra uma atividade de via de Wnt da rede Bayesiana e método centroide mais próximo conforme descrito neste documento em um conjunto de dados de amostras de cólon (GSE4183).
[0098] A Figura 10 mostra uma atividade de via de Wnt da rede Bayesiana e método centroide mais próximo conforme descrito neste documento em um conjunto de dados de amostras de cólon (GSE15960).
[0099] A Figura 11 mostra uma atividade de via de Wnt da rede Bayesiana e método centroide mais próximo conforme descrito neste documento em um conjunto de dados de amostras de câncer de mama (GSE12777).
[0100] A Figura 12 mostra uma atividade de via de Wnt da rede Bayesiana e método centroide mais próximo conforme descrito neste documento em um conjunto de dados de amostras de câncer de mama (GSE21653).
[0101] A Figura 13 mostra uma atividade de via de Wnt da rede Bayesiana e método centroide mais próximo conforme descrito neste documento em um conjunto de dados de amostras de câncer de fígado (GSE9843).
[0102] A Figura 14 mostra uma atividade de via de Wnt da rede Bayesiana e utilizando os genes-alvo da lista curada de evidências em comparação com os genes-alvo da ampla lista da literatura conforme descrito neste documento em um conjunto de dados de amostras de cólon (GSE20916).
[0103] A Figura 15 mostra uma atividade de via de Wnt da rede Bayesiana e utilizando os genes-alvo da lista curada de evidências em comparação com os genes-alvo da ampla lista da literatura conforme descrito neste documento em um conjunto de dados de amostras de cólon (GSE4183).
[0104] A Figura 16 mostra uma atividade de via de Wnt da rede Bayesiana e utilizando os genes-alvo da lista curada de evidências em comparação com os genes-alvo da ampla lista da literatura conforme descrito neste documento em um conjunto de dados de amostras de cólon (GSE15960).
[0105] A Figura 17 mostra uma atividade de via de Wnt da rede Bayesiana e utilizando os genes-alvo da lista curada de evidências em comparação com os genes-alvo da ampla lista da literatura conforme descrito neste documento em um conjunto de dados de amostras de câncer de mama (GSE12777).
[0106] A Figura 18 mostra uma atividade de via de Wnt da rede Bayesiana e utilizando os genes-alvo da lista curada de evidências em comparação com os genes-alvo da ampla lista da literatura conforme descrito neste documento em um conjunto de dados de amostras de câncer de fígado (GSE9843).
[0107] A Figura 19 mostra uma atividade de via de Wnt da rede Bayesiana e utilizando os genes-alvo da lista curada de evidências em comparação com os genes-alvo da ampla lista da literatura conforme descrito neste documento em um conjunto de dados de amostras de meduloblastoma (GSE10327).
[0108] A Figura 20 esquematicamente mostra um sistema de apoio a decisões clínicas (CDS) configurado para avaliar uma ou mais via(s) de sinalização celular conforme revelado neste documento (exemplarmente mostrado para a via Wnt).
[0109] A Figura 21 mostra uma atividade de via Wnt prevista em amostras do cólon de GSE4183.
[0110] A Figura 22 mostra uma atividade de via Wnt prevista em amostras de meduloblastoma de GSE10327.
[0111] A Figura 23 mostra uma atividade de via Wnt prevista em amostras de câncer de fígado de GSE9843.
[0112] A Figura 24 mostra uma atividade de via Wnt prevista em linhas celulares de câncer de mama de GSE12777.
[0113] A Figura 25 mostra uma atividade de via de ER prevista em linhas celulares de câncer de mama de GSE12777.
[0114] A Figura 26 mostra uma atividade de via de ER prevista em amostras de câncer de mama de GSE12276.
[0115] A Figura 27 mostra uma atividade de via de ER prevista em linhas celulares de câncer de GSE36133.
[0116] A Figura 28 mostra uma atividade de viaHedgehog prevista em linhas celulares de câncer de GSE34211.
[0117] A Figura 29 mostra uma atividade de viaHedgehog prevista em amostras de meduloblastoma de GSE10327.
[0118] A Figura 30 mostra uma atividade de viaHedgehog prevista em amostras de câncer de mama de GSE12276.
[0119] A Figura 31 mostra uma atividade de viade ER prevista em linhas celulares resistentes a MCF7 e Tamoxifeno de GSE21618.
[0120] A Figura 32 mostra uma atividade de viade ER prevista em uma série de tempo de amostras de linha celular de MCF7 estimulada com estrogênio de GSE11324.
[0121] A Figura 33 mostra a atividade de viaWnt, ER e Hedgehog em amostras de luminal A de GSE12276.
[0122] A Figura 34 mostra a atividade de viaWnt, ER e Hedgehog em amostras basais de GSE12276.
[0123] A Figura 35 mostra uma atividade de viaWnt prevista em amostras do cólon de GSE20916.
[0124] A Figura 36 mostra uma atividade de viade ER prevista em linhas celulares de MCF7 estimuladas com estrogênio (E2) ou um controle negativo (EtOH) (GSE9253).
[0125] A Figura 37 mostra curvas desobrevivência de Kaplan-Meier de pacientes do conjunto de dados GSE12276 agrupados de acordo com a atividade da via.
[0126] A Figura 38 mostra uma atividade de viade AR prevista em linhas celulares de LNCaP tratadas com diferentes regimes de tratamento de GSE7708.
[0127] A Figura 39 mostra uma atividade de viade AR prevista em amostras de câncer de próstata de GSE17951.
[0128] A Figura 40 mostra uma atividade de viade AR prevista em amostras de câncer de mama de GSE12276.
[0129] A Figura 41 mostra uma atividade de viade AR no conjunto de dados de GSE36133 contendo amostras delinha celular representando diversos tipos de câncer.
[0130] A Figura 42 mostra uma atividade de viade AR no conjunto de dados de GSE34211 contendo amostras delinha celular representando diversos tipos de câncer.
[0131] Os seguintes exemplos meramente ilustrammétodos particularmente preferidos e aspectos selecionados emconexão com os mesmos. Os ensinamentos providos neste documento podem ser utilizados para construir diversos testes e/ou kits, por exemplo, para detectar, prever e/ou diagnosticar a atividade anormal de uma ou mais vias de sinalização celular. Além disso, após utilizar os métodos conforme descritos neste documento, a prescrição do fármaco pode vantajosamente ser guiada, a previsão do fármaco e o monitoramento da eficácia do fármaco (e/ou efeitos adversos) podem ser feitos, a resistência ao fármaco pode ser prevista e monitorada, por exemplo, para selecionar teste(s) subsequente(s) a serem realizados (como um teste de diagnóstico associado). Os seguintes exemplos não devem ser interpretados como limitativos do escopo da presente invenção.EXEMPLO 1: CONSTRUÇÃO DE REDE BAYESIANA
[0132] Conforme revelado neste documento, aoconstruir um modelo probabilístico (por exemplo, o modelo Bayesiano ilustrativo mostrado na Figura 6) e incorporar relações probabilísticas entre níveis de expressão de uma série de genes-alvo diferentes e a atividade da via de sinalização celular, tal modelo pode ser utilizado para determinar a atividade da via de sinalização celular com um alto grau de precisão. Além disso, o modelo probabilístico pode ser prontamente atualizado para incorporar conhecimento adicional obtido por estudos clínicos posteriores, ao ajustar as probabilidades condicionais e/ou adicionar novos nós ao modelo para representar fontes de informações adicionais. Desta maneira, o modelo probabilístico pode ser atualizado conforme apropriado para incorporar o conhecimento médico mais recente.
[0133] Um dos modelos de rede Bayesiana mais simples para representar uma via de sinalização celular seria um modelo de dois níveis incluindo o elemento de fator de transcrição e os genes-alvo associados (ver Figura 1). O elemento de complexo de fator de transcrição é uma representação do nível do complexo do fator de transcrição. O nível de proteína do elemento de fator de transcrição é conectado a uma série de níveis de mRNA dos genes-alvo do fator de transcrição (nesta rede Bayesiana exemplar, apenas três genes-alvo são ilustrados, os quais são conhecidos por serem expressos no tecido no caso do fator de transcrição estar disponível). Deve-se entender que muitos, a maioria, ou todos os genes-alvo da via (no caso das vias Wnt, ER, Hedgehog e Ar, particularmente os genes mencionados na Tabela 1, Tabela 2, Tabela 3 e Tabela 4, respectivamente) são analogamente regulados pelo elemento de TF. As relações entre o nível do elemento de TF e os níveis de mRNA dos genes-alvo são modeladas na rede Bayesiana pelas bordas. Para cada um dos genes-alvo, uma distribuição probabilística condicional especifica como o nível de mRNA do gene depende do nível do elemento de TF.
[0134] Os níveis do elemento de TF e genes-alvo podem ser representados de diversas maneiras. Uma opção é utilizar uma discretização binária, em estados “ausente” e “presente” para o elemento de TF, e “baixo” e “alto” para o nível de mRNA do gene-alvo (ver Figura 1). A relação probabilística entre o elemento de TF e um gene-alvo pode, então, ser representada por uma tabela de probabilidade condicional (conforme indicado na mesma figura). Em vez de uma discretização binária, os níveis podem também ser representados como valores de nível contínuo, ou como valores quantizados tendo três ou mais níveis de quantização (por exemplo, “baixo”, “normal”, e “alto” para genes-alvo).
[0135] A ilustração anterior de uma rede Bayesiana simples é apenas uma realização ilustrativa do modelo da rede Bayesiana (Figura 1). Em geral, um modelo de rede Bayesiana compreende um gráfico direcionado acíclico compreendendo nós conectados por bordas. Cada nó representa um item de informações pertencente à via em questão (ou, de maneira mais geral, à via de sinalização celular). Os nós de elemento de via representam, cada um, um elemento genômico ou proteômico da via de sinalização celular. A título de exemplo ilustrativo, um nó de elemento de via pode representar um dentre, mas sem restrições: uma proteína, um complexo de proteína, uma molécula de mRNA transcrita de um gene-alvo da via de sinalização celular, um gene metilado, uma proteína fosforilada, um complexo de proteína fosforilada, e assim por diante. Conforme discutido posteriormente neste documento, diversos outros tipos de nós, mas não limitados aos exemplos dados, podem ser incluídos na rede Bayesiana para representar outros tipos de informações, tal como elementos de dado de medição específico, ocorrências de variação, e assim por diante.
[0136] Os níveis a “montante” adicionais representando proteínas reguladoras (em estado ativo ou inativo) da via são tipicamente adicionados se o conhecimento do nível de tal proteína poder ser probatório para determinar a recomendação de apoio a decisão clínica. Por exemplo, a inclusão das proteínas elementares ao fator de transcrição ou proteínas essenciais a montante do fator de transcrição na rede Bayesiana (ver Figura 2) poderia ser útil se um fármaco estiver disponível que especificamente vise tais proteínas, em vez da via como um todo. Acredita-se que o elemento de fator de transcrição (TF) é um complexo de proteína (isto é, uma combinação de proteínas ligadas entre si em uma estrutura específica que realiza a função de regular a transcrição de genes-alvo) na maioria das vias de sinalização. Para outras vias, o elemento de TF pode ser uma única proteína. Além disso, as vias de sinalização podem exercer suas atividades através de mais de um fator de transcrição, resultando em uma rede Bayesiana mais complexa com diversos fatores de transcrição alimentando o(s) gene(s)-alvo (ver Figura 3 para uma ilustração hipotética de diversos elementos de fator de transcrição influenciando a transcrição de gene-alvo). Tal rede Bayesiana de múltiplo fator de transcrição pode também ser o resultado de uma combinação de vias combinadas em uma rede Bayesiana.
[0137] Nós de informações adicionais mais a jusante dos genes-alvo podem ser incluídos na rede Bayesiana também. Um exemplo ilustrativo disto é a tradução do mRNA do gene-alvo em proteínas (Figura 4) ou nós de nível de proteína do gene-alvo como nó substituto do nível de MRNA do gene-alvo (Figura 5). As moléculas de mRNA do gene-alvo são traduzidas por interação com moléculas de ribossomo para formar proteínas correspondentes às moléculas de mRNA e correspondentes aos genes-alvo. Esta é a expressão dos genesalvo no nível de proteína. A medição do nível de proteína através de, entre outras, por exemplo, técnicas de espectrometria de massa, imunohistoquímica, eletroforese em gel, pode atuar como evidência para estes níveis de proteína- alvo .
[0138] O nível de expressão de um gene-alvo podeser computado com base na intensidade medida de conjuntos de sonda correspondentes de um microarranjo, por exemplo, ao tirar a média ou por outros meios de outras técnicas (por exemplo, sequenciamento de RNA). Em algumas realizações, esta computação é integrada na rede Bayesiana, ao estender a redeBayesiana com um nó para cada conjunto de sondas que é utilizado e incluindo uma borda que vai até cada um destesnós de “medição” a partir do nó de gene-alvo correspondente, conforme descrito neste documento em referência à Figura 6.
[0139] O modelo probabilístico podeopcionalmente também incorporar informações genômicas adicionais, tais como informações sobre mutações, variações de número de cópias, expressão gênica, metilação, informações de translocação, e assim por diante, as quais alteram as sequências genômicas que são relacionadas à cascata de sinalização da via para inferir a atividade da via e localizar o defeito na via Wnt que causa o funcionamento aberrante (ativação ou inatividade), conforme descrito em referência ilustrativa à Figura 7 para o caso ilustrativo de metilação e dados de número de cópias. Entretanto, deve ser entendido que outros tipos de informações referentes ao gene- alvo são analogamente traduzidas em nós de informações. Tais informações genômicas podem estar disponíveis através de, entre outros, sequenciamento de RNA e análise de SNP.
[0140] Além disso, deve ser entendido que, embora os exemplos descritos adiante neste documento referentes às vias Wnt, ER, AR e Hedgehog sejam providos como exemplos ilustrativos, as abordagens para a análise de via de sinalização celular reveladas neste documento são prontamente aplicadas a outras vias de sinalização celular além destas vias, tal como às vias de sinalização intracelular com receptores na membrana celular (por exemplo, as vias de sinalização de Entalhe, HER2/PI3K, TGFbeta, EGF, VEGF, e TNF- NFkappaB) e vias de sinalização intracelular com receptores dentro da célula (por exemplo, vias de sinalização celular de progesterona, ácido retinoico, e vitamina D).EXEMPLO 2: COMPARAÇÃO DE MÉTODOS DE APRENDIZAGEM DE MÁQUINA
[0141] Aqui, o desempenho de duas técnicas de aprendizagem de máquina é comparado entre si com a via Wnt tomada como um caso de exemplo: a previsão da atividade de Wnt por meio de um método centroide mais próximo é comparada com o método de escolha de acordo com a presente invenção, o qual, por exemplo, usa uma rede Bayesiana.
[0142] Conforme discutido acima, a abordagem de rede Bayesiana foi selecionada com base em suas vantagens que residem na abordagem probabilística ser capaz de incorporar as informações disponíveis em forma “mole”, por exemplo, porcentagens de indivíduos do estudo exibindo características probatórias, ou “dura”, utilizando relações probabilísticas condicionais. Além disso, o modelo probabilístico também permite que as informações sejam incorporadas com base em conhecimento parcial (em vez de completo) da via de sinalização celular subjacente, novamente através do uso de tabelas de probabilidade condicional.
[0143] Aqui, é demonstrado que os inventores agregaram valor na maneira em que eles incluíram propriedades biológicas conhecidas e a disponibilidade de evidências moles utilizando uma rede Bayesiana em comparação com outros métodos de aprendizagem de máquina, por exemplo, classificação centroide mais próxima, um método bem conhecido. A classificação centroide mais próxima é um método de aprendizagem de máquina onde, para cada classe de amostras de treinamento, um perfil de média (= centroide) é computado, e em seguida, para uma amostra a ser classificada, o rótulo é previsto com base no centroide que está mais próximo (o rótulo do centroide mais próximo é, então o resultado da previsão). Os dois centroides são calculados na mesma lista de conjuntos de sondas utilizada na rede Bayesiana, e, para o centroide 'Wnt ligado' e 'Wnt desligado', eles são baseados nas amostras de adenoma e amostras de cólon normais, respectivamente, dos mesmos dados processados de fRMA de GSE8671. A relação de log2 das duas distâncias Euclideanas entre uma amostra e os dois centroides foi posteriormente utilizada para classificar amostras de diversos conjuntos de dados para inferir a classificação das amostras. Isto significa que uma relação de log2 de 0 corresponde a uma distância igual da amostra até os dois centroides, um valor > 0 corresponde a uma amostra classificada como sinalização de Wnt ativo, enquanto que um valor < 0 corresponde a uma amostra identificada possuindo uma via de sinalização de Wnt inativa.
[0144] A rede Bayesiana foi construída similar à Figura 6 e ao procedimento descrito neste documento. Analogamente a esta descrição da rede Bayesiana de Wnt, as tabelas de probabilidade condicional das bordas entre conjuntos de sondas e seus respectivos genes foram treinadas utilizando dados processados por fRMA de 32 amostras de cólon normais e 32 amostras de adenoma do conjunto de dados GSE8671 do Gene Expression Omnibus (acessível em http://www.ncbi.nlm.nih.gov/geo/, último acesso em 13 de julho de 2011). A rede Bayesiana treinada foi, em seguida, testada em diversos conjuntos de dados para inferir a probabilidade P(Wnt Ligado) de que a via Wnt está “ligada”, isto é, ativa, a qual é tomada igual à probabilidade inferida de que o complexo de transcrição da via Wnt está “presente”.
[0145] A rede Bayesiana treinada e o modelo centroide mais próximo foram, em seguida, testados em diversos conjuntos de dados de microarranjo processados por fRMA para inferir a probabilidade de que a via Wnt está “ligada”, medida por P(Wnt Ligado) e relação log2 das distâncias. Os resumos dos resultados da rede Bayesiana e do modelo centroide mais próximo são mostrados nas Figuras 8 a 13. O leitor deve observar que as métricas de saída dos dois métodos não são uma relação um-para-um, entretanto, o sinal e a magnitude relativa das métricas de saída dentro de um método são comparáveis.
[0146] A grande maioria das amostras de (câncer de) cólon (GSE20916, GSE4183) é classificada igualmente entre a via Wnt ativa e inativa, exceto para GSE15960 que teve uma alta fração de amostras erroneamente classificadas negativas no método centroide mais próximo (falsos negativos). Esta percepção de uma maior fração de falsos negativos é mantida nos outros tipos de câncer também. Isto é especialmente verdadeiro para amostras de câncer de mama (GSE12777, GSE21653) e câncer de fígado (GSE9843); exceto por poucas exceções, todas as amostras estão previstas para ter uma via Wnt inativa, o que é conhecido por estar incorreto no caso das amostras de câncer de mama de tipo basal e de câncer de fígado CTNNB1. Em alguns casos, evidente, por exemplo, em GSE15960, a classificação poderia ser corrigida diminuindo e aumentando o limiar da classificação de centroide mais próximo. A ideia por trás disto seria que o limiar da atividade de Wnt poderia ser alterado em diferentes tipos de tecido. Entretanto, isto envolveria treinamento adicional do método de centroide mais próximo para ser aplicável a outros tipos de tecido. Uma das forças do modelo de rede Bayesiana é que este treinamento específico a tecido não é necessário, uma vez que é estabelecido como sendo não específico em relação ao tipo de tecido.EXEMPLO 3: SELEÇÃO DE GENES-ALVO
[0147] Um fator de transcrição (TF) é um complexo de proteína (isto é, uma combinação de proteínas ligadas entre si em uma estrutura específica) ou uma proteína que é capaz de regular a transcrição de genes-alvo ligando-se a sequências de DNA específicas, assim, controlando a transcrição de informações genéticas de DNA para mRNA. O mRNA diretamente produzido devido a esta ação do complexo de transcrição é chamado neste documento de “gene-alvo direto”. A ativação de via pode também resultar em mais transcrição gênicas secundárias, chamadas de “genes-alvo indiretos”. A seguir, modelos de rede Bayesiana (como modelosprobabilísticos exemplares) compreendendo ou consistindo em genes-alvo diretos, como ligações diretas entre a atividade de via e o nível de mRNA, são preferidos, entretanto, a distinção entre genes-alvo diretos e indiretos não é sempre evidente. Aqui, um método para selecionar genes-alvo diretos utilizando uma função de pontuação baseada em dados da literatura disponíveis é apresentado. No entanto, a seleção acidental de genes-alvo indiretos não pode ser descartada devido a informações limitadas e variações biológicas e incertezas
[0148] Genes-alvo de mRNA de vias específicasforam selecionados a partir dentre a literatura científica, utilizando um sistema de classificação no qual a evidência científica para um gene-alvo específico recebia uma classificação dependendo do tipo de experimentos científicos nos quais as evidências foram acumuladas. Embora alguma evidência seja meramente sugestiva de ser um gene-alvo, como, por exemplo, um mRNA aumentando em um microarranjo de um embrião, no qual é sabido que a via Hedgehog está ativa, outras evidências podem ser muito fortes, como a combinação de um sítio de ligação a fator de transcrição da via identificada e a obtenção deste sítio em um ensaio de imunoprecipitação em cromatina (ChIP) após estimulação da via específica na célula e aumento em mRNA após estimulação específica da via em uma linha celular.
[0149] Diversos tipos de experimentos para encontrar genes-alvo de via específica podem ser identificados na literatura científica:
[0150] Experimentos de ChIP, nos quais a ligação direta de um fator de transcrição de via a seu sítio de ligação no genoma é mostrada. Exemplo: Utilizando tecnologia de imunoprecipitação em cromatina (ChIP), posteriormente, sítios de ligação de fator de transcrição TCF4 funcionais putativos no DNA de linhas celulares de cólon com e sem via Wnt ativa foram identificados, como um subconjunto dos sítios de ligação reconhecidos puramente com base em sequência nucleotídica. A funcionalidade putativa foi identificada como evidência derivada de ChIP de que o fator de transcrição demonstrou se ligar ao sítio de ligação de DNA.
[0151] Ensaios de Deslocamento de Mobilidade Eletroforética (EMSA), os quais mostram a ligação in vitro de um fator de transcrição a um fragmento de DNA contendo a sequência de ligação. Comparadas com as evidências baseadas em ChIP, as evidências baseadas em EMSA são menos fortes, uma vez que não podem ser traduzidas à situação in vivo.
[0152] Estimulação da via e medição de perfis de mRNA em um microarranjo ou utilizando sequenciamento de RNA, utilizando linhas celulares induzíveis por via e medição de perfis de mRNA medidos em diversos pontos no tempo após a indução — na presença de cicloheximida, o que inibe a tradução à proteína, assim, supõe-se que os mRNAs induzidos são genes-alvo diretos.
[0153] Similar ao 3, mas utilizando PCR quantitativo para medir as quantidades de mRNAs.
[0154] Identificação de sítios de ligação a fator de transcrição no genoma utilizando uma abordagem de bioinformática. Exemplo para a via Wnt: Utilizando a sequência de ligação a DNA de fator de transcrição TCF4-beta catenina conhecida, um programa de software foi executado na sequência do genoma humano, e sítios de ligação em potencial foram identificados, tanto em regiões promotoras de gene quanto em outras regiões genômicas.
[0155] Similar ao 3, apenas em ausência de cicloheximida.
[0156] Similar ao 4, apenas em ausência de cicloheximida.
[0157] Perfil de expressão de mRNA de amostras de tecido ou células específicas nas quais sabe-se que a via está ativa, entretanto, em ausência da condição de controle negativo adequada.
[0158] Na forma mais simples, pode-se dar todo ponto de mRNA 1-alvo em potencial para cada uma destas abordagens experimentais nas quais o mRNA-alvo foi identificado.
[0159] Alternativamente, os pontos podem ser dados gradativamente, o que significa que uma tecnologia, 1 ponto, segunda tecnologia adiciona um segundo ponto, e assim por diante. Utilizando esta estratégia de classificação relativa, pode-se fazer uma lista de genes-alvo mais confiáveis.
[0160] Alternativamente, a classificação de outra maneira pode ser utilizada para identificar os genesalvo que são mais prováveis de serem genes-alvo diretos, dando um número mais alto de pontos à tecnologia que provê mais evidências para um gene-alvo direto in vivo, na lista acima, isto significaria 8 pontos para a abordagem experimental 1), 7 a 2) e indo até um ponto para a abordagem experimental 8. Tal lista poderia ser chamada de “lista de genes-alvo geral”.
[0161] Apesar das variações biológicas e incertezas, os inventores presumiram que os genes-alvo diretos são mais prováveis de serem induzidos em uma maneira independente de tecido. Uma lista destes genes-alvo pode ser chamada “lista de genes-alvo curada por evidências”. Estas listas de alvos curadas têm sido utilizadas para construir modelos computacionais que podem ser aplicados a amostras provenientes de diferentes fontes de tecidos.
[0162] A “lista de genes-alvo geral” provavelmente contém genes que são mais específicos a tecido, e pode ser potencialmente utilizada para otimizar e aumentar a sensibilidade do modelo para aplicação em amostras de um tecido específico, como amostras de câncer de mama.
[0163] A seguir será ilustrado exemplarmente como a seleção de uma lista de genes-alvo curada por evidências especificamente foi construída para a via de ER.
[0164] Para o propósito de selecionar genes-alvo de ER utilizados como entrada para o “modelo”, os seguintes três critérios foram utilizados:
[0165] 1. A região promotora/potenciadora de gene contém um motivo de elemento de resposta a estrogênio (ERE):
[0166] a. Deve ser provado que o motivo de ERE responde ao estrogênio, por exemplo, por meio de um ensaio de transfecção transitória em que o motivo de ERE específico é ligado a um gene repórter, e
[0167] b. A presença do motivo de ERE deve ser confirmada, por exemplo, por uma análise de motivo enriquecida da região promotora/potenciadora de gene.
[0168] 2. ER (diferencialmente) se liga in vivo à região promotora/potenciadora do gene em questão, demonstrado, por exemplo, por um experimento de ChIP/CHIP ou um ensaio de imunoprecipitação em cromatina:
[0169] a. É provado que ER se liga à região promotora/potenciadora do gene quando a via de ER está ativa, e
[0170] b. (preferivelmente) não se liga (ou se liga fracamente) à região promotora/potenciadora do gene se a via de ER não estiver ativa.
[0171] 3. O gene é transcrito de maneira diferente quando uma via de ER está ativa, demonstrado, por exemplo, por
[0172] a. enriquecimento em vezes do mRNA do gene em questão através de PCR em tempo real, ou experimento de microarranjo, ou
[0173] b. a demonstração de que RNA Pol II se liga à região promotora do gene através de um ensaio de imunoprecipitação.
[0174] A seleção foi feita definindo como genesalvo de ER os genes para os quais evidências experimentais suficientes e bem documentadas foram obtidas provando que todos os três critérios mencionados acima foram atendidos. Um experimento adequado para coletar evidências de ligação diferencial a ER é comparar os resultados de, por exemplo, experimento ChIP/CHIP em uma linha celular de câncer que responde a estrogênio (por exemplo, a linha celular MCF-7), quando exposta ou não exposta a estrogênio. O mesmo vale para coletar evidências de transcrição de mRNA.
[0175] O disposto acima discute a abordagemgenérica e um exemplo mais específico do procedimento de seleção de gene-alvo que foi empregado para selecionar uma série de genes-alvo com base em evidências encontradas utilizando a abordagem acima mencionada. As listas de genes-alvo utilizadas nos modelos de rede Bayesiana para vias exemplares, a saber, as vias Wnt, ER, Hedgehog e AR, são mostradas na Tabela 1, Tabela 2, Tabela 3 e Tabela 4, respectivamente.
[0176] Os genes-alvo da via de ER utilizadospara o modelo da rede Bayesiana da via de ER descrito neste documento (mostrados na Tabela 2) contêm uma seleção de genes-alvo com base em suas pontuações de evidências na literatura; apenas os genes-alvo com as pontuações de evidência mais altas (genes-alvo preferidos de acordo com a invenção) foram adicionados a esta lista curta. A lista completa de genes-alvo de ER, incluindo também os genes com uma pontuação de evidências menor, é mostrada na Tabela 5.
[0177] Uma subseleção ou classificação adicionaldos genes-alvo das vias Wnt, ER, Hedgehog e Ar mostrados na Tabela 1, Tabela 2, Tabela 3 e Tabela 4, foi realizada com base em uma combinação da pontuação de evidências da literatura e as relações de probabilidade calculadas utilizando as tabelas de probabilidade condicional treinadas ligando os nós de conjunto de sondas aos nós de genes-alvocorrespondentes. A relação de probabilidade é uma avaliação da importância do gene-alvo na inferência da atividade das vias. Em geral, espera-se que o nível de expressão de um gene-alvo com uma relação de probabilidade maior seja mais provável de ser mais informativo quanto à atividade geral da via em comparação com genes-alvo com menores relações de probabilidade. Entretanto, devido á complexidade das vias de sinalização celular, deve-se entender que inter-relações mais complexas podem existir entre os genes-alvo e a atividade da via - por exemplo, a consideração de níveis de expressão de diversas combinações de genes-alvo com baixas relações de probabilidade pode ser mais probatória que a consideração de genes-alvo com maiores relações de probabilidade isolados. Na modelagem de Wnt, Hedgehog e AR relatada neste documento, foi descoberto que os genes-alvo mostrados na Tabela 6, Tabela 7, Tabela 8 e Tabela 9 são de uma natureza mais probatória para a previsão das atividades de via Wnt, ER, Hedgehog e AR em comparação com os genes-alvo de menor classificação (assim, os genes-alvo mostrados nas Tabelas 6 a 9 são particularmente preferidos de acordo com a presente invenção). No entanto, considerando a facilidade relativa com a qual tecnologias de aquisição, tal como microarranjos, podem adquirir níveis de expressão para grandes conjuntos de genes, é contemplado o uso de alguns ou todos os genes-alvo da Tabela 6, Tabela 7, Tabela 8 e Tabela 9, e opcionalmente adicionalmente utilizar um, dois, alguns ou todos os genes-alvo adicionais de classificações mostradas na Tabela 1, Tabela 2, Tabela 3 e Tabela 4, no modelo Bayesiano ilustrado na Figura 6.
[0178] Tabela 1. Lista curada por evidências de genes-alvo da via Wnt utilizada na rede Bayesiana e conjuntos de sondas associados para medir o nível de expressão de mRNA dos genes-alvo (n° = número de sequência na listagem desequência anexa).
Figure img0001
Figure img0002
Figure img0003
Figure img0004
[0179] Tabela 2. Lista curada por evidências degenes-alvo da via de ER utilizada na rede Bayesiana e conjuntos de sondas associados para medir o nível de expressão de mRNA dos genes-alvo (n° = número de sequência na listagem de sequência anexa).
Figure img0005
Figure img0006
Figure img0007
Figure img0008
[0180] Tabela 3. Lista curada por evidências de genes-alvo da via Hedgehog utilizada na rede Bayesiana e conjuntos de sondas associados para medir o nível de expressão de mRNA dos genes-alvo (n° = número de sequência na listagem de sequência anexa).
Figure img0009
Figure img0010
Figure img0011
Figure img0012
[0181] Tabela 4. Lista curada por evidências de genes-alvo da via de AR utilizada na rede Bayesiana e conjuntos de sondas associados para medir o nível de expressão de mRNA dos genes-alvo (n° = número de sequência na listagem de sequência anexa).
Figure img0013
Figure img0014
Figure img0015
[0182] Tabela 5. Símbolos de genes dos genes-alvo de ER que apresentaram evidências significativas na literatura (= lista longa de genes-alvo de ER) (n° = número de sequência na listagem de sequência anexa).
Figure img0016
Figure img0017
[0183] Tabela 6. Lista curta de genes-alvo deWnt com base em pontuação de evidências na literatura erelação de probabilidade (nº = número de sequência nalistagem de sequência anexa).
Figure img0018
Figure img0019
Figure img0020
[0184] Tabela 7. Lista curta de genes-alvo de ER com base em pontuação de evidências na literatura e relação de probabilidade (n° = número de sequência na listagem de sequência anexa).
Figure img0021
Figure img0022
[0185] Tabela 8. Lista curta de genes-alvo deHedgehog com base em pontuação de evidências na literatura e relação de probabilidade (n° = número de sequência na listagem de sequência anexa).
Figure img0023
Figure img0024
[0186] Tabela 9. Lista curta de genes-alvo de AR com base em pontuação de evidências na literatura e relação de probabilidade (n° = número de sequência na listagem de sequência anexa).
Figure img0025
Figure img0026
Figure img0027
EXEMPLO 4: COMPARAÇÃO ENTRE LISTA CURADA POREVIDÊNCIAS E LISTA DA AMPLA LITERATURA
[0187] A lista de genes-alvo de Wnt construídabaseada em evidências da literatura seguindo o procedimento descrito neste documento (Tabela 1) é comparada com outra lista de genes-alvo que não segue o procedimento mencionado acima. A lista alternativa é uma compilação de genes indicados por uma variedade de dados de diversas abordagens experimentais a ser um gene-alvo de Wnt publicados em três fontes públicas por laboratórios renomados, conhecidos por sua experiência na área de biologia molecular e com a via Wnt. A lista alternativa é uma combinação dos genes mencionados na tabela S3 de Hatzis et al. (Hatzis P, 2008), o texto e a tabela S1A de de Sousa e Melo (de Sousa E Melo F, 2011) e a lista de genes-alvo coletados e mantidos por Roel Nusse, um pioneiro no campo da sinalização de Wnt (Nusse, 2012). A combinação destas três fontes resultou em uma lista de 124 genes (= lista da ampla literatura, ver Tabela 10). Aqui, a questão do desempenho na previsão da atividade de Wntem amostras clínicas pelo algoritmo derivado desta lista alternativa ter um desempenho similar ou melhor comparado como modelo construído com base na lista existente de genes (= lista curada por evidências, Tabela 1) é discutida.
[0188] Tabela 10. Lista alternativa de genesalvo de Wnt (= lista da ampla literatura) (n° = número desequência na listagem de sequência anexa).
Figure img0028
Figure img0029
Figure img0030
Figure img0031
Figure img0032
Figure img0033
[0189] A próxima etapa consistiu na descobertados conjuntos de sondas da matriz Affymetrix® GeneChip Human Genome U133 Plus 2.0 que correspondessem com os genes. Este processo foi realizado utilizando o plugin Bioconductor em R e curadoria manual para a relevância dos conjuntos de sondas com base no navegador de genoma da UCSC, assim, removendo, por exemplo, conjuntos de sondas em filamentos opostos ou regiões de éxon de genes externos. Para dois dos 124 genes, não há conjuntos de sondas disponíveis neste chip de microarranjo e, portanto, não puderam ser inseridos na rede Bayesiana, estes são LOC283859 e WNT3A. No total, 287 conjuntos de sondas demonstraram corresponder aos 122 genes restantes (Tabela 11).
[0190] Tabela 11. Conjuntos de sondas associadosaos genes-alvo de Wnt na lista de genes da ampla literatura(n° = número de sequência na listagem de sequência anexa).
Figure img0034
Figure img0035
Figure img0036
Figure img0037
Figure img0038
[0191] Posteriormente, a rede Bayesiana foiconstruída similar à Figura 6 e ao procedimento explicado neste documento. Analogamente à descrição da rede Bayesiana de Wnt baseada na lista curada por evidências, as tabelas de probabilidade condicional das bordas entre conjuntos de sondas e seus respectivos genes, tanto a lista curada por evidências quanto a lista da ampla literatura, foram treinadas utilizando dados processados por fRMA de 32 amostras de cólon normais e 32 amostras de adenoma do conjunto de dados GSE8671 do Gene Expression Omnibus (acessível em http://www.ncbi.nlm.nih.gov/geo/, último acesso em 13 de julho de 2011).
[0192] As redes Bayesianas treinadas foram, emseguida, testadas em diversos conjuntos de dados para inferir a probabilidade P(Wnt Ligado) de que a via Wnt está “ligada”, isto é, ativa, a qual é tomada igual à probabilidade inferida de que o complexo de transcrição da via Wnt está “presente”. Os resultados resumidos do modelo da ampla literatura treinado e do modelo curado por evidências são mostrados nas Figuras 14 a 19.
[0193] Evidentemente, poderia ser deduzido que omodelo da ampla literatura geralmente prevê probabilidades mais extremas para a sinalização de Wnt estar ligada ou desligada. Além disso, o modelo alternativo prevê resultados similares para os conjuntos de dados de câncer de cólon (GSE20916, GSE4183, GSE15960), mas, mais do que esperado,amostras com a sinalização de Wnt prevista em conjuntos de dados de amostras de câncer de mama (GSE12777), câncer de fígado (GSE9843) e meduloblastoma (GSE10327).
[0194] Em conclusão, a lista de genes-alvo daampla literatura resulta em previsões aproximadamente igualmente boas de atividade de Wnt no câncer de cólon por um lado, mas previsões piores (muitos falsos positivos) em outros tipos de câncer por outro lado. Isto pode ser um resultado de a lista alternativa de genes-alvo estar muito enviesada em direção a células de cólon especificamente, assim, muito específica a tecido; o interesse principal de tanto Sousa E Melo et al. quanto Hatzis et al. foi câncer colorretal, embora genes-alvo de Wnt não específicos ao cólon possam ser incluídos. Além disso, genes-alvo não específicos a Wnt possivelmente incluídos nestas listas podem ser uma fonte das previsões pioradas da atividade de Wnt em outros tipos de câncer. A lista alternativa provavelmente contém genes-alvo regulados mais indiretamente, o que provavelmente a torna mais específica a tecido. A lista original é ajustada em direção a conter genes-alvo diretos, os quais são mais prováveis de representar genes que são sensíveis a Wnt em todos os tecidos, assim, reduzindo a especificidade de tecido.EXEMPLO 5: TREINAMENTO E USO DA REDE BAYESIANA
[0195] Antes de a rede Bayesiana poder serutilizada para inferir a atividade de vias em uma amostra de testes, os parâmetros descrevendo as relações probabilísticas entre os elementos de rede têm de ser determinados. Além disso, no caso de estados discretos das medições de entrada, é preciso estabelecer limiares que descrevam como fazer a discretização.
[0196] Tipicamente, as redes Bayesianas sãotreinadas utilizando um conjunto representativo de amostras de treino, das quais preferivelmente todos os estados de todos os nós de rede são conhecidos. Entretanto, não é muito prático obter amostras de treino de muitos tipos de cânceres diferentes, dos quais é sabido qual é o estado de ativação da via a ser modelada. Como resultado, os conjuntos de treino disponíveis consistem em um número limitado de amostras, tipicamente somente de um tipo de câncer. Pare permitir que a rede Bayesiana generalize bem a outros tipos de amostras, portanto, deve-se prestar atenção especial à maneira em que os parâmetros são determinados, o que é preferivelmente feito conforme a seguir, na abordagem descrita neste documento.
[0197] Para o nó de TF, a probabilidade(incondicional) de estar em estado “ausente” e “presente” é dada pela ocorrência esperada em um grande conjunto de amostras. Alternativamente, pode-se configurá-las a 0,5, como é feito na Figura 1, para não haver viés para um resultado positivo ou negativo.
[0198] Para os nós de gene-alvo, asprobabilidades condicionais são configuradas como na Figura 1. Se o elemento de TF estiver “ausente”, é mais provável queo gene-alvo está “baixo”, assim, uma probabilidade de 0,95 é escolhida para isto, e uma probabilidade de 0,05 para o gene-alvo estar “alto”. Esta última probabilidade (não zero) é para levar em consideração a (rara) possibilidade de que o gene-alvo é regulado por outros fatores ou acidentalmente observado “alto” (por exemplo, devido a ruídos de medição). Se o elemento de TF estiver “presente”, então, com uma probabilidade justa de 0,70, o gene está “alto”, e com uma probabilidade de 0,30, o gene-alvo está “baixo”. Estes últimos valores são escolhidos desta maneira porque pode haver diversas razões pelas quais um gene-alvo não é altamente expresso, embora o elemento de TF esteja presente, por exemplo, porque a região promotora do gene está metilada. No caso de um gene-alvo não ser regulado positivamente pelo elemento de TF, mas sim regulado negativamente, as probabilidades são escolhidas de maneira similar, mas refletindo a regulação negativa com a presença do elemento de TF.
[0199] Para o modelo de rede Bayesiana dado na Figura 6, onde as intensidades dos conjuntos de sondas formam as medições de entrada, deve-se finalmente determinar os parâmetros para discretização e para as tabelas de probabilidade condicional relacionando as intensidades dos conjuntos de sondas aos níveis de mRNA dos respectivos genes-alvo. Ambos são baseados em dados de treinamento na invenção atual. Para a discretização do nível de intensidade de um conjunto de sondas em estados “baixo” e “alto”, um limiar adequado é determinado, o qual melhor separe os valores de intensidade em um conjunto de amostras de treinamento, onde a via é ativada (amostras “ligadas”) a partir dos valores de intensidade em um conjunto de amostras de treino no qual ela não é (amostras “desligadas”). Finalmente, as tabelas de probabilidade condicional descrevendo as probabilidades de um conjunto de sondas ter uma intensidade “baixa” ou “alta” dependendo do estado “baixo” ou “alto” do respectivo gene- alvo são feitas contando o número de amostras “ligadas” e “desligadas” com um valor de intensidade do conjunto de sondas abaixo e acima do respectivo limiar. Isto é conhecido na literatura como a abordagem frequentista. Uma contagem fictícia é adicionada a cada grupo para evitar entradas nas tabelas de probabilidade condicional com um valor de zero, para evitar comportamento extremo da rede Bayesiana.
[0200] Após a rede Bayesiana ter sido treinada, ela pode ser aplicada em uma amostra de testes conforme a seguir, considerando a rede Bayesiana da Figura 6, e supondo que as medições de microarranjo relacionadas aos conjuntos desondas estão disponíveis. A primeira etapa é discretizar as medições de entrada comparando a intensidade de cada conjuntode sondas na amostra de testes com o respectivo limiar conforme descrito acima. Esta comparação pode ser feita de maneira concreta, configurando cada conjunto de sondas a intensidade “baixa” ou “alta” (chamada 'evidência concreta'), pode ser feita de maneira suave, supondo certa incerteza (ruído) na medição, definindo para cada conjunto de sondas uma probabilidade de estar “baixo” ou “alto” (chamada 'evidência suave'). Por exemplo, a evidência suave de um conjunto de sondas com uma intensidade logo abaixo do limiar pode ser uma probabilidade de 0,8 de estar “baixo” e uma probabilidade de 0,2 de estar “alto”, com base em uma estimativa adequada do ruído e a diferença ao limiar.
[0201] Em seguida, esta evidência concreta ousuave é fornecida a um mecanismo de inferência adequado para redes Bayesianas, por exemplo, com base em um algoritmo de árvore de junção (ver (Neapolitan, 2004)). Tal mecanismo pode, em seguida, inferir a probabilidade atualizada do elemento de TF estar “ausente” ou “presente”, considerando as evidências providas. A probabilidade inferida do elemento de TF estar “presente” é, então, interpretada como a probabilidade estimada de que a respectiva via está ativa.
[0202] Preferivelmente, o treinamento dosmodelos de rede Bayesiana das vias Wnt, ER, Hedgehog e AR é feito utilizando dados públicos disponíveis no Gene Expression Omnibus (acessível emhttp://www.ncbi.nlm.nih.gov/geo/, cf. acima).
[0203] A rede Bayesiana foi treinadaexemplarmente utilizando 32 amostras de cólon consideradas tendo uma via Wnt inativa e 32 amostras de adenoma confirmadas conhecidas por terem uma via Wnt ativa (conjunto de dados de GSE8671).
[0204] A rede Bayesiana da via de ER foiexemplarmente treinada utilizando 4 amostras de MCF7 privadas de estrogênio, conhecidas por terem uma via de ER, e 4 amostras de MCF7 estimuladas por estrogênio, consideradas tendo uma via de ER, a partir do conjunto de dados de GSE8597 também acessível no Gene expression Omnibus.
[0205] O modelo de rede Bayesiana da viaHedgehog foi exemplarmente treinado utilizando 15 amostras de carcinoma de células basais confirmados por terem uma via Hedgehog ativa e 4 amostras de células cutâneas normais representando amostras com uma via Hedgehog inativa disponível no conjunto de dados GSE7553.
[0206] O modelo de rede Bayesiana da via de ARfoi treinado exemplarmente utilizando 3 amostras com atividade de AR positiva, linhas celulares de LNCaP estimuladas com Dihidrotestosterona (DHT), um potente ativador de via de AR, e 3 linhas celulares de LNCaP não estimuladas representando o caso da via de AR inativa.
[0207] Em referência à Figura 35 e à Figura 36,os modelos de rede Bayesiana das vias Wnt e ER foram utilizados para prever as atividades de vias em amostras similares (amostras de cólon e linha celular de câncer de mama MCF7 para a rede Bayesiana de Wnt e Er, respectivamente) não utilizadas no procedimento de treinamento conforme descrito neste documento (nenhum conjunto de dados apropriado para a rede Bayesiana de Hedgehog foi encontrado). As atividades de via previstas da grande maioria das amostras deveriam estar em linha com as atividades de via clinicamente esperadas para o modelo a ser validado.
[0208] A Figura 35 mostra as atividades de Wnt previstas, ilustradas como o logit de P(Wnt ligado) no eixo vertical, para as amostras, ilustrado pelas barras no eixo horizontal, das amostras de cólon agrupadas por classificação, indicado pela cor das barras, no conjunto de dados de GSE20916. Todas as amostras de cólon normais são legitimamente previstas a ter uma via inativa (pontuação < 0), com base no fato de que se trata de uma amostra de tecido saudável. Todas menos quatro amostras consideradas tendo uma via ativa são previstas a ter uma via Wnt ativa.
[0209] Na Figura 36, os resultados de validação do modelo de rede Bayesiana de ER treinada são mostrados para dois microarranjos medidos utilizando uma amostra de linha celular de câncer de mama MCF7, um estimulado com estrogênio (E2) e o outro com um controle negativo (EtOH), originários do conjunto de dados de GSE9253. Em concordância com a atividade de ER alegada, a amostra estimulada com estrogênio é prevista a ter uma via de ER ativa, enquanto que o controle negativo prevê uma via de ER inativa.
[0210] Detalhes e exemplos adicionais para utilizar redes Bayesianas treinadas (por exemplo, das vias Wnt, ER, AR e Hedgehog) para prever as respectivas atividades de via são explicados no Exemplo 6 abaixo.
[0211] O processo de treinamento acima mencionado pode ser empregado em outras redes Bayesianas de aplicações clínicas. Aqui, ele é mostrado e comprovado funcionar para os modelos de rede Bayesiana construídos utilizando o método revelado neste documento representando vias de sinalização celular, mais especificamente as vias Wnt, ER, AR e Hedgehog.EXEMPLO 6: DIAGNÓSTICO DE ATIVIDADE DE VIA(ANORMAL)
[0212] O seguinte ilustrará exemplarmente comoutilizar, por exemplo, modelos de rede Bayesiana para diagnosticar a atividade de uma via de sinalização celular.
[0213] As redes Bayesianas das vias Wnt, ER,Hedgehog e AR, construídas utilizando um nó para a presença de fator de transcrição, uma camada de nós representando o mRNA dos genes-alvo e uma camada de nós representando as intensidades dos conjuntos de sondas correspondentes aos genes-alvo (Tabela 1, Tabela 2, Tabela 3 e Tabela 4), análogas à Figura 6 descrita neste documento, e treinados conforme descrito neste documento, foram utilizadas para prever a atividade das vias como “ligado”, isto é, ativa, ou “desligado”, isto é, inativa, em vários conjunto de dados não usados para treinamento previamente, para inferir o quão bem o componente de inferência opera. As pontuações de atividade de via são correlacionadas com o conhecimento clínico. Resumos de resultados para uma seleção de execuções de testes são mostrados nas Figuras 21 seq.
[0214] Em referência às Figuras 21 seq., osresultados de inferência da atividade de via para amostras de tecido médico utilizando o modelo de rede Bayesiana descrito neste documento são mostrados.
[0215] A Figura 21 mostra resultados para testesde atividade de Wnt no conjunto de dados de amostras de cólon GSE4183. O modelo de rede Bayesiana produziu valores altos de P(Wnt Ligado) para as amostras de adenoma, e baixos para amostras normais, o que corresponde com a (pato)fisiologia de adenoma e tecido saudável. O tecido saudável possui uma proliferação celular lenta e, assim, uma baixa atividade de Wnt relativa ao tecido adenomatoso, o que possui uma rápida proliferação celular e, assim, alta atividade de Wnt. Para as amostras de IBD, o modelo de rede Bayesiana apresentou baixa atividade de via Wnt (P(Wnt Ligado)~0) para todas as amostras, menos uma. Novamente, isto está consistente com as amostras de IBD não serem submetidas a rápida proliferação celular. Para as amostras de células de câncer colorretal, os resultados foram mistos, com alta atividade de via Wnt sendo detectada em cerca de metade destas amostras, mas isto pode ser um resultado de outras vias assumindo o papel de impulsionador de tumor quando o tecido adenomatoso benigno se torna tecido canceroso maligno, ou problemas de análise de amostra, por exemplo, a amostra contendo muito tecido não tumoral, ou o mRNA sendo parcialmente degradado
[0216] O modelo de rede Bayesiana utilizado nos experimentos relatados neste documento foi treinado utilizando o conjunto de dados de amostras GSE8671. Entretanto, a via Wnt está presente (embora possivelmente inativa) em outros tipos de células. Foi, portanto, considerado possível que a rede Bayesiana possa ser aplicável para inferir na atividade de via Wnt anormalmente alta correlativa com outros tipos de cânceres. O raciocínio para isto é que, embora o modelo de rede Bayesiana tenha sido treinado utilizando amostras de cólon, ele foi baseado em primeiros princípios da operação da via de Wnt presente (embora possivelmente inativa) em outros tipos de células. As Figuras 22 a 24 mostram alguns resultados investigando tais inferências “multi-tipos de tecido”.
[0217] A Figura 22 mostra resultados para testes utilizando o modelo de rede Bayesiana treinado utilizando amostras de cólon sendo aplicadas para inferir na atividade de via Wnt em amostras de meduloblastoma (conjunto de dados GSE10327). As amostras incluídas neste conjunto de dados foram adicionalmente caracterizadas em diversos subconjuntos, um deles sendo amostras com a via Wnt sendo ativa. A rede Bayesiana da via Wnt prevê o grupo de amostras de Wnt ativo possuindo uma via Wnt ativa, enquanto que as outras amostras foram previstas corretamente tendo uma via Wnt inativa.
[0218] Os resultados de testes utilizando o modelo de rede Bayesiana de Wnt em um conjunto de dados contendo amostras de câncer de fígado (GSE9843) são mostrados na Figura 23. Aqui, as amostras são agrupadas pelas seguintes anotações a priori atribuídas pelo conjunto de dados GSE9843: “CTNNB1”, “Inflamação”, “Polissomia chr7”, “Proliferação”, e “Não anotada”. As amostras do grupo de “Inflamação” são inferidas uniformemente a não terem atividade de via Wnt anormalmente alta, conforme esperado, uma vez que a condição de inflamação não implica em proliferação celular rápida. As amostras rotuladas “Polissomia chr7” são inferidas uniformemente a não terem atividade de via Wnt anormalmente alta. A polissomia do cromossomo número 7 significa que há mais de dois cromossomos número 7. Uma vez que não há motivos para esperar que esta condição de polissomia impacte a via Wnt, não é inesperado que estas amostras não tenham atividade de via Wnt anormalmente alta.
[0219] Cerca de uma em cinco das amostrasrotuladas “Proliferação” tinham P(Wnt Ligado)>0,5. A proliferação sugere um estado de rápida multiplicação celular. Tal estado pode ser associado à atividade de via Wntanormalmente alta, mas pode também estar associado a diversasoutras possíveis causas de proliferação celular. Portanto, cerca de uma em cinco destas amostras possuindo atividade de via Wnt anormalmente alta não é um resultado absurdo.
[0220] Cerca de metade das amostras do grupo“CTNNB1” são inferidas pela rede Bayesiana a ter atividade de via Wnt anormalmente alta. O gene CTNNB1 codifica a proteína beta-catenina, a qual é uma proteína reguladora da via Wnt, e a ativação de mutações neste gene causa ativação de Wnt anormal. Assim, uma correlação entre o grupo “CTNNB1” e alta atividade de via Wnt está em conformidade com as expectativas.
[0221] A Figura 24 ilustra os resultados detestes do modelo de rede Bayesiana de Wnt descrito neste documento para um conjunto de amostras de câncer de mama. Neste caso, três grupos de linhas celulares de câncer de mama são testados: um grupo para o qual a via Wnt é, a priori, conhecida por estar operando em um nível anormalmente alto (grupo Wnt ligado); um grupo para o qual a via Wnt é, a priori, conhecida por não estar operando em um nível anormalmente alto (grupo Wnt desligado); e outro grupo para o qual a atividade de via Wnt não é conhecida a priori (grupo Desconhecido); além disso, há também uma amostra que é suspeita de ter um baixo nível de ativação de Wnt (Wnt suspeito), embora exista um relato conflitante na literatura de que possa ter uma via Wnt ativa (mas este é um relato minoritário; mais artigos relatam uma via Wnt inativa). Conforme visto na Figura 24, a correlação das inferências providas pela rede Bayesiana com conhecimento a priori é forte para os grupos Wnt ligado e Wnt desligado. Além disso, a amostra mais à direita do gráfico (Wnt suspeito) apresenta uma inferência que corresponde à maioria dos relatos na literatura que afirmam que a via Wnt está desligada. No caso do grupo desconhecido mostrado na Figura 24, para o qual não há conhecimento a priori da atividade de via Wnt, a rede Bayesiana infere baixa atividade para a via Wnt, exceto por um caso para o qual P(Wnt Ligado)>0,5; a literatura mostra que esta linha celular possui uma alta expressão do co-receptor LRP6, o que pode explicar que a via Wnt está ligada.
[0222] A Figura 25 mostra os resultados para o mesmo conjunto de dados das linhas celulares de câncer de mama, mas agora testados quanto à atividade de ER utilizando a rede Bayesiana de ER treinada utilizando linhas celulares de câncer de mama MCF7 conforme descrito neste documento. As amostras conhecidas a priori por ter uma via Wnt ativa foram previstas a ter uma via de ER inativa, o que não é surpreendente, uma vez que a via Wnt já está impulsionando a rápida multiplicação celular. Amostras ER positivas, por outro lado, são encontradas entre as amostras Wnt desligado e as amostras desconhecidas. Em face à Figura 24, isto não é surpreendente.
[0223] Os resultados de testes das previsões da rede Bayesiana de ER treinada em linhas celulares de câncer de mama para um conjunto de amostras de câncer (GSE12276) são mostrados na Figura 26. As amostras de câncer de mama foram subdivididas nas conhecidas classificações: Luminal A (LumA), Luminal B (LumB), Receptor de Fator de Crescimento Epidérmico Humano 2 positivo (HER2), e subtipo de câncer de mama basal. As amostras de tecidos nos subtipos luminal A e luminal B são conhecidas por expressar ER. Também é nestes subtipos que a maioria das amostras são previstas a ter uma alta atividade de via de ER. Por outro lado, as amostras que são classificadas sendo do subtipo basal são conhecidas por ter nenhuma expressão de ER ou expressão baixa, o que se correlaciona bem com nenhuma via de ER ativa, previsto nas amostras de grupo basal. No grupo HER2, apenas três amostras possuem um P(ER ligado) >0,5, enquanto que a maioria das amostras são previstas a ter uma via de ER inativa. Isto se correlaciona bem com o fato de que a classificação é feita no fato de que estas amostras têm uma expressão de HER2 amplificada; a replicação de células descontrolada é presumivelmente acionada através da sinalização de HER2 através de outras vias de sinalização celular que não a via de ER (ver, por exemplo, as linhas celulares de câncer de mama ativas de Wnt na Figura ou as amostras de câncer de mama ativas de Hedgehog na Figura 30).
[0224] O modelo de rede Bayesiana de ER construído e treinado conforme descrito neste documento é utilizado para prever a atividade de via de ER em um grande painel de linhas celulares de diversos cânceres, os resultados são mostrados na Figura 27. Como esperado, apenas as amostras previstas em ER ativo foram encontradas nas linhas celulares de câncer de mama. Todos os outros tipos de linhas celulares de câncer foram previstos terem uma via de ER inativa, o que é conforme o esperado.
[0225] O modelo de rede Bayesiana construído etreinado para a via Hedgehog conforme descrito neste documento é utilizado para prever a atividade da via Hedgehog para linhas celulares de diversos tipos de câncer no conjunto de dados GSE34211. As previsões de atividade de Hedgehog são mostradas na Figura 28. As maiores frações de atividade de Hedgehog previstas como positivas são encontradas nos tipos de câncer de sistema nervoso central (SNC), pele, endométrio e útero, o que está em boa concordância com o conhecimento da literatura referente à proliferação celular dependente de Hedgehog nestes tipos de células.
[0226] A Figura 29 mostra a atividade deHedgehog prevista das amostras de meduloblastoma (GSE10327) que já foi analisada utilizando o modelo de rede Bayesiana de Wnt conforme descrito neste documento. As amostras de meduloblastoma foram caracterizadas em subclasses, com uma delas tendo uma via de sinalização de Hedgehog ativa (identificador: SHH). Todas as amostras no subtipo de SHH são previstas a ter uma sinalização de Hedgehog ativa. Além disso, as amostras de meduloblastoma no subtipo de Wnt foramtambém previstas a ter uma via Hedgehog ativa. Isto está emconcordância com evidências clínicas mostrando que muitas vezes, ambas as vias estão ativas nestes tumores. No entanto,a rede Bayesiana de Wnt foi claramente capaz de prever corretamente a atividade de Wnt apenas no subtipo Wnt. Assim,a combinação da rede Bayesiana de Wnt e Hedgehog é capaz de fazer uma classificação correta destes dois subtipos.
[0227] A atividade de Hedgehog prevista nasamostras de câncer de mama GSE12276, anteriormente utilizada para prever a atividade de ER utilizando o modelo de rede Bayesiana de ER, utilizando o modelo de rede Bayesiana de Hedgehog é mostrada na Figura 30. A via Hedgehog é prevista a estar ativa em uma fração das amostras de cada subtipo. Isto parece estranho, mas correspondido com a previsão de via de ER mostrada na Figura 26, pode-se ver que a atividade de Hedgehog apenas é prevista em amostras que não possuem uma via de ER ativa. Isto está de bom acordo com a hipótese de que a proliferação celular descontrolada em tecido (de mama) pode ser acionada por diferentes vias de sinalização.
[0228] Em resumo, os resultados de testes paradiversas amostras de tecidos e células cancerosos apresentados nas Figuras 21 a 30 fortemente sugerem que as redes Bayesianas dos modelos de Wnt, ER e Hedgehog treinados em amostras específicas a tecido/via são aplicáveis a análisede amostras de outros tipos de tecido. Isto pode permitir quea análise de via de sinalização celular seja aplicada em “multi-tipos de tecidos”. Assim, o sistema de CDS 10 (conforme descrito neste documento) é prontamente aplicado para avaliar a atividade de vias em uma gama de tipos de tecidos diferentes do tipo de tecido das amostras utilizadas para treinar o modelo de rede Bayesiana 40 (ver, por exemplo, a Figura 20, a qual mostra esquematicamente um sistema de apoio a decisões clínicas (CDS) configurado para avaliar uma ou mais vias de sinalização celular conforme revelado neste documento (exemplarmente mostrado para a via Wnt)). Em casos onde as componentes de inferência 40, 44, 46, 48 indicam queo tecido sob análise exibe atividade de via Wnt, ER ou Hedgehog anormalmente alta, mas nenhum fármaco específico a tecido está disponível, um fármaco de supressão de via Wnt, ER ou Hedgehog geral, ou um fármaco específico ao mau funcionamento, pode ser considerado pelo médico com base na recomendação 28 ou na recomendação 26, respectivamente, conforme provido pelo sistema de CDS 10.
[0229] Embora os resultados das Figuras 21 a 30 indiquem aplicabilidade em diversos tipos de tecidos do modelo de rede Bayesiana para a via Wnt, ER e Hedgehog, espera-se que, para aplicações clínicas, os modelos de rede Bayesiana possam opcionalmente ser atualizados ou adaptados para maximizar a aplicabilidade dos mesmos ao tipo de tecido específico sob análise (por exemplo, tecido mamário ou tecido hepático). Tal atualização ou adaptação poderia, por exemplo, implicar no ajuste das probabilidades condicionais com base em estudos clínicos do tipo de tecido sob análise ou no enriquecimento da lista de genes-alvo curada por evidências, descrita neste documento, com gene-alvo específicos a tecido da(s) via(s) sob investigação. Além disso, nós podem ser adicionados ou removidos para melhor ajustar o modelo da rede Bayesiana ao tecido sob análise. Alternativamente, diferentes modelos de rede Bayesiana podem ser treinados desde o início utilizando diferentes conjuntos de treinamento para diferentes tipos de tecido. Além disso, os resultados das Figuras 21 a 30 ilustram a capacidade do processo descrito neste documento de desenvolver e treinar modelos de rede Bayesiana utilizando listas de genes-alvo curadas por evidências de vias que não Wnt, ER e Hedgehog, para prever e diagnosticar a atividade da via.
[0230] Os resultados de testes do modelo de rede Bayesiana de AR construído e treinado conforme descrito neste documento foram exemplarmente utilizados para prever a atividade de AR em linhas celulares de câncer de próstata LNCaP tratadas com diferentes regimes de tratamento (GSE7708) (ver Figura 38). Conforme esperado, as células LNCaP não estimuladas com DHT resultam em uma via de AR inativa prevista, enquanto que células estimuladas com LNCaP foram corretamente previstas a ter uma via de AR ativa e células LNCaP tratadas com Bicalutamida, um fármaco anti-andrógeno, a ter uma via de AR inibida.
[0231] A rede Bayesiana treinada da via de ARconforme descrito neste documento foi também utilizada para prever a probabilidade da via de AR estar ativa em amostras de câncer de próstata do conjunto de dados GSE17951 (os resultados são mostrados na Figura 39). A maioria das biópsias de próstata e tumores foram, não inesperadamente, previstos a ter uma maior probabilidade de atividade de AR em comparação com as amostras dos controles.
[0232] O modelo de rede Bayesiana de AR foitambém aplicado a um teste de múltiplos tecidos, a saber, as amostras de câncer de mama incluídas no conjunto de dados GSE12276. Os resultados para este teste são mostrados na Figura 40. Uma pequena fração das amostras, encontradas em cada subgrupo, está prevista a ter uma via ativa, enquanto que a grande maioria das amostras teve uma via de AR inativa, Curiosamente, a maior porcentagem de amostras com uma via de AR ativa é encontrada no subgrupo HER2, o que não é inesperado, uma vez que é sabido na literatura que há interferência entre as vias HER2 e AR e a via de AR pode também ser induzida por sinalização de HER2.
[0233] O modelo de rede Bayesiana de ARmencionado acima foi também utilizado para prever a atividade de via de AR em dois conjuntos de amostras de linhas celulares de diversos tipos de câncer (GSE36133 e GSE34211) conforme ilustrado na Figura 41 e na Figura 42. Como esperado, a maior parte das linhas celulares demonstraram ter uma via de AR inativa. As exceções a isto são as amostras de câncer de próstata com diversas amostras de linha celular de câncer expressando atividade de via de AR. Na Tabela 12, é mostrado que todas as previsões de atividade de via de AR das amostras de câncer de próstata estão em conformidade com a atividade de AR conhecida.
[0234] Tabela 12. Atividade de AR conhecida e prevista em linhas celulares de câncer de próstata nos conjuntos de dados GSE36133 e GSE34211.
Figure img0039
Figure img0040
EXEMPLO 7: PROGNÓSTICO BASEADO EM ATIVIDADE DE VIA
[0235] Pensa-se que as vias de desenvolvimentoprecoce, como Wnt e Hedgehog, desenvolvem um papel na metástase causada por células cancerosas que reverteram a um fenótipo mais semelhante à célula-tronco, chamado células- tronco cancerosas. Com efeito, evidências suficientes estão disponíveis para as vias de desenvolvimento precoce, tal como a via Wnt, desenvolverem um papel na metástase do câncer, permitindo que as células cancerosas metastáticas dividam alocalização de semeadura em outro tecido ou órgão. A metástase está associada a mau prognóstico, assim, espera-seque a atividade de vias de desenvolvimento precoce, tal como as vias Wnt e Hedgehog, em células cancerosas seja preditiva de mau prognóstico. Isto é confirmado pelo fato de que pacientes de câncer de mama, do conjunto de dados GSE12276, que foram identificados como tendo uma via de ER ativa, mas não tendo uma via Wnt ou Hedgehog ativa utilizando os modelosde rede Bayesiana descritos neste documento tiveram um melhorprognóstico do que pacientes identificados tendo uma via Hedgehog ou Wnt ou ambos, conforme ilustrado pela curva de Kaplan-Meier na Figura 37. EXEMPLO 8: PLANEJAMENTO DE TERAPIA, PREVISÃO DEEFICÁCIA DE FÁRMACO, PREVISÃO DE EFEITOS COLATERAIS E MONITORAMENTO DE EFICÁCIA DE FÁRMACO
[0236] O exemplo seguinte ilustra como usar osmodelos probabilísticos, em particular, os modelos de rede Bayesiana, para planejamento de terapia, previsão de eficácia de fármaco, monitoramento de eficácia de fármaco e atividades relacionadas.
[0237] O modelo de rede Bayesiana da via de ER,construído utilizando um nó para a presença de fator de transcrição, uma camada de nós representando os níveis de mRNA dos genes-alvo (Tabela 2) e uma camada de nós representando as intensidades dos conjuntos de sondas correspondente aos genes-alvo (Tabela 2), análoga à Figura 6 descrita neste documento, e treinado conforme descrito neste documento, foram utilizados para prever a atividade de via. A atividade de via é posteriormente demonstrada que está correlacionada com a eficácia de fármaco ou monitoramento da eficácia do fármaco. Resumos de resultados são mostrados nas Figuras 31 e 32.
[0238] O Tamoxifeno é um fármaco atualmenteutilizado para o tratamento de câncer de mama ER+ (receptor de estrogênio positivo). Ele atua como um antagonista do receptor de estrogênio, inibindo a proliferação celular descontrolada, a qual se acredita que é induzida por sinalização de ER. Infelizmente, nem todo câncer de mama responde ao tratamento com Tamoxifeno, apesar da demonstração da presença de proteína ER em células cancerosas por análise de histopatologia rotineira de slides de tecidos cancerosos. Muitos estudos foram conduzidos para investigar esta chamada resistência a Tamoxifeno. O conjunto de dados publicamente disponível GSE21618 é o resultado de um dentre tais estudos e contém dados de microarranjo de linhas celulares resistentes a Tamoxifeno e MCF7 de tipo selvagem sob diferentes regimes de tratamento. O modelo de rede Bayesiana de ER construído e treinado conforme descrito neste documento é utilizado para analisar as linhas celulares resistente a Tamoxifeno e MCF7 sob diferentes regimes de tratamento, os resultados são mostrados na Figura 31.
[0239] A linha celular resistente a Tamoxifenode controle, indicada por TamR.Ctrl, está prevista a ter uma via de ER inativa para todo ponto de tempo após adição de Tamoxifeno (1, 2, 3, 6, 12, 24 e 48 h). Não é surpreendenteque o tratamento da linha celular resistente a Tamoxifeno, que é insensível ao tratamento de Tamoxifeno, indicado por TamR.Tam, é ineficaz, o que também é ilustrado pela inatividade prevista da via de ER para este grupo ao longodos mesmos pontos de tempo. De acordo com a análise da linhacelular resistente a Tamoxifeno (TamR.Ctrl), a força motriz da proliferação celular descontrolada não é devido à sinalização de ER ativa; portanto, tratá-la com um antagonista de ER não inibirá a proliferação celular. Isto ilustra que o tratamento com Tamoxifeno não é recomendado em caso de atividade de via de ER prevista negativa.
[0240] Por outro lado, a linha celular MCF7 detipo selvagem, conhecida por ser sensível a Tamoxifeno, tratada com 17beta-estradiol (wt1.E2) lentamente reage ao tratamento hormonal, o que é visível nas crescentes previsões de atividade positiva de ER. O tratamento de tal linha celular com inibidores de aromatase que são conhecidos por inibir a produção de estrogênio inibirá a via de ER, o que é ilustrado pela previsão de via de ER decrescente no tempo. Apoiando isto, estão as previsões de via de ER feitas com base nos dados de microarranjo de amostras de MCF7 com estrogênio para aumentar o tempo no conjunto de dados GSE11324, os resultados mostrados na Figura 32.
[0241] O acima mencionado ilustra a capacidade dos modelos probabilísticos, em particular, os modelos de rede Bayesiana, serem utilizados para planejamento de terapia, previsão de eficácia de fármaco, e monitoramento da eficácia do fármaco. Entretanto, deve ser entendido que a mesma metodologia também se aplicaria à previsão e ao monitoramento de efeitos adversos.EXEMPLO 9: DESENVOLVIMENTO DE FÁRMACO
[0242] Similar ao monitoramento de resposta a terapia, um modelo de via pode ser utilizado no desenvolvimento de fármaco para avaliar a eficácia de diversos compostos putativos. Por exemplo, durante a triagem de muitos compostos quanto a um possível efeito em certa via em uma linha celular de câncer, o respectivo modelo de via pode ser utilizado para determinar se a atividade da via sobe ou desce após a aplicação do composto ou não. Muitas vezes, esta verificação é feita utilizando apenas um ou poucos marcadores putativos da atividade da via, o que aumenta a chance de monitoramento ineficaz do efeito de tratamento. Além disso, em estudos de acompanhamento em indivíduos animais ou pacientes, os modelos de via podem ser utilizados da mesma maneira para avaliar a eficácia de fármacos candidatos, e determinar uma dose ideal para ter impacto máximo na atividade da via.
[0243] Um exemplo de monitoramento ineficaz denovos compostos de fármaco é ilustrado pela atividade de viade AR prevista nas amostras de GSE7708 conforme mostrado naFigura 38. Neste estudo, dois possíveis compostos de fármaco a inibir a atividade de via de AR, denotados por Poliamida 1 e Poliamida 2, foram desenvolvidos. Foi demonstrado que estasduas poliamidas são capazes de inibição da via de AR com basenas descobertas de que poliamidas se ligam ao Elemento de Resposta a Andrógeno (ARE) e inibem a expressão de KLK3 (= PSA), um marcador bem conhecido para atividade de AR também incluído na seleção de genes-alvo conforme descrito neste documento, bem como « 35 % das transcrições que foraminduzidas por DHT. Em contraste, o modelo de rede Bayesiana da via de AR previu que estas amostras ainda tinham uma viade AR ativa. A investigação das probabilidades inferidas dosgenes-alvo serem regulados positivamente utilizando o modelo de rede Bayesiana de AR indicou que KLK3, em contraste aos outros genes-alvo, foi regulado negativamente de acordo com as descobertas, enquanto que todos os outros genes-alvo (exceto AR, GUGY1A3 e TMPRSS2 no caso de Poliamida 1) foram expressos de maneira diferente nas amostras tratadas com Poliamida 1 e Poliamida 2. Em outras palavras, apenas um marcador para a atividade de AR, KLK3, foi regulado negativamente, enquanto que a maioria dos genes-alvo identificados ainda foi regulado positivamente, indicando que a via de Ar ainda está amplamente intacta, e assim, ativa. Ao levar em consideração um maior número de genes-alvo com base em evidências da literatura, os inventores foram capazes de mostrar que a inibição da atividade de AR das poliamidas é limitada e que apenas a expressão e KLK3 é claramente regulada negativamente utilizando estas poliamidas. Além disso, isto ilustra o valor de uma abordagem sistemática utilizando um modelo de rede Bayesiana comparado com uma abordagem reducionista no desenvolvimento de fármaco.EXEMPLO 10: DESENVOLVIMENTO DE ENSAIO
[0244] Em vez de aplicar as redes Bayesianasmencionadas em dados de entrada de mRNA provenientes de microarranjos ou sequenciamento de RNA, pode ser benéfico em aplicações clínicas desenvolver ensaios dedicados para realizar as medições de amostra, por exemplo, em uma plataforma integrada, utilizando qPCR para determinar níveis de mRNA de genes-alvo. As sequências de RNA/DNA dos genesalvo revelados podem, então, ser utilizadas para determinar quais iniciadores e sondas selecionar em tal plataforma.
[0245] A validação de tal ensaio dedicado podeser feita utilizando as redes Bayesianas baseadas em microarranjo como um modelo de referência, e verificando se o ensaio desenvolvido fornece resultados similares em um conjunto de amostras de validação. Ao lado de um ensaio dedicado, isto pode também ser feito para construir e calibrar modelos de rede Bayesiana utilizando dados de sequenciamento de mRNA como medições de entrada.EXEMPLO 11: PESQUISA DE VIAS E PESQUISA DEPATOFISIOLOGIA DE CÂNCER
[0246] O seguinte ilustrará como modelos de redeBayesiana podem ser empregados em pesquisas de vias (clínicas), isto é, pesquisas interessadas em descobrir quais vias estão envolvidas em certas doenças, as quais podem ser acompanhadas para pesquisas mais detalhadas, por exemplo, para ligar mutações em proteínas de sinalização a mudanças na ativação de vias (medida com o modelo). Isto é relevante para investigar a iniciação, o crescimento e a evolução e metástase de cânceres específicos (a patofisiologia).
[0247] Os modelos de rede Bayesiana das vias deWnt, ER, Hedgehog e AR, construídos utilizando um nó para a presença de fator de transcrição, uma camada de nós representando os níveis de mRNA dos genes-alvo (Tabela 1, Tabela 2, Tabela 3 e Tabela 4) e uma camada de nós representando as intensidades dos conjuntos de sondas correspondente aos genes-alvo (Tabela 1, Tabela 2, Tabela 3 e Tabela 4), similar à Figura 6 descrita neste documento, e treinado conforme descrito neste documento, foram utilizados para prever a atividade de via de um conjunto de dados que consiste em amostras de câncer de mama (GSE12276).
[0248] Suponha que o pesquisador estáinteressado em analisar a via ou as vias de sinalização celular e a(s) desregulação(ões) específica(s) que aciona(m) a proliferação celular descontrolada. O pesquisador pode analisar os dados de microarranjos utilizando os modelos probabilísticos mencionados, em particular, os modelos de rede Bayesiana, para descobrir quais vias são presumivelmente a causa de proliferação celular descontrolada. Mostrada na Figura 33 e na Figura 34, é possível ver uma ilustração de tal análise para o caso de atividade de Wnt, ER e Hedgehog(amostras basal e luminal A do conjunto de dados GSE12276). Posteriormente, o pesquisador pode buscar em maiores detalhespara encontrar a causa exara de desregulação de via.
[0249] Em referência à Figura 34, as amostrasbasais são conhecidas por terem estado de receptor negativo triplo (ER, PR e HER2), portanto, não é surpreendente ver que todas as amostras são previstas a ter uma via de ER inativa. Por outro lado, algumas das amostras são previstas a ter Wnt ou Hedgehog, ou ambas, ativas, conforme mostrado na Figura 34. Estas atividades de via previstas persuadem o pesquisador a investigar estas amostras em maiores detalhes quanto a, por exemplo, mutações conhecidas ou outras desregulações conhecidas nas vias Wnt e/ou Hedgehog.
[0250] Outro exemplo é dado na Figura 33, ondeas atividades de Wnt, ER e Hedgehog em amostras de luminal A do conjunto de dados GSE12276 são ilustradas. As amostras deluminal A são conhecidas por expressar ER, entretanto, istonão necessariamente significa que as propriedades cancerosassão devido à sinalização de ER ativa. A partir das atividades de via previstas, pode-se inferir que menos da metade das amostras possuem uma sinalização de ER ativa. Entretanto, algumas das amostras que não possuem sinalização de ER ativa demonstram ter uma via Wnt e/ou Hedgehog ativa. Isto pode dar lugar para o pesquisador investigar estas amostras em maiores detalhes quanto a defeitos na via de sinalização Wnt e/ou Hedgehog, respectivamente. Algumas dessas amostras não preveem nenhuma das três vias incluídas sendo ativas; talvez, outras vias estão causando as proliferações celulares descontroladas. Além disso, isto dá ao pesquisador informações adicionais para buscar por defeitos em outras vias.
[0251] Em resumo, as ilustrações descritas nestedocumento indicam a capacidade de modelos de rede Bayesiana treinados (conforme descrito acima) confirmar o processo de descoberta da causa de proliferação celular descontrolada em um método mais direcionado. Ao empregar as redes Bayesianas para triar as amostras quanto a atividades de vias, as atividades de vias previstas podem identificar as possíveis vias para a proliferação celular, o que pode ser acompanhado para pesquisas mais detalhadas, por exemplo, para ligar mutações em proteínas de sinalização ou outras desregulações a alterações em ativação (conforme medido com o modelo).
[0252] Conforme descrito neste documento, o processo para desenvolver e treinar uma rede Bayesiana de vias de sinalização celular pode ser utilizado para construir um modelo de rede Bayesiana para outras vias que poderia também ser empregado em conexão com a presente invenção.EXEMPLO 12: INSCRIÇÃO DE INDIVÍDUO EM UM ENSAIO CLÍNICO COM BASE NA ATIVIDADE PREVISTA
[0253] Se um fármaco candidato for desenvolvido para, por exemplo, bloquear a atividade de uma verta via que ativa o crescimento tumoral, e este fármaco estiver entrando no ensaio clínico, então, uma seleção adequada dos indivíduos para se inscreverem em tal ensaio é essencial para provar a potencial eficácia do fármaco. Em tal caso, os pacientes que não tiverem a respectiva via ativada em seus tumores devem ser excluídos do ensaio, uma vez que é óbvio que o fármaco não pode ser eficaz se a via não for ativada em primeiro lugar. Assim, um modelo de via que pode prever a atividade de via pode ser utilizado como uma ferramenta de seleção, para apenas selecionar os pacientes que são previstos a ter a respectiva via ativada.EXEMPLO 13: SELEÇÃO DE TESTE(S) POSTERIOR(ES) A SEREM REALIZADOS
[0254] Se um tumor for analisado utilizando diferentes modelos de vias, e os modelos preverem desregulação de certa via, então, isto pode guiar a seleção de testes subsequentes a serem realizados. Por exemplo, pode- se executar um ensaio de ligação por proximidade (PLA) para confirmar a presença do respectivo complexo de transcrição (Soderberg O, 2006). Tal PLA pode ser projetado para dar um resultado positivo se duas proteínas chave em um complexo de TF realmente se ligaram, por exemplo, beta-catenina e TCF4 no complexo de TF da via Wnt.
[0255] Outro exemplo é que a via prevista a ser desregulada é analisada em maiores detalhes em relação à cascata de sinalização. Por exemplo, pode-se analisar proteínas chave nesta via para determinar se há mutações nas regiões de DNA codificando por seus respectivos genes, ou pode-se testar quanto à abundância destas proteínas para ver se elas estão mais altas ou mais baixas do que o normal. Tais testes podem indicar qual é a causa-raiz por trás da desregulação da via, e dar ideias sobre quais fármacos disponíveis poderiam ser utilizados para reduzir a atividade da via.
[0256] Estes testes são selecionados para confirmar a atividade da via como identificada utilizando o modelo Bayesiano. Entretanto, a seleção de testes de diagnósticos associados também é possível. Após a identificação da via utilizando o modelo, para escolha de terapia direcionada, apenas os testes de diagnóstico associados precisam ser realizados (a seleção), os quais são aplicáveis à via identificada.EXEMPLO 14: SELEÇÃO DE TESTES DE DIAGNÓSTICO ASSOCIADOS
[0257] Similar ao exemplo anterior, se um tumorfor analisado e os modelos de vias preverem desregulação de certa via, e opcionalmente, uma série de testes adicionais foram realizados para investigar a causa da desregulação, então, um oncologista pode selecionar uma série de fármacos candidatos para tratar o paciente. Entretanto, o tratamento com tal fármaco pode exigir que um teste de diagnóstico associado seja executado primeiro, por exemplo, para cumprir diretrizes clínicas ou garantir o reembolso dos custos de tratamento, ou porque regulamentações (FDA) exigem que seja realizado o teste de diagnóstico associado antes de dar o fármaco. Um exemplo de tal teste de diagnóstico associado é o teste de Her2 para tratamento de pacientes com câncer de mama com o fármaco Herceptin (Trastuzumabe). Assim, o resultado dos modelos de via pode ser utilizado para selecionar os fármacos candidatos e os respectivos testes de diagnóstico associados a serem realizados.EXEMPLO 15: APLICAÇÃO DE CDS
[0258] Em referência à Figura 20(esquematicamente mostrando um sistema de apoio a decisões clínicas (CDS) configurado para avaliar uma ou mais vias de sinalização celular conforme revelado neste documento (exemplarmente mostrado para a via Wnt)), um sistema de apoio a decisões clínicas (CDS) 10 é implementado como um computador adequadamente configurado 12. O computador 12 pode ser configurado para operar como o sistema de CDS 10 executando software, firmware ou outras instruções adequadas armazenados em um meio de armazenamento não transitório (não mostrado) tal como um disco rígido ou outro meio de armazenamento magnético, um disco óptico ou outro meio de armazenamento óptico, uma memória de acesso aleatório (RAM), memória somente-de-leitura (ROM), memória flash, ou outro meio de armazenamento eletrônico, um servidor de rede, e assim por diante. Embora o sistema de CDS ilustrativo 10 seja realizado pelo computador ilustrativo 12, de maneira mais geral, o sistema de CDS pode ser realizado por um dispositivo de processamento digital ou um aparelho compreendendo um processador digital configurado para realizar métodos de apoio a decisões clínicas conforme estabelecido neste documento. Por exemplo, o dispositivo de processamento digital pode ser um dispositivo portátil (por exemplo, um assistente de dados pessoal ou smartphone executando um aplicativo de CDS), um computador notebook, um computador de mesa, um computador ou dispositivo tablet, um servidor de rede remoto, e assim por diante. O computador 12 ou outro dispositivo de processamento digital tipicamente inclui ou é operativamente conectado a um dispositivo de tela 14, atravésdo qual informações, incluindo recomendações de apoio clínicosão exibidas à equipe médica. O computador 12 ou outro dispositivo de processamento digital também inclui ou é operativamente conectado a um ou mais dispositivos de entrada do usuário, tal como um teclado ilustrativo 16, ou um(a) mouse, trackball, trackpad, tela sensível-ao-toque(possivelmente integrada ao dispositivo de tela 14), ou outro dispositivo de entrada do usuário baseados em ponteiro, através dos quais a equipe média pode inserir informações tais como comandos operacionais para controlar o sistema de CDS 10, dados para uso pelo sistema de CDS 10, e assim por diante.
[0259] O sistema de CDS 10 recebe comoinformações de entrada referentes a um material médico (porexemplo, um paciente de hospital, ou um paciente ambulatorialtratado por um oncologista, médico, ou outra equipe médica, ou uma pessoa submetida à triagem de câncer ou algum outro diagnóstico médico que sabe-se ou suspeita-se que tenha um certo tipo de câncer, tal como câncer de cólon, câncer de mama, ou câncer de fígado, e assim por diante). O sistema de CDS 10 aplica diversos algoritmos de análise de dados a estas informações de entrada para gerar recomendações de apoio a decisões clínicas que são apresentadas à equipe médica através do dispositivo de tela 14 (ou através de um sintetizador de voz ou outro dispositivo provendo saída perceptível a humanos). Em algumas realizações, estes algoritmos podem incluir a aplicação de uma diretriz clínica ao paciente. Uma diretriz clínica é um conjunto armazenado de recomendações de tratamento padrão ou “canônicas”, tipicamente construídas com base em recomendações de um painel de especialistas médicos e opcionalmente formatada na forma de um “fluxograma” clínico para facilitar a navegação pela diretriz clínica. Em diversas realizações, os algoritmos de processamento de dados do CDS 10 podem adicionalmente oualternativamente incluir diversos algoritmos de testes de diagnóstico ou clínicos que são realizados em informações deentrada para extrair recomendações de decisão clínica, tal como métodos de aprendizagem de máquina revelados neste documento.
[0260] Nos sistemas de CDS ilustrativosrevelados neste documento (por exemplo, o sistema de CDS 10), os algoritmos de análise de dados de CDS incluem um ou mais algoritmos de testes de diagnóstico ou clínicos que são realizados em informações genômicas e/ou proteômicas de entrada adquiridas por um ou mais laboratórios médicos 18. Estes laboratórios podem ser localizados de diversas maneiras, “no local”, isto é, no hospital ou outro local onde o material médico estiver submetido a exame e/ou tratamento médico, ou “fora do local”, por exemplo, um laboratório especializado e centralizado que recebe (via correio ou outro serviço de entrega) uma amostra de tecido do material médico que foi extraída do material médico (por exemplo, uma amostra obtida de uma lesão mamária, ou de um cólon de um materialmédico conhecido por, ou com suspeita de, ter câncer de cólon, ou de um fígado de um material médico conhecido por,ou com suspeita de, ter câncer de fígado, ou assim por diante, através de um procedimento de biópsia ou outro procedimento de extração de amostra). O tecido do qual uma amostra é extraída pode também ser tecido metastático, por exemplo, tecido (suspeito por ser) maligno originário do cólon, da mama, do fígado, ou de outro órgão que se propagou para fora do cólon, da mama, do fígado, ou outro órgão. Em alguns casos, a amostra de tecido pode ser células tumorais em circulação, isto é, células tumorais que entraram na corrente sanguínea e podem ser extraídas como a amostra de tecido extraída utilizando técnicas de isolamento adequadas. A amostra extraída é processada pelo laboratório para gerar informações genômicas ou proteômicas. Por exemplo, a amostra extraída pode ser processada utilizando um microarranjo (também chamado de diversas maneiras na técnica como chip de gene, chip de DNA, biochip, e assim por diante) ou por processamento de reação em cadeia de polimerase quantitativa (qPCR) para medir informações genômicas ou proteômicas probatórias, tais como níveis de expressão de genes de interesse, por exemplo, na forma de um nível de ácido ribonucleico mensageiro (mRNA) que é transcrito a partir do gene, ou um nível de proteína que é traduzida a partir do mRNA transcrito a partir do gene. Como outro exemplo, a amostra extraída pode ser processada por um laboratório de sequenciamento de genes para gerar sequências para ácido desoxirribonucleico (DNA), ou para gerar uma sequência de RNA, variação de número de cópia, ou assim por diante. Outras abordagens de medição contempladas incluem imunohistoquímica (IHC), citologia, hibridização in situ por fluorescência (FISH), ensaio de ligação por proximidade e assim por diante, realizados em um slide de patologia. Outras informações que podem ser geradas por processamento em microarranjo, espectrometria de massa, sequenciamento de genes, ou outras técnicas de laboratório incluem informações de metilação. Diversas combinações de tais medições genômicas e/ou proteômicas podem também ser realizadas.
[0261] Em algumas realizações, os laboratóriosmédicos 18 realizam uma série de aquisições de dados padronizadas na amostra extraída do tecido do material médico, de modo a gerar uma grande quantidade de dados genômicos e/ou proteômicos. Por exemplo, as técnicas de aquisição de dados padronizadas podem gerar uma sequência de DNA (opcionalmente alinhada) para um ou mais cromossomos ou porções de cromossomos, ou para todo o genoma do tecido. A aplicação de um microarranjo padrão pode gerar milhares ou dezenas de milhares de itens de dados, tais como níveis de expressão para um grande número de genes, diversos dados de metilação, e assim por diante. Esta infinidade de dados genômicos e/ou proteômicos, ou porções selecionadas a partir dos mesmos, são inseridos no sistema de CDS 10 a ser processado de modo a desenvolver informações clinicamente úteis para formular recomendações de apoio a decisões clínicas.
[0262] Os sistemas de CDS revelados e métodos revelados referem-se ao processamento de dados genômicos e/ou proteômicos para avaliar a atividade de diversas vias de sinalização celular. Entretanto, deve ser entendido que os sistemas de CDS revelados (por exemplo, o sistema de CDS 10) podem opcionalmente adicionalmente incluir diversas capacidades adicionais, tal como a geração de recomendações de apoio a decisões clínicas de acordo com as diretrizes clínicas armazenadas com base em diversos dados de pacientes, tais como dados de monitoramento de sinais vitais, dados de histórico do paciente, dados demográficos do paciente (por exemplo, sexo, idade, e assim por diante), dados de aquisição de imagem médica do paciente, e assim por diante. Alternativamente, em algumas realizações, as capacidades do sistema de CDS 10 podem ser limitadas apenas a realizar análises de dados genômicos e/ou proteômicos para avaliar vias de sinalização celular conforme revelado neste documento.
[0263] Com contínua referência à Figura 20 exemplar, o sistema de CDS 10 infere a atividade de uma via de sinalização celular no tecido do material médico com base, pelo menos, mas sem restrições, nos níveis de expressão de genes-alvo da via de sinalização celular medidos na amostra extraída, e determina se a via de sinalização celular está operando de maneira anormal no tecido do material médico com base nesta atividade inferida. Exemplos revelados neste documento referem-se às vias Wnt, ER, AR e Hedgehog como vias de sinalização celular ilustrativas. Estas vias são de interesse em diversas áreas da oncologia porque a perda de regulação nas vias pode ser uma causa de proliferação de um câncer. Há cerca de 10 a 15 vias de sinalização relevantes, e cada câncer é acionado, a princípio, por uma via dominante sendo desregulada. Sem se limitar a nenhuma teoria de operação específica, estas vias regulam a proliferação celular, e consequentemente, uma perda de regulação destas vias em células cancerosas pode levar à via estar “sempre ligada”, assim, acelerando a proliferação de células cancerosas, o que, por sua vez, se manifesta como crescimento, invasão ou metástase (propagação) do câncer.
[0264] A medição dos níveis de expressão de mRNAde genes que codificam para as proteínas reguladoras da viade sinalização celular, tal como uma proteína intermediária que faz parte de uma cascata de proteínas formando a via desinalização celular, é uma medida indireta do nível de expressão da proteína reguladora e pode ou não se correlacionar fortemente ao nível de expressão da proteína reguladora (muito menos com a atividade geral da via de sinalização celular). A via de sinalização celular diretamente regula a transcrição dos genes-alvo - assim, os níveis de expressão de mRNA transcrito a partir dos genesalvo é um resultado direto desta atividade reguladora. Assim, o sistema de CDS 10 infere a atividade da via de sinalizaçãocelular (por exemplo, as vias Wnt, ER, AR e Hedgehog) com base pelo menos nos níveis de expressão de genes-alvo (mRNA ou nível de proteína como uma medição substituta) da via de sinalização celular. Isto garante que o sistema de CDS 10 infere a atividade da via com base em informações diretas providas pelos níveis de expressão medidos dos genes-alvo.
[0265] Entretanto, apesar de, conforme revelado neste documento, serem eficazes para avaliar a atividade geral das vias, os níveis de expressão medidos 20 dos genes-alvo das vias não são especialmente informativos quanto ao motivo das vias estarem operando anormalmente (se este realmente for o caso). Dito de outra forma, os níveis de expressão medidos 20 de genes-alvo de uma via podem indicar que a via está operando anormalmente, mas não indicam qual porção da via está com mau funcionamento (por exemplo, falta regulação suficiente) para fazer com que a via geral opere anormalmente.
[0266] Portanto, se o sistema de CDS 10 detectar atividade anormal de uma via específica, o sistema de CDS 10, então, opcionalmente faz uso de outras informações providas pelos laboratórios médicos 18 para a amostra extraída, tal como sequências genéticas alinhadas 22 e/ou nível(is) de expressão medido(s) para um ou mais genes reguladores da via 24, ou seleciona o teste de diagnóstico a ser realizado em seguida para avaliar qual porção da via está com mau- funcionamento. Para maximizar a eficiência, em algumas realizações, esta avaliação opcional do motivo da via estar com mau funcionamento é realizada apenas se a análise dos níveis de expressão medidos 20 dos genes-alvo da via indicar que a via está operando anormalmente. Em outras realizações, esta avaliação é integrada à análise probabilística da via de sinalização celular descrita neste documento.
[0267] Em realizações nas quais o sistema de CDS 10 avalia qual porção da via está com mau funcionamento, e for bem sucedido ao fazê-lo, as informações permitem que o sistema de CDS 10 recomende a prescrição de um fármaco direcionado ao mau funcionamento específico (recomendação 26 mostrada na Figura 20). Se nenhum mau funcionamento de via específico for identificado (porque a avaliação adicional opcional não é realizada ou porque essa avaliação não identifica nenhuma porção específica da via que está com mau funcionamento), então, o sistema de CDS 10 pode prover uma recomendação padrão 28 recomendando a prescrição de um fármaco de supressão geral para esta via específica (supondo que a atividade de via anormal seja atividade muito alta).EXEMPLO 16: UM KIT E FERRAMENTAS DE ANÁLISE PARA MEDIR ATIVIDADE DE VIAS
[0268] O conjunto de genes-alvo que demonstram melhor indicar atividade de via específica, com base em investigação baseada em sequenciamento de microarranjo/RNA utilizando o modelo Bayesiano, pode ser traduzido em um ensaio de PCR quantitativo multiplex a ser realizado em uma amostra de tecido ou célula. Para desenvolver tal teste aprovado pelo FDA para atividade de via, o desenvolvimento de um kit de testes padronizado é necessário, o qual precisa ser validado clinicamente em ensaios clínicos para obter aprovação regulamentar.
[0269] Em geral, deve ser entendido que, embora as amostras pertencentes à(s) via(s) Wnt, ER, AR e/ou Hedgehog sejam providas como exemplos ilustrativos, as abordagens para análise de via de sinalização celular reveladas neste documento são prontamente aplicadas a outras vias de sinalização celular além destas vias, tal como a vias de sinalização intracelular com receptores na membrana celular (conforme acima) e vias de sinalização intracelular com receptores dentro da célula (conforme acima). Além disso: Este pedido de patente descreve diversas realizações preferidas. Modificações e alterações podem ocorrer a outros após ler e entender a descrição detalhada acima. Pretende-se que o pedido de patente seja interpretado incluindo todas as modificações e alterações na medida em que elas estejam dentro do escopo das reivindicações apensas ou equivalentes das mesmas.LITERATURA:
[0270] de Sousa E Melo F, C. S. (2011).Methylation of cancer-stem-cell-associated Wnt target genes predicts poor prognosis in colorectal cancer patients. Cell Stem Cell., 476-485
[0271] Hatzis P, v. d. (2008). Genome-widepattern of TCF7L2/TCF4 chromatin occupancy in colorectal cancer cells. Mol Cell Biol., 2732-2744
[0272] Neapolitan, R. (2004). Learning Bayesiannetworks. Pearson Prentice Hall
[0273] Nusse, R. (2012, May 1). Wnt targetgenes. Obtido da página inicial do Wnt:http://www.stanford.edu/group/nusselab/cgi- bin/wnt/target_genes
[0274] Soderberg O, G. M. (2006). Directobservation of individual endogenous protein complexes in situ by proximity ligation. Nat Methods., 995-1000
[0275] van de Wetering M, S. E.-P.-F. (2002).The beta-catenin/TCF-4 complex imposes a crypt progenitor

Claims (8)

1. MÉTODO, caracterizado por compreender:a inferência da atividade de uma ou mais via(s) de sinalização celular no tecido de um material médico, pelo menos com base no(s) nível(is) de expressão (20) de um ou mais gene(s)-alvo da(s) via(s) de sinalização celular medido(s) em uma amostra extraída do tecido do material médico, em que a inferência compreende:a inferência da atividade da(s) via(s) de sinalização celular no tecido do material médico através da avaliação de pelo menos uma porção de um modelo probabilístico (40-1, ..., 40-7), preferivelmente uma redeBayesiana (40-1, ..., 40-7), representando a(s) via(s) desinalização celular para um conjunto de entradas incluindo pelo menos o(s) nível(is) de expressão (20) de um ou mais genes-alvo da(s) via(s) de sinalização celular medidas na amostra extraída do tecido do material médico;a estimativa de um nível (46) no tecido do material médico de pelo menos um elemento de fator de transcrição (TF), o pelo menos um elemento de TF controlando a transcrição de um ou mais gene(s)-alvo da(s) via(s) de sinalização celular, a estimativa sendo baseada, pelo menos em parte, em probabilidades condicionais referentes a pelo menos um elemento de TF e o(s) nível(is) de expressão (20) do(s) um ou mais gene(s)-alvo da(s) via(s) de sinalização celular medidas na amostra extraída do tecido do material médico;a inferência da atividade da(s) via(s) de sinalização celular com base no nível estimado na amostra de tecido do fator de transcrição; e a determinação da(s) via(s) de sinalização celular estar/estarem ou não operando de maneira anormal no tecido do material médico com base na atividade inferida da(s) via(s) de sinalização celular no tecido do material médico;em que a inferência é realizada por um dispositivo de processamento digital (12) utilizando o modeloprobabilístico (40-1, ..., 40-7) da(s) via(s) de sinalizaçãocelular,em que a(s) via(s) de sinalização celular é/são compreende(m) uma via Wnt, uma via de ER, uma via de AR e/ou uma via Hedgehog,em que a inferência compreende:a inferência da atividade da via Wnt no tecido do material médico com base pelo menos em níveis de expressão (20) de um ou mais, preferivelmente pelo menos três, gene(s)- alvo da via Wnt medidos na amostra extraída do tecido do material médico selecionado a partir do grupo consistindo em: KIAA1199, AXIN2, RNF43, TBX3, TDGF1, SOX9, ASCL2, IL8, SP5, ZNRF3, KLF6, CCND1, DEFA6 e FZD7,e/oua inferência da atividade da via de ER no tecido domaterial médico com base pelo menos em níveis de expressão (20) de um ou mais, preferivelmente pelo menos três, gene(s)-alvo da via de ER medidos na amostra extraída do tecido do material médico selecionado a partir do grupo consistindo em: CDH26, SGK3, PGR, GREB1, CA12, XBP1, CELSR2, WISP2, DSCAM, ERBB2, CTSD, TFF1 e NRIP1,e/oua inferência da atividade da via Hedgehog no tecidodo material médico com base pelo menos em níveis de expressão (20) de um ou mais, preferivelmente pelo menos três, gene(s)- alvo da via Hedgehog medidos na amostra extraída do tecido do material médico selecionado a partir do grupo consistindo em: GLI1, PTCH1, PTCH2, IGFBP6, SPP1, CCND2, FST, FOXL1, CFLAR, TSC22D1, RAB34, S100A9, S100A7, MYCN, FOXM1, GLI3, TCEA2, FYNe CTSL1,e/oua inferência da atividade da via de AR no tecido domaterial médico com base pelo menos em níveis de expressão (20) de um ou mais, preferivelmente pelo menos três, gene(s)-alvo da via de AR medidos na amostra extraída do tecido do material médico selecionado a partir do grupo consistindo em: KLK2, PMEPA1, TMPRSS2, NKX3_1, ABCC4, KLK3, FKBP5, ELL2, UGT2B15, DHCR24, PPAP2A, NDRG1, LRIG1, CREB3L4, LCP1, GUCY1A3, AR e EAF2.
2. MÉTODO, de acordo com a reivindicação 1, caracterizado pela inferência compreender:a estimativa de um nível (46) no tecido do material médico de pelo menos um elemento de fator de transcrição (TF), representado por um nó de TF do modelo probabilístico, o elemento de TF controlando a transcrição de um ou mais gene(s)-alvo da(s) via(s) de sinalização celular, a estimativa sendo baseada, pelo menos em parte, em probabilidades condicionais do modelo probabilístico (40-1, ..., 40-7) relacionando o nó de TF e os nós no modeloprobabilístico representando os um ou mais gene(s)-alvo da(s) via(s) de sinalização celular medidas na amostra extraída do tecido do material médico,e em que a inferência é preferivelmente realizada utilizando uma rede Bayesiana (40-1, ., 40-7) compreendendo nós representando informações sobre a(s) via(s) de sinalização e relações de probabilidade condicional entre nós conectados da rede Bayesiana.
3. MÉTODO, de acordo com a reivindicação 1 ou 2, caracterizado pela inferência ser adicionalmente baseada em níveis de expressão (20) de pelo menos um gene-alvo da via Wnt medidos na amostra extraída do tecido do material médico selecionado a partir do grupo compreendendo: NKD1, OAT, FAT1, LEF1, GLUL, REG1B, TCF7L2, COL18A1, BMP7, SLC1A2, ADRA2C, PPARG, DKK1, HNF1A e LECT2.
4. MÉTODO, de acordo com a reivindicação 1 ou 2, caracterizado pela inferência ser adicionalmente baseada em níveis de expressão (20) de pelo menos um gene-alvo da via de ER medidos na amostra extraída do tecido do material médico selecionado a partir do grupo compreendendo: AP1B1, ATP5J, COL18A1, COX7A2L, EBAG9, ESR1, HSPB1, IGFBP4, KRT19, MYC, NDUFV3, PISD, PRDM15, PTMA, RARA, SOD1 e TRIM25.
5. MÉTODO, de acordo com a reivindicação 1 ou 2, caracterizado pela inferência ser adicionalmente baseada em níveis de expressão (20) de pelo menos um gene-alvo da via de Hedgehog medidos na amostra extraída do tecido do material médico selecionado a partir do grupo compreendendo: BCL2, FOXA2, FOXF1, H19, HHIP, IL1R2, JAG2, JUP, MIF, MYLK, NKX2-2, NKX2-8, PITRM1 e TOM1.
6. MÉTODO, de acordo com a reivindicação 1 ou 2, caracterizado pela inferência ser adicionalmente baseada em níveis de expressão (20) de pelo menos um gene-alvo da via de AR medidos na amostra extraída do tecido do material médico selecionado a partir do grupo compreendendo: APP, NTS, PLAU, CDKN1A, DRG1, FGF8, IGF1, PRKACB, PTPN1, SGK1 e TACC2.
7. APARELHO, caracterizado por compreender um processador digital (12) configurado para realizar um método conforme definido em qualquer uma das reivindicações 1 a 6.
8. MEIO DE ARMAZENAMENTO NÃO-TRANSITÓRIO, caracterizado por armazenar instruções que são executáveis por um dispositivo de processamento digital (12) para realizar um método conforme definido em qualquer uma das reivindicações 1 a 6.
BR112014000965A 2011-07-19 2012-07-19 Método, aparelho e meio de armazenamento não transitório BR112014000965B8 (pt)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
US201161509137P 2011-07-19 2011-07-19
US61/509,137 2011-07-19
EP11178148.0 2011-08-19
EP11178148A EP2549399A1 (en) 2011-07-19 2011-08-19 Assessment of Wnt pathway activity using probabilistic modeling of target gene expression
PCT/IB2012/053686 WO2013011479A2 (en) 2011-07-19 2012-07-19 Assessment of cellular signaling pathway activity using probabilistic modeling of target gene expression

Publications (3)

Publication Number Publication Date
BR112014000965A2 BR112014000965A2 (pt) 2017-06-13
BR112014000965B1 true BR112014000965B1 (pt) 2021-08-24
BR112014000965B8 BR112014000965B8 (pt) 2022-11-08

Family

ID=44582424

Family Applications (1)

Application Number Title Priority Date Filing Date
BR112014000965A BR112014000965B8 (pt) 2011-07-19 2012-07-19 Método, aparelho e meio de armazenamento não transitório

Country Status (12)

Country Link
US (2) US11443831B2 (pt)
EP (6) EP2549399A1 (pt)
JP (3) JP6204354B2 (pt)
KR (1) KR102064004B1 (pt)
CN (2) CN103649337B (pt)
BR (1) BR112014000965B8 (pt)
DK (3) DK3418396T3 (pt)
ES (3) ES2700617T3 (pt)
IN (1) IN2014CN00675A (pt)
MX (1) MX352827B (pt)
RU (1) RU2719194C2 (pt)
WO (1) WO2013011479A2 (pt)

Families Citing this family (73)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11660317B2 (en) 2004-11-08 2023-05-30 The Johns Hopkins University Compositions comprising cardiosphere-derived cells for use in cell therapy
EP2549399A1 (en) 2011-07-19 2013-01-23 Koninklijke Philips Electronics N.V. Assessment of Wnt pathway activity using probabilistic modeling of target gene expression
ES2797533T3 (es) 2012-02-28 2020-12-02 Novartis Ag Selección de pacientes con cáncer para la administración de inhibidores de la señalización Wnt utilizando el estado mutacional de Rnf43
EP2882445B1 (en) 2012-08-13 2019-04-24 Cedars-Sinai Medical Center Exosomes and micro-ribonucleic acids for tissue regeneration
JP6449779B2 (ja) * 2012-12-26 2019-01-09 コーニンクレッカ フィリップス エヌ ヴェKoninklijke Philips N.V. 目的遺伝子発現の線形結合を用いた細胞信号伝達経路活性の評価
TWI582239B (zh) * 2013-03-11 2017-05-11 諾華公司 與wnt抑制劑相關之標記
US11309059B2 (en) 2013-04-26 2022-04-19 Koninklijke Philips N.V. Medical prognosis and prediction of treatment response using multiple cellular signalling pathway activities
JP6054555B2 (ja) * 2013-06-28 2016-12-27 ナントミクス,エルエルシー 診断テストを特定するための経路分析
EP3052933B1 (en) * 2013-10-02 2019-09-04 Suri Technologies Ltd. Patient-specific immunotherapy for treating heterogeneous tumors
CA2923092C (en) 2014-01-03 2019-12-17 Koninklijke Philips N.V. Assessment of the pi3k cellular signaling pathway activity using mathematical modelling of target gene expression
US9880257B2 (en) * 2014-09-11 2018-01-30 Google Llc Gaussian process-based approach for identifying correlation between wireless signals
US9838847B2 (en) 2014-09-11 2017-12-05 Google LLP Data driven evaluation and rejection of trained Gaussian process-based wireless mean and standard deviation models
US9810762B2 (en) * 2014-09-11 2017-11-07 Google Inc. Calculating mean wireless signal strengths using a gaussian process approach incorporating predictive standard deviations
JP6730983B2 (ja) 2014-09-19 2020-07-29 ザ プロボスト,フェローズ,ファウンデーション スカラーズ,アンド ジ アザー メンバーズ オブ ボード,オブ ザ カレッジ オブ ザ ホーリー アンド アンディブ.トリニティー オブ クイーン エリザベス,ニアー ダブリン 癌の再発リスクを予測する方法
US11357799B2 (en) 2014-10-03 2022-06-14 Cedars-Sinai Medical Center Cardiosphere-derived cells and exosomes secreted by such cells in the treatment of muscular dystrophy
US10016159B2 (en) 2014-10-24 2018-07-10 Koninklijke Philips N.V. Determination of TGF-β pathway activity using unique combination of target genes
CA2965408C (en) * 2014-10-24 2023-10-24 Koninklijke Philips N.V. Medical prognosis and prediction of treatment response using multiple cellular signaling pathway activities
AU2015334841B2 (en) * 2014-10-24 2022-02-03 Koninklijke Philips N.V. Medical prognosis and prediction of treatment response using multiple cellular signaling pathway activities
CN105760707B (zh) * 2014-12-18 2018-07-31 中国科学院大连化学物理研究所 细胞基因翻译过程建模方法
BR112018002848A2 (pt) 2015-08-14 2018-11-06 Koninklijke Philips Nv método, aparelho, mídia de armazenamento não transitório, programa de computador, kit para medir níveis de expressão de seis ou mais genes-alvo da via de sinalização celular
EP3341875A1 (en) * 2015-08-27 2018-07-04 Koninklijke Philips N.V. An integrated method and system for identifying functional patient-specific somatic aberations using multi-omic cancer profiles
CN106897578B (zh) * 2015-12-15 2020-02-14 中国科学院大连化学物理研究所 一种细胞基因翻译过程建模方法
WO2017123662A1 (en) 2016-01-11 2017-07-20 Cedars-Sinai Medical Center Cardiosphere-derived cells and exosomes secreted by such cells in the treatment of heart failure with preserved ejection fraction
US20170329914A1 (en) * 2016-05-11 2017-11-16 International Business Machines Corporation Predicting Personalized Cancer Metastasis Routes, Biological Mediators of Metastasis and Metastasis Blocking Therapies
US11351200B2 (en) 2016-06-03 2022-06-07 Cedars-Sinai Medical Center CDC-derived exosomes for treatment of ventricular tachyarrythmias
US10621236B2 (en) * 2016-09-16 2020-04-14 At&T Intellectual Property I, L.P. Concept based querying of graph databases
WO2018057542A1 (en) 2016-09-20 2018-03-29 Cedars-Sinai Medical Center Cardiosphere-derived cells and their extracellular vesicles to retard or reverse aging and age-related disorders
US11990209B2 (en) 2016-11-11 2024-05-21 University of Pittsburgh—Of the Commonwealth System of Higher Educat Identification of instance-specific somatic genome alterations with functional impact
CN110382521B (zh) 2016-11-25 2024-07-05 皇家飞利浦有限公司 从氧化应激区分肿瘤抑制性foxo活性的方法
CN106755464A (zh) * 2017-01-11 2017-05-31 上海易毕恩基因科技有限公司 用于筛选肠癌和/或胃癌的基因标志物的方法、用该方法筛选的基因标志物及其用途
CN108300783A (zh) * 2017-01-11 2018-07-20 上海易毕恩基因科技有限公司 用于筛选肠癌和/或胃癌的基因标志物的方法、用该方法筛选的基因标志物及其用途
JP7336769B2 (ja) 2017-04-19 2023-09-01 シーダーズ―シナイ メディカル センター 骨格筋ジストロフィーを治療する方法及び組成物
CN107184991B (zh) * 2017-05-03 2020-05-26 武汉爱博泰克生物科技有限公司 PRDM15基因序列在制备NF-κB抑制剂中的应用
CN107164508A (zh) * 2017-06-16 2017-09-15 上海易毕恩基因科技有限公司 用于检测肝癌的基因标志物及其用途
EP3431582A1 (en) 2017-07-18 2019-01-23 Koninklijke Philips N.V. Cell culturing materials
CN107201411A (zh) * 2017-07-27 2017-09-26 上海市长宁区妇幼保健院 Mylk基因作为诊断子宫内膜癌的标志物
CN107385051A (zh) * 2017-08-04 2017-11-24 上海易毕恩生物技术有限公司 用于检测肝肿瘤良恶性的基因标志物、试剂盒及检测方法
EP3462348A1 (en) 2017-09-28 2019-04-03 Koninklijke Philips N.V. Bayesian inference
EP3462349A1 (en) * 2017-10-02 2019-04-03 Koninklijke Philips N.V. Assessment of notch cellular signaling pathway activity using mathematical modelling of target gene expression
EP3461916A1 (en) 2017-10-02 2019-04-03 Koninklijke Philips N.V. Assessment of jak-stat3 cellular signaling pathway activity using mathematical modelling of target gene expression
CA3077501A1 (en) 2017-10-02 2019-04-11 Koninklijke Philips N.V. Determining functional status of immune cells types and immune response
EP3461915A1 (en) 2017-10-02 2019-04-03 Koninklijke Philips N.V. Assessment of jak-stat1/2 cellular signaling pathway activity using mathematical modelling of target gene expression
EP3502279A1 (en) * 2017-12-20 2019-06-26 Koninklijke Philips N.V. Assessment of mapk-ap 1 cellular signaling pathway activity using mathematical modelling of target gene expression
EP3727351A4 (en) 2017-12-20 2021-10-06 Cedars-Sinai Medical Center MODIFIED EXTRACELLULAR VESICLES FOR IMPROVED TISSUE DELIVERY
US11475995B2 (en) * 2018-05-07 2022-10-18 Perthera, Inc. Integration of multi-omic data into a single scoring model for input into a treatment recommendation ranking
CN113626397A (zh) * 2018-06-16 2021-11-09 王梅 对数据文件进行动态处理的方法及系统
US11354591B2 (en) 2018-10-11 2022-06-07 International Business Machines Corporation Identifying gene signatures and corresponding biological pathways based on an automatically curated genomic database
WO2020124585A1 (zh) * 2018-12-21 2020-06-25 北京哲源科技有限责任公司 获得细胞内确定性事件的方法、电子设备及存储介质
JP7386897B2 (ja) 2019-05-03 2023-11-27 コーニンクレッカ フィリップス エヌ ヴェ 高悪性度漿液性卵巣癌における予後予測の方法
EP3812474A1 (en) 2019-10-22 2021-04-28 Koninklijke Philips N.V. Methods of prognosis in high-grade serous ovarian cancer
JP2022532161A (ja) * 2019-05-08 2022-07-13 シーダーズ―シナイ メディカル センター 治療活性細胞およびエクソソーム
EP3739588A1 (en) 2019-05-13 2020-11-18 Koninklijke Philips N.V. Assessment of multiple signaling pathway activity score in airway epithelial cells to predict airway epithelial abnormality and airway cancer risk
EP4013866A4 (en) 2019-08-16 2023-08-30 Tempus Labs, Inc. SYSTEMS AND METHODS FOR DETECTING CELL PATHWAY DISORDER IN CANCER SAMPLES
EP3822368A1 (en) 2019-11-14 2021-05-19 Koninklijke Philips N.V. Assessment of pr cellular signaling pathway activity using mathematical modelling of target gene expression
EP3835433A1 (en) 2019-12-12 2021-06-16 Koninklijke Philips N.V. Notch signaling pathway activity as prognostic marker in bladder cancer
US20210209478A1 (en) 2019-12-12 2021-07-08 Tempus Labs, Inc. Real-World Evidence of Diagnostic Testing and Treatment Patterns in U.S. Breast Cancer Patients with Implications for Treatment Biomarkers from RNA-Sequencing Data
CN111139300B (zh) * 2020-02-19 2021-08-17 伯克利南京医学研究有限责任公司 一组结肠癌预后相关基因的应用
EP3882363A1 (en) 2020-03-17 2021-09-22 Koninklijke Philips N.V. Prognostic pathways for high risk sepsis patients
EP3978628A1 (en) 2020-10-01 2022-04-06 Koninklijke Philips N.V. Prognostic pathways for viral infections
WO2021209567A1 (en) 2020-04-16 2021-10-21 Koninklijke Philips N.V. Prognostic pathways for viral infections
CN111739586B (zh) * 2020-06-17 2024-04-05 浙江大学 以87个基因作为生物标志物预测细胞增殖活性的模型
EP3940704A1 (en) 2020-07-14 2022-01-19 Koninklijke Philips N.V. Method for determining the differentiation state of a stem cell
EP3960875A1 (en) 2020-08-28 2022-03-02 Koninklijke Philips N.V. Pcr method and kit for determining pathway activity
EP3965119A1 (en) 2020-09-04 2022-03-09 Koninklijke Philips N.V. Methods for estimating heterogeneity of a tumour based on values for two or more genome mutation and/or gene expression related parameter, as well as corresponding devices
EP3974540A1 (en) 2020-09-25 2022-03-30 Koninklijke Philips N.V. Method for predicting immunotherapy resistance
EP4015651A1 (en) 2020-12-17 2022-06-22 Koninklijke Philips N.V. Treatment prediction and effectiveness of anti-tnf alpha treatment in ibd patients
EP4039825A1 (en) 2021-02-09 2022-08-10 Koninklijke Philips N.V. Comparison and standardization of cell and tissue culture
WO2022189530A1 (en) 2021-03-11 2022-09-15 Koninklijke Philips N.V. Prognostic pathways for high risk sepsis patients
CN113278700B (zh) * 2021-06-04 2022-08-09 浙江省肿瘤医院 一种用于乳腺癌分型及预后预测的引物组及试剂盒
WO2023084039A1 (en) * 2021-11-15 2023-05-19 Innosign B.V. Assessment of gr cellular signaling pathway activity using mathematical modelling of target gene expression
CN113963745A (zh) * 2021-12-07 2022-01-21 国际竹藤中心 一种构建植物发育分子调控网络的方法及其应用
WO2024033063A1 (en) 2022-08-12 2024-02-15 Innosign B.V. Prediction and monitoring of immunotherapy in cancer
CN116083590B (zh) * 2023-03-23 2024-03-22 雄安妙心医学检验有限公司 一种基因检测试剂盒及其制备方法和应用

Family Cites Families (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6566130B1 (en) * 2000-01-28 2003-05-20 Henry M. Jackson Foundation For The Advancement Of Military Medicine Androgen-regulated gene expressed in prostate tissue
US7371736B2 (en) * 2001-11-07 2008-05-13 The Board Of Trustees Of The University Of Arkansas Gene expression profiling based identification of DKK1 as a potential therapeutic targets for controlling bone loss
EP1380644A1 (en) 2002-07-08 2004-01-14 Kylix B.V. The use of specified TCF target genes to identify drugs for the treatment of cancer, in particular colorectal cancer, in which TCF/beta-catenin/WNT signalling plays a central role
AU2003260973A1 (en) * 2002-09-05 2004-03-29 Toolgen, Inc. Bioinformatics analysis of cellular effects of artificial transcription factors
US20070009923A1 (en) * 2005-01-24 2007-01-11 Massachusetts Institute Of Technology Use of bayesian networks for modeling cell signaling systems
CA2608359A1 (en) 2005-05-13 2006-11-23 Duke University Gene expression signatures for oncogenic pathway deregulation
JP2009521736A (ja) 2005-11-07 2009-06-04 スキャンスカウト,インコーポレイテッド リッチメディアと共に広告をレンダリングするための技術
CA2651929A1 (en) * 2006-05-17 2007-11-29 Timothy S. Gardner Method to determine transcriptional regulation pathways in organisms
WO2008086182A2 (en) * 2007-01-04 2008-07-17 University Of Rochester Use of gene signatures to design novel cancer treatment regimens
JP2010178650A (ja) 2009-02-04 2010-08-19 Univ Of Tokyo 固形癌の再発予測のための試験方法および再発予防剤
US20120252689A1 (en) 2011-04-01 2012-10-04 Zhong Wu Gene expression signature for wnt/b-catenin signaling pathway and use thereof
JP2014513959A (ja) * 2011-05-05 2014-06-19 クリニカル ジェノミクス ピーティーワイ リミテッド 新生物の診断方法
EP2549399A1 (en) 2011-07-19 2013-01-23 Koninklijke Philips Electronics N.V. Assessment of Wnt pathway activity using probabilistic modeling of target gene expression

Also Published As

Publication number Publication date
DK3173489T3 (en) 2018-12-10
EP3173489B1 (en) 2018-09-19
EP3418396B1 (en) 2021-03-24
KR102064004B1 (ko) 2020-01-08
JP6807430B2 (ja) 2021-01-06
EP3831957A1 (en) 2021-06-09
EP2549399A1 (en) 2013-01-23
CN109852671A (zh) 2019-06-07
BR112014000965B8 (pt) 2022-11-08
EP3418396A1 (en) 2018-12-26
MX2014000557A (es) 2014-05-01
ES2700617T3 (es) 2019-02-18
JP2014520566A (ja) 2014-08-25
EP3831957B1 (en) 2022-09-07
DK2734643T3 (en) 2017-03-20
US11443831B2 (en) 2022-09-13
DK3418396T3 (da) 2021-05-25
EP4130291A1 (en) 2023-02-08
EP2734643A2 (en) 2014-05-28
CN103649337B (zh) 2018-11-13
RU2014106026A (ru) 2015-08-27
JP6783729B2 (ja) 2020-11-11
JP2017205129A (ja) 2017-11-24
EP4130291C0 (en) 2024-01-10
RU2719194C2 (ru) 2020-04-17
KR20140046464A (ko) 2014-04-18
IN2014CN00675A (pt) 2015-04-03
WO2013011479A2 (en) 2013-01-24
US20140156200A1 (en) 2014-06-05
EP2734643B1 (en) 2016-12-07
JP2019129850A (ja) 2019-08-08
EP3173489A1 (en) 2017-05-31
ES2874452T3 (es) 2021-11-05
US20230105263A1 (en) 2023-04-06
JP6204354B2 (ja) 2017-09-27
ES2617195T3 (es) 2017-06-15
CN103649337A (zh) 2014-03-19
MX352827B (es) 2017-12-11
BR112014000965A2 (pt) 2017-06-13
EP4130291B1 (en) 2024-01-10
WO2013011479A3 (en) 2013-03-14

Similar Documents

Publication Publication Date Title
JP6807430B2 (ja) 標的遺伝子発現の確率モデルを使用した細胞シグナル経路の活性の評価
AU2020202706B2 (en) Assessment of cellular signaling pathway activity using linear combination(s) of target gene expressions
AU2014259459B2 (en) Medical prognosis and prediction of treatment response using multiple cellular signalling pathway activities

Legal Events

Date Code Title Description
B06U Preliminary requirement: requests with searches performed by other patent offices: procedure suspended [chapter 6.21 patent gazette]
B350 Update of information on the portal [chapter 15.35 patent gazette]
B09A Decision: intention to grant [chapter 9.1 patent gazette]
B16A Patent or certificate of addition of invention granted [chapter 16.1 patent gazette]

Free format text: PRAZO DE VALIDADE: 20 (VINTE) ANOS CONTADOS A PARTIR DE 19/07/2012, OBSERVADAS AS CONDICOES LEGAIS.

B25A Requested transfer of rights approved

Owner name: INNOSIGN B.V. (NL)