CN103649337A - 使用目标基因表达的概率建模评估细胞信号传导途径活性 - Google Patents

使用目标基因表达的概率建模评估细胞信号传导途径活性 Download PDF

Info

Publication number
CN103649337A
CN103649337A CN201280035666.XA CN201280035666A CN103649337A CN 103649337 A CN103649337 A CN 103649337A CN 201280035666 A CN201280035666 A CN 201280035666A CN 103649337 A CN103649337 A CN 103649337A
Authority
CN
China
Prior art keywords
approach
target gene
experimenter
medical
tissue
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201280035666.XA
Other languages
English (en)
Other versions
CN103649337B (zh
Inventor
W.F.J.维哈伊格
A.范德斯托佩
H.J.范奥詹
K.C.杜拉
M.阿维斯德恩达
R.霍夫曼恩
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Innomark Ltd
Original Assignee
Koninklijke Philips Electronics NV
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Koninklijke Philips Electronics NV filed Critical Koninklijke Philips Electronics NV
Priority to CN201811176740.5A priority Critical patent/CN109852671A/zh
Publication of CN103649337A publication Critical patent/CN103649337A/zh
Application granted granted Critical
Publication of CN103649337B publication Critical patent/CN103649337B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6809Methods for determination or identification of nucleic acids involving differential detection
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6876Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
    • C12Q1/6883Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material
    • C12Q1/6886Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material for cancer
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N5/00Computing arrangements using knowledge-based models
    • G06N5/04Inference or reasoning models
    • G06N5/048Fuzzy inferencing
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B20/00ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B20/00ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
    • G16B20/20Allele or variant detection, e.g. single nucleotide polymorphism [SNP] detection
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B20/00ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
    • G16B20/30Detection of binding sites or motifs
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B25/00ICT specially adapted for hybridisation; ICT specially adapted for gene or protein expression
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B40/00ICT specially adapted for biostatistics; ICT specially adapted for bioinformatics-related machine learning or data mining, e.g. knowledge discovery or pattern finding
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B40/00ICT specially adapted for biostatistics; ICT specially adapted for bioinformatics-related machine learning or data mining, e.g. knowledge discovery or pattern finding
    • G16B40/20Supervised data analysis
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B5/00ICT specially adapted for modelling or simulations in systems biology, e.g. gene-regulatory networks, protein interaction networks or metabolic networks
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B5/00ICT specially adapted for modelling or simulations in systems biology, e.g. gene-regulatory networks, protein interaction networks or metabolic networks
    • G16B5/20Probabilistic models
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/106Pharmacogenomics, i.e. genetic variability in individual responses to drugs and drug metabolism
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/112Disease subtyping, staging or classification
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/158Expression markers

Landscapes

  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Chemical & Material Sciences (AREA)
  • Biotechnology (AREA)
  • General Health & Medical Sciences (AREA)
  • Medical Informatics (AREA)
  • Biophysics (AREA)
  • Theoretical Computer Science (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Molecular Biology (AREA)
  • Evolutionary Biology (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Analytical Chemistry (AREA)
  • Genetics & Genomics (AREA)
  • Organic Chemistry (AREA)
  • Wood Science & Technology (AREA)
  • Zoology (AREA)
  • Data Mining & Analysis (AREA)
  • Immunology (AREA)
  • Software Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Physiology (AREA)
  • Evolutionary Computation (AREA)
  • Artificial Intelligence (AREA)
  • Microbiology (AREA)
  • Biochemistry (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Public Health (AREA)
  • Epidemiology (AREA)
  • Databases & Information Systems (AREA)
  • Bioethics (AREA)
  • Pathology (AREA)
  • Probability & Statistics with Applications (AREA)
  • Hospice & Palliative Care (AREA)
  • Oncology (AREA)
  • Mathematical Physics (AREA)

Abstract

本申请主要涉及特定方法,其至少基于医疗受试者的组织的提取样品中测量的一种或多种细胞信号传导途径的一个或多个目标基因的一个或多个表达水平来推断所述医疗个体的组织中一种或多种细胞信号传导途径的活性;装置,其包含配置以进行此类方法的数字压缩机;和非临时性存储介质,其存储由数字处理设备可执行以进行此类方法的指令。

Description

使用目标基因表达的概率建模评估细胞信号传导途径活性
本文描述的主题主要涉及生物信息学、基因组处理技术、蛋白质组处理技术及相关技术。
基因组和蛋白质组分析已经基本上实现了医疗领域诸如肿瘤学中的临床应用,并且是其的潜在希望,其中已知多种癌与基因组突变/变异和/或具体基因的高或低的表达水平的具体组合相关,其在癌的生长和演变(例如细胞增殖和转移)中起作用。例如,Wnt信号传导途径影响细胞增殖的调节,并且是高度调节的。由于丧失调节而导致的高Wnt途径活性与癌,其中与恶性结肠肿瘤相关。尽管不受任何具体运行理论的限制,但认为恶性结肠细胞中Wnt途径的去调节导致高Wnt途径活性,其依次导致恶性结肠细胞的细胞增殖,即结肠癌的扩散。另一方面,例如在骨质疏松症的情况中,异常低的途径活性可能也涉及(of interest)。
获取基因组和蛋白质组数据的技术在临床环境中已经变得容易获得。例如,常规使用通过微阵列的测量来评估基因表达水平、蛋白水平、甲基化等等。自动基因测序能够成本划算的鉴定DNA和mRNA中的遗传变异。基因测序过程中mRNA水平的定量评估保留了作为另一种评估基因表达水平的临床工具的希望。
尽管(或,也许,由于)这些进展,但基因组和蛋白质组分析的临床应用面临根本上的障碍——数据过载。例如,单一临床样品中可鉴定的突变的数目可以为成千上万或者更多的数目。这些突变的大多数是所谓的旁观者突变(bystander mutations)而对癌生长并无具体作用,并且仅有少数的确对癌生长和功能演变起作用,并且这些代表了有效治疗的靶标。单一微阵列能够产生数以万计基因的基因表达水平。处理这样大量的数据来鉴定临床上有用的信息,如例如在选择正确疗法的应用中是困难的。
一种方法是将分析限制为少数规范的或标准化的测试,诸如由美国食品和药物管理局(FDA)认可的测试。在这样的方法中,检测具体指示物或指示物的组合(例如突变和/或特定的高或低基因表达水平)以测试对所指示的疾病病况(例如癌的具体类型)为“阳性的”。规范测试由临床研究所支持,其已经显示出与疾病病况或与治疗效力密切相关。该方法仅用于已经开发了规范测试的那些临床病况,例如疾病的具体诊断、或预测在具体阶段具体癌类型中对药物的应答,并且由于它仅应用于规范的病况,因此也是精确的。
另一种方法基于鉴定基因组或蛋白质组指示物的功能相关的组。例如,Wnt途径包含蛋白质组反应的级联。该链的主要组分包括(但不限于)Wnt信号传导蛋白与细胞的卷曲表面受体的结合,其导致蛋白散乱家族(disheveled family of proteins)的蛋白的活化,其依次影响细胞核中的转录剂诸如基于β连环蛋白/TCF4的蛋白复合物的水平。这些转录剂依次控制目标mRNA分子的转录,其依次翻译为Wnt途径的目标蛋白。临床研究已经显示了Wnt途径的调节蛋白与Wnt途径的活性之间的某些关联。
然而,将此类临床研究结果应用到具体患者的诊断和临床评价中是困难的,这是由于信号传导途径例如Wnt途径的复杂性。作为简单实例,在Wnt途径的“上游”的蛋白表达水平的测量可以无法检测在Wnt途径的“下游”的蛋白的异常行为。认为Wnt途径包括大量反馈机制并且“上游”和“下游”的简单概念可能对于Wnt途径的本质部分是不适用的;更常见的是,包含Wnt途径的蛋白级联的一部分中的异常行为可能对蛋白级联的其他部分以及对作为整体的Wnt途径的活性具有或多或少的影响。还进一步,在某些临床研究中,信号传导级联的调节蛋白的蛋白表达水平通过测量编码该调节蛋白的基因的mRNA表达水平来评估。这是间接测量,其可能无法准确地评估调节蛋白表达水平,并且甚至难以反映有活性蛋白(在具体的翻译后修饰如磷酸化之后)的量。
导致产生本发明的主要问题因此是提供分别进行基因组和蛋白质组分析的合适方法和手段。当研究本说明书、本文提供的实施例时,以及具体是当研究所附的权利要求时,与本发明相关的问题以及进一步的缺陷下的具体方面变得明确。
本发明提供了如本文所公开的新的且改进的方法和装置。
与本发明的主要方面一致,以上问题通过使用目标基因表达的概率建模来评估细胞信号传导途径活性的具体方法来解决,即包括以下内容的方法:
至少基于在医疗受试者的组织的提取样品中测量的一种或多种细胞信号传导途径的一个或多个目标基因的表达水平(具体为mRNA和/或蛋白水平)来推断所述医疗受试者的组织中的一种或多种细胞信号传导途径的活性,其中所述推断包括:
通过评价概率模型(优选Bayesian网络)的至少一部分来推断医疗受试者的组织中一种或多种细胞信号传导途径的活性,所述模型对于一组输入表示一种或多种细胞信号传导途径,所述一组输入包括至少在医疗受试者的组织的提取样品中测量的一种或多种细胞信号传导途径的一个或多个目标基因的一个或多个表达水平;
估计医疗受试者的组织中至少一种转录因子(TF)元件(至少一个控制一种或多种细胞信号传导途径的一个或多个目标基因的TF元件)的水平,所述估计至少部分基于与至少一个TF元件和在医疗受试者的组织的提取样品中测量的一种或多种细胞信号传导途径的一个或多个目标基因的一个或多个表达水平有关的条件概率;和
基于组织样品中转录因子的估计水平来推断一种或多种细胞信号传导途径的活性;和
基于医疗受试者的组织中的一种或多种细胞信号传导途径的推断活性来确定在医疗受试者的组织中一种或多种细胞信号传导途径是否运行异常;
其中通过数字处理设备使用一种或多种细胞信号传导途径的概率模型来进行所述推断。
“一种或多种目标基因”可以是“直接目标基因”和/或“间接目标基因”(如本文所述)。
优选所述推断包含估计医疗受试者的组织中由概率模型的TF节点所代表的至少一种转录因子(TF)元件的水平,所述TF元件控制一种或多种细胞信号传导途径的一个或多个目标基因的转录,所述估计至少部分基于与代表在医疗受试者的组织的提取样品中测量的一种或多种细胞信号传导途径的一个或多个目标基因的概率模型中的所述TF节点和多个节点相关的概率模型的条件概率。
概率模型可以是Bayesian网络模型。因此,根据优选的实施方案,通过使用Bayesian网络进行推断,所述Bayesian网络包含代表关于一种或多种信号传导途径的信息的节点和Bayesian网络的连接节点之间的条件概率关系。
一种或多种细胞信号传导途径可以是Wnt途径、ER(雌激素受体)途径、AR(雄激素受体)途径和/或Hedgehog途径。因此,根据优选的实施方案,一种或多种细胞信号传导途径包含Wnt途径、ER途径、AR途径和/或Hedgehog途径。
具体合适的目标基因描述于以下正文部分以及下文的实施例中(例如见表1-9)。
因此,根据优选的实施方案,一个或多个目标基因选自包含以下目标基因或由其组成的组:表1或表6中列出的目标基因(对于Wnt途径)、表2、表5或表7中列出的目标基因(对于ER途径)、表3或表8中列出的目标基因(对于Hedgehog途径)以及表4或表9中列出的目标基因(对于AR途径)。
具体优选的是这样的方法,其中所述推断包括:
至少基于在医疗受试者的组织的提取样品中测量的一个或多个、优选至少三个Wnt途径的目标基因的表达水平来推断该医疗受试者的组织中Wnt途径的活性,所述目标基因选自包含以下或由其组成的组:KIAA1199、AXIN2、RNF43、TBX3、TDGF1、SOX9、ASCL2、IL8、SP5、ZNRF3、KLF6、CCND1、DEFA6和FZD7。
进一步优选这样的方法,其中所述推断进一步基于在医疗受试者的组织的提取样品中测量的至少一个Wnt途径的目标基因的表达水平,所述目标基因选自包含以下或由其组成的组:NKD1、OAT、FAT1、LEF1、GLUL、REG1B、TCF7L2、COL18A1、BMP7、SLC1A2、ADRA2C、PPARG、DKK1、HNF1A和LECT2。
具体优选的是这样的方法,其中所述推断(还)包括:
至少基于在医疗受试者的组织的提取样品中测量的一个或多个、优选至少三个ER途径的目标基因的表达水平来推断该医疗受试者的组织中ER途径的活性,所述目标基因选自包含以下或由其组成的组:CDH26、SGK3、PGR、GREB1、CA12、XBP1、CELSR2、WISP2、DSCAM、ERBB2、CTSD、TFF1和NRIP1。
进一步优选这样的方法,其中所述推断进一步基于在医疗受试者的组织的提取样品中测量的至少一个ER途径的目标基因的表达水平,所述目标基因选自包含以下或由其组成的组:AP1B1、ATP5J、COL18A1、COX7A2L、EBAG9、ESR1、HSPB1、IGFBP4、KRT19、MYC、NDUFV3、PISD、PREDM15、PTMA、RARA、SOD1和TRIM25。
还优选这样的方法,其中所述推断(还)包括
至少基于在医疗受试者的组织的提取样品中测量的一个或多个、优选至少三个Hedgehog途径的目标基因的表达水平来推断该医疗受试者的组织中Hedgehog途径的活性,所述目标基因选自包含以下或由其组成的组:GLI1、PTCH1、PTCH2、IGFBP6、SPP1、CCND2、FST、FOXL1、CFLAR、TSC22D1、RAB34、S100A9、S100A7、MYCN、FOXM1、GLI3、TCEA2、FYN和CTSL1。
进一步优选这样的方法,其中所述推断进一步基于在医疗受试者的组织的提取样品中测量的至少一个Hedgehog途径的目标基因的表达水平,所述目标基因选自包含以下或由其组成的组:BCL2、FOXA2、FOXF1、G19、HHIP、IL1R2、JAG2、JUP、MIF、MYLK、NKX2.2、NKX2.8、PITRM1和TOM1。
还优选这样的方法,其中所述推断(还)包括
至少基于在医疗受试者的组织的提取样品中测量的一个或多个、优选至少三个AR途径的目标基因的表达水平来推断该医疗受试者的组织中AR途径的活性,所述目标基因选自包含以下或由其组成的组:KLK2、PMEPA1、TMPRSS2、NKX3_1、ABCC4、KLK3、FKBP5、ELL2、UGT2B15、DHCR24、PPAP2A、NDRG1、LRIG1、CREB3L4、LCP1、GUCY1A3、AR和EAF2。
进一步优选这样的方法,其中所述推断进一步基于在医疗受试者的组织的提取样品中测量的至少一个AR途径的目标基因的表达水平,所述目标基因选自包含以下或由其组成的组:APP、NTS、PLAU、CDKN1A、DRG1、FGF8、IGF1、PRKACB、PTPN1、SGK1和TACC2。
本发明的另一方面涉及这样的方法(如本文所述),进一步包括:
为医疗受试者推荐开药,所述药物矫正一种或多种细胞信号传导途径的异常运行;
其中只有当基于一种或多种细胞信号传导途径的推断活性来确定所述一种或多种细胞信号传导途径在医疗受试者的组织中运行异常时,才进行所述推荐。
本发明还涉及这样的方法(如本文所述),其包括:
至少基于在医疗受试者的组织的提取样品中测量的Wnt途径的一组目标基因中两个、三个或更多个的目标基因的表达水平来推断该医疗受试者的组织中Wnt途径的活性
和/或
至少基于在医疗受试者的组织的提取样品中测量的ER途径的一组目标基因中两个、三个或更多个的目标基因的表达水平来推断该医疗受试者的组织中ER途径的活性
和/或
至少基于在医疗受试者的组织的提取样品中测量的Hedgehog途径的一组目标基因中两个、三个或更多个的目标基因的表达水平来推断该医疗受试者的组织中Hedgehog途径的活性,
和/或
至少基于在医疗受试者的组织的提取样品中测量的AR途径的一组目标基因中两个、三个或更多个的目标基因的表达水平来推断该医疗受试者的组织中AR途径的活性。
优选地,
Wnt途径的所述目标基因的组包括至少九个,优选所有选自包含以下或由其组成的组中的目标基因:KIAA1199、AXIN2、RNF43、TBX3、TDGF1、SOX9、ASCL2、IL8、SP5、ZNRF3、KLF6、CCND1、DEFA6和FZD7,
和/或
ER途径的所述目标基因的组包括至少九个,优选所有选自包含以下或由其组成的组中的目标基因:CDH26、SGK3、PGR、GREB1、CA12、XBP1、CELSR2、WISP2、DSCAM、ERBB2、CTSD、TFF1和NRIP1,
和/或
Hedgehog途径的所述目标基因的组包括至少九个,优选所有选自包含以下或由其组成的组中的目标基因:GLI1、PTCH1、PTCH2、IGFBP6、SPP1、CCND2、FST、FOXL1、CFLAR、TSC22D1、RAB34、S100A9、S100A7、MYCN、FOXM1、GLI3、TCEA2、FYN和CTSL1,
和/或
AR途径的所述目标基因的组包括至少九个,优选所有选自包含以下或由其组成的组中的目标基因:KLK2、PMEPA1、TMPRSS2、NKX3_1、ABCC4、KLK3、FKBP5、ELL2、UGT2B15、DHCR24、PPAP2A、NDRG1、LRIG1、CREB3L4、LCP1、GUCY1A3、AR和EAF2。
具体优选这样的方法,其中
Wnt途径的所述目标基因的组进一步包括至少一个选自包含以下或由其组成的组中的目标基因:NKD1、OAT、FAT1、LEF1、GLUL、REG1B、TCF7L2、COL18A1、BMP7、SLC1A2、ADRA2C、PPARG、DKK1、HNF1A和LECT2,
和/或
ER途径的所述目标基因的组进一步包括至少一个选自包含以下或由其组成的组中的目标基因:AP1B1、ATP5J、COL18A1、COX7A2L、EBAG9、ESR1、HSPB1、IGFBP4、KRT19、MYC、NDUFV3、PISD、PREDM15、PTMA、RARA、SOD1和TRIM25,
和/或
Hedgehog途径的所述目标基因的组进一步包括至少一个选自包含以下或由其组成的组中的目标基因:BCL2、FOXA2、FOXF1、G19、HHIP、IL1R2、JAG2、JUP、MIF、MYLK、NKX2.2、NKX2.8、PITRM1和TOM1,
和/或
AR途径的所述目标基因的组进一步包括至少一个选自包含以下或由其组成的组中的目标基因:APP、NTS、PLAU、CDKN1A、DRG1、FGF8、IGF1、PRKACB、PTPN1、SGK1和TACC2。
根据本发明使用的一种或多种样品可以是这样的样品,例如其获自乳腺损伤,或获自已知或怀疑具有结肠癌的医疗受试者的结肠,或获自已知或怀疑具有肝癌的医疗受试者的肝,等等,优选经活组织检查方法或其他样品提取方法获得。提取样品的组织还可以是转移组织,例如,(怀疑的)源自结肠、乳腺、肝或已经扩散到结肠、乳腺、肝或其他器官之外的其他器官的恶性组织。在某些情况下,组织样品可以是循环的肿瘤细胞,即已经进入血流并且可以使用合适的分离技术提取作为提取的组织样品的肿瘤细胞。
本发明的另一个公开方面涉及如本文所述的非临时性存储介质或如本文所述的计算机方法用于疾病的特异性诊断或预测在具体阶段在具体癌类型中对药物的应答的用途。
根据另一公开方面,配置包含数字处理器的装置来进行如本文所述的本发明的方法。
根据另一公开方面,非临时性存储介质存储通过数字处理设备可执行的指令来进行如本文所述的本发明的方法。非临时性存储介质可以是计算机可读取的存储介质,诸如硬盘驱动器或其他磁性存储介质、光盘或其他光存储介质、随机存取存储器(RAM)、只读存储器(ROM)、闪速存储器、或其他电子存储介质、网络服务器等等。数字处理设备可以是手提式设备(例如,个人数据助手或智能电话)、笔记本计算机、台式计算机、平板计算机或设备、遥控网络服务器等等。
根据另一公开方面,计算机方法包含方法代码工具用于使数字处理设备进行如本文所述的本发明的方法。数字处理设备可以是手提式设备(例如,个人数据助手或智能电话)、笔记本计算机、台式计算机、平板计算机或设备、遥控网络服务器等等。
一种优点在于临床决策支持(CDS)系统基于一种或多种细胞信号传导途径的概率分析提供临床推荐,例如使用Wnt途径、ER途径、AR途径和/或Hedgehog途径的Bayesian网络模型。
另一优点在于细胞信号传导途径活性的改进的评估受误差影响更低。
另一优点在于提供CDS系统,其为细胞信号传导途径的调节丧失推荐靶向治疗。
另一优点在于提供CDS系统,将其设计为检测具体的细胞信号传导途径的调节丧失,诸如Wnt途径、ER途径、AR途径或Hedgehog途径,并且其易于适应为起源于具体细胞信号传导途径的不同类型的癌提供推荐。
如本文所述的本发明还可以例如有利地与以下一起使用
- 基于预测(推断)的活性的诊断;
- 基于预测(推断)的活性的预后;
- 基于预测(推断)的活性的药物处方;
- 基于预测(推断)的活性的药物效力预测;
- 基于预测(推断)的活性的副作用预测;
- 药物效力监测;
- 药物开发;
- 测定开发;
- 途径研究;
- 癌分期;
- 基于预测(推断)的活性的临床试验中受试者的注册;
- 待进行的后续测试的选择,和/或;
- 伴随诊断测试的选择。
在阅读并理解所附的附图、以下描述及具体在阅读本文以下提供的更详尽的实施例后,进一步的优点对于本领域技术人员而言将是显而易见的。
图1 显示了表示细胞信号传导途径的部分的简单Bayesian网络。细胞信号传导途径由转录因子(TF)复合物和作为存在的转录因子复合物的结果产生的目标基因所表示。在二元离散的情况下TF元件与目标基因之间的概率关系可以由简图中所示的条件概率表所表示。
图2 显示了描述假定的细胞信号传导途径的的说明性Bayesian网络。上游蛋白和下游目标mRNA节点均描绘于简图中。上游蛋白作为转录因子复合物中的输入,而目标mRNAs为转录因子复合物的输出节点。
图3 显示了具有多个转录因子复合物的单一细胞信号传导途径或具有组合入一个Bayesian网络的它们自身的转录信号复合物的多个细胞信号传导途径或其组合的Bayesian网络代表的说明性实例。
图4 显示了说明与图1类似的细胞信号传导途径的简单代表的Bayesian网络的实例。现在已经加入额外的节点以代表目标mRNA向目标蛋白的翻译。
图5 显示了说明细胞信号传导途径的另一个简单代表的Bayesian网络的说明。使用转录因子复合物及它的目标蛋白水平来代表途径。
图6 显示了具有节点的额外层的图1的说明性Bayesian网络,所述节点代表微阵列芯片上连系探针强度与对应的目标mRNA水平的探针组(probesets)。
图7 显示了图1的Bayesian网络的变体实施方案的说明性实例,其包括代表甲基化和拷贝数变化的节点作为该具体实例中所包括的任何目标mRNA水平的额外信息节点的实例。
图8 显示了在结肠样品(GSE20916)的数据组中如本文所述的Bayesian网络和最近重心法的预测的Wnt途径活性。
图9 显示了在结肠样品(GSE4183)的数据组中如本文所述的Bayesian网络和最近重心法的预测的Wnt途径活性。
图10 显示了在结肠样品(GSE15960)的数据组中如本文所述的Bayesian网络和最近重心法的预测的Wnt途径活性。
图11 显示了在乳腺癌样品(GSE12777)的数据组中如本文所述的Bayesian网络和最近重心法的预测的Wnt途径活性。
图12 显示了在乳腺癌样品(GSE21653)的数据组中如本文所述的Bayesian网络和最近重心法的预测的Wnt途径活性。
图13 显示了在肝癌样品(GSE9843)的数据组中如本文所述的Bayesian网络和最近重心法的预测的Wnt途径活性。
图14 显示了在结肠样品(GSE20916)的数据组中如本文所述的使用Bayesian网络使用证据组织列表(evidence curated list)的目标基因相比于广泛文献列表的目标基因的预测的Wnt途径活性。
图15 显示了在结肠样品(GSE4183)的数据组中如本文所述的使用Bayesian网络使用证据组织列表的目标基因相比于广泛文献列表的目标基因的预测的Wnt途径活性。
图16 显示了在结肠样品(GSE15960)的数据组中如本文所述的使用Bayesian网络使用证据组织列表的目标基因相比于广泛文献列表的目标基因的预测的Wnt途径活性。
图17 显示了在乳腺癌样品(GSE12777)的数据组中如本文所述的使用Bayesian网络使用证据组织列表的目标基因相比于广泛文献列表的目标基因的预测的Wnt途径活性。
图18 显示了在肝癌样品(GSE9843)的数据组中如本文所述的使用Bayesian网络使用证据组织列表的目标基因相比于广泛文献列表的目标基因的预测的Wnt途径活性。
图19 显示了在成神经管细胞瘤样品(GSE10327)的数据组中如本文所述的使用Bayesian网络使用证据组织列表的目标基因相比于广泛文献列表的目标基因的预测的Wnt途径活性。
图20 图示了配置以评估一种或多种如本文公开的细胞信号传导途径的临床决策支持(CDS)系统(示例性显示为Wnt途径)。
图21 显示了来自GSE4183的结肠样品中预测的Wnt途径活性。
图22 显示了来自GSE10327的成神经管细胞瘤样品中预测的Wnt途径活性。
图23 显示了来自GSE9843的肝癌样品中预测的Wnt途径活性。
图24 显示了来自GSE12777的乳腺癌细胞系中预测的Wnt途径活性。
图25 显示了来自GSE12777的乳腺癌细胞系中预测的ER途径活性。
图26 显示了来自GSE12276的乳腺癌样品中预测的ER途径活性。
图27 显示了来自GSE36133的癌细胞系中预测的ER途径活性。
图28 显示了来自GSE34211的癌细胞系中预测的Hedgehog途径活性。
图29 显示了来自GSE10327的成神经管细胞瘤样品中预测的Hedgehog途径活性。
图30 显示了来自GSE12276的乳腺癌样品中预测的Hedgehog途径活性。
图31 显示了来自GSE21618的MCF7和他莫昔芬抗性细胞系中预测的ER途径活性。
图32 显示了来自GSE11324的雌激素刺激的MCF7细胞系样品的时间序列中预测的ER途径活性。
图33 显示了GSE12276的管腔A样品中Wnt、ER和Hedgehog途径活性。
图34 显示了GSE12276的基本样品中Wnt、ER和Hedgehog途径活性。
图35 显示了来自GSE20916的结肠样品中预测的Wnt途径活性。
图36 显示了用雌激素(E2)刺激的MCF7细胞系或阴性对照(EtOH) (GSE9253)中预测的ER途径活性。
图37 显示了来自根据途径活性分组的GSE12276数据组的患者的Kaplan-Meier存活曲线。
图38 显示了来自GSE7708用不同治疗方案处理的LNCaP细胞系中预测的AR途径活性。
图39 显示了来自GSE17951的前列腺癌样品中预测的AR途径活性。
图40 显示了来自GSE12276的乳腺癌样品中预测的AR途径活性。
图41 显示了含有代表多种癌类型的细胞系样品的GSE36133数据组中预测的AR途径活性。
图42 显示了含有代表多种癌类型的细胞系样品的GSE34211数据组中预测的AR途径活性。
以下实施例仅仅说明具体优选的方法和与其相关的所选的方面。其中提供的教导可用于构建几种测试和/或试剂盒,例如来检测、预测和/或诊断一种或多种细胞信号传导途径的异常活性。此外,根据使用如本文所述的方法,能够有利地指导药物处方,能够进行药物预测和药物效力(和/或副作用)的监测,能够预测并监测药物抗性,例如来选择后续待进行的一种或多种测试(如伴随诊断测试)。以下实施例不应解释为限制本发明的范围。
实施例1:Bayesian网络构建
如本文所公开,通过构建概率模型(例如图6中显示的说明性Bayesian模型)并且并入大量不同的目标基因的表达水平与细胞信号传导途径的活性之间的条件概率关系,可以使用此类模型以高度的准确性来测定细胞信号传导途径的活性。此外,通过调节条件概率并/或向模型中加入新的节点来代表额外的信息源,能够容易地升级概率模型来并入通过后期临床研究获得的额外知识。在这种方式中,能够适当地升级概率模型来包括最近的医学知识。
代表细胞信号传导途径的最简单的Bayesian网络模型之一将是包括转录因子元件及相关的目标基因的两水平模型(见图1)。转录因子复合物元件是转录因子复合物的水平的代表。转录因子元件的蛋白水平与转录因子的目标基因的许多mRNA水平相关(在该示例性Bayesian网络中,仅描述了三个目标基因,已知在转录因子可获得的情况下其表达于组织中)。应该理解许多、大部分或所有的途径的目标基因(在Wnt、ER、Hedgehog和AR途径的情况下,具体分别为表1、表2、表3和表4中提及的目标基因)类似地由TF元件调节。TF元件的水平与目标基因的mRNA水平之间的关系通过边缘在Bayesian网络中建立模型。对于目标基因的每一个,条件概率分布说明了基因的mRNA水平如何依赖于TF元件的水平。
TF元件和目标基因的水平可以多种表示。一种选择是使用二元离散,对TF元件为状态“不存在”和“存在”,以及对目标基因的mRNA水平为“下”和“上”(见图1)。TF元件与目标基因之间的概率关系随后可以由条件概率表所表示(如同一附图中所示)。除了二元离散,水平还可以表示为连续的水平值,或者为具有三种或更多种量子化水平的量子化的值(例如,对于目标基因为“下”、“正常”和“上”)。
简单Bayesian网络的前述说明仅仅是Bayesian网络模型的说明性实施方案(图1)。通常,Bayesian网络模型包含通过边缘连接的节点的无环有向图。每一节点代表关于邻近(at hand)的途径(或者更常见地,关于细胞信号传导途径)的信息项。途径元件节点每一个代表细胞信号传导途径的基因组或蛋白质组元件。通过说明性实例,途径元件节点可以代表以下之一但不限于此:蛋白、蛋白复合物、从细胞信号传导途径的目标基因转录的mRNA分子、甲基化的基因、磷酸化的蛋白、磷酸化的蛋白复合物,等等。如本文之后所讨论的,几种其他类型的节点(但不限于给出的实例)可以包括于Bayesian网络中以代表其他类型的信息,诸如具体测量数据元件、基因变异发生,等等。
如果此类蛋白水平的知识对于确定临床决策支持推荐能够提供证据,则通常将代表途径的调节蛋白(以有活性的或无活性的状态)的额外的“上游”水平加入。例如,如果特异性靶向此类蛋白而非整个途径的药物是可获得的,在Bayesian网络中包含对转录因子基本的蛋白或转录因子上游的必要蛋白(见图2)可能是有用的。认为转录因子(TF)元件是大部分信号传导途径中的蛋白复合物(即,以特定结构结合在一起的蛋白的组合,其行使调节从目标基因的转录的功能)。对于其他途径,TF元件可以是单一蛋白。此外,信号传导途径可以经多于一个转录因子行使它们的活性,导致具有流入(feeding)一个或多个目标基因的多个转录因子的更复杂的Bayesian网络(见图3影响目标基因转录的多个转录因子元件的假定说明)。这样的多转录因子Bayesian网络还可以是在一个Bayesian网络中组合的途径的组合的结果。
目标基因进一步下游的额外的信息节点也可以包括在Bayesian网络中。该说明性的实例是目标基因mRNA翻译为蛋白(图4)或者作为目标基因mRNA水平的替代节点的目标基因的蛋白水平节点(图5)。目标基因的mRNA分子通过与核糖体分子相互作用翻译来形成对应于mRNA分子和对应于目标基因的蛋白。这是目标基因在蛋白水平上的表达。通过但不限于例如质谱法、免疫组织化学、凝胶电泳技术的蛋白水平的测量可以作为这些目标蛋白水平的证据。
可以基于微阵列对应的探针组的测量强度,例如通过求平均数或通过其他技术的其他手段(例如RNA测序)来计算目标基因的表达水平。在某些实施方案中,如本文所述并参考图6,通过用每一探针组的节点扩展Bayesian网络将该计算整合入Bayesian网络中,所述探针组被使用并且包括运行来自对应的目标基因节点的这些“测量”节点的每一个的边缘。
概率模型任选还可以并入额外的基因组信息,诸如突变的信息、拷贝数变化、基因表达、甲基化、易位信息等等,其改变与途径的信号传导级联相关的基因组序列以推断途径活性并定位导致异常功能(活化或无活性)的Wnt途径中的缺陷,如同图7对甲基化和拷贝数数据的说明性情况的说明性参考所述。然而,应该理解其他类型的关于目标基因的信息类似地翻译为信息节点。此类基因组信息可以通过但不限于RNA测序和SNP分析来获得。
此外,应该理解尽管本文后面所述的实施例关于提供Wnt、ER、AR和Hedgehog途径作为说明性实例,但本文公开的对细胞信号传导途径分析的方法容易地应用于这些途径之外的其他细胞信号传导途径,诸如具有细胞膜中受体的胞内信号传导途径(例如Notch、HER2/PI3K、TGFβ、EGF、VEGF和TNF-NFκB细胞信号传导途径)和具有细胞内受体的胞内信号传导途径(例如孕酮、视黄酸、和维生素D细胞信号传导途径)。
实施例2:机器学习方法的比较
在此用Wnt途径作为实例彼此比较两种类型的机器学习技术的性能:将通过最近重心法的手段预测Wnt活性与本发明选择的方法比较,其例如使用Bayesian网络。
如上所讨论,基于它的优点在于:使用条件概率关系,概率方法能够并入“软”形式(例如展示出提供证据的特征的研究个体的百分比)和“硬”形式中可获得的信息,选择Bayesian网络方法。此外,概率模型还使信息能够基于解释细胞信号传导途径的部分(而非综合的)知识再经使用条件概率表来并入。
此处证明相比于其他机器学习方法(例如众所周知的方法最近重心分类),发明人使用Bayesian网络以它们包括已知的生物学特性和软证据的可获得性的方式加入值。最近重心分类是机器学习方法,其中对于每一类的训练样品,计算平均概况(=重心),并且随后,对于待分类的样品,基于最近的重心(然后最近重心的标签是预测结果)预测标签。根据Bayesian网络中所用的探针组的相同列表计算两个重心,并且对于“Wnt开”和“Wnt关”重心,它们分别基于GSE8671的相同fRMA处理数据的腺瘤样品和正常结肠样品。随后使用样品和两个重心之间的两个欧几里德距离的log2-比来分类来自多种数据组的样品以推断样品的分类。这表示log2-比为0对应于样品与两个重心的相同距离,值> 0对应于分类为有活性的Wnt信号传导的样品,而值< 0对应于鉴定为具有无活性的Wnt信号传导途径的样品。
构建与图6和本文所述的方法类似的Bayesian网络。与Wnt Bayesian网络的该描述类似,使用来自Gene Expression Omnibus的数据组GSE8671的32个正常结肠样品和32个腺瘤样品的fRMA处理数据(在http://www.ncbi.nlm.nih.gov/geo/上可进入,最后于2011年7月13日访问)训练探针组及它们对应基因之间的边缘的条件概率表。随后用多种数据组测试训练后的Bayesian网络来推断Wnt途径为“开”的概率P(Wnt开),即有活性的,其与Wnt途径转录复合物“存在”的推断概率相同。
随后用多种fRMA处理的微阵列数据组来测试训练后的Bayesian网络和最近重心模型,来推断通过P(Wnt开)和距离的log2-比测量的Wnt途径是“开”的概率。Bayesian网络和最近重心模型结果的概述显示于图8-13中。读者应该注意两种方法的输出度量不是一对一关系,然而,在方法中输出度量的标记和相对量级是相当的。
结肠(癌)样品(GSE20916, GSE4183)的非常大的部分平均分类在有活性的和无活性的Wnt途径中,除了GSE15960之外,其有一大部分在最近重心法中错误地分类为阴性样品(假阴性)。假阴性的更高部分的这种感知也维持在其他癌类型中。这尤其是对于乳腺癌样品(GSE12777, GSE21653)和肝癌(GSE9843)是正确的;除了少数例外,预测所有样品均具有无活性的Wnt途径,已知其在基础类型的乳腺癌和CTNNB1肝癌样品的情况中是不正确的。在某些情况下,在例如GSE15960中明显的是,可以通过降低和增加最近重心分类的阈值来校正分类。这之后的理念将是Wnt活性的阈值在不同组织类型中可能是改变的。然而,这会涉及可应用于其他组织类型的最近重心法的额外训练。Bayesian网络模型的长处之一是该组织特异性训练不是必需的,这是由于将它设立为对组织类型非特异性的。
实施例3:目标基因的选择
转录因子(TF)是蛋白复合物(即,以特定结构结合在一起的蛋白的组合)或蛋白,其通过结合特定DNA序列能够调节来自目标基因的转录,由此控制从DNA至mRNA遗传信息的转录。由于转录复合物的这种作用直接产生的mRNA在本文中称为“直接目标基因”。途径激活还可以产生更多二级基因转录,称为“间接目标基因”。在下文中,优选包含直接目标基因或者由其组成的Bayesian网络模型(作为示例性概率模型)作为途径活性和mRNA水平之间的直接联系,然而直接和间接目标基因之间的区别并不总是明显的。在此呈现使用基于可获得的文献数据的评分函数选择直接目标基因的方法。尽管如此,由于有限的信息和生物学变异及不确定性,不能排除间接目标基因的意外选择。
根据积累证据的科学实验的类型,通过使用其中对于特定目标基因的科学证据给予等级的分级系统,从科学文献中选择特定途径mRNA目标基因。尽管某些实验证据仅仅暗示基因为目标基因,如例如在其中已知Hedgehog途径是有活性的胚胎的微阵列中增加的mRNA,但其他证据可以是非常有力的,如鉴定的途径转录因子结合位点和细胞中特定途径的刺激后染色质免疫沉淀(ChIP)测定中该位点的取回以及细胞系中途径的特定刺激后mRNA的增加的组合。
可以在科学文献中鉴定用于发现特定途径目标基因的几种类型的实验:
1. ChIP实验,其中显示了途径-转录因子与它在基因组上的结合位点的直接结合。实例:通过使用染色质-免疫沉淀(ChIP)技术,随后将具有和不具有有活性的Wnt途径的结肠细胞系的DNA中的假定的功能TCF4转录因子结合位点鉴定为仅基于核苷酸序列识别的结合位点的亚组。将假定的功能性鉴定为来源于ChIP的证据,即发现转录因子结合DNA结合位点。
2. 电泳迁移率变化(EMSA)测定,其显示了转录因子与含有结合序列的DNA片段的体外结合。相比于基于ChIP的证据,基于EMSA的证据更弱,这是由于它无法被翻译为体内情形。
3. 途径的刺激和测量微阵列上的mRNA概况或使用RNA测序,使用途径诱导的细胞系并测量在存在放线菌酮的情况下诱导后几个时间点测量的mRNA概况,其抑制翻译为蛋白,因而假定诱导的mRNAs是直接目标基因。
4. 与3类似,但使用定量PCR来测量mRNAs的量。
5. 使用生物信息学方法鉴定基因组中的转录因子结合位点。对于Wnt途径的实例:使用已知的TCF4-β连环蛋白转录因子DNA结合序列,在人基因组序列上运行软件方法,并鉴定基因启动子区中和其他基因组区中潜在的结合位点。
6. 与3类似,仅仅是不存在放线菌酮。
7. 与4类似,仅仅是不存在放线菌酮。
8. 特定组织或细胞样品的mRNA表达概况,其中已知途径是有活性的,但在不存在合适的阴性对照条件的情况下。
在最简单的形式中,技术人员能够对其中鉴定目标mRNA的这些实验方法的每一种给予潜在的目标mRNA 1分。
或者,分能够递增给予,表示一种技术1分,第二种技术加第二分,等等。使用该相对分级策略,技术人员能够形成最可靠的目标基因的列表。
或者,可以使用以另一种方式的分级来鉴定最可能是直接目标基因的目标基因,通过给予提供体内直接目标基因最多证据的技术更高数目的分,在上文的列表中,这将表示对实验方法1)为8分,对2)为7分,并且降低至对实验方法8为1分。这样的列表可以被称为“一般目标基因列表”。
尽管存在生物学变异和不确定性,但发明人假定直接目标基因最可能以组织不依赖的形式来诱导。这些目标基因的列表可被称为“证据组织目标基因列表”。已经使用这些组织的目标列表来构建计算模型,其能够应用于来自不同组织来源的样品。
“一般目标基因列表”可能包含更加组织特异性的基因,并且能够潜在地用于优化并增加应用于来自特定组织样品如乳腺癌样品的模型的灵敏度和特异性。
以下将示例性说明证据组织目标基因列表的选择如何具体构建ER途径。
为了选择用作“模型”的输入的ER目标基因的目的,使用以下三种标准:
1. 基因启动子/增强子区含有雌激素应答元件(ERE)基序:
a. 应该证明ERE基序响应雌激素,例如通过其中特定ERE基序连接报道基因的瞬时转染测定的手段,和
b. ERE基序的存在应该通过例如基因启动子/增强子区的富含基序分析来确定。
2. 通过例如ChIP/CHIP实验或染色质免疫沉淀测定证实ER(差异地)体内结合所讨论的基因的启动子/增强子区:
a. 证实当ER途径为有活性时ER结合基因的启动子/增强子区,和
b. 如果ER途径没有活性,则(优选)不结合(或弱结合)基因的基因启动子/增强子区。
3. 例如通过以下证实当ER途径是有活性的,该基因差异转录,
a. 经实时PCR或微阵列实验的所讨论的基因的mRNA的倍数富集,或
b. 经免疫沉淀测定证实RNA Pol II结合基因的启动子区。
通过确定这样的基因为ER目标基因来完成选择,对于所述基因集合了足够且充分记载的证明上述所有三个标准均达到的实验证据。收集ER差异结合证据的合适实验是比较当暴露于或不暴露于雌激素时,响应雌激素的癌细胞系(例如MCF-7细胞系)中的ChIP/CHIP实验的结果。其同样适用于收集mRNA转录的证据。
上文讨论了目标基因选择方法的一般方法和更具体的实例,其已用于基于使用上述方法发现的证据来选择大量的目标基因。在对示例性途径即Wnt、ER、Hedgehog和AR途径的Bayesian网络模型中使用的目标基因列表分别显示于表1、表2、表3和表4中。
用于本文所述的ER途径的Bayesian网络的ER途径的目标基因(显示于表2中)包含基于它们文献证据分值选择目标基因;仅将具有最高证据分值的目标基因(优选本发明的目标基因)加入该短表中。还包括具有更低证据分值的那些基因在内的ER目标基因的完整列表显示于表5中。
显示于表1、表2、表3和表4中的Wnt、ER、Hedgehog和AR途径的目标基因的进一步亚选择或分级基于文献证据分值和使用联系探针组节点与对应的目标基因节点的训练后的条件概率表计算的比值比(odds ratios)的组合来进行。所述比值比为在推断途径活性中目标基因重要性的评估。通常,预期相比于具有更低比值比的目标基因,具有更高比值比的目标基因的表达水平可能对于途径的总体活性信息更多。然而,由于细胞信号传导途径的复杂性,应该理解更复杂的相互关系可以存在于目标基因与途径活性之间-例如,在分离中考虑具有低比值比的目标基因的多种组合的表达水平可以比考虑具有更高比值比的目标基因更有证明性。在本文报道的Wnt、ER、Hedgehog和AR建模中,已经发现表6、表7、表8和表9中显示的目标基因相比于更低分级的目标基因对预测Wnt、ER、Hedgehog和AR途径活性有更高的证明性(因此,表6-9中显示的目标基因根据本发明尤其优选)。尽管如此,鉴于使用获取技术诸如微阵列能够获得大量组基因的表达水平的相对容易,考虑在如图6中所示的Bayesian模型中利用表6、表7、表8和表9的目标基因的某些或全部,并且任选额外使用表1、表2、表3和表4中显示的分级的一个、两个、某些或全部额外的目标基因。
表1. 用于Bayesian网络中的Wnt途径的目标基因和用于测量目标基因的mRNA表达水平的相关探针组的证据组织列表(# =附加序列表中的序列编号)。
Figure 45422DEST_PATH_IMAGE001
Figure 962562DEST_PATH_IMAGE002
表2. 用于Bayesian网络中的ER途径的目标基因和用于测量目标基因的mRNA表达水平的相关探针组的证据组织列表(# =附加序列表中的序列编号)。
Figure 539037DEST_PATH_IMAGE003
表3. 用于Bayesian网络中的Hedgehog途径的目标基因和用于测量目标基因的mRNA表达水平的相关探针组的证据组织列表(# =附加序列表中的序列编号)。
Figure 934246DEST_PATH_IMAGE004
Figure 827247DEST_PATH_IMAGE005
表4. 用于Bayesian网络中的AR途径的目标基因和用于测量目标基因的mRNA表达水平的相关探针组的证据组织列表(# =附加序列表中的序列编号)。
Figure 712026DEST_PATH_IMAGE006
Figure 541178DEST_PATH_IMAGE007
表5. 发现具有明显文献证据的ER目标基因的基因符号(=ER目标基因长表)(# =附加序列表中的序列编号)。
Figure 740078DEST_PATH_IMAGE008
表6. 基于文献证据分值和比值比的Wnt目标基因的短表(# =附加序列表中的序列编号)。
Figure 736853DEST_PATH_IMAGE009
表7. 基于文献证据分值和比值比的ER目标基因的短表(# =附加序列表中的序列编号)。
Figure 730217DEST_PATH_IMAGE010
表8. 基于文献证据分值和比值比的Hedgehog目标基因的短表(# =附加序列表中的序列编号)。
Figure 297596DEST_PATH_IMAGE011
表9. 基于文献证据分值和比值比的AR目标基因的短表(# =附加序列表中的序列编号)。
Figure 34608DEST_PATH_IMAGE012
实施例4:证据组织列表与广泛文献列表的比较
将按照本文所述的方法基于文献证据构建的Wnt目标基因的列表(表1)与未按照上述方法的目标基因的另一个表进行比较。可选表为这样基因的编辑,所述基因为由著名实验室(已知他们在分子生物学和Wnt途径领域中的专业知识)在三种公共来源中公开的通过多种不同实验方法的各种数据表明为Wnt目标基因。可选表是来自Hatzis等(Hatzis P, 2008)的表S3、来自de Sousa e Melo (de Sousa E Melo F, 2011)的文本和表S1 A及由Wnt信号传导领域的先驱Roel Nusse收集并维护的目标基因列表(Nusse, 2012)中提及的基因的组合。这三种来源的组合产生了124个基因的列表(=广泛文献列表,见表10)。在此讨论是否通过来源于该可选表的算法预测临床样品中的Wnt活性的性能与基于现存的基因列表(=证据组织列表,表1)构建的模型表现类似或比其更好这一问题。
表10. Wnt目标基因的可选表(=广泛文献列表)(# =附加序列表中的序列编号)。
Figure 863203DEST_PATH_IMAGE015
下一步由发现对应于基因的Affymetrix? GeneChip Human Genome U133 Plus 2.0阵列的探针组组成。该方法使用R中的Bioconductor插件和基于UCSC基因组浏览器的对探针组相关性的手动组织来进行,由此去除例如相反链上或基因外显子区之外的探针组。对于124个基因中的两个,在该微阵列-芯片上不存在可用的探针组,并因此无法插入到Bayesian网络中,这些是LOC283859和WNT3A。总计发现287个探针组对应剩余的122个基因(表11)。
表11. 与广泛文献基因列表中的Wnt目标基因相关的探针组(# =附加序列表中的序列编号)。
Figure 104829DEST_PATH_IMAGE016
Figure 176690DEST_PATH_IMAGE017
Figure 820161DEST_PATH_IMAGE018
随后构建与图6和本文解释的方法类似的Bayesian网络。与基于证据组织列表的Wnt Bayesian网络的该描述类似,使用来自Gene Expression Omnibus的数据组GSE8671的32个正常结肠样品和32个腺瘤样品的fRMA处理数据(在http://www.ncbi.nlm.nih.gov/geo/上可进入,最后于2011年7月13日访问)训练证据组织列表和广泛文献列表的探针组及它们对应基因之间的边缘的条件概率表。
随后用多种数据组检测训练后的Bayesian网络来推断Wnt途径为“开”的概率P(Wnt开),即有活性的,其与Wnt途径转录复合物“存在”的推断概率相同。训练的广泛文献列表模型和证据组织模型的概述结果显示于图14-19中。
显然,能够推得对于是开或关的Wnt信号传导广泛文献模型通常预测的更极端的概率。此外,可选模型对于结肠癌数据组(GSE20916, GSE4183, GSE15960)预测了类似结果,但多于乳腺癌(GSE12777)、肝癌(GSE9843)和成神经管细胞瘤样品(GSE10327)数据组中具有预测的有活性Wnt信号传导的预期样品。
总之,广泛文献目标基因列表一方面在结肠癌中产生了几乎同样好的Wnt活性预测,但另一方面却在其他癌类型中预测更差(太多假阳性)。这可能是目标基因的可选表太过特异地偏向结肠细胞因而过于组织特异性的结果;尽管非结肠特异性Wnt目标基因也可包括在内,但de Sousa E Melo等和Hatzis等主要兴趣为结肠直肠癌。此外,这些列表中可能包括的非Wnt特异性目标基因可能是其他癌类型中Wnt活性的更差预测的来源。可选表可能包含更间接调节的目标基因,其可能使它更加组织特异性的。原始列表趋于包含直接目标基因,其最可能代表在所有组织中是Wnt灵敏的基因,因而降低了组织特异性。
实施例5:训练并使用Bayesian网络
在Bayesian网络可以用于推断测试样品中的途径活性之前,必须确定描述网络元件之间的概率关系的参数。此外,在输入测量的离散状态的情况下,必须将阈值设定为描述如何处理离散化。
通常,使用训练样品的代表组训练Bayesian网络,优选其所有网络节点的所有状态均是已知的。然而,从许多不同类型的癌中获得训练样品(已知其哪种活化状态是将要建模的途径的)是不实际的。结果是,可用的训练组由有限数量的样品组成,通常仅来自于一种类型的癌。为了使Bayesian网络良好地概括其他类型的样品,因此技术人员必须特别关注确定参数的方式,其优选如本文所述的以下方法完成。
对于TF节点,状态“不存在”和“存在”中的(无条件的)概率通过一大组样品的预期发生来给予。或者,技术人员可以如图1中所做将它们设定为0.5,以对阳性或阴性结果不具有偏离。
对于目标基因节点,条件概率如图1中设定。如果TF元件为“不存在”,最可能目标基因是“下”,因此对此选择0.95的概率,并且对为“上”的目标基因选择0.05的概率。后者(非零)概率为了解释目标基因受其他因子调节或意外地观察为“上”(例如由于测量噪声)的(罕见)概率。如果TF元件“存在”,则以0.70的公平概率目标基因为“上”,并且以0.30的概率目标基因为“下”。以这种方式选择后者值,这是由于可以存在即使TF元件存在但目标基因却并未高度表达的几种原因,例如由于基因启动子区被甲基化。在目标基因并未由TF元件上调但却下调的情况下,以相似的方式选择概率,但反映存在TF元件的情况下的下调。
对于如图6中给出的Bayesian网络模型,其中探针组的强度形成输入测量,技术人员最后必须确定对于离散化和对于涉及探针组强度与对应的目标基因的mRNA水平的条件概率表的参数。这两者均基于本发明中的训练数据。对于探针组强度水平离散化为状态“低”和“高”,确定合适的阈值,所述阈值将其中途径是活化的训练样品(“开”样品)组中的强度值与其中途径不是活化的训练样品(“关”样品)组中的强度值最佳地区分开。最后,通过计数具有对应阈值以下和以上的探针组的强度值的“开”和“关”样品的数目来完成取决于对应目标基因的“下”或“上”状态来描述探针组具有“低”或“高”强度的概率的条件概率表。这在频率论方法的文献中是已知的。将虚拟计数(dummy count)加入每组中以防止条件概率表中条目的值为零,以防止Bayesian网络的极端行为。
在Bayesian网络训练后,可以应用于如下的测试样品中,考虑图6的Bayesian网络并假定与探针组相关的微阵列测量是可获得的。第一步是通过比较测试样品中每一探针组强度与如上所述的对应阈值来将输入测量离散化。该比较可以以严格方式完成,将每一探针组设定为“低”或“高”强度(称为‘严格证据’),或者它可以以宽松方式完成,假定测量中的某些不确定性(噪声),将每一探针组设定为“低”或“高”的概率(称为‘宽松证据’)。例如,基于噪声及与阈值的差异的合适估计,具有刚刚低于阈值的强度的探针组的宽松证据可以是0.8的“低”概率和0.2的“高”概率。
随后,将该严格或宽松证据应用于Bayesian网络的合适的推理引擎,例如基于联合树算法(见(Neapolitan, 2004))。给定所提供的证据,此类引擎可以随后推断TF元件为“不存在”或“存在”的升级概率。随后将TF元件为“存在”的推断概率解释为对应途径是有活性的估计概率。
优选地,Wnt、ER、Hedgehog和AR途径的Bayesian网络模型的训练使用Gene Expression Omnibus(在http://www.ncbi.nlm.nih.gov/geo/上可进入,参见上文)上可获得的公共数据来完成。
使用认为具有无活性的Wnt途径的32个正常结肠样品和已知具有有活性的Wnt途径的32个确定的腺瘤样品(GSE8671数据组)示例性训练Wnt Bayesian网络。
使用已知具有无活性的ER途径的4个去除雌激素的MCF7样品和认为具有有活性的ER途径的4个雌激素刺激的MCF7样品(均来自GSE8597数据组,也在Gene expression Omnibus上可进入)示例性训练ER途径的Bayesian网络模型。
使用确定具有有活性的Hedgehog途径的15个基底细胞癌样品和代表具有无活性的Hedgehog途径的4个正常皮肤细胞样品(均在GSE7553数据组中可获得)示例性训练Hedgehog途径的Bayesian网络模型。
使用具有阳性AR活性的3个样品(用有效的AR途径激活物双氢睾酮(DHT)刺激的LNCaP细胞系)和代表无活性的AR途径情况的3个未刺激的LNCaP细胞系示例性训练AR途径的Bayesian网络模型。
参考图35和图36,使用Wnt和ER途径的训练的Bayesian网络来预测未用于如本文所述的训练方法(未发现Hedgehog Bayesian网络的合适的数据组)中的相似样品(对Wnt和ER Bayesian网络分别为结肠样品和MCF7乳腺癌细胞系)中的途径活性。样品的绝大部分的预测的途径活性应该与对于要验证的模型的临床预期的途径活性一致。
图35显示了GSE20916数据组中的预测Wnt活性,表示为纵轴上P(Wnt开)的logit,对于样品由横轴上的柱显示,其通过分类分组的结肠样品由柱的颜色表示。基于它为健康组织的样品,将所有正常结肠样品正当地预测为具有无活性的途径(分值< 0)。预测除了四个样品外的所有声称具有有活性的途径的样品为具有有活性的Wnt途径。
在图36中,显示使用MCF7乳腺癌细胞系样品(一个用雌激素(E2)刺激,另一个用阴性对照(EtOH)刺激,均来源于GSE9253数据组)测量的两组微阵列的训练的ER Bayesian网络模型的验证结果。与声称的ER活性一致,预测用雌激素刺激的样品具有有活性的ER途径,而阴性对照预测为无活性的ER途径。
使用训练的Bayesian网络(例如Wnt、ER、AR和Hedgehog途径)来预测对应的途径活性的进一步细节和实例在下文实施例6中进行解释。
上述训练方法可以用于临床应用的其他Bayesian网络。在此显示并证实使用本文公开的代表细胞信号传导途径,更具体为Wnt、ER、AR和Hedgehog途径的方法构建的Bayesian网络模型工作。
实施例6:(异常)途径活性的诊断
下文将示例性说明如何使用例如Bayesian网络模型来诊断细胞信号传导途径的活性。
使用Wnt、ER、Hedgehog和AR途径的Bayesian网络来预测多种之前未用于训练的数据组中途径活性为“开”(即有活性的)或“关”(即无活性的),以推断推断组件运行的如何良好,所述Bayesian网络如下构建:使用转录因子存在的节点,代表目标基因mRNA的节点的层和代表对应于目标基因(表1、表2、表3和表4)的探针组强度的节点的层,类似于本文所述的图6,并如本文所述进行训练。预测的途径活性分值与临床知识相关。测试运行的选择的结果概述显示于图21seq.中。
参考图21seq.,显示使用本文所述的Bayesian网络模型的医疗组织样品的途径活性推断结果。
图21显示了结肠样品数据组GSE4183的Wnt活性测试的结果。Bayesian网络模型对腺瘤样品产生了P(Wnt开)的高值,并且对正常样品产生低值,其对应于腺瘤和健康组织的(病理)生理学。健康组织具有缓慢的细胞增殖并因此为低Wnt活性,相对于腺瘤组织,其具有快速细胞增殖,并因此为高Wnt活性。对于IBD样品,Bayesian网络模型对除了一个样品之外的所有样品均显示出低Wnt途径活性(P(Wnt开)~0)。而且,这与未进行快速细胞增殖的IBD样品是一致的。对于结肠直肠癌细胞样品,结果是混杂的,在这些样品的约一半中检测到高Wnt途径活性,但这可以是当良性腺瘤组织变为恶性癌组织时假定为肿瘤驱动者作用的其他途径的结果,或者是样品分析问题,例如样品含有太多非肿瘤组织或者mRNA被部分降解。
使用结肠样品数据组GSE8671训练本文报道的实验中使用的Bayesian网络模型。然而,Wnt途径存在于(虽然可能是无活性的)其他细胞类型中。因此认为这是可能的,即Bayesian网络可能可应用于推断与其他类型癌相关的异常高的Wnt途径活性。对此的理论是这样的,尽管使用结肠样品训练Bayesian网络模型,但它是基于其他细胞类型中存在的(尽管可能无活性)Wnt途径运行的首要原理。图22-24显示了调查此类“交叉组织类型”推断的一些结果。
图22显示了使用用所应用的结肠样品训练的Bayesian网络模型推断成神经管细胞瘤样品(数据组GSE10327)中Wnt途径活性的测试的结果。包括在该数据组中的样品已经被进一步表征为几个亚组,它们之一为具有有活性的Wnt途径的样品。Wnt途径的Bayesian网络预测了具有有活性的Wnt途径的Wnt有活性的样品的组,而其他样品正确地预测具有无活性的Wnt途径。
使用Wnt Bayesian网络模型在含有肝癌样品的数据组(GSE9843)中的测试结果显示于图23中。在此通过以下GSE9843数据组指定的在前注释来将样品分组:“CTNNB1”、“炎症”、“多体性chr7”、“增殖”、和“未注释”。“炎症”组的样品一律推断为不具有异常高的Wnt途径活性,如同预期,这是由于炎症状况并不需要快速的细胞增殖。标记“多体性chr7”的样品也一律推断为不具有异常高的Wnt途径活性。7号染色体的多体性表示存在多于两条7号染色体。由于并无理由来预期该多体性条件会影响Wnt途径,因此这些样品不具有异常高的Wnt途径活性并不意外。
标记为“增殖”的样品中约五分之一具有P(Wnt开)>0.5。增殖暗示快速细胞倍增的状态。这种状态可与异常高的Wnt途径活性有关,但也可与细胞增殖的许多其他可能的原因有关。因此,这些样品中约五分之一具有异常高的Wnt途径活性并不是不合理的结果。
通过Bayesian网络推断“CTNNB1”组样品的约一半具有异常高的Wnt途径活性。CTNNB1基因编码β-连环蛋白,其为Wnt途径的调节蛋白,并且该基因中的活化突变导致异常的Wnt活化。因此,“CTNNB1”组与高Wnt途径活性之间的关联与预期一致。
图24显示了本文所述的Wnt Bayesian网络模型对一组乳腺癌样品的测试结果。在该情况下,测试了三组乳腺癌细胞系:一组对其在前已知Wnt途径以异常高的水平运行(Wnt开-组);一组对其在前已知Wnt途径不以异常高的水平运行(Wnt关-组);并且另一组对其Wnt途径活性在前并不知晓(未知组);此外还有一个怀疑其具有低水平的Wnt活化的样品(Wnt怀疑的),尽管在文献中存在不一致的报道,即它可具有有活性的Wnt途径(但这是少数报道;更多文章报道为无活性的Wnt途径)。如图24中所见,由Bayesian网络提供的推断与在前知识的关联对Wnt开-和Wnt关-组是有力的。而且图的最右侧样品(Wnt怀疑的)显示出这样的推断,其对应于文献中大部分的报道即Wnt途径是关的。在图24中所示的未知组的情况下,对其不存在Wnt途径活性的在前知识,Bayesian网络推断Wnt途径的低活性,除了一个实例对其为P(Wnt开)>0.5;文献显示该细胞系具有共受体LRP6的高表达,其可以解释Wnt途径是开的。
图25显示了使用如本文所述的用MCF7乳腺癌细胞系训练的ER Bayesian网络对乳腺癌细胞系的同一数据组但现在测试ER活性的结果。将在前已知具有有活性的Wnt途径的样品预测为具有无活性的ER途径,这并不意外,因为Wnt途径已经驱动快速的细胞增殖。另一方面ER阳性样品发现于Wnt关样品和未知样品中。考虑到图24,这并不令人惊讶。
用乳腺癌细胞系训练的ER Bayesian网络对一组癌样品(GSE12276)预测的测试结果显示于图26中。将乳腺癌样品再细分为众所周知的分类:管腔A(LumA)、管腔B(LumB)、人表皮生长因子受体2阳性 (HER2)和基底乳腺癌亚型。已知管腔A和管腔B亚型的组织样品表达ER。还是在这些亚型中,预测大部分样品具有高ER途径活性。另一方面,已知分类为基底亚型的样品不具有ER表达或具有低的ER表达,其恰好与基底组样品中预测的无活性的ER途径一致。在HER2组中,仅三个样品具有P(ER开)>0.5,而预测大部分样品具有无活性的ER途径。这与这一事实良好关联,即分类根据以下事实完成:这些样品具有扩大的HER2表达;不受控的细胞增殖假定由HER2信号传导经ER途径之外的其他细胞信号传导途径来驱动(例如见图24中的Wnt有活性的乳腺癌细胞系或图30中的Hedgehog有活性的乳腺癌样品)。
使用如本文所述构建并训练的ER Bayesian网络模型来预测多种癌的大量细胞系中的ER途径活性,结果显示于图27中。如同所预期的,在乳腺癌细胞系中仅发现ER有活性的预测样品。将所有其他类型的癌细胞系预测具有无活性的ER途径,其如同所预期的。
使用如本文所述构建并用Hedgehog途径训练的Bayesian网络模型来预测GSE34211数据组中多种癌类型的细胞系的Hedgehog途径的活性。Hedgehog活性预测结果显示于图28中。阳性预测的Hedgehog途径的最高部分发现于中枢神经系统(CNS)、皮肤、子宫内膜和子宫癌类型中,其与关于这些细胞类型中Hedgehog依赖性细胞增殖的文献知识良好一致。
图29显示了成神经管细胞瘤样品(GSE10327)的预测的Hedgehog活性,其已经用如本文所述的Wnt Bayesian网络模型分析。成神经管细胞瘤样品已经被表征为亚类,它们中的一种具有有活性的Hedgehog信号传导途径(标识符:SHH)。预测SHH亚型中的所有样品均具有有活性的Hedgehog信号传导。此外,还预测Wnt亚型中的成神经管细胞瘤样品具有有活性的Hedgehog途径。这与显示这些肿瘤中两种途径常常均有活性的临床证据是一致的。尽管如此,Wnt Bayesian网络明显仅能在Wnt亚型中正确预测Wnt活性。因此,Wnt和Hedgehog Bayesian网络的组合能够产生这两种亚型的正确分类。
早先使用ER Bayesian网络模型预测ER活性的GSE12276乳腺癌样品使用Hedgehog Bayesian网络模型预测的Hedgehog活性显示于图30中。预测Hedgehog途径在每种亚型的一部分样品中是有活性的。这看起来奇怪,但却符合图26中显示的ER途径预测结果,技术人员能够看出Hedgehog活性仅预测在不具有有活性的ER途径的样品中。这与(乳腺)组织中不受控的细胞增殖可以由不同的信号传导途径驱动这一假说良好一致。
总之,图21-30中呈现的多种癌组织样品和细胞的测试结果有力暗示用组织/途径特异性样品训练的Wnt、ER和Hedgehog模型的Bayesian网络可应用于分析其他类型的组织样品。这可以使细胞信号传导途径分析能够应用于“交叉组织类型”。因此,将CDS系统10(如本文所述)容易地应用于评估用于训练Bayesian网络模型40的组织类型的样品之外的一定范围的组织类型中的途径活性(例如见图20,其图示配置来评估如本文所述的一种或多种细胞信号传导途径(示例性显示为Wnt途径)的临床决策支持(CDS)系统)。在其中推断组件40、44、46、48表明分析的组织展示出异常高的Wnt、ER或Hedgehog途径活性但没有组织特异性药物可用的情况下,分别根据如CDS系统10提供的推荐28或推荐26,医师可以考虑一般的Wnt、ER或Hedgehog途径抑制药物或机能障碍特异性药物。
尽管图21-30的结果表明了Wnt、ER和Hedgehog途径的Bayesian网络模型的交叉组织类型适用性,预期对于临床应用,任选可以将Bayesian网络模型升级或适应以将其对分析的具体组织类型(例如乳腺组织或肝组织)的适用性最大化。此类升级或适应可以例如意味着调整基于分析的组织类型的临床研究的条件概率,或者用调查的一种或多种途径的组织特异性目标基因来充实如本文所述的证据组织目标基因列表。此外,可以将节点加入或去除以更好地使Bayesian网络模型适合分析的组织。或者,可以使用不同组织类型的不同训练组从头训练不同的Bayesian网络模型。此外,图21-30的结果表明本文所述方法开发并训练使用Wnt、ER和Hedgehog之外的途径的证据组织目标基因列表开发并训练Bayesian网络模型以预测并诊断途径活性的能力。
将如本文所述构建并训练的AR Bayesian网络模型的测试结果用于预测用不同处理方案处理的LNCaP前列腺癌细胞系(GSE7708)中的AR活性(见图38)。如同预期,未用DHT刺激的LNCaP细胞导致预期的无活性的AR途径,而LNCaP刺激的细胞被正确地预测具有有活性的AR途径,并且用抗雄激素药物比卡鲁胺处理的LNCaP细胞具有受抑制的AR途径。
还使用如本文所述的AR途径的训练的Bayesian网络来预测GSE17951数据组的前列腺癌样品中AR途径是有活性的概率(结果显示于图39中)。相比于对照样品,前列腺活组织检查和肿瘤的大部分没有意外地被预测具有更高概率的AR活性。
还将AR Bayesian网络模型应用于交叉组织测试中,即,GSE12276数据组中包括的乳腺癌样品。该测试的结果显示于图40中。将每一亚组中发现的一小部分样品预测为具有有活性的途径,而绝大部分样品具有无活性的AR途径。显著的是,最高百分比的具有有活性的AR途径的样品发现于HER2亚组中,这并不意外,因为从文献中已知在HER2和AR途径之间存在交流(crosstalk)并且AR途径也能够由HER2信号传导所诱导。
还使用上述AR Bayesian网络模型来预测如图41和图42中所示的多种癌类型的两组细胞系样品(GSE36133和GSE34211)中AR途径的活性。如同预期,发现细胞系的大部分具有无活性的AR途径。对此的例外是具有表达AR途径活性的几个癌细胞系样品的前列腺癌样品。在表12中显示前列腺癌样品的所有AR途径活性预测与已知的AR活性一致。
表12. GSE36133和GSE34211数据组中前列腺癌细胞系中已知和预测的AR活性。
Figure 233956DEST_PATH_IMAGE019
实施例7:基于途径活性的预后
认为早期发育途径如Wnt和Hedgehog在由已经转化为更加干细胞样的表型(被称为癌干细胞)的癌细胞所导致的转移中起作用。的确,可获得充足的证据关于早期发育途径诸如Wnt途径在癌转移中起作用,使转移癌细胞在另一器官或组织中的播种位置开始分裂。转移与不良预后相关,因此预期在癌细胞中早期发育活性诸如Wnt和Hedgehog途径的活性对于不良预后是预测性的。如图37中由Kaplan-Meier曲线所示,这由这一事实所支持,即使用本文所述的Bayesian网络模型鉴定具有有活性的ER途径但不具有有活性的Wnt或Hedgehog途径的来自GSE12276数据组的乳腺癌患者比鉴定为具有有活性的Hedgehog或Wnt途径或者两者的患者具有更好的预后。
实施例8:治疗计划、药物效力的预测、副作用的预测和药物效力的监测
以下实例说明如何使用概率模型具体为Bayesian网络模型用于治疗计划、药物效力的预测、药物效力及相关活性的监测。
使用ER途径的Bayesian网络模型来预测途径活性,所述Bayesian网络模型如下构建:使用转录因子存在的节点、代表目标基因(表2)mRNA水平的节点的层和代表对应于目标基因(表2)的探针组强度的节点的层,与本文所述的图6类似,并如本文所述训练。随后证明途径活性与药物效力或监测药物效力有关。结果概述显示于图31和32中。
他莫昔芬是目前用于治疗ER+(雌激素受体阳性)乳腺癌的药物。它作为雌激素受体的部分拮抗剂来抑制不受控的细胞增殖,认为其由ER信号传导诱导。不幸的是,尽管通过癌组织切片的常规组织病理学分析证明癌细胞中存在ER蛋白,但并非每种乳腺癌都对用他莫昔芬治疗响应。已经进行许多研究来调查这种所谓的他莫昔芬抗性。公开可获得的GSE21618数据组是此类研究之一的结果,并且包含不同治疗方案下的他莫昔芬抗性和野生型MCF7细胞系的微阵列数据。使用如本文所述构建并训练的ER Bayesian网络来分析不同治疗方案下的他莫昔芬抗性和野生型MCF7细胞系,结果显示于图31中。
预测由TamR.Ctrl表示的对照他莫昔芬抗性细胞系在他莫昔芬加入后的每一时间点(1、2、3、6、12、24和48小时)上具有无活性的ER途径。由TamR.Tam表示的用他莫昔芬处理他莫昔芬抗性细胞系(其对他莫昔芬处理不敏感)是无效的,这并不意外,其还由该组在相同时间点上预测的ER途径无活性来说明。根据他莫昔芬抗性细胞系(TamR.Ctrl)的的分析,不受控的细胞增殖的驱动力不是由于有活性的ER信号传导;因此用ER拮抗剂治疗它将不会抑制细胞增殖。这说明在阴性的预测ER途径活性的情况下不推荐用他莫昔芬治疗。
另一方面,用17β-雌二醇处理已知为他莫昔芬敏感的野生型MCF7细胞系(wt1.E2)对在增加的ER阳性活性预测结果中可见的激素治疗缓慢地反应。用已知为抑制雌激素产生的芳香酶抑制剂处理这样的细胞系将抑制ER途径,其通过及时降低ER途径预测来说明。支持这一点的是ER途径预测,其基于来自GSE11324数据组中用雌激素处理增加的时间的MCF7样品的微阵列数据产生,结果显示于图32中。
上述内容说明概率模型具体为Bayesian网络模型用于治疗计划、药物效力预测和药物效力监测的能力。然而,应该理解同样的方法学还将用于预测并监测副作用。
实施例9:药物开发
与治疗应答监测类似,途径模型可以用于药物开发以评估多种推定化合物的有效性。例如,当筛选许多化合物对癌细胞系中某一途径的可能作用时,可以使用相应的途径模型来确定在应用化合物或未应用后途径的活性是否上升或下降。通常,仅使用途径活性的一种或少数几种推定标志物来完成该检查,其增加治疗作用的无效监测的机率。此外,在动物或患者受试者的随访研究中,可以类似地使用途径模型来评估候选药物的有效性,并且来确定最佳剂量来最大程度地影响途径活性。
无效监测新药物化合物的实例由如图38中所示的GSE7708样品中预测的AR途径活性来说明。在该研究中,已经开发了抑制AR途径活性的两种可能的药物化合物,由聚酰胺1和聚酰胺2表示。已经证实这两种聚酰胺能够抑制AR途径以及≈ 35 %的由DHT诱导的转录物,其基于这一发现,即聚酰胺结合雄激素响应元件(ARE)并抑制AR活性众所周知的标志物KLK3 (= PSA)(也包括于如本文所述的目标基因选择中)的表达。相反,AR途径的Bayesian网络模型预测这些样品仍具有有活性的AR途径。使用AR Bayesian网络模型调查上调的目标基因的推断概率表明按照该发现,与其他目标基因不同,KLK3下调,而所有其他目标基因(在聚酰胺1的情况下除了AR、GUCY1A3和TMPRSS2)明显在聚酰胺1和聚酰胺2处理的样品中差异表达。换言之,仅有一个AR活性的标志物KLK3下调,而所鉴定的目标基因的大部分仍上调,表明AR途径仍是大部分完整的并因此是有活性的。通过考虑基于文献证据的大量目标基因,本发明人能够显示聚酰胺的AR活性的抑制受限并且使用这些聚酰胺仅KLK3表达明显下调。此外,这说明相比于药物开发中还原论方法,使用Bayesian网络模型的系统方法的值。
实施例10:测定开发
开发进行样品测量的专用测定,例如在使用qPCR来测定目标基因的mRNA水平的整合平台上而非应用提及的Bayesian网络到来自微阵列或RNA测序的mRNA输入数据在临床应用中可能是有利的。随后可以将公开的目标基因的RNA/DNA序列用于确定在此类平台上选择哪种引物和探针。
此类专用测定的确认可以通过使用基于微阵列的Bayesian网络作为参考模型并且验证所开发的测定在一组确认样品上是否产生相似结果来完成。除专用测定外,还可以使用mRNA测序数据作为输入测量建立并校正类似的Bayesian网络模型来完成这一点。
实施例11:途径研究和癌病理生理学研究
以下内容将说明Bayesian网络模型如何可以用于(临床)途径研究中,即目的在于发现哪些途径参与某些疾病的研究,其可以跟随更具体的研究,例如联系信号传导蛋白中的突变与途径活化中的改变(用模型测量)。这与调查具体癌的起始、生长和演变和转移(病理生理学)有关。
使用Wnt、ER、Hedgehog和AR途径的Bayesian网络模型来预测由乳腺癌样品组成的数据组(GSE12276)的途径活性,所述Bayesian网络模型如下构建:使用转录因子存在的节点、代表目标基因(表1、表2、表3和表4)mRNA水平的节点的层和代表对应于目标基因(表1、表2、表3和表4)的探针组强度的节点的层,与本文所述的图6类似,并如本文所述训练。
推测研究人员目的在于寻找驱动不受控细胞增殖的一种或多种细胞信号传导途径及一种或多种特定失调。研究人员可以使用上述概率模型具体为Bayesian网络模型分析微阵列数据来发现哪些途径大概是不受控细胞增殖的原因。显示于图33和图34中,技术人员能看到此类分析对Wnt、ER和Hedgehog活性的说明(GSE12276数据组的基底和管腔A样品)。随后,研究人员可以更详细地搜索以发现途径失调的准确原因。
参考图34,已知基底样品具有三重阴性受体状态(ER、PR和HER2),因此看到预测所有样品均具有无活性的ER途径并不意外。另一方面,如图34中所示,预测样品中的某些具有Wnt或Hedgehog是有活性的或者两者均有活性。这些预测的途径活性说服研究人员更详细地调查这些样品,例如Wnt和/或Hedgehog途径中已知的突变或其他已知的失调。
另一实例在图33中给出,其中说明了GSE12276数据组的管腔A样品中的Wnt、ER和Hedgehog活性。已知管腔A样品表达ER,然而这并不必然表示癌特性是由于有活性的ER信号传导。从预测的途径活性,技术人员能推断少于一半的样品具有有活性的ER信号传导。然而,发现并不具有有活性的ER信号传导的样品中的一些具有有活性的Wnt和/或Hedgehog途径。这可能引起研究人员更详尽地调查这些样品分别在Wnt和/或Hedgehog信号传导途径中的缺陷。样品中的一些没有预测所包括的三条途径的任一条是有活性的;可能其他途径导致不受控的细胞增殖。这还给予研究人员额外信息来搜索其他途径中的缺陷。
总之,本文所述的说明表明了训练的Bayesian网络模型(如上所述的)在更定向的方法中支持发现不受控细胞增殖原因的方法的能力。通过使用Bayesian网络来筛选样品的途径活性,预测的途径活性可以指出细胞增殖可能的途径,其可以继而进行更详细的研究,例如联系信号传导蛋白中的突变或其他已知的失调与活化中的改变(如用模型测量)。
如本文所述,可以使用开发并训练细胞信号传导途径的Bayesian网络的方法来构建还可以与本发明关联使用的其他途径的Bayesian网络模型。
实施例12:基于预测的活性的临床试验中受试者的注册
如果开发候选药物例如来阻断驱动肿瘤生长的某一途径的活性,并且该药物将进入临床试验,那么正确选择受试者在此类试验中注册对于证实药物的潜在有效性是必需的。在这种情况下,在他们的肿瘤中对应途径并未活化的患者应该被排除在试验之外,因为显而易见的是如果途径在第一位置上没有活化,则药物不会有效。因此,将可预测途径活性的途径模型可以用作选择工具,来仅选择那些预测对应的途径活化的患者。
实施例13:待进行的一种或多种后续测试的选择
如果使用不同途径模型分析肿瘤,并且模型预测某一途径的失调,则这可以引导待进行的后续测试的选择。例如,技术人员可以运行邻位连接测定(PLA)来确定对应转录复合物的存在(S?derberg O, 2006)。如果TF复合物中的两个关键蛋白,例如Wnt途径的TF复合物中的β-连环蛋白和TCF4的确结合在一起,则可以将这样的PLA设计为给出阳性结果。
另一实例是更详细地分析预测为失调的途径的信号传导级联。例如,技术人员可以分析该途径中的关键蛋白来确定是否在编码它们对应基因的DNA区中存在突变,或者技术人员可以测试这些蛋白的丰度来看它们是否比正常更高或更低。此类测试可以表明途径失调背后的根本原因是什么,并且给出关于哪种可用药物可以用于降低途径活性的认识。
选择这些检测来确定如使用Bayesian模型鉴定的途径的活性。然而,选择伴随诊断测试也是可以的。使用模型鉴定途径后,对于靶向治疗选择仅那些伴随诊断测试需要进行(选择),其可应用于鉴定的途径。
实施例14:伴随诊断测试的选择
与之前实施例类似,如果分析肿瘤并且途径模型预测特定途径失调,并且任选已经进行大量额外测试来调查失调的原因,则肿瘤学家可以选择大量候选药物来治疗患者。然而,用此类药物治疗可以需要首先进行伴随诊断测试,例如以符合临床指导方针或者以确保治疗费用的偿还,或者由于监管机构(FDA),其需要在给予该药物之前进行伴随诊断测试。此类伴随诊断测试的实例是对于用药物赫赛汀(曲妥珠单抗)治疗的乳腺癌患者的Her2测试。因此,可以将途径模型的结果用于选择候选药物及待进行的对应伴随诊断测试。
实施例15:CDS应用
参考图20(图示配置以评估如本文所述的一种或多种细胞信号传导途径(示例性显示对于Wnt途径)的临床决策支持(CDS)系统),提供临床决策支持(CDS)系统10实施作为合适配置的计算机12。计算机12可以配置以通过执行存储于非临时性存储介质(未显示)诸如硬盘驱动器或其他磁性存储介质、光盘或其他光存储介质、随机存取存储器(RAM)、只读存储器(ROM)、闪速存储器、或其他电子存储介质、网络服务器等等上的合适软件、固件、或其他指令来作为CDS系统10而运行。尽管说明性CDS系统10通过说明性计算机12而具体化,更常见地通过数字处理设备或包含配置以进行如本文所述的临床决策支持方法的数字处理器的装置而将CDS系统具体化。例如,数字处理设备可以是手提式设备(例如,运行CDS应用的个人数据助手或智能电话)、笔记本计算机、台式计算机、平板计算机或设备、遥控网络服务器等等。计算机12或其他数字处理设备通常包括显示设备14或者与其可操作地连接,经所述显示设备14,包括临床决策支持推荐的信息呈现于医疗人员。计算机12或其他数字处理设备通常还包括一种或多种用户输入设备或与其可操作地连接,诸如说明性的键盘16、或鼠标、轨迹球、触控板、触控式屏幕(可能与显示设备14整合)、或其他基于指针的用户输入设备,经所述用户输入设备,医疗人员可以输入信息,诸如控制CDS系统10的操作指令、由CDS系统10使用的数据等等。
CDS系统10接受关于医疗受试者的输入信息(例如,医院患者、或由肿瘤学家、医师、或其他医疗人员治疗的门诊患者或进行癌筛选或某些其他医疗诊断的人(已知或怀疑其患有某种类型的癌,诸如结肠癌、乳腺癌、或肝癌等等)。CDS系统10对该输入信息应用多种数据分析算法,以产生经显示设备14(或经声音合成器或提供人可感知的输出的其他设备)呈现给医疗人员的临床决策支持推荐。在某些实施方案中,这些算法可以包括向患者应用临床指导方针。临床指导方针为标准或“规范”治疗推荐的存储组,通常基于一组医疗专家的推荐而构建,并且任选设计为临床“流程图”的形式,以利于通过临床指导方针浏览。在多种实施方案中,CDS 10的数据处理算法可以额外或者可选地包括多种诊断或临床测试算法(其在输入信息上进行以提取临床决策推荐),诸如本文公开的机器学习方法。
在本文公开的说明性CDS系统(例如,CDS系统10)中,CDS数据分析算法包括一种或多种诊断或临床检测算法,其在通过一个或多个医学实验室18获得的输入基因组和/或蛋白质组信息上进行。这些实验室可以不同地定位为“现场(on-site)”,即在医院里或者在医疗受试者进行医疗检查和/或治疗的其他位置,或者定位为“场外(off-site)”,例如(经邮件或另一种递送服务)接收已从医疗受试者中提取出的医疗受试者的组织样品(例如,自乳腺病变、或者已知或怀疑患有结肠癌的医疗受试者的结肠、或者已知或怀疑患有肝癌的医疗受试者的肝等等,经活组织检查方法或其他样品提取方法获得的样品)的专门和集中的实验室。提取样品的组织还可以是转移组织,例如,(怀疑的)源自结肠、乳腺、肝或已经扩散到结肠、乳腺、肝或其他器官之外的其他器官的恶性组织。在某些情况下,组织样品可以是循环的肿瘤细胞,即已经进入血流并且可以使用合适的分离技术提取作为提取的组织样品的肿瘤细胞。提取的样品由实验室处理来产生基因组或蛋白质组信息。例如,可以使用微阵列(在本领域中也不同地称为基因芯片、DNA芯片、生物芯片等等)或通过定量聚合酶链反应(qPCR)处理来处理提取的样品,以测量用作证明的基因组或蛋白质组信息,诸如目的基因的表达水平,例如以从该基因转录的信使核糖核酸(mRNA)的水平、或者从转录自该基因的mRNA翻译的蛋白的水平的形式。作为另一实例,可以由基因测序实验室处理提取的样品,以产生脱氧核糖核酸(DNA)的序列,或者产生RNA序列、拷贝数变化等等。其他考虑的测量方法包括在病理学切片上进行的免疫组织化学(IHC)、细胞学、荧光原位杂交(FISH)、邻位连接测定等等。可以由微阵列处理、质谱法、基因测序、或其他实验室技术产生的其他信息包括甲基化信息。也可以进行这些基因组和/或蛋白质组测量的多种组合。
在某些实施方案中,医疗实验室18对医疗受试者的组织提取样品进行许多标准化数据获取,以产生大量基因组和/或蛋白质组数据。例如,标准化数据获取技术可以产生一条或多条染色体或染色体部分、或组织的整个基因组的(任选比对的)DNA序列。应用标准微阵列能够产生千万计的数据项,诸如大量基因的表达水平、多种甲基化数据等等。将该过多的基因组和/或蛋白质组数据、或其所选的部分输入CDS系统10中进行处理,以开发用于明确阐述临床决策支持推荐的临床上有用的信息。
公开的CDS系统和相关方法涉及处理基因组和/或蛋白质组数据以评估多种细胞信号传导途径的活性。然而,应该理解公开的CDS系统(例如,CDS系统10)可以任选进一步包括不同的额外能力,诸如基于多种患者数据诸如生命体征监测数据、患者历史数据、患者人口数据(例如,性别、年龄等等)、患者医疗成像数据等等按照存储的临床指导方针产生临床决策支持推荐。或者,在某些实施方案中,CDS系统10的能力可以限于仅仅进行如本文所公开的基因组和/或蛋白质组数据分析以评估细胞信号传导途径。
继续参考示例性图20,CDS系统10基于至少但不限制于提取样品中测量的细胞信号传导途径的目标基因表达水平来推断医疗受试者组织中细胞信号传导途径的活性,并且基于该推断的活性来确定在医疗受试者的组织中该细胞信号传导途径是否异常运行。本文公开的实施例涉及Wnt、ER、AR和Hedgehog途径作为说明性细胞信号传导途径。由于途径调节的缺失可以是癌增殖的原因,因此这些途径是肿瘤学多个领域中的目标。存在约10-15个相关的信号传导途径,并且每种癌原则上由失调的一种主要途径驱动。不限于任何运行的具体理论,这些途径调节细胞增殖,并且必然癌细胞中这些途径调节的缺失可以导致途径“始终为开”,因而加速癌细胞的增殖,其依次显示为癌的生长、侵入或转移(扩散)。
测量编码细胞信号传导途径的调节蛋白(诸如形成细胞信号传导途径的蛋白级联的一部分的中间蛋白)的基因的mRNA表达水平是该调节蛋白表达水平的间接测量,并且可以会或者可以不会与实际的调节蛋白表达水平密切相关(与细胞信号传导途径的总体活性关系则低得多)。细胞信号传导途径直接调节目标基因的转录-因此,从该目标基因转录的mRNA的表达水平是该调节活性的直接结果。因此,CDS系统10基于至少细胞信号传导途径(例如,Wnt、ER、AR和Hedgehog途径)的目标基因的表达水平(mRNA或蛋白水平作为替代测量)推断该细胞信号传导途径的活性。这保证CDS系统10基于由目标基因的测量的表达水平提供的直接信息来推断途径的活性。
然而,如本文所公开的,尽管对于评估所有途径的活性是有效的,但途径目标基因测量的表达水平20并非对于该途径为何异常运行特别提供信息(如果的确情况是这样的话)。换言之,尽管途径目标基因测量的表达水平20可以表明途径异常运行,但却不会表明途径的哪一部分故障(例如,缺少足够的调节)而导致整个途径异常运行。
因此,如果CDS系统10检测具体途径的异常活性,则CDS系统10随后任选使用由医疗实验室18提供的对于提取样品的其他信息诸如途径24的一种或多种调节基因的比对遗传序列22和/或测量的一个或多个表达水平,或者选择下一步进行的诊断检测,来评估该途径的哪一部分故障。为了将效力最大化,在某些实施方案中,只有当途径目标基因测量的表达水平20的分析表明途径异常运行时才进行途径为何故障的这一任选评估。在其他的实施方案中,将该评估整合入本文所述的细胞信号传导途径的概率分析中。
在其中CDS系统10评估途径的哪一部分故障且成功实施的实施方案中,额外的信息能够使CDS系统10推荐靶向具体故障的药物处方(显示于图20中的推荐26)。如果没有鉴定到具体途径故障(由于任选的额外评估未进行或者由于评估无法鉴定途径的任何具体部分出现故障),则CDS系统10能够提供缺省推荐28,其为该具体途径推荐一般性抑制药物的处方(假定异常的途径活性是非常高的活性)。
实施例16:测量途径活性的试剂盒和分析工具
基于微阵列/RNA测序的基于使用Bayesian模型的调查所发现的最佳指示具体的途径活性的目标基因的组能够转变为在组织或细胞样品上进行的多元定量PCR测定。为了开发这样的FDA许可的途径活性的测试,需要开发标准化测试试剂盒,其需要在临床试验中临床验证以获得监管许可。
通常,应该理解尽管提供关于Wnt、ER、AR和/或Hedgehog途径的实例作为说明性实例,但本文公开的细胞信号传导途径分析方法除这些途径之外还容易地应用于的其他细胞信号传导途径,诸如具有在细胞膜中的受体的胞内信号传导途径(参见上文)和具有细胞内的受体的胞内信号传导途径(参见上文)。此外:该申请描述了几种优选的实施方案。当阅读并理解前面详细的描述时,可以对其他进行修改或改变。本申请意图理解为包括所有此类修改或改变,只要它们进入所附的权利要求或其等同物的范围之内。
Figure 104009DEST_PATH_IMAGE021

Claims (20)

1.一种方法,其包括:
至少基于在医疗受试者的组织的提取样品中测量的一种或多种细胞信号传导途径的一个或多个目标基因的一个或多个表达水平(20)来推断所述医疗受试者的组织中的一种或多种细胞信号传导途径的活性,其中所述推断包括:
通过评价概率模型(40-1, …, 40-7)优选Bayesian网络(40-1, …, 40-7)的至少一部分来推断医疗受试者的组织中一种或多种细胞信号传导途径的活性,其表示对于一组输入的一种或多种细胞信号传导途径,所述一组输入包括至少在医疗受试者的组织的提取样品中测量的一种或多种细胞信号传导途径的一个或多个目标基因的一个或多个表达水平(20);
估计医疗受试者的组织中至少一种转录因子(TF)元件(至少一个控制一种或多种细胞信号传导途径的一个或多个目标基因的TF元件)的水平(46),所述估计至少部分基于与至少一个TF元件和在医疗受试者的组织的提取样品中测量的一种或多种细胞信号传导途径的一个或多个目标基因的一个或多个表达水平(20)有关的条件概率;
基于组织样品中转录因子的估计水平来推断一种或多种细胞信号传导途径的活性;和
基于医疗受试者的组织中的一种或多种细胞信号传导途径的推断活性来确定在医疗受试者的组织中一种或多种细胞信号传导途径是否运行异常;
其中通过数字处理设备(12)使用一种或多种细胞信号传导途径的所述概率模型(40-1, …, 40-7)来进行所述推断。
2.权利要求1的方法,其中所述推断包括:
估计医疗受试者的组织中由概率模型的TF节点所代表的至少一种转录因子(TF)元件的水平(46),所述TF元件控制一种或多种细胞信号传导途径的一个或多个目标基因的转录,所述估计至少部分基于与代表在医疗受试者的组织的提取样品中测量的一种或多种细胞信号传导途径的一个或多个目标基因的概率模型中的所述TF节点和多个节点相关的所述概率模型(40-1, …, 40-7)的条件概率;
并且其中所述推断优选通过使用包含代表关于所述一种或多种信号传导途径的信息的节点的Bayesian网络(40-1, …, 40-7)及所述Bayesian网络的连接节点之间的条件概率关系来进行。
3.权利要求1或2中任一项的方法,其中所述一种或多种细胞信号传导途径包含Wnt途径、ER途径、AR途径和/或Hedgehog途径。
4.权利要求3的方法,其中所述推断包括:
至少基于在医疗受试者的组织的提取样品中测量的Wnt途径的一个或多个、优选至少三个目标基因的表达水平(20)来推断所述医疗受试者的组织中Wnt途径的活性,所述目标基因选自包含以下的组:KIAA1199、AXIN2、RNF43、TBX3、TDGF1、SOX9、ASCL2、IL8、SP5、ZNRF3、KLF6、CCND1、DEFA6和FZD7。
5.权利要求3或4的方法,其中所述推断(还)包括:
至少基于在医疗受试者的组织的提取样品中测量的ER途径的一个或多个、优选至少三个目标基因的表达水平(20)来推断所述医疗受试者的组织中ER途径的活性,所述目标基因选自包含以下的组:CDH26、SGK3、PGR、GREB1、CA12、XBP1、CELSR2、WISP2、DSCAM、ERBB2、CTSD、TFF1和NRIP1。
6.权利要求3-5中任一项的方法,其中所述推断(还)包括:
至少基于在医疗受试者的组织的提取样品中测量的Hedgehog途径的一个或多个、优选至少三个目标基因的表达水平(20)来推断所述医疗受试者的组织中Hedgehog途径的活性,所述目标基因选自包含以下的组:GLI1、PTCH1、PTCH2、IGFBP6、SPP1、CCND2、FST、FOXL1、CFLAR、TSC22D1、RAB34、S100A9、S100A7、MYCN、FOXM1、GLI3、TCEA2、FYN和CTSL1。
7.权利要求3-6中任一项的方法,其中所述推断(还)包括:
至少基于在医疗受试者的组织的提取样品中测量的AR途径的一个或多个、优选至少三个目标基因的表达水平(20)来推断所述医疗受试者的组织中AR途径的活性,所述目标基因选自包含以下的组:KLK2、PMEPA1、TMPRSS2、NKX3_1、ABCC4、KLK3、FKBP5、ELL2、UGT2B15、DHCR24、PPAP2A、NDRG1、LRIG1、CREB3L4、LCP1、GUCY1A3、AR和EAF2。
8.权利要求4的方法,其中所述推断进一步基于在所述医疗受试者的组织的提取样品中测量的Wnt途径的至少一个目标基因的表达水平(20),所述目标基因选自包含以下的组:NKD1、OAT、FAT1、LEF1、GLUL、REG1B、TCF7L2、COL18A1、BMP7、SLC1A2、ADRA2C、PPARG、DKK1、HNF1A和LECT2。
9.权利要求5的方法,其中所述推断进一步基于在所述医疗受试者的组织的提取样品中测量的ER途径的至少一个目标基因的表达水平(20),所述目标基因选自包含以下的组:AP1B1、ATP5J、COL18A1、COX7A2L、EBAG9、ESR1、HSPB1、IGFBP4、KRT19、MYC、NDUFV3、PISD、PREDM15、PTMA、RARA、SOD1和TRIM25。
10.权利要求6的方法,其中所述推断进一步基于在所述医疗受试者的组织的提取样品中测量的Hedgehog途径的至少一个目标基因的表达水平(20),所述目标基因选自包含以下的组:BCL2、FOXA2、FOXF1、G19、HHIP、IL1R2、JAG2、JUP、MIF、MYLK、NKX2.2、NKX2.8、PITRM1和TOM1。
11.权利要求7的方法,其中所述推断进一步基于在所述医疗受试者的组织的提取样品中测量的AR途径的至少一个目标基因的表达水平(20),所述目标基因选自包含以下的组:APP、NTS、PLAU、CDKN1A、DRG1、FGF8、IGF1、PRKACB、PTPN1、SGK1和TACC2。
12.权利要求1-11中任一项的方法,其进一步包括:
为所述医疗受试者推荐开药,所述药物矫正一种或多种细胞信号传导途径的异常运行;
其中只有当基于一种或多种细胞信号传导途径的推断活性来确定所述一种或多种细胞信号传导途径在所述医疗受试者的组织中异常运行时,才进行所述推荐。
13.权利要求1-11中任一项的方法,其中所述方法用于至少一种以下活动:
基于所述医疗受试者的组织中所述一种或多种细胞信号传导途径的推断活性的诊断;
基于所述医疗受试者的组织中所述一种或多种细胞信号传导途径的推断活性的预后;
基于所述医疗受试者的组织中所述一种或多种细胞信号传导途径的推断活性的药物处方;
基于所述医疗受试者的组织中所述一种或多种细胞信号传导途径的推断活性的药物效力的预测;
基于所述医疗受试者的组织中所述一种或多种细胞信号传导途径的推断活性的副作用的预测;
药物效力监测;
药物开发;
测定开发;
途径研究;
癌分期;
基于所述医疗受试者的组织中所述一种或多种细胞信号传导途径的推断活性的医疗受试者在临床试验中的注册;
待进行的后续测试的选择,和
伴随诊断测试的选择。
14.权利要求1-13中任一项的方法,其包括:
至少基于在医疗受试者的组织的提取样品中测量的Wnt途径的一组目标基因中两个、三个或更多个的目标基因的表达水平(20)来推断所述医疗受试者的组织中Wnt途径的活性
和/或
至少基于在医疗受试者的组织的提取样品中测量的ER途径的一组目标基因中两个、三个或更多个的目标基因的表达水平(20)来推断所述医疗受试者的组织中ER途径的活性
和/或
至少基于在医疗受试者的组织的提取样品中测量的Hedgehog途径的一组目标基因中两个、三个或更多个的目标基因的表达水平(20)来推断所述医疗受试者的组织中Hedgehog途径的活性,
和/或
至少基于在医疗受试者的组织的提取样品中测量的AR途径的一组目标基因中两个、三个或更多个的目标基因的表达水平(20)来推断所述医疗受试者的组织中AR途径的活性。
15.权利要求14的方法,其中
Wnt途径的所述目标基因的组包括至少九个,优选所有选自包含以下的组中的目标基因:KIAA1199、AXIN2、RNF43、TBX3、TDGF1、SOX9、ASCL2、IL8、SP5、ZNRF3、KLF6、CCND1、DEFA6和FZD7,
和/或
ER途径的所述目标基因的组包括至少九个,优选所有选自包含以下的组中的目标基因:CDH26、SGK3、PGR、GREB1、CA12、XBP1、CELSR2、WISP2、DSCAM、ERBB2、CTSD、TFF1和NRIP1,
和/或
Hedgehog途径的所述目标基因的组包括至少九个,优选所有选自包含以下的组中的目标基因:GLI1、PTCH1、PTCH2、IGFBP6、SPP1、CCND2、FST、FOXL1、CFLAR、TSC22D1、RAB34、S100A9、S100A7、MYCN、FOXM1、GLI3、TCEA2、FYN和CTSL1,
和/或
AR途径的所述目标基因的组包括至少九个,优选所有选自包含以下的组中的目标基因:KLK2、PMEPA1、TMPRSS2、NKX3_1、ABCC4、KLK3、FKBP5、ELL2、UGT2B15、DHCR24、PPAP2A、NDRG1、LRIG1、CREB3L4、LCP1、GUCY1A3、AR和EAF2。
16.权利要求15的方法,其中
Wnt途径的所述目标基因的组进一步包括至少一个选自包含以下的组中的目标基因:NKD1、OAT、FAT1、LEF1、GLUL、REG1B、TCF7L2、COL18A1、BMP7、SLC1A2、ADRA2C、PPARG、DKK1、HNF1A和LECT2,
和/或
ER途径的所述目标基因的组进一步包括至少一个选自包含以下的组中的目标基因:AP1B1、ATP5J、COL18A1、COX7A2L、EBAG9、ESR1、HSPB1、IGFBP4、KRT19、MYC、NDUFV3、PISD、PREDM15、PTMA、RARA、SOD1和TRIM25,
和/或
Hedgehog途径的所述目标基因的组进一步包括至少一个选自包含以下的组中的目标基因:BCL2、FOXA2、FOXF1、G19、HHIP、IL1R2、JAG2、JUP、MIF、MYLK、NKX2.2、NKX2.8、PITRM1和TOM1,
和/或
AR途径的所述目标基因的组进一步包括至少一个选自包含以下的组中的目标基因:APP、NTS、PLAU、CDKN1A、DRG1、FGF8、IGF1、PRKACB、PTPN1、SGK1和TACC2。
17.装置,其包含配置用于进行权利要求1-16中任一项所述的方法的数字处理器(12)。
18.非临时性存储介质,其存储由数字处理设备(12)可执行以进行权利要求1-16中任一项所述的方法的存储指令。
19.计算机程序,其包含用于使数字处理设备(12)进行权利要求1-16中任一项所述的方法的程序代码工具。
20.权利要求18中所述的非临时性存储介质或权利要求19中所述的计算机程序用于疾病的特异性诊断或预测在具体阶段在具体癌类型中对药物的应答的用途。
CN201280035666.XA 2011-07-19 2012-07-19 使用目标基因表达的概率建模评估细胞信号传导途径活性 Active CN103649337B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201811176740.5A CN109852671A (zh) 2011-07-19 2012-07-19 使用目标基因表达的概率建模评估细胞信号传导途径活性

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
US201161509137P 2011-07-19 2011-07-19
US61/509137 2011-07-19
EP11178148A EP2549399A1 (en) 2011-07-19 2011-08-19 Assessment of Wnt pathway activity using probabilistic modeling of target gene expression
EP11178148.0 2011-08-19
PCT/IB2012/053686 WO2013011479A2 (en) 2011-07-19 2012-07-19 Assessment of cellular signaling pathway activity using probabilistic modeling of target gene expression

Related Child Applications (1)

Application Number Title Priority Date Filing Date
CN201811176740.5A Division CN109852671A (zh) 2011-07-19 2012-07-19 使用目标基因表达的概率建模评估细胞信号传导途径活性

Publications (2)

Publication Number Publication Date
CN103649337A true CN103649337A (zh) 2014-03-19
CN103649337B CN103649337B (zh) 2018-11-13

Family

ID=44582424

Family Applications (2)

Application Number Title Priority Date Filing Date
CN201280035666.XA Active CN103649337B (zh) 2011-07-19 2012-07-19 使用目标基因表达的概率建模评估细胞信号传导途径活性
CN201811176740.5A Pending CN109852671A (zh) 2011-07-19 2012-07-19 使用目标基因表达的概率建模评估细胞信号传导途径活性

Family Applications After (1)

Application Number Title Priority Date Filing Date
CN201811176740.5A Pending CN109852671A (zh) 2011-07-19 2012-07-19 使用目标基因表达的概率建模评估细胞信号传导途径活性

Country Status (12)

Country Link
US (2) US11443831B2 (zh)
EP (6) EP2549399A1 (zh)
JP (3) JP6204354B2 (zh)
KR (1) KR102064004B1 (zh)
CN (2) CN103649337B (zh)
BR (1) BR112014000965B8 (zh)
DK (3) DK3173489T3 (zh)
ES (3) ES2700617T3 (zh)
IN (1) IN2014CN00675A (zh)
MX (1) MX352827B (zh)
RU (1) RU2719194C2 (zh)
WO (1) WO2013011479A2 (zh)

Cited By (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106755464A (zh) * 2017-01-11 2017-05-31 上海易毕恩基因科技有限公司 用于筛选肠癌和/或胃癌的基因标志物的方法、用该方法筛选的基因标志物及其用途
CN107077536A (zh) * 2014-10-24 2017-08-18 皇家飞利浦有限公司 使用靶基因表达的数学建模评价TGF‑β细胞信号传导途径的活性
CN107385051A (zh) * 2017-08-04 2017-11-24 上海易毕恩生物技术有限公司 用于检测肝肿瘤良恶性的基因标志物、试剂盒及检测方法
CN108064380A (zh) * 2014-10-24 2018-05-22 皇家飞利浦有限公司 使用多种细胞信号传导途径活性的医学预后和治疗反应的预测
CN108138237A (zh) * 2015-08-14 2018-06-08 皇家飞利浦有限公司 使用靶基因表达的数学建模评估NFkB细胞信号传导途径活性
WO2018129988A1 (zh) * 2017-01-11 2018-07-19 上海易毕恩基因科技有限公司 用于检测肠癌的基因标志物的方法、用该方法筛选的基因标志物及其用途
CN108875009A (zh) * 2018-06-16 2018-11-23 王梅 一种用于对数据文件进行动态处理的方法及系统
WO2018228028A1 (zh) * 2017-06-16 2018-12-20 上海易毕恩基因科技有限公司 用于检测肝癌的基因标志物及其用途
CN111139300A (zh) * 2020-02-19 2020-05-12 伯克利南京医学研究有限责任公司 一组结肠癌预后相关基因的应用
CN111183233A (zh) * 2017-10-02 2020-05-19 皇家飞利浦有限公司 使用靶基因表达的数学建模评估Notch细胞信号传导途径活性
CN111479933A (zh) * 2017-10-02 2020-07-31 皇家飞利浦有限公司 使用靶基因表达的数学建模评估jak-stat1/2细胞信号传导途径活性
CN111742369A (zh) * 2017-12-20 2020-10-02 皇家飞利浦有限公司 使用靶基因表达的数学建模评估mapk-ap-1细胞信号传导途径活性
CN113963745A (zh) * 2021-12-07 2022-01-21 国际竹藤中心 一种构建植物发育分子调控网络的方法及其应用

Families Citing this family (60)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11660317B2 (en) 2004-11-08 2023-05-30 The Johns Hopkins University Compositions comprising cardiosphere-derived cells for use in cell therapy
EP2549399A1 (en) 2011-07-19 2013-01-23 Koninklijke Philips Electronics N.V. Assessment of Wnt pathway activity using probabilistic modeling of target gene expression
WO2013130364A1 (en) 2012-02-28 2013-09-06 Novartis Ag Cancer patient selection for administration of wnt signaling inhibitors using rnf43 mutation status
EP2882445B1 (en) 2012-08-13 2019-04-24 Cedars-Sinai Medical Center Exosomes and micro-ribonucleic acids for tissue regeneration
CN111961726A (zh) * 2012-12-26 2020-11-20 皇家飞利浦有限公司 使用靶基因表达的线性组合评价细胞信号传导途径活性
TWI582239B (zh) * 2013-03-11 2017-05-11 諾華公司 與wnt抑制劑相關之標記
JP6603208B2 (ja) * 2013-04-26 2019-11-06 コーニンクレッカ フィリップス エヌ ヴェ 複数の細胞内シグナル伝達経路活性を用いた治療反応の医学的予後及び予測
US11011273B2 (en) * 2013-06-28 2021-05-18 Nantomics, Llc Pathway analysis for identification of diagnostic tests
US20160237163A1 (en) * 2013-10-02 2016-08-18 Suri Technologies Ltd. Patient-specific immunotherapy for treating heterogeneous tumors
WO2015101635A1 (en) 2014-01-03 2015-07-09 Koninklijke Philips N.V. Assessment of the pi3k cellular signaling pathway activity using mathematical modelling of target gene expression.
US9838847B2 (en) 2014-09-11 2017-12-05 Google LLP Data driven evaluation and rejection of trained Gaussian process-based wireless mean and standard deviation models
US9880257B2 (en) * 2014-09-11 2018-01-30 Google Llc Gaussian process-based approach for identifying correlation between wireless signals
US9810762B2 (en) * 2014-09-11 2017-11-07 Google Inc. Calculating mean wireless signal strengths using a gaussian process approach incorporating predictive standard deviations
WO2016042164A1 (en) * 2014-09-19 2016-03-24 The Provost, Fellows, Foundation Scholars, & The Other Members Of Board, Of The College Of The Holy & Unidv. Trinity Of Queen Elizabeth, Near Dublin A method of predicting risk of recurrence of cancer
US11357799B2 (en) 2014-10-03 2022-06-14 Cedars-Sinai Medical Center Cardiosphere-derived cells and exosomes secreted by such cells in the treatment of muscular dystrophy
WO2016062892A1 (en) 2014-10-24 2016-04-28 Koninklijke Philips N.V. Medical prognosis and prediction of treatment response using multiple cellular signaling pathway activities
CN105760707B (zh) * 2014-12-18 2018-07-31 中国科学院大连化学物理研究所 细胞基因翻译过程建模方法
JP6883584B2 (ja) * 2015-08-27 2021-06-09 コーニンクレッカ フィリップス エヌ ヴェKoninklijke Philips N.V. マルチオミック癌プロファイルを用いて機能的な患者固有の体細胞異常を識別するための統合された方法及びシステム
CN106897578B (zh) * 2015-12-15 2020-02-14 中国科学院大连化学物理研究所 一种细胞基因翻译过程建模方法
EP3402543B1 (en) 2016-01-11 2021-09-08 Cedars-Sinai Medical Center Cardiosphere-derived cells and exosomes secreted by such cells in the treatment of heart failure with preserved ejection fraction
US20170329914A1 (en) * 2016-05-11 2017-11-16 International Business Machines Corporation Predicting Personalized Cancer Metastasis Routes, Biological Mediators of Metastasis and Metastasis Blocking Therapies
US11351200B2 (en) 2016-06-03 2022-06-07 Cedars-Sinai Medical Center CDC-derived exosomes for treatment of ventricular tachyarrythmias
US10621236B2 (en) * 2016-09-16 2020-04-14 At&T Intellectual Property I, L.P. Concept based querying of graph databases
WO2018057542A1 (en) 2016-09-20 2018-03-29 Cedars-Sinai Medical Center Cardiosphere-derived cells and their extracellular vesicles to retard or reverse aging and age-related disorders
US11990209B2 (en) 2016-11-11 2024-05-21 University of Pittsburgh—Of the Commonwealth System of Higher Educat Identification of instance-specific somatic genome alterations with functional impact
CA3044709A1 (en) 2016-11-25 2018-05-31 Koninklijke Philips N.V. Method to distinguish tumor suppressive foxo activity from oxidative stress
EP3612191A4 (en) 2017-04-19 2020-12-30 Cedars-Sinai Medical Center METHODS AND COMPOSITIONS FOR TREATING SKELETAL MUSCLE DYSTROPHY
CN107184991B (zh) * 2017-05-03 2020-05-26 武汉爱博泰克生物科技有限公司 PRDM15基因序列在制备NF-κB抑制剂中的应用
EP3431582A1 (en) 2017-07-18 2019-01-23 Koninklijke Philips N.V. Cell culturing materials
CN107201411A (zh) * 2017-07-27 2017-09-26 上海市长宁区妇幼保健院 Mylk基因作为诊断子宫内膜癌的标志物
EP3462348A1 (en) 2017-09-28 2019-04-03 Koninklijke Philips N.V. Bayesian inference
EP3461916A1 (en) * 2017-10-02 2019-04-03 Koninklijke Philips N.V. Assessment of jak-stat3 cellular signaling pathway activity using mathematical modelling of target gene expression
CN111587293A (zh) 2017-10-02 2020-08-25 皇家飞利浦有限公司 确定免疫细胞类型和免疫应答的功能状态
US11660355B2 (en) 2017-12-20 2023-05-30 Cedars-Sinai Medical Center Engineered extracellular vesicles for enhanced tissue delivery
US11475995B2 (en) * 2018-05-07 2022-10-18 Perthera, Inc. Integration of multi-omic data into a single scoring model for input into a treatment recommendation ranking
US11354591B2 (en) 2018-10-11 2022-06-07 International Business Machines Corporation Identifying gene signatures and corresponding biological pathways based on an automatically curated genomic database
WO2020124585A1 (zh) * 2018-12-21 2020-06-25 北京哲源科技有限责任公司 获得细胞内确定性事件的方法、电子设备及存储介质
EP3812474A1 (en) 2019-10-22 2021-04-28 Koninklijke Philips N.V. Methods of prognosis in high-grade serous ovarian cancer
EP3963108A1 (en) 2019-05-03 2022-03-09 Koninklijke Philips N.V. Methods of prognosis in high-grade serous ovarian cancer
CA3139514A1 (en) * 2019-05-08 2020-11-12 Cedars-Sinai Medical Center Therapeutically active cells and exosomes
EP3739588A1 (en) 2019-05-13 2020-11-18 Koninklijke Philips N.V. Assessment of multiple signaling pathway activity score in airway epithelial cells to predict airway epithelial abnormality and airway cancer risk
CA3148023A1 (en) * 2019-08-16 2021-02-25 Nike T. Beaubier Systems and methods for detecting cellular pathway dysregulation in cancer specimens
EP3822368A1 (en) 2019-11-14 2021-05-19 Koninklijke Philips N.V. Assessment of pr cellular signaling pathway activity using mathematical modelling of target gene expression
EP3835433A1 (en) 2019-12-12 2021-06-16 Koninklijke Philips N.V. Notch signaling pathway activity as prognostic marker in bladder cancer
CA3163492A1 (en) 2019-12-12 2021-06-17 Tempus Labs, Inc. Real-world evidence of diagnostic testing and treatment patterns in u.s. breast cancer patients
EP3882363A1 (en) 2020-03-17 2021-09-22 Koninklijke Philips N.V. Prognostic pathways for high risk sepsis patients
US20230223108A1 (en) 2020-04-16 2023-07-13 Innosign B.V. Prognostic pathways for viral infections
EP3978628A1 (en) 2020-10-01 2022-04-06 Koninklijke Philips N.V. Prognostic pathways for viral infections
CN111739586B (zh) * 2020-06-17 2024-04-05 浙江大学 以87个基因作为生物标志物预测细胞增殖活性的模型
EP3940704A1 (en) 2020-07-14 2022-01-19 Koninklijke Philips N.V. Method for determining the differentiation state of a stem cell
EP3960875A1 (en) 2020-08-28 2022-03-02 Koninklijke Philips N.V. Pcr method and kit for determining pathway activity
EP3965119A1 (en) 2020-09-04 2022-03-09 Koninklijke Philips N.V. Methods for estimating heterogeneity of a tumour based on values for two or more genome mutation and/or gene expression related parameter, as well as corresponding devices
EP3974540A1 (en) 2020-09-25 2022-03-30 Koninklijke Philips N.V. Method for predicting immunotherapy resistance
EP4015651A1 (en) 2020-12-17 2022-06-22 Koninklijke Philips N.V. Treatment prediction and effectiveness of anti-tnf alpha treatment in ibd patients
EP4039825A1 (en) 2021-02-09 2022-08-10 Koninklijke Philips N.V. Comparison and standardization of cell and tissue culture
WO2022189530A1 (en) 2021-03-11 2022-09-15 Koninklijke Philips N.V. Prognostic pathways for high risk sepsis patients
CN113278700B (zh) * 2021-06-04 2022-08-09 浙江省肿瘤医院 一种用于乳腺癌分型及预后预测的引物组及试剂盒
WO2023084039A1 (en) * 2021-11-15 2023-05-19 Innosign B.V. Assessment of gr cellular signaling pathway activity using mathematical modelling of target gene expression
WO2024033063A1 (en) 2022-08-12 2024-02-15 Innosign B.V. Prediction and monitoring of immunotherapy in cancer
CN116083590B (zh) * 2023-03-23 2024-03-22 雄安妙心医学检验有限公司 一种基因检测试剂盒及其制备方法和应用

Family Cites Families (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6566130B1 (en) * 2000-01-28 2003-05-20 Henry M. Jackson Foundation For The Advancement Of Military Medicine Androgen-regulated gene expressed in prostate tissue
US7371736B2 (en) * 2001-11-07 2008-05-13 The Board Of Trustees Of The University Of Arkansas Gene expression profiling based identification of DKK1 as a potential therapeutic targets for controlling bone loss
EP1380644A1 (en) 2002-07-08 2004-01-14 Kylix B.V. The use of specified TCF target genes to identify drugs for the treatment of cancer, in particular colorectal cancer, in which TCF/beta-catenin/WNT signalling plays a central role
WO2004022575A2 (en) * 2002-09-05 2004-03-18 Toolgen, Inc. Bioinformatics analysis of cellular effects of artificial transcription factors
CN101194260A (zh) * 2005-01-24 2008-06-04 利兰·斯坦福青年大学托管委员会 使用贝叶斯网络建立细胞信号传导系统模型的方法
US20090186024A1 (en) 2005-05-13 2009-07-23 Nevins Joseph R Gene Expression Signatures for Oncogenic Pathway Deregulation
US20070112567A1 (en) 2005-11-07 2007-05-17 Scanscout, Inc. Techiques for model optimization for statistical pattern recognition
WO2007136787A2 (en) * 2006-05-17 2007-11-29 The Trustees Of Boston University Method to determine transcriptional regulation pathways in organisms
WO2008086182A2 (en) * 2007-01-04 2008-07-17 University Of Rochester Use of gene signatures to design novel cancer treatment regimens
JP2010178650A (ja) 2009-02-04 2010-08-19 Univ Of Tokyo 固形癌の再発予測のための試験方法および再発予防剤
US20120252689A1 (en) 2011-04-01 2012-10-04 Zhong Wu Gene expression signature for wnt/b-catenin signaling pathway and use thereof
KR20140064732A (ko) 2011-05-05 2014-05-28 클리니칼 게노믹스 피티와이. 엘티디. 신생물을 진단하는 방법
EP2549399A1 (en) 2011-07-19 2013-01-23 Koninklijke Philips Electronics N.V. Assessment of Wnt pathway activity using probabilistic modeling of target gene expression

Non-Patent Citations (4)

* Cited by examiner, † Cited by third party
Title
HANS A KESTLER ET AL.: "Network modeling of signal transduction: establishing the global view", 《BIOESSAYS》 *
MICHAEL F. OCHS ET AL.: "Detection of Treatment-Induced Changes in Signaling Pathways in Gastrointestinal Stromal Tumors Using Transcriptomic Data", 《SYSTEMS BIOLOGY AND EMERGING TECHNOLOGIES》 *
SASIREKHA KRISHNAN ET AL.: "The role of signaling pathways in the expansion of corneal epithelial cells in serum-free B27 supplemented medium", 《MOLECULAR VISION》 *
SIMON ROGERS, RAYA KHANIN AND MARK GIROLAMI.: "Bayesian model-based inference of transcription factor activity", 《BMC BIOINFORMATICS》 *

Cited By (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107077536A (zh) * 2014-10-24 2017-08-18 皇家飞利浦有限公司 使用靶基因表达的数学建模评价TGF‑β细胞信号传导途径的活性
CN108064380A (zh) * 2014-10-24 2018-05-22 皇家飞利浦有限公司 使用多种细胞信号传导途径活性的医学预后和治疗反应的预测
CN108138237A (zh) * 2015-08-14 2018-06-08 皇家飞利浦有限公司 使用靶基因表达的数学建模评估NFkB细胞信号传导途径活性
CN108138237B (zh) * 2015-08-14 2022-04-05 皇家飞利浦有限公司 使用靶基因表达的数学建模评估NFkB细胞信号传导途径活性
CN106755464A (zh) * 2017-01-11 2017-05-31 上海易毕恩基因科技有限公司 用于筛选肠癌和/或胃癌的基因标志物的方法、用该方法筛选的基因标志物及其用途
WO2018129988A1 (zh) * 2017-01-11 2018-07-19 上海易毕恩基因科技有限公司 用于检测肠癌的基因标志物的方法、用该方法筛选的基因标志物及其用途
WO2018228028A1 (zh) * 2017-06-16 2018-12-20 上海易毕恩基因科技有限公司 用于检测肝癌的基因标志物及其用途
CN107385051A (zh) * 2017-08-04 2017-11-24 上海易毕恩生物技术有限公司 用于检测肝肿瘤良恶性的基因标志物、试剂盒及检测方法
CN111183233A (zh) * 2017-10-02 2020-05-19 皇家飞利浦有限公司 使用靶基因表达的数学建模评估Notch细胞信号传导途径活性
CN111479933A (zh) * 2017-10-02 2020-07-31 皇家飞利浦有限公司 使用靶基因表达的数学建模评估jak-stat1/2细胞信号传导途径活性
CN111742369A (zh) * 2017-12-20 2020-10-02 皇家飞利浦有限公司 使用靶基因表达的数学建模评估mapk-ap-1细胞信号传导途径活性
CN108875009A (zh) * 2018-06-16 2018-11-23 王梅 一种用于对数据文件进行动态处理的方法及系统
CN111139300A (zh) * 2020-02-19 2020-05-12 伯克利南京医学研究有限责任公司 一组结肠癌预后相关基因的应用
CN111139300B (zh) * 2020-02-19 2021-08-17 伯克利南京医学研究有限责任公司 一组结肠癌预后相关基因的应用
CN113963745A (zh) * 2021-12-07 2022-01-21 国际竹藤中心 一种构建植物发育分子调控网络的方法及其应用

Also Published As

Publication number Publication date
JP2019129850A (ja) 2019-08-08
EP2549399A1 (en) 2013-01-23
EP4130291B1 (en) 2024-01-10
WO2013011479A2 (en) 2013-01-24
EP2734643A2 (en) 2014-05-28
CN103649337B (zh) 2018-11-13
DK3418396T3 (da) 2021-05-25
EP3831957A1 (en) 2021-06-09
WO2013011479A3 (en) 2013-03-14
EP3173489A1 (en) 2017-05-31
DK3173489T3 (en) 2018-12-10
ES2874452T3 (es) 2021-11-05
KR20140046464A (ko) 2014-04-18
US11443831B2 (en) 2022-09-13
ES2700617T3 (es) 2019-02-18
JP2017205129A (ja) 2017-11-24
IN2014CN00675A (zh) 2015-04-03
US20230105263A1 (en) 2023-04-06
ES2617195T3 (es) 2017-06-15
EP3173489B1 (en) 2018-09-19
MX2014000557A (es) 2014-05-01
EP2734643B1 (en) 2016-12-07
RU2014106026A (ru) 2015-08-27
EP4130291C0 (en) 2024-01-10
US20140156200A1 (en) 2014-06-05
JP6783729B2 (ja) 2020-11-11
CN109852671A (zh) 2019-06-07
MX352827B (es) 2017-12-11
BR112014000965B8 (pt) 2022-11-08
JP2014520566A (ja) 2014-08-25
JP6807430B2 (ja) 2021-01-06
EP3418396A1 (en) 2018-12-26
KR102064004B1 (ko) 2020-01-08
EP4130291A1 (en) 2023-02-08
BR112014000965A2 (pt) 2017-06-13
EP3418396B1 (en) 2021-03-24
RU2719194C2 (ru) 2020-04-17
EP3831957B1 (en) 2022-09-07
DK2734643T3 (en) 2017-03-20
BR112014000965B1 (pt) 2021-08-24
JP6204354B2 (ja) 2017-09-27

Similar Documents

Publication Publication Date Title
CN103649337A (zh) 使用目标基因表达的概率建模评估细胞信号传导途径活性
CN105121665B (zh) 使用多重细胞信号传导途径活性的治疗应答的医学预后和预测
Simon et al. Analysis of gene expression data using BRB-array tools
Wang et al. The bimodality index: a criterion for discovering and ranking bimodal signatures from cancer gene expression profiling data
Brannon et al. Molecular stratification of clear cell renal cell carcinoma by consensus clustering reveals distinct subtypes and survival patterns
ES2878196T3 (es) Evaluación de la actividad de la vía de señalización celular mediante el uso de una o más combinaciones lineales de expresiones de genes diana
Waddell et al. Gene expression profiling of formalin‐fixed, paraffin‐embedded familial breast tumours using the whole genome‐DASL assay
Young et al. The role of functional data in interpreting the effects of genetic variation
Yaung et al. Artificial intelligence and high-dimensional technologies in the theragnosis of systemic lupus erythematosus
Hicks et al. Integrative genomic analysis for the discovery of biomarkers in prostate cancer
Malinowski Multiple biomarkers in molecular oncology. II. Molecular diagnostics applications in breast cancer management
Zhao Semi-Parametric Mixture Gaussian Model to Detect Breast Cancer Intra-Tumor Heterogeneity
Milioli Breast Cancer Intrinsic Subtypes: A Critical Conception in Bioinformatics
Gevaert A Bayesian network integration framework for modeling biomedical data

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
TR01 Transfer of patent right

Effective date of registration: 20220913

Address after: Holland Ian Deho Finn

Patentee after: Innomark Ltd.

Address before: Holland Ian Deho Finn

Patentee before: KONINKLIJKE PHILIPS N.V.

TR01 Transfer of patent right