CN105121665B - 使用多重细胞信号传导途径活性的治疗应答的医学预后和预测 - Google Patents

使用多重细胞信号传导途径活性的治疗应答的医学预后和预测 Download PDF

Info

Publication number
CN105121665B
CN105121665B CN201480023555.6A CN201480023555A CN105121665B CN 105121665 B CN105121665 B CN 105121665B CN 201480023555 A CN201480023555 A CN 201480023555A CN 105121665 B CN105121665 B CN 105121665B
Authority
CN
China
Prior art keywords
approach
cell
target gene
tissue
subject
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201480023555.6A
Other languages
English (en)
Other versions
CN105121665A (zh
Inventor
W.F.J.维哈伊格
H.J.范奧詹
A.范德斯托佩
M.阿维斯德恩达
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Koninklijke Philips NV
Original Assignee
Koninklijke Philips NV
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Koninklijke Philips NV filed Critical Koninklijke Philips NV
Publication of CN105121665A publication Critical patent/CN105121665A/zh
Application granted granted Critical
Publication of CN105121665B publication Critical patent/CN105121665B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B5/00ICT specially adapted for modelling or simulations in systems biology, e.g. gene-regulatory networks, protein interaction networks or metabolic networks
    • G16B5/20Probabilistic models
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B5/00ICT specially adapted for modelling or simulations in systems biology, e.g. gene-regulatory networks, protein interaction networks or metabolic networks
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6876Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
    • C12Q1/6883Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material
    • C12Q1/6886Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material for cancer
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N33/00Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
    • G01N33/48Biological material, e.g. blood, urine; Haemocytometers
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B20/00ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B20/00ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
    • G16B20/20Allele or variant detection, e.g. single nucleotide polymorphism [SNP] detection
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B25/00ICT specially adapted for hybridisation; ICT specially adapted for gene or protein expression
    • G16B25/10Gene or protein expression profiling; Expression-ratio estimation or normalisation
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/30ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for calculating health indices; for individual health risk assessment
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/118Prognosis of disease development
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/158Expression markers
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B25/00ICT specially adapted for hybridisation; ICT specially adapted for gene or protein expression

Landscapes

  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Chemical & Material Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Molecular Biology (AREA)
  • Medical Informatics (AREA)
  • Biotechnology (AREA)
  • Biophysics (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Theoretical Computer Science (AREA)
  • Evolutionary Biology (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Analytical Chemistry (AREA)
  • Organic Chemistry (AREA)
  • Pathology (AREA)
  • Immunology (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Physiology (AREA)
  • Biochemistry (AREA)
  • Public Health (AREA)
  • Hospice & Palliative Care (AREA)
  • Oncology (AREA)
  • Microbiology (AREA)
  • General Engineering & Computer Science (AREA)
  • Probability & Statistics with Applications (AREA)
  • Biomedical Technology (AREA)
  • Epidemiology (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Primary Health Care (AREA)
  • Hematology (AREA)
  • Urology & Nephrology (AREA)
  • Food Science & Technology (AREA)
  • General Physics & Mathematics (AREA)

Abstract

本申请涉及用于测定风险得分的方法,所述风险得分指示临床事件将在某一时间段内发生的风险。风险得分至少部分基于受试者的组织和/或细胞和/或体液中的两个或更多个细胞信号传导途径的推断活性组合。细胞信号传导途径包含Wnt途径、ER途径、HH途径和/或AR途径。风险得分这样进行限定,使得临床事件将在某一时间段内发生的所示风险随着P ER 增加而减少,并且随着max(P Wnt 、P HH )增加而增加,其中P ER P Wnt P HH 分别指示ER途径、Wnt途径和HH途径的推断活性。

Description

使用多重细胞信号传导途径活性的治疗应答的医学预后和 预测
发明领域
本文描述的主题主要涉及生物信息学、基因组处理领域、蛋白质组学处理领域和相关领域。
发明背景
基因组和蛋白质组学分析已基本实现,且提出医学领域例如肿瘤学中的临床应用的潜在希望,其中多种癌症已知与基因组突变/变异/异常甲基化模式的特异性组合和/或特异性基因的高或低表达水平相关,所述特异性基因在癌症的生长和进化例如细胞增殖和转移中起作用。例如,Wnt信号传导途径影响细胞增殖的调节,并且是高度调节的。由于调节丧失导致的高Wnt途径活性已与癌症关联,在所述癌症中有恶性结肠肿瘤。虽然不限于任何具体操作理论,但认为恶性肿瘤细胞中的Wnt途径失调导致高Wnt途径活性,其依次又引起恶性结肠细胞的细胞增殖,即结肠癌的传播。另一方面,例如在骨质疏松症的情况下,异常低的途径活性也可能是有利的。在健康和疾病中的细胞分裂、功能和/或分化中起相似作用的其他途径是细胞信号传导途径(例如ER、PR、AR、PPAR、GR、VitD、TGFbeta、Notch、Hedgehog、FGF、NFκB、VEGF和PDGF)。
获得基因组和蛋白组学数据的技术在临床背景下已变得容易获得。例如,通过微阵列的测量常规用于评价基因表达水平、蛋白质水平、甲基化等等。自动化的基因测序允许DNA和mRNA中的遗传变异/突变/异常甲基化模式的成本有效的鉴定。在基因测序期间的mRNA水平的定量评价带来作为用于评价基因表达水平的临床工具的希望。
治疗学家例如肿瘤科医生的主要挑战之一是对患者的预后作出有根据的猜测,因为这种信息影响治疗选择。基于个别患者癌症组织样品的基因组学、转录组学和蛋白质组学(以及其他“组学”)分析,提供了可以潜在地促成患者的预后评价的信息。然而,解释这些复杂数据以提取有关临床信息已证明为挑战,在很大程度上仍是未解决的。患者预后可以以几种方法以定量方式得到指示,如例如:“复发时间”、或“转移时间”、或“存活时间”、或“由于疾病或治疗的死亡风险”。
发明概述
本发明提供了如本文公开的新的和改良的方法和仪器。
依照本发明的主要方面,上述问题通过用于测定风险得分的具体方法得到解决,所述风险得分指示临床事件将在某一时间段内发生的风险,所述方法即包括下述的方法:
至少基于在受试者的组织和/或细胞和/或体液的提取样品中测量的细胞信号传导途径的一种或多种靶基因的表达水平,推断受试者的组织和/或细胞和/或体液中的两个或更多个细胞信号传导途径的活性,和
测定指示临床事件将在某一时间段内发生的风险的风险得分,其中所述风险得分至少部分基于推断活性的组合,
其中所述细胞信号传导途径包含Wnt途径、ER(雌激素受体)途径、HH(Hedgehog)途径和/或AR(雄激素受体)途径,
其中所述细胞信号传导途径包含ER途径、Wnt途径和HH途径,并且其中所述风险得分这样进行限定,使得临床事件将在某一时间段内发生的所示风险随着P ER 增加而减少,并且随着max(P Wnt 、P HH )增加而增加,
其中P ER P Wnt P HH 分别指示ER途径、Wnt途径和HH途径的推断活性。
受试者可以是人或动物,并且特别是医疗受试者。此外,“靶基因”可以是“直接靶基因”和/或“间接靶基因”(如本文描述的)。
Wnt途径、ER途径、HH途径和AR途径优选定义为细胞信号传导途径,其最终导致与途径相关的转录因子(TF)复合物的转录活性。优选地,这些分别由至少β-连环蛋白/TCF4、ERα二聚体、GLI家族成员和AR组成。
受试者的组织和/或细胞和/或体液中的细胞信号传导途径活性的推断可以例如尤其通过下述执行:(i)评估代表一组输入的细胞信号传导途径的概率模型(优选贝叶斯网络)的至少一部分,所述一组输入包括至少在受试者的组织和/或细胞和/或体液中(例如在组织载玻片或细胞上的染色),或者在组织和/或细胞和/或体液的提取样品中,测量的细胞信号传导途径的一种或多种靶基因的表达水平,(ii)估计受试者的组织中的至少一种转录因子(TF)元件的水平,所述至少一种TF元件控制细胞信号传导途径的一种或多种靶基因的转录,所述估计至少部分基于关于至少一种TF元件的条件概率,以及在受试者的提取样品中测量的细胞信号传导途径的一种或多种靶基因的表达水平,和(iii)基于在组织样品和/或细胞样品和/或体液样品中估计的转录因子水平,推断细胞信号传导途径的活性。这在公开的欧洲专利申请EP 2 549 399 A1(“Assessment of Wnt pathway activity usingprobabilistic modeling of target gene expressions”),且特别是公开的国际专利申请WO 2013/011479 A2(“Assessment of cellular signaling pathway activity usingprobabilistic modeling of target gene expression”)中详细描述,所述专利的内容随同整体引入。
在示例性替代方案中,在受试者的组织和/或细胞和/或体液中的细胞信号传导途径中的一种或多种的活性的推断可以例如尤其通过下述执行:(i)在受试者的组织和/或细胞和/或体液的提取样品中,测定转录因子(TF)元件的水平,该TF元件控制细胞信号传导途径的一种或多种靶基因的转录,测定至少部分基于评估将细胞信号传导途径的一种或多种基因的表达水平与TF元件的水平关联的数学模型,该模型至少部分基于一种或多种靶基因的表达水平的一种或多种线性组合,和(ii)基于在受试者的组织和/或细胞和/或体液的提取样品中测定的TF元件水平,推断在受试者的组织和/或细胞和/或体液中的细胞信号传导途径的活性。这在未公开的美国临时专利申请US 61/745839,相应的未公开的国际专利申请PCT/IB2013/061066(“Assessment of cellular signaling pathway activity usinglinear combination(s)of target gene expressions”)中详细描述。
优选地,细胞信号传导途径包含在癌症中起作用的至少一个细胞信号传导途径。
特别优选的是其中细胞信号传导途径包含Wnt途径和/或HH途径的方法,并且其中风险得分这样进行限定,使得临床事件将在某一时间段内发生的所示风险随着Wnt途径的推断活性增加而增加,和/或随着HH途径的推断活性增加而增加。
还特别优选的是其中细胞信号传导途径包含ER途径的方法,并且其中风险得分这样进行限定,使得临床事件将在某一时间段内发生的所示风险随着ER途径的推断活性增加而减少。
进一步优选的是其中推断活性的组合包含下述表达的方法
α · P ER + β · max(P Wnt ,P HH ),
其中P ER P Wnt P HH 分别指示ER途径、Wnt途径和HH途径的推断活性,αβ是正的常数比例因子,并且临床事件将在某一时间段内发生的所示风险随着表达的值增加而单纯增加。
特别优选的是这样的方法,其中所述推断包括:
至少基于在受试者的组织和/或细胞和/或体液的提取样品中测量的Wnt途径的一种或多种,优选至少三种靶基因的表达水平,推断受试者的组织和/或细胞和/或体液中的Wnt途径的活性,所述靶基因选自下述:KIAA1199、AXIN2、RNF43、TBX3、TDGF1、SOX9、ASCL2、IL8、SP5、ZNRF3、KLF6、CCND1、DEFA6和FZD7,
和/或
至少基于在受试者的组织和/或细胞和/或体液的提取样品中测量的ER途径的一种或多种,优选至少三种靶基因的表达水平,推断受试者的组织和/或细胞和/或体液中的ER途径的活性,所述靶基因选自下述:GREB1、PGR、XBP1、CA12、SOD1、CTSD、IGFBP4、TFF1、SGK3、NRIP1、CELSR2、WISP2和AP1B1,
和/或
至少基于在受试者的组织和/或细胞和/或体液的提取样品中测量的HH途径的一种或多种,优选至少三种靶基因的表达水平,推断受试者的组织和/或细胞和/或体液中的HH途径的活性,所述靶基因选自下述:GLI1、PTCH1、PTCH2、IGFBP6、SPP1、CCND2、FST、FOXL1、CFLAR、TSC22D1、RAB34、S100A9、S100A7、MYCN、FOXM1、GLI3、TCEA2、FYN和CTSL1,
和/或
至少基于在受试者的组织和/或细胞和/或体液的提取样品中测量的AR途径的一种或多种,优选至少三种靶基因的表达水平,推断受试者的组织和/或细胞和/或体液中的AR途径的活性,所述靶基因选自下述:KLK2、PMEPA1、TMPRSS2、NKX3_1、ABCC4、KLK3、FKBP5、ELL2、UGT2B15、DHCR24、PPAP2A、NDRG1、LRIG1、CREB3L4、LCP1、GUCY1A3、AR和EAF2。
进一步优选的是这样的方法,其中所述推断进一步基于:
在受试者的组织和/或细胞和/或体液的提取样品中测量的Wnt途径的至少一种靶基因的表达水平,所述靶基因选自:NKD1、OAT、FAT1、LEF1、GLUL、REG1B、TCF7L2、COL18A1、BMP7、SLC1A2、ADRA2C、PPARG、DKK1、HNF1A和LECT2,
和/或
在受试者的组织和/或细胞和/或体液的提取样品中测量的ER途径的至少一种靶基因的表达水平,所述靶基因选自:RARA、MYC、DSCAM、EBAG9、COX7A2L、ERBB2、PISD、KRT19、HSPB1、TRIM25、PTMA、COL18A1、CDH26、NDUFV3、PRDM15、ATP5J和ESR1,
和/或
在受试者的组织和/或细胞和/或体液的提取样品中测量的HH途径的至少一种靶基因的表达水平,所述靶基因选自: BCL2、FOXA2、FOXF1、H19、HHIP、IL1R2、JAG2、JUP、MIF、MYLK、NKX2.2、NKX2.8、PITRM1和TOM1,
和/或
在受试者的组织和/或细胞和/或体液的提取样品中测量的AR途径的至少一种靶基因的表达水平,所述靶基因选自: APP、NTS、PLAU、CDKN1A、DRG1、FGF8、IGF1、PRKACB、PTPN1、SGK1和TACC2。
本发明的另一个方面涉及进一步包括下述的方法(如本文描述的):
将受试者指定至与不同所示风险相关的多个风险组中的至少一个,所述风险指示临床事件将在某一时间段内发生,
和/或
至少部分基于临床事件将在某一时间段内发生的所示风险,决定对于受试者推荐的治疗。
本发明还涉及包括下述的方法(如本文描述的):
至少基于在受试者的组织和/或细胞和/或体液的提取样品中测量的Wnt途径的一组靶基因的两种、三种或更多种靶基因的表达水平,推断受试者的组织和/或细胞和/或体液中的Wnt途径的活性,
和/或
至少基于在受试者的组织和/或细胞和/或体液的提取样品中测量的ER途径的一组靶基因的两种、三种或更多种靶基因的表达水平,推断受试者的组织和/或细胞和/或体液中的ER途径的活性,
和/或
至少基于在受试者的组织和/或细胞和/或体液的提取样品中测量的HH途径的一组靶基因的两种、三种或更多种靶基因的表达水平,推断受试者的组织和/或细胞和/或体液中的HH途径的活性,
和/或
至少基于在受试者的组织和/或细胞和/或体液的提取样品中测量的AR途径的一组靶基因的两种、三种或更多种靶基因的表达水平,推断受试者的组织和/或细胞和/或体液中的AR途径的活性。
优选地,
Wnt途径的靶基因的组包含选自下述的至少九种,优选全部靶基因:KIAA1199、AXIN2、RNF43、TBX3、TDGF1、SOX9、ASCL2、IL8、SP5、ZNRF3、KLF6、CCND1、DEFA6和FZD7,
和/或
ER途径的靶基因的组包含选自下述的至少九种,优选全部靶基因:GREB1、PGR、XBP1、CA12、SOD1、CTSD、IGFBP4、TFF1、SGK3、NRIP1、CELSR2、WISP2和AP1B1,
和/或
HH途径的靶基因的组包含选自下述的至少九种,优选全部靶基因:GLI1、PTCH1、PTCH2、IGFBP6、SPP1、CCND2、FST、FOXL1、CFLAR、TSC22D1、RAB34、S100A9、S100A7、MYCN、FOXM1、GLI3、TCEA2、FYN和CTSL1,
和/或
AR途径的靶基因的组包含选自下述的至少九种,优选全部靶基因:KLK2、PMEPA1、TMPRSS2、NKX3_1、ABCC4、KLK3、FKBP5、ELL2、UGT2B15、DHCR24、PPAP2A、NDRG1、LRIG1、CREB3L4、LCP1、GUCY1A3、AR和EAF2。
特别优选的是这样的方法,其中
Wnt途径的靶基因的组进一步包括选自下述的至少一种靶基因:NKD1、OAT、FAT1、LEF1、GLUL、REG1B、TCF7L2、COL18A1、BMP7、SLC1A2、ADRA2C、PPARG、DKK1、HNF1A和LECT2、
和/或
ER途径的靶基因的组进一步包括选自下述的至少一种靶基因:RARA、MYC、DSCAM、EBAG9、COX7A2L、ERBB2、PISD、KRT19、HSPB1、TRIM25、PTMA、COL18A1、CDH26、NDUFV3、PRDM15、ATP5J和ESR1,
和/或
HH途径的靶基因的组进一步包括选自下述的至少一种靶基因:BCL2、FOXA2、FOXF1、H19、HHIP、IL1R2、JAG2、JUP、MIF、MYLK、NKX2.2、NKX2.8、PITRM1和TOM1,
和/或
AR途径的靶基因的组进一步包括选自下述的至少一种靶基因:APP、NTS、PLAU、CDKN1A、DRG1、FGF8、IGF1、PRKACB、PTPN1、SGK1和TACC2。
待依照本发明使用的样品可以是优选经由活组织检查操作或其他样品提取操作,例如得自癌症病变,或怀疑癌症的病变,或转移性肿瘤,或其中存在被癌细胞污染的流体的体腔(例如胸膜腔或腹腔或者膀胱腔),或含有癌细胞的其他体液等等的样品。样品由其提取的细胞还可以是来自血液系统恶性肿瘤(例如白血病或淋巴瘤)的肿瘤细胞。在一些情况下,细胞样品还可以是循环肿瘤细胞,即已进入血流且可以使用合适的分离技术(例如血浆分离置换法(apheresis)或常规静脉抽血)提取的肿瘤细胞。除血液之外,样品由其提取的体液可以是尿、胃肠内容物或渗出液。如本文使用的,术语“提取的样品”还涵盖这样的情况,其中受试者的组织和/或细胞和/或体液已取自受试者并且例如已置于显微镜载玻片上,并且其中为了执行请求保护的方法,例如借助于激光捕获显微切割(LCM),或通过从载玻片上刮取目的细胞来提取该样品的一部分,或通过荧光激活细胞分选技术。
进一步优选的是这样的方法,其进一步包括组合风险得分和/或推断活性中的至少一种与得自一种或多种另外的预后测试的一种或多种另外的风险得分,以获得组合的风险得分,其中所述组合的风险得分指示临床事件将在某一时间段内发生的风险。一种或多种另外的预后测试可以特别包含Oncotype DX®乳腺癌测试、Mammostrat®乳腺癌测试、MammaPrint®乳腺癌测试、BluePrintTM乳腺癌测试、CompanDx®乳腺癌测试、BreastCancer IndexSM(HOXB13/IL17BR)、OncotypeDX®结肠癌测试、和/或通过测量基因/蛋白质Ki67的表达执行的增殖测试。
优先地,临床事件是癌症,特别是乳腺癌。临床事件将在某一时间段内发生的风险随后优先是治疗后的癌症返回的风险,即复发的风险。这可以是局部的(即,在原始肿瘤的侧面处)、或远处的(即转移,超出原始侧面)。可替代地,风险可以是疾病进展或死亡的风险。
依照另一个公开的方面,仪器包括配置为执行如本文描述的根据本发明的方法的数字处理器。
依照另一个公开的方面,非瞬时性存储介质存储可通过数字处理装置执行的指令,以执行如本文描述的根据本发明的方法。非瞬时性存储介质可以是计算机可读存储介质,例如硬驱或其他磁性存储介质、光盘或其他光盘存储介质、随机存取存储器(RAM)、只读存储器(ROM)、闪存、或其他电子存储介质、网络服务器等等。数字处理装置可以是手提式装置(例如个人数字助理或智能电话)、笔记本计算机、台式计算机、平板计算机或装置、远程网络服务器等等。
依照另一个公开的方面,计算机程序包含用于促使数字处理装置执行如本文描述的根据本发明的方法的程序代码工具。数字处理装置可以是手提式装置(例如个人数字助理或智能电话)、笔记本计算机、台式计算机、平板计算机或装置、远程网络服务器等等。
依照另一个公开的方面,信号代表指示临床事件将在某一时间段内发生的风险的风险得分,其中所述风险得分起因于执行如本文描述的根据本发明的方法。信号可以是模拟信号或它可以是数字信号。
一个优点在于临床决策支持(CDS)系统,特别地,如通过至少部分基于细胞信号传导途径的推断活性组合的风险得分指示的,基于临床事件例如癌症特别是乳腺癌将在某一时间段内发生的风险,例如使用Wnt途径、ER途径、AR途径和/或HH途径的概率或另一种数学模型,基于两个或更多个细胞信号传导途径的分析,例如通过决定用于受试者的治疗,所述CDS系统适合提供临床建议。
另一个优点在于适合将受试者指定至多个风险组中的至少一个的CDS系统,如通过至少部分基于一个或多个细胞信号传导途径的推断活性组合的风险得分指示的,所述风险组与临床事件例如癌症特别是乳腺癌将在某一时间段内发生的不同风险相关。
另一个优点在于组合指示临床事件将在某一时间段内发生的风险的风险得分,以及至少部分基于一种或多种细胞信号传导途径的推断活性与得自一种或多种另外的预后测试的一种或多种另外的风险得分的组合的那种。
如本文描述的本发明还可以例如有利地与下述结合使用:
- 部分基于一个或多个细胞信号传导途径的推断活性组合的预后预测,
- 部分基于一个或多个细胞信号传导途径的推断活性组合的例如化学疗法和/或激素治疗的药物功效预测,
- 部分基于一个或多个细胞信号传导途径的推断活性组合的药物功效监控,
- 部分基于一个或多个细胞信号传导途径的推断活性组合的药物开发,
- 部分基于一个或多个细胞信号传导途径的推断活性组合的测定开发,和/或
- 部分基于一个或多个细胞信号传导途径的推断活性组合的癌症分期。
在阅读和理解附图、下述说明书后,且特别是阅读本文下文提供的详细实施例后,进一步的优点对于本领域普通技术人员将是显而易见的。
附图简述
图1显示了对于来自GSE6532、GSE9195、GSE20685、GSE20685、GSE21653和E-MTAB-365的一组多样化乳腺癌患者(n = 1294),使用等式(7)计算的MPS的直方图,其中α = 1和β= 1。
图2显示了如在GSE6532和GSE9195中报道的,用手术和辅助激素处理治疗的ER阳性患者中的无复发存活的卡普兰-迈耶曲线。基于以MPS为基础的高风险分层、Oncotype DX®复发得分(RS)和关于两种得分(MPS & RS)的高风险分层,将患者组分开。
图3显示了如在E-MTAB-365中报道的,原发性乳腺癌患者中的无复发存活的卡普兰-迈耶曲线。如本文描述的,基于以多途径得分为基础的风险分层算法,将患者组分开。p值使用时序检验在低风险和高风险患者组之间进行计算。
图4显示了如在GSE20685中报道的,一组多样化乳腺癌患者中的无复发存活的卡普兰-迈耶曲线。基于以本文提供的多途径得分为基础的风险分层算法,将患者组分开。所报道的p值使用时序检验在低风险和高风险患者组之间进行计算。
图5显示了如在GSE21653中报道的,一组早期乳腺癌患者中的无复发存活的卡普兰-迈耶曲线。基于以本文提供的多途径得分为基础的风险分层算法,将患者组分开。所报道的p值使用时序检验在低风险和高风险患者组之间进行计算。
图6图解显示了配置为测定风险得分的临床决策支持(CDS)系统,所述风险得分指示临床事件将在某一时间段内发生的风险,如本文公开的。
图7显示了举例说明来自比较两种不同测定的风险得分的实验结果的图。
实施方案详述
下述实施例仅举例说明特别优选的方法和与之结合的所选方面。其中提供的教导可以用于构建几种测试和/或试剂盒。下述实施例不应解释为限制本发明的范围。
实施例1:推断两个或更多个细胞信号传导途径的活性
如公开的欧洲专利申请EP 2 549 399 A1(“Assessment of Wnt pathwayactivity using probabilistic modeling of target gene expressions”),且特别是公开的国际专利申请WO 2013/011479 A2(“Assessment of cellular signaling pathwayactivity using probabilistic modeling of target gene expression”)中详细描述的,通过构建概率模型(例如贝叶斯模型),且掺入在许多不同靶基因的表达水平和细胞信号传导途径的活性之间的条件概率关系,此类模型可以用于以高准确度测定细胞信号传导途径的活性。此外,概率模型可以容易地更新,以掺入通过以后的临床研究获得的另外知识,通过调整条件概率和/或将新结点加入模型中以代表另外的信息来源。以这种方式,概率模型可以适当地更新,以体现最近的医学知识。
各自途径的靶基因可以优选根据WO 2013/011479 A2的部分“实施例3:靶基因的选择”和“实施例4:证据策划列表和广泛文献列表的比较”中所述的方法加以选择,并且概率模型可以优选根据WO 2013/011479 A2的“实施例5:训练和使用贝叶斯网络”中所述的方法加以训练。用于测定示例性Wnt途径、ER途径、AR途径和/或AR途径活性的靶基因的合适选择在所附权利要求中限定。
在未公开的美国临时专利申请US 61/745839,相应的未公开的国际专利申请PCT/IB2013/061066(“Assessment of cellular signaling pathway activity using linearcombination(s)of target gene expressions”)中详细描述的另一种容易理解且解释的方法中,通过构建掺入细胞信号传导途径的一种或多种靶基因的表达水平和转录因子(TF)元件水平之间的关系的数学模型(例如线性或(假)线性模型),该TF元件控制细胞信号传导途径的一种或多种靶基因的转录,该模型至少部分基于一种或多种靶基因的表达水平的一种或多种线性组合,来测定某一细胞信号传导途径的活性。
就这种以后的方法而言,一种或多种靶基因的表达水平可以优选是mRNA水平的测量,其可以是例如使用与靶基因的mRNA序列相关的探针的(RT)-PCR和微阵列技术以及RNA测序的结果。在另一个实施方案中,一种或多种靶基因的表达水平可以通过蛋白质水平,例如由靶基因编码的蛋白质的浓度进行测量。
上述表达水平可以任选以可能更适合或更不适合应用的许多方式进行转换。例如,表达水平例如基于微阵列的mRNA水平的四种不同转化可以是:
- “连续数据”,即如使用众所周知的算法例如MAS5.0和fRMA在微阵列预处理后获得的表达水平,
- “z得分”,即连续表达水平这样换算,使得跨越所有样品的平均值为0并且标准差为1,
- “离散的”,即超过某一阈值的每一个表达设为1,并且低于某一阈值的每一个表达设为0(例如探针组的阈值可以选择为在许多阳性和相同数目的阴性临床样品的组中的其值的中值),
- “模糊的”,即使用下述形式的S型函数,将连续表达水平转换为0和1之间的值:1/(1 + exp((threxpr)/ se)),其中expr是连续表达水平,thr是如先前提及的阈值,并且se是影响0和1之间的差异的软化参数。
可以构建的最简单模型之一是这样的模型,其在第一层中具有代表转录因子(TF)元件的结点,以及在第二层中代表靶基因的表达强度水平的直接测量的加权结点,所述直接测量例如通过在微阵列或(q)PCR实验中,与特定靶基因特别高度关联的一个探针组。权重可以基于来自训练数据集的计算或基于专业知识。在其中每种靶基因可能测量多重表达水平的情况下(例如在微阵列实验的情况下,其中一种靶基因可以用多重探针组进行测量),使用仅一种表达水平/靶基因的这种方法是特别简单的。选择用于特定靶基因的一种表达水平的具体方法是使用来自探针组的表达水平,所述探针组能够最佳分开训练数据集的活跃和消极样品。测定该探针组的一种方法是执行统计检验,例如t检验,并且选择具有最低p值的探针组。具有最低p值的探针的训练数据集的表达水平通过限定具有(已知)活跃和消极样品的表达水平重叠的可能性最小概率的探针。另一种选择方法是基于优势比。在此类模型中,对于一种或多种靶基因各自提供一种或多种表达水平,并且一种或多种线性组合包含对于一种或多种靶基因各自包括加权项的线性组合,每个加权项基于对于相应的靶基因提供的一种或多种表达水平的仅一种表达水平。如果如上所述每种靶基因选择仅一种表达水平,则该模型可以被称为“最具判别性的探针组”模型。
在“最具判别性的探针组”模型的替代物中,在其中每种靶基因可能测量多重表达水平的情况下,能够利用每种靶基因提供的所有表达水平。在此类模型中,对于一种或多种靶基因各自提供一种或多种表达水平,并且其中一种或多种线性组合包含对于一种或多种靶基因提供的一种或多种表达水平的所有表达水平的线性组合。换言之,对于一种或多种靶基因各自,对于相应的靶基因提供的一种或多种表达水平各自可以在线性组合中通过其自身(个别)权重进行加权。这种变体可以被称为“所有探针组”模型。它具有相对简单同时利用所有提供的表达水平的优点。
如上所述的两个模型的共同之处在于它们可以视为“单层”模型,其中TF元件的水平基于表达水平的线性组合进行计算。
在TF元件的水平已通过评估各自模型进行测定后,测定的TF元件水平可以是有阈值的,以便推断细胞信号传导途径的活性。计算此类适当阈值的方法是通过比较已知具有消极途径的训练样品和具有活跃途径的训练样品的测定的TF元件水平wlc。这样做且还考虑到这些组中的方差的方法通过使用阈值获得
其中σμ是训练样品的标准差和平均值。在仅少数样品在活跃和/或消极训练样品中可获得的情况下,假计数可以加入基于两组方差的平均值计算的方差中:
其中v是组方差,并且x是阳性假计数。标准差σ接下来可以通过获得方差v的平方根来获得。
为了便于解释,阈值可以从TF元件wlc的测定水平中扣除,导致细胞信号传导途径的活性得分,使得负值对应于消极细胞信号传导途径,并且正值对应于活跃细胞信号传导途径。
可以使用代表途径的活性信号传导的实验测定的举例说明性“双层”模型,作为上述“单层”模型的替代物。对于每一种靶基因,基于其相关探针组的测量强度,使用线性组合计算概括水平(“第一(底)层”)。计算的概括值随后与使用进一步线性组合的途径的其他靶基因的概括值组合(“第二(顶)层”)。权重可以由训练数据集学习或基于专业知识或其组合。换种说法,在“双层”模型中,对于一种或多种靶基因各自提供一种或多种表达水平,并且一种或多种线性组合对于一种或多种靶基因各自包含对于相应的靶基因提供的一种或多种表达水平的所有表达水平的第一线性组合(“第一(底)层”)。该模型进一步至少部分基于对于一种或多种靶基因各自包括加权项的进一步的线性组合,每个加权项基于对于相应的靶基因的第一线性组合(“第二(顶)层”)。
在优选形式的“双层”模型中,概括值的计算可以包括使用训练数据对于每种靶基因限定阈值,并且从计算的线性组合中扣除阈值,获得基因概括。此处,阈值可以这样选择,使得负基因概括水平对应于下调的靶基因,并且正基因概括水平对应于上调的靶基因。另外,基因概括值在它们合并到“第二(上层)”之前,使用例如上述转化(模糊、离散等)之一进行转化是可能的。
在TF元件的水平已通过评估“双层”模型进行测定后,测定的TF元件水平可以是有阈值的,以便推断细胞信号传导途径的活性,如上所述。
在下文中,上文就US 61/745839,相应的PCT/IB2013/061066而言描述的模型统称为“(假)线性模型”。
各自途径的靶基因可以优选根据US 61/745839,相应的PCT/IB2013/061066的部分“实施例2:靶基因的选择”和“实施例3:证据策划列表和广泛文献列表的比较”中所述的方法加以选择,并且数学模型可以优选根据US 61/745839,相应的PCT/IB2013/061066的“实施例4:训练和使用数学模型”中所述的方法加以训练。在所附权利要求中限定的靶基因的选择也可与这种以后的方法一起用于测定示例性Wnt途径、ER途径、AR途径和/或AR途径的活性。
在下文中,简要概括了根据US 61/745839,相应的PCT/IB2013/061066的部分“实施例2:靶基因的选择”和“实施例3:证据策划列表和广泛文献列表的比较”中所述的方法的各自途径的靶基因选择,以及根据US 61/745839,相应的PCT/IB2013/061066的“实施例4:训练和使用数学模型”中所述的方法的数学模型训练。
靶基因的选择根据US 61/745839,相应的PCT/IB2013/061066的实施例2。
转录因子(TF)是蛋白质复合物(即,以特异性结构结合在一起的蛋白质组合)或能够通过与特异性DNA序列结合来调节来自靶基因的转录的蛋白质,从而控制从DNA到mRNA的遗传信息转录。由于这种转录复合物的作用直接产生的mRNA在本文中被称为“直接靶基因”。途径活化还可以导致被称为“间接靶基因”的更多次级基因转录。在下文中,包含直接靶基因或由直接靶基因组成的(假)线性模型是优选的,所述直接靶基因作为途径活性和mRNA水平之间的直接联系,然而,在直接和间接靶基因之间的区别不一定是显而易见的。此处,呈现了使用基于可用文献数据的评分函数来选择直接靶基因的方法。然而,由于有限的信息以及生物学变异和不确定性,无法排除间接靶基因的意外选择。
取决于其中累积证据的科学实验类型,通过使用其中特异性靶基因的科学证据给出排名的排名系统,从科学文献中选择特异性途径mRNA靶基因。虽然一些实验证据仅暗示基因是靶基因,如例如在其中已知HH途径活跃的胚胎微阵列上的mRNA增加,但其他证据可以是极强的,如鉴定的途径转录因子结合位点、以及在刺激细胞中的特异性途径后该位点在染色质免疫沉淀(ChIP)测定中的取回和在特异性刺激细胞系中的途径后mRNA中的增加的组合。
发现特异性途径靶基因的几类实验可以在科学文献中得到鉴定,例如(但不限于):
1. 显示了其中途径转录因子与其在基因组上的结合位点直接结合的ChIP实验。例子:通过使用染色质免疫沉淀(ChIP)技术,鉴定了在含和不含活跃Wnt途径的结肠细胞系的DNA中后续假定的功能TCF4转录因子结合位点,作为纯粹基于核苷酸序列识别的结合位点亚集。假定功能性鉴定为发现转录因子与DNA结合位点结合的ChIP衍生的证据。
2. 电泳迁移率变动(EMSA)测定,其显示转录因子与含有结合序列的DNA片段的体外结合。与基于ChIP的证据相比较,基于EMSA的证据强度较弱,因为它不能转变为体内情况。
3. 途径的刺激和测量在微阵列上的mRNA概况或使用RNA测序,使用途径诱导细胞系且测量在诱导后的几个时间点测量的mRNA概况 - 在环己酰亚胺的存在下,所述环己酰亚胺抑制翻译为蛋白质,因此诱导的mRNA假定为直接靶基因。
4. 类似于3,但使用定量PCR以测量mRNA的量。
5. 使用生物信息学方法鉴定在基因组中的转录因子结合位点。Wnt途径的例子:使用已知的TCF4-β连环蛋白转录因子DNA结合序列,在人基因组序列上运行软件程序,并且鉴定在基因启动子区和其他基因组区两者中的潜在结合位点。
6. 类似于3,仅在不存在环己酰亚胺的情况下。
7. 类似于4,仅在不存在环己酰亚胺的情况下。
8. 已知途径是活性的特异性组织或细胞样品的mRNA表达概况分析,然而,在不存在适当的阴性对照条件的情况下。
在最简单的形式中,对于其中鉴定靶mRNA的这些实验方法各自,可以对每一种潜在的靶mRNA给予1点。
可替代地,点可以渐增给予,意指一种技术1点,第二种技术增加第二点等等。使用这种相对排名策略,可以制备最可靠的靶基因列表。
可替代地通过将最高点数给予提供体内直接靶基因的最多证据的技术,以另一种方式的排名可以用于鉴定最可能为直接靶基因的靶基因,在上文列表中,这意指对于实验方法1)8点,2)7点,并且对于实验方法8下降至一点。此类列表可以称为“一般靶基因列表”。
尽管生物学变异和不确定性,本发明人假定直接靶基因最可能以组织不依赖性方式诱导。这些靶基因的列表可以称为“证据策划的靶基因列表”。这些策划的靶列表已用于构建计算模型,其可以应用于来自不同组织和/或细胞来源的样品。
“一般靶基因列表”可能含有更组织特异性的基因,并且可以潜在用于优化且增加模型应用于来自特异性组织的样品如乳腺癌样品的灵敏度和特异性。
下文将示例性举例说明对于ER途径如何特异性构建证据策划靶基因列表的选择。
为了选择用作本文描述的(假)线性模型的输入的ER靶基因的目的,使用下述三个标准:
1. 基因启动子/增强子区含有雌激素应答元件(ERE)基序:
a. 例如借助于其中特异性ERE基序与报道基因联系的瞬时转染测定,ERE基序应证明为响应雌激素,和
b. ERE基序的存在应通过例如基因启动子/增强子区的富集基序分析加以证实。
2. ER在体内与所讨论的基因的启动子/增强子区(差异)结合,通过例如ChIP/CHIP实验或染色质免疫沉淀测定证实:
a. 当ER途径活跃时,ER证明为与基因的启动子/增强子区结合,和
b. 如果ER途径不是活跃的,则(优选)不与基因的启动子/增强子区结合(或弱结合)。
3. 当ER途径活跃时,基因是差异转录的,通过例如下述证实
a. 通过实时PCR或微阵列实验的所讨论的基因的mRNA富集倍数,或
b. 通过免疫沉淀测定证实RNA Pol II与基因的启动子区结合。
通过将对于其收集足够和有据可查的实验证据的基因定义为ER靶基因来完成选择,证明符合上文提及的所有三个标准。收集ER差异结合的证据的合适实验是比较当暴露于或不暴露于雌激素时,例如响应雌激素的癌细胞系(例如MCF-7细胞系)中的ChIP/CHIP实验的结果。这同样适用于收集mRNA转录的证据。
前述讨论了靶基因选择操作的一般方法和更具体例子,其已用于基于使用上述方法发现的证据选择许多靶基因。对于示例性途径,即Wnt、ER、HH和AR途径,在(假)线性模型中使用的靶基因列表分别显示于表1、表2、表3和表4中。
用于本文描述的ER途径的(假)线性模型的ER途径的靶基因(表2中所示)含有基于其文献证据得分选择的靶基因;将仅具有最高证据得分的靶基因(根据本发明的优选靶基因)加入该短列表中。ER靶基因的完整列表还包括具有更低证据得分的那些基因显示于表5中。
基于文献证据得分和使用训练数据集计算的优势比的组合,执行表1、表2、表3和表4中显示的Wnt、ER、HH和AR途径的靶基因的进一步次选择或排名,所述训练数据集将探针组结点与相应的靶基因结点联系。如果使用相同数目的活跃和消极训练样品,则优势比使用截断值例如所有训练样品的中值进行计算;超过截断的每一个值宣布为高的,并且低于截断的每一个值宣布为低的。这对于其中途径已知活跃或消极的训练样品完成。随后,关于特异性靶基因或探针组的优势比可以如下计算:
f(活跃,低)= n(活跃,低)/(n(活跃,低)+ n(活跃,高)) (3)
f(消极,低)= n(消极,低)/(n(消极,低)+ n(消极,高))
优势比= f(消极,低)/(1 – f(消极,低))
*(1 – f(活跃,低))/ f(活跃,低)
其中n(活跃,低)是发现具有低于截断的表达水平,已知具有活跃途径的训练样品数目,n(消极,低)是发现具有低于截断的表达水平,已知具有消极途径的训练样品数目等等。f(活跃,低)和f(消极,低)分别是已知具有活跃或消极途径,且发现具有低于截断的表达水平的样品分数。
可替代地,为了避免不明确的优势比(除以零),可以对分数计算添加例如假计数,例如:
f(活跃,低) =(n(活跃,低)+ 1) (4)
/(n(活跃,低)+n(活跃,高)+2)
f(消极,低) =(n(消极,低)+ 1)
/(n(消极,低)+n(消极,高)+2)。
可替代地,还可以通过在测量背景下假定一定不确定性(噪声)替换显示出证明活性的样品的绝对数目,且假定例如正态分布,对于每个训练样品计算“低”或“高”的概率(称为“软证据”)。随后,分数计算可以遵循上述计算进行计算。
f(活跃,低) =(∑p(活跃,低)+ 1) (5)
/(∑p(活跃,低)+∑p(活跃,高)+2)
f(消极,低) =(∑p(消极,低)+ 1)
/(∑p(消极,低)+∑p(消极,高)+2)
其中p(活跃,低)和p(消极,低)对于每种样品观察低于截断的概率,假定标准分布,其中平均值等于各自训练样品的测量表达水平,并且标准差等于与表达水平测量相关的不确定性的估计,例如在log2尺度上0.25。这些概率在所有训练样品上合计,并且接下来加入假计数。
优势比是靶基因在推断途径活性中的重要性的评价。一般而言,预期与具有更低优势比的靶基因相比较,具有更高优势比的靶基因的表达水平关于途径的总体活性可能是更多信息的。然而,由于细胞信号传导途径的复杂性,应当理解更复杂的相互关系可以存在于靶基因和途径活性之间 - 例如,考虑具有低优势比的靶基因的多种组合的表达水平可能比分开考虑具有更高优势比的靶基因更提供证据。在本文报告的Wnt、ER、HH和AR建模中,已发现与更低排名的靶基因相比较,表6、表7、表8和表9中所示的靶基因具有用于预测Wnt、ER、HH和AR途径活性的更高的证据性质(因此,表6至9中所示的靶基因根据本发明是特别优选的)。然而,考虑到获得技术例如微阵列可以获得大的基因的组的表达水平的相对容易,在所述(假)线性模型中,考虑利用表6、表7、表8和表9的靶基因的一些或全部,并且任选另外使用表1、表2、表3和表4中所示的另外靶基因排名中的一种、两种、一些或全部。
表1. 在(假)线性模型中使用的Wnt途径的靶基因和用于测量靶基因的mRNA表达水平的相关探针组的证据策划列表。
表2. 在(假)线性模型中使用的ER途径的靶基因和用于测量靶基因的mRNA表达水平的相关探针组的证据策划列表。“最具判别性的探针组”由下划线标记。
表3. 在(假)线性模型中使用的HH途径的靶基因和用于测量靶基因的mRNA表达水平的相关探针组的证据策划列表。
表4. 在(假)线性模型中使用的AR途径的靶基因和用于测量靶基因的mRNA表达水平的相关探针组的证据策划列表。
表5. 发现具有明显科学证据的ER靶基因的基因符号(= ER靶基因长列表)。
表6. 基于文献证据得分和优势比的Wnt途径靶基因的短列表。
表7. 基于文献证据得分和优势比的ER途径靶基因的短列表。
表8. 基于文献证据得分和优势比的HH途径靶基因的短列表。
表9. 基于文献证据得分和优势比的AR途径靶基因的短列表。
根据US 61/745839,相应的PCT/IB2013/061066的实施例3的证据策划列表和广泛文献列表比较
遵循本文描述的操作基于文献证据构建的Wnt靶基因列表(表1)与不遵循上述操作的另一个靶基因列表相比较。替代列表是通过来自不同实验方法的多种数据指示为通过有名实验室在三个公开来源中发表的Wnt靶基因的基因汇集,所述实验室因其在分子生物学和Wnt途径领域中的专业而有名。替代列表是来自Hatzis等人(Hatzis P,2008)的表S3中所述的基因,来自de Sousa e Melo(de Sousa E Melo F,2011)的正文和表S1A,以及通过Roel Nusse(Wnt途径领域的先驱者)收集且维持的靶基因列表(Nusse,2012)的组合。这三个来源的组合导致124种基因的列表(=广泛文献列表,参见表10)。此处,讨论与基于现有基因列表(=证据策划的列表,表1)构建的模型相比较,通过衍生自该替代列表的算法在预测临床样品中的Wnt活性中的表现是否类似或更佳的问题。
表10. Wnt靶基因的替代列表(=广泛文献列表)。
靶基因 参考文献 靶基因 参考文献
ADH6 de Sousa e Melo等人 L1CAM Nusse
ADRA2C Hatzis等人 LBH Nusse
APCDD1 de Sousa e Melo等人 LEF1 Hatzis等人,de Sousa e Melo等人,Nusse
ASB4 de Sousa e Melo等人 LGR5 de Sousa e Melo等人,Nusse
ASCL2 Hatzis等人,de Sousa e Melo等人 LOC283859 de Sousa e Melo等人
ATOH1 Nusse MET Nusse
AXIN2 Hatzis等人,de Sousa e Melo等人,Nusse MMP2 Nusse
BIRC5 Nusse MMP26 Nusse
BMP4 Nusse MMP7 Nusse
BMP7 Hatzis等人 MMP9 Nusse
BTRC Nusse MRPS6 Hatzis等人
BZRAP1 de Sousa e Melo等人 MYC Hatzis等人,Nusse
SBSPON de Sousa e Melo等人 MYCBP Nusse
CCL24 de Sousa e Melo等人 MYCN Nusse
CCND1 Nusse NANOG Nusse
CD44 Nusse NKD1 de Sousa e Melo等人
CDH1 Nusse NOS2 Nusse
CDK6 Hatzis等人 NOTUM de Sousa e Melo等人
CDKN2A Nusse NRCAM Nusse
CLDN1 Nusse NUAK2 Hatzis等人
COL18A1 Hatzis等人 PDGFB Hatzis等人
CTLA4 Nusse PFDN4 Hatzis等人
CYP4X1 de Sousa e Melo等人 PLAUR Nusse
CYR61 Nusse POU5F1 Nusse
DEFA5 de Sousa e Melo等人 PPARD Nusse
DEFA6 de Sousa e Melo等人 PROX1 de Sousa e Melo等人
DKK1 de Sousa e Melo等人,Nusse PTPN1 Hatzis等人
DKK4 de Sousa e Melo等人 PTTG1 Nusse
DLL1 Nusse REG3A de Sousa e Melo等人
DPEP1 de Sousa e Melo等人 REG4 de Sousa e Melo等人
EDN1 Nusse RPS27 Hatzis等人
EGFR Nusse RUNX2 Nusse
EPHB2 Hatzis等人,de Sousa e Melo等人,Nusse SALL4 Nusse
EPHB3 Hatzis等人,Nusse SLC1A1 de Sousa e Melo等人
ETS2 Hatzis等人 SLC7A5 Hatzis等人
FAT1 Hatzis等人 SNAI1 Nusse
FGF18 Nusse SNAI2 Nusse
FGF20 Nusse SNAI3 Nusse
FGF9 Nusse SIK1 Hatzis等人
FLAD1 Hatzis等人 SOX17 Nusse
AK122582 Hatzis等人 SOX2 de Sousa e Melo等人
FN1 Nusse SOX4 Hatzis等人
FOSL1 Nusse SOX9 Nusse
FOXN1 Nusse SP5 Hatzis等人,de Sousa e Melo等人
FST Nusse SP8 Hatzis等人
FZD2 de Sousa e Melo等人 TCF3 Nusse
FZD7 Nusse TDGF1 Hatzis等人
GAST Nusse TIAM1 Nusse
GMDS Hatzis等人 TNFRSF19 Nusse
GREM2 Nusse TNFSF11 Nusse
HES6 Hatzis等人 TRIM29 de Sousa e Melo等人
HNF1A Nusse TSPAN5 de Sousa e Melo等人
ID2 Nusse TTC9 de Sousa e Melo等人
IL22 de Sousa e Melo等人 VCAN Nusse
IL8 Nusse VEGFA Nusse
IRX3 de Sousa e Melo等人 VEGFB Nusse
IRX5 de Sousa e Melo等人 VEGFC Nusse
ISL1 Nusse WNT10A Hatzis等人
JAG1 Nusse WNT3A Nusse
JUN Nusse ZBTB7C de Sousa e Melo等人
KIAA1199 de Sousa e Melo等人 PATZ1 Hatzis等人
KLF4 Hatzis等人 ZNRF3 Hatzis等人
下一步由发现对应于基因的Affymetrix® GeneChip Human Genome U133 Plus2.0阵列的探针组所组成。该过程使用基于UCSC基因组浏览器对于探针组相关性的Bioconductor plugin in R和手动策划执行,类似于本文描述的(假)线性模型,从而去除例如在相反链或基因外显子区外部的探针组。对于124种基因中的两种,不存在该微阵列芯片上可用的探针组,并且因此不能插入(假)线性模型中,它们是LOC283859和WNT3A。发现总共287个探针组对应于剩余122种基因(表11)。
表11. 在广泛文献基因列表中与Wnt靶基因相关的探针组。
随后,如本文说明的,使用“黑与白”方法计算权重参数,类似于所述“所有探针组”模型构建(假)线性模型。类似于基于证据策划列表的Wnt(假)线性模型的描述,与探针组及其各自基因之间的边缘相关的权重,使用连续fRMA处理的32个正常结肠样品和来自GeneExpression Omnibus(在http://www.ncbi.nlm.nih.gov/geo/处可获得,2011年7月13日最后一次访问)的数据集GSE8671的32个腺瘤样品的数据,训练证据策划列表和广泛文献列表两者。
训练的(假)线性模型随后在多个数据集上进行测试,以推断Wnt途径的活性得分。
根据测试,可以推论广泛文献模型一般预测Wnt信号传导开(活性水平阳性)或关的更极端活性得分。另外,替代模型对于结肠癌数据集(GSE20916、GSE4183、GSE15960)预测相似结果,但在乳腺癌(GSE12777)和成髓细胞瘤样品(GSE10327)数据集中,超过预期的样品具有预测的活跃Wnt信号传导。
总之,广泛文献靶基因列表一方面导致在结肠癌中的Wnt活性的近似相等良好的预测,但另一方面导致在其他癌症类型中更差的预测(更多假阳性)。这可能是由于替代靶基因列表具体朝向结肠细胞太多偏差,因此太组织特异性;de Sousa E Melo等人和Hatzis等人主要兴趣均为结肠直肠癌,尽管可以包括非结肠特异性Wnt靶基因。另外,在这些列表中可能包括的非Wnt特异性靶基因可能是在其他癌症类型中的Wnt活性的更差预测的来源。替代列表可能含有更多间接调节的靶基因,这可能使得它更组织特异性。原始列表朝向含有直接靶基因调整,其最可能代表在所有组织中Wnt敏感的基因,因此降低组织特异性。
根据US 61/745839,相应的PCT/IB2013/061066的实施例4训练和使用数学模型
在如本文示例性描述的(假)线性模型可以用于推断测试样品中的途径活性之前,需要测定指示结点和阈值之间的关联的符号和量级的权重,所述阈值调用结点“不存在”或“存在”。可以使用专业知识先验地填充权重和阈值,但通常模型使用训练样品的代表性组进行训练,其中优选地基础事实是已知的。例如具有已知存在转录因子复合物(=活跃途径)或不存在转录因子复合物(=消极途径)的样品中的探针组的表达数据。然而,从许多不同种类癌症中获得训练样品是不实际的,在所述癌症中已知待建模途径的活化状态是何种。因此,可用的训练集由通常仅来自一类癌症的有限数目的样品组成。在本文中,方法描述为测定将测试样品分类为具有活跃或消极途径所需的参数。
本领域已知的是考虑模型拓扑学且改变模型参数(此处权重和阈值)的训练算法(例如回归)的量级,使得模型输出(此处加权的线性得分)得到优化。在本文中我们证实两种示例性方法,其可以用于直接由表达水平计算权重,而无需优化算法。
优选地,Wnt、ER、HH和AR途径的(假)线性模型的训练使用在Gene ExpressionOmnibus(在http://www.ncbi.nlm.nih.gov/geo/处可获取,参照上文)上可获得的公开数据来完成。
在此处定义为“黑与白”方法的第一种方法归结为三元系统,其中加权因子是{-1,0,1}的元件。如果我们将这放入生物学背景下,则-1和1对应于在途径活性的情况下分别下调和上调的基因或探针。在探针或基因不能统计上证明为上调或下调的情况下,它收到0的权重。此处,我们已使用活跃途径样品的表达水平相对于具有消极途径的样品的表达水平的左侧和右侧,两样品t检验,以测定探针或基因是上调还是下调,考虑到使用的训练数据。在其中活跃样品的平均值统计上大于消极样品的情况下,即p值低于一定阈值,例如0.3,则探针组或靶基因测定为上调的。相反,在其中活跃样品的平均值统计上低于消极样品的情况下,该探针组或靶基因测定为在途径活化后是下调的。在最低p值(左侧或右侧)超过上述阈值的情况下,我们将该探针或基因的权重限定为0。
在另一个优选实施方案中,使用取得权重和阈值的替代方法。该替代方法基于优势比的算法(例如基础e),并且因此称为“优势比”权重。基于探针/基因水平高于和低于相应阈值的阳性和阴性训练样品数目,所述阈值例如所有训练样品的中值,计算关于每种探针或基因的优势比(等式3)。可以加入假计数,以避免除以零(等式4)。进一步的精化是通过下述以略微更随机的方式计数高于/低于阈值的样品:假定探针/基因水平例如以某一指定的标准差(例如在2-log尺度上0.25)在其观察值周围正态分布,并且计数高于和低于阈值的概率质量(等式5)。
可替代地,可以采用本领域已知的优化算法例如回归,以测定本文描述的(假)线性模型的权重和阈值。
必须特别注意对于(假)线性模型测定的参数概括良好的方式。可替代地,可以使用本领域已知的其他机器学习方法例如贝叶斯网络,以能够通过在训练操作期间取得专门测量来相当良好地概括。
优选地,Wnt、ER、HH和AR途径的(假)线性模型的训练使用在Gene ExpressionOmnibus(在http://www.ncbi.nlm.nih.gov/geo/处可获取)上可获得的公开数据来完成。模型使用此类公开数据示例性训练。
请注意就WO 2013/011479 A2和US 61/745839,相应的PCT/IB2013/061066而言,在所附权利要求中限定的ER靶基因的排名次序略微改变,因为添加新的文献证据。以与US61/745839,相应的PCT/IB2013/061066的实施例3中所述相似的方法,将ER靶基因选择且排名。通过组合文献证据得分和每种基因区分Affymetrix模型内的活跃和失活途径的个别能力,将基因排名。当用MCF7细胞系样品的训练集训练模型,所述训练集耗尽雌激素且随后保持耗尽或暴露于1 nM雌激素24小时(GSE35428),并且用训练集和两个其他训练集测试模型,在所述两个其他训练集中MCF7细胞耗尽雌激素且随后保持耗尽或暴露于10 nM或25 nM雌激素(分别为GSE11352和GSE8597)时,这种排名基于对于每种基因获得的加权假阳性和假阴性率的线性组合。
(注意到加权假阳性和假阴性的组合(代替优势比)用于解释各个集合中使用的不同实验条件。不同权重根据本发明人的置信度进行设置:假阳性(阴性)是模型而不是已对样品实施的不同实验条件的结果。例如,在所有实验中,在暴露于雌激素或进一步耗尽另外24小时之前,MCF7细胞系样品首先耗尽雌激素一段时间。更短的耗尽时间可以促使尽管雌激素耗尽,途径仍是活跃的,在这种情况下,假阳性具有比测试和训练样品两者均耗尽相同时间量时更少的权重。)
实施例2:测定风险得分
一般而言,可以设计许多不同公式用于测定风险得分,所述风险得分指示临床事件将在某一时间段内发生的风险,并且至少部分基于在受试者的组织和/或细胞和/或体液中的两个或更多个细胞信号传导途径的推断活性组合,即:
其中MPS是风险得分(术语“MPS”在本文中用作“多途径得分”的缩写,以便指示风险得分受两个或更多个细胞信号传导途径的推断活性影响),P i 是细胞信号传导途径i的活性得分,N是在考虑中的细胞信号传导途径的总数目,并且X是可能进入等式内的可能的进一步因子或参数的占位符。此类公式可以更具体地是给定变量中的一定程度的多项式,或变量的线性组合。此类多项式中的加权系数和幂可以基于专家知识进行设置,但通常具有已知基本事实例如存活数据的训练数据集用于获得关于等式(6)的加权系数和幂的估计值。推断活性可以使用等式(6)进行组合,并且随后生成MPS。接下来,这样优化评分函数的加权系数和幂,使得高MPS与直至临床事件出现的更长时间段关联,并且反之亦然。优化评分函数与复发数据的关联可以使用许多分析技术来完成,例如Cox比例风险检验(如本文示例性使用的)、时序检验、与标准优化技术例如梯度下降或手动适应结合的卡普兰-迈耶估计量。
在该实施例中,临床事件是癌症,特别是乳腺癌,并且考虑Wnt途径、ER(雌激素受体)途径、HH(Hedgehog)途径和AR(雄激素受体)途径的推断活性,如公开的国际专利申请WO2013/011479 A2(“Assessment of cellular signaling pathway activity usingprobabilistic modeling of target gene expression”),或未公开的美国临时专利申请US 61/745839,相应的未公开的国际专利申请PCT/IB2013/061066(“Assessment ofcellular signaling pathway activity using linear combination(s)of target geneexpressions”)中详细讨论的。
本文示例性使用的公式考虑到Wnt途径、ER途径和HH途径的活性。它基于衍生自癌症生物学研究的本发明人的观察,以及在可公开获得的数据集中发现的存活以及Wnt、ER和HH途径活性之间的关联。早期发育途径如Wnt和Hedgehog被认为在通过癌细胞引起的转移中起作用,所述癌细胞恢复为更干细胞样表型,称为癌干细胞。事实上,本发明人认为关于早期发育途径例如Wnt途径在癌症转移中起作用允许转移癌细胞在另一个器官或组织中的种植位置中开始分裂,可获得足够指示。转移与不良预后相关且代表癌症复发形式,因此在癌细胞中的早期发育途径例如Wnt和HH途径的活性由本发明人预期为预示不良预后,而ER途径的活性看起来与乳腺癌患者中的不良结果关联。Wnt和Hedgehog途径在癌症进展和转移中的假定作用基于临床前研究,并且在受试者中未得到显示,因为无法获得用于测量其活性的方法。
根据生物学研究的这些本发明人观察,以及Wnt和HH活性可以在癌症复发中起作用和ER活性看起来与良好临床结果联系的临床关联,在本文中组合在下述示例性公式中
其中P ER P Wnt P HH 分别指示ER途径、Wnt途径和HH途径的推断活性(例如在0至1的范围内),并且αβ是正的常数比例因子。在该实施例中,αβ示例性选择为等于1,并且已使用处于其活性状态的Wnt途径、ER途径和HH途径的概率,如通过公开的国际专利申请WO2013/011479 A2(“Assessment of cellular signaling pathway activity usingprobabilistic modeling of target gene expression”)中详细描述的方法推断的。使用ER、Wnt和HH途径的本文的贝叶斯网络模型包含A)目的转录因子水平的顶部水平结点,B)代表目的靶基因的存在的结点水平(分别为WO 2013/011479 A2中的表2、表1和表3),和C)代表与目的靶基因相关的探针组的结点水平(分别为WO 2013/011479 A2中的表2、表1和表3)。存在或不存在的TF元件的先前概率设为0.5。如WO 2013/011479 A2中所述,水平A和B之间的条件概率如下仔细地精心挑选:(i)TF不存在/靶基因向下:0.95,(ii)TF不存在/靶基因向上:0.05,(iii)TF存在/靶基因向下:0.30,和(iv)TF存在/靶基因向上:0.70,其中水平B和C之间的条件概率分别在来自GSE8597、GSE8671和GSE7553的数据上进行训练。
作为训练数据,GSE8597已用于ER途径,GSE8671已用于Wnt途径,并且GSE7553已用于HH途径。在推断中已掺入的靶基因是用于ER途径的GREB1、PGR、XBP1、CA12、SOD1、CTSD、IGFBP4、TFF1、SGK3、NRIP1、CELSR2、WISP2、AP1B1、RARA、MYC、DSCAM、EBAG9、COX7A2L、ERBB2、PISD、KRT19、HSPB1、TRIM25、PTMA、COL18A1、CDH26、NDUFV3、PRDM15、ATP5J、ESR1,用于Wnt途径的KIAA1199、AXIN2、RNF43、TBX3、TDGF1、SOX9、ASCL2、IL8、SP5、ZNRF3、KLF6、CCND1、DEFA6、FZD7、NKD1、OAT、FAT1、LEF1、GLUL、REG1B、TCF7L2、COL18A1、BMP7、SLC1A2、ADRA2C、PPARG、DKK1、HNF1A、LECT2,以及用于HH途径的GLI1、PTCH1、PTCH2、IGFBP6、SPP1、CCND2、FST、FOXL1、CFLAR、TSC22D1、RAB34、S100A9、S100A7、MYCN、FOXM1、GLI3、TCEA2、FYN、CTSL1、BCL2、FOXA2、FOXF1、H19、HHIP、IL1R2、JAG2、JUP、MIF、MYLK、NKX2.2、NKX2.8、PITRM1和TOM1。
所得到的MPS范围为–1(其表明临床事件(此处为局部或远处的癌症特别是乳腺癌)在某一时间段内复发的低风险)至关于高风险复发患者的+1。
请注意虽然在下文中,使用根据等式(7)计算的MPS,但基于Wnt、ER和HH途径的推断活性,计算风险得分(MPS)的另一种合适方法由下述示例性公式提供:
其中P ER P Wnt P HH 分别指示ER途径、Wnt途径和HH途径的推断活性(例如在0至1的范围内),并且αβγ是非负常数比例因子。
使本文示例性使用的此类预后价值量化的两种方法是Cox比例风险回归模型,以及与时序检验结合的卡普兰-迈耶曲线:
第一种方法将风险模型与存活数据伴随一种或多种协变量拟合。总之,此类风险模型解释了基于协变量的(数)值,在群体内的存活(临床事件)中的变动。由于拟合,每个包括的协变量将指定危害比(HR),其基于协变量的值定量临床事件的相关风险,例如HR二对应于伴随协变量值增加一的关于患者的目的临床事件两倍更高的风险。详细地,HR值为一意指这种协变量对存活没有影响,而对于HR < 1,协变量数目中的增加表明更低的风险,并且协变量数目中的减少表明更高的风险,并且对于HR > 1,协变量数目中的增加表明更高的风险,并且协变量数目中的减少表明更低的风险。连同危害比一起,报道了95%置信区间和p值(即,危害比显著小于或大于一的单侧概率)。所有协变量在零和一之间定标,以作出简单的危害比的直接比较。
后面一种方法涉及标绘卡普兰-迈耶曲线,其代表根据时间的临床事件存活概率。例如,通过基于示例性预后测试,对于群体中的不同风险组标绘卡普兰-迈耶曲线,可以显现示例性临床事件风险的分开的质量。这种质量可以进一步借助于时序检验进行量化,所述时序检验计算两个存活函数相等的概率(p值)。
为了根据风险将患者分层,示例性使用下述算法:具有MPS小于–0.1的患者与高ER途径活性概率关联,并且因此指定为具有低复发风险,而MPS大于+0.1与高风险Wnt和/或HH途径的高活性相关,并且因此与高复发风险关联。具有在–0.1和+0.1之间的MPS的患者分类为具有发展复发的中度风险,因为这个组包括具有活跃的低风险途径例如ER途径,以及高风险信号传导途径例如Wnt或HH的活化的患者,或其中途径无一推断为驱动肿瘤生长的患者。阈值–0.1和+0.1基于在多个数据集中所得到的MPS得分分布的分析,所述数据集包括1294个多样化乳腺癌患者,如Gene Expression Omnibus(在http://www.ncbi.nlm.nih.gov/geo/处可获得的GSE6532、GSE9195、GSE20685、GSE20685和GSE21653,2013年2月13日最后一次访问)和ArrayExpress(E-MTAB-365,http://www.ebi.ac.uk/arrayexpress/experiments/,2013年2月13日最后一次访问)中报道的,如图1中可见的。
作为基准,使用分开的途径活性和来自Genomic Health的乳腺癌Oncotype DX®测试,其显示为良好的复发预测物,并且与关于乳腺癌的其他基于基因表达的预测物一致。Oncotype DX®测试返回0至100的风险或复发得分(RS),其基于对于基因实验对象组测量的表达水平组合进行计算。RS就ER阳性、HER2阴性(蛋白质染色或FISH)、淋巴结阴性乳腺癌患者中的10年存活而言进行优化(参见Paik,S.,等人: “A multi-gene assay to predictrecurrence of Tamoxifen-treated,node-negative breast cancer,” The New EnglandJournal of Medicine,351(27),(2004),第2817–2826页;Fan,C.,等人: “Concordanceamong gene-expression-based predictors for breast cancer,” The New EnglandJournal of Medicine,355(6),(2006),第560–569页)。遵循通过Fan等人(参见Fan,C.,等人(2006))报道的操作,使用在所述数据集中报道的微阵列表达数据计算RS,并且随后根据Oncotype DX®风险分层算法,将患者分成低风险、中度风险和高风险患者。
结果
(i)Erasmus数据
来自Gene Expression Omnibus(在http://www.ncbi.nlm.nih.gov/geo/处可获得,2013年2月13日最后一次访问)的GSE12276中的所有204个患者经历复发(中值复发时间:21个月,范围:0 – 115个月),这使得其成为研究途径活性得分及其衍生的MPS就复发风险而言的预后价值的良好数据集,以察看它们是否可以将早期复发病例与晚期病例分开。
单变量Cox比例风险回归模型使用Wnt途径、ER途径、HH途径和AR途径,以及关于RSMPS的标准化值(即0至1之间的值)进行拟合,参见下表12。单变量分析指示RSMPS两者均具有显著大于1的危害比,而P ER 具有显著小于1的危害比。包括RSP ER MPS的组合的多变量分析导致两种显著预测物(p < 0.05)。然而,MPSP ER 的组合导致关于预测物之一的显著性丧失(MPS: p > 0.05),这通过P ER 也是多途径得分的元素的事实加以解释。因此,使用RSMPSP ER 的多变量分析在逻辑上也失败。
表12. GSE12276中的所有患者的Cox比例危害比。
总之,单变量分析显示就复发而言,来自Genomic Health的Oncotype DX®复发得分(RS)具有比基于途径的预测物P Wnt P HH P AR 更强的预测力,这并非出乎意料的,因为RS特异性优化以预测复发,而P Wnt P HH P AR 旨在预测途径活性。然而,P ER 以及由其与P Wnt P HH 组合衍生的MPS也是关于复发的很强的显著预测物。另外,组合RSP ER MPS导致改善的风险分层,胜过分开的预测物(不显著,p ≈ 0.14)。另外,这还暗示Oncotype DX®复发得分(RS)和多途径得分(MPS)是互补的复发预测物,并且两者均视为肿瘤生长潜在的不同机制。
考虑到来自相同数据集的仅71个患者对于Oncotype DX®乳腺癌测试符合条件(即,ER阳性和淋巴结阴性伴随未知HER2状态的患者),观察到RSP ER 仍是强复发预测物(p< 0.05);参见下表13。另一方面,观察到MPS不再是显著预测物,其可能是更同质的患者组的结果(仅具有少数Wnt-和HH-活跃肿瘤)。引人注目的是,关于ET阳性(蛋白质染色)和淋巴结阴性患者中的复发预后的最强预测物是P ER ,而不是Oncotype DX®复发得分(RS)。
表13. 关于GSE12276中的ER阳性和淋巴结阴性患者的Cox比例危害比。
(ii) Guy医院数据
Erasmus GSE12276数据集具有朝向复发的偏差,因为它仅包括在随访过程中具有复发的患者。为了研究基于途径的预测的预后价值,将它们应用于通过Guy医院在GSE6532和GSE9195中报道的更临床有关的患者集合(总共164个患者)。这些数据集中的患者诊断有ER阳性肿瘤,并且用手术和辅助激素处理治疗5年。
Oncotype DX®复发得分(RS)与MPS的直接比较(参见表14)指示两种测试均大约相等良好地能够预测复发风险(HR: 4.41(1.93 – 10.091)相对于6.43(1.66 – 24.90))。一旦在多变量分析中组合,两种测试的预测力就保持显著。这支持在Erasmus GSE12276数据集中获得的结果;得自Oncotype DX®乳腺癌测试的复发得分(RS)和MPS是互补的复发预测物,并且两者均视为肿瘤生长潜在的不同机制。组合这两种测试进一步改善无复发存活预测,如图2(请注意图2A显示了在时间轴上放大的图2B的裁剪)和下表14中可见的。
表14. GSE6532和GSE9195中的所有患者的Cox比例危害比。
(iii)Cartes d’Identité des Tumeurs数据
为了证实MPS也可应用于原发性乳腺癌患者的整个群体,例如基底、HER2扩增乳腺癌,将它应用于来自可经由ArrayExpress公开获得的E-MTAB-365数据集的患者样品的多样化集合(n = 537,ER +/-、HER +/-、PGR +/-、不同级别等,中值随访65 ±(SD)40个月)。这导致高风险和中度风险相对于低风险患者中的良好存活分离(两者p < 0.01)),如图3(请注意图3A显示了在时间轴上放大的图3B的裁剪)中可见的,以及HR 2.72(1.25 – 5.92,p <0.01)。
(iv)Koo Foundation Sun-Yat-Sen Cancer Center数据
MPS在由多样化组的乳腺癌患者组成的另一个患者队列(n = 327,GSE20685、ER+/-、HER +/-、PGR +/-,淋巴结阴性/阳性等)上进行测试。这导致HR 3.53(1.34 – 9.30,p< 0.01)以及低、中度和高风险患者组的良好分离,参见图4(请注意图4A显示了在时间轴上放大的图4B的裁剪)。
(v)Institut Paoli-Calmattes数据
接下来,将MPS复发估计量应用于266个早期乳腺癌患者的集合,所述患者在Institut Paoli-Calmattes经历手术。患者涵盖乳腺癌的多样化集合:ER+/-、HER +/-、PGR+/-、淋巴结阴性/阳性、级别1/2/3、KI67 +/-和P53 +/-。这些样品的微阵列在GSE21653数据集中可公开获得。MPS的HR在2.8(1.20 – 6.51,p < 0.01)时是显著的,此外低风险和高风险卡普兰-迈耶存活曲线的风险分层同样是显著的(p = 0.017),参见图5(请注意图5A显示了在时间轴上放大的图5B的裁剪)。
实施例3:测定开发
代替对来自微阵列或RNA测序的mRNA输入数据应用例如所述贝叶斯或(假)线性模型,在临床应用中开发执行样品测量的专用测定可以是有利的,例如在整合平台上使用qPCR以测定其为MPS的部分的靶基因的mRNA水平。公开的靶基因的RNA/DNA序列随后可以用于测定在此类平台上选择何种引物和探针。
此类专用MPS测定的验证可以通过下述完成:使用基于微阵列的贝叶斯或(假)线性模型作为参考模型,并且验证开发的测定是否对一组验证样品给出相似结果。紧靠专用测定,这还可以使用mRNA测序数据作为输入测量来完成,以构建且校正相似的贝叶斯或(假)线性模型。
实施例4:CDS应用
参考图6(图解显示配置为如本文公开的测定风险得分的临床决策支持(CDS)系统,所述风险得分指示临床事件将在某一时间段内发生的风险),临床决策支持(CDS)系统10作为适当配置的计算机12实现。计算机12可以配置为通过执行合适的软件、固件或存储在非瞬时性存储介质(未示出)上的其他指令来操作CDS系统10,所述非瞬时性存储介质例如硬驱或其他磁性存储介质、光盘或另一种光盘存储介质、随机存取存储器(RAM)、只读存储器(ROM)、闪存、或另一种电子存储介质、网络服务器等等。虽然举例说明性CDS系统10通过举例说明性计算机12体现,但更一般地,CDS系统可以通过数字处理装置或包含数字处理器的仪器体现,所述数字处理器配置为执行如本文描述的临床决策支持方法。例如,数字处理装置可以是手提式装置(例如运行CDS应用的个人数字助理或智能电话)、笔记本计算机、台式计算机、平板计算机或装置、远程网络服务器等等。计算机12或其他数字处理装置通常包括显示装置14或与显示装置14可操作地连接,信息包括临床决策支持建议经由所述显示装置14展示给医护人员。计算机12或其他数字处理装置通常还包括一个或多个用户输入装置,或与一个或多个用户输入装置可操作地连接,所述用户输入装置例如举例说明性键盘16、或者鼠标、跟踪球、跟踪板、触摸屏(可能与显示装置14集成)、或其他基于指针的用户输入设备,经由所述用户输入装置医护人员可以输入信息例如用于控制CDS系统10的操作指令,由CDS系统10使用的数据等等。
CDS系统10接受关于受试者(例如医院患者,或由肿瘤科医生、医生或其他医务人员治疗的门诊患者,或已知或怀疑患有某种类型的癌症例如结肠癌、乳腺癌或肝癌,接受癌症筛查的个人或一些其他医学诊断的个人等等)的输入信息。CDS系统10对该输入信息应用多种数据分析算法,以生成临床决策支持建议,其经由显示装置14(或经由语音合成器或提供人可察觉的输入的其他装置)呈现给医护人员。在一些实施方案中,这些算法可以包括对患者应用临床指导。临床指导是存储的标准或“规范”治疗建议的组,通常基于医学专家组的建议构建,且任选以临床“流程图”的形式格式化,以促进通过临床指导的导航。在多个实施方案中,CDS 10的数据处理算法可以另外或可替代地包括多种诊断或临床测试算法,其对输入信息执行以提取临床决策建议,例如本文公开的机器学习方法。
在本文公开的举例说明性CDS系统(例如CDS系统10)中,CDS数据分析算法包括一种或多种诊断或临床测试算法,其对通过一个或多个医学实验室18获得的输入基因组和/或蛋白质组学信息执行。这些实验室可以不同定位“在现场”,即在医院或其中受试者接受医学检查和/或治疗的其他场所,或“非现场的”,例如接受(经由邮件或另一种递送服务)受试者的组织和/或细胞和/或体液样品的专门和集中的实验室,所述样品已从受试者中提取(优选经由活组织检查操作或其他样品提取操作,例如得自癌症病变,或怀疑癌症的病变,或转移性肿瘤,或其中存在被癌细胞污染的流体的体腔(例如胸膜腔或腹腔或者膀胱腔),或含有癌细胞的其他体液等等的样品)。样品由其提取的细胞还可以是来自血液系统恶性肿瘤(例如白血病或淋巴瘤)的肿瘤细胞。在一些情况下,细胞样品还可以是循环肿瘤细胞,即已进入血流且可以使用合适的分离技术(例如血浆分离置换法或常规静脉抽血)提取的肿瘤细胞。除血液之外,样品由其提取的体液可以是尿、胃肠内容物或渗出液。
提取的样品通过实验室进行处理,以生成基因组或蛋白质组学信息。例如,提取的样品可以使用微阵列(在本领域中也不同地称为基因芯片、DNA芯片、生物芯片等等)或通过定量聚合酶链反应(qPCR)处理进行处理,以测量提供证据的基因组或蛋白质组学信息,例如目的基因的表达水平,例如以由基因转录的信使核糖核酸(mRNA)水平,或由从基因转录的mRNA翻译的蛋白质水平的形式。作为另一个例子,提取的样品可以通过基因测序实验室进行处理,以生成脱氧核糖核酸(DNA)的序列,或生成RNA序列、拷贝数变异、甲基化等等。其他考虑的测量方法包括对病理学载玻片执行的免疫组织化学(IHC)、细胞学、荧光原位杂交(FISH)、邻近连接测定等等。可以通过微阵列处理、质谱法、基因测序或其他实验室技术生成的其他信息包括甲基化信息。还可以执行此类基因组和/或蛋白质组学测量的多种组合。
在一些实施方案中,医学实验室18对受试者的组织和/或细胞和/或体液的提取样品执行许多标准化数据采集,以便生成大量基因组和/或蛋白质组学数据。例如,标准化数据采集技术可以对于一个或多个染色体或染色体部分,或者组织和/或细胞和/或体液的整个基因组生成(任选比对的)DNA序列。应用标准微阵列可以生成数千或数以万计的数据项,例如大量基因的表达水平,多种甲基化数据等等。类似地,基于PCR的测量可以用于测量所选基因的表达水平。这种过多的基因组和/或蛋白质组学数据,或其所选部分,被输入CDS系统10以进行处理,以便开发用于制定临床决策支持建议的临床上有用的信息。
所公开的CDS系统和相关方法涉及基因组和/或蛋白质组学数据的处理,以评价多个细胞信号传导途径的活性,并且由其测定指示临床事件(例如癌症)在某一时间段内发生的风险的风险得分。然而,应当理解所公开的CDS系统(例如CDS系统10)可以任选进一步包括不同的另外能力,例如基于多种患者数据例如生命体征监控数据、病史数据、患者人口统计学数据(例如性别、年龄等等)、患者医学成像数据等等,依照存储的临床指导生成临床决策支持建议。可替代地,在一些实施方案中,CDS系统10的能力可以局限于仅执行基因组和/或蛋白质组学数据分析,以如本文公开的评价细胞信号传导途径的活性,并且由其测定指示临床事件(例如癌症)在某一时间段内发生的风险的风险得分。
连续参考示例性图6,CDS系统10至少但不限于基于在受试者的组织和/或细胞和/或体液的提取样品中,测量的细胞信号传导途径的一种或多种靶基因表达水平20,推断受试者的组织和/或细胞和/或体液中,两个或更多个细胞信号传导途径(此处,Wnt途径、ER途径和HH途径)的活性22。本文公开的例子涉及作为举例说明性细胞信号传导途径的Wnt、ER、AR和HH途径。这些途径在不同肿瘤学领域中是有利的,因为途径的调节丧失可以是癌症增殖的原因。存在约10-15个相关信号传导途径,并且每种癌症通过失调的至少一个占优势途径驱动。不限于任何具体操作理论,这些途径调节细胞增殖,并且因此在癌细胞中这些途径的调节丧失可以导致途径“始终开放”,因此加速癌细胞的增殖,其依次又体现为癌症的生长、侵入或转移(传播)。
编码细胞信号传导途径的调节蛋白质,例如其为形成细胞信号传导途径的蛋白质级联的一部分的中间蛋白质的基因的mRNA表达水平的测量,是调节蛋白质表达水平的间接测量,并且可能与实际调节蛋白质表达水平强烈关联或不强烈关联(与细胞信号传导途径的总体活性关联少得多)。细胞信号传导途径直接调节靶基因的转录 - 因此,由靶基因转录的mRNA的表达水平是该调节活性的直接结果。因此,CDS系统10至少基于细胞信号传导途径的一种或多种靶基因的表达水平(mRNA或蛋白质水平作为替代测量),推断两个或更多个细胞信号传导途径(此处,Wnt途径、ER途径和HH途径)的活性。这确保CDS系统10基于通过靶基因的测量的表达水平提供的直接信息来推断途径的活性。
在该实施例中,推断活性P Wnt P ER P HH ,即Wnt途径、ER途径和HH途径的推断活性,随后用于测定24指示临床事件(在该实施例中,癌症,特别是乳腺癌)将在某一时间段内发生的风险的风险得分,如本文详细描述的。风险得分至少部分基于推断活性的组合。例如,风险得分可以是如关于等式(7)详细描述的计算的“多途径得分”(MPS)。
基于测定的MPS,在该实施例中,CDS系统10将受试者指定26至与不同所示风险相关的多个风险组中的至少一个,所述风险指示临床事件将在某一时间段内发生,和/或至少部分基于临床事件将在某一时间段内发生的所示风险,决定28对于受试者推荐的治疗。
通过CDS系统对于特定患者测定MPS和/或风险分类,或者如本文描述的MPS和风险分类的独立实现,将允许肿瘤科医生、医生或者涉及患者诊断或治疗或监控/随访的其他医护人员定制治疗,使得患者具有长期存活的最佳机会,同时,不需要的副作用,尤其是侵袭性化学疗法和/或靶向疗法和/或免疫疗法和/或放射疗法和/或手术的那些副作用,降到最低。因此,例如具有癌症复发的低风险的患者,即具有低MPS的那些患者和/或基于如本文描述的风险分层算法分类为低风险的那些患者,目前通常用单独的激素治疗或激素治疗的组合(例如抗雌激素和/或芳香酶抑制剂),以及毒性较低的化学治疗剂进行治疗。另一方面,具有癌症复发的中度或高风险的患者,即具有中至高MPS的那些患者和/或基于如本文描述的风险分层算法分类为中度或高风险的那些患者,目前通常用更侵袭性的化学疗法例如基于蒽环和/或紫杉烷的治疗方案进行治疗。另外,可能与其他患者测试结果例如P ER P Wnt P HH P AR 和/或其他预后或预测(例如伴侣诊断)测试组合的MPS,可以产生用靶向药物(例如它莫西芬、曲妥珠单抗、贝伐珠单抗)、和/或其他治疗药物(例如免疫疗法)(其目前不是用于患者的特定癌症的主线治疗方案的部分)、和/或其他治疗选项(例如放射疗法,例如短距离放射疗法)、和/或不同治疗时机(例如主要治疗前和/或后)治疗患者的决策。
注意到代替直接使用测定的风险得分(MPS)作为临床事件(例如癌症)将在某一时间段内发生的风险的指示,CDS系统10能够配置为组合风险得分和/或推断活性中的至少一种与得自一种或多种另外的预后测试的一种或多种另外的风险得分,以获得组合的风险得分,其中所述组合的风险得分指示临床事件将在某一时间段内发生的风险。一种或多种另外的预后测试可以特别包含Oncotype DX®乳腺癌测试、Mammostrat®乳腺癌测试、MammaPrint®乳腺癌测试、BluePrintTM乳腺癌测试、CompanDx®乳腺癌测试、乳腺癌指数SM(HOXB13/IL17BR)、OncotypeDX®结肠癌测试、和/或通过测量基因/蛋白质Ki67的表达执行的增殖测试。
实施例5:测定风险得分的试剂盒和分析工具
使用例如贝叶斯模型或(假)线性模型,基于微阵列/基于RNA测序的研究发现最佳指示特异性途径活性的靶基因的组可以转变为例如对组织、细胞或体液样品执行的多路定量PCR测定或专用微阵列生物芯片。如本文描述的基因序列的选择可以用于选择例如用于RT-PCR的引物探针组或用于微阵列开发的寡核苷酸。为了开发此类FDA批准的用于途径活性和风险得分测定的测试,需要开发标准化的测试试剂盒,其需要在临床试验中进行临床验证,以获得管理机构批准。
实施例6:风险得分的比较
图7显示了举例说明来自比较两种不同测定的风险得分的实验结果的图。特别地,根据等式(8)计算第一风险得分(MPS),并且根据等式(7)计算第二风险得分。通过指定对乳腺癌样品(GSE6532和GSE9195)测定的危害比的算法,其导致α = log(1/0.36)、β = log(3.67)和γ = log(2.29),第一风险得分对于乳腺癌样品进行优化。关于第二风险得分的αβ的值示例性选择为等于1。实验对GSE21653、GSE20685和E-TABM-365数据集执行,并且根据各自的风险得分(其中所述风险得分这样定标,使得它们可以容易地进行比较),测定在入选(样品取得)后10年时经历复发的患者部分。总共1130个患者参加,其中1005个具有完全存活数据。虚线曲线举例说明关于根据等式(8)计算的第一风险得分的结果,而实线曲线举例说明关于根据等式(7)计算的第二风险得分的结果。
根据该图将了解的是根据等式(7)计算的第二风险得分(实线曲线)导致单纯增加的风险,而根据等式(8)计算的第一风险得分(虚线曲线)在更高的风险得分时趋向平稳(它甚至看起来下降了一点)。这意指在根据等式(8)计算的第一风险得分的上端,不再能够区别患者的风险,而对于根据等式(7)计算的第二风险得分,风险继续随着风险得分而增加。
另外,根据该图还明确的是根据等式(7)计算的第二风险得分(实线曲线)更好地能够区分高风险患者(0.84相对于0.78),还在鉴定低风险患者(0.43相对于0.45)方面略微优于根据等式(8)计算的第一风险得分(虚线曲线)。
一般而言,应当理解虽然与Wnt途径、ER途径、AR途径和/或HH途径有关的例子提供作为举例说明性例子,但用于本文公开的细胞信号传导途径分析的方法容易应用于除这些途径外的其他细胞信号传导途径,例如在细胞膜中具有受体的细胞内信号传导途径和具有在细胞内的受体的细胞内信号传导途径。另外:本申请描述了几个优选实施方案。在阅读且理解前述详述后,其他人可以想到修饰和改变。预期本申请应解释为包括所有此类修饰和改变,只要它们在所附权利要求或其等价物范围内。
根据附图、公开内容和所附权利要求的研究,在实践本发明中对所公开实施方案的其他变化可以由本领域技术人员理解且实现。
在权利要求中,单词“包含”不排除其他元件或步骤,并且不定冠词“一个”或“一种”不排除多个/种。
单个单元或装置可以达成权利要求中所述的几项的功能。在相互不同的独立权利要求中所述的某些测量的简单事实并非指示这些测量的组合不能用于突出优点。
计算如通过一个或几个单元或装置执行的风险得分测定可以通过任何其他数目的单元或装置来执行。
计算机程序可以存储/分布在合适的介质例如光盘存储介质或固态介质上,连同其他硬件一起或作为其他硬件的部分供应,但还可以以其他形式分布,例如经由因特网或者其他有线或无线远程通信系统。
权利要求中的任何参考符号不应解释为限制范围。
本申请主要涉及用于测定指示临床事件将在某一时间段内发生的风险的风险得分的具体方法,其中所述风险得分至少部分基于在受试者的组织和/或细胞和/或体液中的两个或更多个细胞信号传导途径的推断活性组合。本申请还涉及包括配置为执行此类方法的数字处理器的仪器,存储可通过数字处理装置执行以执行此类方法的非瞬时性存储介质,以及包含用于促使数字处理装置执行此类方法的程序代码工具的计算机程序。
文献:
de Sousa E Melo F,C. S.(2011). Methylation of cancer-stem-cell-associated Wnt target genes predicts poor prognosis in colorectal cancerpatients. Cell Stem Cell.,476-485
Hatzis P,v. d.(2008). Genome-wide pattern of TCF7L2/TCF4 chromatinoccupancy in colorectal cancer cells. Mol Cell Biol.,2732-2744
Nusse,R.(2012,May 1). Wnt target genes. Retrieved from The Wnthomepage: http://www.stanford.edu/group/nusselab/cgi-bin/wnt/target_genes
Söderberg O,G. M.(2006). Direct observation of individual endogenousprotein complexes in situ by proximity ligation. Nat Methods.,995-1000
van de Wetering M,S. E.-P.-F.(2002). The beta-catenin/TCF-4 compleximposes a crypt progenitor phenotype on colorectal cancer cells. Cell,241-250。

Claims (14)

1.用于测量细胞信号传导途径的一种或多种靶基因的表达水平的试剂在制备用于这样的方法的试剂盒中的用途,所述方法包括:
至少基于在受试者的组织和/或细胞和/或体液的提取样品中测量的细胞信号传导途径的一种或多种靶基因的表达水平(20),推断所述受试者的组织和/或细胞和/或体液中的两个或更多个细胞信号传导途径的活性,和
测定指示临床事件将在某一时间段内发生的风险的风险得分,其中所述风险得分至少部分基于推断活性的组合,
其中所述细胞信号传导途径包含Wnt途径、ER途径、HH途径和/或AR途径,
其中所述细胞信号传导途径包含ER途径、Wnt途径和HH途径,并且其中所述风险得分这样进行限定,使得临床事件将在某一时间段内发生的所示风险随着P ER 增加而减少,并且随着max(P Wnt ,P HH )增加而增加,
其中P ER P Wnt P HH 分别指示ER途径、Wnt途径和HH途径的推断活性,
其中所述推断包括:
至少基于在所述受试者的组织和/或细胞和/或体液的提取样品中测量的Wnt途径的一种或多种靶基因的表达水平(20),推断所述受试者的组织和/或细胞和/或体液中的Wnt途径的活性,所述靶基因选自下述:KIAA1199、AXIN2、RNF43、TBX3、TDGF1、SOX9、ASCL2、IL8、SP5、ZNRF3、KLF6、CCND1、DEFA6和FZD7,
和/或
至少基于在所述受试者的组织和/或细胞和/或体液的提取样品中测量的ER途径的一种或多种靶基因的表达水平(20),推断所述受试者的组织和/或细胞和/或体液中的ER途径的活性,所述靶基因选自下述:GREB1、PGR、XBP1、CA12、SOD1、CTSD、IGFBP4、TFF1、SGK3、NRIP1、CELSR2、WISP2和AP1B1,
和/或
至少基于在所述受试者的组织和/或细胞和/或体液的提取样品中测量的HH途径的一种或多种靶基因的表达水平(20),推断所述受试者的组织和/或细胞和/或体液中的HH途径的活性,所述靶基因选自下述:GLI1、PTCH1、PTCH2、IGFBP6、SPP1、CCND2、FST、FOXL1、CFLAR、TSC22D1、RAB34、S100A9、S100A7、MYCN、FOXM1、GLI3、TCEA2、FYN和CTSL1,
和/或
至少基于在所述受试者的组织和/或细胞和/或体液的提取样品中测量的AR途径的一种或多种靶基因的表达水平(20),推断所述受试者的组织和/或细胞和/或体液中的AR途径的活性,所述靶基因选自下述:KLK2、PMEPA1、TMPRSS2、NKX3_1、ABCC4、KLK3、FKBP5、ELL2、UGT2B15、DHCR24、PPAP2A、NDRG1、LRIG1、CREB3L4、LCP1、GUCY1A3、AR和EAF2。
2.权利要求1的用途,其中所述推断活性的组合包含下述表达
α · P ER + β · max(P Wnt ,P HH ),
其中αβ是正常数比例因子,并且所述临床事件将在某一时间段内发生的所示风险随着表达的值增加而单纯增加。
3.权利要求1和2中任一项的用途,其中所述推断包括:
至少基于在所述受试者的组织和/或细胞和/或体液的提取样品中测量的Wnt途径的至少三种靶基因的表达水平(20),推断所述受试者的组织和/或细胞和/或体液中的Wnt途径的活性,所述靶基因选自下述:KIAA1199、AXIN2、RNF43、TBX3、TDGF1、SOX9、ASCL2、IL8、SP5、ZNRF3、KLF6、CCND1、DEFA6和FZD7,
和/或
至少基于在所述受试者的组织和/或细胞和/或体液的提取样品中测量的ER途径的至少三种靶基因的表达水平(20),推断所述受试者的组织和/或细胞和/或体液中的ER途径的活性,所述靶基因选自下述:GREB1、PGR、XBP1、CA12、SOD1、CTSD、IGFBP4、TFF1、SGK3、NRIP1、CELSR2、WISP2和AP1B1,
和/或
至少基于在所述受试者的组织和/或细胞和/或体液的提取样品中测量的HH途径的至少三种靶基因的表达水平(20),推断所述受试者的组织和/或细胞和/或体液中的HH途径的活性,所述靶基因选自下述:GLI1、PTCH1、PTCH2、IGFBP6、SPP1、CCND2、FST、FOXL1、CFLAR、TSC22D1、RAB34、S100A9、S100A7、MYCN、FOXM1、GLI3、TCEA2、FYN和CTSL1,
和/或
至少基于在所述受试者的组织和/或细胞和/或体液的提取样品中测量的AR途径的至少三种靶基因的表达水平(20),推断所述受试者的组织和/或细胞和/或体液中的AR途径的活性,所述靶基因选自下述:KLK2、PMEPA1、TMPRSS2、NKX3_1、ABCC4、KLK3、FKBP5、ELL2、UGT2B15、DHCR24、PPAP2A、NDRG1、LRIG1、CREB3L4、LCP1、GUCY1A3、AR和EAF2。
4.权利要求1或3的用途,其中所述推断进一步基于:
在所述受试者的组织和/或细胞和/或体液的提取样品中测量的Wnt途径的至少一种靶基因的表达水平(20),所述靶基因选自:NKD1、OAT、FAT1、LEF1、GLUL、REG1B、TCF7L2、COL18A1、BMP7、SLC1A2、ADRA2C、PPARG、DKK1、HNF1A和LECT2,
和/或
在所述受试者的组织和/或细胞和/或体液的提取样品中测量的ER途径的至少一种靶基因的表达水平(20),所述靶基因选自:RARA、MYC、DSCAM、EBAG9、COX7A2L、ERBB2、PISD、KRT19、HSPB1、TRIM25、PTMA、COL18A1、CDH26、NDUFV3、PRDM15、ATP5J和ESR1,
和/或
在所述受试者的组织和/或细胞和/或体液的提取样品中测量的HH途径的至少一种靶基因的表达水平(20),所述靶基因选自: BCL2、FOXA2、FOXF1、H19、HHIP、IL1R2、JAG2、JUP、MIF、MYLK、NKX2.2、NKX2.8、PITRM1和TOM1,
和/或
在所述受试者的组织和/或细胞和/或体液的提取样品中测量的AR途径的至少一种靶基因的表达水平(20),所述靶基因选自: APP、NTS、PLAU、CDKN1A、DRG1、FGF8、IGF1、PRKACB、PTPN1、SGK1和TACC2。
5.权利要求1-4中任一项的用途,其进一步包括:
将所述受试者指定至与不同所示风险相关的多个风险组中的至少一个,所述风险指示所述临床事件将在某一时间段内发生,
和/或
至少部分基于所述临床事件将在某一时间段内发生的所示风险,决定对于所述受试者推荐的治疗。
6.权利要求1-5中任一项的用途,其包括:
至少基于在所述受试者的组织和/或细胞和/或体液的提取样品中测量的Wnt途径的一组靶基因的两种、三种或更多种靶基因的表达水平(20),推断所述受试者的组织和/或细胞和/或体液中的Wnt途径的活性,
和/或
至少基于在所述受试者的组织和/或细胞和/或体液的提取样品中测量的ER途径的一组靶基因的两种、三种或更多种靶基因的表达水平(20),推断所述受试者的组织和/或细胞和/或体液中的ER途径的活性,
和/或
至少基于在所述受试者的组织和/或细胞和/或体液的提取样品中测量的HH途径的一组靶基因的两种、三种或更多种靶基因的表达水平(20),推断所述受试者的组织和/或细胞和/或体液中的HH途径的活性,
和/或
至少基于在所述受试者的组织和/或细胞和/或体液的提取样品中测量的AR途径的一组靶基因的两种、三种或更多种靶基因的表达水平(20),推断所述受试者的组织和/或细胞和/或体液中的AR途径的活性。
7.权利要求6的用途,其中
所述Wnt途径的靶基因的组包含选自下述的至少九种靶基因:KIAA1199、AXIN2、RNF43、TBX3、TDGF1、SOX9、ASCL2、IL8、SP5、ZNRF3、KLF6、CCND1、DEFA6和FZD7,
和/或
所述ER途径的靶基因的组包含选自下述的至少九种靶基因:GREB1、PGR、XBP1、CA12、SOD1、CTSD、IGFBP4、TFF1、SGK3、NRIP1、CELSR2、WISP2和AP1B1,
和/或
所述HH途径的靶基因的组包含选自下述的至少九种靶基因:GLI1、PTCH1、PTCH2、IGFBP6、SPP1、CCND2、FST、FOXL1、CFLAR、TSC22D1、RAB34、S100A9、S100A7、MYCN、FOXM1、GLI3、TCEA2、FYN和CTSL1,
和/或
所述AR途径的靶基因的组包含选自下述的至少九种靶基因:KLK2、PMEPA1、TMPRSS2、NKX3_1、ABCC4、KLK3、FKBP5、ELL2、UGT2B15、DHCR24、PPAP2A、NDRG1、LRIG1、CREB3L4、LCP1、GUCY1A3、AR和EAF2。
8.权利要求6的用途,其中
所述Wnt途径的靶基因的组包含选自下述的全部靶基因:KIAA1199、AXIN2、RNF43、TBX3、TDGF1、SOX9、ASCL2、IL8、SP5、ZNRF3、KLF6、CCND1、DEFA6和FZD7,
和/或
所述ER途径的靶基因的组包含选自下述的全部靶基因:GREB1、PGR、XBP1、CA12、SOD1、CTSD、IGFBP4、TFF1、SGK3、NRIP1、CELSR2、WISP2和AP1B1,
和/或
所述HH途径的靶基因的组包含选自下述的全部靶基因:GLI1、PTCH1、PTCH2、IGFBP6、SPP1、CCND2、FST、FOXL1、CFLAR、TSC22D1、RAB34、S100A9、S100A7、MYCN、FOXM1、GLI3、TCEA2、FYN和CTSL1,
和/或
所述AR途径的靶基因的组包含选自下述的全部靶基因:KLK2、PMEPA1、TMPRSS2、NKX3_1、ABCC4、KLK3、FKBP5、ELL2、UGT2B15、DHCR24、PPAP2A、NDRG1、LRIG1、CREB3L4、LCP1、GUCY1A3、AR和EAF2。
9.权利要求7或8的用途,其中
所述Wnt途径的靶基因的组进一步包括选自下述的至少一种靶基因:NKD1、OAT、FAT1、LEF1、GLUL、REG1B、TCF7L2、COL18A1、BMP7、SLC1A2、ADRA2C、PPARG、DKK1、HNF1A和LECT2、
和/或
所述ER途径的靶基因的组进一步包括选自下述的至少一种靶基因:RARA、MYC、DSCAM、EBAG9、COX7A2L、ERBB2、PISD、KRT19、HSPB1、TRIM25、PTMA、COL18A1、CDH26、NDUFV3、PRDM15、ATP5J和ESR1,
和/或
所述HH途径的靶基因的组进一步包括选自下述的至少一种靶基因:BCL2、FOXA2、FOXF1、H19、HHIP、IL1R2、JAG2、JUP、MIF、MYLK、NKX2.2、NKX2.8、PITRM1和TOM1,
和/或
所述AR途径的靶基因的组进一步包括选自下述的至少一种靶基因:APP、NTS、PLAU、CDKN1A、DRG1、FGF8、IGF1、PRKACB、PTPN1、SGK1和TACC2。
10.权利要求1-9中任一项的用途,其进一步包括组合所述风险得分和/或所述推断活性中的至少一种与得自一种或多种另外的预后测试的一种或多种另外的风险得分,以获得组合的风险得分,其中所述组合的风险得分指示所述临床事件将在某一时间段内发生的风险。
11.权利要求1-10中任一项的用途,其中所述临床事件是癌症。
12.权利要求11的用途,其中所述癌症是乳腺癌。
13.非瞬时性存储介质,其存储可通过数字处理装置(12)执行的指令,以执行如权利要求1-12中任一项中所述的方法。
14.计算机程序,其包含用于促使数字处理装置(12)执行如权利要求1-12中任一项中所述的方法的程序代码工具。
CN201480023555.6A 2013-04-26 2014-04-24 使用多重细胞信号传导途径活性的治疗应答的医学预后和预测 Active CN105121665B (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
EP13165471.7 2013-04-26
EP13165471 2013-04-26
PCT/EP2014/058326 WO2014174003A1 (en) 2013-04-26 2014-04-24 Medical prognosis and prediction of treatment response using multiple cellular signalling pathway activities

Publications (2)

Publication Number Publication Date
CN105121665A CN105121665A (zh) 2015-12-02
CN105121665B true CN105121665B (zh) 2019-11-26

Family

ID=48182831

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201480023555.6A Active CN105121665B (zh) 2013-04-26 2014-04-24 使用多重细胞信号传导途径活性的治疗应答的医学预后和预测

Country Status (11)

Country Link
US (1) US11309059B2 (zh)
EP (2) EP2989211B1 (zh)
JP (1) JP6603208B2 (zh)
KR (1) KR102256141B1 (zh)
CN (1) CN105121665B (zh)
AU (1) AU2014259459B2 (zh)
BR (1) BR112015026736A2 (zh)
CA (1) CA2909991A1 (zh)
MX (1) MX366204B (zh)
RU (1) RU2718647C2 (zh)
WO (1) WO2014174003A1 (zh)

Families Citing this family (31)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2014174003A1 (en) 2013-04-26 2014-10-30 Koninklijke Philips N.V. Medical prognosis and prediction of treatment response using multiple cellular signalling pathway activities
CA2923092C (en) 2014-01-03 2019-12-17 Koninklijke Philips N.V. Assessment of the pi3k cellular signaling pathway activity using mathematical modelling of target gene expression
CA2965442A1 (en) 2014-10-24 2016-04-28 Koninklijke Philips N.V. Assessment of tgf-b cellular signaling pathway activity using mathematical modelling of target gene expression
ES2838923T3 (es) 2014-10-24 2021-07-02 Koninklijke Philips Nv Pronóstico médico y predicción de la respuesta a tratamiento usando múltiples actividades de la ruta de señalización celular
JP7065609B6 (ja) 2014-10-24 2022-06-06 コーニンクレッカ フィリップス エヌ ヴェ 複数の細胞シグナル伝達経路活性を用いる治療応答の医学的予後及び予測
ES2861400T3 (es) 2015-08-14 2021-10-06 Koninklijke Philips Nv Evaluación de la actividad de la ruta de señalización celular de NFkB usando modelos matemáticos de la expresión de genes diana
US20190128899A1 (en) * 2016-06-13 2019-05-02 Koninklijke Philips N.V. Method for inferring activity of a transcription factor of a signal transduction pathway in a subject
US20190385697A1 (en) * 2017-02-14 2019-12-19 The Regents Of The University Of Colorado, A Body Corporate Methods for predicting transcription factor activity
EP3431582A1 (en) 2017-07-18 2019-01-23 Koninklijke Philips N.V. Cell culturing materials
EP3692170A1 (en) 2017-10-02 2020-08-12 Koninklijke Philips N.V. Determining functional status of immune cells types and immune response
EP3461915A1 (en) 2017-10-02 2019-04-03 Koninklijke Philips N.V. Assessment of jak-stat1/2 cellular signaling pathway activity using mathematical modelling of target gene expression
EP3502279A1 (en) 2017-12-20 2019-06-26 Koninklijke Philips N.V. Assessment of mapk-ap 1 cellular signaling pathway activity using mathematical modelling of target gene expression
US11462325B2 (en) * 2018-09-29 2022-10-04 Roche Molecular Systems, Inc. Multimodal machine learning based clinical predictor
EP3963108A1 (en) * 2019-05-03 2022-03-09 Koninklijke Philips N.V. Methods of prognosis in high-grade serous ovarian cancer
EP3739588A1 (en) 2019-05-13 2020-11-18 Koninklijke Philips N.V. Assessment of multiple signaling pathway activity score in airway epithelial cells to predict airway epithelial abnormality and airway cancer risk
US20220270757A1 (en) * 2019-08-02 2022-08-25 Intellijoint Surgical Inc. Systems and methods to collaborate, to train an expert system and to provide an expert system
EP3882363A1 (en) 2020-03-17 2021-09-22 Koninklijke Philips N.V. Prognostic pathways for high risk sepsis patients
KR102565378B1 (ko) * 2020-03-23 2023-08-10 단국대학교 산학협력단 유방암 호르몬 수용체의 상태 예측을 위한 바이오 마커
US20230223108A1 (en) 2020-04-16 2023-07-13 Innosign B.V. Prognostic pathways for viral infections
EP3978628A1 (en) 2020-10-01 2022-04-06 Koninklijke Philips N.V. Prognostic pathways for viral infections
EP3940704A1 (en) 2020-07-14 2022-01-19 Koninklijke Philips N.V. Method for determining the differentiation state of a stem cell
EP3960875A1 (en) * 2020-08-28 2022-03-02 Koninklijke Philips N.V. Pcr method and kit for determining pathway activity
EP3965119A1 (en) 2020-09-04 2022-03-09 Koninklijke Philips N.V. Methods for estimating heterogeneity of a tumour based on values for two or more genome mutation and/or gene expression related parameter, as well as corresponding devices
EP3974540A1 (en) 2020-09-25 2022-03-30 Koninklijke Philips N.V. Method for predicting immunotherapy resistance
KR102189142B1 (ko) * 2020-10-15 2020-12-09 서울대학교병원 만성신장질환의 악화 예측 마커로서의 snp 및 이의 이용
EP4015651A1 (en) 2020-12-17 2022-06-22 Koninklijke Philips N.V. Treatment prediction and effectiveness of anti-tnf alpha treatment in ibd patients
EP4039825A1 (en) 2021-02-09 2022-08-10 Koninklijke Philips N.V. Comparison and standardization of cell and tissue culture
WO2022189530A1 (en) 2021-03-11 2022-09-15 Koninklijke Philips N.V. Prognostic pathways for high risk sepsis patients
CN114410667B (zh) * 2021-12-31 2022-10-11 广东省科学院动物研究所 一种鞍带石斑鱼znrf3基因及其编码的蛋白和应用
KR102508252B1 (ko) * 2022-01-11 2023-03-09 주식회사 볼츠만바이오 생체신호전달 네트워크 모델의 학습방법 및 이를 위한 장치
CN114524872A (zh) * 2022-03-09 2022-05-24 广州诺诚生物技术研发有限公司 一种用于乳腺癌检测的单克隆抗体及其试剂盒

Family Cites Families (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20060235255A1 (en) 2005-04-15 2006-10-19 Gartside Robert J Double bond hydroisomerization process
EP1910564A1 (en) * 2005-05-13 2008-04-16 Duke University Gene expression signatures for oncogenic pathway deregulation
RU2376372C2 (ru) * 2007-04-03 2009-12-20 Государственное учреждение Научно-исследовательский институт медицинской генетики Томского научного центра Сибирского отделения Российской академии медицинских наук Способ генетической диагностики подверженности к сердечно-сосудистым заболеваниям
WO2010144358A1 (en) * 2009-06-08 2010-12-16 Singulex, Inc. Highly sensitive biomarker panels
RU2013140708A (ru) * 2011-02-04 2015-03-10 Конинклейке Филипс Н.В. Способ для оценки потока информации в биологических сетях
EP2549399A1 (en) * 2011-07-19 2013-01-23 Koninklijke Philips Electronics N.V. Assessment of Wnt pathway activity using probabilistic modeling of target gene expression
US9324927B2 (en) 2011-12-08 2016-04-26 Koninklijke Philips N.V. Semiconductor light emitting device with thick metal layers
AU2013368945B2 (en) 2012-12-26 2020-01-23 Innosign B.V. Assessment of cellular signaling pathway activity using linear combination(s) of target gene expressions
WO2014174003A1 (en) 2013-04-26 2014-10-30 Koninklijke Philips N.V. Medical prognosis and prediction of treatment response using multiple cellular signalling pathway activities

Non-Patent Citations (5)

* Cited by examiner, † Cited by third party
Title
A multi-gene assay to predict recurrence of Tamoxifen-treated,node-negative breast cancer;Paik S等;《THE NEW ENGLAND JOURNAL OF MEDICINE》;20041231;第351卷(第27期);第2817-2826页 *
Accurate and reliable cancer classification based on Probabilistic Inference of Pathway Activity;Junjie Su等;《PLOS ONE》;20091207;第4卷(第12期);e8161 *
Detection of Treatment-Induced Changes in Signaling Pathways in Gastrointestinal Stromal Tumors using Transcriptomic Data;Michael F等;《Cancer Research》;20091201;第69卷(第23期);第9125-9132页 *
Inferring Pathway Activity toward Precise Disease Classification;Eunjung Lee等;《PLOS COMPUTATIONAL BIOLOGY》;20081107;第4卷(第11期);e1000217 *
Nonparametric pathway-based regression models for analysis of genomic data;Z wei等;《Biosatatistics》;20070430;第8卷(第2期);第265-284页 *

Also Published As

Publication number Publication date
EP2989211B1 (en) 2018-06-13
EP3372695A1 (en) 2018-09-12
WO2014174003A1 (en) 2014-10-30
CN105121665A (zh) 2015-12-02
JP6603208B2 (ja) 2019-11-06
US20160110494A1 (en) 2016-04-21
AU2014259459B2 (en) 2020-03-26
EP3372695B1 (en) 2020-09-09
MX366204B (es) 2019-07-02
EP2989211A1 (en) 2016-03-02
RU2015150464A (ru) 2017-06-02
RU2718647C2 (ru) 2020-04-10
CA2909991A1 (en) 2014-10-30
JP2016519926A (ja) 2016-07-11
US11309059B2 (en) 2022-04-19
MX2015014847A (es) 2016-03-11
AU2014259459A1 (en) 2015-12-17
BR112015026736A2 (pt) 2017-07-25
KR20160003124A (ko) 2016-01-08
KR102256141B1 (ko) 2021-05-27

Similar Documents

Publication Publication Date Title
CN105121665B (zh) 使用多重细胞信号传导途径活性的治疗应答的医学预后和预测
AU2020202706B2 (en) Assessment of cellular signaling pathway activity using linear combination(s) of target gene expressions
US20230105263A1 (en) Assessment of cellular signaling pathway activity using probabilistic modeling of target gene expression
van der Heijden et al. A five-gene expression signature to predict progression in T1G3 bladder cancer
Yoshihara et al. Gene expression profile for predicting survival in advanced-stage serous ovarian cancer across two independent datasets
Lee et al. Prediction of recurrence-free survival in postoperative non–small cell lung cancer patients by using an integrated model of clinical information and gene expression
CN108064380A (zh) 使用多种细胞信号传导途径活性的医学预后和治疗反应的预测
Bartsch et al. Expression profiling for bladder cancer: strategies to uncover prognostic factors
Wang et al. Identification of a 5-gene signature for clinical and prognostic prediction in gastric cancer patients upon microarray data
CA2889276A1 (en) Method for identifying a target molecular profile associated with a target cell population
Dadiani et al. Tumor evolution inferred by patterns of microRNA expression through the course of disease, therapy, and recurrence in breast cancer
Bloomstein et al. Validated limited gene predictor for cervical cancer lymph node metastases
Ciniselli Identification of Circulating Biomarkers for the Early Diagnosis of Colorectal Cancer: Methodological Aspects

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant