CN113557310A - 用于乳腺癌预后的转录组谱分析 - Google Patents

用于乳腺癌预后的转录组谱分析 Download PDF

Info

Publication number
CN113557310A
CN113557310A CN201980091514.3A CN201980091514A CN113557310A CN 113557310 A CN113557310 A CN 113557310A CN 201980091514 A CN201980091514 A CN 201980091514A CN 113557310 A CN113557310 A CN 113557310A
Authority
CN
China
Prior art keywords
subject
cancer
kit
breast cancer
genes
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201980091514.3A
Other languages
English (en)
Inventor
S·L·常
E·达维乔尼
F·冯
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Pfs Genomics
Veracyte SD Inc
Original Assignee
Pfs Genomics
GenomeDx Biosciences Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Pfs Genomics, GenomeDx Biosciences Inc filed Critical Pfs Genomics
Publication of CN113557310A publication Critical patent/CN113557310A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N33/00Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
    • G01N33/48Biological material, e.g. blood, urine; Haemocytometers
    • G01N33/50Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing
    • G01N33/53Immunoassay; Biospecific binding assay; Materials therefor
    • G01N33/574Immunoassay; Biospecific binding assay; Materials therefor for cancer
    • G01N33/57407Specifically defined cancers
    • G01N33/57415Specifically defined cancers of breast
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6813Hybridisation assays
    • C12Q1/6816Hybridisation assays characterised by the detection means
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6876Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
    • C12Q1/6883Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material
    • C12Q1/6886Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material for cancer
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N33/00Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
    • G01N33/48Biological material, e.g. blood, urine; Haemocytometers
    • G01N33/50Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing
    • G01N33/53Immunoassay; Biospecific binding assay; Materials therefor
    • G01N33/574Immunoassay; Biospecific binding assay; Materials therefor for cancer
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H20/00ICT specially adapted for therapies or health-improving plans, e.g. for handling prescriptions, for steering therapy or for monitoring patient compliance
    • G16H20/10ICT specially adapted for therapies or health-improving plans, e.g. for handling prescriptions, for steering therapy or for monitoring patient compliance relating to drugs or medications, e.g. for ensuring correct administration to patients
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H20/00ICT specially adapted for therapies or health-improving plans, e.g. for handling prescriptions, for steering therapy or for monitoring patient compliance
    • G16H20/40ICT specially adapted for therapies or health-improving plans, e.g. for handling prescriptions, for steering therapy or for monitoring patient compliance relating to mechanical, radiation or invasive therapies, e.g. surgery, laser therapy, dialysis or acupuncture
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/20ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for computer-aided diagnosis, e.g. based on medical expert systems
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/30ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for calculating health indices; for individual health risk assessment
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/118Prognosis of disease development
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/158Expression markers
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N2800/00Detection or diagnosis of diseases
    • G01N2800/52Predicting or monitoring the response to treatment, e.g. for selection of therapy based on assay results in personalised medicine; Prognosis
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02ATECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
    • Y02A90/00Technologies having an indirect contribution to adaptation to climate change
    • Y02A90/10Information and communication technologies [ICT] supporting adaptation to climate change, e.g. for weather forecasting or climate simulation

Landscapes

  • Health & Medical Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Immunology (AREA)
  • Organic Chemistry (AREA)
  • General Health & Medical Sciences (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Biomedical Technology (AREA)
  • Pathology (AREA)
  • Molecular Biology (AREA)
  • Analytical Chemistry (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Physics & Mathematics (AREA)
  • Biotechnology (AREA)
  • Biochemistry (AREA)
  • Microbiology (AREA)
  • Medical Informatics (AREA)
  • Public Health (AREA)
  • Genetics & Genomics (AREA)
  • Urology & Nephrology (AREA)
  • Hematology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Oncology (AREA)
  • Hospice & Palliative Care (AREA)
  • General Engineering & Computer Science (AREA)
  • Biophysics (AREA)
  • Primary Health Care (AREA)
  • Epidemiology (AREA)
  • Medicinal Chemistry (AREA)
  • Data Mining & Analysis (AREA)
  • Cell Biology (AREA)
  • Food Science & Technology (AREA)
  • General Physics & Mathematics (AREA)
  • Databases & Information Systems (AREA)
  • Nuclear Medicine, Radiotherapy & Molecular Imaging (AREA)
  • Surgery (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
  • Apparatus Associated With Microorganisms And Enzymes (AREA)

Abstract

公开了用于受试者的乳腺癌的诊断、预后和治疗的方法、系统和试剂盒。本发明还提供了生物标志物和临床上有用的分类器,它们用于鉴定可以避免辅助化学疗法和内分泌疗法的、处于低乳腺癌复发风险的受试者。在某些情况下,在本文中进一步公开了用于检测这样的生物标志物的探针集合,其用于确定受试者的乳腺癌复发风险。还提供了基于表达谱分析来确定乳腺癌复发风险以治疗乳腺癌的方法。

Description

用于乳腺癌预后的转录组谱分析
相关申请
本申请要求2018年12月8日提交的美国临时专利申请系列号62/777,128的优先权,其特此通过引用整体并入本文。
技术领域
本发明涉及用于治疗乳腺癌的个性化药物和方法的领域。具体地,本发明涉及转录组谱分析(transcriptomic profiling)用于乳腺癌的预后以鉴定可能免于辅助性全身疗法的受试者的用途。
背景技术
癌症是异常细胞在体内任何地方不受控制的增长。异常细胞被称为癌细胞、恶性细胞或肿瘤细胞。构成癌组织的许多癌症和异常细胞通过异常细胞所源自的组织的名称来进一步鉴定(例如,乳腺癌)。癌细胞可以不受控制地增殖并形成癌细胞团。癌细胞可以从该原始细胞团脱离,通过血液和淋巴系统移动,并且寄留在其它器官中,在那里它们可以再次重复不受控制的生长周期。癌细胞离开一个区域并在另一个身体区域生长的这个过程常常被称为转移性扩散或转移性疾病。例如,如果乳腺癌细胞扩散至骨骼(或其它地方),则它可以意指个体患有转移性乳腺癌。
标准临床参数诸如肿瘤大小、分级、淋巴结受累和肿瘤-淋巴结-转移(TNM)分期(美国癌症联合委员会)可能与结果相关,并有助于根据(新)辅助化学疗法、免疫疗法、抗体疗法和/或放射疗法方案将受试者分级。分子标志物在临床实践中的掺入可以定义更可能对靶向治疗产生应答的肿瘤亚型。但是,按组织学或分子亚型分组的分期匹配的肿瘤可能对相同的治疗方案有不同的应答。可能存在具有重要病因学贡献的额外关键遗传改变和表观遗传改变。在癌细胞和肿瘤微环境(TME)中起作用的分子机制和调节途径的更详细理解,可以显著改善新型抗肿瘤药物的设计,并为最佳治疗策略的选择提供信息。用于表征每个肿瘤的生物学的诊断、预后和治疗生物标志物的开发和实施可以帮助临床医生做出关于个体受试者护理和治疗的重要决定。
原发性乳腺癌的治疗高度个体化,并已进入精准医学时代。由于公众意识的提高和筛查计划的加强,低风险肿瘤的比例已经随着相应过度治疗的风险而增加(Hosseini等人(2017) Eur. J. Surg. Oncol. 43:938-943)。因此,目前的指南除了对高风险肿瘤进行升级治疗外,还侧重于对低风险受试者进行降级治疗(Curigliano等人(2017) Ann Oncol28:1700-1712)。帮助评估辅助化学疗法复发风险降低的工具是最成功的,并已纳入临床指南,而目前除了雌激素受体(ER)的表达外,还没有批准通过来自内分泌疗法的益处对受试者分级的试验(Curigliano等人, 出处同上)。
来自早期乳腺癌试验者合作组(Early Breast Cancer Trialists’Collaborative Group,EBCTCG)的大型后设分析证实,ER-阳性的(ER+)乳腺癌在停止内分泌疗法后15年内继续以相对一致的速度复发并导致死亡,这表明某些受试者需要延长的内分泌疗法(Pan等人(2017) N. Engl. J. Med. 377:1836-1846)。但是,内分泌疗法可能有很大的副作用,这反映在50-80%的依从率上(Chlebowski等人(2006) Oncology 71:1-9)。这已经导致人们努力鉴定可以安全地免除内分泌疗法的具有ER+ 癌症的受试者。因此,即使在没有内分泌疗法存在下也可以选择复发风险最低的那些女性的试验可以避免不必要的治疗及其相关的发病率。
为了解决这个问题,最近证实了70-基因标记会鉴定20年内具有低复发风险的超低风险受试者组,即使没有任何系统治疗(Esserman等人(2017) JAMA Oncol. 3:1503-1510)。令人感兴趣的是,相同作者评价了给按70-基因标记分级的高风险和低风险受试者施用他莫昔芬的效果,并发现佐剂他莫昔芬在两组中均具有显著影响(Van 't Veer等人(2017) Breast Cancer Res Treat 166:593-601)。这证实了预后不会导致治疗预测,且在亚组中进行治疗效果的回顾分析时应谨慎。
从临床角度看,已经争论人们可以认为相对治疗效果在亚组中是一致的,并根据基线风险水平和绝对治疗效果做出治疗决策(Peto等人(2011) Br. J. Cancer 104:1057-1058)。但是,当考虑使用基线风险进行基因表达试验时,一个新出现的问题是当前试验在个体受试者水平上不一致的概念。虽然基因表达试验总体上表现良好,在组水平上表现相似,但单个受试者的结果可能存在很大差异,即当使用不同试验时低风险和高风险受试者组并不相同。实际上,最近的研究发现,五种常见基因表达试验的一致性只是适度的,39%的受试者被所有试验统一归类为低风险,而个别试验预测61%-82%为低风险(Bartlett等人(2016) Comparing Breast Cancer Multiparameter Tests in the OPTIMA PrelimTrial: No Test Is More Equal Than the Others. J. Natl. Cancer Inst. 108,2016)。因此,仍然需要更好的方法来对患有早期乳腺癌的受试者进行分级。
为了提供申请人认为与本发明可能有关的已知信息的目的,提供该背景信息。既不一定意图承认,也不应解释为,任意上述信息构成本发明的现有技术。
发明内容
本发明涉及用于受试者的乳腺癌的诊断、预后和治疗的方法、系统和试剂盒。本发明还提供了用于鉴定处于低乳腺癌复发风险的受试者的生物标志物和分类器,所述受试者可以避免辅助化学疗法和内分泌疗法。在某些情况下,在本文中进一步公开了探针集合,其用于检测这样的生物标志物以确定受试者的乳腺癌复发风险。还提供了基于表达谱分析(expression profiling)来确定乳腺癌复发风险的治疗乳腺癌的方法。
在某些实施方案中,本发明包括一种用于确定预后和治疗受试者的乳腺癌的方法,所述方法包括:a)从受试者得到包含乳腺癌细胞的生物样品; b)测量生物样品中选自表2的多个基因的表达水平; c)基于生物样品中选自表2的多个基因的表达水平,确定受试者是否处于低癌症复发风险;和d)基于生物样品中选自表2的多个基因的表达水平,如果所述受试者没有被鉴定为处于低癌症复发风险,则施用辅助化学疗法或内分泌疗法,和如果受试者被鉴定为处于低癌症复发风险,则不施用辅助化学疗法或内分泌疗法。在其它实施方案中,选自表2的一个或多个基因的表达水平可以与对照相比增加或降低。在其它实施方案中,在生物样品中测量选自表2的所有基因的表达水平。
在某些实施方案中,多个基因选自:ATP结合盒亚家族F成员1 (ABCF1), 乙酰辅酶A乙酰基转移酶2 (ACAT2), 肌动蛋白样6A (ACTL6A), 载脂蛋白B mRNA编辑酶催化亚基3B(APOBEC3B), 抗沉默功能1B组蛋白伴侣蛋白(ASF1B), ATP合酶 H+运输线粒体F1复合物γ多肽1 (ATP5C1), bystin样(BYSL), 染色体1开放读码框106 (C1orf106), 细胞分裂周期25B (CDC25B), 细胞分裂周期45 (CDC45), 染色质沉默和DNA复制因子1 (CDT1), CCAAT/增强子结合蛋白γ(CEBPG), 着丝粒蛋白I (CENPI), 染色质组装因子1亚基A (CHAF1A),染色质组装因子1亚基B (CHAF1B), 检验点激酶1 (CHEK1), 细胞因子诱导的细胞凋亡抑制剂1 (CIAPIN1), 细胞骨架相关蛋白2 (CKAP2), CTP合酶1 (CTPS1), DNA复制解螺旋酶/核酸酶2 (DNA2), DNA甲基转移酶1 (DNMT1), DNA甲基转移酶3β(DNMT3B), E2F转录因子8 (E2F8), 依莫帕米结合蛋白(甾醇异构酶) (EBP), 真核翻译起始因子4E结合蛋白1(EIF4EBP1), ER膜蛋白复合物亚基8 (EMC8), 具有序列相似性的家族96成员B (FAM96B),范科尼贫血互补群A (FANCA), F-盒子蛋白5 (FBXO5), 甘油醛-3-磷酸脱氢酶(GAPDH),甘氨酰-tRNA合成酶(GARS), 孪蛋白DNA复制抑制剂(GMNN), G-蛋白信号传递调节剂2(GPSM2), GTP结合蛋白4 (GTPBP4), 肝细胞瘤-衍生的生长因子(HDGF), 血液学和神经学表达的1 (HN1), 热激蛋白家族A (Hsp70)成员14 (HSPA14), 热激蛋白家族D (Hsp60)成员1 (HSPD1), 肌醇单磷酸酶2 (IMPA2), 白介素1受体相关激酶1 (IRAK1), 赖氨酰基-tRNA合成酶(KARS), 动粒相关的1 (KNTC1), LDL受体有关的蛋白8 (LRP8), 微型染色体维持复合物组分5 (MCM5), 微型染色体维持复合物组分7 (MCM7), MIS18动粒蛋白A(MIS18A), 线粒体核糖体蛋白L15 (MRPL15), 线粒体核糖体蛋白S17 (MRPS17), 线粒体转录终止因子3 (MTERF3), 核前层蛋白A识别因子(NARF), 非-SMC凝缩蛋白I复合物亚基D2 (NCAPD2), 非-SMC凝缩蛋白II复合物亚基D3 (NCAPD3), NADH:泛醌氧化还原酶亚基A9(NDUFA9), 核包膜嵌膜蛋白1 (NEMP1), NME/NM23核苷二磷酸激酶1 (NME1), NOP2核仁蛋白(NOP2), 核孔蛋白205 (NUP205), 起点识别复合物亚基1 (ORC1), 丙酮酸脱氢酶(硫辛酰胺)α1 (PDHA1), 异戊二烯基(癸异戊二烯基)二磷酸合酶亚基1 (PDSS1), 磷酸甘油酸激酶1 (PGK1), polo样激酶4 (PLK4), 嘌呤核苷磷酸化酶(PNP), DNA聚合酶α2, 辅助亚基(POLA2), 蛋白磷酸酶, Mg2+/Mn2+ 依赖性的1G (PPM1G), 过氧化氧化还原蛋白4(PRDX4), 蛋白酶体亚基β4 (PSMB4), 蛋白酶体亚基β5 (PSMB5), 蛋白酶体26S亚基, 非-ATP酶14 (PSMD14), 蛋白酶体26S亚基, 非-ATP酶2 (PSMD2), 蛋白酶体组装伴侣蛋白1(PSMG1), 磷脂酰丝氨酸合酶1 (PTDSS1), RAD51重组酶(RAD51), RAD54同系物B (酿酒酵母) (RAD54B), RAD54-样(酿酒酵母) (RAD54L), RAN结合蛋白1 (RANBP1), 小核内核糖核蛋白多肽A (SNRPA1), 小核内核糖核蛋白多肽G (SNRPG), SPC25, NDC80动粒复合物组分(SPC25), SRSF蛋白激酶1 (SRPK1), 应激诱导的磷蛋白1 (STIP1), 转化酸性含卷曲螺旋的蛋白3 (TACC3), 转录延伸因子B亚基1 (TCEB1), 跨膜蛋白97 (TMEM97), 拓扑异构酶(DNA) IIα(TOP2A), 拓扑异构酶(DNA) II结合蛋白1 (TOPBP1), 磷酸丙糖异构酶1(TPI1), 尿嘧啶DNA糖基化酶(UNG)和酪氨酸3-单加氧酶/色氨酸5-单加氧酶活化蛋白ζ(YWHAZ)。
在某些实施方案中,受试者具有雌激素受体阳性的(ER+)、人表皮生长因子受体2阴性的(HER2-)乳腺癌,且是绝经后的。
从受试者得到的生物样品通常是乳房活组织检查或肿瘤样品,但可以是来自含有乳腺癌细胞的受试者的体液或组织的任何样品。在某些实施方案中,将包含来自选自表2的基因的序列或其互补序列的核酸(例如,RNA转录物)从生物样品进一步分离,和/或纯化,和/或在分析前扩增。
通过多种方法,包括但不限于原位杂交、基于PCR的方法、基于阵列的方法、免疫组织化学方法、RNA测定方法和免疫测定方法,可以确定生物标志物的表达水平。例如,使用一种或多种试剂诸如核酸探针、核酸引物和抗体,可以确定基因表达的水平。在某些实施方案中,确定生物标志物的表达水平包括测量核酸(例如,RNA转录物)的水平。
在某些实施方案中,至少一个基因的表达水平与对照相比降低。在其它实施方案中,至少一个基因的表达水平与对照相比增加。
在某些实施方案中,在用辅助化学疗法或内分泌疗法治疗受试者之前执行本文所述的方法。
在其它实施方案中,所述方法进一步包括计算受试者的平均基因组风险(AGR)评分,其中基于AGR评分和生物样品中选自表2的基因的表达水平,如果受试者没有被鉴定为处于低癌症复发风险,则将辅助化学疗法或内分泌疗法施用给受试者,和基于AGR评分和生物样品中选自表2的基因的表达水平,如果受试者被鉴定为处于低癌症复发风险,则不将辅助化学疗法或内分泌疗法施用给受试者。
在某些实施方案中,使用例如T-检验、P-值、KS (Kolmogorov Smirnov) P-值、准确度、准确度P-值、阳性预测值(PPV)、阴性预测值(NPV)、灵敏度、特异性、AUC、AUC P-值(Auc.p值)、Wilcoxon检验P-值、中位倍数差异(MFD)、Kaplan Meier曲线、生存AUC(survAUC)、Kaplan Meier P-值(KM P-值)、单变量分析比值比P-值(uvaORPval)、多变量分析比值比P-值(mvaORPval)、单变量分析风险比P-值(uvaHRPval)和多变量分析风险比P-值(mvaHRPval),可以评价一种或多种生物标志物基因的表达水平的显著性。在其它实施方案中,一种或多种靶标的表达水平的显著性可以是基于选自包括以下项的组的两个或更多个度量:AUC、AUC P-值(Auc.p值)、Wilcoxon检验P-值、中位倍数差异(MFD)、Kaplan Meier(KM)曲线、生存AUC (survAUC)、单变量分析比值比P-值(uvaORPval)、多变量分析比值比P-值(mvaORPval)、Kaplan Meier P-值(KM P-值)、单变量分析风险比P-值(uvaHRPval)或多变量分析风险比P-值(mvaHRPval)。
在其它实施方案中,本发明包括用于确定具有乳腺癌的受试者的预后和是否用辅助化学疗法和内分泌疗法治疗所述受试者的探针集合,所述探针集合包含用于检测多个靶核酸的多个探针,其中所述多个靶核酸包含选自表2的基因的一个或多个基因序列或其互补序列。可以可检测地标记探针以便利检测。
在其它实施方案中,本发明包括用于确定具有乳腺癌的受试者的预后和是否用辅助化学疗法和内分泌疗法治疗所述受试者的系统,所述系统包括:a)本文描述的探针集合;和b)计算机模型或算法,其用于分析在来自具有乳腺癌的受试者的生物样品中与所述多个探针杂交的多个靶核酸的表达水平或表达谱,和基于所述表达水平或表达谱确定所述受试者是否处于低癌症复发风险和可以免除用辅助化学疗法和内分泌疗法治疗。
在某些实施方案中,本发明包括用于确定具有乳腺癌的受试者的预后以及是否用辅助辅助化学疗法和内分泌疗法治疗所述受试者的试剂盒,所述试剂盒包含用于测量选自表2的多个基因的表达水平的试剂。在其它实施方案中,所述试剂盒可以包括:用于测量多个基因的表达水平的一种或多种试剂(例如,杂交探针、PCR引物或微阵列),其中所述多个基因包含选自表2的一个或多个基因;用于容纳供试验的生物样品的容器,所述生物样品包含从人受试者分离的乳腺癌细胞;和印刷的说明书,其关于使所述试剂与所述生物样品或所述生物样品的一部分反应以确定所述受试者是否处于低乳腺癌复发风险和可以免除用辅助化学疗法和内分泌疗法治疗。可以将所述试剂包装在分开的容器中。在其它实施方案中,所述试剂盒可以进一步包含一种或多种对照参考样品或用于测量基因表达的其它试剂(例如,用于执行PCR、RT-PCR、微阵列分析、RNA印迹、免疫测定或免疫组织化学的试剂)。在一些实施方案中,所述试剂盒包含用于测量在表2中列出的多个基因的表达水平的试剂。在其它实施方案中,所述试剂盒包含用于测量在表2中列出的所有基因的表达水平的试剂。例如,所述试剂盒可以包含如本文中所述的用于检测多个靶核酸的探针集合,其中所述多个靶核酸包含选自表2的基因的一个或多个基因序列或其互补序列、或它们的任意组合。
在其它实施方案中,所述试剂盒进一步包含用于确定具有乳腺癌的受试者的预后和是否用辅助化学疗法和内分泌疗法治疗所述受试者的系统,其中所述系统包含:a)探针集合,其包含用于检测多个靶核酸的多个探针,其中所述多个靶核酸包含选自表2的基因的一个或多个基因序列或其互补序列;和b)计算机模型或算法,其用于分析在来自具有乳腺癌的受试者的生物样品中与所述多个探针杂交的多个靶核酸的表达水平或表达谱,和基于所述表达水平或表达谱确定所述受试者是否处于低癌症复发风险和可以免除用辅助化学疗法和内分泌疗法治疗。
考虑到本文公开内容,本领域技术人员会容易明白主题发明的这些和其它实施方案。
通过引用并入
在本说明书中提及的所有出版物、专利和专利申请都通过引用整体并入本文,其程度如同明确地且单独地指出每篇单独的出版物、专利或专利申请通过引用并入。
附图说明
图1A-1C显示了SweBCG 91-RT的765个受试者中先前公布的标记的性能和对比。图1A显示了森林图,其描绘了所有765个受试者中15个先前公布的基因标记中的每一个的单变量(UVA)标准化风险比(HR)。将连续风险评分除以标准差,以直接对比不同值分布的评分之间的风险比。当除以标准差时,最大可能的HR为2.5。显示了所有受试者和远端转移终点的结果。图1B显示了所有765个受试者中不同标记的Pearson关联和分级聚类。对于在患有ER+ 癌症的乳腺癌受试者中发生的大多数标记或对于患有ER+ 癌症的乳腺癌受试者,看到中等至高度的相关性。图1C显示了先前公布的标记关于它们对个体受试者的分类的对比。给条形图加色以指示每种标记对受试者的评分的四分位数。为了对比还显示了基于免疫组织化学评分的组织学分级、达到转移的时间和亚型。显示了所有765个受试者的结果。将样品按15种标记的平均值的等级排序。
图2A-2C显示了SweBCG 91-RT的765个受试者中先前公布的标记在分类哪些受试者处于风险的最低四分位数的一致性。条形图显示了用标题标记归类为最低四分位数的受试者的比例,这也是彼此标记的最低四分位数。对所有765个受试者进行了该分析。
图3显示了在454名患有SweBCG 91-RT的ER+、HER2-癌症的绝经后且未全身治疗的受试者中先前公布的标记的表现。图3显示了森林图,其描绘了454名绝经后且未全身治疗的具有ER+、HER2-癌症的受试者的15个先前公布的基因标记中每一个的单变量(UVA)标准化风险比(HR)。将连续风险评分除以标准差以直接对比具有不同分布值的评分之间的风险比。显示了在绝经后且未全身治疗的具有ER+、HER2- 癌症的受试者中的远端转移终点的结果。
图4A-4C显示了在454名患有SweBCG 91-RT的ER+、HER2-癌症的绝经后且未全身治疗的受试者中先前公布的标记的表现。图4A-4C显示了对于15个先前公布的基因标记中的每一个,SweBCG 91-RT组群中454名未接受ER+、HER2-癌症的全身疗法的绝经后受试者的转移的Kaplan-Meier图。
图5A和5B显示了在绝经后且未全身治疗的的具有ER+、HER2- 癌症的受试者的平均基因组风险和MET141的Kaplan-Meier生存分析。关于平均基因组风险(图5A)和MET141标记(图5B),在SweBCG 91-RT组群中,454名未接受ER+、HER2- 癌症的全身疗法的绝经后受试者中的转移的Kaplan-Meier图。
图6A和6B显示了反应组(reactome)途径分析。反应组分析途径图指示,对于先前公布的标记(图6A)和MET141标记(图6B),细胞周期、DNA复制和基因转录途径在基因列表中过表达。分析表明,MET141主要捕获与之前的标记相同的途径。
图7. 主题流程图. 流程图描述了为基因表达分析和最终亚组分析包括的SweBCG91-RT肿瘤样品。
图8A-8C显示了所有受试者的Kaplan-Meier生存分析,转移终点。Kaplan-Meier图显示了对于15个先前公布的基因标记中的每一个,在完整SweBCG91-RT组群中达到转移的时间。
图9显示了单变量风险比的森林图、所有受试者和乳腺癌特异性的生存终点。森林图描绘了对于终点乳腺癌特异性的生存,15个先前公布的基因标记中的每一个的单变量(UVA)标准化风险比(HR)。将评分除以标准差以对比具有不同范围值的评分。显示了所有受试者的结果。
图10A-10C显示了所有受试者的Kaplan-Meier生存分析,BCSS终点。Kaplan-Meier图显示了对于15个先前公布的基因标记中的每一个,在完整SweBCG91-RT组群中乳腺癌特异性的生存。
图11A-11C显示了所有受试者15个标记随时间的AUC,转移终点。在不同时间点在受试者工作特征(ROC)分析中的曲线下面积(AUC)。观察到随着时间推移大多数标志物的性能明显下降,表明它们通常更擅长预测早期复发。
图12显示了具有ER+、HER2- 癌症的绝经后且未全身治疗的受试者的单变量风险比的森林图,乳腺癌特异性的生存。森林图描绘了关于终点乳腺癌特异性的生存,15个先前公布的基因标记中的每一个的单变量(UVA)标准化风险比(HR)。将评分除以标准差以对比具有不同范围值的评分。显示了454名绝经后且未全身治疗的具有ER+、HER2- 癌症的受试者的结果。
图13A-13C显示了具有ER+、HER2- 癌症的绝经后且未全身治疗的受试者的Kaplan-Meier生存分析,乳腺癌特异性的生存。Kaplan-Meier图显示了对于15个先前公布的基因标记中的每一个,在SweBCG91-RT组群中454名未接受ER+、HER2- 癌症的全身疗法的绝经后受试者的乳腺癌特异性的生存。
图14A-14C显示了绝经后且未全身治疗的具有ER+、HER2- 癌症的受试者15个标记随时间的AUC,转移终点。在不同时间点在受试者工作特征(ROC)分析中的曲线下面积(AUC)。观察到随着时间推移大多数标记的性能明显下降,意味着它们通常更擅长预测早期复发。
图15A-15C显示了将受试者分类为低风险的一致性的对比。在对哪些受试者处于风险的最低四分位数进行分类时标记的一致性。条形图显示了被分类为具有标题标记的最低四分位数的受试者的比例,这也是彼此标记的最低四分位数。针对绝经后且未全身治疗的患有ER+、HER2- 癌症的受试者进行该分析。
具体实施方式
本发明公开了使用多个靶标的基于表达的分析来诊断、预测和/或监测受试者的乳腺癌的状态或结果的系统和方法。通常,所述方法包括(a)任选地提供来自受试者的样品;(b)测定所述样品中多个靶标的表达水平;和(c)基于所述多个靶标的表达水平,诊断、预测和/或监测乳腺癌的状态或结果。
测定样品中多个靶标的表达水平可以包括将样品应用于微阵列。在某些情况下,测定表达水平可以包括算法的应用。所述算法可用于产生分类器。可替换地,所述分类器可以包括探针选择区域。在某些情况下,测定多个靶标的表达水平包括检测和/或定量多个靶标。在某些实施方案中,测定多个靶标的表达水平包括对多个靶标测序。在某些实施方案中,测定多个靶标的表达水平包括扩增多个靶标。在某些实施方案中,测定多个靶标的表达水平包括定量多个靶标。在某些实施方案中,测定多个靶标的表达水平包括对多个靶标进行多路反应。
在本文中进一步公开了用于确定受试者是否处于低乳腺癌复发风险的方法。大体上,所述方法包括: (a)提供来自受试者的包含乳腺癌细胞的样品;(b)测定所述样品中多个靶标的表达水平;和(c)基于所述多个靶标的表达水平确定受试者是否处于低乳腺癌复发风险以及是否用辅助化学疗法和内分泌疗法治疗所述受试者。例如,被鉴定为处于低乳腺癌复发风险的受试者可以免除用辅助化学疗法和内分泌疗法治疗,而被鉴定为处于较高乳腺癌复发风险的受试者可以施用辅助化学疗法和内分泌疗法。
在更详细地描述本发明之前,应当理解,本发明不限于所描述的特定方法、组合物、物品或机器,因为这样的方法、组合物、物品或机器当然可以变化。还应该理解,本文所用术语仅用于描述特定实施方案的目的,且无意限制本发明的范围。
靶标
在某些情况下,测定多个基因的表达水平包括检测和/或定量多个靶分析物。在某些实施方案中,测定多个基因的表达水平包括对多个靶核酸测序。在某些实施方案中,测定多个生物标志物基因的表达水平包括扩增多个靶核酸。在某些实施方案中,测定多个生物标志物基因的表达水平包括对多个靶分析物进行多路反应。
本文中公开的方法经常包括测定多个靶标的表达水平。多个靶标可以包含蛋白编码基因或非蛋白编码基因的编码靶标和/或非编码靶标。蛋白编码基因结构可以包含外显子和内含子。外显子可以进一步包含编码序列(CDS)和非翻译区(UTR)。可以将蛋白编码基因转录以产生前-mRNA,且可以将前-mRNA加工以产生成熟mRNA。可以将成熟mRNA翻译以产生蛋白。
非蛋白编码基因结构可以包含外显子和内含子。通常,非蛋白编码基因的外显子区域主要含有UTR。可以将非蛋白编码基因转录以产生前-mRNA,且可以将前-mRNA加工以产生非编码RNA (ncRNA)。
编码靶标可以包含外显子的编码序列。非编码靶标可以包含外显子的UTR序列、内含子序列、基因间序列、启动子序列、非编码转录物、CDS反义、内含子反义、UTR反义或非编码转录物反义。非编码转录物可以包含非编码RNA (ncRNA)。
在某些情况下,多个靶标包含一个或多个选自表2的靶标。在某些情况下,多个靶标包含至少约2个、至少约3个、至少约4个、至少约5个、至少约6个、至少约7个、至少约8个、至少约9个、至少约10个、至少约15个、至少约20个、至少约25个、至少约30个、至少约35个、至少约40个、至少约45个或至少约50个选自表2的靶标。
在某些实施方案中,多个靶标选自:ATP结合盒亚家族F成员1 (ABCF1), 乙酰辅酶A乙酰基转移酶2 (ACAT2), 肌动蛋白样6A (ACTL6A), 载脂蛋白B mRNA编辑酶催化亚基3B(APOBEC3B), 抗沉默功能1B组蛋白伴侣蛋白(ASF1B), ATP合酶H+运输线粒体F1复合物γ多肽1 (ATP5C1), bystin样(BYSL), 染色体1开放读码框106 (C1orf106), 细胞分裂周期25B (CDC25B), 细胞分裂周期45 (CDC45), 染色质沉默和DNA复制因子1 (CDT1), CCAAT/增强子结合蛋白γ(CEBPG), 着丝粒蛋白I (CENPI), 染色质组装因子1亚基A (CHAF1A),染色质组装因子1亚基B (CHAF1B), 检验点激酶1 (CHEK1), 细胞因子诱导的细胞凋亡抑制剂1 (CIAPIN1), 细胞骨架相关蛋白2 (CKAP2), CTP合酶1 (CTPS1), DNA复制解螺旋酶/核酸酶2 (DNA2), DNA甲基转移酶1 (DNMT1), DNA甲基转移酶3β(DNMT3B), E2F转录因子8 (E2F8), 依莫帕米结合蛋白(甾醇异构酶) (EBP), 真核翻译起始因子4E结合蛋白1(EIF4EBP1), ER膜蛋白复合物亚基8 (EMC8), 具有序列相似性的家族96成员B (FAM96B),范科尼贫血互补群A (FANCA), F-盒子蛋白5 (FBXO5), 甘油醛-3-磷酸脱氢酶(GAPDH),甘氨酰-tRNA合成酶(GARS), 孪蛋白DNA复制抑制剂(GMNN), G-蛋白信号传递调节剂2(GPSM2), GTP结合蛋白4 (GTPBP4), 肝细胞瘤-衍生的生长因子(HDGF), 血液学和神经学表达的1 (HN1), 热激蛋白家族A (Hsp70)成员14 (HSPA14), 热激蛋白家族D (Hsp60)成员1 (HSPD1), 肌醇单磷酸酶2 (IMPA2), 白介素1受体相关激酶1 (IRAK1), 赖氨酰基-tRNA合成酶(KARS), 动粒相关的1 (KNTC1), LDL受体有关的蛋白8 (LRP8), 微型染色体维持复合物组分5 (MCM5), 微型染色体维持复合物组分7 (MCM7), MIS18动粒蛋白A(MIS18A), 线粒体核糖体蛋白L15 (MRPL15), 线粒体核糖体蛋白S17 (MRPS17), 线粒体转录终止因子3 (MTERF3), 核前层蛋白A识别因子(NARF), 非-SMC凝缩蛋白I复合物亚基D2 (NCAPD2), 非-SMC凝缩蛋白II复合物亚基D3 (NCAPD3), NADH:泛醌氧化还原酶亚基A9(NDUFA9), 核包膜嵌膜蛋白1 (NEMP1), NME/NM23核苷二磷酸激酶1 (NME1), NOP2核仁蛋白(NOP2), 核孔蛋白205 (NUP205), 起点识别复合物亚基1 (ORC1), 丙酮酸脱氢酶(硫辛酰胺)α1 (PDHA1), 异戊二烯基(癸异戊二烯基)二磷酸合酶亚基1 (PDSS1), 磷酸甘油酸激酶1 (PGK1), polo样激酶4 (PLK4), 嘌呤核苷磷酸化酶(PNP), DNA聚合酶α2, 辅助亚基(POLA2), 蛋白磷酸酶, Mg2+/Mn2+ 依赖性的1G (PPM1G), 过氧化氧化还原蛋白4(PRDX4), 蛋白酶体亚基β4 (PSMB4), 蛋白酶体亚基β5 (PSMB5), 蛋白酶体26S亚基, 非-ATP酶14 (PSMD14), 蛋白酶体26S亚基, 非-ATP酶2 (PSMD2), 蛋白酶体组装伴侣蛋白1(PSMG1), 磷脂酰丝氨酸合酶1 (PTDSS1), RAD51重组酶(RAD51), RAD54同系物B (酿酒酵母) (RAD54B), RAD54-样(酿酒酵母) (RAD54L), RAN结合蛋白1 (RANBP1), 小核内核糖核蛋白多肽A (SNRPA1), 小核内核糖核蛋白多肽G (SNRPG), SPC25, NDC80动粒复合物组分(SPC25), SRSF蛋白激酶1 (SRPK1), 应激诱导的磷蛋白1 (STIP1), 转化酸性含卷曲螺旋的蛋白3 (TACC3), 转录延伸因子B亚基1 (TCEB1), 跨膜蛋白97 (TMEM97), 拓扑异构酶(DNA) IIα(TOP2A), 拓扑异构酶(DNA) II结合蛋白1 (TOPBP1), 磷酸丙糖异构酶1(TPI1), 尿嘧啶DNA糖基化酶(UNG)和酪氨酸3-单加氧酶/色氨酸5-单加氧酶活化蛋白ζ(YWHAZ)。
在某些情况下,多个靶标包含编码靶标、非编码靶标或它们的任意组合。在某些情况下,编码靶标包含外显子序列。在其它情况下,非编码靶标包含非外显子或外显子序列。可替换地,非编码靶标包含UTR序列、内含子序列、反义或非编码RNA转录物。在某些情况下,非编码靶标包含与UTR序列或内含子序列部分地重叠的序列。非编码靶标还包括非外显子和/或外显子转录物。外显子序列可以包含在蛋白编码基因上的区域,诸如外显子、UTR或其部分。非外显子序列可以包含在蛋白编码、非蛋白编码基因或其部分上的区域。例如,非外显子序列可以包含内含子区域、启动子区域、基因间区域、非编码转录物、外显子反义区域、内含子反义区域、UTR反义区域、非编码转录物反义区域或其部分。在其它情况下,多个靶标包含非编码RNA转录物。
多个靶标可以包含选自本文公开的分类器的一个或多个靶标。可以从一种或多种模型或算法生成分类器。一种或多种模型或算法可以是朴素贝叶斯(Naïve Bayes,NB)、递归分割(Rpart)、随机森林(RF)、支持向量机(SVM)、k-最近邻(KNN)、高维判别分析(HDDA)线性模型或它们的组合。分类器可以具有等于或大于0.60的AUC。分类器可以具有等于或大于0.61的AUC。分类器可以具有等于或大于0.62的AUC。分类器可以具有等于或大于0.63的AUC。分类器可以具有等于或大于0.64的AUC。分类器可以具有等于或大于0.65的AUC。分类器可以具有等于或大于0.66的AUC。分类器可以具有等于或大于0.67的AUC。分类器可以具有等于或大于0.68的AUC。分类器可以具有等于或大于0.69的AUC。分类器可以具有等于或大于0.70的AUC。分类器可以具有等于或大于0.75的AUC。分类器可以具有等于或大于0.77的AUC。分类器可以具有等于或大于0.78的AUC。分类器可以具有等于或大于0.79的AUC。分类器可以具有等于或大于0.80的AUC。基于其95%置信区间(CI),AUC可以具有临床意义。分类器的准确度可以是至少约70%。分类器的准确度可以是至少约73%。分类器的准确度可以是至少约75%。分类器的准确度可以是至少约77%。分类器的准确度可以是至少约80%。分类器的准确度可以是至少约83%。分类器的准确度可以是至少约84%。分类器的准确度可以是至少约86%。分类器的准确度可以是至少约88%。分类器的准确度可以是至少约90%。分类器的p-值可以小于或等于0.05。分类器的p-值可以小于或等于0.04。分类器的p-值可以小于或等于0.03。分类器的p-值可以小于或等于0.02。分类器的p-值可以小于或等于0.01。分类器的p-值可以小于或等于0.008。分类器的p-值可以小于或等于0.006。分类器的p-值可以小于或等于0.004。分类器的p-值可以小于或等于0.002。分类器的p-值可以小于或等于0.001。
多个靶标可以包含一个或多个选自随机森林(RF)分类器的靶标。多个靶标可以包含两个或更多个选自随机森林(RF)分类器的靶标。多个靶标可以包含三个或更多个选自随机森林(RF)分类器的靶标。多个靶标可以包含2、3、4、5、6、7、8、9、10、11、12、13、14、15、20、25、30、35、40、45、50个或更多个选自随机森林(RF)分类器的靶标。RF分类器可以是RF2和RF3或RF4分类器。RF分类器可以是RF22分类器(例如,具有22个靶标的随机森林分类器)。例如,本发明的RF分类器可以包含2个或更多个选自表2的靶标。
多个靶标可以包含一个或多个选自SVM分类器的靶标。多个靶标可以包含2、3、4、5、6、7、8、9、10个或更多个选自SVM分类器的靶标。多个靶标可以包含12、13、14、15、17、20、22、25、27、30个或更多个选自SVM分类器的靶标。多个靶标可以包含32、35、37、40、43、45、47、50、53、55、57、60个或更多个选自SVM分类器的靶标。SVM分类器可以是SVM2分类器。本发明的SVM分类器可以包含2个或更多个选自表2的靶标。
多个靶标可以包含一个或多个选自KNN分类器的靶标。多个靶标可以包含2、3、4、5、6、7、8、9、10个或更多个选自KNN分类器的靶标。多个靶标可以包含12、13、14、15、17、20、22、25、27、30个或更多个选自KNN分类器的靶标。多个靶标可以包含32、35、37、40、43、45、47、50、53、55、57、60个或更多个选自KNN分类器的靶标。多个靶标可以包含65、70、75、80、85、90、95、100个或更多个选自KNN分类器的靶标。例如,本发明的KNN分类器可以包含2个或更多个选自表2的靶标。
多个靶标可以包含一个或多个选自朴素贝叶斯(NB)分类器的靶标。多个靶标可以包含2、3、4、5、6、7、8、9、10个或更多个选自NB分类器的靶标。多个靶标可以包含12、13、14、15、17、20、22、25、27、30个或更多个选自NB分类器的靶标。多个靶标可以包含32、35、37、40、43、45、47、50、53、55、57、60个或更多个选自NB分类器的靶标。多个靶标可以包含65、70、75、80、85、90、95、100个或更多个选自NB分类器的靶标。例如,本发明的NB分类器可以包含2个或更多个选自表2的靶标。
多个靶标可以包含一个或多个选自递归分割(Rpart)分类器的靶标。多个靶标可以包含2、3、4、5、6、7、8、9、10个或更多个选自Rpart分类器的靶标。多个靶标可以包含12、13、14、15、17、20、22、25、27、30个或更多个选自Rpart分类器的靶标。多个靶标可以包含32、35、37、40、43、45、47、50、53、55、57、60个或更多个选自Rpart分类器的靶标。多个靶标可以包含65、70、75、80、85、90、95、100个或更多个选自Rpart分类器的靶标。例如,本发明的Rpart分类器可以包含2个或更多个选自表2的靶标。
多个靶标可以包含一个或多个选自高维判别分析(HDDA)分类器的靶标。多个靶标可以包含两个或更多个选自高维判别分析(HDDA)分类器的靶标。多个靶标可以包含三个或更多个选自高维判别分析(HDDA)分类器的靶标。多个靶标可以包含5、6、7、8、9、10、11、12、13、14、15个或更多个选自高维判别分析(HDDA)分类器的靶标。例如,本发明的Rpart分类器可以包含2个或更多个选自表2的靶标。
探针/引物
本发明提供了用于诊断、监测和/或预测受试者的乳腺癌的状态或结果的探针集合,所述探针集合包含多个探针,其中(i)所述集合中的探针能够检测至少一种靶标的表达水平;和(ii)表达水平以至少约40%特异性确定受试者的癌症状态(例如,复发风险)。
探针集合可以包含一个或多个多核苷酸探针。各个多核苷酸探针包含来源于靶序列或其互补序列的核苷酸序列的核苷酸序列。设计多核苷酸探针的核苷酸序列,使得其对应于靶序列或与靶序列互补。多核苷酸探针可以在严谨的或降低的严谨性杂交条件下与靶序列的区域、与其互补序列或与由其衍生的核酸序列(诸如cDNA)特异性地杂交。
使用本领域已知的技术,例如,基于目标多核苷酸序列相对于基因序列数据库(诸如NCBI的人基因组序列、UniGene、dbEST或非冗余数据库)的BLASTN检索,可以在计算机环境中进行多核苷酸探针序列的选择和它们的唯一性的确定。在本发明的一个实施方案中,探针集合中的多核苷酸探针与来源于靶序列的靶mRNA的区域互补。还可以将计算机程序用于选择不可以交叉杂交或不可以非特异性地杂交的探针序列。
在某些情况下,从乳腺癌组织样品提取并扩增的RNA的微阵列杂交可产生数据集,然后通过fRMA技术对所述数据集进行概括和标准化。在除去(或过滤)交叉杂交PSR和含有少于4个探针的PSR以后,剩余的PSR可以用于进一步分析。在fRMA和过滤以后,可以将数据分解为其主组分,并使用方差分析模型来确定批次效应仍然存在于前10个主组分中的程度。
然后可将这些剩余的PSR通过CR(临床复发)和非-CR样品之间的T-检验进行过滤。使用0.01的p-值截止,可进一步细化剩余的特征(例如,PSR)。使用弹性网罚分,通过正则化逻辑回归可以实施特征选择。正则化回归可以使用所有训练数据自举(bootstrap)超过1000次;通过自举的每次迭代,可以列出三次交叉验证后具有非零系数的特征。在某些情况下,将在总运行的至少25%中选择的特征用于模型建立。
本发明的多核苷酸探针的长度范围可以是从约15个核苷酸至编码靶标或非编码靶标的全长。在本发明的一个实施方案中,多核苷酸探针是至少约15个核苷酸的长度。在另一个实施方案中,多核苷酸探针是至少约20个核苷酸的长度。在另一个实施方案中,多核苷酸探针是至少约25个核苷酸的长度。在另一个实施方案中,多核苷酸探针是约15个核苷酸至约500个核苷酸的长度。在其它实施方案中,多核苷酸探针是约15个核苷酸至约450个核苷酸、约15个核苷酸至约400个核苷酸、约15个核苷酸至约350个核苷酸、约15个核苷酸至约300个核苷酸、约15个核苷酸至约250个核苷酸、约15个核苷酸至约200个核苷酸的长度。在某些实施方案中,探针是至少15个核苷酸的长度。在某些实施方案中,探针是至少15个核苷酸的长度。在某些实施方案中,探针是至少20个核苷酸、至少25个核苷酸、至少50个核苷酸、至少75个核苷酸、至少100个核苷酸、至少125个核苷酸、至少150个核苷酸、至少200个核苷酸、至少225个核苷酸、至少250个核苷酸、至少275个核苷酸、至少300个核苷酸、至少325个核苷酸、至少350个核苷酸、至少375个核苷酸的长度。
探针集合的多核苷酸探针可以包含RNA、DNA、RNA或DNA模拟物或它们的组合,且可以是单链的或双链的。因此,多核苷酸探针可以由天然存在的核碱基、糖和共价核苷间(主链)键组成,以及由具有功能相似的非天然存在部分的多核苷酸探针组成。这样的经修饰的或取代的多核苷酸探针可以提供合乎需要的性能,例如,增强的对靶基因的亲和力和增加的稳定性。探针集合可以包含编码靶标和/或非编码靶标。优选地,探针集合包含编码靶标和非编码靶标的组合。
在某些实施方案中,探针集合包含与至少约5个编码靶标和/或非编码靶标杂交的多个靶序列。可替换地,探针集合包含与至少约10个编码靶标和/或非编码靶标杂交的多个靶序列。在某些实施方案中,探针集合包含与至少约15个编码靶标和/或非编码靶标杂交的多个靶序列。在某些实施方案中,探针集合包含与至少约20个编码靶标和/或非编码靶标杂交的多个靶序列。在某些实施方案中,探针集合包含与至少约30个编码靶标和/或非编码靶标杂交的多个靶序列。
本发明的系统进一步提供了能够扩增由探针集合定义的靶序列或其片段或子序列或互补序列的引物和引物对。可以将探针集合的核苷酸序列提供在计算机可读介质中以用于计算机环境应用,并作为用于设计适当引物的基础,所述适当引物用于扩增探针集合的一个或多个靶序列。
基于靶序列的核苷酸序列的引物可以被设计用于扩增靶序列。为了用于扩增反应诸如PCR,可以使用一对引物。引物序列的确切组成对于本发明不是至关重要的,但是对于大多数应用来说,如本领域中已知的,引物可以在严谨条件下,特别是在高严谨性条件下与探针集合的特定序列杂交。通常选择引物对以生成至少约50个核苷酸、更通常至少约100个核苷酸的扩增产物。用于选择引物序列的算法通常是已知的,并且以商业软件包的形式获得。这些引物可以用在标准的基于定量或定性PCR的测定中,以评估由探针集合定义的RNA的转录物表达水平。可替换地,这些引物可以与探针(诸如在使用实时PCR的扩增中的分子信标)组合使用。
在一个实施方案中,当用在扩增反应中时,引物或引物对特异性地扩增靶标的核酸序列的至少一部分(或其亚组,如本文中所述的)、其RNA形式、或其任一种的互补序列。
可以任选地将标记物附接至或掺入探针或引物多核苷酸以允许检测和/或定量代表目标靶序列的靶多核苷酸。靶多核苷酸可以是表达的靶序列RNA本身、其cDNA拷贝或由其衍生的扩增产物,并且可以是正链或负链,只要其可在所使用的测定中被特异性地检测到。类似地,可以标记抗体。
在某些多路形式中,用于检测不同靶标的标记物可以是可辨别的。可以将标记物直接附接(例如,经由共价键)或间接附接(例如,经由桥接分子或一系列分子(例如,可与测定组分结合的分子或复合物),或经由可被掺入测定组分中的结合对的成员,例如生物素-抗生物素蛋白或抗生蛋白链菌素)。许多标记物以可容易地用于此类缀合(例如通过胺酰化)的活化形式商购获得,或者标记物可以通过已知的或可确定的缀合方案(其中许多是本领域已知的)附接。
本文所述的在本发明中有用的标记物包括当结合至目标生物分子或掺入其中时可被检测到的任何物质。可以使用任何有效的检测方法,包括光学、光谱、电学、压电、磁性、拉曼散射、表面等离子体共振、比色测量、测热等。标记物通常选自生色团、发光团、荧光团、猝灭系统的一个成员、色原体、半抗原、抗原、磁性颗粒、呈现非线性光学的材料、半导体纳米晶体、金属纳米颗粒、酶、抗体或其结合部分或其等同物、适体和结合对的一个成员、及其组合。可以使用猝灭方案,其中可以在探针上使用猝灭剂和荧光团作为猝灭对的成员,使得在与靶标的结合引入或猝灭来自荧光团的信号后发生光学参数的变化。这样的系统的一个例子是分子信标。合适的猝灭剂/荧光团系统是本领域已知的。可以通过多种中间键结合标记物。例如,多核苷酸可以包含生物素结合物质,并且可以将光学可检测的标记物缀合至生物素,并然后结合标记的多核苷酸。类似地,多核苷酸传感器可以包含免疫学物质诸如抗体或片段,并且可以添加含有光学可检测的标记物的第二抗体。
在本文所述的方法中有用的生色团包括可以吸收能量并发射光的任何物质。对于多路测定,可以使用具有可检测的不同发射光谱的多种不同的信号传递生色团。生色团可以是发光团或荧光团。典型的荧光团包括荧光染料、半导体纳米晶体、镧系元素螯合物、多核苷酸-特异性的染料和绿色荧光蛋白。
在某些实施方案中,本发明的多核苷酸包含靶标的核酸序列或其互补序列的至少20个连续碱基。多核苷酸可以包含靶标的核酸序列的至少21、22、23、24、25、27、30、32、35、40、45、50个或更多个连续碱基。
多核苷酸可以以多种形式提供,包括作为固体、在溶液中或在阵列中。多核苷酸可以任选地包含一种或多种标记物,可以将所述标记物化学地和/或酶促地掺入多核苷酸中。
在某些实施方案中,可以在基底上提供本文中提供的一种或多种多核苷酸。基底可以包含多种材料,其可以是生物材料、非生物材料、有机材料、无机材料,或这些材料的任何组合。例如,基底可以是聚合的Langmuir Blodgett膜、官能化玻璃、Si、Ge、GaAs、GaP、SiO2、SiN4、改性硅,或多种凝胶或聚合物中的任一种,诸如(聚)四氟乙烯、(聚)偏二氟乙烯、聚苯乙烯、交联的聚苯乙烯、聚丙烯酸、聚乳酸、聚乙醇酸、聚(丙交酯共乙交酯)、聚酸酐、聚(甲基丙烯酸甲酯)、聚(乙烯-共聚-乙酸乙烯酯)、聚硅氧烷、聚合的硅胶、胶乳、葡聚糖聚合物、环氧树脂、聚碳酸酯或它们的组合。可以使用导电聚合物和光电导材料。
基底可以采取阵列、光电二极管、光电子传感器(诸如光电子半导体芯片或光电子薄膜半导体)或生物芯片的形式。探针在基底上的位置可以是可寻址的;这可以以高度密集的格式完成,并且位置可以是可微米寻址的或可纳米寻址的。
诊断样品
从需要治疗癌症的受试者收集含有乳腺癌细胞的生物样品,以基于表达水平或表达谱评价所述受试者是否处于低癌症复发风险且可以免除用辅助化学疗法和内分泌疗法治疗。用于与本发明的系统一起使用和用在本发明的方法中的诊断样品包含适合提供RNA表达信息的核酸。大体而言,从其获得表达的RNA并分析其靶基因表达的生物样品可以是疑似包含癌性乳房组织或细胞的任何材料。诊断样品可以是直接用在本发明的方法中的生物样品。可替换地,诊断样品可以是从生物样品制备的样品。
在一个实施方案中,包含或疑似包含癌性组织或细胞的样品或样品部分可以是生物材料的任何来源,包括细胞、组织或流体,包括体液。样品来源的非限制性例子包括抽吸物、针吸活组织检查、细胞学小丸(cytology pellet)、通过例如手术或尸体剖检获得的块状组织制备物或其切片、淋巴液、血液、血浆、血清、肿瘤和器官。在某些实施方案中,样品来自乳腺肿瘤活组织检查。
样品可以是存档样品,其具有已知的和记录在案的医疗结果,或者可以是来自尚不清楚其最终医疗结果的当前受试者的样品。
在某些实施方案中,可以在分子分析之前解剖样品。样品可以通过块状肿瘤样本或其部分的宏观解剖来制备,或者可以通过显微解剖来处理,例如通过激光捕获显微解剖(LCM)。
样品最初可以以多种状态提供,如新鲜组织、新鲜冷冻组织、细针抽吸物,并且可以是固定的或未固定的。经常,医学实验室常规地以固定状态制备医学样品,这有助于组织储存。多种固定剂可以用于固定组织以稳定细胞的形态,并且可单独使用或与其它试剂组合使用。示例性的固定剂包括交联剂、醇、丙酮、Bouin氏溶液、Zenker溶液、Hely溶液、锇酸溶液和Carnoy溶液。
交联固定剂可以包含适用于形成两个或更多个共价键的任何试剂,例如醛。通常用于固定的醛的来源包括甲醛、低聚甲醛、戊二醛或福尔马林。优选地,交联剂包含甲醛,其可以以其天然形式或以低聚甲醛或福尔马林的形式被包含。本领域技术人员将会理解,对于其中已使用交联固定剂的样品,可能需要特殊的预备步骤,包括例如加热步骤和蛋白水解酶-k消化;参见方法。
可以将一种或多种醇单独地或与其它固定剂组合地用于固定组织。用于固定的示例性醇包括甲醇、乙醇和异丙醇。
在医学实验室中经常使用福尔马林固定。福尔马林包含醇(通常为甲醇)和甲醛,两者均可用于固定生物样品。
无论是固定的还是未固定的,可以任选地将生物样品包埋在包埋介质中。用于组织学的示例性包埋介质包括石蜡、Tissue-Tek®V.I.P、Paramat、Paramat Extra、Paraplast、Paraplast X-tra、Paraplast Plus、Peel Away Paraffin Embedding Wax、Polyester Wax、Carbowax Polyethylene Glycol、Polyfin、Tissue Freezing MediumTFMFM、Cryo-Gef和OCT化合物(Electron Microscopy Sciences, Hatfield, PA)。如本领域已知的,在分子分析之前,可以通过任意合适的技术除去包埋材料。例如,在将样品包埋于石蜡中的情况下,通过用有机溶剂(例如二甲苯)萃取,可以除去包埋材料。试剂盒可商购获得用于从组织除去包埋介质。可以根据需要将样品或其切片进行进一步加工步骤,例如系列水合或脱水步骤。
在某些实施方案中,样品是固定的、蜡包埋的生物样品。通常,来自医学实验室的样品提供为固定的、蜡包埋的样品,最常见地作为福尔马林固定的、石蜡包埋的(FFPE)组织。
无论生物样品的来源,最终测定的靶多核苷酸都可以合成地制备(在对照序列的情况下),但通常从生物学来源纯化并进行一个或多个制备步骤。可以纯化RNA以从生物样品除去或减少一种或多种不希望的组分或将其浓缩。相反,在RNA对于特定测定而言太浓的情况下,可将其稀释。
RNA提取
可以使用任何合适的技术从生物样品提取并纯化RNA。许多技术是本领域已知的,并且几种可商购获得(例如,FormaPure核酸提取试剂盒, Agencourt Biosciences,Beverly MA, High Pure FFPE RNA Micro Kit, Roche Applied Science,Indianapolis, IN)。可以使用TRIzol (Invitrogen, Carlsbad, CA)从冷冻组织切片提取RNA,并使用RNeasy Protect试剂盒(Qiagen, Valencia, CA)纯化。可以使用DNA酶I处理(Ambion, Austin, TX)进一步纯化RNA以消除任何污染性DNA。可以使用Nanodrop ND-1000分光光度计(Nanodrop Technologies,Rockland,DE)来测定RNA浓度。可以通过冷乙酸钠沉淀进一步纯化RNA以消除干扰cDNA合成的污染物。可以通过运行电泳图谱来评价RNA完整性,并且可以使用用于Bioanalyzer 2100(Agilent Technologies,Santa Clara,CA)的RNA6000 PicoAssay来确定RNA完整性数目(RIN,指示mRNA的完整性的相关量度)。
试剂盒
还提供了用于实施期望的方法的试剂盒,且其包含用于容纳试剂盒的组分的容器或壳体,含有一种或多种核酸的一个或多个容器,以及任选地含有一种或多种试剂的一个或多个容器。试剂包括在上面物质组合物部分中描述的那些,以及可用于实施所述方法的那些试剂,包括扩增试剂,并且可以包括一种或多种探针、引物或引物对、酶(包括聚合酶和连接酶)、嵌入染料、标记的探针和可掺入扩增产物的标记物。
在某些实施方案中,试剂盒包含对本文所述的靶序列的那些子集和组合具有特异性的引物或引物对。引物或引物对适于选择性地扩增靶序列。试剂盒可以包含至少2种、3种、4种或5种适于选择性地扩增一种或多种靶标的引物或引物对。试剂盒可以包含至少5、10、15、20、30、40、50、60、70、80、90、100、110种或更多种适于选择性地扩增一种或多种靶标的引物或引物对。
在某些实施方案中,当用于扩增反应中时,试剂盒的引物或引物对特异性地扩增本文所述的非编码靶标、编码靶标、外显子或非外显子靶标、对应于选自表2的靶标的核酸序列、其RNA形式、或其任一种的互补序列。试剂盒可以包括多个这样的引物或引物对,其可以特异性地扩增相应的多个不同的本文所述的非编码靶标、编码靶标、外显子或非外显子转录物、对应于选自表2的靶标的核酸序列、其RNA形式或其互补序列。可以以试剂盒形式提供适于选择性地扩增一种或多种靶标的至少2种、3种、4种或5种引物或引物对。在某些实施方案中,试剂盒包含适合于扩增一种或多种靶标的5至50种引物或引物对。
试剂可以独立地为液体或固体形式。试剂可以提供在混合物中。可以任选地在试剂盒中提供对照样品和/或核酸。对照样品可以包括获自或代表未显示出疾病迹象的受试者的肿瘤样品的组织和/或核酸,以及获自或代表发生全身性癌症的受试者的肿瘤样品的组织和/或核酸。
核酸可以以阵列形式提供,因此在试剂盒中可以包含阵列或微阵列。试剂盒可以任选地由政府机构认证用于预测癌症受试者的疾病结果和/或用于指定治疗方式。
关于使用试剂盒实施本发明的一种或多种方法的说明书可以与容器一起提供,并且可以提供在任何固定介质中。说明书可以位于容器或壳体的内部或外部,和/或可以印刷在其任何表面的内部或外部。试剂盒可以以多路形式用于并行地检测和/或定量代表所表达的靶基因的一种或多种不同的靶多核苷酸。
扩增和杂交
在样品收集和核酸提取以后,可以对包含RNA的样品的核酸部分进行一个或多个制备反应,所述核酸部分是一种或多种目标靶多核苷酸或可以用于制备一种或多种目标靶多核苷酸。这些制备反应可以包括体外转录(IVT)、标记、片段化、扩增和其它反应。在检测、定量和/或扩增之前,可以首先用逆转录酶和引物处理mRNA以产生cDNA;这可以用纯化的mRNA在体外进行或者原位进行,例如在附着于载玻片的细胞或组织中。
“扩增”意指产生核酸的至少一个拷贝(在该情况下为表达的RNA)并且在许多情况下产生多个拷贝的任何过程。扩增产物可以是RNA或DNA,并且可以包括所表达的靶序列的互补链。DNA扩增产物最初可以通过逆向翻译产生,然后任选地从进一步扩增反应产生。扩增产物可以包含靶序列的全部或部分,并且可以任选地被标记。多种扩增方法适合使用,包括基于聚合酶的方法和基于连接的方法。示例性的扩增技术包括聚合酶链式反应方法(PCR)、脂肪酶链式反应(LCR)、基于核酶的方法、自我持续序列复制(3SR)、基于核酸序列的扩增(NASBA)、Qβ复制酶的使用、反转录、缺口平移等。
不对称的扩增反应可以用于优先将代表用于检测的靶序列的一条链扩增为靶多核苷酸。在某些情况下,扩增产物本身的存在和/或量可以用于确定给定的靶序列的表达水平。在其它情况下,扩增产物可以用于与包含传感器多核苷酸的阵列或其它基底杂交,所述传感器多核苷酸用于检测和/或定量靶序列表达。
在基于聚合酶的方法中的第一轮扩增通常形成与模板链互补的引物延伸产物。如果模板是单链RNA,则在第一次扩增中使用具有逆转录酶活性的聚合酶以将RNA反转录为DNA,并且可以实施额外的扩增循环来复制引物延伸产物。当然,用于PCR的引物必须被设计成与其相应模板中可产生可扩增区段的区域杂交;因此,每种引物必须杂交,使得其3'核苷酸与其互补模板链中的核苷酸(所述核苷酸位于用于在PCR中复制该互补模板链的引物的3'核苷酸的3'侧)配对。
可以如下扩增靶多核苷酸:使靶多核苷酸的一条或多条链与引物和具有合适活性的聚合酶接触以延伸引物并复制靶多核苷酸,从而产生全长互补多核苷酸或其较小部分。可以使用具有可复制靶多核苷酸的聚合酶活性的任何酶,包括DNA聚合酶、RNA聚合酶、逆转录酶、具有超过一种类型的聚合酶或酶活性的酶。酶可以是热不稳定的或热稳定的。还可以使用酶的混合物。示例性的酶包括:DNA聚合酶诸如DNA聚合酶I (“Pol I”)、Pol I的克列诺片段、T4、T7、Sequenase®T7、Sequenase®Version 2.0 T7、Tub、Taq、Tth、Pfic、Pfu、Tsp、 Tfl、Tli和热球菌属(Pyrococcus sp)GB-D DNA聚合酶; RNA聚合酶诸如大肠杆菌SP6、T3和T7 RNA聚合酶;和逆转录酶诸如AMV、M-MuLV、MMLV、RNA酶H MMLV (SuperScript®)、SuperScript®II、ThermoScript®、HIV-1和RAV2逆转录酶。这些酶是商购可得的。具有多种特异性的示例性聚合酶包括RAV2和Tli (外切-)聚合酶。示例性的热稳定的聚合酶包括Tub、Taq、Tth、Pfic、Pfu、Tsp、Tf1、Tli和热球菌属GB-D DNA聚合酶。
选择合适的反应条件来允许扩增靶多核苷酸,所述反应条件包括pH、缓冲液、离子强度、一种或多种盐的存在和浓度、反应物和辅因子诸如核苷酸和镁和/或其它金属离子(例如,锰)的存在和浓度、任选的共溶剂、温度、用于包含聚合酶链式反应的扩增方案的热循环谱,并且可以部分地取决于所使用的聚合酶以及样品的性质。共溶剂包括甲酰胺(通常从约2至约10%)、甘油(通常从约5至约10%)和DMSO(通常从约0.9至约10%)。可以在扩增方案中使用技术以使在扩增期间产生的假阳性或伪像最小化。这些技术包括“降落”PCR、热启动技术、嵌套引物的使用或设计PCR引物,使得在引物二聚体形成的情况下形成茎-环结构,并从而不被扩增。可以使用加速PCR的技术,例如离心PCR,其允许在样品内更大的对流,并且包括用于快速加热和冷却样品的红外加热步骤。可以进行一轮或多轮扩增。在PCR期间可以使用过量的一种引物来产生过量的一种引物延伸产物;优选地,过量产生的引物延伸产物是待检测的扩增产物。可以使用多种不同的引物来扩增样品内的不同靶多核苷酸或特定靶多核苷酸的不同区域。
可以在允许任选地标记的传感器多核苷酸在扩增循环的至少一部分期间与扩增产物杂交的条件下实施扩增反应。如本领域已知的,当以这种方式实施测定时,通过监测扩增期间的光发射或荧光,可以实现该杂交事件的实时检测。
在扩增产物用于与阵列或微阵列杂交的情况下,可用许多合适的商购可得的扩增产物。这些包括可从NuGEN, Inc. (San Carlos, CA)获得的扩增试剂盒,包括WT-OvationTm System, WT-OvationTm System v2, WT-OvationTm Pico System, WT-OvationTm FFPE Exon Module, WT-OvationTm FFPE Exon Module RiboAmp和RiboAmpPlus RNA Amplification Kits (MDS Analytical Technologies (以前的Arcturus)(Mountain View, CA), Genisphere, Inc. (Hatfield, PA),包括RampUp Plus和SenseAmp RNA Amplification试剂盒,单独地或组合地。在扩增和标记后可以将扩增的核酸进行一个或多个纯化反应,例如使用磁珠(例如,RNAC1ean磁珠,AgencourtBiosciences)。
使用实时定量多路RT-PCR平台和其它多路技术诸如GenomeLab GeXP GeneticAnalysis System (Beckman Coulter, Foster City, CA), SmartCycler®9600或GeneXpert®Systems (Cepheid, Sunnyvale, CA), ABI 7900 HT Fast Real Time PCRsystem (Applied Biosystems, Foster City, CA), LightCycler®480 System (RocheMolecular Systems, Pleasanton, CA), xMAP 100 System (Luminex, Austin, TX)Solexa Genome Analysis System (Illumina, Hayward, CA), OpenArray Real TimeqPCR (BioTrove, Woburn, MA)和BeadXpress System (Illumina, Hayward, CA),可以分析多种RNA生物标志物。
靶基因的检测和/或定量
检测和/或定量编码的靶基因的表达的任何方法原则上都可以用在本发明中。所表达的靶基因可以直接检测和/或定量,或者可以被复制和/或扩增以允许检测表达的靶基因的扩增拷贝。
用于检测和/或定量靶基因的方法可以包括RNA印迹法、测序、阵列或微阵列杂交,通过特定结构的酶切割(例如,Clariom S测定, ThermoFisher Scientific, Invader®测定, Third Wave Technologies, 例如如在美国专利号5,846,717、6,090,543、6,001,567、5,985,557和5,994,069中所描述)和扩增方法(例如RT-PCR,包括在TaqMan®测定(PEBiosystems,Foster City,Calif.,例如如在美国专利号5,962,233和5,538,848中所描述)中),并且可以是定量的或半定量的,并且可以随可用生物样品的来源、量和条件而变化。还可以使用这些方法的组合。例如,可以扩增、标记核酸并对其执行微阵列分析。用于检测和/或定量靶基因的方法可以包括使用微阵列杂交对注释基因的基因水平表达分析(例如,Clariom S测定, ThermoFisher Scientific)。
在某些情况下,可以通过测序来检测靶基因。测序方法可以包括全基因组测序或外显子组测序。也可以使用测序方法诸如Maxim-Gilbert、链终止或高通量系统。另外,合适的测序技术包括使用标记的终止子或引物和在平板或毛细管中进行的凝胶分离的经典二脱氧测序反应(Sanger方法)、通过合成(使用可逆终止的标记的核苷酸)进行的测序、焦磷酸测序、454测序、与标记的寡核苷酸探针的文库的等位基因特异性杂交、通过合成(使用与标记的克隆的文库的等位基因特异性杂交,然后实施连接)进行的测序、对在聚合步骤期间标记的核苷酸的掺入的实时监测以及SOLiD测序。
用于检测和/或定量靶基因的其它方法包括单分子测序(例如,Helicos、PacBio)、边合成边测序(例如Illumina、Ion Torrent)、边连接边测序(例如ABI SOLID)、边杂交边测序(例如,完整基因组学)、原位杂交、珠阵列技术(例如,Luminex xMAP、IlluminaBeadChips)、分支DNA技术(例如,Panomics、Genisphere)。测序方法可以使用检测核苷酸的荧光(例如,Illumina)或电子(例如,Ion Torrent、Oxford Nanopore)方法。
用于QRT-PCR分析的反转录
可以通过本领域已知的任何方法实施反转录。例如,可以使用Omniscript试剂盒(Qiagen, Valencia, CA)、Superscript III试剂盒(Invitrogen, Carlsbad, CA) (用于RT-PCR)实施反转录。可以实施靶标特异性的引发以便提高靶基因的检测灵敏度并生成靶标特异性的cDNA。
TaqMan®基因表达分析
可以使用Applied Biosystems Prism(ABI) 7900HT仪器在具有相当于1 ng总RNA的靶基因特异性cDNA的51.11倍体积中实施TaqMan®RT-PCR。
添加用于TaqMan分析的引物和探针浓度,以使用PCR循环条件(诸如95℃持续10分钟的一个循环,95℃持续20秒和60℃持续45秒的40个循环)扩增荧光扩增子。可以测定参考样品以确保试剂和过程稳定性。应测定阴性对照(例如,无模板)以监测任何外源性核酸污染。
分类阵列
本发明涵盖可以以阵列形式提供从其衍生的探针集合或探针。在本发明的上下文中,“阵列”是空间上或逻辑上组织的多核苷酸探针的集合。可以使用包含对编码靶标、非编码靶标或其组合特异性的探针的阵列。可替换地,可以使用包含对靶标的两种或更多种转录物或其衍生产物特异性的探针的阵列。理想地,阵列可以对靶基因的转录物中的5、10、15、20、25、30种或更多种是特异性的。可以单独地或与其它转录物组合地检测这些基因的表达。在某些实施方案中,使用阵列,所述阵列包含宽范围的针对乳房特异性表达产物的传感器探针以及合适的对照序列。在某些情况下,阵列可以包含Human Exon 1.0 ST Array(HuEx 1.0 ST, Affymetrix, Inc., Santa Clara, CA.)。
通常,将多核苷酸探针附着于固体基底上,并且排列成使得每一个探针的位置(在基底上)和身份都是已知的。可以将多核苷酸探针附着于能够耐受该阵列的使用所必需的试剂和条件的多种固体基底中的一种。例子包括但不限于:聚合物,诸如(聚)四氟乙烯、(聚)偏二氟乙烯、聚苯乙烯、聚碳酸酯、聚丙烯和聚苯乙烯;陶瓷;硅;二氧化硅;改性硅;(熔融的)二氧化硅、石英或玻璃;官能化的玻璃;纸,诸如滤纸;重氮化纤维素;硝酸纤维素过滤器;尼龙膜;和聚丙烯酰胺凝胶垫。透光的基底对于可以用在涉及光学检测的测定中的阵列而言是有用的。
阵列形式的例子包括膜或过滤器阵列(例如,硝酸纤维素、尼龙阵列)、平板阵列(例如,多孔(诸如24-孔、96-孔、256-孔、384-孔、864-孔或1536-孔)微量滴定板阵列)、针阵列和珠阵列(例如,在液体“浆”中)。在基底(诸如玻璃或陶瓷载玻片)上的阵列经常被称为芯片阵列或“芯片”。这样的阵列是本领域众所周知的。在本发明的一个实施方案中,癌症预后阵列是芯片。
数据分析
在某些实施方案中,可以将一种或多种模式识别方法用于分析靶基因的表达水平。模式识别方法可以包括表达水平的线性组合或表达水平的非线性组合。在某些实施方案中,将RNA转录物的表达测量结果或RNA转录物水平的组合配入线性或非线性模型或算法(例如,'表达标记'),并将其转化为可能性评分。该可能性评分指示生物样品来自可能不表现出疾病迹象、可能表现出全身性癌症或可能表现出生化复发的受试者的概率。可能性评分可以用于区分这些疾病状态。可以以机器可读格式提供模型和/或算法,并且可以用于使表达水平或表达谱与疾病状态相关联,和/或指定用于受试者或受试者类别的治疗方式。
测定多个靶基因的表达水平可以包括使用算法或分类器。使用本领域已知的技术,可以管理、分类和分析阵列数据。测定多个基因靶标的表达水平可以包括探针集合建模和数据预处理。使用Robust Multi-Array (RMA)算法或变体GC-RMA、fRMA、ProbeLogarithmic Intensity Error (PLIER)算法或变体iterPLIER,可以衍生出探针集合建模和数据预处理。可以应用方差或强度过滤器,以使用RMA算法预处理数据,例如通过除去分别具有< 10的标准差或< 100个强度单位的标准化数据范围的平均强度的靶基因。
可替换地,测定多个基因靶标的表达水平可以包括使用机器学习算法。机器学习算法可以包括监督学习算法。监督学习算法的例子可以包括平均单依赖估计器(AODE)、人工神经网络(例如,反向传播)、贝叶斯统计(例如,朴素贝叶斯分类器、贝叶斯网络、贝叶斯知识库)、基于案例的推理、决策树、归纳逻辑程序设计、高斯过程回归、数据处理分组方法(GMDII)、学习自动机、学习矢量量化、最小信息长度(决策树、决策图等)、懒惰学习、基于实例的学习最近邻算法、类比建模、可能近似正确的学习(Probably approximately correctlearning)(PAC)学习、降纹波规则、知识获取方法、符号机器学习算法、亚符号机器学习算法、支持向量机、随机森林、分类器的集成、自举汇聚(装袋)和加强。监督学习可以包括有序分类,诸如回归分析和信息模糊网络(IFN)。可替换地,监督学习方法可以包括统计分类,诸如AODE、线性分类器(例如,Fisher氏线性判别式、逻辑回归、朴素贝叶斯分类器、感知器和支持向量机)、二次分类器,k-最近邻、加强、决策树(例如,C4.5、随机森林)、贝叶斯网络和隐马尔可夫模型。
机器学习算法还可以包括无监督学习算法。无监督学习算法的例子可以包括人工神经网络、数据分簇、期望最大化算法、自组织映射、径向基函数网络、矢量量化、生成拓扑映射、信息瓶颈方法和IBSEAD。无监督学习还可以包括关联规则学习算法,诸如Apriori算法、Eclat算法和FP-生长算法。还可以使用分级聚类,诸如单链接分簇和概念分簇。可替换地,无监督学习可以包括划分分簇,诸如K-平均值算法和模糊分簇。
在某些情况下,机器学习算法包括强化学习算法。强化学习算法的例子包括但不限于时域差值学习、Q学习和学习自动机。可替换地,机器学习算法可以包括数据预处理。
优选地,机器学习算法可以包括但不限于平均单依赖估计器(AODE)、Fisher氏线性判别式、逻辑回归、感知器、多层感知器、人工神经网络、支持向量机、二次分类器、加强、决策树、C4.5、贝叶斯网络、隐马尔可夫模型、高维判别分析和高斯混合模型。机器学习算法可以包括支持向量机、朴素贝叶斯分类器、k-最近邻、高维判别分析或高斯混合模型。在某些情况下,机器学习算法包括随机森林。
亚型分型
分子亚型分型是一种将乳腺癌分类为多个遗传上不同的类别或亚型之一的方法。每个亚型对不同种类的治疗做出不同应答,且特定亚型的存在预示着,例如,化学抗性、较高或较低的复发风险、或个体预后良好或不良。在表2中列出的多个基因靶标的差异表达分析允许鉴定处于低癌症复发风险的受试者,其可以免除用辅助化学疗法和内分泌疗法治疗。在某些情况下,将本发明的分子亚型分型方法与其它生物标志物(如肿瘤等级和激素水平)组合使用,用于分析乳腺癌。例如,具有雌激素受体阳性的(ER+)、人表皮生长因子受体2阴性的(HER2-)乳腺癌且绝经后的受试者可能更有可能具有较低的复发风险。
治疗方案
诊断、预测或监测癌症的状态或结果可以包含治疗癌症或预防癌症进展。另外,诊断、预测或监测癌症的状态或结果可以包含鉴定或预测受试者处于低或高复发风险。在某些情况下,诊断、预测或监测可以包含确定治疗方案。确定治疗方案可以包含施用抗癌疗法。可替换地,确定治疗方案可以包含修改、推荐、继续或中断抗癌方案。例如,如本文中所述基于表达谱分析确定为处于低乳腺癌复发风险的受试者可以免于辅助化学疗法或内分泌疗法。在某些情况下,如果样品表达概况与已知疾病或疾病结果的表达概况一致,表达概况可以用于指定一种或多种治疗方式(例如,治疗方案、抗癌方案)。抗癌方案可以包含一种或多种抗癌疗法。抗癌疗法的例子包括激素/内分泌疗法、手术、化学疗法、辐射疗法、免疫疗法/生物疗法和光动力学疗法。
激素疗法或内分泌疗法可能涉及激素(诸如类固醇激素或激素拮抗剂)的施用,以调节某些激素的水平,从而阻止生长或诱导激素响应性的癌细胞的细胞凋亡。例如,可以用选择性雌激素受体调节剂(SERM)治疗乳腺癌,例如但不限于,他莫昔芬、雷洛昔芬、托瑞米芬和氟维司群。可替代地或另外,激素合成抑制剂诸如芳香酶抑制剂(包括但不限于,来曲唑、阿那曲唑、依西美坦和氨鲁米特)可以用于治疗乳腺癌。在某些情况下,使用黄体酮(例如但不限于,醋酸甲地孕酮和醋酸甲羟孕酮)的激素补充可以用于治疗激素响应性的晚期乳腺癌。具体地,可以用雌激素受体拮抗剂(例如他莫昔芬)或阻断雌激素产生的药物诸如芳香酶抑制剂(例如阿那曲唑或来曲唑)治疗ER+ 乳腺癌。激素疗法还可以包括内分泌器官的手术除去(例如,睾丸切除术或卵巢切除术)。
肿瘤外科治疗使用手术方法来诊断、分期和治疗癌症,并解除某些癌症相关症状。手术可以用于除去肿瘤(例如,割除、切除、瘤体减小手术),重建身体的一部分(例如,恢复性手术),和/或解除症状诸如疼痛(例如,姑息性手术)。手术还可以包括冷冻手术。冷冻手术(也称为冷冻疗法)可以使用由液氮(或氩气)产生的极端寒冷来破坏异常组织。冷冻手术可以用于治疗外部肿瘤,诸如皮肤上的那些。对于外部肿瘤,可以用棉签或喷雾装置将液氮直接施用于癌细胞。冷冻手术也可以用于治疗体内肿瘤(内部肿瘤和骨内肿瘤)。对于内部肿瘤,液氮或氩气可以通过称为冷冻探针的中空器械循环,所述冷冻探针放置成与肿瘤接触。超声或MRI可以用于引导冷冻探针并监测细胞的冷冻,从而限制对附近健康组织的损伤。在探针周围可形成一团冰晶,从而冻结附近的细胞。有时使用超过一个探针将液氮递送至肿瘤的各个部位。可以在手术期间或穿过皮肤(经皮)将探针放入肿瘤中。冷冻手术后,将冷冻组织解冻并且可以被身体自然吸收(对于内部肿瘤),或者可以溶解并形成痂(对于外部肿瘤)。
化学治疗剂也可以用于治疗癌症。化学治疗剂的例子包括:烷化剂、抗代谢药、植物生物碱和萜类化合物、长春花生物碱、鬼臼毒素、紫杉烷、拓扑异构酶抑制剂和细胞毒性的抗生素。顺铂、卡铂和奥沙利铂是烷化剂的例子。其它烷化剂包括氮芥、环磷酰胺、苯丁酸氮芥、异环磷酰胺。烷化剂可以通过与生物学重要分子中的氨基、羧基、巯基和磷酸酯基团形成共价键而损害细胞功能。可替换地,碱化剂可以化学修饰细胞的DNA。
抗代谢药是化学治疗剂的另一个例子。抗代谢药可冒充为嘌呤或嘧啶,并且可阻止嘌呤和嘧啶在(细胞周期的)“S”期中掺入到DNA中,从而停止正常发育和分裂。抗代谢药也可影响RNA合成。代谢物的例子包括硫唑嘌呤和巯基嘌呤。
生物碱可以来源于植物,并且阻断细胞分裂,也可以用于治疗癌症。生物碱可以阻止微管功能。生物碱的例子是长春花生物碱和紫杉烷。长春花生物碱可以结合微管蛋白上的特定位点并抑制微管蛋白装配成微管(细胞周期的M期)。长春花生物碱可以来源于马达加斯加小长春花,长春花(Catharanthus roseus)(以前称为玫瑰红长春花(Vinca rosea))。长春花生物碱的例子包括但不限于长春新碱、长春碱、长春瑞滨或长春地辛。紫杉烷是由紫杉属(Taxus)植物(紫杉)产生的二萜。紫杉烷可以来源于天然来源或人工合成。紫杉烷包括紫杉醇(泰素)和多西他赛(泰索帝)。紫杉烷可以破坏微管功能。微管对细胞分裂是必不可少的,并且紫杉烷可以稳定化微管中与GDP结合的微管蛋白,从而抑制细胞分裂过程。因而,大体而言,紫杉烷可能是有丝分裂的抑制剂。紫杉烷也可以放射致敏并且经常含有众多手性中心。
替代性化学治疗剂包括鬼臼毒素。鬼臼毒素是一种植物衍生的化合物,其可有助于消化,并可以用于生产细胞生长抑制性药物,诸如依托泊苷和替尼泊苷。它们可以阻止细胞进入G1期(DNA复制的起始)和DNA复制(S期)。
拓扑异构酶是维持DNA的拓扑结构的必需酶。对I型或II型拓扑异构酶的抑制可以通过扰乱适当的DNA超螺旋来干扰DNA的转录和复制。一些化学治疗剂可以抑制拓扑异构酶。例如,一些I型拓扑异构酶抑制剂包括喜树碱:伊立替康和托泊替康。II型抑制剂的例子包括安吖啶、依托泊苷、磷酸依托泊苷和替尼泊苷。
化学治疗剂的另一个例子是细胞毒性的抗生素。细胞毒性的抗生素是一组用于治疗癌症的抗生素,因为它们可干扰DNA复制和/或蛋白合成。细胞毒性的抗生素包括但不限于:放线菌素、蒽环类抗生素、多柔比星、柔红霉素、戊柔比星、伊达比星、表柔比星、博来霉素、普卡霉素和丝裂霉素。
在某些情况下,抗癌治疗可以包含辐射疗法。辐射可以来自身体外部的机器(外部线束辐射疗法)或来自放置在癌细胞附近的体内的放射性物质(内部辐射疗法,更常见地称为近距离放射疗法))。全身辐射疗法使用放射性物质,通过口施用或施用进静脉,其在血液中输送至全身组织。
外部线束辐射疗法可以以光子束(x-射线或γ射线)的形式递送。光子是光和其它形式的电磁辐射的基本单位。外部线束辐射疗法的一个例子被称为三维适形辐射疗法(3D-CRT)。3D-CRT可以使用计算机软件和高级处理机器来将辐射递送至非常精确成形的靶区域。目前正在测试许多其它的外部线束辐射疗法的方法,并将其用于癌症治疗。这些方法包括但不限于强度调制辐射疗法(IMRT)、图像引导的辐射疗法(IGRT)、立体定位放射手术(SRS)、立体定位身体辐射疗法(SBRT)和质子疗法。
强度调制辐射疗法(IMRT)是外部线束辐射的一个例子,并且可以使用数百个称为准直器的小型辐射束成形装置来递送单次剂量的辐射。准直器可以是固定的或在治疗期间可以移动,从而允许在治疗期间改变辐射束的强度。该类型的剂量调节允许肿瘤或附近组织的不同区域接受不同剂量的辐射。逆向计划IMRT(称为逆向治疗计划)。在逆向治疗计划中,预先计划了针对肿瘤和周围组织的不同区域的辐射剂量,然后高性能计算机程序计算辐射治疗的所需光束数量和角度。相反地,在传统(正向)治疗计划中,预先选择辐射束的数量和角度,并且计算机计算从每个计划束可以递送多少剂量。IMRT的目标是向需要它的区域增加辐射剂量,并减少向周围正常组织的特定敏感区域的辐射暴露。
外部线束辐射的另一个例子是图像引导的辐射疗法(IGRT)。在IGRT中,可以在治疗期间实施重复的成像扫描(CT、MRI或PET)。这些成像扫描可以由计算机处理以鉴定由治疗引起的肿瘤尺寸和位置的变化,并且允许在治疗期间根据需要调节受试者的位置或计划的辐射剂量。重复成像可以增加辐射治疗的精确度,并且可以允许减少待治疗的组织的计划体积,从而减少对正常组织的总辐射剂量。
螺旋断层放疗是图像引导的IMRT的一类。螺旋断层放疗机器是CT成像扫描仪和外部线束辐射疗法机器之间的杂合体。为成像和治疗递送辐射的螺旋断层放疗机器的部分可以以与正常CT扫描仪相同的方式在受试者周围完全旋转。螺旋断层放疗机器可以在即将进入治疗期间之前捕获受试者肿瘤的CT图像,以允许非常精确的肿瘤靶向并且不影响正常组织。
立体定位放射手术(SRS)可以向小肿瘤递送一个或多个高剂量的辐射。SRS使用极其准确的图像引导的肿瘤靶向和受试者定位。因此,可以施用高剂量的辐射,而不会对正常组织造成过度损伤。SRS可以用于治疗边缘清晰的小肿瘤。其最常用于治疗脑或脊髓肿瘤以及来自其它癌症类型的脑转移灶。为了治疗一些脑转移灶,除了SRS以外,受试者还可接受对整个脑的辐射疗法(称为全脑辐射疗法)。SRS需要使用头固定架或其它装置在治疗期间固定受试者,以确保高剂量的辐射被准确递送。
立体定位身体辐射疗法(SBRT)在大多数情况下使用比3D-CRT更小的辐射场和更高的剂量在较少的期间中递送辐射疗法。SBRT可以治疗存在于脑和脊髓外的肿瘤。由于这些肿瘤更可能随着身体的正常运动而移动,因此不可像在脑或脊柱中的肿瘤那样准确地靶向,SBRT通常在超过一个剂量中施用。SBRT可以用于治疗小的孤立肿瘤,包括在肺和肝中的癌症。SBRT系统可能以其商标名称知名,诸如CyberKnife®。
在质子疗法中,可以通过质子递送外部线束辐射疗法。质子是一类带电粒子。质子束与光子束的差别主要在于它们在活组织中存储能量的方式。尽管光子将能量存储在全部沿着它们穿过组织的路径的小袋中,但质子将其大部分能量存储在其路径的末端(称为Bragg峰),并且沿路径存储较少的能量。质子的使用可以减少正常组织向辐射的暴露,可能允许将较高剂量的辐射递送至肿瘤。
其它带电粒子束诸如电子束可以用于照射浅表肿瘤,诸如皮肤癌或在身体表面附近的肿瘤,但是它们不可穿过组织行进很远。
内部辐射疗法(近距离放射疗法)是从放置在身体内部或表面上的辐射源(放射性物质)递送的辐射。几种近距离放射疗法技术用于癌症治疗中。间质性近距离放射疗法可以使用放置在肿瘤组织内(诸如在乳腺肿瘤内)的辐射源。腔内近距离放射疗法可以使用放置在手术腔或肿瘤附近的体腔(诸如胸腔)内的辐射源。可用于治疗眼内黑素瘤的巩膜上近距离放射疗法可以使用附着于眼睛的辐射源。在近距离放射疗法中,可以将放射性同位素密封在微小颗粒或“种子”中。使用递送装置诸如针、导管或某些其它类型的载体,可以将这些种子置于受试者体内。随着同位素自然衰变,它们会发出可损伤附近癌细胞的辐射。近距离放射疗法可能能够向一些癌症递送比外部线束辐射疗法更高剂量的辐射,而对正常组织造成更小的损伤。
近距离放射疗法可以作为低剂量率或高剂量率治疗来施用。在低剂量率治疗中,癌细胞在数天的阶段内从辐射源接受连续的低剂量辐射。在高剂量率治疗中,附着至置于体内的递送管的机器人机器可以引导一个或多个辐射源进入或靠近肿瘤,然后在每个治疗期间结束时移除辐射源。可以在一个或多个治疗期间中施用高剂量率治疗。高剂量率治疗的一个例子是MammoSite®系统。近距离放射疗法可以用于治疗已经历保乳手术的具有乳腺癌的受试者。
近距离放射疗法源的放置可以是暂时的或永久的。对于永久性近距离放射疗法,辐射源可以通过手术密封在体内并留在那里,即使在已发出所有的辐射以后。在某些情况下,剩余物(放射性同位素被密封在其中)不会对受试者造成任何不适或伤害。永久性近距离放射疗法是一类低剂量率近距离放射疗法。对于暂时性近距离放射疗法,使用管(导管)或其它载体来递送辐射源,并且在治疗后移除载体和辐射源。暂时性近距离放射疗法可以是低剂量率或高剂量率治疗。近距离放射疗法可以单独使用,或者与外部线束辐射疗法联合使用以向肿瘤提供辐射的“增强”,而不影响周围正常组织。
在全身性辐射疗法中,受试者可以吞咽放射性物质(诸如放射性碘或与单克隆抗体结合的放射性物质)或接受所述放射性物质的注射。放射性碘(131I)是一类通常用于帮助治疗癌症(诸如甲状腺癌)的全身辐射疗法。甲状腺细胞自然摄入放射性碘。对于用于某些其它类型癌症的全身辐射疗法,单克隆抗体可以帮助将放射性物质靶向正确的位置。与放射性物质结合的抗体通过血液移动,定位并杀死肿瘤细胞。例如,药物替伊莫单抗(泽娃灵®)可以用于治疗某些类型的B-细胞非霍奇金淋巴瘤(NHL)。该药物的抗体部分识别并结合在B淋巴细胞的表面上发现的蛋白。托西莫单抗和碘I131托西莫单抗(Bexxar®)的组合药物方案可以用于治疗某些类型的癌症,诸如NHL。在该方案中,可以首先给受试者施用非放射性的托西莫单抗抗体,然后用附接了131I的托西莫单抗抗体治疗。托西莫单抗可以与替伊莫单抗一样识别并结合B淋巴细胞上的蛋白。该抗体的非放射性形式可以帮助保护正常B淋巴细胞免于来自131I的辐射损伤。
一些全身性辐射疗法药物会解除已经扩散至骨的癌症(骨转移灶)引起的疼痛。这是一类姑息辐射疗法。放射性药物来昔屈南钐-153 (Quadramet®)和氯化锶-89(Metastron®)是可以用于治疗骨转移引起的疼痛的放射性药物的例子。
生物疗法(有时称为免疫疗法、生物疗法、生物学疗法或生物应答调节剂(BRM)疗法)直接地或间接地利用身体的免疫系统对抗癌症或减轻可能由一些癌症治疗引起的副作用。生物疗法包括干扰素、白介素、集落刺激因子、单克隆抗体、疫苗、基因疗法和非特异性的免疫调节剂。
干扰素(IFN)是天然存在于体内的细胞因子的类型。干扰素α、干扰素β和干扰素γ是可以用于癌症治疗中的干扰素的例子。
与干扰素一样,白介素(IL)是在体内天然存在并且可以在实验室中制备的细胞因子。许多白介素已被鉴定用于治疗癌症。例如,可以将白介素-2 (IL-2或阿地白介素)、白介素7和白介素12用作抗癌治疗。IL-2可以刺激许多免疫细胞(诸如淋巴细胞)的生长和活性,所述免疫细胞可破坏癌细胞。白介素可以用于治疗许多癌症,包括白血病、淋巴瘤和脑癌、结肠直肠癌、卵巢癌、乳腺癌、肾癌和前列腺癌。
集落刺激因子(CSF)(有时称为造血生长因子)也可以用于治疗癌症。CSF的一些例子包括但不限于G-CSF (非格司亭)和GM-CSF (沙格司亭)。CSF可以促进骨髓干细胞的分裂及其发育成白血细胞、血小板和红血细胞。骨髓对身体的免疫系统是至关重要的,因为它是所有血细胞的来源。因为抗癌药物可以损伤身体的制造白血细胞、红血细胞和血小板的能力,所以CSF对免疫系统的刺激可能有益于正在经历其它抗癌治疗的受试者,因此可以将CSF与其它抗癌疗法(诸如化学疗法)组合。CSF可以用于治疗多种癌症,包括淋巴瘤、白血病、多发性骨髓瘤、黑素瘤以及脑、肺、食管、乳房、子宫、卵巢、前列腺、肾、结肠和直肠的癌症。
另一类生物疗法包括单克隆抗体(MOAB或MoAB)。这些抗体可以由单一类型的细胞产生,并且对特定抗原可以具有特异性。为了产生MOAB,可将人癌细胞注射进小鼠中。作为应答,小鼠免疫系统可产生针对这些癌细胞的抗体。可以将产生抗体的小鼠浆细胞分离并与在实验室中生长的细胞融合,以产生称为杂交瘤的“杂交”细胞。杂交瘤可以无限地产生大量的这些纯抗体或MOAB。MOAB可以以多种方式用于癌症治疗中。例如,与特定类型的癌症反应的MOAB可以增强受试者对癌症的免疫应答。MOAB可以被编程来对抗细胞生长因子,从而干扰癌细胞的生长。
可以将MOAB与其它抗癌疗法诸如化疗剂、放射性同位素(放射性物质)、其它生物疗法或其它毒素结合。当抗体闩锁在癌细胞上时,它们将这些抗癌疗法直接递送至肿瘤,从而帮助破坏它。也证实了携带放射性同位素的MOAB在诊断某些癌症(诸如结直肠癌、卵巢癌、前列腺癌和乳腺癌)方面是有用的。
Rituxan®(利妥昔单抗)和赫赛汀®(曲妥珠单抗)是可用作生物疗法的MOAB的例子。Rituxan可以用于治疗非霍奇金淋巴瘤。赫赛汀可以用于治疗具有肿瘤的受试者中的转移性乳腺癌,所述肿瘤产生过量的称为HER2的蛋白。可替换地,MOAB可以用于治疗淋巴瘤、白血病、黑素瘤以及脑、乳房、肺、肾、结肠、直肠、卵巢、前列腺和其它区域的癌症。
癌症疫苗是生物疗法的另一种形式。癌症疫苗可被设计成激励受试者的免疫系统识别癌细胞。癌症疫苗可被设计成治疗现有癌症(治疗性疫苗)或预防癌症的发展(预防性疫苗)。在诊断出癌症以后,可以将治疗性疫苗注射进人体内。这些疫苗可以阻止现有肿瘤的生长,预防癌症复发,或者消除未被先前治疗所杀死的癌细胞。当肿瘤很小时施用的癌症疫苗可能能够根除癌症。另一方面,在癌症发生之前将预防性疫苗施用给健康个体。这些疫苗被设计成刺激免疫系统以攻击可导致癌症的病毒。通过靶向这些致癌性病毒,可以预防某些癌症的发生。例如,cervarix和gardasil是治疗人乳头瘤病毒的疫苗,并且可以预防宫颈癌。治疗性疫苗可以用于治疗黑素瘤、淋巴瘤、白血病以及脑、乳房、肺、肾、卵巢、前列腺、胰腺、结肠和直肠的癌症。可以将癌症疫苗与其它抗癌疗法联合使用。
基因疗法是生物疗法的另一个例子。基因疗法可能涉及将遗传物质引入人细胞中以对抗疾病。基因治疗方法可以改善受试者对癌症的免疫应答。例如,可以将基因插入免疫细胞中以增强其识别和攻击癌细胞的能力。在另一个方案中,可以给癌细胞注射造成癌细胞产生细胞因子并刺激免疫系统的基因。
在某些情况下,生物疗法包括非特异性的免疫调节剂。非特异性的免疫调节剂是刺激或间接增强免疫系统的物质。经常,这些药剂靶向关键的免疫系统细胞,并且可能造成继发应答,诸如增加的细胞因子和免疫球蛋白的产生。用于癌症治疗中的两种非特异性的免疫调节剂是卡介苗(BCG)和左旋咪唑。BCG可以用于治疗手术后浅表性膀胱癌。BCG可以通过刺激炎症性应答和可能的免疫应答而起作用。可以将BCG的溶液滴注至膀胱中。有时将左旋咪唑与氟尿嘧啶(5-FU)化学疗法一起用于治疗手术后III期(Dukes' C)结肠癌。左旋咪唑可以起作用以恢复被抑制的免疫功能。
光动力学疗法(PDT)是可以使用称为光敏剂或光增敏剂的药物和特定类型的光的抗癌治疗。当将光敏剂暴露于特定波长的光时,它们可以产生杀死附近细胞的氧的形式。光敏剂可以被特定波长的光激活。该波长决定了光可进入身体的距离。因此,可以使用光敏剂和光的波长来用PDT治疗身体的不同区域。
在用于癌症治疗的PDT的第一步中,可将光增敏剂注射进血流中。该药剂可能被全身的细胞吸收,但其在癌细胞中滞留的时间可以比其在正常细胞中滞留的时间更长。在注射后大约24-72小时,当大多数药剂已经离开正常细胞但仍留在癌细胞中时,可以将肿瘤暴露于光。肿瘤中的光敏剂可以吸收光并产生破坏附近癌细胞的氧的活性形式。除了直接杀死癌细胞外,PDT还可以通过两种其它方式缩小或破坏肿瘤。光敏剂可以损伤肿瘤中的血管,从而阻止癌症接收必需的营养物。PDT也可能激活免疫系统以攻击肿瘤细胞。
用于PDT的光可以来自激光或其它来源。可以通过纤维光缆(传输光的细纤维)引导激光以将光递送至身体内部的区域。例如,可以将纤维光缆通过内窥镜(一种用于观察体内组织的细光调制管)插入肺或食管以治疗这些器官中的癌症。其它光源包括发光二极管(LED),其可以用于表面肿瘤,诸如皮肤癌。通常将PDT作为受试者外部程序来实施。也可以重复PDT,并可以与其它疗法(诸如手术、辐射或化学疗法)一起使用。
体外光分离置换法(ECP)是PDT的一类,其中可以使用机器来收集受试者的血细胞。可以用光增敏剂在体外处理受试者的血细胞,将其暴露于光,然后返回至受试者。ECP可以用于帮助减轻对其它疗法无应答的皮肤T-细胞淋巴瘤的皮肤症状的严重程度。ECP可以用于治疗其它血液癌症,并且也可以帮助减少移植后的排斥。
另外,光增敏剂(诸如卟吩姆钠或Photofrin®)可以用于PDT中以治疗或解除食管癌和非小细胞肺癌的症状。当癌症阻塞食管时,或当单独的激光疗法不能令人满意地治疗癌症时,卟吩姆钠可以解除食管癌的症状。卟吩姆钠可以用于治疗常规治疗对它不适宜的受试者中的非小细胞肺癌,和解除具有阻塞气道的非小细胞肺癌的受试者的症状。卟吩姆钠也可以用于治疗具有巴雷特食管(一种可导致食管癌的病症)的受试者中的癌前病变。
激光疗法可以使用高强度光来治疗癌症和其它疾病。激光可以用于缩小或破坏肿瘤或癌前生长。激光最常用于治疗浅表性癌症(在身体表面或内脏器官衬里上的癌症),诸如基底细胞皮肤癌和某些癌症(诸如宫颈癌、阴茎癌、阴道癌、外阴癌和非小细胞肺癌)的极早期阶段。
激光还可以用于解除癌症的某些症状,诸如出血或阻塞。例如,激光可以用于缩小或破坏阻塞受试者的气道(气管)或食管的肿瘤。激光还可以用于除去阻塞结肠或胃的结肠息肉或肿瘤。
激光疗法经常通过柔性内窥镜(一种用于观察体内组织的细光调制管)来施用。内窥镜配有光纤(传输光的细纤维)。将它通过身体中的开口(诸如口、鼻、肛门或阴道)插入。然后将激光精确地瞄准以切开或破坏肿瘤。
激光诱导的间质性温热疗法(LITT)或间质性激光光凝固术也使用激光来治疗一些癌症。LITT与被称为过热的癌症治疗类似,其使用热以通过破坏或杀死癌细胞来缩小肿瘤。在LITT期间,将光纤插入肿瘤。在纤维尖端处的激光升高肿瘤细胞的温度并损伤或破坏它们。LITT有时用于缩小肝脏中的肿瘤。
激光疗法可以单独使用,但是最常见地将它与其它治疗(诸如手术、化学疗法或辐射疗法)组合。另外,激光可以封闭神经末梢以减轻手术后的疼痛,并封闭淋巴管以减少肿胀并限制肿瘤细胞的扩散。
用于治疗癌症的激光可以包括二氧化碳(CO2)激光、氩激光和钕:钇-铝-石榴石(Nd:YAG)激光。这些中的每一种都可以收缩或破坏肿瘤,并可以与内窥镜一起使用。CO2和氩激光可以切割皮肤的表面而不会进入更深层。因此,它们可以用于除去浅表性癌症,诸如皮肤癌。相反地,Nd:YAG激光更常见地通过内窥镜来施用以治疗内脏器官,诸如子宫、食管和结肠。Nd:YAG激光也可以在LITT期间通过光纤行进到身体的特定区域中。氩激光经常用于激活在PDT中使用的药物。
对于具有全身性疾病的受试者,可以指定额外的治疗方式诸如辅助化学疗法(例如,多西他赛、米托蒽醌和泼尼松)和全身性辐射疗法(例如,钐或锶)。可能立即用辐射疗法治疗这样的受试者以便消除推测的微转移性疾病,所述疾病不可在临床上检测到,但可通过靶基因表达标记来揭示。也可以更密切地监测这样的受试者的疾病进展的征象。
对于不具有全身性疾病的受试者,可以施用局部辅助辐射疗法或化学疗法(例如,局限于乳房组织)。对于没有疾病证据(NED)的受试者,如本文所述的表达谱分析和/或风险评分的计算可以用于确定乳腺癌的复发风险。对于使用本文所述的方法被鉴定为具有低乳腺癌复发风险的受试者,他们的医师不太可能推荐辅助化学疗法和内分泌疗法,以便避免治疗相关的副作用诸如代谢综合征(例如,高血压、糖尿病和/或体重增加)、骨质疏松症、直肠炎、失禁或阳痿。可以给具有与NED一致的样品的受试者指定警惕等待或不治疗。
可以对靶基因分组,使得关于组中的靶基因集合获得的信息可以用于做出或辅助做出临床上有关的判断,诸如诊断、预后或治疗选择。
还提供了受试者报告,其包含来自受试者的生物样品中的多个靶基因的测量的表达水平的表示,其中所述表示包括对应于靶基因中的任何1个、2个、3个、4个、5个、6个、8个、10个、20个、30个或更多个、本文描述的子集或它们的组合的靶基因的表达水平。在某些实施方案中,测量的表达水平的表示可以采取目标靶基因的表达水平的线性或非线性组合的形式。受试者报告可以以机器(例如,计算机)可读格式和/或以硬(纸)副本提供。该报告还可以包括来自一组或多组具有已知疾病状态和/或结果的受试者的多个靶基因的表达水平的标准测量结果。该报告可以用于向受试者和/或治疗医师告知所表达的靶基因的表达水平、可能的医学诊断和/或含义,并且任选地可以为受试者推荐治疗方式。
还提供了可用于治疗、诊断、预后和以其它方式评估疾病的基因表达谱的表示。在某些实施方案中,这些谱表示被还原至可由机器自动读出的介质诸如计算机可读介质(磁性的、光学的等)。所述物品还可以包括用于评估这样的介质中的基因表达谱的指令。例如,所述物品可以包含可读存储形式,其具有用于对比上述基因的集合(portfolios)的基因表达谱的计算机指令。所述物品还可以具有以数字方式记录在其中的基因表达谱,使得它们可以与来自受试者样品的基因表达数据进行对比。可替换地,可以以不同的表示形式记录所述谱。图形记录是一种这样的格式。分簇算法可以辅助这样的数据的可视化。
实施例
实施例1:综合转录组谱分析鉴定可能免于辅助性全身疗法的乳腺癌受试者。
简介
在该研究中,我们旨在更好地对早期乳腺癌患者进行分级。可以影响基因表达标记的按风险对受试者成功分级的能力的因素包括:缺乏对大型明确定义的受试者组群的长期随访,缺乏没有任何全身治疗的受试者组群,以及针对使用其它表达标记获得的结果对比结果的有限能力。因此,本研究旨在通过全面分析来自SweBCG 91-RT试验的765名早期乳腺癌受试者的转录组来解决这些问题,其中703名在辅助设定中未经全身治疗(Sjostrom M等人. J Clin Oncol 35:3222-3229, 2017)。计算并评估先前为ER+受试者开发的15种不同的基因表达标记。在鉴定可能免于辅助化学疗法和内分泌疗法的低风险受试者组时,对比了这些标记的性能和不一致性。为了缓解不一致标记的问题,将标记组合成平均基因组风险(AGR)。最后,开发了一种相关的新的141-基因标记,它以更少的基因和相似的性能捕获相同的生物学。
结果
组群的特征
对SweBCG 91-RT组群的765个受试者的转录组进行了分析(图5)。临床特征详见表1。该组群富含ER+和HER2- (83%)肿瘤,且92%的受试者未接受辅助内分泌疗法或化学疗法。在整个组群中,84%的受试者在15年中没有发生转移事件。
关于转移的预后潜力和BCSS,计算和评估来自15个先前公布的基因表达标记的风险评分。对于转移终点,来自先前公布的标记的15个计算评分中的13个是统计上显著的(FDR < 0.05) (图1A和图6),对于BCSS具有类似的结果(图7A-7B),且大多数连续风险评分彼此高度相关(图1B)。尽管标记具有高度相关性,但个体受试者的标记之间存在相当大的分歧(图1C)。当将风险评分与亚型和组织学分级对比时,3级和三阴性和HER2-亚型具有与1-2级和luminal亚型相比更高的风险(图1C)。并且,根据大多数连续风险评分,发生早期复发的受试者往往被归类为较高风险(图1C),并且标记在鉴定早期复发方面更好,如所有预后标记关于早期复发(5-年)的AUC高于晚期复发(15-年)所证实的(图8)。
为了进一步评价用于鉴定低风险受试者的15种标记的一致性,我们计算了低风险分类一致性,其量化这样的受试者的平均比例:所述受试者被一种标记被分类为风险的最低四分位数,也被其它标记分类为风险的最低四分位数。平均分类一致性范围从28%到53%(图1D)。
表1. 受试者特征
Figure DEST_PATH_IMAGE001
在免除全身辅助治疗的潜在候选人中,来自15种先前公布的标记的计算评分的性能
为了关注可能成为免除全身辅助治疗的临床候选人的受试者,我们选择了绝经后且未接受任何全身辅助治疗的具有ER+、HER2- 肿瘤的受试者(N=454,占分析组群的59%)。在该低风险亚组中,86%的受试者在15年内没有发生转移。15种标记中的10种与转移显著相关(FDR<0.05),标尺化的风险比(HR)为1.4-2.1 (图2A-2B),并且同一组标记也可预测BCSS(图9A-9B)。由于晚期复发的风险是乳腺癌受试者的主要关注点,我们通过计算不同时间点的AUC来分析不同标记的表现。对于大多数标记,预后能力随时间下降(图10),在5、10和15年的平均AUC分别为0.73、0.66和0.60。标记之间的平均低风险分类一致性从27%到51%不等(图11)。
平均基因组风险
为了提高预测的稳定性,我们将平均基因组风险(AGR)计算为15种标记评分的平均值。AGR的预后性能与最具预后意义的个体基因组标记一致(HR=1.7 [1.4-2.1],对于在低风险组群中的转移,p<0.001)。此外,AGR在ER+、HER2-、绝经后且未全身治疗的亚组中鉴定了非常低风险的受试者群体,因为具有AGR评分的最低四分位数的受试者(N=114,亚组的25%)在前10年内没有远端转移事件,并且在15年内没有转移的受试者的比例为94%(95%CI89-100%) (图3A)。
标记对比和有关的141-基因标记
由于许多标记与达到转移的时间显著相关,所以我们旨在鉴定标记之间的相似性。我们对标记之间共享的基因进行了评估,发现一个标记(MGI标记,由五个基因组成)中高达100%的基因可以在另一个标记中找到(表3)。当从该分析中删除Toronto 2017标记时,因为它已经使用来自本工作中包含的许多标记的基因列表以及MGI标记(其具有小基因总数)衍生出,我们发现在一个标记中至多69%的基因是与其它标记共有的。当单独对先前公布的标记进行富集分析时,我们发现细胞周期和代谢途径在这些标记基因列表中是显著且高度富集的(FDR<0.05,表4)。鉴于标记之间基因列表组成的相似性,我们研究了与这些先前公布的标记没有大量共享基因的标记在该数据集中是否仍然具有预测性。为此目的,我们通过鉴定与AGR高度相关的基因但排除与先前标记重叠的基因,在五个公众可得到的组群中得出了一个标记。这导致具有与AGR相似性能的141-基因标记(MET141,表2):对于亚组中最低风险四分位数,94%(95%CI 88-100%)在15年中没有转移(图3B)。AGR和MET141基因列表的基因网络分析表明,两者都富含相似的基因集合,重点是细胞周期控制、DNA复制、转录和细胞外基质组构(图4A-4B)。
讨论
使用综合转录组谱分析评价15种先前描述的预后乳腺癌标记在SweBCG 91-RT中的预后性能,SweBCG 91-RT是长期随访的未全身治疗的受试者的独特组群。这些结果表明,尽管大多数标记在组水平上表现良好,但在个体受试者水平上存在相当大的不一致。为此目的,我们开发了平均基因组风险(AGR)的概念和相关的新的141-基因标记(MET141)。AGR和MET141都可以鉴定绝经后且未全身治疗的具有ER+、HER2- 癌症的预后良好的受试者,并且其可能是免除全身疗法(包括内分泌疗法)的候选人。此外,与需要从15种不同标记计算和总结风险的AGR不同,MET141标记将类似的信息提炼成单个标记。
最近的EBCTCG后设分析表明,晚期复发是一个重要的临床问题,且避免内分泌疗法的努力必须依赖于长期随访数据(Pan H等人. N Engl J Med 377:1836-1846, 2017.)。在该研究中,我们证实,来自先前公布的标记的计算评分的性能随着随访时间的延长而恶化。尽管如此,即使没有任何全身疗法,许多标记仍可以鉴定大部分在15年超过90%没有转移并且在20年乳腺癌特异性存活率为约90%的受试者(图6和3B)。
一个新出现的困境是目前临床使用的多个基因表达试验的结果与个体受试者的风险预测之间存在相当大的不一致。实际上,我们在很大程度上已经证实了Bartlett等人在不同组群中的结果,该结果表明,只有39%的受试者通过五个试验统一归类为低风险,而个别试验预测为低风险的比例要大得多。相同作者表明,三种不同亚型分型试验对于41%的肿瘤是不一致的(Bartlett JM等人. J Natl Cancer Inst 108, 2016.)。在我们的当前工作中,我们提出了通过使用整个转录组平台和所有标记的平均值来克服这一问题的策略。该方法产生的结果与最好单个标记一致,并且可以改善标记间变异性,因为它依赖更多的数据点。
尽管这些数据提示使用所有可用标记对肿瘤进行分析可能是有价值的,但由于成本和来自肿瘤的足够样品材料的可用性,这可能是不可行的。为此目的,我们开发了一种新的141-基因标记(MET141),它是基于与AGR相关的基因。MET141基因标记捕获与AGR相同的生物学并具有相似的性能,但在临床设定中可能是更可行的。
这些结果表明,在绝经后且未全身治疗的具有ER+、HER2-肿瘤的乳腺癌组群中,来自先前开发的乳腺癌标记的计算评分在很大程度上具有预后意义。这些评分鉴定了可以免于全身治疗(内分泌疗法和化学疗法)的低风险受试者。但是,标记在个体受试者水平上是不一致的,并且我们的结果表明,标记平均值的应用可以产生更稳健的受试者水平结果。使用该平均值或相关的141-基因标记,即使在没有任何全身治疗的情况下,也可以鉴定具有极好的长期无转移性的受试者。
这些结果表明,本发明的方法和标志物可预测转移并鉴定可免于辅助化学疗法和内分泌治疗的乳腺癌患者。这些结果进一步表明,本发明的方法和标志物可用于治疗乳腺癌。
受试者
进行了SweBCG 91-RT试验的回顾性分析,其细节先前已发表(Sjostrom M等人. JClin Oncol 35:3222-3229, 2017; Killander F等人. Eur J Cancer 67:57-65, 2016;和Malmström P等人. Eur J Cancer 39:1690-7, 2003.)。简而言之,该试验将1,178名接受保乳手术的淋巴结阴性的I和IIA期受试者随机分配至辅助全乳辐射疗法或无放射疗法。根据当时的地区指南施用全身辅助疗法,并且很少使用。最初的研究证实了辐射对局部区域事件有好处,但对乳腺癌特异性生存(BCSS)没有好处。如以前所述(Sjostrom M等人. JClin Oncol 35:3222-3229, 2017.),根据St Gallen International Breast CancerConference (2013) Expert Panel进行亚型分型。该分析的主要终点是无远端复发间隔(即达到转移的时间),其定义为从手术时间直到转移、最后一次随访或死亡的时间,其中死亡作为审查事件(Gourgou-Bourgade S等人. Ann Oncol 26:873-9, 2015.)。按照建议,患有对侧乳腺癌或另一种原发性癌症的受试者没有进行审查(Hudis CA等人. J Clin Oncol25:2127-32, 2007.)。无转移受试者的中位随访时间为14.3年。为完整起见,显示了BCSS的结果,无事件受试者的中位随访时间为18.6年。试验和随访研究获得Lund University伦理委员会批准(批准号2010/127和2015/548),并获得所有受试者的知情口头同意。
RNA提取和基因表达分析
来自SweBCG 91-RT试验中的922个原发肿瘤的福尔马林固定的、石蜡包埋的(FFPE)组织样品可用于进一步处理(图5)。癌症含量由经过认证的乳腺病理学家确认,并在苏木精和伊红染色的载玻片上标记了代表性肿瘤区域。使用从1.5 mm组织穿孔物提取RNA。
虽然已经举例说明和描述了本发明的优选实施方案,但是应当理解,在不脱离本发明的精神和范围的情况下可以在其中做出各种改变。RNeasy FFPE试剂盒(Qiagen,Hilden, 德国)和使用Ovation FFPE WTA系统(NuGEN, San Carlos, CA)扩增cDNA。使用Encore生物素模块(NuGEN, San Carlos, CA)对扩增的cDNA进行片段化和标记,并与GeneChip Human Exon 1.0 ST Arrays (Thermo Fisher Scientific, South SanFrancisco, CA)杂交。在CLIA认证的临床操作实验室(GenomeDx Inc, San Diego, CA)中进行样品处理。765个样品具有足够的RNA,并通过了cDNA和微阵列质量控制。使用单通道阵列标准化对基因表达(Gene Expression Omnibus GSE119295)进行归一化(Piccolo SR等人. Genomics 100:337-44, 2012.)。
数据分析
先前公布的乳腺癌风险评分的计算
使用公开的算法或通过公众可得到的R包,计算15种先前公布的基因表达标记的替代评分(Paik S等人. N Engl J Med 351:2817-26, 2004; Filipits M等人. ClinCancer Res 17:6012-20, 2011; Sotiriou C等人. J Natl Cancer Inst 98:262-72,2006; Parker JS等人. J Clin Oncol 27:1160-7, 2009; van de Vijver MJ等人. NEngl J Med 347:1999-2009, 2002; Haibe-Kains B等人. Genome Biol 11:R18, 2010;Loi S等人. BMC Genomics 9:239, 2008; Wang Y等人. Lancet 365:671-9, 2005; LoiS等人. Proc Natl Acad Sci U S A 107:10208-13, 2010; Tutt A等人. BMC Cancer 8:339, 2008; Davis LM等人. J Mol Diagn 9:327-36, 2007; Ring BZ等人. J ClinOncol 24:3039-47, 2006; Ma XJ等人. Clin Cancer Res 14:2601-8, 2008; Bayani J等人. NPJ Breast Cancer 3:3, 2017;和Ma XJ等人. Cancer Cell 5:607-16, 2004.)
统计分析
使用R生存包(2.41-3版本)进行生存分析。为了对比具有不同值范围的标记之间的风险比,通过将评分除以其标准差来归一化每个连续风险评分。
使用R生存ROC包(1.0.3版本)计算时间依赖性曲线下面积(AUC)的估计值(Heagerty PJ等人. Biometrics 56:337-44, 2000.)。通过在1000个自举样品上迭代AUC估计值以生成采样分布并计算重新采样估计值的2.5和97.5百分位,估计时间依赖性AUC的置信区间。为了对比低风险受试者的分类在标记与标记之间有何不同,我们在单个标记的连续风险评分的最低四分位数内鉴定了受试者,并且计算了也被分类为彼此标记的最低四分位数的那些受试者的比例。我们然后计算了平均比例,不包括感兴趣的标记(其中比例为1)。我们将其称为“低风险分类协议”。
先前公布的乳腺癌风险评分的计算
在多种平台上开发了先前公布的乳腺癌风险评分。我们将来自GeneChip HumanExon 1.0 ST微阵列的基因表达数据应用于基因组标记方程式以计算替代连续风险评分。使用在R (3.3.2版)中的genefu包(2.6.0版) (Gendoo DM et al. Bioinformatics 32:1097-9, 2016)根据已发布的其方程式计算以下风险评分:OncotypeDx-样, (Paik S等人.N Engl J Med 351:2817-26, 2004) Endopredict-样, (Filipits M等人. Clin CancerRes 17:6012-20, 2011) 基因组级索引(Genomic Grade Index)-样, (Sotiriou C等人.J Natl Cancer Inst 98:262-72, 2006) PAM50ROR-样, (Parker JS等人. J Clin Oncol27:1160-7, 2009) 基因70-样, (van 't Veer LJ等人. Nature 415:530-6, 2002)GeniusM3-样, (Haibe-Kains B等人. Genome Biol 11:R18, 2010) TAMR-样, (Loi S等人. BMC Genomics 9:239, 2008) 基因76-样, (Wang Y等人. Lancet 365:671-9, 2005)和PIK3CAGS-样风险评分. (Loi S等人. Proc Natl Acad Sci U S A 107:10208-13,2010.)。对于基于来自特定微阵列的探针的标记,使用Entrez基因标识符的genefu注解将探针映射到我们的微阵列平台上的适当基因。对于在我们的微阵列上不可得到的少数基因,从标记方程式省略了该基因的术语(系数和基因表达值)。使用的genefu函数列出在表1中。
表1. 先前公布的标记的genefu函数和基因重叠.
Figure 744641DEST_PATH_IMAGE002
Celera-样风险评分
如以前所述(Tutt A等人. BMC Cancer 8:339, 2008.),通过计算14个基因的表达总和来计算风险评分。
ExagenBC-样ER+风险评分
如以前所述(Davis LM等人. J Mol Diagn 9:327-36, 2007.),基于以下方程式计算风险评分: R = 0.128*CYP24 - 0.173*PDCD6IP + 0.183*BIRC5。
Mammostrat-样风险评分
如以前所述(Ring BZ等人. J Clin Oncol 24:3039-47, 2006.),基于以下方程式计算风险评分: R = 1.54*SLC7A5 + 1.12*TP53 + 1.06*NDRG1 + 0.72*HTF9C + 0.5*CEACAM5。
MGI-样风险评分
如以前所述(Ma XJ等人. Clin Cancer Res 14:2601-8, 2008.),如下计算风险评分:将评分中五个基因中每一个的表达水平归一化成具有0的平均值和1的标准差,然后组合进单个评分作为第一主组分。
Toronto 2017-样风险评分
如以前所述(Bayani J等人. NPJ Breast Cancer 3:3, 2017),通过计算涉及95个基因的基因表达和系数的线性方程式来计算风险评分。
两基因比率-样风险评分
如以前所述(Ma XJ等人. Cancer Cell 5:607-16, 2004.),通过从HOXB13的表达减去IL17RB的表达,计算风险评分。
平均基因组风险
为了计算平均基因组风险,在组群中将14个标记评分中的每一个从0缩放到1,然后计算平均值。缩放是必要的,以防止在平均风险的计算中过度加权具有较大值范围的标记。
MET141
下载了五个公众可得到的乳腺癌数据集(Kreike, GEO30682; Kao, GEO20685;Wang, GEO2034; Hatzis, GEO17705; van de Vijver,从http://microarray-pubs.stanford.edu/wound_NKI/explore.html下载)。对于每个数据集,将探针转化成基因标识符,并鉴定五个数据集之间共有的基因的子集(10,990个基因)。计算了这五个组群中每个受试者的平均基因组风险。为了评估基因以包含在新标记中,我们删除了与来自先前公布的标记的基因相同的基因,并使用剩余的10,315个基因将每个基因与每个组群中的平均基因组风险相关联。保留在所有五个组群中具有> 0.4或<-0.4的Spearman氏相关系数的基因,从而产生共141个基因;其中89个正相关基因和52个负相关基因(表2)。最终的MET141评分是从正相关基因的平均表达减去负相关基因的平均表达。
途径分析
为了评估在基因列表中过度展示的生物途径,我们使用了Panther统计过度展示试验(13.0版,pantherdb.org)(Mi H等人. Nucleic Acids Res 45:D183-d189, 2017),其中使用具有FDR多重试验校正的Fisher's Exact作为试验类型,并使用Panther GO-SlimBiological Process基因列表作为注解数据集。作为辅助方法,我们还使用了具有“项目到人(project to human)”选项的Reactome Analysis Tools (reactome.org) (参见,Fabregat A等人. Nucleic Acids Res 46:D649-d655, 2018和Milacic M等人. Cancers(Basel) 4:1180-211, 2012)。对于两种方法,都输入了官方基因符号的列表。途径的显著富集被定义为FDR < 0.05。
表2. 在MET141中包括的基因
与较高基因组风险正相关的基因 与较高基因组风险负相关的基因
ATP结合盒亚家族F成员1(ABCF1) 4-氨基丁酸氨基转移酶(ABAT)
乙酰辅酶A乙酰基转移酶2(ACAT2) 结合肌动蛋白的LIM蛋白家族成员3(ABLIM3)
肌动蛋白样6A(ACTL6A) 血管紧张素II受体1型(AGTR1)
载脂蛋白B mRNA编辑酶催化亚基3B(APOBEC3B) 醛脱氢酶6家族成员A1(ALDH6A1)
抗沉默功能1B组蛋白伴侣蛋白(ASF1B) 锚蛋白重复家族A成员2(ANKRA2)
ATP合酶H+运输线粒体F1复合物γ多肽1(ATP5C1) BCL2相互作用蛋白3样(BNIP3L)
bystin样(BYSL) BTG抗增殖因子2(BTG2)
染色体1开放读码框106(C1orf106) 细胞周期蛋白G2(CCNG2)
细胞分裂周期25B(CDC25B) 冷诱导的RNA结合蛋白(CIRBP)
细胞分裂周期45(CDC45) 细胞色素c氧化酶亚基7A1(COX7A1)
染色质沉默和DNA复制因子1(CDT1) 半胱氨酸蛋白酶抑制剂C(CST3)
CCAAT/增强子结合蛋白γ(CEBPG) C-X-C基序趋化因子配体12(CXCL12)
着丝粒蛋白I(CENPI) 核心蛋白聚糖(DCN)
染色质组装因子1亚基A(CHAF1A) 含有烯酰辅酶A水合酶结构域的2(ECHDC2)
染色质组装因子1亚基B(CHAF1B) ELOVL脂肪酸延长酶5(ELOVL5)
检验点激酶1(CHEK1) 具有序列相似性的家族13成员B(FAM13B)
细胞因子诱导的细胞凋亡抑制剂1(CIAPIN1) 具有序列相似性的家族198成员B(FAM198B)
细胞骨架相关蛋白2(CKAP2) 富含F-盒子和亮氨酸的重复蛋白5(FBXL5)
CTP合酶1(CTPS1) 含有黄素的单加氧酶5(FMO5)
DNA复制解螺旋酶/核酸酶2(DNA2) 间隙连接蛋白α1(GJA1)
DNA甲基转移酶1(DNMT1) HtrA丝氨酸肽酶1(HTRA1)
DNA甲基转移酶3β(DNMT3B) 免疫球蛋白(CD79A)结合蛋白1(IGBP1)
E2F转录因子8(E2F8) 胰岛素样生长因子结合蛋白4(IGFBP4)
依莫帕米结合蛋白(甾醇异构酶)(EBP) 胰岛素样生长因子结合蛋白6 (IGFBP6)
真核翻译起始因子4E结合蛋白1(EIF4EBP1) 白介素20受体亚基α(IL20RA)
ER膜蛋白复合物亚基8(EMC8) 胰岛素受体基底1(IRS1)
具有序列相似性的家族96成员B(FAM96B) 嵌膜蛋白2B(ITM2B)
范科尼贫血互补群A(FANCA) 肌醇1,4,5-三磷酸受体1型(ITPR1)
F-盒子蛋白5(FBXO5) 亮氨酸拉链转录因子样1(LZTFL1)
甘油醛-3-磷酸脱氢酶(GAPDH) 甘露糖苷酶α2B类成员2(MAN2B2)
甘氨酰-tRNA合成酶(GARS) Meis同源框3假基因1(MEIS3P1)
孪蛋白DNA复制抑制剂(GMNN) 微管相关肿瘤抑制物1(MTUS1)
G-蛋白信号传递调节剂2(GPSM2) 肌球蛋白VC(MYO5C)
GTP结合蛋白4(GTPBP4) myoferlin(MYOF)
肝细胞瘤-衍生的生长因子(HDGF) neurobeachin(NBEA)
血液学和神经学表达的1(HN1) nischarin(NISCH)
热激蛋白家族A (Hsp70)成员14(HSPA14) NME/NM23家族成员5(NME5)
热激蛋白家族D (Hsp60)成员1(HSPD1) 催乳素诱导的蛋白(PIP)
肌醇单磷酸酶2(IMPA2) 前列腺素E受体3(PTGER3)
白介素1受体相关激酶1(IRAK1) 醌型二氢喋啶还原酶(QDPR)
赖氨酰基-tRNA合成酶(KARS) rabaptin, RAB GTPase结合效应物蛋白1(RABEP1)
动粒相关的1(KNTC1) 视黄酸诱导的2(RAI2)
LDL受体有关的蛋白8(LRP8) 核糖核酸酶A家族成员4(RNASE4)
微型染色体维持复合物组分5(MCM5) 操作储存的钙进入相关的调节因子(SARAF)
微型染色体维持复合物组分7(MCM7) 结合SH3结构域的谷氨酸富集蛋白样(SH3BGRL)
MIS18动粒蛋白A(MIS18A) 含有sushi结构域的6(SUSD6)
线粒体核糖体蛋白L15(MRPL15) syntabulin(SYBU)
线粒体核糖体蛋白S17(MRPS17) TBC1结构域家族成员9(TBC1D9)
线粒体转录终止因子3(MTERF3) 转录延伸因子A样1(TCEAL1)
核前层蛋白A识别因子(NARF) 含有跨膜BAX抑制剂基序的4(TMBIM4)
非-SMC凝缩蛋白I复合物亚基D2(NCAPD2) 泛素样3(UBL3)
非-SMC凝缩蛋白II复合物亚基D3(NCAPD3) 含有锌指和BTB结构域的16(ZBTB16)
NADH:泛醌氧化还原酶亚基A9(NDUFA9)
核包膜嵌膜蛋白1(NEMP1)
NME/NM23核苷二磷酸激酶1(NME1)
NOP2核仁蛋白(NOP2)
核孔蛋白205(NUP205)
起点识别复合物亚基1(ORC1)
丙酮酸脱氢酶(硫辛酰胺)α1(PDHA1)
异戊二烯基(癸异戊二烯基)二磷酸合酶,亚基1(PDSS1)
磷酸甘油酸激酶1(PGK1)
polo样激酶4(PLK4)
嘌呤核苷磷酸化酶(PNP)
DNA聚合酶α2, 辅助亚基(POLA2)
蛋白磷酸酶, Mg2+/Mn2+ 依赖性的1G(PPM1G)
过氧化氧化还原蛋白4(PRDX4)
蛋白酶体亚基β4(PSMB4)
蛋白酶体亚基β5 (PSMB5)
蛋白酶体26S亚基, 非-ATP酶14(PSMD14)
蛋白酶体26S亚基, 非-ATP酶2(PSMD2)
蛋白酶体组装伴侣蛋白1(PSMG1)
磷脂酰丝氨酸合酶1(PTDSS1)
RAD51重组酶(RAD51)
RAD54同系物B (酿酒酵母)(RAD54B)
RAD54-样(酿酒酵母)(RAD54L)
RAN结合蛋白1(RANBP1)
小核内核糖核蛋白多肽A'(SNRPA1)
小核内核糖核蛋白多肽G(SNRPG)
SPC25, NDC80动粒复合物组分(SPC25)
SRSF蛋白激酶1(SRPK1)
应激诱导的磷蛋白1(STIP1)
转化酸性含卷曲螺旋的蛋白3(TACC3)
转录延伸因子B亚基1(TCEB1)
跨膜蛋白97(TMEM97)
拓扑异构酶(DNA) IIα(top2A)
拓扑异构酶(DNA) II结合蛋白1(topBP1)
磷酸丙糖异构酶1(TPI1)
尿嘧啶DNA糖基化酶(UNG)
酪氨酸3-单加氧酶/色氨酸5-单加氧酶活化蛋白ζ(YWHAZ)
Figure DEST_PATH_IMAGE003
表4. 先前公布的基因组标记的过表达分析
Celera 富集倍数 原始P-值 FDR
细胞周期的调节(GO:0051726) 22.63 2.99E-04 3.65E-02
DNA代谢过程(GO:0006259) 14.35 1.41E-04 3.45E-02
GENIUSM3 富集倍数 原始P-值 FDR
DNA重组(GO:0006310) 7.23 2.87E-03 4.66E-02
DNA复制(GO:0006260) 7.18 2.47E-07 3.01E-05
细胞生长(GO:0016049) 5.75 8.21E-04 1.54E-02
DNA代谢过程(GO:0006259) 4.80 1.57E-08 3.83E-06
DNA修复(GO:0006281) 4.50 5.51E-04 1.34E-02
细胞周期(GO:0007049) 2.86 1.40E-05 8.52E-04
含有核碱基的化合物代谢过程(GO:0006139) 1.85 6.70E-06 5.45E-04
含有磷酸的化合物代谢过程(GO:0006796) 1.83 1.36E-03 2.36E-02
氮化合物代谢过程(GO:0006807) 1.82 3.13E-05 1.53E-03
细胞组分组构(GO:0016043) 1.77 7.37E-04 1.50E-02
细胞组分组构或生物发生(GO:0071840) 1.75 6.99E-04 1.55E-02
基本代谢过程(GO:0044238) 1.46 3.88E-04 1.05E-02
代谢过程(GO:0008152) 1.42 1.70E-04 5.20E-03
细胞过程(GO:0009987) 1.36 3.32E-05 1.35E-03
未分类(UNCLASSIFIED) 0.73 8.92E-05 3.11E-03
GGI 富集倍数 原始P-值 FDR
染色体分离(GO:0007059) 27.94 5.56E-15 4.52E-13
减数分裂(GO:0007126) 19.96 9.33E-07 1.63E-05
有丝分裂(GO:0007067) 16.07 1.92E-16 2.35E-14
DNA复制(GO:0006260) 15.77 3.33E-11 1.62E-09
细胞增殖(GO:0008283) 15.40 2.56E-05 3.91E-04
细胞周期的调节(GO:0051726) 13.31 2.11E-10 8.56E-09
DNA代谢过程(GO:0006259) 10.02 8.84E-14 5.39E-12
细胞周期(GO:0007049) 9.70 4.33E-24 1.06E-21
胞质分裂(GO:0000910) 8.97 7.07E-05 9.59E-04
DNA修复(GO:0006281) 7.41 1.94E-04 2.25E-03
再生(GO:0000003) 5.09 1.32E-03 1.46E-02
细胞组分运动(GO:0006928) 4.73 2.52E-05 4.09E-04
染色质组构(GO:0006325) 4.53 2.34E-03 2.48E-02
细胞器组构(GO:0006996) 3.91 1.69E-08 4.59E-07
含有磷酸的化合物代谢过程(GO:0006796) 3.62 1.74E-09 6.07E-08
细胞骨架组构(GO:0007010) 3.57 3.78E-03 3.84E-02
细胞组分组构(GO:0016043) 2.84 5.35E-07 1.09E-05
细胞组分组构或生物发生(GO:0071840) 2.75 5.65E-07 1.06E-05
含有核碱基的化合物代谢过程(GO:0006139) 2.58 5.88E-08 1.43E-06
氮化合物代谢过程(GO:0006807) 2.21 8.39E-05 1.02E-03
代谢过程(GO:0008152) 1.90 1.76E-07 3.89E-06
基本代谢过程(GO:0044238) 1.78 7.16E-05 9.19E-04
细胞过程(GO:0009987) 1.73 9.27E-09 2.83E-07
未分类(UNCLASSIFIED) 0.59 5.76E-05 8.27E-04
细胞表面受体信号传递途径(GO:0007166) < 0.01 4.40E-03 4.29E-02
PAM50 富集倍数 原始P-值 FDR
减数分裂(GO:0007126) 18.85 6.19E-04 3.78E-02
细胞凋亡过程的负调节(GO:0043066) 15.74 1.40E-04 1.14E-02
有丝分裂(GO:0007067) 11.81 2.40E-06 2.93E-04
细胞周期(GO:0007049) 6.47 2.62E-07 6.39E-05
TAMR13 富集倍数 原始P-值 FDR
染色体分离(GO:0007059) 15.47 6.80E-11 4.15E-09
减数分裂(GO:0007126) 13.97 1.33E-06 3.25E-05
细胞增殖(GO:0008283) 12.93 2.15E-06 4.37E-05
有丝分裂(GO:0007067) 10.18 1.63E-13 1.98E-11
细胞周期的调节(GO:0051726) 9.98 8.44E-11 4.12E-09
DNA重组(GO:0006310) 9.52 1.06E-03 1.12E-02
基因表达的表观遗传调节(GO:0040029) 6.97 3.11E-03 3.04E-02
DNA代谢过程(GO:0006259) 6.65 1.80E-11 1.46E-09
DNA复制(GO:0006260) 6.31 5.70E-05 7.72E-04
胞质分裂(GO:0000910) 6.28 1.71E-04 2.09E-03
DNA修复(GO:0006281) 5.93 8.61E-05 1.11E-03
细胞周期(GO:0007049) 5.65 1.36E-15 3.31E-13
再生(GO:0000003) 4.58 2.05E-04 2.38E-03
细胞骨架组构(GO:0007010) 3.37 5.40E-04 5.99E-03
细胞组分运动(GO:0006928) 2.84 2.08E-03 2.12E-02
细胞器组构(GO:0006996) 2.76 2.01E-06 4.47E-05
含有磷酸的化合物代谢过程(GO:0006796) 2.72 6.55E-08 1.78E-06
氮化合物代谢过程(GO:0006807) 2.45 1.51E-09 6.13E-08
生物合成方法(GO:0009058) 2.34 4.61E-06 8.66E-05
细胞组分组构(GO:0016043) 2.14 2.73E-05 4.44E-04
细胞组分组构或生物发生(GO:0071840) 2.06 4.92E-05 7.06E-04
含有核碱基的化合物代谢过程(GO:0006139) 1.99 6.74E-06 1.17E-04
代谢过程(GO:0008152) 1.73 2.49E-08 7.61E-07
细胞过程(GO:0009987) 1.56 1.29E-08 4.50E-07
未分类(UNCLASSIFIED) 0.67 2.76E-05 4.20E-04
Toronto 2017 富集倍数 原始P-值 FDR
减数分裂(GO:0007126) 20.16 8.81E-07 3.58E-05
细胞增殖(GO:0008283) 18.66 1.34E-06 4.68E-05
染色体分离(GO:0007059) 15.19 6.26E-07 3.06E-05
有丝分裂(GO:0007067) 13.53 7.73E-13 9.43E-11
细胞周期的调节(GO:0051726) 11.20 3.44E-08 2.80E-06
氨基酸运输(GO:0006865) 10.04 8.06E-04 1.16E-02
DNA复制(GO:0006260) 9.29 1.39E-05 3.76E-04
胞质分裂(GO:0000910) 9.06 6.70E-05 1.36E-03
细胞凋亡过程的负调节(GO:0043066) 8.42 1.51E-03 1.94E-02
细胞周期(GO:0007049) 7.20 8.96E-15 2.19E-12
再生(GO:0000003) 5.14 1.25E-03 1.70E-02
DNA代谢过程(GO:0006259) 4.80 1.28E-04 2.23E-03
细胞骨架组构(GO:0007010) 4.64 1.62E-04 2.48E-03
磷酸代谢过程的调节(GO:0019220) 4.27 6.21E-05 1.38E-03
细胞器组构(GO:0006996) 3.27 5.08E-06 1.55E-04
含有磷酸的化合物代谢过程(GO:0006796) 2.61 6.77E-05 1.27E-03
细胞组分组构(GO:0016043) 2.44 4.97E-05 1.21E-03
细胞组分组构或生物发生(GO:0071840) 2.28 1.58E-04 2.57E-03
生物调节(GO:0065007) 1.81 2.33E-03 2.84E-02
细胞过程(GO:0009987) 1.64 5.52E-07 3.37E-05
未分类(UNCLASSIFIED) 0.69 3.59E-03 4.18E-02

Claims (27)

1.一种治疗受试者的乳腺癌的方法,所述方法包括:
a) 获得或已经获得来自受试者的样品中的多个基因的表达水平,其中所述多个基因选自表2;
b) 基于所述表达水平确定所述受试者处于低癌症复发风险,或基于所述表达水平确定所述受试者没有处于低癌症复发风险;和
c) 如果基于所述表达水平,受试者没有被鉴定为处于低癌症复发风险,则施用辅助化学疗法或内分泌疗法,和如果基于所述表达水平,受试者被鉴定为处于低癌症复发风险,则不施用辅助化学疗法或内分泌疗法。
2.根据权利要求1所述的方法,所述方法进一步包括:计算受试者的平均基因组风险(AGR)评分,其中如果基于AGR评分和生物样品中选自表2的基因的表达水平,受试者没有被鉴定为处于低癌症复发风险,则将辅助化学疗法或内分泌疗法施用给受试者,和如果基于AGR评分和生物样品中选自表2的基因的表达水平,受试者被鉴定为处于低癌症复发风险,则不将辅助化学疗法或内分泌疗法施用给受试者。
3.根据权利要求1所述的方法,其中所述生物样品是活组织检查或肿瘤样品。
4.根据权利要求1所述的方法,其中所述受试者是人。
5.根据权利要求1所述的方法,其中所述受试者具有雌激素受体阳性的(ER+)、人表皮生长因子受体2阴性的(HER2-)乳腺癌,且是绝经后的。
6.根据权利要求1所述的方法,其中在生物样品中测量选自表2的所有基因的表达水平。
7.根据权利要求1所述的方法,其中选自表2的一个或多个基因的表达水平与对照相比增加或降低。
8.根据权利要求1所述的方法,其中所述测量表达水平包括实施原位杂交、基于PCR的方法、基于阵列的方法、免疫组织化学方法、RNA测定方法或免疫测定方法。
9.根据权利要求8所述的方法,其中所述测量表达水平包括使用选自核酸探针、一种或多种核酸引物和抗体的试剂。
10.根据权利要求1所述的方法,其中所述测量表达水平包括测量RNA转录物的水平。
11.根据权利要求1所述的方法,其中在用辅助化学疗法或内分泌疗法治疗所述受试者之前实施所述方法。
12.一种用于确定具有乳腺癌的受试者的预后以及是否用辅助化学疗法和内分泌疗法治疗所述受试者的试剂盒,所述试剂盒包含用于测量选自表2的多个基因的表达水平的试剂。
13.根据权利要求12所述的试剂盒,其中所述试剂盒包含用于测量在表2中列出的所有基因的表达水平的试剂。
14.根据权利要求12所述的试剂盒,其中所述试剂包含用于实施原位杂交、基于PCR的方法、基于阵列的方法、免疫组织化学方法、RNA测定方法或免疫测定方法的试剂。
15.根据权利要求12所述的试剂盒,其中所述试剂包含微阵列、核酸探针、核酸引物或抗体中的一种或多种。
16.根据权利要求12所述的试剂盒,其中所述试剂盒包含至少一组PCR引物,所述PCR引物能够扩增包含选自表2的基因的序列或其互补序列的核酸。
17.根据权利要求12所述的试剂盒,其中所述试剂盒包含至少一种探针,所述探针能够与包含选自表2的基因的序列或其互补序列的核酸杂交。
18.根据权利要求12所述的试剂盒,所述试剂盒进一步包含电子或纸质形式的信息,所述信息包含关于如何确定具有乳腺癌的受试者的预后以及是否用辅助化学疗法和内分泌疗法治疗所述受试者的说明书。
19.根据权利要求12所述的试剂盒,所述试剂盒进一步包含一种或多种对照参考样品。
20.一种用于确定具有乳腺癌的受试者的预后以及是否用辅助化学疗法和内分泌疗法治疗所述受试者的探针集合,所述探针集合包含用于检测多个靶核酸的多个探针,其中所述多个靶核酸包含选自表2的基因的一个或多个基因序列或其互补序列。
21.根据权利要求20所述的探针集合,其中所述探针集合包含用于检测多个靶核酸的多个探针,所述靶核酸包含选自表2的基因的基因序列或其互补序列。
22.根据权利要求21所述的探针集合,其中至少一个探针被可检测地标记。
23.一种用于确定具有乳腺癌的受试者的预后以及是否用辅助化学疗法和内分泌疗法治疗所述受试者的试剂盒,所述试剂盒包含根据权利要求22所述的探针集合。
24. 一种用于确定具有乳腺癌的受试者的预后和是否用辅助化学疗法和内分泌疗法治疗所述受试者的系统,所述系统包括:
a) 根据权利要求22所述的探针集合;和
b) 计算机模型或算法,其用于分析在来自具有乳腺癌的受试者的生物样品中与所述多个探针杂交的多个靶核酸的表达水平或表达谱,和基于所述表达水平或表达谱确定所述受试者是否处于低癌症复发风险和可以免除用辅助化学疗法和内分泌疗法治疗。
25.一种试剂盒,其包含根据权利要求24所述的系统。
26.根据权利要求25所述的试剂盒,所述试剂盒进一步包含用于指定所述受试者的治疗方式的计算机模型或算法。
27.根据权利要求25所述的试剂盒,所述试剂盒进一步包含用于归一化所述多个靶核酸的表达水平或表达谱的计算机模型或算法。
CN201980091514.3A 2018-12-08 2019-12-06 用于乳腺癌预后的转录组谱分析 Pending CN113557310A (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US201862777128P 2018-12-08 2018-12-08
US62/777128 2018-12-08
PCT/US2019/065098 WO2020118274A1 (en) 2018-12-08 2019-12-06 Transcriptomic profiling for prognosis of breast cancer

Publications (1)

Publication Number Publication Date
CN113557310A true CN113557310A (zh) 2021-10-26

Family

ID=70973557

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201980091514.3A Pending CN113557310A (zh) 2018-12-08 2019-12-06 用于乳腺癌预后的转录组谱分析

Country Status (10)

Country Link
US (1) US20220033912A1 (zh)
EP (1) EP3891293A4 (zh)
JP (1) JP2022512152A (zh)
CN (1) CN113557310A (zh)
AU (1) AU2019392939A1 (zh)
CA (1) CA3127733A1 (zh)
IL (1) IL283780A (zh)
MX (1) MX2021006560A (zh)
SG (1) SG11202106130UA (zh)
WO (1) WO2020118274A1 (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114377135A (zh) * 2022-03-15 2022-04-22 河南大学 Ppm1g在诊治肺癌中的应用
CN114959023A (zh) * 2022-03-19 2022-08-30 新乡医学院 ERα阳性乳腺癌分子标志物及其应用
CN118006766A (zh) * 2024-04-09 2024-05-10 鄂尔多斯市中心医院(内蒙古自治区超声影像研究所) Pola2在诊断代谢综合征中的应用

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP2255198A4 (en) 2008-02-15 2011-05-25 Mayo Foundation DETECTION OF NEOPLASM
ES2812753T3 (es) 2014-03-31 2021-03-18 Mayo Found Medical Education & Res Detección de neoplasma colorectal
MX2023010179A (es) * 2021-03-01 2023-10-16 Pfs Genomics Inc Métodos y clasificadores genómicos para el pronóstico del cáncer de mama e identificación de sujetos que probablemente no se beneficien de la radioterapia.
CN113186273B (zh) * 2021-05-13 2023-02-21 中国人民解放军总医院第一医学中心 一种用于预测P2Y12受体拮抗剂抗血小板疗效的circRNA检测试剂盒及其应用
CN116913479B (zh) * 2023-09-13 2023-12-29 西南石油大学 一种确定实施pmrt的三阴性乳腺癌患者的方法及装置

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2005017530A1 (en) * 2003-08-11 2005-02-24 Applied Genomics, Inc. Reagents and methods for use in cancer diagnosis, classification and therapy
CN1950701A (zh) * 2004-02-20 2007-04-18 维里德克斯有限责任公司 乳腺癌预后
CN1995388A (zh) * 2005-08-02 2007-07-11 维里德克斯有限责任公司 预测乳腺癌的骨复发
WO2011056688A2 (en) * 2009-10-27 2011-05-12 Caris Life Sciences, Inc. Molecular profiling for personalized medicine
WO2011063274A2 (en) * 2009-11-23 2011-05-26 Genomic Health, Inc. Methods to predict clinical outcome of cancer
CN102439454A (zh) * 2009-02-11 2012-05-02 卡里斯Mpi公司 肿瘤的分子谱分析

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2010093872A2 (en) * 2009-02-13 2010-08-19 The United States Of America, As Represented By The Secretary, Department Of Health And Human Services Molecular-based method of cancer diagnosis and prognosis
US20150111758A1 (en) * 2012-03-06 2015-04-23 Oslo Universitetssykehus Hf Gene signatures associated with efficacy of postmastectomy radiotherapy in breast cancer
WO2016018524A1 (en) * 2014-07-30 2016-02-04 Trustees Of Dartmouth College E2f4 signature for use in diagnosing and treating breast and bladder cancer
US10443103B2 (en) * 2015-09-16 2019-10-15 Innomedicine, LLC Chemotherapy regimen selection

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2005017530A1 (en) * 2003-08-11 2005-02-24 Applied Genomics, Inc. Reagents and methods for use in cancer diagnosis, classification and therapy
CN1950701A (zh) * 2004-02-20 2007-04-18 维里德克斯有限责任公司 乳腺癌预后
CN1995388A (zh) * 2005-08-02 2007-07-11 维里德克斯有限责任公司 预测乳腺癌的骨复发
CN102439454A (zh) * 2009-02-11 2012-05-02 卡里斯Mpi公司 肿瘤的分子谱分析
WO2011056688A2 (en) * 2009-10-27 2011-05-12 Caris Life Sciences, Inc. Molecular profiling for personalized medicine
WO2011063274A2 (en) * 2009-11-23 2011-05-26 Genomic Health, Inc. Methods to predict clinical outcome of cancer

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
NICOLAS SERVANT等: "Search for a gene expression signature of breast cancer local recurrence in young women", CLIN CANCER RES *

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114377135A (zh) * 2022-03-15 2022-04-22 河南大学 Ppm1g在诊治肺癌中的应用
CN114377135B (zh) * 2022-03-15 2023-11-24 河南大学 Ppm1g在诊治肺癌中的应用
CN114959023A (zh) * 2022-03-19 2022-08-30 新乡医学院 ERα阳性乳腺癌分子标志物及其应用
CN118006766A (zh) * 2024-04-09 2024-05-10 鄂尔多斯市中心医院(内蒙古自治区超声影像研究所) Pola2在诊断代谢综合征中的应用

Also Published As

Publication number Publication date
AU2019392939A1 (en) 2021-06-24
JP2022512152A (ja) 2022-02-02
IL283780A (en) 2021-07-29
EP3891293A4 (en) 2023-01-04
US20220033912A1 (en) 2022-02-03
WO2020118274A1 (en) 2020-06-11
CA3127733A1 (en) 2020-06-11
MX2021006560A (es) 2021-11-17
EP3891293A1 (en) 2021-10-13
SG11202106130UA (en) 2021-07-29

Similar Documents

Publication Publication Date Title
AU2018210695B2 (en) Molecular subtyping, prognosis, and treatment of bladder cancer
AU2016334893B2 (en) Use of a genetic signature diagnostically to evaluate treatment strategies for prostate cancer
US11873532B2 (en) Subtyping prostate cancer to predict response to hormone therapy
CN113557310A (zh) 用于乳腺癌预后的转录组谱分析
CN113748215B (zh) 用于乳腺癌的预后和预测来自辅助放射疗法的益处的方法和基因组分类器
WO2019028285A2 (en) USE OF SPECIFIC GENE EXPRESSION OF IMMUNE CELLS FOR THE PROGNOSIS OF PROSTATE CANCER AND THE PREDICTION OF SENSITIVITY TO RADIOTHERAPY
US20240145032A1 (en) Methods and genomic classifiers for prognosis of breast cancer and identifying subjects not likely to benefit from radiotherapy
US20220213557A1 (en) Non-coding rna for subtyping of bladder cancer
US20230115828A1 (en) Genomic classifiers for prognosing and treating clinically aggressive luminal bladder cancer
CA3199114A1 (en) Methods and genomic classifiers for identifying homologous recombination deficiency prostate cancer

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
WD01 Invention patent application deemed withdrawn after publication
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20211026