CN114058704A - 用于检测癌症中的微卫星不稳定性和dna碱基切除修复途径抑制的合成致死性的新标记 - Google Patents

用于检测癌症中的微卫星不稳定性和dna碱基切除修复途径抑制的合成致死性的新标记 Download PDF

Info

Publication number
CN114058704A
CN114058704A CN202111386681.6A CN202111386681A CN114058704A CN 114058704 A CN114058704 A CN 114058704A CN 202111386681 A CN202111386681 A CN 202111386681A CN 114058704 A CN114058704 A CN 114058704A
Authority
CN
China
Prior art keywords
mmr
msi
tumors
microsatellite
deletions
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202111386681.6A
Other languages
English (en)
Inventor
D·兰布雷彻特
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Vlaams Instituut voor Biotechnologie VIB
Life Sciences Research Partners vzw
Original Assignee
Vlaams Instituut voor Biotechnologie VIB
Life Sciences Research Partners vzw
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Vlaams Instituut voor Biotechnologie VIB, Life Sciences Research Partners vzw filed Critical Vlaams Instituut voor Biotechnologie VIB
Publication of CN114058704A publication Critical patent/CN114058704A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6876Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
    • C12Q1/6883Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material
    • C12Q1/6886Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material for cancer
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61PSPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
    • A61P35/00Antineoplastic agents
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61PSPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
    • A61P35/00Antineoplastic agents
    • A61P35/02Antineoplastic agents specific for leukemia
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61PSPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
    • A61P43/00Drugs for specific purposes, not provided for in groups A61P1/00-A61P41/00
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/106Pharmacogenomics, i.e. genetic variability in individual responses to drugs and drug metabolism
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/112Disease subtyping, staging or classification
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/136Screening for pharmacological compounds
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/154Methylation markers
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/156Polymorphic or mutational markers
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/158Expression markers

Landscapes

  • Health & Medical Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Organic Chemistry (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Engineering & Computer Science (AREA)
  • Analytical Chemistry (AREA)
  • Wood Science & Technology (AREA)
  • Pathology (AREA)
  • Genetics & Genomics (AREA)
  • Immunology (AREA)
  • Zoology (AREA)
  • General Health & Medical Sciences (AREA)
  • Oncology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • General Engineering & Computer Science (AREA)
  • Hospice & Palliative Care (AREA)
  • Molecular Biology (AREA)
  • Microbiology (AREA)
  • Biochemistry (AREA)
  • Biotechnology (AREA)
  • Biophysics (AREA)
  • Physics & Mathematics (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • General Chemical & Material Sciences (AREA)
  • Medicinal Chemistry (AREA)
  • Nuclear Medicine, Radiotherapy & Molecular Imaging (AREA)
  • Pharmacology & Pharmacy (AREA)
  • Animal Behavior & Ethology (AREA)
  • Public Health (AREA)
  • Veterinary Medicine (AREA)
  • Hematology (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
  • Medicines That Contain Protein Lipid Enzymes And Other Medicines (AREA)
  • Investigating Or Analysing Biological Materials (AREA)

Abstract

本申请涉及癌症、尤其是错配修复(MMR‑)缺陷肿瘤领域。本文提供对检测肿瘤是否为错配修复缺陷具有高敏感性的新标记。该标记尤其是微卫星区域中的突变。因此,提供用于诊断肿瘤的微卫星不稳定性的方法,其包括测定这些标记的存在。此外,提供试剂盒来检测这些标记(或其亚组)在样品中的存在。

Description

用于检测癌症中的微卫星不稳定性和DNA碱基切除修复途径 抑制的合成致死性的新标记
本申请是申请日为2013年04月10日、发明名称为“用于检测癌症中的微卫星不稳定性和测定与DNA碱基切除修复途径抑制的合成致死性的新标记”的中国专利申请201380030379.4(国际申请号PCT/EP2013/057516)的分案申请。
技术领域
本申请涉及癌症、尤其是错配修复(MMR-)缺陷肿瘤领域。本文提供对检测肿瘤是否为错配修复缺陷具有高敏感性的新标记。该标记尤其是微卫星区域中的突变。因此,提供用于诊断肿瘤的微卫星不稳定性的方法,其包括测定这些标记的存在。此外,提供试剂盒来检测这些标记(或其亚组)在样品中的存在。
有趣地,突变优先影响通过同源重组(HR)途径的双链断裂(DSB)修复,DSB修复在MMR缺陷肿瘤中功能上受损。本文中显示,这些肿瘤对通过酶聚ADP核糖聚合酶的药理学抑制(PARP抑制)诱导单链断裂敏感。因此,基于MMR和PARP之间的合成致死相互作用,提供用于MMR缺陷肿瘤的新治疗模式。
背景技术
肿瘤中与DNA错配修复缺陷相关的基因组不稳定性的形式称为微卫星不稳定性(MSI)。微卫星不稳定性(MSI)是微卫星中的重复DNA核苷酸单位的数目的克隆变化。它通常出现在错配修复(MMR)基因缺陷的肿瘤中:DNA MMR系统未能修复DNA复制过程中发生的错误,导致普遍存在于整个基因组中的简单、重复的微卫星序列长度内的单核苷酸突变和改变的加速累积。
MMR缺陷是非常清楚的Lynch综合症病因,Lynch综合症是造成2%至5%的子宫内膜(EM)癌或结直肠(CRC)癌的癌症易感性的常染色体显性遗传障碍。Lynch综合症由MMR途经基因(MLH1、MSH2、MSH3、MSH6或PMS2)中的突变或缺失引起(Jiricny,2006)。此外,MLH1的外遗传沉默(常称为“散发性”Lynch综合症)促成这些肿瘤的另外15%(Kuismanen等,2002)。还已在少数卵巢癌、胰腺癌、胃癌、白血病以及几种其他癌症中描述了MMR缺陷。
MMR机制的缺陷在肿瘤组织中但不在正常周围组织中产生DNA复制错误。具体而言,体细胞错误作为单核苷酸和二核苷酸重复中的插入/缺失突变累积——称为微卫星不稳定性(MSI)的现象(Pinol等,2005)。
MMR缺陷的肿瘤在诸如5-氟尿嘧啶和烷化剂(如替莫唑胺(temozolomide))的标准化疗后显示不同的预后和治疗结果。未治疗的具有MMR缺陷肿瘤的CRC患者具有略好的预后,但似乎未从基于5-氟尿嘧啶的辅助性化疗(其是CRC的首选化疗)受益。具体而言,在MMR缺陷肿瘤中,5-氟尿嘧啶诱导的错配被耐受,导致未能诱导细胞死亡(Hewish等,2010)。MMR缺陷肿瘤对EM中常用的化疗顺式铂氨和脱羧铂氨也有抗性(Hewish等,2010)。此外,MMR缺陷肿瘤可以对包括抗-EGFR和抗-VEGF治疗的靶向治疗具有抗性,因为它们在激活旁路或下游信号传导途径的基因中获得二次突变。例如,MMR肿瘤可以在双链断裂修复基因(例如MRE11、ATR和RAD50)、已知的癌基因或肿瘤抑制基因(例如PIK3CA或PTEN)中获得突变。另一种可能性是MLH1的外遗传沉默与诸如BRAF V600E突变的具体突变一致(Ogino等,2012),其代表晚期CRC中对靶向抗-EGFR治疗的反应的已建立的阴性预测因子(De Roock等,2010)。
个性化MMR缺陷肿瘤的治疗的努力已集中于鉴定与MMR途径的合成致死相互作用。具体而言,研究揭示,增加的氧化损伤(通过氨基蝶呤暴露或PINK1沉默(Martin等,2011))和碱基切除修复(BER)途径的干扰(通过DNA聚合酶γ或β抑制(Martin等,2010))致敏MMR缺陷肿瘤。具体而言,在MMR肿瘤中,氧化损伤诱导8-氧鸟嘌呤(8-oxoG)DNA损伤,其未能通过BER或MMR途径充分修复,在DNA水平主要产生GC至TA的二核苷酸颠换,导致细胞死亡。此外,已假设存在肿瘤可耐受的最大突变频率,在最大突变频率以上,突变的进一步增加将是有害的。因此,已提出用诱变核苷类似物附加地治疗MMR肿瘤,直至获得导致肿瘤的错误灾变样消融的临界突变水平。但是,到现在为止,这些努力未能转化为临床上有效的治疗选择。备选地,还可以靶向由于MMR缺陷而发生的二次突变(Dorard等,2011)。但是,表征MMR缺陷肿瘤的二次突变谱的研究限于在一个或几个报道基因座观察,或仅集中在已知热点序列处的突变上。虽然它们能够确定突变最常影响单核苷酸和二核苷酸重复,但存在于这些肿瘤中的体细胞突变谱仍未得到很好的表征。
由于MMR缺陷主要存在于结直肠肿瘤和子宫内膜肿瘤中代表家族形式的癌症,且由于肿瘤显示MMR缺陷的突变谱特征,常使用评估MMR缺陷的诊断测试。
目前为止,最常用的检测MSI的方法是测量包含整个微卫星的聚合酶链反应扩增子的长度。这需要DNA、一对引物(其中之一常进行末端荧光标记)、测序仪和适宜的软件。备选地,如果对扩增子进行测序,则可以简单地计数重复单位的数目。MSI也可以通过检测错配修复基因之一的免疫组织化学(IHC)染色的丢失来直接诊断。免疫组织化学法和基因法都表征为大量的假阳性,为此,在常规诊断背景中进行免疫组织化学和基因水平的组合评估。
人基因组中有至少500 000个微卫星,由于MMR缺陷并非影响给定肿瘤中的所有微卫星,研究一个以上微卫星和研究常受不稳定性影响的微卫星很重要。由于微卫星标记最初由研究人员根据它们自己的实验非常随机地挑选,在Bethesda,MD举行了会议来讨论该问题,并提出建议来促进研究之间的一致性。这导致称为Bethesda系列9的“金标准”标记系列的推荐。此系列由三个二核苷酸重复(D2S123、D5S346、D17S250)和两个单核苷酸重复(BAT26、BAT25)组成,且仍是MSI的标准测试。已提出,如果40%或更多的测试标记不稳定(也称为MSI-高或MSI-H),则认为肿瘤MSI阳性。在使用五标记系列时,这意味着在它们中的至少两个为阳性时称为MSI;但是,具有MSI的肿瘤中通常有四个或全部五个为阳性。全部五个标记测试为阴性的肿瘤称为微卫星稳定(MSS)。对于在1个肿瘤标记上(或<30%的肿瘤标记上)测试为阳性的肿瘤,提出了术语MSI-L9
虽然仍认为Bethesda系列是标准,但已知它具有比较低的敏感性(也取决于哪一个MMR基因突变)。例如,对于具有MLH1突变的患者,敏感性为80%,但对于具有MSH6突变的患者,它仅为55%10。这可以通过加入其他标记来改善10,但实际上为MSI-H的患者仍可以呈现为MSI-L或MSS。这并非没有意义,因为MSI状态在几种癌症(例如Lynch综合症的那些)的预后(MSI-H患者通常较好11)、治疗(MSI-H肿瘤不响应基于氟-尿嘧啶(FU)的辅助性治疗,因为需要完整的MMR系统来诱导具有FU修饰的DNA的细胞的凋亡11-13)和诊断中很重要,新诊断的结直肠癌(CRC)患者常进行MSI状态筛查。
另一显著的劣势是,Bethesda系列仅推荐用于结肠癌,即使已知其他显示MSI的癌症9。这似乎是由于这样的事实,这五个标记是非常随机地鉴定为在微卫星不稳定结肠癌中突变,但生物学机制未知。
另一劣势属于技术性的。Bethesda标记系列包含非常长的重复(例如,BAT26标记包含26核苷酸A重复),用来测定MSI状态的典型PCR产物超过100bp。为了准确测序这些片段并测定重复的精确长度,通常与多毛细管凝胶电泳结合使用基于Sanger的测序方法。但是,越来越多的实验室使用所谓的“下一代”测序,下一代测序利用大规模并行测序技术。虽然更便宜,但这些技术利用较短的阅读,且不能用来检测Bethesda标机系列上的微卫星不稳定性。因此,实验室需要维持两台测序仪:一台用于Bethesda标机系列筛查,一台用于其他实验。如果状态不需要特殊的测序仪来测定MSI,且此测定可以在常用的设备上进行,则它将方便得多。
因此,找到比目前使用的Bethesda系列更敏感同时保持对MSI的特异性的微卫星不稳定性标记将是有利的。理想地,用无偏检测法找到这些标记(即在整个基因组内寻找而不是检查认为在疾病背景中改变的具体区域)。另一优势是指示MSI的标记的鉴定本身。这就是说,它们是微卫星不稳定性的通用标记,而不仅仅是结肠癌中的微卫星不稳定性的标记(如Bethesda系列的情况)。这确实将避免找到其中可以存在MSI的每种癌症的新标记的需要。另一优势将是可以不依赖于技术地测定其状态的标记的鉴定。更具体而言,可以用下一代测序技术鉴定(而不是仅用Sanger测序鉴定)的标记。这样,实验室无需保持它们仅用于检查Bethesda系列标记的仪器。
此外,还存在进一步优化MMR特异性治疗例如以更合理地预测它们对靶向治疗的反应的巨大需要。另外,存在找到克服对常用治疗的抗性的方式的需要,例如,通过鉴定MMR缺陷肿瘤对其敏感的治疗,即使它们对标准治疗具有抗性。
发明概述
本发明的目的是提供用于测定具体癌症的MSI状态的更好的标记。为了确保检测无偏,我们在此首次报道错配修复缺陷肿瘤的下一代测序。选择不处于长微卫星中的标记,使得它们的检测不依赖于Sanger测序技术。另外,为了扩大标记的适用性,在不同肿瘤类型中评价了标记,使得它们代表多种癌症的微卫星不稳定性标记,而不是癌症类型特异性标记。最后,选择经常存在于肿瘤中的标记。有趣地,许多频发(热点)突变聚集在影响DNA双链断裂修复途径的基因中,且可以显示此途径在功能上受影响。因此,可以证明,这些标记为阳性的肿瘤对DNA碱基切除修复酶抑制剂(如PARP抑制剂)的抑制敏感:这产生合成致死相互作用。
如将在实施例章节中展开,下一代测序允许鉴定可以用来检测MMR缺陷且符合这些条件的新的标记系列。
鉴定出的标记可以分为两类:存在于具体基因的编码区(即外显子)中的微卫星区域中的插入/缺失,及存在于具体基因的非编码区(最尤其是5’和3’UTR区)中的插入/缺失。
因此,本文提供诊断肿瘤的MSI状态的方法,其包括测定插入/缺失在肿瘤DNA样品中的至少两个微卫星区域中的存在,其中该至少两个微卫星区域是:
-存在于来自表1中所列基因的5’UTR区或3’UTR区中的至少两个微卫星区域;或
-选自存在于表2中所列基因的外显子中的那些和/或存在于来自表1中所列基因的5’UTR区或3’UTR区中的那些的至少三个微卫星区域;
其中至少一个插入/缺失的存在指示MSI。
根据其他具体实施方案,该微卫星区域是同聚物区域。还根据其他具体实施方案,该微卫星区域与表1或2中鉴定的微卫星区域相同(即该至少两个微卫星区域选自表1或2中所列的微卫星区域的列表)。
根据具体实施方案,存在于UTR中的微卫星区域可以选自表4而不是表1。根据其他具体实施方案,这些微卫星区域可以选自表6而不是表1。
根据备选而非排他的具体实施方案,存在于基因的外显子中的微卫星区域可以选自表5而不是表2。根据其他具体实施方案,该区域可以选自表7而不是表2。
根据非常具体的实施方案,该微卫星区域可以选自表8中所列的基因。
根据具体实施方案,诊断其MSI状态的癌症或肿瘤选自:结直肠癌、子宫内膜癌、卵巢癌、胃癌、白血病和Lynch综合症的肿瘤。
由于非编码区(如5’和3’UTR区)中的微卫星中的插入/缺失经受了比编码区中的插入/缺失少的选择压力(后者由此导致移码突变,产生完全不同于最初的翻译),可以证明,来自非编码区的微卫星中的插入/缺失是不同癌症类型中MSI的可靠标记。事实上,在证明具有MSI的MMR缺陷肿瘤上测试时,本文鉴定的超过50%的非编码区标记评分为阳性。对于外显子标记,在这些肿瘤上测试时,仍有超过1/3评分为阳性。这解释了为什么设想在至少部分标记处于外显子区中时使用至少三个标记。
还尤其设想使用外显子区中的标记和非编码区中的标记的组合。例如,根据具体实施方案,其中测定插入/缺失的存在的该至少两个微卫星区域是选自存在于来自表1中所列基因的5’UTR区或3’UTR区中的那些的至少两个微卫星区域和选自存在于表2中所列基因的外显子中的那些的至少两个微卫星区域。
根据具体实施方案,设想使用多于至少两个或三个的标记。使用更多的标记通常将产生更准确的诊断(虽然此益处将增加成本。另外,一旦高于标记的某个阈值,加入另一标记的相对价值即受限,因为它并非必然增加信息)。因此,根据具体实施方案,使用至少4、5、6、7或8个标记(即选自存在于表2中所列基因的外显子中的那些和/或存在于来自表1中所列基因的5’UTR区或3’UTR区中的微卫星区域中的插入/缺失)。根据另一具体实施方案,用至少8、9、10、11或12个插入/缺失在选自存在于表2中所列基因的外显子中的那些和/或存在于来自表1中所列基因的5’UTR区或3’UTR区中的那些的微卫星区域中的存在来测定MSI状态。根据其他具体实施方案中,还使用甚至更多的标记,例如至少15个、至少20个、至少25个、至少30个、至少35个、至少40个标记、或至少50个标记。
根据具体实施方案,所使用的至少一个标记是之前未与癌症相关的基因中或之前未知在MMR缺陷肿瘤中受影响的基因中的外显子标记。因此,设想选自存在于表2中所列基因的外显子中的那些的一个或多个微卫星包含存在于选自以下的基因中的至少一个微卫星:SETD1B、RBMXL1、CCDC150、OR7E24、C15orf40、KIAA2018、LTN1、SLC22A9、CDH26、DDX27、EXOSC9、FAM111B、KIAA0182、KIAA1919、MIS18BP1、PRRT2、TMEM60、AQP7、ARV1、CCDC168、ELAVL3、F8、FETUB、HPS1、NBEAL1、P4HTM、PIGB、RBM43、RG9MTD1、SRPR和TMEM9。根据甚至更具体的实施方案,至少一个微卫星存在于选自以下的基因中:SETD1B、TMEM60、DDX27、EXOSC9、FAM111B和KIAA1919。根据备选实施方案,SEC31A、CNOT2、RNF145、RNPC3、SLC35F5、TMBIM4、CD3G、DOCK3、MYO10和PRRG1也可以用于这些列表中。
根据备选的具体实施方案,所使用的至少一个标记是定位于5’或3’UTR区中的10和15个重复碱基之间的同聚物中的插入/缺失。
尤其设想的标记系列是表3中所示基因中的微卫星。因此,根据这些实施方案,提供这样的方法,其中测定插入/缺失在肿瘤DNA的样品中的至少两个微卫星区域中的存在,其中该至少两个微卫星区域是来自表3中所示的56个基因的微卫星区域。
根据具体实施方案,MSI状态可以进一步表征如下:如果所研究的微卫星区域的17%或更多包含插入/缺失,则该肿瘤为MSI-H,如果2%和17%之间的微卫星区域包含插入/缺失,则该肿瘤为MSI-L,如果不到2%的微卫星区域包含插入/缺失,则该肿瘤为微卫星稳定(MSS)。作为实例,对于56个标记的实例,如果0个或1个标记为阳性,则将该肿瘤分类为MSS,如果2至9个为阳性标记,则该肿瘤是MSI-L,如果10个或更多个为阳性标记,则将该肿瘤分类为MSI-H。备选地,来自Bethesda系列的范围可以外推(10个中的0个是阳性标记是MSS,10个中的1个或2个是阳性标记为MSI-L,3个或更多个是阳性标记为MSI-H;其对应于在MSS和MSI-L之间区分的1%和9%之间的阳性标记及分类为MSI-H的超过20%阳性标记的边界)。
根据具体方面,本文提供的微卫星插入/缺失标记可以独立于所使用的技术检测。但是,尤其设想不通过基于Sanger测序的方法来进行插入/缺失的存在的测定。这是因为用Bethesda标记系列检测微卫星不稳定性的方法通常通过Sanger测序进行,Sanger测序是证明非常麻烦的流程。根据其他实施方案,尤其设想通过单碱基对延伸法(如SequenomMassArray)、DNA杂交技术(例如Taqman)、熔解曲线分析(包括HRM)或类似技术测定插入/缺失的存在。
根据另一方面,提供用于测定肿瘤样品中的MSI的生物标志系列。这种生物标志序列包含选自存在于来自表1中所列基因的5’UTR区或3’UTR区中的那些和存在于表2中所列基因的外显子中的那些的至少八个微卫星区域。根据非常具体的实施方案,该生物标志系列包含表3中所列微卫星区域的至少一半。根据其他具体实施方案,该生物标志系列由表3中所列的56个微卫星区域所代表。
尤其设想此生物标志系列可以用来检测癌症中的MSI状态。因此,提供此生物标志系列在诊断癌症中的微卫星不稳定性中的用途。
因此,提供本文所述的生物标志系列用作药物。更具体而言,提供本文所述的生物标志系列用作诊断剂。更具体而言,提供本文所述的生物标志系列用于诊断癌症中的微卫星不稳定性。
根据其他实施方案,提供用于测定肿瘤样品中的MSI的试剂盒,其包含对生物标志系列(即选自存在于来自表1中所列基因的5’UTR区或3’UTR区中的那些和存在于表2中所列基因的外显子中的那些的至少八个微卫星区域)进行基因型分型的工具。最具体而言,该试剂盒将适于尤其设想的一个或多个生物标志系列。根据具体实施方案,该试剂盒将包含对Bethesda系列标记或扩展的Bethesda系列标记进行基因型分型的工具。这类试剂盒尤其适于进行该标记与Bethesda系列的并肩比较。
如实施例章节中所示,本文提供的插入/缺失标记富集在涉及DNA双链断裂修复途径并影响其功能性的基因中。因此,其中存在这些标记的细胞对DNA碱基切除修复抑制的合成致死性敏感。这提供了新的治疗机会,因为MSI阳性肿瘤常对所使用的标准化疗具有抗性。
因此,在另一方面,提供筛查癌细胞对DNA碱基切除修复酶抑制剂处理的敏感性的方法,其包括测定该癌细胞中的MSI状态。根据具体实施方案,该DNA碱基切除修复酶抑制剂是PARP抑制剂。根据具体实施方案,该癌细胞来自选自以下的癌症:结直肠癌、子宫内膜癌、卵巢癌、胃癌、白血病和Lynch综合症的肿瘤。虽然这些方法基本上可以在体内、离体和在体外进行,但尤其设想在体外进行它们。
根据具体实施方案,MSI的存在指示癌细胞对DNA碱基切除修复酶抑制剂处理的敏感性;即在用这种抑制剂处理时,该癌细胞将死亡、停止生长或更少地增殖。
根据具体实施方案,该癌细胞是获自个体的细胞,且对DNA碱基切除修复酶抑制剂处理的敏感性的筛查用于指导该个体的处理。根据备选实施方案,该敏感性筛查用于分层或分类个体进行临床试验。
根据具体实施方案,通过本文所述的方法来确定MSI的存在,即包括测定插入/缺失在肿瘤DNA的样品中的至少两个微卫星区域中的存在的方法,其中该至少两个微卫星区域是:
-存在于来自表1中所列基因的5’UTR区或3’UTR区中的至少两个微卫星区域;或
-选自存在于表2中所列基因的外显子中的那些和/或存在于来自表1中所列基因的5’UTR区或3’UTR区中的那些的至少三个微卫星区域;
其中至少一个插入/缺失的存在指示MSI。
根据其他具体实施方案,用本文所述的生物标志系列确定MSI的存在,即包含选自存在于来自表1中所列基因的5’UTR区或3’UTR区中的那些和存在于表2中所列基因的外显子中的那些的至少八个微卫星区域的生物标志系列。
因此,不仅提供筛查癌细胞对DNA碱基切除修复酶抑制剂处理的敏感性的方法,还提供诊断患有癌症的个体对DNA碱基切除修复酶抑制剂处理的敏感性的方法,其包括以下步骤:
-测定获自该个体的癌细胞的样品中的MSI状态;
-将该MSI状态与对DNA碱基切除修复酶抑制剂处理的敏感性相关,其中MSI的存在指示对该处理的敏感性。
可选地,这些方法包括从该个体获得癌细胞的样品的附加步骤(在测定步骤之前)。然后通常在所获得的样品的细胞中进行MSI状态的测定。尤其设想在体外进行癌细胞的样品中的MSI状态的测定。
根据具体实施方案,该DNA碱基切除修复酶抑制剂抑制剂是PARP抑制剂。根据具体实施方案,该癌细胞来自选自以下的癌症:结直肠癌、子宫内膜癌、卵巢癌、胃癌、白血病和Lynch综合症的肿瘤(或Lynch综合症谱的任意其他肿瘤)。根据具体实施方案,通过本文所述的方法来确定MSI的存在,即包括测定插入/缺失在肿瘤DNA的样品中的至少两个微卫星区域中的存在的方法,其中该至少两个微卫星区域是:
-存在于来自表1中所列基因的5’UTR区或3’UTR区中的至少两个微卫星区域;或
-选自存在于表2中所列基因的外显子中的那些和/或存在于来自表1中所列基因的5’UTR区或3’UTR区中的那些的至少三个微卫星区域;
其中至少一个插入/缺失的存在指示MSI。
根据其他具体实施方案,用本文所述的生物标志系列确定MSI的存在,即包含选自存在于来自表1中所列基因的5’UTR区或3’UTR区中的那些和存在于表2中所列基因的外显子中的那些的至少八个微卫星区域的生物标志系列。
还设想此方面的方法可以包括用DNA碱基切除修复酶抑制剂处理该个体的步骤(如果通过MSI状态确定该个体对这种处理敏感)。
因此,还提供用于在有需要的个体中治疗具有MSI的癌症的方法,其包括:
-确定MSI在该癌症中的存在;
-对该个体施用DNA碱基切除修复酶抑制剂。
设想通过对该个体施用该抑制剂来治疗该癌症。该方法可以可选地具有从该个体获得癌细胞的样品的附加步骤(在测定MSI和确定MSI的存在的步骤之前)。
根据具体实施方案,该DNA碱基切除修复酶抑制剂抑制剂是PARP抑制剂。根据具体实施方案,该癌细胞来自选自以下的癌症:结直肠癌、子宫内膜癌、卵巢癌、胃癌、白血病和Lynch综合症的肿瘤。根据具体实施方案,通过本文所述的方法来确定MSI的存在,即包括测定插入/缺失在肿瘤DNA的样品中的至少两个微卫星区域中的存在的方法,其中该至少两个微卫星区域是:
-存在于来自表1中所列基因的5’UTR区或3’UTR区中的至少两个微卫星区域;或
-选自存在于表2中所列基因的外显子中的那些和/或存在于来自表1中所列基因的5’UTR区或3’UTR区中的那些的至少三个微卫星区域;
其中至少一个插入/缺失的存在指示MSI。
根据其他具体实施方案,用本文所述的生物标志系列确定MSI的存在,即包含选自存在于来自表1中所列基因的5’UTR区或3’UTR区中的那些和存在于表2中所列基因的外显子中的那些的至少八个微卫星区域的生物标志系列。
附图简述
图1.MSH6缺陷高变体中的体细胞取代和插入/缺失。
(a)MMR缺陷肿瘤和两种MMR健全肿瘤中的平均突变频率(每mpb碱基的突变数,)。(b)按插入/缺失和取代分层的突变频率。(c-d)在微卫星、同聚物(长度超过5bp)、短同聚物(长度为3至5bp)中及“不在重复区域中”观察到的插入/缺失的分数,与它们在这些区域中的预期分数相比。(e-f)分层为外显子、基因间和内含子区域的MMR缺陷肿瘤中的插入/缺失(e)和取代(f)的频率。
图2.MSH6缺陷高变体中的体细胞突变和插入/缺失模式。
(a)黑素瘤、小细胞肺癌、非小细胞肺癌、MMR缺陷子宫内膜肿瘤、两种MMR健全子宫内膜肿瘤的全基因组序列和来自子宫内膜肿瘤患者的匹配种系DNA(外周白细胞)中的体细胞取代模式。(b-c)MMR缺陷(b)和MMR健全(c)肿瘤中的体细胞取代频率按第一个核苷酸突变的二核苷酸分层。归一化的取代频率反映受影响的二核苷酸的数目除以那些二核苷酸的全基因组数目,表示为总取代频率的百分比。(d)预测MMR缺陷肿瘤中的取代频率的基因组特征多变量线性回归模拟。所展示的是显示取代频率和基因组特征之间相关的按取代的数目排序的基因组特征数据的热图。在热图右侧的条形图中展示各基因组特征的源自线性模型的T值,并显示显著性(灰色阴影等于P>0.01)和相关方向。为了在单个热图中容纳不同尺度的各特征,按百分位数分布展示基因组特征数据,白色和红色分别表示低和高百分位数。因为数目不足以按1Mb窗口进行模拟,将CpG位点中的G:C>A:T转换按10Mb窗口分级。(e)高变体中每1Mb窗口的取代、转换(排除CG中的G:C>A:T)和颠换的频率对按十分位数分级的该窗口的复制时间。频率相对于最早窗口复制展示。误差棒表示平均值的标准误(对于复制时间超过0.2的取代和转换,P<0.01)。(f)CpG岛内和CpG岛外的取代、转换(排除CG中的G:C>A:T)和颠换的频率,相对于其在高变体中的全基因组频率。(g)预测MMR缺陷肿瘤中的插入/缺失频率的基因组特征多变量线性回归模拟。热图和条形图如针对系列(d)所述。(h)MMR缺陷肿瘤中按核苷酸分层的受插入/缺失影响的同聚物的分数,与具有该核苷酸含量的同聚物的全基因组分数相比。(i)插入或缺失所示数目的碱基的所有插入/缺失的分数。(j-k)高变体中的体细胞取代和最接近的体细胞插入/缺失(j)或取代(k)之间的距离及基于20个随机模型的预期距离。
图3.10个MMR缺陷外显子组的体细胞突变模式。
(a)10个MMR缺陷肿瘤和4个MMR健全肿瘤的编码外显子中的平均突变频率。(b)按插入/缺失和取代分层的10个MMR缺陷肿瘤对4个MMR健全肿瘤的编码外显子中的平均突变频率。(c-d)MMR缺陷外显子(c)和一组公开的种系从头取代(d)中按二核苷酸(第一个核苷酸突变)分层的取代频率。作图的归一化取代频率反映受影响二核苷酸的数目除以那些二核苷酸的全基因组数目,并表示为总体细胞取代频率的百分比。(e)在MLH1缺陷和MSH2缺陷肿瘤中在微卫星、同聚物、短同聚物中及不在重复区域中观察到的插入/缺失的分数,与这些区域的全基因组分数相比。
图4.MMR缺陷肿瘤的外显子组、5’和3’UTR中的热点突变。
(a)同聚物的分数作为其在编码区、5’和3’UTR中的长度的函数。(b)受插入/缺失影响的同聚物的分数作为编码区、5’和3’UTR中的同聚物长度的函数。(c)MMR缺陷肿瘤的编码区、5’和3’UTR中的平均体细胞插入/缺失频率。(d)经常受插入/缺失影响的同聚物的分数作为编码区、5’和3’UTR的同聚物长度的函数。
图5.评估MSI的Bethesda和56标记热点突变系列。
在114个未选择的原发性子宫内膜肿瘤的独立系列中分析了扩展的Bethesda系列及通过外显子组测序鉴定的外显子、5’和3’UTR中的56个热点突变的系列。结果基于扩展的Bethesda系列按照高微卫星不稳定性(MSI-H)、低微卫星不稳定性(MSI-L)或微卫星稳定(MSS)状态进行颜色编码。
图6.通过HR途径影响DNADSB修复的体细胞突变。
通过HR途径修复DSB的示意图(修改自IPA同源重组途径示意图)。标记为橙色(灰色背景)的基因携带我们自己的MMR缺陷肿瘤集中或来自公开可得的TCGA数据集的MSI-H肿瘤中的体细胞突变。
图7.MMR缺陷细胞对PARP抑制敏感。
(a)染色DNA修复标记RAD51(绿色)并用DAPI(蓝色)复染的暴露于0或10μMolaparib的MMR缺陷和MMR健全原代肿瘤细胞的代表性共焦图像。箭头(黄色)指示包含超过5个绿色核点的RAD51阳性细胞。(b)含有>5个RAD51核点的细胞的定量。显示用olaparib(10μM)或载体对照处理后24小时时8种不同的MMR缺陷细胞和4种不同的MMR健全细胞的培养物的平均值。(c-d)8种MMR缺陷细胞(c)和4种MMR健全细胞(d)伴随olaparib的浓度递增(1μM、3μM、10μM)的平均细胞增殖。用xCELLigence RTCA DP系统(Roche Applied Science)测量实时细胞增殖直至处理后48小时。将值对模拟处理的对照(0μM olaparib)归一化。误差棒代表平均值的标准差。星号表示,在所示时间点,处理的细胞和模拟处理的细胞之间统计上显著的差异(P<0.05)。(e)每种细胞培养物的细胞增殖率(MMR缺陷细胞以蓝色显示(图中靠下的8个)和MMR健全细胞以红色显示(图中靠上的4个))。总的来说,MMR缺陷细胞表征为增殖的剂量依赖性减少,而MMR健全细胞未响应olaparib(重复测量P=2.0E-7;还见图7c)。
发明详述
定义
将就具体实施方案并参考某些附图描述本发明,但本发明不限于这些具体实施方案和附图,而是仅通过权利要求来限制。权利要求中任何参考符号不应解释为限制范围。所述附图仅是示意性和非限制性的。在附图中,为了说明的目的,一些元素的大小可以夸大,而不是按比例绘制。在本说明书和权利要求中使用术语“包含”时,它不排除任意其他元素或步骤。在提到单数名词时使用不定冠词或定冠词(例如“一”、“一个”、“该”)时,除非另有明确说明,这包括多个该名词。
此外,本说明书和权利要求中的术语第一、第二等用于在相似的元素之间进行区分,并非必然用于描述连续顺序或时间顺序。应理解,这样使用的术语在适当环境下可互换,本文所述的本发明的实施方案能够以本文所描述或说明的顺序之外的其他顺序操作。
提供以下术语或定义仅是为了辅助理解本发明。除非文中明确定义,本文所用的所有术语具有与它们之于本发明所属领域的技术人员相同的含义。对于本领域的定义和术语,从业者尤其可参考Sambrook等,Molecular Cloning:A Laboratory Manual,第2版,Cold Spring Harbor Press,Plainsview,New York(1989);和Ausubel等,CurrentProtocols in Molecular Biology(Supplement 47),John Wiley & Sons,New York(1999)。本文提供的定义不应解释为具有比本领域普通技术人员的理解小的范围。
本文所用的术语“微卫星”或“微卫星区域”指核苷酸序列中由至少两个重复单位组成且具有最少6个碱基的长度的单核苷酸、二核苷酸、三核苷酸、四核苷酸、五核苷酸或六核苷酸重复。微卫星的具体亚类包括同聚物。本文所用的“同聚物”指微卫星区域,其是至少6个碱基的单核苷酸重复;换言之,如果在DNA水平看,则是至少6个连续的A、C、T或G残基的一段序列。最尤其是,在测定微卫星时,审视个体的基因组DNA(或存在于个体中的癌症的基因组DNA)。
本申请中所用的术语“MSI状态”指微卫星不稳定性(MSI)的存在,微卫星不稳定性是微卫星中重复DNA核苷酸单位数目的克隆改变或体细胞改变。MSI状态可以是三个离散种类之一:MSI-H,也称为MSI-高、MSI阳性或MSI;MSI-L,也称为MSI-低;或微卫星稳定(MSS),也称为缺乏MSI。通常,为了分类为MSI-H,用于分类MSI状态的标记中的至少20%需评分为阳性,而对于MSS分类,不到2.5%评分为阳性。如果中间数目的标记评分为阳性,则将肿瘤分类为MSI-L。应注意,由于这些初始界限衍生自扩展的Bethesda标记系列(其仅由10个标记组成),由于通常将评估不到100个标记,且阳性标记的数目是整数,该百分比是近似值。MSS和MSI-L之间的差异通常将是1%和9%之间的标记评分为阳性(在评估10个标记时,这意味着1个阳性标记导致MSI-L分类),而MSI-L和MSI-H之间的差异通常将是15%和25%之间的阳性标记(即,在该阈值之上,肿瘤是MSI-H,在该阈值之下,肿瘤是MSI-L)。备选地,仅评估微卫星不稳定性的存在和缺乏之间的差异而不是在三个种类中进行区分,在这种情况下,该状态为存在MSI或缺乏MSI(=MSS)。鉴于完整的错配修复(MMR)系统的缺乏和MSI的存在之间的相关性,诊断MSI的存在(或诊断MSI状态)可以解释为诊断MMR效率。但是,应注意,MMR可以有功能或缺乏,不存在中间种类。因此,MSI-L也对应于MMR缺陷——这种情况等同于仅评估MSI的存在或缺乏。
“诊断肿瘤的MSI状态”或“诊断个体中肿瘤的MSI状态”或“诊断个体的MSI状态”或“测定肿瘤(或个体)的MSI状态”在本文中认为是同义词。测定(或诊断)MSI状态通常暗示基于在所研究的微卫星区域中检测到一个或多个插入/缺失的存在而得出MSI的结论,或基于未在所研究的微卫星区域中检测到插入/缺失而得出缺乏微卫星不稳定的结论。因此,在微卫星区域中“测定插入/缺失的存在”意指在该微卫星区域中评估或检测插入/缺失的存在或缺乏。同样,在至少两个微卫星区域中测定插入/缺失的存在意指在该至少两个微卫星区域的每一个中评估或检测插入/缺失的存在或缺乏。至少一个插入/缺失的存在指示MSI(如本申请中所解释,确定MSI所需的阳性标记的精确数目将取决于所使用的标记的数目)。
本文所用的“插入/缺失”指包括插入、缺失二者及其组合的突变种类。微卫星区域中的插入/缺失导致核苷酸的净获得或丧失。可以通过将它与其中不存在插入/缺失的DNA相比(例如将来自肿瘤样品的DNA与来自具有该肿瘤的个体的种系DNA相比),或者尤其是在单态微卫星或同聚物的情况下,通过将它与该微卫星的已知长度相比(尤其是通过计数重复单位的数目),可以确定插入/缺失的存在。根据具体实施方案,尤其设想插入/缺失具有1和5个核苷酸之间的长度(即微卫星或同聚物的长度比该微卫星或同聚物的正常已知长度长或短1至5个核苷酸)。根据其他具体实施方案中,该插入/缺失具有1至4个核苷酸、1至3个核苷酸或1或2个核苷酸的长度。应注意,由于插入/缺失可以是插入和缺失的组合,改变的核酸序列可以比该长度参考大(例如,5个核苷酸的缺失与3个核苷酸的插入导致长度改变2,但微卫星的序列也可以改变)。但是,最典型地,插入/缺失将是通常为1或2个核苷酸的插入或缺失。
“单态微卫星”是其中所有个体、尤其是给定群体的所有个体具有相同数目的重复单位的微卫星。这与“多态微卫星”不同,多态微卫星用来指其中给定群体的超过1%展示重复单位数目的杂合性的微卫星。作为实例,BAT26标记在超过99%的欧洲人种中由26个腺嘌呤组成,而在至多25%的美国人种(包括非洲裔美国人)中观察到在此位置具有不同数目的腺嘌呤(例如15、20、22、23)的等位基因17。因此,BAT26在欧洲人种是单态微卫星,在美国人种是多态微卫星16
“肿瘤DNA的样品”指可以用作进行测序的基础的任意样品,其中存在来自癌症的DNA。本文所用的术语“癌症”指涉及失调的细胞生长的不同疾病,还指恶性肿瘤。术语“肿瘤”在本申请中用作同义词。设想此术语涵盖所有实体瘤类型(癌、肉瘤、胚细胞瘤),但它还明确涵盖非实体癌症类型,如白血病、淋巴瘤和骨髓瘤。因此,“肿瘤DNA的样品”也可以是来自患有白血病的人的血液样品。通常,肿瘤DNA的样品已在一个点从个体、尤其是患有癌症的个体分离。可选地,它已进行了一种或多种形式的预处理(例如,裂解、分级分离、分离、纯化)以测序DNA,但也设想测序来自未处理的样品的DNA。本文所用的名词“个体”指单个脊椎动物,更尤其是单个哺乳动物,最尤其是单个人类。本文所用的“个体”通常是人,但也可以是哺乳动物,尤其是驯养动物,如猫、狗、兔、豚鼠、雪貂、大鼠、小鼠等,或农场动物,如马、牛、猪、山羊、绵羊、驼羊等。个体还可以是非哺乳动物脊椎动物,如鱼类、爬行动物、两栖动物或鸟类;基本上任意可发展癌症的动物都符合该定义。
本文所用的术语“结直肠癌”意在包括结肠的恶性肿瘤(ICD-10中的C18)、直肠乙状结肠连接部的恶性肿瘤(ICD-10中的C19)、直肠的恶性肿瘤(ICD-10中的C20)及肛门和肛管的恶性肿瘤(ICD-10中的C21)。
本文所用的术语“Lynch综合症”指常染色体显性遗传病症,其具有结肠或结直肠癌以及其他癌症(包括子宫内膜癌、卵巢癌、胃癌、小肠癌、肝胆管癌、上尿道癌、脑癌和皮肤癌)的高风险。这些癌症的高风险是由使DNA错配修复受损的遗传突变引起。该病症的旧名是HNPCC。
本文所用的“DNA碱基切除修复酶抑制剂”指可以在DNA水平(通过抑制相关基因产物的形成,即通过阻止或干扰转录)、在RNA水平(通过中和或去稳定mRNA来阻止或干扰翻译)或在蛋白质水平(通过中和或抑制涉及BER的蛋白质)干扰基因产物的碱基切除修复功能的物质。尤其设想该抑制剂是PARP抑制剂,因为这类抑制剂已良好地表征。最尤其设想的是PARP-1和/或PARP-2的抑制剂,因为这些酶是最活跃地涉及BER的PARP。但是,也可以使用其他PARP的抑制剂。在这方面,最近的出版物提出,PARP抑制剂iniparib(明确设想使用)抑制PARP-1和2之外的其他PARP,尤其是PARP-5和6(Ji J,Lee MP,Kadota M等Pharmacodynamic and pathway analysis of three presumed inhibitors of poly(ADP-ribose)polymerase:ABT-888,AZD 2281,和BSI201.Proceedings of the 102ndAnnual Meeting of the American Association for Cancer Research;2011年4月2-6日;Orlando,Fla.AACR.2011.Abstract nr 4527;Maegley KA,Bingham P,Tatlock JH等All PARP inhibitors are not equal:an in vitro mechanistic comparison of PF-01367338 to iniparib.J Clin Oncol.2011;29(增刊;摘要e13576);Nagourney RA,Kenyon KR,Francisco FR等Functional analysis of PARP inhibitors AZD 2281 andBSI-201 in human tumor primary cultures:a comparison of activity andexamination of synergy with cytotoxic drugs.J Clin Oncol.2011;29(增刊;摘要e13599))。
PARP抑制剂的实例包括但不限于iniparib、olaparib、rucaparib、veliparib、CEP9722、MK 4827、BMN-673和3-氨基苯甲酰胺。
详述
发生在错配修复(MMR)缺陷细胞中的DNA复制错误作为错配突变持续存在并使得易感一系列肿瘤。因此,测序了第一个来自MMR缺陷肿瘤的基因组,允许无偏地评估DNA复制错误。观察到突变率相对于MMR健全的肿瘤显著提高。插入或缺失(插入/缺失)突变最常发生,且大致限于同聚物序列,而单碱基对取代主要由A:T>G:C和G:C>A:T转换组成,且更常定位在插入/缺失附近。由于取代率在体细胞插入/缺失附近更高,这暗示插入/缺失突变在DNA复制过程中作为诱变位点。由于阴性克隆选择,体细胞突变率在外显子组中比在基因组的其余部分中低,而由于阳性选择,几个MMR缺陷肿瘤中发生了一些外显子突变。这些频发突变尤其影响在正常匹配组织中表达的基因,暗示它们代表了MMR缺陷肿瘤进程的驱动者。
有趣地,插入/缺失主要定位在同聚物中,尤其是具有增加的长度的同聚物中。这些观察结果还具有中间临床implication。目前用于MSI肿瘤的诊断分类9,14-15的扩展的Bethesda系列仅具有有限的敏感性(即MLH1-、MSH2-和MSH6-缺陷肿瘤的80%、84%和55%16),很可能是因为此系列由8个微卫星及仅2个长度分别为25和26个核苷酸的同聚物标记组成。通过将我们的56个频发插入/缺失的系列应用于114个子宫内膜肿瘤,我们可以证明,至多43%的肿瘤显示可变的MSI程度。这显著高于之前的报道,最可能是因为这些插入/缺失不是随机选择的,而是通过无偏评估频繁影响外显子组、5’和3’UTR的突变鉴定的。我们还观察到,子宫内膜肿瘤中的频发插入/缺失定位在其他癌症类型的MMR肿瘤中。由于3’UTR中的插入/缺失仅由受影响的同聚物的长度决定,而在外显子组中,它们需在源组织表达的基因中进行阳性选择,多种癌症类型所共有的大多数插入/缺失定位在5’和3’UTR。因此,5’和3’UTR或其他非编码序列中的频发突变似乎尤其适于检测多种癌症类型中的MSI。有趣地,最频发的突变的选择系列对检测多种癌症类型中的微卫星不稳定性(MSI)高度敏感。在114个原发性子宫内膜肿瘤中,在几乎一半的肿瘤中观察到了MSI的连续谱,表明MSI比预期更频繁地发生。
如将在实施例章节中、尤其是在实施例5中详述,在MMR缺陷肿瘤中,在5’UTR和3’UTR区中尤其存在更常受插入/缺失影响的同聚物。表1中提供突变最频发的基因的列表。
表1.16个MMR缺陷肿瘤样品中的5’和3’UTR区中最频发的插入/缺失(存在于16个肿瘤样品中的至少4个中)。后两栏分别显示该同聚物有多频繁地受插入或缺失影响。
Figure BDA0003367311410000131
Figure BDA0003367311410000141
Figure BDA0003367311410000151
Figure BDA0003367311410000161
Figure BDA0003367311410000171
Figure BDA0003367311410000181
Figure BDA0003367311410000191
Figure BDA0003367311410000201
Figure BDA0003367311410000211
Figure BDA0003367311410000221
Figure BDA0003367311410000231
Figure BDA0003367311410000241
Figure BDA0003367311410000251
Figure BDA0003367311410000261
Figure BDA0003367311410000271
Figure BDA0003367311410000281
Figure BDA0003367311410000291
Figure BDA0003367311410000301
Figure BDA0003367311410000311
Figure BDA0003367311410000321
Figure BDA0003367311410000331
Figure BDA0003367311410000341
Figure BDA0003367311410000351
Figure BDA0003367311410000361
Figure BDA0003367311410000371
Figure BDA0003367311410000381
Figure BDA0003367311410000391
Figure BDA0003367311410000401
Figure BDA0003367311410000411
Figure BDA0003367311410000421
Figure BDA0003367311410000431
Figure BDA0003367311410000441
Figure BDA0003367311410000451
Figure BDA0003367311410000461
Figure BDA0003367311410000471
值得注意的是,表1中所列基因中的一些在UTR区中具有一个以上频发插入/缺失(例如CALN1、EIF4G3、KDM5A),这增加了这些基因组区域并非随机地受影响而是经历了阳性选择的可能性。
重要地,在MMR缺陷肿瘤中,外显子区中的同聚物也更频繁地受插入/缺失影响。如在例如实施例4中所解释,这不是基于序列长度,而是由阳性克隆选择引起。所以,虽然通常较不频繁地突变,但这些突变可以是肿瘤进程的驱动者。表2中提供在其外显子区中最频繁地受插入/缺失影响的31个基因的列表。
表2.16个MMR缺陷肿瘤样品的外显子中最频发的插入/缺失。后两栏分别显示该同聚物有多频繁地受插入或缺失影响。
Figure BDA0003367311410000481
Figure BDA0003367311410000491
Figure BDA0003367311410000501
Figure BDA0003367311410000511
如实施例章节中详述,取自表1的超过50%的标记在MMR缺陷肿瘤的随机组中评分为阳性,而表2中所列外显子标记的超过三分之一的情况也如此。这允许以高准确性和确定性将MMR缺陷肿瘤分类为MSI阳性。
因此,提供诊断肿瘤的MSI状态的方法,其包括测定插入/缺失在肿瘤DNA样品中的至少两个微卫星区域中的存在,其中该至少两个微卫星区域是:
-存在于来自表1中所列基因的5’UTR区或3’UTR区中的至少两个微卫星区域;或
-选自存在于表2中所列基因的外显子中的那些和/或存在于来自表1中所列基因的5’UTR区或3’UTR区中的那些的至少三个微卫星区域,其中至少一个插入/缺失的存在指示MSI。
尤其是,该微卫星区域是同聚物区域。它们最尤其是与表1或2中所列的同聚物区域相同。
尤其设想使用几个标记,因为这提高MSI分类的效力并提高敏感性。尤其是,使用来自表1的UTR标记和来自表2的外显子标记的混合。几个标记可以是来自每个列表的至少2个,但标记总数尤其是至少5个、至少8个、至少10个、至少12个、至少15个、至少20个。
备选地,标记可以选自表4或选自表6或表8,而不是表1。标记可以选自表5或选自表7或表8,而不是表2。
根据具体实施方案,所使用的至少一个标记是之前未与癌症相关的基因中或之前未知在MMR缺陷肿瘤中受影响的基因中的外显子标记。因此,设想选自存在于表2中所列基因的外显子中的那些的一个或多个微卫星包含存在于选自以下的基因中的至少一个微卫星:SETD1B、RBMXL1、CCDC150、OR7E24、C15orf40、KIAA2018、LTN1、SLC22A9、CDH26、DDX27、EXOSC9、FAM111B、KIAA0182、KIAA1919、MIS18BP1、PRRT2、TMEM60、AQP7、ARV1、CCDC168、ELAVL3、F8、FETUB、HPS1、NBEAL1、P4HTM、PIGB、RBM43、RG9MTD1、SRPR和TMEM97。根据甚至更具体的实施方案,至少一个微卫星存在于选自以下的基因中:SETD1B、TMEM60、DDX27、EXOSC9、FAM111B和KIAA1919。根据备选实施方案,SEC31A、CNOT2、RNF145、RNPC3、SLC35F5、TMBIM4、CD3G、DOCK3、MYO10和PRRG1也可以用于这些列表中。
根据备选的具体实施方案,所使用的至少一个标记是位于5’或3’UTR区中的10和15个重复碱基之间的同聚物中的插入/缺失。这类同聚物的具体实例包括但不限于以下基因列表的3’UTR区中的同聚物:WIPF2、NARG2、AHCYL1、C17orf63、CD5L、CEP170、COL5A2、CSNK1G3、DIDO1、EIF4G3、GSK3B、KCNMB4、MAPK1IP1L、NPR3、PI15、PRTG、RASGRP1、SH3KBP1、SHROOM3、SLC5A3、UBE2Z、ZBTB33、ZNF275、AGPAT3、APH1B、BCL11A、BMPR1B、CALN1、CASK、CBFB、CBX5、CCDC85C、CNOT7、CYP1B1、DRAM2、EDA2R、EDEM3、EGR1、EIF4G3、FAM20B、FCHSD2、FLT1、FMO2、G3BP2、HELZ、HRNR、IER3IP1、KCNG1、KCNK1、KLF3、LHX9、LRRC8D、LYRM1、MED13、MYO5B、NCEH1、PPP1R12A、PPP1R3D、RAB11FIP1、RAB6C、SAMD12、SEMA6A、SLAIN2、SMAD4、TMED7、TMEM57、TMEM65、TNPO1、TOR1AIP2、TRAK2、TRIP11、UST、VEGFA、ZBTB7A、ZKSCAN1、ZNF12和ZNF169。
设计了由取自表1和2的56个标记的选择组成的生物标志系列(见实施例章节)。根据具体实施方案,这些标记用于诊断MSI状态。这56个标记在表3中列出。
表3.56个标记的系列。
Figure BDA0003367311410000521
Figure BDA0003367311410000531
Figure BDA0003367311410000541
尤其设想使用来自此系列的标记(因为它们对频发的插入/缺失尤其敏感),包括来自MYL1、DIDO1、UBE2Z、RYR3、TMEM65、BTBD7、KDM5A、ABAT4、PPM1A、UBA6和ZNF185的列表的一种或多种。此外,尤其是在评估结直肠肿瘤的MSI状态时,还设想ARL10、GRIA2和TMC7。这些既敏感又特异(即检测到非常少的假阳性MSI病例)。
根据非常具体的实施方案,可以用来自MSH6(外显子插入/缺失)和/或SULF2(3’UTR缺失)的微卫星补充该56标记系列。
根据备选实施方案,未评价MSH6中的插入/缺失,因为这是已知的MMR缺陷基因。虽然已知MSH3基因也是MMR缺陷基因,但此基因的缺陷通常与MSI不相关27。然而,根据具体实施方案,未用MSH3中的插入/缺失作为标记。
如实施例章节中详述,可以对表1的标记应用附加的过滤步骤,排除在我们的专有基因组数据库的种系中作为变体存在的标记。应注意,这些全都是稀有变体,因为它们不存在于dbSNP中或1000Genomes数据库中。此标记列表在表4中显示(至少在16个肿瘤样品的4个中发生)。
表4.附加的过滤步骤后16个MMR缺陷肿瘤样品的5’和3’UTR区中最频发的插入/缺失。
Figure BDA0003367311410000551
Figure BDA0003367311410000561
Figure BDA0003367311410000571
Figure BDA0003367311410000581
Figure BDA0003367311410000591
Figure BDA0003367311410000601
Figure BDA0003367311410000611
Figure BDA0003367311410000621
Figure BDA0003367311410000631
Figure BDA0003367311410000641
Figure BDA0003367311410000651
Figure BDA0003367311410000661
Figure BDA0003367311410000671
Figure BDA0003367311410000681
Figure BDA0003367311410000691
Figure BDA0003367311410000701
Figure BDA0003367311410000711
Figure BDA0003367311410000721
Figure BDA0003367311410000731
Figure BDA0003367311410000741
Figure BDA0003367311410000751
Figure BDA0003367311410000761
Figure BDA0003367311410000771
Figure BDA0003367311410000781
Figure BDA0003367311410000791
Figure BDA0003367311410000801
Figure BDA0003367311410000811
Figure BDA0003367311410000821
Figure BDA0003367311410000831
Figure BDA0003367311410000841
Figure BDA0003367311410000851
Figure BDA0003367311410000861
Figure BDA0003367311410000871
Figure BDA0003367311410000881
Figure BDA0003367311410000891
将相同的附加过滤(步骤)应用于表2的标记;结果在表5中列出。
表5.附加的过滤步骤后16个MMR缺陷肿瘤样品的外显子区域中最频发的插入/缺失。
Figure BDA0003367311410000892
Figure BDA0003367311410000901
Figure BDA0003367311410000911
Figure BDA0003367311410000921
根据具体实施方案,其中在UTR区中存在一个以上频发插入/缺失的基因尤其适合作为标记。在这些实施方案中,该基因中的至少一个选自一些列表:ARHGEF11、CBLN2、DIO2、MBNL1(all 5’UTR markers)、ACVR1C、ANKIB1、ATXN1、BCL11A、BCL11B、BCL7A、BOD1L、BTBD7、C11orf58、C14orf101、CACNB4、CALN1、CANX、CASK、CBFB、CBL、CBX5、CCND1、CCND2、CLCN5、CRTC1、CSNK1E、CYP1B1、DCUN1D5、DDHD1、DLGAP2、DSTYK、DTNA、DUT、DYRK2、EBF1、EFNA5、EIF4G3、ELAVL3、EPS15、ERBB2IP、ERBB4、EVI5、FAM116A、FAM126B、FAM20B、FAM46A、FBN2、FBXO27、FGF9、FGFR1OP2、FOXN2、FOXN3、FOXP1、GABRB2、GDAP2、GNAI2、GSK3B、HAS2、HDAC4、HELZ、HIPK2、HNRNPA3、HNRNPK、HUWE1、IGFBP5、INSR、KDM5A、KIAA0825、KIAA1324、KIF1B、KLHL4、LARP4B、LIN7C、LMO4、LPHN3、LYRM7、MAP1B、MAPK1IP1L、MDM2、MED1、MED13、MED28、MESDC1、MEX3A、MGAT4A、MKLN1、MLL2、NARG2、NCEH1、NPNT、NPR3、NR2F2、NUFIP2、OPA3、OTUD4、OXR1、PALM2、PAPD5、PDGFA、PIGM、PLAGL2、PPP2R3A、PRPF40A、PRTG、RAB11FIP2、RAB8B、RBM12B、RBMS3、RC3H1、RORA、RPRD2、RUNDC3B、SAMD12、SAR1A、SATB2、SDC4、SENP1、SENP5、SH3KBP1、SH3RF1、SIPA1L3、SLAIN2、SLC7A11、SMAD3、SMAD4、SMAD5、SORL1、SOST、SOX4、SPCS3、SRRM4、ST7L、SYNJ2BP、TACC1、TFAP2B、TLCD2、TMEM57、TMTC3、TNRC6B、TNRC6C、TRIM66、TRPS1、UBN2、USP43、VEZF1、WDR82、XKR6、XYLT1、ZBTB7A、ZNF238、ZNF737、ZNF740(全为3’UTR标记)、CPLX4、DDX3X、GABRG2、PIK3R1、PTP4A2、SATB1、SEMA6A和STK11(在5’和3’UTR中受影响)。
但是,应注意,其中在UTR区中只有一个同聚物频繁地受影响的基因可以作为同等好的标记,例如,因为在UTR中仅存在一个同聚物区域,或因为明显偏向于在一个同聚物中而不是其他同聚物中发生插入/缺失。后者例如可在诸如CACNB4、EIF4G3、FAM20B、LPHN3或PRTG的基因的UTR中看到,其中一个以上同聚物频繁地受影响,但一个同聚物比其他同聚物更常受影响,即使同聚物长度和组成相当。
还尤其设想将具有频繁受一个以上插入/缺失影响的外显子区域的基因作为标记。因此,根据具体实施方案,尤其设想将CASP5、MIAT、TROVE2和TSIX作为外显子标记;更尤其设想CASP5和TSIX。
所设想的另一具体的UTR标记列表是在前11个实体MMR缺陷肿瘤中鉴定的那些。此列表在表6中提供,常见的频发插入/缺失定义为在11个样品的至少3个中存在。
表6.11个MMR缺陷肿瘤样品中的5’和3’UTR区中最常见的频发插入/缺失。
Figure BDA0003367311410000931
Figure BDA0003367311410000941
Figure BDA0003367311410000951
Figure BDA0003367311410000961
Figure BDA0003367311410000971
Figure BDA0003367311410000981
Figure BDA0003367311410000991
Figure BDA0003367311410001001
Figure BDA0003367311410001011
Figure BDA0003367311410001021
Figure BDA0003367311410001031
Figure BDA0003367311410001041
Figure BDA0003367311410001051
Figure BDA0003367311410001061
Figure BDA0003367311410001071
Figure BDA0003367311410001081
Figure BDA0003367311410001091
Figure BDA0003367311410001101
Figure BDA0003367311410001111
Figure BDA0003367311410001121
Figure BDA0003367311410001131
Figure BDA0003367311410001141
Figure BDA0003367311410001151
Figure BDA0003367311410001161
Figure BDA0003367311410001171
Figure BDA0003367311410001181
Figure BDA0003367311410001191
Figure BDA0003367311410001201
Figure BDA0003367311410001211
Figure BDA0003367311410001221
Figure BDA0003367311410001231
Figure BDA0003367311410001241
Figure BDA0003367311410001251
Figure BDA0003367311410001261
Figure BDA0003367311410001271
Figure BDA0003367311410001281
Figure BDA0003367311410001291
Figure BDA0003367311410001301
Figure BDA0003367311410001311
同样,所设想的另一具体的外显子标记列表是在前11个实体MMR缺陷肿瘤中鉴定的那些。此列表在表7中提供,常见的频发插入/缺失定义为在11个样品的至少3个中存在。
表7.11个MMR缺陷肿瘤样品的外显子中最常见的频发插入/缺失。后三栏显示该基因是否是癌症普查基因,之前是否已报道它在MMR缺陷肿瘤中受影响,及是否已知该突变与其他癌症相关。
Figure BDA0003367311410001312
Figure BDA0003367311410001321
Figure BDA0003367311410001331
表8中列出可以从其选择标记的所设想的另一具体列表。根据具体实施方案,该至少两个UTR微卫星区域或至少三个微卫星区域(如上文所定义)是选自表8中所列出的那些的区域。但是,根据备选的非常具体的实施方案该标记选自表1和/或表2,且不包含表8中所列出的标记。这种情况下的示例性标记包括但不限于LLRC8D、SAMD12、SEPT7、CASK、FAM20B、HELZ、KCNK1、LHX9、LYRM1、TMEM26、TRIP11、ZBTB7A、ZKSCAN1、ZNF217、WIPF2、COL5A2、ZBTB33、AGPAT3、BMPR1B、CNOT7、EDEM3、G3BP2、HRNR、KLF3、TNPO1、TRAK2、ZNF169、BDNF、OIT3、CNOT2、LTN1、MBD4、SLC22A9、ATR、CDH26、KIAA2018、RNF145、TGFBR2和TMBIM4。
表8.MMR缺陷肿瘤样品的5’和3’UTR区中及外显子中的频发插入/缺失。
Figure BDA0003367311410001332
Figure BDA0003367311410001341
Figure BDA0003367311410001351
Figure BDA0003367311410001361
Figure BDA0003367311410001371
根据具体实施方案,用作标记的同聚物的长度将不超过20个核苷酸,或将不超过15个核苷酸(例如,以允许更有效地检测插入/缺失的存在)。因此,根据具体实施方案,该标记选自例如表1至表8的任一个,但仅选自短于20个核苷酸或短于15个核苷酸的标记。与现有技术的标记(例如BAT25和BAT26标记)相比,这种更短的长度尤其有利。
尤其是,在一些实施方案中,用作标记的同聚物的长度不超过15个核苷酸、14个核苷酸、13个核苷酸、12个核苷酸或甚至11个核苷酸。另一方面,根据具体实施方案,所设想的同聚物的长度为至少6个核苷酸、至少7个核苷酸、至少8个核苷酸、至少9个核苷酸或甚至至少10个核苷酸。根据尤其具体的实施方案,设想至少一个标记(及至多所使用的全部标记)的标记长度在7和15个核苷酸之间、8和15个核苷酸之间、8和14个核苷酸之间、8和13个核苷酸之间、9和13个核苷酸之间、10和13个核苷酸之间、8和12个核苷酸之间、9和12个核苷酸之间、8和11个核苷酸之间或9和11个核苷酸之间。
重要地,上述标记可以用来独立于癌症类型测定MSI状态。因此,基本上,对于每种类型的癌症,可以用本文提供的标记来进行MSI状态诊断。但是,由于MSI最常存在于在错配修复基因中具有缺陷的癌症中,尤其设想诊断其中MMR缺陷比在其他类型中更频繁地发生的肿瘤的肿瘤样品中的MSI状态。因此,该癌症样品通常是选自结直肠癌、子宫内膜癌、卵巢癌、胃癌、白血病和Lynch综合症谱的肿瘤的样品。
诊断MSI状态通常暗示得出检测到MSI的存在或不存在(这与检测到MSI的缺乏等同)的结论。通常,检测到MSI的存在将基于在所研究的微卫星区域中检测到一个或多个插入/缺失。在微卫星区域中具有插入/缺失的本文表1-3中所示的标记基因越多,该肿瘤表征为微卫星不稳定的机会越高。
通常,MSI可以分为MSI-H、MSI-L和MSS。根据具体实施方案,如果用来诊断MSI状态的20%(或25%)或更多的微卫星区域包含插入/缺失,则该肿瘤为MSI-H,如果2.5%和20%(25%)之间的微卫星区域包含插入/缺失,则该肿瘤为MSI-L,如果不到2.5%的微卫星区域包含插入/缺失,则该肿瘤为微卫星稳定。根据备选实施方案,如果用来诊断MSI状态的17%或更多的微卫星区域包含插入/缺失,则将MSI分类为MSI-H,如果2%(或2.5%)和17%之间的微卫星区域包含插入/缺失,则该肿瘤为MSI-L,如果不到2%(或2.5%)的微卫星区域包含插入/缺失,则该肿瘤为微卫星稳定。在使用更多数目(例如25个或更多)的标记时,尤其优选后一种分类。使用百分比而不是绝对值,因为技术人员可以改变标记的数目。作为一般指导,该百分比应或多或少地对应于在公认的Bethesda系列中所应用的百分比。例如,如果使用8个标记,则该肿瘤将仅在没有一个微卫星标记包含插入/缺失时为MSS;如果2个或更多个标记为阳性,则它将是MSI-H,而如果只有一个标记包含插入/缺失,则它将是MSI-L。由于从此实例显而易见,如果使用有限数目的标记,则一个阳性标记或多或少地可以影响诊断,所以尤其设想使用更多标记。这尤其有助于可靠地将肿瘤分类为MSI-L。例如,对于2-17%分类,如果使用56个标记的优选标记系列,则肿瘤在0或1个标记评分为阳性时是MSS,在2至9个标记评分为阳性时是MSI-L,在10个或更多个标记评分为阳性时是MSI-H。
公开的研究也提出,MMR肿瘤对标准治疗和不断涌现的靶向治疗具有不同的反应。临床前研究表明,例如,MMR缺陷肿瘤显示对5-氟尿嘧啶、抗-EGFR和VEGF治疗的抗性25,26。这种异质性的确切原因未知,但作为MMR缺陷的结果的二次(频发)突变的存在或缺乏可以决定治疗结果。例如,我们观察到KRAS中的频发突变,其作为抗-EGFR治疗的已确定的阴性反应预测子。有趣地,子宫内膜肿瘤中最频发的突变也特异性影响在正常子宫内膜中表达且在MMR-和MMR+肿瘤中差异表达的基因,表明这些突变的阳性克隆选择。频发突变的鉴定还揭示了用于治疗MMR缺陷肿瘤的几种新的治疗靶标。
因此,根据一些具体实施方案,本文提供的诊断肿瘤的MSI状态的方法可以进一步包括根据MSI状态(即根据发现该肿瘤是MSI-H、MSI-L或MSS)选择治疗方案的步骤。
本方法全都依赖于检测基因组的微卫星区域中的插入/缺失。将简要描述用于分析核酸样品来检测插入/缺失的常用方法。但是,本领域已知的任意方法都可以用于本发明来检测插入/缺失的存在。
a.等位基因特异性杂交
此技术(还常称为等位基因特异性寡核苷酸杂交(ASO)(例如Stoneking等,Am.J.Hum.Genet.48:70-382,1991;Saiki等,Nature 324,163-166,1986;EP 235,726;和WO89/11548))依赖于通过使对变体之一特异的寡核苷酸探针与获自扩增核酸样品的扩增产物杂交来在因一个碱基而不同的两个DNA分子间区分。此方法通常利用短的寡核苷酸,例如长度为15-20个碱基。设计探针来与一种变体和另一种变体差异杂交。设计这种探针的原理和指导在本领域中可得,例如在本文引用的参考文献中。杂交条件应足够严格,使得两个等位基因之间存在杂交强度的显著差异,并产生基本上二元的反应,探针由此仅与等位基因之一杂交。一些探针设计为与靶DNA的区段杂交,使得多态位点与探针的中央位置(例如,在15个碱基的寡核苷酸中,在位置7;在16个碱基的寡核苷酸中,在位置8或9)对齐,但无需此设计。
通过测量与样品杂交的等位基因特异性寡核苷酸的量来测定等位基因的量和/或存在。通常,用诸如荧光标记的标记标记寡核苷酸。例如,将等位基因特异性寡核苷酸加至呈递具有不同微卫星长度的固定化寡核苷酸。严格的杂交和洗涤条件后,测量每个微卫星寡核苷酸的荧光强度。
适合用于检测探针和样品中的靶核酸序列之间形成的杂种分子的测定形式为本领域已知,且包括固定靶标(斑点印迹)形式和固定探针(反向斑点印迹或线印迹)测定形式。斑点印迹和反向斑点印迹测定形式描述于美国专利号5,310,893、5,451,512、5,468,613和5,604,099中,每篇专利在此引入作为参考。
在斑点印迹形式中,将扩增的靶DNA固定在固体支持物(如尼龙膜)上。用标记探针在适宜的杂交条件下孵育膜-靶标复合物,通过在适宜的严格条件下洗涤来去除未杂交的探针,并针对结合探针的存在监测膜。
在反向斑点印迹(或线印迹)形式中,将探针固定在固体支持物(如尼龙膜或微量滴定板)上。通常在扩增期间通过掺入标记引物来标记靶DNA。可以标记引物之一或二者。用标记的扩增靶DNA在适宜的杂交条件下孵育膜-探针复合物,通过在适宜的严格条件下洗涤来去除未杂交的靶DNA,并针对结合的靶DNA的存在监测膜。反向线印迹检测测定描述于实施例中。
b.等位基因特异性引物
还可以用等位基因特异性扩增或引物延伸法检测插入/缺失。这些反应通常涉及引物的使用,该引物设计为通过引物3’端的错配特异性靶向多态性。在聚合酶缺乏校正活性时,错配的存在影响聚合酶延伸引物的能力。例如,为了用基于等位基因特异性扩增或延伸的方法检测等位基因序列,设计与微卫星的正常等位基因(即无插入/缺失)互补的引物,使得3’端核苷酸与含有正确数目的重复的序列杂交。可以通过引物起始延伸的能力来测定具体等位基因的存在。如果3’端错配,则延伸被阻止。
在一些实施方案中,将该引物与第二引物结合用于扩增反应。该第二引物在与微卫星不相关的位点处杂交。扩增从两个引物行进,产生预示存在特定等位基因形式的可检测产物。基于等位基因特异性扩增或延伸的方法描述于例如WO 93/22456、美国专利号5,137,806、5,595,890、5,639,611和美国专利号4,851,331中。
使用基于等位基因特异性扩增的基因型分型,等位基因的鉴定仅需检测扩增的靶序列的存在或缺乏。用于检测扩增的靶序列的方法为本领域公知。例如,常用所述凝胶电泳和探针杂交测定来检测核酸的存在。
在备选的无探针方法中,通过监测反应混合物中双链DNA的总量的增加来检测扩增的核酸,其描述于例如美国专利号5,994,056及欧洲专利公开号487,218和512,334中。双链靶DNA的检测依赖于荧光的增加(多种DNA结合染料(例如SYBR Green),在结合于双链DNA时显示)。
如本领域技术人员所理解,等位基因特异性扩增法可以在利用多种等位基因特异性引物来靶向特定等位基因的反应中进行。用于这类多重应用的引物通常用可区分的标记标记,或这样选择,使得从等位基因产生的扩增产物可通过大小区分。因此,例如,可以通过扩增产物的凝胶电泳来用单个扩增鉴定样品中的两个等位基因。
如在等位基因特异性探针的情况下,等位基因特异性寡核苷酸引物可以在杂交区域中与多态等位基因之一精确互补,或者在寡核苷酸3’端以外的位置处具有一些错配,该错配发生在两个等位基因序列的非多态位点。
c.可检测探针
i)5’核酸酶测定探针
还可以用美国专利号5,210,015、5,487,972和5,804,375及Holland等,1988,Proc.Natl.Acad.Sci.USA 88:7276-7280中所述的
Figure BDA0003367311410001401
或“5’-核酸酶测定”进行基因型分型。在
Figure BDA0003367311410001402
测定中,在扩增反应过程中加入在扩增区域内杂交的标记检测探针。修饰探针,以阻止探针作为进行DNA合成的引物发挥作用。用具有5’-至3’-核酸外切酶活性的DNA聚合酶进行扩增。在扩增的每个合成步骤期间,DNA聚合酶的5’-至3’-核酸外切酶活性降解所延伸的引物下游与靶核酸杂交的任意探针。因此,新靶链的合成也导致探针的降解,降解产物的累积提供了靶序列合成的测量。
杂交探针可以是在含和不含插入/缺失的等位基因之间区分的等位基因特异性探针。备选地,该方法可以用等位基因特异性引物和与扩增产物结合的标记探针进行。
适合用于检测降解产物的任意方法都可以用于5’-核酸酶测定。通常,用两种荧光染料标记检测探针,其中之一能够猝灭另一种染料的荧光。将染料附着于探针,通常一种染料附着于5’端,另一种染料附着于内部位点,使得在探针处于非杂交状态时发生猝灭,并使得在两种染料之间发生DNA聚合酶的5’-至3’-核酸外切酶活性对探针的切割。扩增导致探针在染料之间切割,同时消除猝灭,增加可从原来猝灭的燃料观察到的荧光。通过测量反应荧光的增加来监测降解产物的累积。美国专利号5,491,063和5,571,673(二者都在此引入作为参考)描述了用于检测与扩增同时发生的探针降解的备选方法。
ii)二级结构探针
可通过二级结构变化检测的探针也适合用于检测多态性,包括插入/缺失。示例性二级结构或茎-环结构探针包括分子信标或
Figure BDA0003367311410001403
引物/探针。分子信标探针是可以形成发夹结构的单链寡核苷酸探针,其中通常将荧光团和猝灭剂放置在寡核苷酸的相反端。在探针的任一端,短的互补序列允许形成分子内茎,其使得荧光团和猝灭剂靠近。分子信标的环部分与目的靶核酸互补。此探针与它的目的靶核酸的结合形成迫使茎分开的杂种分子。这导致将荧光团和猝灭剂相互移开的构象变化,并产生更强的荧光信号。但是,分子信标探针对探针靶标中小的序列变异高度敏感(Tyagi S.和Kramer F.R.,NatureBiotechnology,14卷,303-308页(1996);Tyagi等,Nature Biotechnology,16卷,49-53页(1998);Piatek等,Nature Biotechnology,16卷,359-363页(1998);Marras S.等,GeneticAnalysis:Biomolecular Engineering,14卷,151-156页(1999);Tpp I.等,BioTechniques,28卷,732-738页(2000))。
Figure BDA0003367311410001404
引物/探针包含与引物共价连接的茎-环结构探针。
d.DNA测序和单碱基延伸
还可以通过直接测序来检测插入/缺失。方法包括例如基于双脱氧测序的方法和其他方法,如Maxam和Gilbert序列(见例如Sambrook等,上文)。
其他检测方法包括寡核苷酸长度产物的PyrosequencingTM。这类方法通常利用诸如PCR的扩增技术。例如,在焦磷酸测序中,使测序引物与单链、PCR扩增的DNA模板杂交;并与酶DNA聚合酶、ATP硫酸化酶、萤光素酶和腺苷三磷酸双磷酸酶及底物腺苷酰硫酸(APS)和萤光素孵育。向反应中加入四种脱氧核苷酸三磷酸(dNTP)之一。如果该脱氧核苷酸三磷酸与模板链中的碱基互补,则DNA聚合酶催化它掺入DNA链。每个掺入事件伴随焦磷酸((PPi))以与所掺入的核苷酸的量等摩尔的量释放。ATP硫酸化酶在腺苷酰硫酸的存在下定量地将PPi转化为ATP。此ATP驱动萤光素酶介导的萤光素向氧化萤光素的转化,该转化以与ATP的量成比例的量产生可见光。通过电荷耦合装置(CCD)照相机检测萤光素酶催化的反应中产生的光,并在PyrogramTM中作为峰观察。每个光信号与所掺入的核苷酸的数目成比例。腺苷三磷酸双磷酸酶(核苷酸降解酶)持续降解未掺入的dNTP和过量的ATP。降解完成时,加入另一种dNTP。
另一种用于表征插入/缺失的相似方法无需使用完整的PCR,而是通常仅使用与要研究的核苷酸互补的单个荧光标记的双脱氧核糖核酸分子(ddNTP)对引物的延伸。通过检测已通过一个碱基延伸并带上荧光标记的引物,可以鉴定多态位点处的核苷酸(例如Kobayashi等,Mol.Cell.Probes,9:175-182,1995)。
e.电泳
可以通过使用变性梯度凝胶电泳来分析用聚合酶链反应产生的扩增产物。不同的等位基因可以根据不同的序列依赖性熔解特性和DNA在溶液中的电泳迁移来鉴定(见例如Erlich编辑,PCR Technology,Principles and Applications for DNA Amplification,W.H.Freeman及其同事,New York,1992,第7章)。
可以用毛细管电泳来进行微卫星多态性的区分。毛细管电泳方便地允许鉴定特定微卫星等位基因中的重复数。应用毛细管电泳来分析DNA多态性为本领域技术人员公知(见例如Szantai等,J Chromatogr A.(2005)1079(1-2):41-9;Bjorheim和Ekstrom,Electrophoresis(2005)26(13):2520-30;和Mitchelson,Mol Biotechnol.(2003)24(1):41-68)。
f.单链构象多态性分析
可以用例如Orita等,Proc.Nat.Acad.Sci.86,2766-2770(1989)中所述的单链构象多态性分析来区分靶序列的等位基因,该单链构象多态性分析通过单链PCR产物电泳迁移的改变来鉴定碱基差异。可以按上文所述产生扩增的PCR产物,加热或以其他方式变性,以形成单链扩增产物。单链核酸可以重折叠或形成部分依赖于碱基序列的二级结构。单链扩增产物不同的电泳迁移率可以与靶基因的等位基因之间的碱基序列差异相关。
g.熔解曲线分析
熔解曲线分析是双链DNA在加热期间的解离特征的评估。随着温度提高,双链开始解离,导致吸光度、增色性的提高。50%的DNA变性的温度称为熔点(不与物理学中所用的术语熔点混淆)。断裂DNA的两条链之间的碱基-碱基氢键所需的能量取决于其长度、GC含量及其互补性。由于G-C碱基配对在它们之间具有3个氢键而A-T碱基对仅具有2个氢键的事实,具有更高G-C含量的DNA将具有比具有更高A-T含量的DNA高的熔解温度。通过加热含有双链DNA序列的反应混合物并测量随温度的解离,可以测定单核苷酸多态性(SNP)的存在和同一性。
最初,用UV吸光度观察链解离,但基于荧光测量的技术现在是最常用的方法。可以用嵌入DNA的荧光团(如SYBR green、EvaGreen)或荧光团标记的DNA探针测量两条DNA链之间的温度依赖性解离。
变通技术是高分辨率溶解(HRM)分析。可购得许多染料和高分辨率仪器来进行熔解曲线分析或HRM;包括大多数qPCR仪。
插入/缺失检测方法常利用标记的寡核苷酸。寡核苷酸可以通过掺入可通过光谱、光化学、生物化学、免疫化学或化学手段检测的标记来标记。有用的标记包括荧光染料、放射性标记(例如32P)、高电子密度试剂、酶(如过氧化物酶或碱性磷酸酶)、生物素或可获得其抗血清或单克隆抗体的半抗原和蛋白质。标记技术为本领域公知(见例如Sambrook等,上文)。
本文提供的微卫星插入/缺失标记可以用这些技术中的任一种或其他技术检测——该标记系列独立于所使用的技术。但是,尤其设想不通过基于Sanger测序的方法来进行插入/缺失的存在的测定。这是因为用Bethesda标记系列检测微卫星不稳定性的方法通常通过Sanger测序进行,Sanger测序是证明非常麻烦的流程。根据其他实施方案,尤其设想通过单碱基对延伸法(如Sequenom MassArray)、DNA杂交技术(例如Taqman)、熔解曲线分析或类似技术来测定插入/缺失的存在。
根据另一方面,提供本文所述的生物标志系列用作药物。尤其是,提供本文所述的生物标志系列用作诊断剂。尤其设想可以用此生物标志系列来检测癌症中的MSI状态,或用于测定肿瘤样品中的MSI。因此,提供此生物标志系列在诊断癌症中的微卫星不稳定性(或MSI状态)中的用途。
虽然还明确设想使用更少的标记,但尤其适合用于测定肿瘤样品中的MSI的生物标志系列是包含至少八个标记(微卫星区域)的生物标志系列。这种生物标志系列包含选自存在于来自表1中所列基因的5’UTR区或3’UTR区中的那些和存在于表2中所列基因的外显子中的那些的至少八个微卫星区域。该至少八个标记可以是至少10个标记、至少12个标记、至少16个标记、至少20个标记、至少25个标记或甚至更多。根据非常具体的实施方案,该生物标志系列包含表3中所列微卫星区域的至少一半。根据其他具体实施方案,该生物标志系列由表3中所列的56个微卫星区域代表。
根据具体实施方案,该标记选自最频发的那些,即存在于至少三分之一或至少一半的MMR缺陷肿瘤中的标记。因此,标记选自在16个肿瘤中出现至少5次(例如在表1和2中,或在表4和5中)、在16个肿瘤中出现6次、在16个肿瘤中出现7次、或在16个肿瘤中出现至少8次的标记。或者它们在11个肿瘤中出现至少4次(例如在表6和7中)、在11个肿瘤中出现至少5次、在11个肿瘤中出现至少6次。
还根据其他实施方案,提供用于测定肿瘤样品中的MSI的试剂盒,其包含对生物标志系列(即选自存在于来自表1中所列基因的5’UTR区或3’UTR区中的那些和存在于表2中所列基因的外显子中的那些的至少八个微卫星区域)进行基因型分型的工具。最具体而言,该试剂盒将适于尤其设想的一个或多个生物标志系列。根据具体实施方案,该试剂盒还可以包含对Bethesda系列标记或扩展的Bethesda系列标记进行基因型分型的工具。这类试剂盒尤其适于进行该标记与Bethesda系列的并肩比较。还设想试剂盒仅采用Bethesda标记系列的一个亚组(例如1至5个标记而不是全部10个)。在这种情况下,明确设想包括BAT25和BAT26,因为通常认为这些标记最稳定。不言而喻,这还意味着本文所述的诊断MSI的方法还可以进一步包括测定扩展的Bethesda标记系列的一个或多个标记(除使用本文所述的标记外)的状态的步骤。
如实施例章节(尤其是实施例8和9)中所示,本文提供的插入/缺失标记富集在涉及DNA双链断裂修复途径并影响其功能性的基因中。因此,其中存在这些标记的细胞对DNA碱基切除修复抑制的合成致死性敏感。这提供了新的治疗机会,因为MSI阳性肿瘤常对所使用的标准化疗具有抗性。
因此,在另一方面,提供筛查癌细胞对DNA碱基切除修复酶抑制剂处理的敏感性的方法,其包括测定该癌细胞中的MSI状态。根据具体实施方案,该DNA碱基切除修复酶抑制剂是PARP抑制剂。根据具体实施方案,该癌细胞来自选自以下的癌症:结直肠癌、子宫内膜癌、卵巢癌、胃癌、白血病和Lynch综合症的肿瘤。根据其他具体实施方案,该癌细胞来自对标准治疗具有抗性的癌症。尤其设想这种疗法选自5-FU(5-氟尿嘧啶,Efudex)、脱羧铂氨、顺式铂氨或靶向治疗(尤其是针对EGFR(例如吉非替尼(gefitinib)、埃罗替尼(erlotinib)、西妥昔单抗(cetuximab)、帕尼单抗(panitumumab))或针对Braf的靶向治疗。虽然这些方法基本上可以在体内、离体和在体外进行,但尤其设想在体外进行它们。
根据具体实施方案,MSI的存在指示癌细胞对DNA碱基切除修复酶抑制剂处理的敏感性;即在用这种抑制剂处理时,该癌细胞将死亡、停止生长或更少地增殖。
根据具体实施方案,该癌细胞是获自个体的细胞,且对DNA碱基切除修复酶抑制剂处理的敏感性的筛查用于指导该个体的处理。根据备选实施方案,该敏感性筛查用于分层或分类个体进行临床试验。
根据具体实施方案,通过本文所述的方法来确定MSI的存在,即包括测定插入/缺失在肿瘤DNA的样品中的至少两个微卫星区域中的存在的方法,其中该至少两个微卫星区域是:
-存在于来自表1中所列基因的5’UTR区或3’UTR区中的至少两个微卫星区域;或
-选自存在于表2中所列基因的外显子中的那些和/或存在于来自表1中所列基因的5’UTR区或3’UTR区中的那些的至少三个微卫星区域;
其中至少一个插入/缺失的存在指示MSI。
根据其他具体实施方案,用本文所述的生物标志系列确定MSI的存在,即包含选自存在于来自表1中所列基因的5’UTR区或3’UTR区中的那些和存在于表2中所列基因的外显子中的那些的至少八个微卫星区域的生物标志系列。根据其他具体实施方案,该生物标志系列包含选自表3中所列的那些的至少八个微卫星区域。
根据非常具体的实施方案,该方法还可以包括测序涉及同源重组途径的基因的步骤。
因此,不仅提供筛查癌细胞对DNA碱基切除修复酶抑制剂处理的敏感性的方法,还提供诊断患有癌症的个体对DNA碱基切除修复酶抑制剂处理的敏感性的方法,其包括以下步骤:
-测定获自该个体的癌细胞的样品中的MSI状态;
-将该MSI状态与对DNA碱基切除修复酶抑制剂处理的敏感性相关,其中MSI的存在指示对该处理的敏感性。
可选地,这些方法包括从该个体获得癌细胞的样品的附加步骤(在测定步骤之前)。然后通常在所获得的样品的细胞中进行MSI状态的测定。尤其设想在体外进行癌细胞的样品中的MSI状态的测定。
根据具体实施方案,该DNA碱基切除修复酶抑制剂抑制剂是PARP抑制剂。根据具体实施方案,该癌细胞来自选自以下的癌症:结直肠癌、子宫内膜癌、卵巢癌、胃癌、白血病和Lynch综合症的肿瘤(或Lynch综合症谱的任意其他肿瘤)。根据具体实施方案,通过本文所述的方法来确定MSI的存在,即包括测定插入/缺失在肿瘤DNA的样品中的至少两个微卫星区域中的存在的方法,其中该至少两个微卫星区域是:
-存在于来自表1中所列基因的5’UTR区或3’UTR区中的至少两个微卫星区域;或
-选自存在于表2中所列基因的外显子中的那些和/或存在于来自表1中所列基因的5’UTR区或3’UTR区中的那些的至少三个微卫星区域;
其中至少一个插入/缺失的存在指示MSI。
根据其他具体实施方案,用本文所述的生物标志系列确定MSI的存在,即包含选自存在于来自表1中所列基因的5’UTR区或3’UTR区中的那些和存在于表2中所列基因的外显子中的那些的至少八个微卫星区域的生物标志系列。
还设想此方面的方法可以包括用DNA碱基切除修复酶抑制剂处理该个体的步骤(如果通过MSI状态确定该个体对这种处理敏感)。
因此,还提供用于在有需要的个体中治疗具有MSI(或等同地,MMR缺陷)的癌症的方法,其包括:
-确定MSI在该癌症中的存在;
-对该个体施用DNA碱基切除修复酶抑制剂。
对于涉及诊断患有癌症的个体对DNA碱基切除修复酶抑制剂处理的敏感性或治疗患有具有MSI的癌症的个体的方法,尤其设想此癌症对至少一种标准治疗(尤其是选自5-FU(5-氟尿嘧啶,Efudex)、脱羧铂氨、顺式铂氨或靶向治疗(尤其是针对EGFR(例如吉非替尼、埃罗替尼、西妥昔单抗、帕尼单抗)或针对Braf的靶向治疗)的标准治疗)具有抗性。
设想通过对该个体施用该抑制剂来治疗该癌症。该方法可以可选地具有从该个体获得癌细胞的样品的附加步骤(在测定MSI和确定MSI的存在的步骤之前)。
根据具体实施方案,该DNA碱基切除修复酶抑制剂抑制剂是PARP抑制剂。根据具体实施方案,该癌细胞来自选自以下的癌症:结直肠癌、子宫内膜癌、卵巢癌、胃癌、白血病和Lynch综合症的肿瘤。根据具体实施方案,通过本文所述的方法来确定MSI的存在,即包括测定插入/缺失在肿瘤DNA的样品中的至少两个微卫星区域中的存在的方法,其中该至少两个微卫星区域是:
-存在于来自表1中所列基因的5’UTR区或3’UTR区中的至少两个微卫星区域;或
-选自存在于表2中所列基因的外显子中的那些和/或存在于来自表1中所列基因的5’UTR区或3’UTR区中的那些的至少三个微卫星区域;
其中至少一个插入/缺失的存在指示MSI。
根据其他具体实施方案,用本文所述的生物标志系列确定MSI的存在,即包含选自存在于来自表1中所列基因的5’UTR区或3’UTR区中的那些和存在于表2中所列基因的外显子中的那些的至少八个微卫星区域的生物标志系列。
应理解,虽然本文已就本发明的细胞和方法讨论了具体实施方案、具体配置以及材料和/或分子,但可以进行形式和细节的多种改变或修改而不背离本发明的范围和精神。提供以下实施例来更好地说明具体实施方案,不应认为它们限制本申请。本申请仅通过权利要求限制。
实施例
实施例1.MMR缺陷的子宫内膜肿瘤的全基因组测序
为了选择用于全基因组测序的MMR缺陷肿瘤,使用了标准诊断测试,包括MMR蛋白质(MLH1、MSH2和MSH6)的免疫组织化学、用扩展的Bethesda系列评估微卫星不稳定性(MSI)(Pinol等,2005)及MLH1启动子的甲基化概况序型分析(profiling)。免疫组织化学和MLH1启动子超甲基化的结果作为表9中的前3行显示。用国际MSI评价指南推荐的系列(即修订的Bethesda系列(Boland等,1998;Dietmaier等,1997))在包含单核苷酸或二核苷酸重复序列(分别为2和8个标记)的10个不同基因座处分析了微卫星不稳定性(MSI)状态。在两个五重反应(pentaplex)中进行PCR扩增:多重反应(mutiplex)A(BAT25、BAT26、D5S346、D17S250、D2S123)和多重反应B(BAT40、D17S787、D18S58、D18S69、TGFβ-RII)。正向引物用6-FAM、HEX、VIC或TET标记。在ABI 3130Genetic Analyzer(Applied Biosystems)上分析了来自同一患者的肿瘤DNA和正常DNA的扩增子。肿瘤1在8个成功的标记中有7个为强阳性,而另外两个肿瘤为阴性。这确认了肿瘤1是MMR缺陷。结果总结在表10中。关于肿瘤样品的更多信息包含在表11中。
选择了一个MMR缺陷EM肿瘤(显示阳性MSI状态和MSH6表达的缺乏(表9))和两个MMR健全EM肿瘤。使用Complete
Figure BDA0003367311410001451
(CG)技术,我们获得了肿瘤和匹配的正常样品的高覆盖率测序数据(平均分别为95.2x和77.1x),随后用之前发展的注释和过滤途径(Reumers等,2011)分析了该测序数据。MMR缺陷肿瘤显示明显的高增变表型,用验证过的CGAtoolsTM calldiff法(http://cgatools.sourceforge.net)显示包含显著多于其他肿瘤的新的体细胞突变(表12,使用calldiff的体细胞突变)。设计此算法来找到来自同一个体的两个基因组(如肿瘤-正常对)之间的差异。
然后,我们应用了基于随机选择的突变的独立验证的质量评分阈值,产生估计在94.6%的突变判定的总体准确性。这确认了MMR缺陷肿瘤的突变负荷高20.3倍(图1a和表12)。超增变样品中体细胞变体的详细检查揭示了MSH6的外显子5中的体细胞移码插入(F1088fs;Note S2),这与MSH6表达的缺乏一致。在诸如POLE的DNA聚合酶中未发现突变。事实上,在34种已知的DNA聚合酶中,只有REV3L在高变体中发生了体细胞突变。但是,由于REV3L涉及跨损伤DNA合成,REV3L中的突变不可能引起我们的高变体表型。此外,用ASCAT算法(Van Loo等,2010)进行了拷贝数分析。ASCAT专门设计用于检测肿瘤样品中的拷贝数异常。它通过估计和调节总体肿瘤倍性和样品中的有效肿瘤部分来准确测定实体瘤中的等位基因特异性拷贝数。与MMR健全(proficient)肿瘤不同,高变体是染色体稳定肿瘤(数据未显示)。
表9.评估MMR缺陷的标准诊断测试
用Complete Genomics(CG)全基因组测序技术或与Illumina测序技术组合的Truseq外显子组富集测序所有肿瘤。对于每个肿瘤,显示了使用扩展的Bethesda系列的微卫星不稳定性(MSI)、MMR蛋白质(MLH1、MSH2和MSH6)的标准免疫组织化学和MLH1启动子的甲基化状态。星号(*)表示少数肿瘤细胞中存在弱阳性核染色。
Figure BDA0003367311410001461
表10.三个子宫内膜肿瘤在扩展的Bethesda系列上的数据
Figure BDA0003367311410001462
表11.肿瘤样品和临床信息。表格列出所选择的三个肿瘤样品的详细信息。所有肿瘤都是来自无遗传性癌症家族史的患者的原发性、首次化疗的肿瘤。
Figure BDA0003367311410001463
表12.来自应用于肿瘤-正常对(MMR-1、MMR+1和MMR+2)的calldiff法的结果
Figure BDA0003367311410001464
Figure BDA0003367311410001471
实施例2.MSH6缺陷高变体中的体细胞突变模式
模式生物和细胞系中的研究揭示,由于MMR缺陷而出现的体细胞突变在大多数情况下涉及影响微卫星序列(具有6个碱基的最小长度和至少两个重复单位的二核苷酸至六核苷酸重复)和同聚物(具有6个碱基的最小长度的单核苷酸重复)的插入/缺失(插入/缺失)(Ellegren,2004)。为了测试此假说,我们用以下定义将基因组分层为四个不同的种类:
-微卫星区域:由至少两个重复单位组成且具有6个碱基的最小长度的二、三、四、五或六核苷酸重复。
-同聚物区域:具有6个碱基的最小长度的单核苷酸重复。
-短的同聚物区域:长度为3、4或5个碱基的单核苷酸重复。
-非重复区域:基因组的其余部分,即不是简单重复序列的部分的每个碱基。
通过用“grepseq”工具(http://code.google.com/p/grepseq/)扫描序列文件(FASTA格式)来测定符合这些定义的基因组区域。在全基因组水平,总体重复组成如下:微卫星(7.9%)、同聚物(1.9%)、短同聚物(19.8%)和不在重复区域中(70.4%)。
在我们的高变体中,我们观察到,体细胞突变比基于其全基因组(genome-wide)发生率的预期更频发地定位在同聚物中(未显示)。我们发现,与它们的全基因组发生率(1.9%)相比,体细胞突变更频繁地累积在同聚物中(47.7%)。35.5%、10.7%和6.2%的体细胞突变分别定位在非重复区域、短同聚物和微卫星中。与这些区域的全基因组发生率(即非重复、短同聚物和微卫星分别为70.4%、19.8%和7.9%)相比,体细胞突变比预期更不频繁地在这些区域中受影响。
此外,我们观察到,插入/缺失确实比单碱基对取代更频繁(57.4%插入/缺失对42.6%取代;图1b),但主要影响同聚物(81.3%)而不是微卫星(图1c)。取代未优先影响同聚物或微卫星(图1d)。突变在内含子中与在基因组的其余部分中一样频繁地发生,但在外显子(排除5’和3’非翻译区(UTR))中明显更少。对于插入/缺失,此减少比取代更显著(74.7%对14.3%;图1e,f)。对外显子、基因间和内含子区域中的同聚物数目或同聚物长度校正确认了此减少不能归因于更少或更短的同聚物。大多数外显子插入/缺失导致杂合移码突变(160个移码对3个非移码插入/缺失),表明它们是经历阴性克隆选择的功能丧失突变。
MSH6缺陷高变体中的体细胞突变
评估UV光诱发的黑素瘤(Pleasance等,2010a)和吸烟诱发的肺腺癌(Pleasance等,2010b)的研究揭示,G:C>A:T转换和G:C>T:A颠换分别在这些肿瘤中频繁发生。在评估我们的高变体中的体细胞取代时,观察到了明显不同的模式,其中与MMR健全肿瘤中的仅50.1%相比,所有取代中的71.5%是A:T>G:C和G:C>A:T转换(图2a)。显著地,在该高变体中,G:C>A:T转化最频繁地发生在CG二核苷酸的背景中(其中C经历取代,G是后面的核苷酸),而A:T>G:C转换独立于二核苷酸背景且比在MMR健全肿瘤中更频繁地发生(图2b-c)。
然后,为了鉴定提供最符合高变体突变模式的那些特征,我们用线性回归来使多种类型的取代与之前在解释人群中的遗传变异性中涉及的9个基因组特征(Hodgkinson和Eyre-Walker,2011)(图2d;该9个特征是与端粒的距离、复制时间、简单重复、GC组成、CpG含量、CpG岛、基因含量、DNA酶超敏感性和核纤层结合位点)相关。虽然我们未能观察到与基因含量、DNA酶超敏感性或核纤层结合结构域的相关性(未显示),但与端粒的距离、复制时间、简单重复含量、GC组成(GC%)、CpG频率和CpG岛分数代表显著和独立的预测子。总体上,我们观察到对转换比对颠换好的预测模型(R2分别为0.22和0.07;图2d),而在个体水平,观察到了以下相关。首先,我们发现了复制时间和转换(而不是颠换)之间的阳性相关(图2e),显示晚S期DNA复制的保真性的降低增加了转换突变而不是颠换,表明之前观察到的晚S期颠换的增加(Koren等,2012)可以归因于那时的MMR活性降低,因为MMR机器的缺乏构成目前和之前研究的数据集之间的主要差异。第二,对于简单重复,观察到了正好处于同聚物侧翼的碱基上的取代增加42%。这对转换和颠换二者而言都是真实的,最有可能涉及DNA聚合酶在重复DNA序列内的停顿,导致易错复制(Hodgkinson和Eyre-Walker,2011)。第三,GC%与转换和颠换频率反相关。这之前已在许多生物中描述,虽然尚未出现解释此相关性的显性模型,但我们的数据显示,差异MMR活性未促成此作用。第四,GpG位点中的G:C>A:T转换强烈依赖于CpG含量,但与CpG岛的分数反相关(图2d)。由于除CpG岛中的那些外,基因组中的大多数CpG甲基化,这显示类似于脱酰胺驱动的突变的与胞嘧啶甲基化的关联,CG>TG转换由此通过自发的依赖于复制的胞嘧啶脱酰胺过程出现。由于通常认为MMR与复制相关,与MMR健全肿瘤相比在MMR缺陷中观察到CG>TG转换的更大增加(3042对452个突变)证明不依赖于复制的非经典MMR,其最近已在分子水平描述(Hombauer等,2011;Liu等,2008;Pena-Diaz等,2012),对基因组完整性很重要。最后,CpG岛频率与总体突变频率反相关。实际上,CpG岛外的碱基经历突变的可能性比CpG岛内侧的那些高近两倍(图2f)。阴性选择不可能解释此减少,因为外显子取代未以相同的程度减少。DNA甲基化通过它可以诱导的聚合酶停顿提供了备选的解释(Song等,2012),但另一种可能性是通过脱酰胺修复,其可以通过易错聚合酶催化。
总体上,与一般群体中的突变频率相关的大多数基因组特征与MMR缺陷肿瘤中的体细胞取代相关,表明显著部分的人遗传多样性是由于逃逸MMR的错配而出现。在此概念的支持中,我们在1000 Genomes Project和小鼠dbSNP数据库中的高变体的体细胞和种系DNA中观察到了非常相似的突变频率(分别为代表转换的所有取代的71.5%、68.3%、66.9%和67.1%)。具体而言,高变体中每个染色体单位(100kb)的体细胞取代频率与相同单位中的匹配种系的数目(R2=0.90)和1000 Genomes Project SNP(R2=0.90)强相关,但与肺腺癌或黑素瘤基因组中的体细胞取代频率不相关(R2=0.53和0.37)。
MSH6缺陷高变体中的体细胞插入/缺失
然后,我们评价了高变体中的体细胞插入/缺失模式。如预期,由于大多数插入/缺失定位在同聚物中,观察到了简单重复和插入/缺失频率之间的强相关(图2g)。几乎所有插入/缺失都影响A或T同聚物(94.0%;图2h),但由于92.2%的同聚物由A或T碱基组成,C或G同聚物似乎同等地倾向于累积插入/缺失。此外,至多96.4%的插入/缺失由1或2bp移码组成(图2i),从而确认MSH6主要涉及1或2bp插入/缺失的修复。缺失的频率略低于插入(47.7%对52.3%;P<10E-6)。在计算每个体细胞取代与最接近的体细胞插入/缺失的距离时,我们观察到,取代定位在<5或<10bp的距离内的频率分别比基于取代和插入/缺失的随机分布的预期高3.8和3.4倍(图2j)。类似地,虽然没有kataegis(体细胞风暴)(Nik-Zainal等,2012)的证据,但体细胞取代聚簇的频率比随机模拟的预测高7.6倍(图2k)。虽然总体频率较低,但在MMR健全肿瘤中观察到了相同的取代聚簇(未显示),表明这些聚簇的发生率受MMR抑制。显著地,这些观察结果类似于真核基因组,其中取代的数目在其他取代和插入/缺失附近提高(McDonald等,2011;Tian等,2008)。
实施例3.错配修复缺陷和健全的肿瘤及其匹配的正常样品的外显子组测序
我们选择了表征为MLH1、MSH2或MSH6的缺乏的10个附加的MMR缺陷EM和CRC肿瘤以及4个MMR健全肿瘤(表9,表13)。因此,收集了总计14个肿瘤-正常对用于外显子组测序,包括11个子宫内膜肿瘤(EM)及其匹配的种系样品和3个结直肠肿瘤(CRC)及其匹配的种系对。所有肿瘤都是原发性、首次化疗的肿瘤。肿瘤DNA衍生自新鲜冷冻的肿瘤组织,而这些样品的匹配种系DNA提取自外周血白细胞。所有这些样品的详细临床信息在表13中列出。此外,将5个MMR缺陷的原代子宫内膜肿瘤细胞系包括在分析中,使得达到总计16个MMR缺陷肿瘤样品。
表13.附加肿瘤样品的临床信息
Figure BDA0003367311410001491
3.1 标准诊断测试
以下表14和15描述对已测序的子宫内膜和结肠肿瘤进行的MSI测定中的标准诊断测试(MMR基因MLH1、MSH2和MSH6的免疫组织化学;MLH1启动子区的过度甲基化状态;使用8个二核苷酸重复标记和2个单核苷酸重复标记的扩展的Bethesda系列的微卫星不稳定性)的结果。在免疫组织化学实验中,星号(*)表示少数肿瘤细胞中的弱阳性核染色。用主要MMR蛋白质(MLH1、MSH2和MSH6)的免疫组织化学进行MMR缺陷状态的分类。在肿瘤细胞的细胞核中缺乏这些蛋白质中的任一种时,将该肿瘤分类为MMR缺陷(MMR-),否则分类为MMR健全(MMR+)。
表14.评估MMR缺陷的标准诊断测试
Figure BDA0003367311410001501
对于微卫星不稳定性测试,包括在扩展的Bethesda系列中的所有标记的详细结果在下文中列出。
表15.关于扩展的Bethesda系列的数据
Figure BDA0003367311410001502
显著地,如通过免疫组织化学评估,MMR-4、7和8肿瘤为MLH1、MSH2或MSH6阴性,但未能用Bethesda系列鉴定为MSI阳性肿瘤。此观察结果最可能说明,目前用于诊断MSI的Bethesda系列未能识别许多MSI阳性肿瘤。但是,使用我们的56标记改进系列(表3和实施例7),我们能够确认这些MMR缺陷肿瘤为MSI阳性。
3.2 用Illumina的HiSeq2000技术测序的外显子组的测序、作图和变体判定
使用独立测序技术
Figure BDA0003367311410001511
的肿瘤和匹配种系DNA的外显子组测序揭示,每个MMR缺陷肿瘤平均包含1,497个体细胞事件对MMR健全肿瘤的39个(增加38.9倍;图3a)。在MMR缺陷肿瘤中,这些中的绝大多数(78.4%)是取代(图3b),其大多数是A:T>G:C和G:C>A:T转换(81.5%)。其余的突变是高度富集在同聚物中(55.9%)的体细胞插入/缺失。
简言之,用Illumina的TruSeq外显子组富集试剂盒(8rxns)捕获外显子组,富集后,对富集文库进行Illumina测序(HiSeq 2000)。用TruSeq SBS试剂盒进行配对末端测序(2x75bp)。使用默认参数,用BWA来将来自每个测序泳道的原始读出(fastq格式)与人参考基因组(NCBI37/hg19)比对。用SAMtools(v.0.1.13)处理和分选比对的读出,用MarkDuplicates(http://picard.sourceforge.net,v1.32)去除PCR重复。用GenomeAnalysisToolKit(GATK v1.0.4487)进行碱基重校准、插入/缺失周围的局部比对和单核苷酸变体判定。此外,我们还从体细胞突变列表过滤了所有共同的变体。这用多种数据道(track)进行,用BED工具(Quinlan and Hall,2010)的intersectBed命令来将该多种数据道应用于变体列表。用Sequenom MassARRAY基因型分型验证体细胞取代和插入/缺失。质量过滤和验证后的总体突变数据在表16中给出。
表16.质量过滤和验证后的总体突变数据
Figure BDA0003367311410001512
背景依赖性作用揭示了G:C>A:T转换的强CG作用(图3c)。有趣地,通过外显子组测序鉴定的种系从头取代显示相似的背景依赖性作用,确认了人遗传变异和疾病的潜在突变常由于逃逸MMR的错配而出现(图3d)。此外,虽然体细胞事件的数目在CRC中比EM肿瘤中略高(平均2,278对1,161个事件),但我们未观察到两个肿瘤类型之间突变模式的明显差异(未显示)。
同样,按照MLH1-或MSH2-缺陷分层突变模式未能揭示明显的差异。具体而言,虽然我们观察到插入/缺失在微卫星中略微更常见(12.0%和11.2%对高变体基因组中的5.4%),但同聚物仍最频繁地受影响(图3e),确认了MLH1-或MSH2-缺陷肿瘤中的插入/缺失优先影响同聚物而不是微卫星。
实施例4.MMR缺陷肿瘤中的阳性克隆选择和频发突变
4.1 频繁受影响的同聚物(热点突变)的分析
在MMR缺陷肿瘤的外显子组中观察到的突变频率揭示了阴性选择的证据,一些突变也可以经历阳性选择。这类突变更可能作为热点(频发)突变出现。因此,我们评估了MMR缺陷肿瘤中有多少同聚物频繁受影响。因此,针对频发取代和插入/缺失的发生率分析了10个MMR缺陷肿瘤外显子组,以及从高变体全基因组提取的外显子组。产生了两组频发突变:发生在11个肿瘤中的至少3个或至少4个中的取代或插入/缺失的数目。
在11个MMR缺陷肿瘤中检测到了热点突变。产生了在三个(四个)或更多个样品中发生的突变的变体列表。我们首先旨在排除这些热点突变是测序错误的事实。存在热点突变是假阳性的可能性,因为它们可以通过肿瘤中的系统性假阳性变体判定或通过正常样品中的系统性假阳性判定产生。因此,我们进行了附加的过滤步骤。具体而言,我们收集了在11个子宫内膜正常外显子组和3个结直肠正常外显子组的每一个中鉴定出的所有变体。将也作为种系变体存在于这些外显子组的至少一个中的每个热点突变视为系统错误,并从数据集去除。这导致频发取代的大幅减少,同时对发生插入/缺失的影响非常有限(表17)。
表17.从热点突变过滤假阳性
Figure BDA0003367311410001521
对3个或更多个肿瘤中的5个热点取代进行了Sequenom验证。在这些取代中,仅确认了1个。此外,我们试图验证存在于四个或更多个样品中的所有插入/缺失。在这44个频发插入/缺失中,26个插入/缺失可以成功地进行基因型分型,且全都用Sequenom基因型分型确认(100%验证率)。鉴于频发和非频发体细胞插入/缺失的高验证率,我们未寻求进一步验证其余插入/缺失(n=18),但将所有频发插入/缺失视为真阳性插入/缺失。
由于在MMR缺陷肿瘤中,插入/缺失主要限于同聚物中,我们将我们的分析限制于频繁影响同聚物区域的插入/缺失。我们在11个MMR缺陷肿瘤的每一个中筛查了全部30,111个Illumina TruSeq捕获的外显子同聚物。表18列出在MMR缺陷肿瘤中频繁受影响的同聚物的数目。
表18.在11个MMR缺陷肿瘤中在外显子区域中具有插入/缺失的同聚物的列表。
Figure BDA0003367311410001522
总计,1,493个同聚物受影响至少一次,255个受影响至少两次,82个受影响三次,44个在11个肿瘤的至少4个中频繁受影响。将这82个受影响的同聚物视为热点突变,82个热点突变中的4个定位在已知的癌症普查基因(RPL22、MSH6、MLL3和BRAF)中。82个热点突变中的41个定位在之前已涉及MMR缺陷肿瘤或其他癌症类型的基因中。这些突变的列表在表7中给出。通过附加分析5个原代肿瘤细胞系来扩展该分析。这产生了总计149个在16个MMR缺陷肿瘤的至少4个中频繁受影响的外显子同聚物。这些热点突变的详情可见于表2中。在应用附加的过滤步骤时,不仅排除了存在于1000Genomes数据库和dbSNP数据库中的常见变体,还排除了我们的超过100个个体的专有数据库中的变体,这产生了在表5中列出的103个频繁受影响的外显子同聚物。
在11个肿瘤的至少4个中受影响的44个同聚物中,21、18、1和4个分别由A、T、G或C序列组成。对于在11个肿瘤的至少3个中受影响的82个同聚物,34、31、7和10个分别由A、T、G或C序列组成(未显示)。但是,可以观察到11次中的至少3次强烈偏向影响长度为7-11个核苷酸的同聚物。
4.2 频发插入/缺失的预期频率对观测频率
为了评估频发插入/缺失是由于阳性选择而发生还是由于MMR缺陷肿瘤中提高的插入/缺失频率而随机发生,我们根据在高变体中观察到的全基因组插入/缺失频率计算了频发插入/缺失的预期数目。由于复制过程中的聚合酶滑动(slippage)更可能发生在长同聚物中,预期插入/缺失突变更易影响长度增加的同聚物。因此,我们计算了6和11个碱基之间的每种同聚物长度的预期频率(fe,基因组),因为这些长度代表了绝大多数外显子同聚物(99.7%,图4a)。
表19.同聚物分布作为同聚物长度的函数
Figure BDA0003367311410001531
如所提到,用高变体中的观测频率(fe,基因组)来计算外显子中受影响的同聚物的预期数目(通过将每个同聚物的预期插入/缺失数乘以外显子组中此长度的同聚物的数目)。然后我们计算了在11个MMR缺陷肿瘤中受影响的给定长度的同聚物的数目。将11个MMR缺陷外显子组的此数目平均,并称为将受影响的给定长度的同聚物的观测频率(fo,外显子组)。然后将相对于此长度的同聚物中预期的插入/缺失数的倍数富集计算为观测频率和预期频率的比值。存在于这些外显子组中的长度8-11的同聚物中的插入/缺失的数目具有弱富集(表20)。
表20
Figure BDA0003367311410001532
Figure BDA0003367311410001541
假定每个相同长度的同聚物具有同等高的机会受影响,同聚物在两个或三个独立肿瘤中受影响的概率可以计算为同聚物在一个肿瘤中受影响的概率(即观测的全基因组频率f基因组)的乘积。
这样,同聚物在三个肿瘤中受影响的预期频率计算如下:
fe,在3个中频发=(fe,基因组)3
对于在四个肿瘤中受影响的插入/缺失:
fe,在4个中频发=(fe,基因组)4
为了分别计算三个、四个肿瘤中的频发插入/缺失的预期数目,我们将预期频率乘以外显子组中的同聚物的数目,并乘以我们可以从11个样品中分别抽出3个、4个样品的方式的数目(即组合C(3,11)和C(4,11)的数目)。因此,11个肿瘤中预期的频发插入/缺失数计算如下:
N在3个中频发=C(3,11)*N同聚物*fe,在3个中频发
N在4个中频发=C(4,11)*N同聚物*fe,在4个中频发
对于存在于三个肿瘤中的插入/缺失,该数据如下:
表21.存在于11个肿瘤的三个中的同聚物中的预期和观测插入/缺失
Figure BDA0003367311410001542
虽然我们已经看到存在于三个样品中的插入/缺失的富集,但存在于四个或更多个样品中的插入/缺失的富集更强:
表22.存在于11个肿瘤的4个中的同聚物中的预期和观测插入/缺失
Figure BDA0003367311410001543
总的来说,虽然外显子组中的大多数同聚物由6个核苷酸组成,但最频繁受影响的同聚物显示8-11个核苷酸的长度。因此,我们评估了这些同聚物由于其增加的长度而频繁受影响的可能性。我们计算了特定长度的同聚物受高变体中的插入/缺失影响的全基因组概率,并发现,对于每个同聚物长度,外显子组中的观测突变的数目高于预期。我们还计算了在特定长度的同聚物中观察到频发插入/缺失的全基因组概率,并发现,对于每个同聚物长度,>2或>3个肿瘤中的外显子频发突变的观测数目比预期高得多,从而表明外显子同聚物未由于增加的长度而频繁受影响。这表明这些同聚物中的这些插入/缺失在这些癌症中经过阳性选择。
结论
总体上,30,111个同聚物中的1,238个受影响一次,而173个同聚物受影响两次。此外,82个同聚物在至少3个肿瘤中受相同的插入/缺失影响。在那些中,27和8个同聚物存在于4或5个肿瘤中,5个同聚物存在于6个肿瘤中(表7和表23)。相反,仅在一个以上MMR缺陷肿瘤中鉴定出单取代(KRAS中的G13D)。
表23.在11个MMR缺陷外显子组的至少3个中受插入/缺失影响的基因。
Figure BDA0003367311410001551
实施例5.3’和5’UTR中的频发(recurrence)插入/缺失影响长同聚物
由于5’和3’UTR在决定基因表达中至关重要,我们还评估了这些区域中的突变。具体而言,使用来自MMR缺陷肿瘤的外显子组数据,我们能够可靠地评估这些区域的至多83.9%和91.9%。
5.1 调节区中的频发插入/缺失
为了评估5’UTR和3’UTR的任一个是否受频发突变影响,我们筛查了分别定位在10个MMR缺陷肿瘤的外显子组捕获的5’UTR和3’UTR中的5,367和59,259个同聚物。还在全基因组测序的高变体样品的5’UTR和3’UTR中筛查了这些同聚物,使得我们能够在其中筛查5’和3’UTR的肿瘤总数为11个MMR缺陷肿瘤。我们去除了也可以作为种系变体存在于11个MMR缺陷样品的至少一个中的每个热点突变。
同聚物中的频发插入/缺失在5’和3’UTR区中比来自外显子组中的观察结果的预期更频繁:在3’UTR区中,我们在11个肿瘤的至少4个中观察到了1,142个频发插入/缺失,在11个肿瘤的至少3个中观察到1,812个,而在5’UTR中,我们在11个肿瘤的至少4个中观察到50个频发插入/缺失,在11个肿瘤的至少3个中观察到89个。这些频发插入/缺失显示在表6中。在考虑5个附加的MMR缺陷样品时,对于3’UTR区,这产生16个肿瘤的4个中的2648个频发插入/缺失,对于5’UTR区,这产生16个肿瘤的4个中的155个频发插入/缺失。UTR区中的同聚物中的频发插入/缺失(存在于16个MMR缺陷肿瘤的至少4个中)的此列表显示在表1中。此处同样,附加的过滤步骤(不仅排除存在于1000Genomes数据库和dbSNP数据库中的常见变体,还排除我们的超过100个个体的专有数据库中的变体)将UTR区中频繁受影响的同聚物的数目减少至表4中所列的16个肿瘤的4个中的1314个频发插入/缺失(对于3’UTR区)和16个肿瘤的4个中的88个频发插入/缺失。
相反,频发取代非常罕见:在11个肿瘤的至少4个中发现3个频发取代,在11个肿瘤的至少3个中发现18个频发取代,而在5’UTR区中,在三个样品中观察到1个频发取代,在4个或更多个样品中未碰到取代。
5.1.1.同聚物长度及体细胞突变在外显子区、5’UTR和3’UTR中的频发
为了评估5’和3’UTR区中的频发插入/缺失是也源自阳性克隆选择还是简单地由于同聚物含量而发生,我们评估了同聚物的长度分布作为其在外显子、5’UTR和3’UTR中的位置的函数。我们观察到,3’UTR中存在较多的同聚物,而5’UTR中存在较少的同聚物。3’UTR中的同聚物还比外显子组中长。例如,外显子组包含29,733(98.7%)个长度<9个核苷酸的同聚物,而5’UTR和3’UTR分别包含4,857(90.5%)和49,769(84.0%)个长度<9个核苷酸的同聚物。尽管3’UTR中长度短(6或7)的同聚物的数目高于外显子组中(未显示),但3’UTR和外显子组中受影响的同聚物的数目几乎等同(未显示)。在3’UTR中,大量插入/缺失定位在长同聚物(即具有9、10、11、>=12个碱基对的同聚物)中。
在评估5’和3’UTR及外显子组中的频发插入/缺失时,我们观察到,3’UTR中的频发插入/缺失的数目也比5’UTR或外显子组中高得多。显著地,尽管3’UTR中长度7或8的同聚物的数目高于外显子组中,尽管3’UTR中长度7或8的同聚物中的插入/缺失的数目高于外显子组中,但外显子组中存在比3’UTR中多的影响长度7或8的同聚物的频发插入/缺失。3’UTR中的频发插入/缺失主要影响长度11和>=12的同聚物。
为了验证外显子组中长度<9的频繁受影响的同聚物的分数的增加不是由不同区域中同聚物的长度分布的总体差异引起,我们校正了长度<9的同聚物中的插入/缺失频率(即受影响的同聚物的分数)用于这些同聚物在不同区域中的总体发生率。校正的分数计算如下:
Figure BDA0003367311410001561
然后针对三个不同区域(外显子组、5’UTR和3’UTR)计算了此校正的突变频率。此校正后,与5’(19.5%)和3’UTR(2.2%)相比,仍观察到较短的频现同聚物在外显子组中的富集(长度<9的同聚物为39.2%)。这些数据清楚地表明,同聚物长度严格地决定了哪些同聚物在5’和3’UTR中受影响,而在外显子组中,同聚物长度以及突变对克隆生长优势的影响决定那些同聚物频繁受影响。表24显示描述前一段落中的数目的总览。
表24.同聚物的分布作为其长度的函数
Figure BDA0003367311410001562
因此,总的来说,在5’和3’UTR中,同聚物比编码区中长(图4a);此外,UTR中更长的同聚物具有提高的累积插入/缺失的倾向(图4b)。共同地,这导致5’和3’UTR中的插入/缺失频率比编码区中高(分别为增加3.8和10.7倍;图4c)。但是,在UTR中,在长同聚物中排除热点突变。例如,只有3个(89个中的;3.4%)和71个(1,812个中的;3.9%)热点突变在5’和3’UTR中影响长度<9bp的同聚物(表14),而在编码区中,存在至多34个(82个中的;41.5%)这类热点突变(图4d)。总体上,这表明同聚物长度严格决定那些同聚物在5’和3’UTR中频繁受影响,而在编码区中,突变对克隆选择优势的影响共同决定那个同聚物最频繁受影响。
实施例6.频繁突变的基因的基因表达谱
由于我们已假设频发突变与肿瘤的生长优势引起的阳性选择相联系,受这些频发突变影响的基因应至少在正常子宫内膜组织中表达。还预期这些基因中的至少一个亚组可以见于其他错配修复缺陷的肿瘤中,且热点突变将改变受影响的基因的表达。因此,我们在子宫内膜特异性表达的背景中及在结直肠MMR缺陷肿瘤中差异表达的基因的背景中分析了受频发突变影响的基因的表达谱。
6.1 正常子宫内膜中的基因表达
用查询“在人类子宫内膜中过量表达/欠表达/非差异表达的所有基因”从GeneExpression Atlas23(http://www.ebi.ac.uk/gxa/)下载正常子宫内膜组织中的基因表达数据。此查询产生14,664个基因,其中9,021个在正常子宫内膜中过量表达,463个欠表达,5,180个未显示差异表达。由于过量表达和欠表达是相对于整个不同组织类型中的一般基因表达谱计算,难以评估欠表达的基因是有效地缺失(不表达)还是仅以较低的水平表达。但是,对于在子宫内膜组织中显著过量表达的基因,我们可以安全地提出,它们至少在子宫内膜内发挥作用。因此,在此分析中,我们将我们自己限制于在正常子宫内膜中过量表达的基因。
将来自不同数据集的突变与所衍生的表达数据相比较:在MMR健全肿瘤中突变的所有基因(MMR+基因),在MMR缺陷肿瘤中突变的所有基因(MMR-基因),在MMR缺陷肿瘤中频繁受影响的所有基因(定义为11个样品中的3个,频发基因),及最后的外显子区中的所有频发插入/缺失(频发外显子)。此分析表明,频发(热点)突变在正常子宫内膜组织中过量表达的基因中过量存在。这些分析的所有数目显示在表25中。
表25.正常子宫内膜中的基因表达
Figure BDA0003367311410001571
微卫星不稳定的结直肠癌特异的基因中的分析
从Banerjea等22的研究衍生在微卫星不稳定(MSI-H)和微卫星稳定(MSS)的结直肠癌之间差异表达的基因。在此研究中,分析了133个结直肠肿瘤,其中29个(22%)肿瘤鉴定为MSI-H。从Affymetrix HG-U133A芯片衍生基因表达数据。衍生的数据集包含4,874个在微卫星不稳定和稳定的癌症之间差异表达的基因(P<0.05,Benjamini and Hochberg FalseDiscovery Rate)。
将来自不同数据集的突变与所衍生的表达数据相比较:在MMR健全肿瘤中突变的所有基因(MMR+基因),在MMR缺陷肿瘤中突变的所有基因(MMR-基因),在MMR缺陷肿瘤中频繁受影响的所有基因(定义为11个样品中的3个,频发基因),及最后的外显子区中的所有频发插入/缺失(频发外显子)。此分析揭示,热点突变在在微卫星不稳定肿瘤中差异表达的基因集中富集。
表26.具有MSI的结直肠癌特异的仅的分析
Figure BDA0003367311410001581
总结
使用来自Gene Expression Atlas(Kapushesky等,2010)的公开可得的表达数目,我们评估了在至少3个MMR缺陷肿瘤中受相同的突变(后文称为热点突变)影响的基因是否在正常EM组织中表达。在MMR健全和MMR缺陷肿瘤中突变的所有基因中,与受热点突变影响的基因的88%相比,58%和64%在EM组织中表达(表25)。针对正常黏膜组织获得了相似的数据(未显示)。此外,在评估MMR缺陷肿瘤和MMR健全肿瘤之间的表达差异时(Banerjea等,2004),我们观察到,受非热点突变影响的基因的20%和受热点突变影响的基因的32%差异表达。因此,热点突变优先影响在正常组织中表达的基因,并改变其表达,表明它们源自肿瘤中的阳性克隆选择。
实施例7.可靠地检测多种肿瘤类型中的MSI的频发突变
目前用由8个微卫星标记和2个同聚物标记组成的扩展的Bethesda系列来诊断性评估MSI作为MMR缺陷的标记9,15。由于这些标记不是根据它们影响MMR肿瘤的相对频率选择,此系列有时未能检测到MMR肿瘤24。因此,我们评估了频发突变是否可以改善MSI的检测。
7.1 诊断系列的构建
存在我们通过其认为可能改善目前用于检测微卫星不稳定性的诊断系列的两个标准。首先,我们以无偏方式测定了MMR缺陷肿瘤中的频发突变:通过进行全基因组和外显子组测序实验并简单地观察那些未知频繁受影响。以无偏方式进行的检测表明,最频发的热点突变将对检测MSI最敏感。第二,我们鉴定出的大多数频发插入/缺失定位在3’UTR中。5’和3’UTR中的频发插入/缺失不进行严格的阳性选择,而是主要由受影响的同聚物的长度决定,不可能发生组织特异性富集。这两个标准确保我们:i)选择到没有关于其功能的先验知识、在多个肿瘤样品中频繁受影响的标记;和ii)具有许多可能独立于癌症类型的标记。对于后者,选自5’和3’UTR的插入/缺失可以是最有用的。
为了获得最高的敏感性,我们仅使用存在于4个或更多个样品中的突变。对于5’和3’UTR频发插入/缺失,优选影响5个或更多个样品的插入/缺失。用得到的44个频发外显子插入/缺失、1,142个频发3’UTR插入/缺失和50个频发5’UTR插入/缺失设计基于Sequenom的系列来检测MMR缺陷。由于频发插入/缺失定位在同聚物区域中,Sequenom多重PCR的引物设计复杂。广泛的优化实验后,成功产生了对56个热点突变进行基因型分型的六个测定。在56个热点突变中,11个定位在外显子中,40个定位在3’UTR中,5个定位在5’UTR中。我们将此系列称为56标记系列。这56个突变的全部详情可以见于表3中。
7.2 子宫内膜肿瘤中的MSI的诊断评估
然后,将该56标记系列应用于114个未经选择的手术切除的子宫内膜肿瘤的附加系列,该系列由7个透明细胞型子宫内膜癌、69个子宫内膜样子宫内膜癌、18个混合型erousendometrioid子宫内膜癌、10个浆液型子宫内膜癌和10个未分类的子宫内膜癌组成。所有肿瘤都是原发性未化疗子宫内膜肿瘤。可获得这些肿瘤中的每一个的新鲜冷冻组织。所选择的标记的基因型分型成功率高(平均为98.7%)。一个样品的阳性标记的数目在0和33之间变动,具有每个样品6.5个阳性标记的总体平均数。类似于Bethesda系列,我们定义了三类微卫星不稳定性:微卫星稳定(MSS,Bethesda中的10个标记中的0个,或56标记系列中的56个标记中的0或1个)、低微卫星不稳定性(MSI-L,Bethesda系列中的10个标记中的1-2个,56标记系列中的2和9个标记之间)和高微卫星不稳定性(MSI-H,Bethesda中的10个标记中的3个或更多个,56标记系列中的10个或更多个)。根据56标记系列的这些种类,将65个肿瘤(57.0%)定义为MSS,分别将33个肿瘤(29.0%)和16个肿瘤(14.0%)定义为MSI-H和MSI-L。在这33个MSI-H肿瘤中,Bethesda将29个肿瘤鉴定为MSI-H(>2标记为阳性),3个肿瘤鉴定为MSI-L,一个肿瘤鉴定为MSS。反之,Bethesda未鉴定出未通过我们的热点突变系列鉴定出的任意MSI-H肿瘤(如图5中所示)。此结果显示,对于此系列的子宫内膜肿瘤,56标记系列表现得比Bethesda系列好。结直肠肿瘤中的数目相当(未显示)。
7.3 其他肿瘤类型中的突变特征
我们还将我们的56标记系列应用于其他肿瘤类型(卵巢肿瘤和白血病)。选择了4个MSI-H样品,包括1个卵巢肿瘤和3个白血病细胞系样品(DND41、CCRF-CEM和SUPT1)。为了评估我们在MMR缺陷的子宫内膜/结直肠肿瘤中的观察结果是否可以扩展至其他肿瘤类型,对MSI-H卵巢肿瘤、检测为MSS的两个卵巢肿瘤机器匹配的正常样品、以及三个MSI-H白血病细胞系和MSS白血病细胞系(RPMI-8402)进行了测序。
3个卵巢肿瘤-正常对是在手术过程中收集的原发性未化疗肿瘤。用Illumina的TruSeq捕获对MMR缺陷卵巢肿瘤(MMR-卵巢1)及其匹配的正常DNA进行了外显子组测序。上述相同的分析途径用于分析这些外显子组数据。从已有的全基因组数据提取两个MMR+卵巢肿瘤(MMR+卵巢1和2)及其匹配的正常样品的外显子组数据。具体而言,两个MMR健全肿瘤-正常对已经可从另一项目获得,并用Complete Genomics测序。全基因组序列以检索号EGAS00001000158保存在European Genome-Phenome Archive。将与本文前面的实施例中所述相同的分析用于这些基因组。
此外,用Nimblegen捕获对4个白血病细胞系进行了外显子组测序。用NimblegenSeqCap EZ Human Exome Library v2.0捕获外显子组。按照来自Illumina’s paired-endDNA Sample Preparation Guide的标准流程构建预富集DNA文库。根据生产商的说明书进行外显子组富集。进行一轮(72小时)基于生物素化诱饵的杂交,然后进行链霉抗生物素蛋白磁珠结合、洗涤步骤和洗脱步骤。洗脱后进行18个循环的PCR富集,对富集的文库进行Illumina测序(HiSeq 2000)。用TruSeq SBS试剂盒进行末端配对测序(2x51bp)。一个泳道用于一个外显子组。所有样品的详细临床信息在表27中列出。表28列出见于所有卵巢和白细胞样品中的MMR基因中的所有突变。
表27.卵巢和白血病肿瘤的临床信息
Figure BDA0003367311410001601
表28.卵巢和白血病肿瘤中的MMR基因的突变状态
Figure BDA0003367311410001602
在MMR缺陷卵巢肿瘤(MMR-卵巢1)中,检测到2,045个新的体细胞取代和280个新的体细胞插入/缺失。由于在其他MMR缺陷肿瘤中的验证率在全基因组和外显子组测序的肿瘤中都非常高(见上),未对此肿瘤进行进一步验证。在两个MMR健全卵巢肿瘤中,分别检测到32和42个新的体细胞取代及12和18个新的体细胞插入/缺失。由于在MMR健全肿瘤中的验证率通常低,用Sequenom MassARRAY验证了两个MMR健全卵巢肿瘤中的所有体细胞突变。分别将16和20个取代确认为MMR健全卵巢肿瘤中的真实取代。插入/缺失未在任一肿瘤中得到确认。对于这些体细胞突变,我们观察到与在EM/CRC肿瘤中观察到的相同的模式(数据未显示)。
用上文所述的Illumina HiSeq技术对四个白血病细胞系的外显子组进行了测序。由于对这些细胞系而言没有可获得的匹配的正常DNA样品,我们不能在体细胞突变或种系突变之间区分。但是,使用早先描述的常见的变体过滤途径,我们可以消除最频繁存在的变体。如之前在MMR缺陷肿瘤中所观察到,插入/缺失主要定位在MMR缺陷白血病样品的同聚物中。另一方面,MMR健全样品未显示此模式(未显示)。
对于取代,MMR缺陷样品和MMR健全样品中的模式非常相似(未显示)。具体而言,这些模式揭示了大多数取代不定位在重复区。如在子宫内膜/结直肠MMR缺陷肿瘤中,MMR缺陷样品中的取代主要由转换组成(分别为73.0%和27.0%颠换)。
总结
我们选择了通过外显子组测序鉴定的最频发的热点突变中的56个:45个在UTR中,其进行克隆选择的倾向性较低,因此可以检测不同组织类型的肿瘤中的MSI;11个在编码区中。针对这56个突变对114个手术切除的EM肿瘤进行的基因型分型揭示,33个(29.0%)肿瘤的≥10个标记为阳性(MSI-高或MSI-H),16个(14.0%)肿瘤的2至9个标记为阳性(MSI-低或MSI-L)。其余65个(57.0%)肿瘤的<2个标记为阳性,是微卫星稳定(MSS)肿瘤(图5)。在33个MSI-H肿瘤中,Bethesda仅将29个肿瘤鉴定为MSI-H(>2个标记为阳性)。4个不一致的肿瘤在MSH6中包含移码突变,或在组织病理学上为MSH6缺陷,从而确认它们是MSI-H。反之,Bethesda未鉴定出未通过我们的热点突变系列鉴定出的任意MSI-H。
最后,我们评估了热点突变是否也存在于卵巢肿瘤和白血病中。首先,使用我们的56标记系列,我们选择了各有20、25、23和21个标记为阳性的1个卵巢肿瘤和3个白血病细胞系(DND41、CCRF-CEM和SUPT1),以及没有阳性标记的2个卵巢肿瘤和一个白血病细胞系(RPMI8402)。卵巢肿瘤及其匹配的正常样品的外显子组测序确认,MSI-H卵巢肿瘤包含基本上比2个对应的MSS肿瘤多的体细胞事件,包括MSH6中的移码缺失。虽然我们由于匹配的种系DNA不可得而未能在白血病细胞系中的体细胞突变或种系突变之间进行区分,但取代和插入/缺失在MSI-H细胞系中也更频繁(注意S9)。观察到了MLH1中的两个功能丧失突变和MSH6中的移码缺失,确认了MSI-H细胞系为MMR缺陷。在评估在子宫内膜肿瘤中鉴定出的频发突变是否也存在于卵巢和白血病基因组中时,我们注意到,在子宫内膜MMR-肿瘤中的384个频发突变中,60、25、8和1个分别存在于1、2、3或4个MMR-肿瘤中(未显示)。在将频发突变限制于存在于至少3个子宫内膜肿瘤中的那些时,观察到了更明显的富集。最后,由于肿瘤组织阳性选择外显子组中的频发插入/缺失,而5’和3’UTR中的频发插入/缺失主要取决于同聚物的长度,UTR中的插入/缺失可以代表更好的MSI标记。
实施例8.MMR缺陷肿瘤的突变模式影响DNA双链断裂修复
为了探究MMR缺陷肿瘤中的热点突变的生物学相关性,我们用两种不同工具(即
Figure BDA0003367311410001611
和GenomeMuSiC)进行了途径分析。这两种工具使用四种不同的途径数据库,即IPA、KEGG、BioCarta和Reactome数据库。多种工具和数据库的使用允许我们获得受影响的途径的详细印象。
8.1.使用
Figure BDA0003367311410001612
和GenomeMuSiC的途径分析
Ingenuity Pathway Analysis(
Figure BDA0003367311410001613
http://www.ingenuity.com/)使得能够鉴定与目的基因最相关的生物学途径。用
Figure BDA0003367311410001614
对所有具有体细胞插入/缺失(2,231个基因中的3,022个插入/缺失,排除MMR基因中的插入/缺失,因为我们对源自MMR缺陷的二次突变感兴趣)的基因进行的途径分析揭示,24个途径显著富集(P<0.05)(未显示)。“BRCA1在DNA损伤反应中的作用”和“通过同源重组(HP)进行的DNA双链断裂(DSB)修复”分别排第1和第3。如果将目的基因列表限制于仅携带热点突变(452个基因中的1,382个插入/缺失)的基因,则揭示了如表29中所示的13个显著富集的途径。
表29.携带热点突变的基因的途经分析
Figure BDA0003367311410001615
Figure BDA0003367311410001621
总的来说,
Figure BDA0003367311410001622
用两个不同的目的基因集(即携带体细胞插入/缺失的所有基因和具有热点突变的所有基因)揭示“BRCA1中DNA损伤反应中的作用”是最靠前的富集途径。“G2/MDNA检验点调节”和“通过同源重组(HP)进行的DNA双链断裂(DSB)修复”也高度显著。
用所有体细胞插入/缺失(排除MMR基因上的所有插入/缺失)作为输入,用GenomeMuSiC(http://gmt.genome.wustl.edu/genome-music/0.3/index.html)进行了类似的分析。用GenomeMuSiC对MMR缺陷肿瘤中的所有体细胞插入/缺失(2,231个基因中的3,022个插入/缺失,排除MMR基因中的插入/缺失)进行的途经分析揭示了51个显著突变的途径(FDR<0.05)。“DNA修复”、“碱基切除修复”和“G2/M DNA损伤检验点”途径排序最高,从而确认了来自
Figure BDA0003367311410001623
分析的结果。
8.2 外显子/内含子分界中的插入/缺失的途径分析
此外,由于已知基因也可以通过定位在外显子/内含子分界中的影响同聚物的插入/缺失而失活,我们将我们的突变判定扩展至存在于每个外显子的上游和下游的25个碱基对序列中的插入/缺失。按早先所述进行相同的突变判定和过滤途径。我们检测到外显子/内含子分界中的1,700个附加的插入/缺失,包括ATM的内含子7的同聚物中的缺失、MRE11的内含子4的同聚物中的缺失和FANCD2的内含子5的同聚物中的插入。这三个插入/缺失分别影响7、5和1个样品。与外显子区域中的3,022个插入/缺失一起,全部4,722个突变的GenomeMuSiC分析揭示了54个显著突变的途径(FDR<0.05)。外显子/内含子分界中的插入/缺失的纳入产生了DNA DSB修复作为最靠前的富集途径的甚至更强的信号。
考虑所有分析,有11个基因涉及通过HR途径进行的DSB修复。以下表30列出这些基因和在这些基因中携带突变的MMR缺陷肿瘤。
表30.涉及通过HR途径进行的DSB修复的基因
Figure BDA0003367311410001624
总结
由于MMR缺陷肿瘤中的插入/缺失可以经历阳性或阴性克隆选择,我们评估了具体途径是否富集这些突变。平均每个MMR缺陷肿瘤包含309个插入/缺失,其中30个是热点突变。用
Figure BDA0003367311410001631
对所有受体细胞插入/缺失影响的基因(除MMR基因外,因为这些基因中的插入/缺失导致MMR缺陷)进行的途径分析揭示,“BRCA1在DNA损伤反应中的作用”和“通过同源重组(HR)进行的DNA双链断裂DSB)修复”是最靠前的富集途径(分别为P=6.5E-03和P=1.1E-02)。所有热点突变的
Figure BDA0003367311410001632
分析揭示,除“BRCA1在DNA损伤反应中的作用”(P=2.0E-03)外、“G2/M DNA损伤检验点调节”途径也富集(P=3.1E-03)。这些途径中最频繁突变的基因包括ATR、BLM、BRCA1、CHEK1和FANCM(分别为4、2、2、2和2个突变;表30)等。用GenomeMuSiC(其基于KEGG、BioCarta或Reactom数据库计算特异性突变的途径,同时校正背景突变率)对MMR缺陷肿瘤中的所有插入/缺失进行的途经分析揭示,“DNA修复”、“碱基切除修复”和“G2/M DNA损伤检验点”分别排序最高(分比为P=6.3E-05、P=3.1E-04和P=9.8E-04)。此外,由于DSB修复基因还可以受定位在外显子/内含子分界中的同聚物中的功能丧失插入/缺失影响(Ham等,2006),我们将我们的突变判定扩展至存在于每个外显子的上游和下游的25bp序列中的插入/缺失。所有突变(1,700个外显子/内含子分界插入/缺失和3,022个外显子插入/缺失)的GenomeMuSiC分析产生DNA DSB修复作为最靠前的富集途径的甚至更强的信号(例如,对于BioCarta中的“ATR/BRCA”途径,P=6.8E-07,对于Reactome中的“G2/M DNA损伤检验点”,P=3.0E-05)。总体上,每个MMR缺陷肿瘤平均在通过HR途径进行的DNA修复中包含3.0±0.5个插入/缺失(图6)。
在复制这些发现的尝试中,我们分析了在The Cancer Genome Atlas network(TCGA,2012)的背景中测序的27CRC MSI-H肿瘤的外显子组数据。虽然以仅20x(其对可靠检测同聚物中的插入/缺失而言非常低(Reumers等,2011))的平均覆盖深度对这些肿瘤进行了测序,但我们选择了针对这些肿瘤报道的1,426个移码插入/缺失(在1,284个基因中,不包括MMR基因)中的每一个,此外还选择了通过TCGA鉴定的19个插入/缺失,该TCGA基于通过候选基因法选择的29个同聚物的分开评估。显著地,受插入/缺失影响的1,303个基因的IPA分析确认,“BRCA1在DNA损伤反应中的作用”同样是最靠前的富集途径(P=0.0148)。此途径中突变的基因包括RAD50、ATR、BLM和CHEK1(分别为7、5、2和1个突变;图6)。
8.3 MMR缺陷细胞中通过HR途径进行的DSB修复的失活
为了研究MMR缺陷肿瘤中通过HR途径进行的DSB修复是否在功能上失活,我们评估了8个MMR缺陷和4个MMR健全的原代肿瘤培养物和癌细胞系中的DSB修复活性。用56标记系列分析分析这些细胞的MMR状态,并通过Bethesda系列确认。
从在Division of Gynecologic Oncology,University HospitalsGasthuisberg,Leuven(比利时)进行手术的患者建立9个原代子宫内膜和卵巢肿瘤细胞培养物。只有在提供知情同意书后,才将患者纳入研究中。用以下流程来产生原代肿瘤培养物。首先,为了从手术室转运至细胞培养实验室,将肿瘤样品放入补充了青霉素/链霉素(1000U/ml)和两性霉素(0.5μg/ml)(全都来自Life Technologies)的无菌RPMI培养基。随后用补充了青霉素/链霉素和两性霉素的PBS洗涤肿瘤样品,用无菌刀片切碎组织。用含胶原酶IV型(1mg/ml;Roche)的补充了青霉素/链霉素和两性霉素的RPMI培养基(LifeTechnologies)消化肿瘤组织。还向消化培养基中加入DNA酶I(0.1mg/ml;Roche)。消化在37℃下伴随震荡进行3小时。然后,通过滤过70μm滤器来制备单细胞悬液,并用氯化铵溶液(Stem Cell Technologies)裂解红细胞。最后将单细胞接种入25cm2培养瓶,第二天更换培养基。1-3周后,在细胞达到60-70%汇合时,用小鼠抗-人CD90(克隆AS02;Dianova)去除成纤维细胞,用Mouse Pan IgG Dynabeads(Life Technologies)进行阴性选择。然后在70-90%汇合时传代细胞培养物,在不同代次将细胞培养物存入细胞库。表31列出按照此流程产生的多种原代肿瘤培养物。
表31.原代肿瘤细胞培养物
Figure BDA0003367311410001641
在补充了20%胎牛血清、2mM L-谷氨酰胺、100U/ml青霉素、100μg/ml链霉素、1μg/ml两性霉素和10μg/ml庆大霉素的RPMI Medium 1640(Gibco)中培养原代肿瘤细胞培养物,直至20代。在37℃下在含5%CO2的湿空气中进行所有细胞培养。还常规监测它们的支原体污染,且未检测到支原体生长。
HEC-1-A、MDA-MB-231和MCF7细胞全获自American Type Culture Collections(ATCC,Manassas,VA,USA)。HEC-1-A细胞培养在McCoy’s 5A Medium(Gibco-BRL,Lifetechnologies)中,MDA-MB-231和MCF7细胞培养在Dulbecco’s Modified Eagle’s Medium(DMEM,Gibco-BRL)中,全都补充10%胎牛血清(FBS,Gibco-BRL)、2mM L-谷氨酰胺、100U/ml青霉素和100μg/ml链霉素(全都来自Life Technologies)。将全部人细胞在37℃下维持在含5%CO2的湿空气中。表32中列出细胞系。
表32.
Figure BDA0003367311410001642
总结
已确定MMR缺陷肿瘤富含影响通过HR途径进行的DSB修复的功能丧失突变,我们研究了此途径是否也在功能上失活。这是相关的,因为这些突变是杂合插入/缺失,其功能丧失作用可以由未受影响的等位基因弥补。由于单链断裂(SSB)在DNA复制过程中转化为DSB,从而激活通过HR进行的DSB修复,我们将8个MMR缺陷肿瘤和4个MMR健全肿瘤(9个原代肿瘤培养物和3个癌细胞系)暴露于抑制SSB修复的PARP抑制剂olaparib,随后分别定量具有γH2AX-和RAD51-阳性点的细胞的相对数目作为DNA损伤和活性HR的测量。由肿瘤中没有一个进行了外显子组测序,因此代表MMR缺陷肿瘤的独立组,用我们的56标记系列测定MMR状态,并用Bethesda系列确认。虽然我们未在缺乏olaparib的情况下观察到MMR缺陷肿瘤培养物和MMR健全肿瘤培养物之间的RAD51点形成的差异(10±2%的细胞对13±2%显示RAD51点形成,P=0.74;图7a、b),但暴露于10μM olaparib导致MMR缺陷细胞中的RAD51点形成显著少于MMR健全细胞(19±3%对37±4%;P=0.02;图7a、b)。相反,在通过H2AX免疫荧光研究未修复的DNA损伤的程度时,无论其MMR状态是哪种,olaparib都显著增加所有细胞中的γH2AX点的数目(未显示),从而表明DNA损伤的含量在两种培养物之间相似。由于在BRCA1或BRCA2缺陷细胞中,PARP抑制时完全缺乏RAD51点形成(Farmer等,2005),这些数据表明,在MMR缺陷细胞中,通过HR途径进行的DSB修复仅部分失活。
实施例9.PARP抑制剂olaparib致敏MMR缺陷肿瘤
由于MMR缺陷肿瘤表征为通过HR途径进行的DSB修复的活性降低,我们假定,类似于BRCA1缺陷肿瘤(Farmer等,2005),PARP抑制剂可以选择性靶向这些肿瘤。将全部8个MMR缺陷培养物和4个MMR健全培养物剂量依赖性地(1,3和10μM)暴露于olaparib,并评估对增殖的影响。单个MMR缺陷培养物(包括6个MMR缺陷原代肿瘤培养物中的每一个)在暴露于olaparib时显示增殖的剂量依赖性减少,而MMR健全的细胞中没有一个表征为相似的反应。平均起来,1、3和10μM的olaparib分别使MMR缺陷细胞的增殖减少15%、20%和42%(P=0.02、P<0.001和P<0.001,各自与未处理的细胞相比;图7c),而在48小时时未在MMR健全肿瘤中观察到作用(对于olaparib的所有浓度,P=NS;图7d)。总体上,增殖在MMR缺陷和健全肿瘤之间也高度显著不同(重复测量P<0.001)。由于分别暴露于3μM和10μM的olaparib的BRCA1和BRCA2缺陷细胞表征为78%和91%的活率降低(Farmer等,2005;Patel等,2012),这些“离体”数据确认,与它们通过HR途径进行的DSB修复的部分失活一致,MMR缺陷细胞通过PARP抑制致敏。
使用xCELLigence系统的细胞增殖
用Real-Time Cell Analyzer(RTCA)xCELLigence System(Roche AppliedScience,Mannheim,德国)来动态监测细胞增殖率。该系统测量组织培养E-平板的底部上的跨微电极电阻抗。阻抗测量结果提供关于细胞数目、活率、形态和黏附的定量信息。在200μl培养基中将5,000细胞/孔接种在E-平板16(Roche)上。接种后24小时,用olaparib处理细胞至希望的终浓度(1、3、10μM olaparib)。所有孔中最终的DMSO百分比为0.1%。每个处理条件重复测量三次。处理后按5分钟的间隔监测动态细胞指数值48小时。将细胞指数值对各细胞的载体处理对照归一化。下图显示每种细胞培养物的细胞增殖率(MMR缺陷细胞显示为蓝色,MMR健全细胞显示为红色)。总的来说,MMR缺陷细胞表征为增殖的剂量依赖性减少,而MMR健全细胞未响应olaparib(重复测量P=2.0E-7;图7c和e)。
讨论
在此,我们测序了MMR缺陷肿瘤的第一个全基因组。我们观察到,大多数体细胞取代由核苷酸转换组成,邻近核苷酸对测定那些核苷酸受影响具有重要的背景依赖性作用。显著地,在种系DNA和其他真核生物中及在以相似的方式与重要的基因组特征相关的这些基因组中也观察到了这些取代模式(Hodgkinson和Eyre-Walker,2011)。具体而言,我们在甲基化CpG序列中观察到了更高数目的取代,使MMR机器涉及甲基化胞嘧啶脱酰胺的修复,证明非标准MMR对维持基因组完整性至关重要。
此外,脱酰胺是人疾病相关突变和进化潜在的最重要的过程之一。从这个角度看,值得注意的是,我们在10个来自MMR缺陷肿瘤的附加基因组中、在从头种系取代中及在人和小鼠SNP数据库中观察到了非常相似的特征。总体上,这些观察结果表明,类似于细菌群体(Saint-Ruf和Matic,2006),人类中不完整的错配修复促成通过遗传适应进行的自然选择。
高变体中约一半的突变是插入/缺失。重要地,虽然在高通量测序中插入/缺失检测背负非常高的假阳性率,但我们用正交技术验证了92.7%的插入/缺失。大多数插入/缺失特异性影响同聚物序列。这是相关的,因为目前用于诊断分类MSI的扩展的Bethesda系列具有非常有限的敏感性(对MLH1-、MSH2-和MSH6-缺陷肿瘤为80%、84%和55%(de laChapelle和Hampel,2010)),可能是因为它由8个微卫星标记和仅2个同聚物标记组成。我们的通过外显子组测序鉴定的热点突变的56标记系列在检测MSI中更敏感,尤其是在已知MSH6缺陷比MLH1或MSH2缺陷更频繁的EM肿瘤中。此外,由于56个标记中的45个定位在不太可能驱动克隆选择的UTR中,我们能够在影响不同组织的癌症中检测MSI-H。最后,由于56个标记中的大多数定位在长度≤10bp的同聚物中,这些标记与多种低至高通量的基因型分型技术相容,如单碱基对延伸(Sequenom MassArray)、等位基因特异性杂交(TaqMan)技术和熔解曲线分析(包括HRM)。Bethesda中最敏感的标记(BAT25和BAT26)明显相容性较低,因为它们检测25和26bp的同聚物中的插入/缺失。
有趣地,我们观察到,外显子组中的几个插入/缺失(全都代表功能丧失不变)作为热点突变存在。平均起来,每个肿瘤包含30个热点突变,与MMR健全肿瘤之前的癌症测序努力相比,该热点突变显著高(Nik-Zainal等,2012;Rausch等,2012)。途径分析进一步揭示,通过HR途径进行的DSB修复富集突变;每个肿瘤中平均有3个突变影响此途径。之前已报道了DSB修复基因(如RE11A或RAD50)中的突变,但这些研究集中在单个基因中的具体突变上而不是途径上,因此仅可以确定一部分MMR缺陷肿瘤在这些基因之一中突变(Miquel等,2007)。此外,虽然公认BRCA1和BRCA2缺陷的细胞以及范科尼贫血(Fanconi anemia)或其他HR相关基因缺陷的细胞选择性地对PARP抑制剂超敏感(Murai等,2012),但证明MMR缺陷细胞系对PARP抑制的选择性尚不确凿。迄今最有前景的研究观察到MRE11的表达水平和对PARP抑制剂ABT-888的细胞毒性之间微弱但显著的相关,但随后在MSS细胞系中敲减MRE11仅轻微改变了在高浓度的抑制剂下的增殖(Vilar等,2011)。相反,我们无假定地发现,在我们自己的数据集中及在公开的TCGA数据集中,通过HR进行的DSB修复是MMR缺陷EM和CRC肿瘤中受功能丧失突变影响的最靠前的途径,表明该途径中的几个基因协作来在MMR缺陷肿瘤中失活通过HR进行的DSB修复。每个MMR缺陷原代肿瘤培养物以及无MRE11突变的那些在用olaparib攻击时显示剂量依赖性作用的发现在功能上确认了这些杂合突变的累积作用。
已发展了几种PARP抑制剂,如olaparib(AZD2281)、veliparib(ABT-888)和niraparib(MK-4827)。用这些抑制剂进行的初步研究揭示了在携带BRCA1和BRCA2突变的乳腺癌或卵巢癌患者中显著的临床益处而不引起过量毒性(Tutt等,2010)。尽管有这些令人鼓舞的结果,但PARP抑制剂尚未获批(Maxwell和Domchek,2012)。主要障碍之一是缺乏低成本的经FDA批准的诊断测试。用于BRCA1和BRCA2突变测试的诊断测试不是FDA批准的,且相关成本非常高。因此,制药公司对启动PARP抑制剂的3期临床研究犹豫不决(Maxwell和Domchek,2012)。我们的MMR缺陷肿瘤对PARP抑制敏感的观察结果在这方面很有吸引力。首先,我们的研究鉴定出可能对PARP抑制敏感的第二个亚组的肿瘤。虽然可以理解MSI肿瘤仅代表CRC和EM肿瘤的小部分,但可以受益的患有MSI肿瘤的绝对患者群体与具有BRCA1或BRCA2突变或甚至其他靶向剂的群体一样大(如果不大于)。第二,MSI肿瘤的伴随诊断测试已经可得,使用传统方法(如Bethesda系列),或通过频发热点突变的谱分析。因此,我们的观察结果转化入临床背景可能比BRCA1或BRCA2突变载体进展得更快,且可以通过我们的更敏感和可自动化/可放大的标记系列进一步加速。第三,对MSI肿瘤中的靶向治疗选择存在巨大的临床需要。具体而言,虽然具有MSI的II或III期CRC肿瘤表征为轻微改善的预后,但晚期背景中的MSI肿瘤与更多的腹膜转移及更差的不依赖于化疗方案的总体存活相关(Smith等,2013)。
此外,已将对PARP抑制的临床抗性归因于恢复全长BRCA1或2蛋白质从而重新建立其在肿瘤细胞中的功能的二次突变(Barber等,2012),但这种机制不太可能针对受体细胞突变影响的每个DSB修复基因发生。这表明MMR缺陷肿瘤不太可能发展对PARP抑制剂的抗性,使得它们从长期看在治疗上更有价值。
材料和方法
错配修复频率的检测:为了评估肿瘤和匹配的种系样品中的MLH1、MSH2和MSH6表达,用以下单克隆抗体进行了免疫组织化学:用于MLH1的克隆ES05(DAKO)、用于MSH2的克隆G219-1129(BD Pharmagen)和用于MSH6的克隆EP49(Epitomics)。用SALSA MS-MLPA KIT(MRC-Holland)测定MLH1启动子区的超甲基化状态。
样品选择和制备:我们选择了14个子宫内膜、3个结直肠肿瘤和3个卵巢肿瘤-正常对进行测序。肿瘤DNA源自新鲜冷冻的肿瘤组织。所有样品都是原发性未化疗肿瘤。这20个样品的匹配的正常DNA提取自外周白细胞。从所有患者获得知情同意书。此外,对4个市售T细胞急性成淋巴细胞白血病细胞系(DND41、CCRF-CEM、SUPT1和RPMI-8402,获自DSMZ,http://www.dsmz.de/)进行了测序。对于所有样品,用Qiagen DNAeasy试剂盒提取DNA。
全基因组测序:选择了5个肿瘤-正常对(包括3个EM对和2个卵巢对)进行全基因组测序。用Complete
Figure BDA0003367311410001671
服务进行末端配对测序,该服务包括原始数据分析(图像分析、碱基判定、比对和变体判定)用。CGA工具(http://cgatools.sourceforge.net)的calldiff法来选择体细胞突变。对于每个体细胞突变,CGA工具报告体细胞评分,反映所判定的体细胞突变的置信度。分值越高表示置信度越高。使用通过Sequenom MassARRAY产生的验证数据,我们确定了选择真实的体细胞突变并消除假阳性测序错误的最佳截止值。将体细胞得分截止值应用于所有体细胞突变列表,仅在具有高于这些阈值的分值的突变用于进一步分析。
MMR缺陷肿瘤的外显子组测序:用TruSeq Exome Enrichment Kit(Illumina)捕获15个子宫内膜、结直肠肿瘤和卵巢肿瘤-正常对的外显子组。在HiSeq2000上用TruSeq SBS试剂盒进行末端配对测序(对于EM和卵巢样品为2x75bp,对于CRC样品为2x100bp)。用Nimblegen SeqCap EZ Human Exome Library v2.0捕获4个白血病基因组的外显子组。在HiSeq2000上用TruSeq SBS试剂盒进行末端配对测序(2x50bp)。对于所有外显子组,用默认参数用BWA来将来自每个测序泳道的原始读出与人参考基因组比对。用SAMtools(v.0.1.13)处理和分选比对的读出,用Picard MarkDuplicates去除PCR重复。用GenomeAnalysisToolKit(McKenna等,2010)(GATK v1.0.4487)进行碱基重校准、插入/缺失周围的局部比对和单核苷酸变体判定。用GATK Unified Genotyper判定取代,而用Dindel(Albers等,2011)(v1.01)检测插入/缺失。根据由GATK变体判定者提供的质量分值进行取代的最初质量过滤。只有在质量分值在肿瘤和匹配的正常样品中大于Q30时,才保留突变。
全基因组和外显子组数据的注释:用ANNOVAR和UCSC RefGene hg18注释道(Wang等,2010)注释了全基因组序列数据。用“grepseq”(http://code.google.com/p/grepseq/)确定重复序列。微卫星定义为由至少两个重复单位组成且具有6个碱基的最小长度的二、三、四、五和六核苷酸重复,同聚物定义为最小长度为6个碱基的单核苷酸重复,短同聚物定义为3、4或5个碱基长的单核苷酸重复。用BED工具的intersectBed命令进行重复区域的注释。
全基因组和外显子组数目的可及性:所有全基因组和外显子组数据的未过滤的变体文件已在受限检索下以检索号EGAS00001000182和EGAS00001000158保藏在EuropeanGenotype Phenotype Archive(http://www.ebi.ac.uk/ega)。
原代肿瘤培养和免疫荧光:从进行手术的患者的肿瘤建立九个原代子宫内膜和卵巢肿瘤细胞培养物。将原代肿瘤细胞培养物培养在补充了20%FBS、2mM L-谷氨酰胺、100U/ml青霉素、100μg/ml链霉素、1μg/ml两性霉素和10μg/ml庆大霉素的RPMI1640培养基(GIBCO)中至多20代。在400μl培养基中将25,000细胞/孔接种在8孔玻片(Nunc)上,并培养24小时。暴露于0或10μM olaparib后,在PBS中漂洗玻片,在37℃的多聚甲醛中固定,用0.1%Triton X-100通透,并用BSA封闭。用小鼠抗-磷酸-组蛋白H2A.X单克隆抗体(Millipore克隆JBW301,1:100)或兔抗-Rad51(H-92)多克隆抗体(Santa Cruz H-92,1:1000)染色细胞,在含0.1%Triton X-100的PBS中洗涤。使用Alexa Fluor 488(Invitrogen),将玻片封固在含有DAPI的Prolong Gold Antifade试剂(MolecularProbes)中。用Plan-Neofluar 40x/1.3油浸物镜在Zeiss LSM 510倒置共焦显微镜上测定点阳性细胞(每个细胞核>5个点)的百分比。对于每个实验,分析至少100个细胞核。
细胞增殖:用Real-Time Cell Analyzer(RTCA)xCELLigence System(Roche)来动态监测细胞增殖率。在200μl培养基中将5,000细胞/孔接种在E-平板16(Roche)上。将Olaparib(AZD-2281,JS Research Chemicals Trading)溶解在DMSO中。接种后24小时,用olaparib(1、3、10μM)处理细胞。每个条件重复测量三次,所有实验都在不同时间点重复进行两次。处理后监测动态细胞指数值48小时。
材料
小鼠抗-磷酸-组蛋白H2A.X(Ser139)单克隆抗体(克隆JBW301)来自MilliporeCorporation,Billerica,MA,USA。兔抗-Rad51(H-92)多克隆抗体来自Santa CruzBiotechnology,Santa Cruz,CA,USA。Olaparib(AZD-2281,批号3-8/10)购自JS ResearchChemicals Trading,Schleswig Holstein,德国,配制为DMSO中的贮液,分装为10份-20℃保存至使用。按1:50将Olaparib进一步稀释在各培养基中,然后在板孔中1:20稀释。
γH2AX免疫染色
用γH2AX免疫荧光测量olaparib处理时未修复的DNA损伤的程度。DNA中有双链断裂时,H2AX在丝氨酸139上磷酸化,称为γH2AX。对于γH2AX免疫染色,在400μl培养基中将25,000细胞/孔接种在8孔Lab-tek Permanox Chamber玻片(Nunc)上,并在37℃、5%CO2下孵育24小时。随后,孵育24小时后,将细胞暴露于0或10μM olaparib,在磷酸缓冲盐溶液(PBS)中漂洗玻片,在37℃下在4%多聚甲醛中固定10分钟,用0.1%Triton X-100通透5分钟并用5%牛血清白蛋白(BSA)封闭10分钟,二者都在室温下进行。用1:100稀释的小鼠抗-磷酸-组蛋白H2A.X(Ser139)单克隆抗体(克隆JBW301,Millipore)染色细胞。用AlexaFluor-488山羊抗-小鼠IgG(Alexa)显示一抗,并封固在含有DAPI的Prolong GoldAntifade试剂(Molecular Probes)中。无论其MMR状态是哪种,在所有细胞中,与基线相比,10μM Olaparib处理使γH2AX点的数目增加4-6倍,表明DSB DNA损伤的程度在两种培养物间相似。
RAD51免疫染色
RAD51蛋白质在通过HR途径的DSB修复中发挥主要作用,将RAD51阳性点的形成用作通过HR进行的DSB修复的标记。为了进行RAD51染色,在400μl培养基中将25,000细胞/孔接种在8孔Lab-tek Permanox Chamber玻片(Nunc)上,并在37℃、5%CO2下孵育24小时,直至olaparib处理。暴露于0或10μM olaparib后孵育24小时后,在室温下用PBS洗涤细胞,37℃下在含0.1%Triton X-100的PBS中的3%多聚甲醛中固定20分钟。用1:1000稀释的兔抗-Rad51(H-92)多克隆抗体(Santa Cruz)在4℃孵育玻片16小时,然后用含0.1%Triton X-100的PBS洗涤4次,每次15分钟。用Alexa Fluor-488山羊抗-兔IgG(Alexa)显示一抗,并封固在含有DAPI的Prolong Gold Antifade试剂(Molecular Probes)中。
共焦显微术
使用Plan-Neofluar 40x/1.3油浸物镜及488和750nm的激发波长(Chameleon相干双光子激光器),用Zeiss LSM 510倒置共焦显微镜显示γH2AX和RAD51。通过焦点最大投影,从相隔1.20μm的光学切面以0.5μm的切面厚度获取图像。用LSM510软件处理图像。具有>5个点的细胞核评分为阳性,每个培养物和每个条件计数至少100个细胞核。
示例性的技术方案
本发明例如还包括以下技术方案:
1.诊断肿瘤的MSI状态的方法,其包括测定插入/缺失在所述肿瘤DNA样品中的至少两个微卫星区域中的存在,其中至少两个微卫星区域是:
-存在于来自表1中所列基因的5’UTR区或3’UTR区中的至少两个微卫星区域;或
-选自存在于表2中所列基因的外显子中的那些和/或存在于来自表1中所列基因的5’UTR区或3’UTR区中的那些的至少三个微卫星区域;
其中至少一个插入/缺失的存在指示MSI。
2.技术方案1的方法,其中微卫星区域是同聚物区域。
3.技术方案1或2的方法,其中微卫星区域与表1或表2中鉴定的微卫星区域相同。
4.技术方案1至3中任一项的方法,其中肿瘤选自结直肠癌、子宫内膜癌、卵巢癌、胃癌、白血病和Lynch综合症的肿瘤。
5.技术方案1至4中任一项的方法,其中至少两个微卫星区域是选自存在于来自表1中所列基因的5’UTR区或3’UTR区中的那些的至少两个微卫星区域,和选自存在于表2中所列基因的外显子中的那些的至少两个微卫星区域。
6.技术方案1至5中任一项的方法,其中选自存在于表2中所列基因的外显子中的那些的一个或多个微卫星包含选自以下基因的至少一个微卫星:SETD1B、RBMXL1、CCDC150、TMEM60、DDX27、EXOSC9、FAM111B、KIAA0182、KIAA1919、OR7E24、P4HTM、PRRT2、RNPC3和TMEM97。
7.技术方案1至6中任一项的方法,其中至少两个微卫星区域是至少八个微卫星区域。
8.技术方案1至7中任一项的方法,其中至少两个微卫星区域是表3中所示的56个微卫星区域。
9.技术方案7或8的方法,其中MSI进一步表征如下:如果所述微卫星区域的17%或更多包含插入/缺失,则所述肿瘤为MSI-H,如果2%和17%之间的所述微卫星区域包含插入/缺失,则所述肿瘤为MSI-L,如果不到2%的所述微卫星区域包含插入/缺失,则所述肿瘤为微卫星稳定(MSS)。
10.技术方案1至9中任一项的方法,其中不通过基于Sanger测序的方法来进行插入/缺失的存在的测定。
11.技术方案1至10中任一项的方法,其中通过单碱基对延伸技术、DNA杂交技术或熔解曲线分析来进行插入/缺失的存在的测定。
12.用于测定肿瘤样品中的MSI的生物标志系列,其包含选自存在于来自表1中所列基因的5’UTR区或3’UTR区中的那些和存在于表2中所列基因的外显子中的那些的至少八个微卫星区域。
13.技术方案12的生物标志系列,其中至少八个微卫星区域是选自表3中所列基因的至少八个微卫星区域。
14.技术方案12或13的生物标志系列,其用作诊断剂。
15.技术方案12或13的生物标志系列,其用于诊断癌症中的微卫星不稳定性。
16.技术方案12或13的生物标志系列的用途,用于诊断癌症中的微卫星不稳定性。
17.用于测定肿瘤样品中的MSI的试剂盒,其包含对选自存在于来自表1中所列基因的5’UTR区或3’UTR区中的那些和存在于表2中所列基因的外显子中的那些的至少八个微卫星区域进行基因型分型的工具。
18.在有需要的个体中治疗具有MSI的癌症的方法,其包括:
-确定MSI在所述癌症中的存在;
-对所述个体施用DNA碱基切除修复酶抑制剂。
19.技术方案18的方法,其中DNA碱基切除修复酶抑制剂是PARP抑制剂。
20.技术方案18或19的方法,其中通过技术方案1至11中任一项的方法和/或用技术方案12和13的生物标志系列确定MSI的存在。
21.技术方案20的方法,其中癌症选自结直肠癌、子宫内膜癌、卵巢癌、胃癌、白血病和Lynch综合症的肿瘤。
22.技术方案21的方法,其中癌症对用于这些类型的癌症的至少一种标准治疗具有抗性。
23.筛查癌细胞对DNA碱基切除修复酶抑制剂处理的敏感性的方法,其包括测定所述细胞中的MSI状态。
24.技术方案23的方法,其中癌细胞来自选自结直肠癌、子宫内膜癌、卵巢癌、胃癌、白血病和Lynch综合症的肿瘤的癌症。
25.技术方案23或24的方法,其中DNA碱基切除修复酶抑制剂是PARP抑制剂。
26.技术方案23至25中任一项的方法,其中MSI的存在指示对所述处理的敏感性。
27.技术方案23至26中任一项的方法,其中癌细胞是获自个体的细胞,且所述敏感性的筛查用于指导所述个体的处理或用于分层或分类所述个体进行临床试验。
28.技术方案23至27中任一项的方法,其中通过技术方案1至11中任一项的方法和/或用技术方案12和13的生物标志系列确定MSI的存在。
29.诊断患有癌症的个体对DNA碱基切除修复酶抑制剂处理的敏感性的方法,其包括以下步骤:
-可选地从所述个体获得癌细胞的样品;
-测定从所述个体获得的癌细胞的样品中的MSI状态;
-将所述MSI状态与对DNA碱基切除修复酶抑制剂处理的敏感性相关,其中MSI的存在指示对所述处理的敏感性。
30.技术方案29的方法,其进一步包括以下步骤:如果所述个体对这种处理敏感,则用DNA碱基切除修复酶抑制剂处理所述个体。
31.技术方案29或30的方法,其中通过技术方案1至11中任一项的方法和/或用技术方案12和13的生物标志系列确定MSI的存在。
参考文献
1.Stratton,M.R.,Campbell,P.J.& Futreal,P.A.The cancer genome.Nature458,719-724(2009).
2.Futreal,P.A.等A census of human cancer genes.Nat Rev Cancer 4,177-183(2004).
3.Loeb,L.A.,Loeb,K.R.& Anderson,J.P.Multiple mutations andcancer.Proc Natl Acad Sci U S A 100,776-781(2003).
4.Loeb,L.A.,Springgate,C.F.& Battula,N.Errors in DNA replication as abasis of malignant changes.Cancer Res 34,2311-2321(1974).
5.Loeb,L.A.Human cancers express mutator phenotypes:origin,consequences and targeting.Nat Rev Cancer 11,450-457(2011).
6.Poulogiannis,G.,Frayling,I.M.& Arends,M.J.DNA mismatch repairdeficiency in sporadic colorectal cancer and Lynch syndrome.Histopathology56,167-179(2010).
7.Beckman,R.A.& Loeb,L.A.Negative clonal selection in tumorevolution.Genetics 171,2123-2131(2005).
8.Jones,S.等Frequent mutations of chromatin remodeling gene ARID1A inovarian clear cell carcinoma.Science 330,228-231(2010).
9.Boland CR,Thibodeau SN,Hamilton SR等:A National Cancer InstituteWorkshop on Microsatellite Instability for cancer detection and familialpredisposition:Development of international criteria for the determination ofmicrosatellite instability in colorectal cancer.Cancer Res 58:5248-5257,1998.
10.Palomaki GE,McClain MR,Melillo S等:EGAPP supplementary evidencereview:DNA testing strategies aimed at reducing morbidity and mortality fromLynch syndrome.Genetics in Medicine 11:42-65,2009.
11.Popat S,Hubner R,Houlston RS:Systematic review of microsatelliteinstability and colorectal cancer prognosis.J Clinl Oncol 23:609-617,2005.
12.Ribic CM,Sargent DJ,Moore MJ等:Tumor microsatellite-instabilitystatus as apredictor of benefit from Fluorouracil-based adjuvant chemotherapyfor colon cancer.N Engl J Med 349:247-257,2003.
13.Des Guetz G,Schischmanoff O,Nocalas P等:Does microsatelliteinstability predict the efficacy of adjuvant chemotherapy in colorectalcancer?A systematic review with meta-analysis.Euro J Cancer 45:1890-1896,2009.
14.Dietmaier,W.等Diagnostic microsatellite instability:definition andcorrelation with mismatch repair protein expression.Cancer Res 57,4749-4756(1997).
15.Umar,A.等Revised Bethesda Guidelines for hereditary nonpolyposiscolorectal cancer(Lynch syndrome)and microsatellite instability.J Natl CancerInst 96,261-268(2004).
16.de la Chapelle,A.& Hampel,H.Clinical relevance of microsatelliteinstability in colorectal cancer.J Clin Oncol 28,3380-3387(2010).
17.Pyatt R,Chadwick RB,Johnson CK等:Polymorphic variation at the BAT-25 and BAT-26 loci in individuals of African origin:Implications formicrosatellite instability testing.Am J Pathol 155:349-353,1999.
18.Lindor,N.M.等Immunohistochemistry versus microsatelliteinstability testing in phenotyping colorectal tumors.J Clin Oncol 20,1043-1048(2002).
19.Simpkins,S.B.等MLH1 promoter methylation and gene silencing is theprimary cause of microsatellite instability in sporadic endometrialcancers.Hum Mol Genet 8,661-666(1999).
20.Herman,J.G.等Incidence and functional consequences of hMLH1promoter hypermethylation in colorectal carcinoma.Proc Natl Acad Sci USA 95,6870-6875(1998).
21.Quinlan,A.R.& Hall,I.M.BEDTools:a flexible suite of utilities forcomparing genomic features.Bioinformatics 26,841-842(2010).
22.Banerjea,A.等Colorectal cancers with microsatellite instabilitydisplay mRNA expression signatures characteristic of increasedimmunogenicity.Mol Cancer 3,21(2004).
23.Kapushesky,M.等Gene expression atlas at the Europeanbioinformatics institute.Nucleic Acids Res 38,D690-698(2010).
24.Pinol,V.等Accuracy of revised Bethesda guidelines,microsatelliteinstability,and immunohistochemistry for the identification of patients withhereditary nonpolyposis colorectal cancer.JAMA 293,1986-1994(2005).
25.Hewish,M.,Lord,C.J.,Martin,S.A.,Cunningham,D.& Ashworth,A.Mismatchrepair deficient colorectal cancer in the era of personalized treatment.NatRev Clin Oncol 7,197-208(2010).
26.Heijink,D.M.等Perspectives for tailored chemoprevention andtreatment of colorectal cancer in Lynch syndrome.Crit Rev Oncol Hematol(2010).
27.Plaschke,J.等Aberrant protein expression and frequent allelic lossof MSH3 in colorectal cancer with low-level microsatellite instability.Int JColorectal Dis 27:911–919(2012).

Claims (20)

1.对包含存在于来自表3中所列基因的外显子中和/或5’UTR区或3’UTR区中的至少三个微卫星区域的生物标志系列进行基因型分型的寡核苷酸工具的用途,
用于制备测定肿瘤样品中MSI状态的试剂盒,包括测定指示MSI状态的插入/缺失在肿瘤DNA样品中的至少三个微卫星区域中的存在,
其中所述至少三个微卫星区域的每一个都是具有八(8)个单核苷酸碱基的最小长度和十二(12)个单核苷酸碱基的最大长度的单核苷酸重复,
其中肿瘤选自结直肠癌、子宫内膜癌、卵巢癌、胃癌、白血病和Lynch综合症的肿瘤。
2.如权利要求1所述的用途,其中所述至少三个微卫星区域的每一个都是具有九(9)个单核苷酸碱基的最小长度,和十一(11)个单核苷酸碱基的最大长度的单核苷酸重复。
3.如权利要求1或2所述的用途,其中所述寡核苷酸工具包含寡核苷酸探针或寡核苷酸引物,其对于所述存在于来自表3中所列基因的外显子和/或5’UTR或3’UTR区中的至少三个微卫星区域是特异性的。
4.如权利要求1-3任一项所述的用途,其中所述至少三个单核苷酸重复是选自如表3中所列的基因MYL1、DIDO1、UBE2Z、RYR3、TMEM65、BTBD7、KDM5A、ABAT4、PPM1A、UBA6、ZNF185、ARL10、GRIA2和TMC7。
5.如权利要求4所述的用途,其中所述至少三个单核苷酸重复是选自如表3中所列的基因MYL1、DIDO1、UBE2Z、RYR3、TMEM65、BTBD7、KDM5A、ABAT4、PPM1A、UBA6和ZNF185。
6.如权利要求1-5任一项所述的用途,其中所述至少三个微卫星区域是存在于来自表3中所列基因的5’UTR或3’UTR区中的区域。
7.如权利要求1-6任一项所述的用途,其中所述至少三个微卫星区域是至少八个微卫星区域。
8.如权利要求7所述的用途,其中所述至少八个微卫星区域是存在于来自表3中所列基因的外显子和/或5’UTR或3’UTR区中的56个微卫星区域的至少一半。
9.如权利要求1-8任一项所述的用途,进一步包含对存在于来自表2中所列MSH6基因的外显子中的微卫星区域进行基因型分型的寡核苷酸工具。
10.如权利要求1-9任一项所述的用途,进一步包含对存在于来自表1中所列SULF2基因的3’UTR区中的微卫星区域进行基因型分型的寡核苷酸工具。
11.如权利要求1-10任一项所述的用途,其中MSI状态被认为是MSI阳性的是至少2%的微卫星区域包含插入/缺失。
12.如权利要求11所述的用途,其中MSI状态可以进一步表征如下:如果微卫星区域的17%或更多包含插入/缺失,则该肿瘤为MSI-H,如果2%和17%之间的微卫星区域包含插入/缺失,则该肿瘤为MSI-L,如果不到2%的微卫星区域包含插入/缺失,则该肿瘤为微卫星稳定。
13.如权利要求1-12任一项所述的用途,其中通过单碱基对延伸技术、DNA杂交技术或熔解曲线分析来进行插入/缺失的存在的测定。
14.如权利要求13所述的用途,其中寡核苷酸工具选自等位基因特异性探针、等位基因特异性引物、可检测探针、和/或二级结构探针。
15.如权利要求1-14任一项所述的用途,其中肿瘤选自结直肠癌或子宫内膜癌。
16.如权利要求15所述的用途,其中肿瘤是子宫内膜癌。
17.如权利要求1-16任一项所述的用途,还用于制备用于筛查癌细胞对DNA碱基切除修复酶抑制剂处理的敏感性的试剂盒。
18.如权利要求17所述的用途,其中DNA碱基切除修复酶抑制剂是PARP抑制剂。
19.如权利要求17-18任一项所述的用途,其中指示MSI的插入/缺失的存在还指示对所述处理的敏感性。
20.如权利要求17-19任一项所述的用途,其中癌细胞是获自个体的细胞,且所述敏感性的筛查用于指导所述个体的处理或用于分层或分类所述个体进行临床试验。
CN202111386681.6A 2012-04-10 2013-04-10 用于检测癌症中的微卫星不稳定性和dna碱基切除修复途径抑制的合成致死性的新标记 Pending CN114058704A (zh)

Applications Claiming Priority (7)

Application Number Priority Date Filing Date Title
US201261622383P 2012-04-10 2012-04-10
US61/622,383 2012-04-10
US201261638955P 2012-04-26 2012-04-26
US61/638,955 2012-04-26
EP13161395.2 2013-03-27
EP13161395 2013-03-27
CN201380030379.4A CN104379765A (zh) 2012-04-10 2013-04-10 用于检测癌症中的微卫星不稳定性和测定与dna碱基切除修复途径抑制的合成致死性的新标记

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
CN201380030379.4A Division CN104379765A (zh) 2012-04-10 2013-04-10 用于检测癌症中的微卫星不稳定性和测定与dna碱基切除修复途径抑制的合成致死性的新标记

Publications (1)

Publication Number Publication Date
CN114058704A true CN114058704A (zh) 2022-02-18

Family

ID=47915624

Family Applications (2)

Application Number Title Priority Date Filing Date
CN202111386681.6A Pending CN114058704A (zh) 2012-04-10 2013-04-10 用于检测癌症中的微卫星不稳定性和dna碱基切除修复途径抑制的合成致死性的新标记
CN201380030379.4A Pending CN104379765A (zh) 2012-04-10 2013-04-10 用于检测癌症中的微卫星不稳定性和测定与dna碱基切除修复途径抑制的合成致死性的新标记

Family Applications After (1)

Application Number Title Priority Date Filing Date
CN201380030379.4A Pending CN104379765A (zh) 2012-04-10 2013-04-10 用于检测癌症中的微卫星不稳定性和测定与dna碱基切除修复途径抑制的合成致死性的新标记

Country Status (10)

Country Link
EP (2) EP2836606B1 (zh)
JP (1) JP6578205B2 (zh)
KR (1) KR20150005597A (zh)
CN (2) CN114058704A (zh)
AU (1) AU2013246909B2 (zh)
BR (1) BR112014025185B1 (zh)
CA (1) CA2869729C (zh)
ES (1) ES2906023T3 (zh)
RU (1) RU2014145017A (zh)
WO (1) WO2013153130A1 (zh)

Families Citing this family (39)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10294529B2 (en) 2012-04-10 2019-05-21 Life Sciences Research Partners Vzw Microsatellite instability markers in detection of cancer
US10633707B2 (en) 2012-04-10 2020-04-28 Vib Vzw Markers for detecting microsatellite instability in cancer and determining synthetic lethality with inhibition of the DNA base excision repair pathway
CN107208152B (zh) * 2015-03-06 2021-03-23 深圳华大基因股份有限公司 检测突变簇的方法和装置
EP3353320B1 (en) 2015-09-22 2023-06-07 Biocartis NV Improved detection of short homopolymeric repeats
WO2017112738A1 (en) * 2015-12-22 2017-06-29 Myriad Genetics, Inc. Methods for measuring microsatellite instability
AU2017281099A1 (en) * 2016-06-21 2019-01-03 The Wistar Institute Of Anatomy And Biology Compositions and methods for diagnosing lung cancers using gene expression profiles
GB201614474D0 (en) * 2016-08-24 2016-10-05 Univ Of Newcastle Upon Tyne The Methods of identifying microsatellite instability
GB201621969D0 (en) * 2016-12-22 2017-02-08 Genome Res Ltd Hotspots for chromosomal rearrangement in breast and ovarian cancers
CN106755501B (zh) * 2017-01-25 2020-11-17 广州燃石医学检验所有限公司 一种基于二代测序的同时检测微卫星位点稳定性和基因组变化的方法
US11447830B2 (en) 2017-03-03 2022-09-20 Board Of Regents, The University Of Texas System Gene signatures to predict drug response in cancer
JP2020530763A (ja) * 2017-07-12 2020-10-29 アンスティテュート キュリー マイクロサテライト配列中の突然変異を検出する方法
CN107267505B (zh) * 2017-07-21 2020-10-30 首都医科大学 微卫星标记及其在结直肠癌的预后判定和/或化疗敏感性预测中的应用
EP3645723A1 (en) * 2017-10-16 2020-05-06 H. Hoffnabb-La Roche Ag NUCLEIC ACID MOLECULE FOR REDUCTION OF PAPD5 AND PAPD7 mRNA FOR TREATING HEPATITIS B INFECTION
JP6955035B2 (ja) * 2017-11-16 2021-10-27 イルミナ インコーポレイテッド マイクロサテライト不安定性を決定するためのシステム及び方法
EP3514247B1 (en) 2018-01-23 2020-03-11 Biocartis NV Biomarker panel and methods for detecting microsatellite instability in cancers
WO2019145306A1 (en) 2018-01-23 2019-08-01 Biocartis Nv Biomarker panel and methods for detecting microsatellite instability in cancers
US20210005286A1 (en) 2018-01-23 2021-01-07 Biocartis Nv Methods for the analysis of dissociation melt curve data
US20210047696A1 (en) * 2018-03-28 2021-02-18 INSERM (Institut National de la Santé et de la Recherche Médicale) Methods and pharmaceutical compositions for treating cancer
CN108753834B (zh) * 2018-05-28 2021-11-23 上海海洋大学 ddx27基因缺失斑马鱼突变体的制备方法
WO2019236448A1 (en) * 2018-06-04 2019-12-12 The Broad Institute, Inc. Therapeutic treatment of microsatellite unstable cancers
EP3806850A2 (en) * 2018-06-15 2021-04-21 Ideaya Biosciences, Inc. Methods of inhibiting proliferative cells
CN108866190B (zh) * 2018-07-12 2022-01-28 吉林大学 一种卵巢恶性肿瘤易感性预测试剂盒及系统
CN108676890B (zh) * 2018-07-12 2022-01-28 吉林大学 一种女性乳腺恶性肿瘤易感性预测试剂盒及系统
CN108676889B (zh) * 2018-07-12 2022-02-01 吉林大学 一种胃腺癌易感性预测试剂盒及系统
CN108841960B (zh) * 2018-07-12 2022-02-01 吉林大学 一种结肠腺癌易感性预测试剂盒及系统
CN108676888B (zh) * 2018-07-12 2022-01-28 吉林大学 一种肺部恶性肿瘤易感性预测试剂盒及系统
CN112930569A (zh) * 2018-08-31 2021-06-08 夸登特健康公司 无细胞dna中的微卫星不稳定性检测
SG11202102528UA (en) * 2018-09-14 2021-04-29 Lexent Bio Inc Methods and systems for assessing microsatellite instability
US20200118644A1 (en) * 2018-10-15 2020-04-16 Tempus Labs, Inc. Microsatellite instability determination system and related methods
WO2020165361A1 (en) 2019-02-14 2020-08-20 Vib Vzw Retrotransposon biomarkers
CN110184358A (zh) * 2019-06-25 2019-08-30 台州市立医院 甲状腺癌早期诊断用的oit3基因及其应用
EP3863019A1 (en) 2020-02-07 2021-08-11 Sophia Genetics S.A. Methods for detecting and characterizing microsatellite instability with high throughput sequencing
CN114182011B (zh) * 2020-09-14 2023-09-15 中山大学附属第六医院 检测微卫星bat25位点稳定性的引物对、试剂盒及方法
CN112522405B (zh) * 2020-12-10 2023-03-21 首都医科大学 Magi3在预测结直肠癌患者预后或化疗敏感性中的应用
CN112626216B (zh) * 2020-12-31 2022-11-01 复旦大学附属中山医院 一种检测肿瘤微卫星不稳定性状态的组合物及其应用
CN112708679B (zh) * 2021-01-27 2023-01-24 厦门艾德生物医药科技股份有限公司 检测人群微卫星不稳定性的生物标志物组及其应用
CA3226694A1 (en) 2021-07-15 2023-01-19 Katholieke Universiteit Leuven Biomarkers predicting response of breast cancer to immunotherapy
CN113736790B (zh) * 2021-10-14 2023-05-02 四川农业大学 一种敲除鸭hnRNPA3基因的sgRNA、细胞系及其构建方法和应用
CN114854861A (zh) * 2022-05-20 2022-08-05 北京大学第一医院 基因组合制备人肿瘤同源重组缺陷、肿瘤突变负荷和微卫星不稳定性分级检测产品的用途

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE60113945T2 (de) * 2000-11-15 2006-06-29 Roche Diagnostics Gmbh Verfahren zur Analyse von Wiederkehrenden PCR-Podukten, das auf der Analyse von DNS-Schmelzkurven basiert
WO2012166151A1 (en) * 2011-06-03 2012-12-06 Biomarin Pharmaceutical Inc. Use of dihydropyridophthalazinone inhibitors of poly (adp-ribose) polymerase (parp) in the treatment of myelodysplastic syndrome (mds) and acute myeloid leukaemia (aml)
CN102230004B (zh) * 2011-06-08 2012-12-26 北京阅微基因技术有限公司 肿瘤细胞微卫星不稳定状态的复合扩增体系及检测试剂盒

Also Published As

Publication number Publication date
EP3998347A1 (en) 2022-05-18
JP6578205B2 (ja) 2019-09-18
CA2869729A1 (en) 2013-10-17
JP2015516144A (ja) 2015-06-08
BR112014025185B1 (pt) 2022-06-28
AU2013246909B2 (en) 2018-10-11
RU2014145017A (ru) 2016-05-27
CN104379765A (zh) 2015-02-25
CA2869729C (en) 2021-12-28
BR112014025185A2 (pt) 2021-06-01
ES2906023T3 (es) 2022-04-12
WO2013153130A1 (en) 2013-10-17
EP2836606A1 (en) 2015-02-18
AU2013246909A1 (en) 2014-10-30
KR20150005597A (ko) 2015-01-14
EP2836606B1 (en) 2021-12-29

Similar Documents

Publication Publication Date Title
JP6578205B2 (ja) 癌におけるマイクロサテライト不安定性を検出しdna塩基除去修復経路の阻害による合成致死性を決定するための新規なマーカー
US20200255913A1 (en) Novel Markers for Detecting Microsatellite Instability in Cancer and Determining Synthetic Lethality with Inhibition of the DNA Base Excision Repair Pathway
US20220010385A1 (en) Methods for detecting inactivation of the homologous recombination pathway (brca1/2) in human tumors
AU2020223754B2 (en) Methods and materials for assessing loss of heterozygosity
Patch et al. Whole–genome characterization of chemoresistant ovarian cancer
Ge et al. Global patterns of cis variation in human cells revealed by high-density allelic expression analysis
Shi et al. Characterizing the genetic basis of methylome diversity in histologically normal human lung tissue
US10294529B2 (en) Microsatellite instability markers in detection of cancer
EP2885427B1 (en) Colorectal cancer methylation marker
Vargas‐Parra et al. Elucidating the molecular basis of MSH2‐deficient tumors by combined germline and somatic analysis
WO2017112738A1 (en) Methods for measuring microsatellite instability
Ter Brugge et al. Homologous recombination deficiency derived from whole-genome sequencing predicts platinum response in triple-negative breast cancers
US20220025466A1 (en) Differential methylation
US20240084389A1 (en) Use of simultaneous marker detection for assessing difuse glioma and responsiveness to treatment
Egolf Defining the Landscape of Rare Inherited and de novo Germline Structural Variation in Neuroblastoma
Benafif The use of germline genetic profiles to guide prostate cancer targeted screening and cancer care

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
REG Reference to a national code

Ref country code: HK

Ref legal event code: DE

Ref document number: 40069685

Country of ref document: HK