CN117561340A

CN117561340A - 使用全基因组cfDNA片段化图谱检测癌症的方法

Info

Publication number: CN117561340A
Application number: CN202280027033.8A
Authority: CN
Inventors: N·C·德拉科波利; A·利尔; J·凯利
Original assignee: Delphi Diagnostics
Current assignee: Delphi Diagnostics
Priority date: 2021-04-08
Filing date: 2022-04-07
Publication date: 2024-02-13
Also published as: KR20240015624A; AU2022254718A1; BR112023020307A2; JP2024515558A; IL307524A; EP4320277A1; CA3214321A1; WO2022216981A1

Abstract

本公开提供了利用对从患者获得的样品中的游离DNA(cfDNA)片段的分析来诊断和预测癌症状态的方法和系统。本公开提供了一种检测受试者的癌症的方法。本公开还提供了一种确定患有癌症的受试者的总体存活率的方法。本公开进一步提供了一种监测受试者的癌症的方法。还提供了用于遗传分析的系统。

Description

使用全基因组cfDNA片段化图谱检测癌症的方法

相关申请的交叉引用

本申请根据35 U.S.C.§119(E)要求于2021年4月8日提交的美国临时专利申请序列号63/172,493的优先权权益。在先申请的公开内容被视为本申请的公开的一部分并且通过引用的方式并入本申请的公开中。

技术领域

本发明总体上涉及遗传分析，并且更具体地涉及用于分析游离DNA(cfDNA)片段以检测受试者的癌症和/或评估受试者的总体存活率的方法和系统。

背景技术

世界范围内人类癌症的发病率和死亡率很大程度上是由于这些疾病的诊断较晚，在这种情况下治疗效果较差。不幸的是，临床证实的可以用于广泛诊断和治疗早期癌症患者的生物标记物并不广泛可得。

对游离DNA(cfDNA)的分析表明，此类方法可以为早期诊断和治疗提供新的途径。已经表明循环肿瘤DNA(ctDNA)片段平均比来自非肿瘤细胞的其它cfDNA更短。先前的工作已经探索了将片段分成由与组蛋白核心或接头蛋白结合引起的不同大小的组(例如，短和长，或相互排斥的大小组)并且使用这些片段的计数来量化ctDNA和/或将各个样品分类为存在/不存在肿瘤。然而，先前的研究缺乏确定被诊断患有癌症的患者的总体存活率以及在癌症检测中提供稳健的灵敏度和特异性的能力。

发明内容

本公开提供了利用对cfDNA的分析来检测和预测受试者的总体存活率的方法和系统，所述检测和预测通过对通过分析从受试者获得的样品中的cfDNA片段而获得的cfDNA片段化图谱进行评分来进行。评分方法提供了对受试者的总体生存能力的度量。

照此，在一个实施例中，本发明提供了一种检测受试者的癌症的方法。所述方法包含：

a)确定来自所述受试者的样品的游离DNA(cfDNA)片段化图谱，所述cfDNA片段化图谱通过以下确定：

从所述受试者获得cfDNA片段并进行分离，

对所述cfDNA片段进行测序以获得测序片段，

将所述测序片段映射到基因组以获得映射序列窗口，以及

分析所述映射序列窗口以确定cfDNA片段长度并生成所述cfDNA片段化图谱；以及

b)通过基于所述cfDNA片段化图谱计算评分来将所述受试者分类为患有癌症或未患癌症，所述评分指示所述受试者体内存在癌症的概率，由此检测到所述受试者的癌症。在一些方面，所述癌症不包含肺癌。在一些方面，向所述受试者施用化疗剂、放射疗法、免疫疗法或其它治疗方案。

在一些方面，计算评分包含：i)确定短cfDNA片段与长cfDNA片段的比率，ii)通过染色体臂确定所述cfDNA片段的Z评分，iii)使用计算混合模型分析来量化cfDNA片段密度，以及iv)使用机器学习模型来处理i)-iii)的输出以定义所述评分。

在另一实施例中，本发明提供了一种确定患有癌症的受试者的总体存活率的方法。

所述方法包含：

a)确定来自所述受试者的样品的游离DNA(cfDNA)片段化图谱；

b)基于所述cfDNA片段化图谱计算评分，其中计算所述评分包括：i)确定所述样品的短cfDNA片段与长cfDNA片段的比率，ii)通过染色体臂确定所述样品的cfDNA片段的Z评分，iii)使用计算混合模型分析来量化cfDNA片段密度，以及iv)使用机器学习模型来处理i)-iii)的输出以定义所述评分；以及

c)基于所述评分确定所述受试者总体存活的概率，由此确定所述受试者的总体存活率。

在又一方面，本发明提供了一种治疗患有癌症的受试者的方法。所述方法包含：

a)使用本发明的方法来检测所述受试者的癌症，或使用本发明的方法来确定所述受试者的总体存活率；以及

b)向所述受试者施用癌症治疗，由此治疗所述受试者。在一些方面，向所述受试者施用化疗剂、放射疗法、免疫疗法或其它治疗方案。

在仍另一实施例中，本发明提供了一种监测受试者的癌症的方法。所述方法包含：

a)使用本发明的方法来检测所述受试者的癌症，和/或使用本发明的方法来确定所述受试者的总体存活率；以及

b)向所述受试者施用癌症治疗；以及

c)在施用所述癌症治疗后使用本发明的方法来确定所述受试者的总体存活率，由此监测所述受试者的癌症。在一些方面，向所述受试者施用化疗剂、放射疗法、免疫疗法或其它治疗方案。

在另一实施例中，本发明提供了用计算机程序编码的非暂时性计算机可读存储介质。所述计算机程序包含指令，所述指令在由一个或多个处理器执行时使所述一个或多个处理器执行操作以执行本发明的方法。

在又一实施例中，本发明提供了计算系统。所述系统包含存储器和耦接到所述存储器的一个或多个处理器，其中所述一个或多个处理器被配置成执行实施本发明的方法的操作。

在又一实施例中，本发明提供了一种用于遗传分析和评估癌症的系统，所述系统包含：(a)测序仪，所述测序仪被配置成生成样品的全基因组测序(WGS)数据集；以及(b)本发明的非暂时性计算机可读存储介质和/或计算机系统。

附图说明

图1是展示在本发明的一个实施例中使用本公开的方法的示例性DELFI方法的示意图。从一组健康个体和癌症患者中收集血液。从血浆级分中提取cfDNA，将其加工成测序文库，通过全基因组测序进行检查，映射到基因组，并进行分析以确定跨基因组的cfDNA片段化图谱。使用机器学习方法来生成DELFI评分，并将个体分类为健康或患有癌症。

图2是示出用于非侵入性癌症检测的cfDNA片段化测定的性能的表。在3个月内(包含3个月)，74名患者被诊断为患有16种不同实体癌中的1种，而207名患者没有癌症。

图3是示出在本发明的一个实施例中使用本公开的方法生成的数据的曲线图。所述图示出了癌症检测的cfDNA片段化测定的总体性能。

图4是示出在本发明的一个实施例中使用本公开的方法生成的数据的曲线图。所述图示出了与DELFI评分相关的受试者存活率。较高的DELFI评分与总体存活率下降相关联，与癌症分期或其它临床特性无关。

图5是示出在本发明的一个实施例中使用本公开的方法生成的数据曲线的一系列曲线图。计算出的DELFI评分将所描绘的患有癌症(不包含肺癌)的个体的卡普兰-梅尔曲线(Kaplan-Meier curve)分开，而不论用于定义高分(>0.5)与低分(<0.5)的截断值如何。每个分图顶部的数字指示所确定的截断值。

图6是示出在本发明的一个实施例中使用本公开的方法生成的数据的曲线图。图6示出了cox比例风险模型在两种设置中的结果。在第一设置中(图的左分图)，DELFI评分被视为连续的。在第二设置中(图的右分图)，DELFI评分被视为高(>0.5)或低(<0.5)。在任一种设置中，DELFI评分都是强有力的存活率预测因子，即使在对抽血年龄和分期进行调整时也是如此。注意，所述分期是相对于1期而言的。

具体实施方式

本文描述了一种用于癌症的早期检测以及对患有癌症的受试者的总体存活率的预测的非侵入性方法。血液中的cfDNA可以为癌症患者提供非侵入性诊断途径。如本文所证明的，使用早期拦截的DNA片段评估(DELFI)来评估患有各种类型癌症的患者以及健康个体的cfDNA的全基因组片段化模式。对cfDNA的评估包含评分方法。确定了使用与总体存活率相关的给定患者样品的cfDNA片段获得的cfDNA片段化图谱的定义评分(本文也称为“DELFI评分”)。使用本文所描述的方法评估cfDNA可以提供用于癌症的早期检测和评估的筛查方法，这可以增加成功治疗癌症患者的机会。评估cfDNA还可以提供用于监测癌症的方法，这可以增加成功治疗的机会并改善癌症患者的结局。

在描述本发明的组合物和方法之前，应当理解本发明不限于所描述的特定方法和系统，因为此类方法和系统可以变化。还应理解，本文中所使用的术语仅出于描述特定实施例的目的，并且不旨在为限制性的，因为本发明的范围仅受所附权利要求限制。

如在本说明书和所附权利要求中所使用的，除非上下文另外明确指示，否则单数形式“一个(a)”、“一种(an)”以及“所述(the)”包含复数指代物。因此，例如，对“所述方法”的提及包含本文所描述的类型的一种或多种方法和/或步骤，在阅读本公开等后，所述一种或多种方法和/或步骤对于本领域的技术人员而言将变得显而易见。

除非另外定义，否则本文所使用的所有技术术语和科学术语的含义与本发明所属领域的普通技术人员通常所理解的含义相同。虽然可以在本发明的实践或测试中使用类似于或等效于本文所描述的方法和材料的任何方法和材料，但现在描述优选的方法和材料。

本公开提供了用于分析cfDNA以检测或在其它方面评估癌症的创新方法和系统。如先前研究所指示，平均而言，无癌症个体具有较长的cfDNA片段(平均大小为167.09bp)，而患有癌症的个体具有较短的cfDNA片段(平均大小为164.88bp)。本文所描述的方法允许通过对cfDNA片段化模式的全基因组分析来同时分析cfDNA中的大量异常。

a)确定来自所述受试者的样品的游离DNA(cfDNA)片段化图谱；以及

b)通过基于所述cfDNA片段化图谱计算评分来将所述受试者分类为患有癌症或未患癌症，所述评分指示所述受试者体内存在癌症的概率，条件是所述癌症不包含肺癌，由此检测到所述受试者的癌症。

所述方法包含：

a)确定来自所述受试者的样品的游离DNA(cfDNA)片段化图谱；

b)基于所述cfDNA片段化图谱计算评分，其中计算所述评分包含：i)确定所述样品的短cfDNA片段与长cfDNA片段的比率，ii)通过染色体臂确定所述样品的cfDNA片段的Z评分，iii)使用计算混合模型分析来量化cfDNA片段密度，以及iv)使用机器学习模型来处理i)-iii)的输出以定义所述评分；以及

在实施例中，本发明提供了一种治疗患有癌症的受试者的方法。所述方法包含：

在另一实施例中，本发明提供了一种监测受试者的癌症的方法。所述方法包含：

a)使用本发明的方法来检测所述受试者的癌症，或使用本发明的方法来确定所述受试者的总体存活率；

b)向所述受试者施用癌症治疗；以及

c)在施用所述癌症治疗后使用本发明的方法来确定所述受试者的总体存活率，由此监测所述受试者的癌症。

本文所描述的方法利用cfDNA片段化图谱。如本文所使用的，术语“片段化图谱”(在一些方面，确定哺乳动物中的cfDNA片段化图谱)可以用于将哺乳动物鉴定为患有癌症。例如，可以对从哺乳动物获得的cfDNA片段(例如，来自从哺乳动物获得的样品)进行低覆盖率全基因组测序，并且可以将测序片段映射到基因组(例如，在非重叠窗口中)并进行评估以确定cfDNA片段化图谱。患有癌症的哺乳动物的cfDNA片段化图谱比健康哺乳动物(例如，未患癌症的哺乳动物)的cfDNA片段化图谱更具异质性(例如，在片段长度方面)。

cfDNA片段化图谱可以包含一个或多个cfDNA片段化模式。cfDNA片段化模式可以包含任何适当cfDNA片段化模式。cfDNA片段化模式的实例包含但不限于片段大小密度、中值片段大小、片段大小分布、小cfDNA片段与大cfDNA片段的比率以及cfDNA片段的覆盖范围。在一些方面，cfDNA片段化图谱可以是全基因组cfDNA图谱(例如，整个基因组中的窗口中的全基因组cfDNA图谱)。在一些方面，cfDNA片段化图谱可以是靶向区域图谱。靶向区域可以是基因组的任何适当部分(例如，染色体区域)。可以如本文所述确定cfDNA片段化图谱的染色体区域的实例包含但不限于染色体的一部分(例如，2q、4p、5p、6q、7p、8q、9q、10q、11q、12q和/或14q的一部分)和染色体臂(例如，8q、13q、11q和/或3p的染色体臂)。在一些情况下，cfDNA片段化图谱可以包含两个或更多个靶区域图谱。

在各个方面，分离从样品获得的cfDNA，并在分析中利用特定大小范围的片段。在一些方面，分析排除了小于约10、50、100或105bp和大于约220、250、300、350bp或更多的片段大小。在一些方面，分析排除了小于105bp和大于170bp的片段大小。在一些方面，分析排除了小于约230、240、250、260bp和大于约420、430、440、450bp或更大的片段大小。在一些方面，分析排除了小于260bp和大于440bp的片段大小。

在一些方面，cfDNA片段化图谱可以通过以下来确定：将来自受试者的包括cfDNA片段的样品处理成测序文库；使测序文库经受低覆盖率全基因组测序以获得测序片段；将测序片段映射到基因组以获得映射序列窗口；以及分析映射序列窗口以确定cfDNA片段长度。

在一些方面，cfDNA片段化图谱可以通过以下来确定：从受试者获得cfDNA片段并进行分离，对cfDNA片段进行测序以获得测序片段，将测序片段映射到基因组以获得映射序列窗口，以及分析映射序列窗口以确定cfDNA片段长度并生成cfDNA片段化图谱。

本发明的方法基于对分离的cfDNA的低覆盖率全基因组测序和分析。在一方面，用于开发本发明方法的数据基于浅层全基因组序列数据(1-2x覆盖范围)。

在一些方面，在覆盖基因组的非重叠窗口中分析映射序列。从概念上讲，窗口大小的范围可能为数千至数百万个碱基，从而导致基因组中有数百至数千个窗口。5Mb窗口用于评估cfDNA片段化模式，因为即使在有限数量的1-2x基因组覆盖范围内，这些窗口也能提供超过每窗口20,000个读数。在每个窗口内，检查cfDNA片段的覆盖范围和大小分布。在一些方面，可以将来自个体的全基因组模式与参考群体进行比较，以确定所述模式是可能健康的或还是源自癌症的。

在某些方面，映射序列包含数十至数千个基因组窗口，如10、50、100至1,000、5,000、10,000或更多个窗口。此类窗口可以是非重叠的或重叠的，并且包含约100万、200万、300万、400万、500万、600万、700万、800万、900万或1000万个碱基对。

在各个方面，在每个窗口内确定cfDNA片段化图谱。照此，本发明提供了用于确定受试者体内(例如，从受试者获得的样品中的)cfDNA片段化图谱的方法。

在一些方面，cfDNA片段化图谱可以用于鉴定cfDNA片段长度的变化(例如，改变)。改变可以是全基因组改变或一个或多个靶向区域/基因座的改变。靶区域可以是含有一个或多个癌症特异性改变的任何区域。在一些方面，cfDNA片段化图谱可以用于鉴定(例如，同时鉴定)约10个改变至约500个改变(例如，约25个至约500个、约50个至约500个、约100个至约500个、约200个至约500个、约300个至约500个、约10个至约400个、约10个至约300个、约10个至约200个、约10个至约1 00个、约10个至约50个、约20个至约400个、约30个至约300个、约40个至约200个、约50个至约100个、约20个至约1 00个、约25个至约75个、约50个至250个或约1 00个至约200个改变)。

在各个方面，cfDNA片段化图谱可以包含cfDNA片段大小模式。cfDNA片段可以具有任何适当大小。例如，在一些方面，cfDNA片段的长度可以为约50个碱基对(bp)至约400bp。如本文所述，患有癌症的受试者的cfDNA片段大小模式可以包含比健康受试者的中值cfDNA片段大小更短的中值cfDNA片段大小。健康受试者(例如，未患有癌症的受试者)可以具有中值cfDNA片段大小为约166.6bp至约167.2bp(例如，约166.9bp)的cfDNA片段大小。在一些方面，患有癌症的受试者可以具有比健康受试者的cfDNA片段大小平均短约1.28bp至约2.49bp(例如，约1.88bp)的cfDNA片段大小。例如，患有癌症的受试者可以具有中值cfDNA片段大小为约164.11bp至约165.92bp(例如，约165.02bp)的cfDNA片段大小。

在一些方面，二核小体cfDNA片段的长度可以为约230个碱基对(bp)至约450bp。如本文所述，患有癌症的受试者的二核小体cfDNA片段大小模式可以包含比健康受试者的中值二核小体cfDNA片段大小更短的中值二核小体cfDNA片段大小。在一些方面，平均而言，无癌症受试者在二核小体范围内具有较长的cfDNA片段(平均大小为334.75bp)，而患有癌症的受试者具有较短的二核小体cfDNA片段(平均大小为329.6bp)。照此，健康受试者(例如，未患有癌症的受试者)可以具有中值cfDNA片段大小为约334.75bp的二核小体cfDNA片段大小。在一些方面，患有癌症的受试者可以具有比健康受试者的二核小体cfDNA片段大小更短的二核小体cfDNA片段大小。例如，患有癌症的受试者可以具有中值cfDNA片段大小为约329.6bp的二核小体cfDNA片段大小。

cfDNA片段化图谱可以包含cfDNA片段大小分布。如本文所述，患有癌症的受试者可以具有比健康受试者的cfDNA片段大小分布更多变的cfDNA大小分布。在一些方面，大小分布可以在靶向区域内。健康受试者(例如，未患癌症的受试者)的靶区域cfDNA片段大小分布可以为约1或小于约1。在一些方面，患有癌症的受试者可以具有比健康受试者的靶向区域cfDNA片段大小分布更长(例如，长10、15、20、25、30、35、40、45、50或更多bp，或这些数目之间的任何数目的碱基对)的靶向区域cfDNA片段大小分布。在一些方面，患有癌症的受试者可以具有比健康受试者的靶向区域cfDNA片段大小分布更短(例如，短10、15、20、25、30、35、40、45、50或更多bp，或这些数目之间的任何数目的碱基对)的靶向区域cfDNA片段大小分布。在一些方面，患有癌症的受试者可以具有比健康受试者的靶向区域cfDNA片段大小分布小约47bp至长约30bp的靶向区域cfDNA片段大小分布。在一些方面，患有癌症的受试者可以具有cfDNA片段的长度平均相差10、11、12、13、14、15、15、17、18、19、20或更多bp的靶向区域cfDNA片段大小分布。例如，患有癌症的受试者可以具有cfDNA片段的长度平均相差约13bp的靶向区域cfDNA片段大小分布。在一些方面，大小分布可以是全基因组大小分布。

cfDNA片段化图谱可以包含小cfDNA片段与大cfDNA片段的比率以及片段比率与参考片段比率的相关性。如本文所用，关于小cfDNA片段与大cfDNA片段的比率，小cfDNA片段的长度可以为约100bp至约150bp。如本文所使用的，关于小cfDNA片段与大cfDNA片段的比率，大cfDNA片段的长度可以为约151bp至220bp。如本文所述，患有癌症的受试者的片段比率相关性(例如，cfDNA片段比率与参考DNA片段比率如来自一个或多个健康受试者的DNA片段比率的相关性)可以比健康受试者的片段比率相关性低(例如，低2倍、低3倍、低4倍、低5倍、低6倍、低7倍、低8倍、低9倍、低10倍或更多倍)。健康受试者(例如，未患有癌症的受试者)可以具有约1(例如，约0.96)的片段比率相关性(例如，cfDNA片段比率与参考DNA片段比率如来自一个或多个健康受试者的DNA片段比率的相关性)。在一些方面，患有癌症的受试者的片段比率相关性(例如，cfDNA片段比率与参考DNA片段比率如来自一个或多个健康受试者的DNA片段比率的相关性)可以比健康受试者的片段比率相关性(例如，cfDNA片段比率与参考DNA片段比率如来自一个或多个健康受试者的DNA片段比率的相关性)平均低约0.19至约0.30(例如，约0.25)。

本发明的方法进一步包含基于cfDNA片段化图谱计算评分(例如，DELFI评分)。在一些方面，计算评分包含：i)确定样品的短cfDNA片段与长cfDNA片段的比率，ii)通过染色体臂确定样品的cfDNA片段的Z评分，iii)使用计算混合模型分析来量化cfDNA片段密度，以及iv)使用机器学习模型来处理i)-iii)的输出以定义评分。在各个方面，评分用于确定受试者总体存活的概率。

在一个说明性实例(实例1)中，在多种癌症群组中，本发明人通过低覆盖率全基因组测序计算了每个个体的5MB库的短片段与长片段的比率、染色体臂的Z评分和cfDNA片段大小的混合模型。使用这些特征作为输入，本发明人使交叉验证的梯度增强机器适合于每个人的癌症状态(癌症/非癌症)。此模型的输出是范围为0至1的评分，其中高数值指示癌症的信号更强，并且低数值指示与非癌症更相似。一旦完成，只保留诊断为癌症的样品。

在一些方面，所输出的评分分析如下。使用随访时间、患者在随访结束时是否存活以及来自上述机器学习模型的评分，确定了cfDNA的片段化与存活率之间的关系。如图5所示，在患有癌症的个体中，确定了卡普兰-梅尔曲线中具有高分与低分的强分离。另外地，通过拟合cox比例风险模型，对评分、癌症分期和患者年龄进行回归，评估此评分与其它临床特征的独立性。

参考图5，如以上所讨论的，计算出的DELFI评分将所描绘的患有癌症(不包含肺癌)的个体的卡普兰-梅尔曲线分开，而不论用于定义高分(>0.5)与低分(<0.5)的截断值如何。每个分图顶部的数字指示所确定的截断值。

图6示出了cox比例风险模型在两种设置中的结果。在第一设置中(图的左分图)，DELFI评分被视为连续的。在第二设置中(图的右分图)，DELFI评分被视为高(>0.5)或低(<0.5)。在任一种设置中，DELFI评分都是强有力的存活率预测因子，即使在对抽血年龄和分期进行调整时也是如此。注意，所述分期是相对于1期而言的。

目前描述的方法和系统可用于检测、预测、治疗和/或监测受试者体内癌症状态。可以如本文所述评估、监测和/或治疗任何适当受试者，如哺乳动物。可以如本文所述评估、监测和/或治疗的一些哺乳动物的实例包含但不限于人、灵长类，如猴子、狗、猫、马、牛、猪、羊、小鼠和大鼠。例如，可以使用本文所述的方法评估患有或疑似患有癌症的人，并且任选地可以用如本文所述的一种或多种癌症治疗对其进行治疗。

可以使用本文所述的方法和系统评估和/或治疗患有或疑似患有任何适当类型的癌症的受试者(例如，通过向受试者施用一种或多种癌症治疗)。癌症可以是任何分期的癌症。在一些方面，癌症可以是早期癌症。在一些方面，癌症可以是无症状的癌症。在一些方面，癌症可以是残留疾病和/或复发(例如，在外科手术切除后和/或在癌症疗法后)。癌症可以是任何类型的癌症。可以如本文所述进行评估、监测和/或治疗的癌症类型的实例包含但不限于肺癌、结直肠癌、前列腺癌、乳腺癌、胰腺癌、胆管癌、肝癌、CNS癌、胃癌、食道癌、胃肠道间质瘤(GIST)、子宫癌和卵巢癌。另外的类型的癌症包含但不限于骨髓瘤、多发性骨髓瘤、B细胞淋巴瘤、滤泡性淋巴瘤、淋巴细胞性白血病、白血病和骨髓性白血病。在一些方面，癌症是实体瘤。在一些方面，癌症是肉瘤、癌或淋巴瘤。在一些方面，癌症是肺癌、结直肠癌、前列腺癌、乳腺癌、胰腺癌、胆管癌、肝癌、CNS癌、胃癌、食道癌、胃肠道间质瘤(GIST)、子宫癌或卵巢癌。在一些方面，癌症是血液癌。在一些方面，癌症是骨髓瘤、多发性骨髓瘤、B细胞淋巴瘤、滤泡性淋巴瘤、淋巴细胞性白血病、白血病或骨髓性白血病。

当治疗患有或疑似患有如本文所述的癌症的受试者时，可以向受试者施用一种或多种癌症治疗。癌症治疗可以是任何适当癌症治疗。可以以任何适当频率(例如，在数天至数周的时间段内一次或多次)向受试者施用本文所述的一种或多种癌症治疗。癌症治疗的实例包含但不限于外科手术干预、辅助化学疗法、新辅助化学疗法、放射疗法、激素疗法、细胞毒性疗法、免疫疗法、过继性T细胞疗法(例如，嵌合抗原受体和/或具有野生型或经修饰的T细胞受体的T细胞)、靶向疗法，如施用激酶抑制剂(例如，靶向如易位或突变等特定遗传损伤的激酶抑制剂)(例如，激酶抑制剂、抗体、双特异性抗体)、信号转导抑制剂、双特异性抗体或抗体片段(例如，BiTEs)、单克隆抗体、免疫检查点抑制剂、外科手术(例如，外科手术切除)，或以上的任何组合。在一些方面，癌症治疗可以降低癌症的严重性、减轻癌症的症状，和/或减少受试者体内存在的癌细胞的数目。

在一些方面，癌症治疗可以是化疗剂。化疗剂的非限制性实例包含：安吖啶、阿扎胞苷、硫唑嘌呤、贝伐单抗(或其抗原结合片段)、博来霉素、白消安、卡铂、卡培他滨、苯丁酸氮芥、顺铂、环磷酰胺、阿糖胞苷、达卡巴嗪、柔红霉素、多西他赛、去氧氟尿苷、阿霉素、表柔比星、盐酸埃罗替尼、依托泊苷、氟达拉滨、氟尿苷、氟达拉滨、氟尿嘧啶、吉西他滨、羟基脲、伊达比星、异环磷酰胺、伊立替康、洛莫司汀、氮芥、美法仑、巯嘌呤、甲氨蝶呤、丝裂霉素、米托蒽醌、奥沙利铂、紫杉醇、培美曲塞、丙卡巴肼、全反式维甲酸、链佐星、他氟平、替莫唑胺、替尼泊苷、硫鸟嘌呤、拓扑替康、乌拉莫司汀、戊柔比星、长春碱、长春新碱、长春地辛、长春瑞滨，及其组合。抗癌疗法的另外的实例是本领域已知的；参见例如美国临床肿瘤学会(ASCO)、欧洲肿瘤医学学会(ESMO)或国家综合癌症网络(NCCN)中的疗法指南。

当监测患有或疑似患有如本文所述的癌症的受试者时，监测可以在癌症治疗的历程之前、期间和/或之后进行。本文提供的监测方法可以用于确定一种或多种癌症治疗的功效和/或选择进行增强监测的受试者。

在一些方面，监测可以包含能够监测一种或多种癌症治疗(例如，一种或多种癌症治疗的功效)的常规技术。在一些方面，与未被选择进行增强监测的受试者相比，可以以增加的频率向被选择进行增强监测的受试者施用诊断测试(例如，本文公开的诊断测试中的任一种)。例如，可以以每天两次、每天一次、每周两次、每周一次、每月两次、每月一次、每季度一次、每半年一次、每年一次或其中的任何频率向被选择进行增强监测的受试者施用诊断测试。

在各个方面，DNA存在于取自受试者的生物样品中并在本发明的方法中使用。生物样品实际上可以是包含DNA的任何类型的生物样品。生物样品通常是流体，如全血或其具有循环cfDNA的一部分。在实施例中，样品包含来自肿瘤或液体活检的DNA，所述液体活检如但不限于羊水、房水、玻璃体液、血液、全血、分级血液、血浆、血清、母乳、脑脊液(CSF)、耵聍(耳垢)、乳糜、鸡眼、内淋巴液、外淋巴液、粪便、呼吸、胃酸、胃液、淋巴液、粘液(包含鼻引流液和粘液)、心包液、腹膜液、胸膜液、脓液、鼻涕、唾液、呼出气冷凝液、皮脂、精液、痰、汗水、滑液、眼泪、呕吐物、前列腺液、乳头抽吸液、泪液、汗液、颊拭子、细胞溶解产物、胃肠液、活检组织和尿液或其它生物流体。在一方面，样品包含来自循环肿瘤细胞的DNA。

如以上所公开的，生物样品可以是血液样品。血液样品可以使用本领域已知的方法获得，如手指穿刺或静脉切开术。合适地，血液样品为大约0.1至20ml，或替代地大约1至15ml，其中血液的体积为大约10ml。也可以使用较少的量，以及血液中的循环游离DNA。微量采样和通过针吸活组织检查、导管、排泄或产生含有DNA的体液的采样也是潜在的生物样品来源。

本公开的方法和系统利用核酸序列信息，并且因此可以包含任何方法或测序装置以用于执行核酸测序，包含核酸扩增、聚合酶链反应(PCR)、纳米孔测序、454测序、插入标签测序。在一些方面，本公开的方法或系统利用如以下公司提供的系统：依诺米那公司(Illumina，Inc)(包含但不限于HiSeq^TM X10、HiSeq^TM 1000、HiSeq^TM 2000、HiSeq^TM 2500、Genome Analyzers^TM、MiSeq^TM、NextSeq、NovaSeq 6000系统)、应用生物系统生命技术公司(SOLiD^TM系统、Ion PGM^TM测序仪、ion Proton^TM测序仪)或Genapsys公司或BGI MGI公司，以及其它系统。核酸分析也可以通过由以下公司提供的系统进行：牛津纳米孔技术公司(OxfordNanopore Technologies)(GridiON^TM、MiniON^TM)或太平洋生物科学公司(PacificBiosciences)(Pacbio^TM RS II或Sequel I或II)。

本发明包含用于执行所公开的方法的步骤的系统，并且部分地根据功能组件和各种处理步骤来描述。可以通过被配置成执行指定功能并实现各种结果的任何数量的组件、操作和技术来实现此类功能组件和处理步骤。例如，本发明可以采用可以执行各种功能的各种生物样品、生物标志物、元件、材料、计算机、数据源、存储系统和介质、信息收集技术和过程、数据处理标准、统计分析、回归分析等。

因此，本发明还提供了用于检测、分析和/或评估癌症的系统。在各个方面，所述系统包含：(a)测序仪，所述测序仪被配置成生成样品的低覆盖率全基因组测序数据集；以及(b)具有执行本发明方法的功能的计算机系统和/或处理器。

在一些方面，计算机系统进一步包含一个或多个另外的模块。例如，所述系统可以包含可操作以选择合适的遗传组分分析(例如，特定大小的cfDNA片段)的提取和/或分离单元中的一个或多个。

在一些方面，计算机系统进一步包含视觉显示装置。所述视觉显示装置可以可操作以显示曲线拟合线、参考曲线拟合线和/或两者的比较。

可以以任何合适的方式(例如使用在计算机系统上操作的计算机程序)实施根据本发明的各方面的用于数据分析的方法。如本文所讨论的，根据本发明的各个方面的示范性系统可以结合计算机系统来实施，该计算机系统为例如包括处理器和随机存取存储器的常规计算机系统，如远程可访问的应用服务器、网络服务器、个人计算机或工作站。计算机系统还适当地包含另外的存储器装置或信息存储系统，如大容量存储系统和用户界面，例如常规监测器、键盘和跟踪装置。然而，计算机系统可以包含任何合适的计算机系统和相关联的设备，并且可以以任何合适的方式来配置。在一个实施例中，计算机系统包括独立系统。在另一实施例中，计算机系统是包含服务器和数据库的计算机网络的一部分。

接收、处理和分析信息所需的软件可以在单个装置中实施或在多个装置中实施。可以通过网络来访问软件，使得信息的存储和处理相对于用户远程发生。根据本发明的各个方面的系统及其各种元件提供便于检测和/或分析的功能和操作，如数据收集、处理、分析、报告和/或诊断。例如，在本方面，计算机系统执行计算机程序，其可以接收、存储、搜索、分析和报告与人类基因组或其区域相关的信息。计算机程序可以包括执行各种功能或操作的多个模块，如用于处理原始数据并生成补充数据的处理模块以及用于分析原始数据和补充数据以生成疾病状态模型和/或诊断信息的定量评估的分析模块。

由系统执行的程序可以包括任何合适的过程以便于分析和/或癌症诊断。在一个实施例中，系统被配置成建立疾病状态模型和/或确定患者的疾病状态。确定或鉴定疾病状态可以包含生成关于患者相对于疾病的状况的任何有用信息，如执行诊断、提供有助于诊断的信息、评估疾病的分期或进程、鉴定可以指示对疾病的易感性的状况、鉴定是否会推荐进一步的测试、预测和/或评估一个或多个治疗程序的功效，或以其它方式评估患者的疾病状态、疾病的概率或其它健康方面。

提供以下实例以进一步绘示本发明的优点和特征，但其不旨在限制本发明的范围。虽然该实例是可以使用的实例中的典型实例，但是也可以替代地使用本领域技术人员已知的其它程序、方法或技术。

实例1

在前瞻性诊断队列中使用全基因组cfDNA片段化检测癌症

己证实全基因组cfDNA片段化模式以高灵敏度和特异性区分来自患有和未患癌症的个体的血浆样品。

在此实施例中，本公开的方法用于检测癌症并预测患者的总体存活率。

研究的目的是将cfDNA片段化测定作为基于血液的筛查试验进行评估，以检测多种不同的实体瘤并通过使用计算评分方案来预测患者的总体存活率。

方法

血浆样品：从281名因非器官特异性癌症体征和症状而转诊至赫勒福和根措夫特医院(the Herlev and Gentofte Hospital)(哥本哈根大学医院，丹麦哥本哈根)的诊断门诊的患者收集样品。

cfDNA片段化方法：cfDNA片段化方法在图1中概述。从血浆中提取cfDNA，将其加工成测序文库，通过低覆盖率全基因组测序(WGS)进行检查，映射到基因组，并进行分析以确定跨基因组的cfDNA片段化图谱。

使用机器学习来生成DELFI评分，并将个体分类为健康或患有癌症，并预测患者的总体存活率。

结果

用于非侵入性癌症检测的cfDNA片段化测定的性能：在3个月内(包含3个月)，74名患者被诊断为患有16种不同实体癌中的1种，而207名患者没有癌症。另外的结果在图2中示出。使用10次重复、10倍交叉验证确定局部和转移性癌症以及结直肠癌、肺癌和所有其它癌症的所有期的曲线下面积(AUC)。

用于癌症检测的cfDNA片段化测定的总体性能：结果在图3中概述。用于分析74名患有I-IV期癌症的个体和207名非癌症对照的接受者操作特性(ROC)的AUC。

通过DELFI评分来分析的存活率：如图4所示，较高的DELFI评分与总体存活率下降相关，与癌症分期或其它临床特性无关。图4示出了与DELFI评分相关的受试者存活率。较高的DELFI评分与总体存活率下降相关联，与癌症分期或其它临床特性无关。

结论

对前瞻性纳入的个体的此研究证明了cfDNA片段化测定区分患有和未患癌症的个体的能力。本发明的测定仅使用从低覆盖率WGS获得的片段化相关信息即可在多种癌症环境中表现出高性能。

结果表明，尽管存在常见的非恶性疾病(包含心血管疾病、自身免疫性疾病或炎性疾病)，但机器学习模型可以使用cfDNA片段化图谱来区分癌症和非癌症。另外地，独立于其它特性，具有较高DELFI评分的个体预后较差。

这些数据支持全基因组cfDNA片段化分析的开发，以用于单种和多种癌症的非侵入性检测。

尽管已经参考以上实例描述了本发明，但应当理解，修改和变化均涵盖在本发明的精神和范围之内。因此，本发明仅由以下权利要求限制。

Claims

1.一种检测受试者的癌症的方法，所述方法包括：

从所述受试者获得cfDNA片段并进行分离，

对所述cfDNA片段进行测序以获得测序片段，

将所述测序片段映射到基因组以获得映射序列窗口，以及

b)通过基于所述cfDNA片段化图谱计算评分来将所述受试者分类为患有癌症或未患癌症，所述评分指示所述受试者体内存在癌症的概率，由此检测到所述受试者的癌症。

2.根据权利要求1所述的方法，其中计算所述评分包括：i)确定短cfDNA片段与长cfDNA片段的比率，ii)通过染色体臂确定所述cfDNA片段的Z评分，iii)使用计算混合模型分析来量化cfDNA片段密度，以及iv)使用机器学习模型来处理i)-iii)的输出以定义所述评分。

3.根据权利要求2所述的方法，其中所述评分的范围为0至1。

4.根据权利要求3所述的方法，其中所述受试者体内存在癌症的所述概率随着评分值的增加而增加。

5.根据权利要求4所述的方法，其中对于被分类为患有癌症的受试者，所述方法进一步包括基于所述评分确定所述受试者总体存活的概率。

6.根据权利要求5所述的方法，其中所述受试者总体存活的所述概率随着评分值的增加而降低。

7.根据权利要求6所述的方法，其进一步包括将所述评分分类为高评分或低评分，其中高评分的值大于0.5并且低评分的值小于0.5，并且其中高评分指示所述受试者的总体存活率下降。

8.根据权利要求1所述的方法，其中测序包括使所述cfDNA片段经受低覆盖率全基因组测序以获得所述测序片段。

9.根据权利要求1所述的方法，其中分离cfDNA片段包括排除小于105bp和大于170bp的片段大小。

10.根据权利要求1所述的方法，其中所述映射序列窗口包括几十至几千个窗口。

11.根据权利要求10所述的方法，其中所述窗口是非重叠窗口。

12.根据权利要求11所述的方法，其中所述窗口各自包括约500万个碱基对。

13.根据权利要求12所述的方法，其中在每个窗口内确定cfDNA片段化图谱。

14.根据权利要求1所述的方法，其中所述cfDNA片段化图谱包括所述映射序列窗口中的小cfDNA片段与大cfDNA片段的比率。

15.根据权利要求1所述的方法，其中所述cfDNA片段化图谱包括跨所述基因组的窗口中小cfDNA片段和大cfDNA片段的序列覆盖率。

16.根据权利要求1所述的方法，其中所述cfDNA片段化图谱覆盖整个基因组。

17.根据权利要求1所述的方法，其中所述cfDNA片段化图谱覆盖亚基因组区间。

18.根据权利要求1所述的方法，其中分类包括将所述cfDNA片段化图谱与参考cfDNA片段化进行比较。

19.根据权利要求18所述的方法，其中参考cfDNA片段化图谱是健康受试者的cfDNA片段化图谱。

20.根据权利要求1所述的方法，其中所述癌症是实体瘤。

21.根据权利要求20所述的方法，其中所述癌症是肉瘤、癌或淋巴瘤。

22.根据权利要求20所述的方法，其中所述癌症选自由以下组成的组：结直肠癌、前列腺癌、乳腺癌、胰腺癌、胆管癌、肝癌、CNS癌、胃癌、食道癌、胃肠道间质瘤(GIST)、子宫癌和卵巢癌。

23.根据权利要求1所述的方法，其中所述癌症是血液癌。

24.根据权利要求23所述的方法，其中所述癌症选自由以下组成的组：骨髓瘤、多发性骨髓瘤、B细胞淋巴瘤、滤泡性淋巴瘤、淋巴细胞性白血病、白血病和骨髓性白血病。

25.根据权利要求1所述的方法，其进一步包括向所述受试者施用癌症治疗。

26.根据权利要求25所述的方法，其中所述癌症治疗选自由以下组成的组：外科手术、辅助化学疗法、新辅助化学疗法、放射疗法、激素疗法、细胞毒性疗法、免疫疗法、过继性T细胞疗法、靶向疗法或其任何组合。

27.一种确定患有癌症的受试者的总体存活率的方法，所述方法包括：

a)确定来自所述受试者的样品的游离DNA(cfDNA)片段化图谱；

28.根据权利要求27所述的方法，其中所述评分的范围为0至1。

29.根据权利要求28所述的方法，其中所述受试者总体存活的所述概率随着评分值的增加而降低。

30.根据权利要求29所述的方法，其进一步包括将所述评分分类为高评分或低评分，其中高评分的值大于0.5并且低评分的值小于0.5，并且其中高评分指示所述受试者的总体存活率下降。

31.根据权利要求27所述的方法，其中所述cfDNA片段化图谱通过以下确定：

从所述受试者获得cfDNA片段并进行分离，

对所述cfDNA片段进行测序以获得测序片段，

将所述测序片段映射到基因组以获得映射序列窗口，以及

分析所述映射序列窗口以确定cfDNA片段长度并生成所述cfDNA片段化图谱。

32.根据权利要求31所述的方法，其中测序包括使所述cfDNA片段经受低覆盖率全基因组测序以获得所述测序片段。

33.根据权利要求31所述的方法，其中分离cfDNA片段包括排除小于105bp和大于170bp的片段大小。

34.根据权利要求31所述的方法，其中所述映射序列窗口包括几十至几千个窗口。

35.根据权利要求34所述的方法，其中所述窗口是非重叠窗口。

36.根据权利要求35所述的方法，其中所述窗口各自包括约500万个碱基对。

37.根据权利要求36所述的方法，其中在每个窗口内确定cfDNA片段化图谱。

38.根据权利要求31所述的方法，其中所述cfDNA片段化图谱包括所述映射序列窗口中的小cfDNA片段与大cfDNA片段的比率。

39.根据权利要求31所述的方法，其中所述cfDNA片段化图谱包括跨所述基因组的窗口中小cfDNA片段和大cfDNA片段的序列覆盖率。

40.根据权利要求31所述的方法，其中所述cfDNA片段化图谱覆盖整个基因组。

41.根据权利要求31所述的方法，其中所述cfDNA片段化图谱覆盖亚基因组区间。

42.根据权利要求27所述的方法，其中所述癌症是实体瘤。

43.根据权利要求42所述的方法，其中所述癌症是肉瘤、癌或淋巴瘤。

44.根据权利要求42所述的方法，其中所述癌症选自由以下组成的组：肺癌、结直肠癌、前列腺癌、乳腺癌、胰腺癌、胆管癌、肝癌、CNS癌、胃癌、食道癌、胃肠道间质瘤(GIST)、子宫癌和卵巢癌。

45.根据权利要求27所述的方法，其中所述癌症是血液癌。

46.根据权利要求45所述的方法，其中所述癌症选自由以下组成的组：骨髓瘤、多发性骨髓瘤、B细胞淋巴瘤、滤泡性淋巴瘤、淋巴细胞性白血病、白血病和骨髓性白血病。

47.根据权利要求27所述的方法，其进一步包括向所述受试者施用癌症治疗。

48.根据权利要求47所述的方法，其中所述癌症治疗选自由以下组成的组：外科手术、辅助化学疗法、新辅助化学疗法、放射疗法、激素疗法、细胞毒性疗法、免疫疗法、过继性T细胞疗法、靶向疗法或其任何组合。

49.一种治疗患有癌症的受试者的方法，所述方法包括：

a)使用根据权利要求1至19中任一项所述的方法来检测所述受试者的癌症，或使用根据权利要求27至41中任一项所述的方法来确定所述受试者的总体存活率；以及

b)向所述受试者施用癌症治疗，由此治疗所述受试者。

50.根据权利要求49所述的方法，其中所述癌症是实体瘤。

51.根据权利要求50所述的方法，其中所述癌症是肉瘤、癌或淋巴瘤。

52.根据权利要求50所述的方法，其中所述癌症选自由以下组成的组：肺癌、结直肠癌、前列腺癌、乳腺癌、胰腺癌、胆管癌、肝癌、CNS癌、胃癌、食道癌、胃肠道间质瘤(GIST)、子宫癌和卵巢癌。

53.根据权利要求49所述的方法，其中所述癌症是血液癌。

54.根据权利要求53所述的方法，其中所述癌症选自由以下组成的组：骨髓瘤、多发性骨髓瘤、B细胞淋巴瘤、滤泡性淋巴瘤、淋巴细胞性白血病、白血病和骨髓性白血病。

55.根据权利要求49所述的方法，其中所述癌症治疗选自由以下组成的组：外科手术、辅助化学疗法、新辅助化学疗法、放射疗法、激素疗法、细胞毒性疗法、免疫疗法、过继性T细胞疗法、靶向疗法或其任何组合。

56.根据权利要求47所述的方法，其中所述受试者是人。

57.一种监测受试者的癌症的方法，所述方法包括：

a)使用根据权利要求1至19中任一项所述的方法来检测所述受试者的癌症，或使用根据权利要求27至41中任一项所述的方法来确定所述受试者的总体存活率；

b)向所述受试者施用癌症治疗；以及

c)在施用所述癌症治疗后使用根据权利要求27至41中任一项所述的方法来确定所述受试者的总体存活率，由此监测所述受试者的癌症。

58.一种用计算机程序编码的非暂时性计算机可读存储介质，所述程序包括指令，所述指令在由一个或多个处理器执行时使所述一个或多个处理器执行操作以执行根据权利要求1至24或27至46中任一项所述的方法。

59.一种计算系统，其包括：存储器；以及耦接到所述存储器的一个或多个处理器，所述一个或多个处理器被配置成执行操作以执行根据权利要求1至24或27至46中任一项所述的方法。