CN113930507A

CN113930507A - 疾病的检测和治疗以及用于传送测试结果的系统和方法

Info

Publication number: CN113930507A
Application number: CN202111138455.6A
Authority: CN
Inventors: 埃尔米·埃尔图凯; 阿米尔阿里·塔拉萨兹; 巴赫拉姆·加法尔扎德·克曼尼; 纳姆迪·伊胡埃格布
Original assignee: Guardant Health Inc
Current assignee: Guardant Health Inc
Priority date: 2014-12-31
Filing date: 2015-12-28
Publication date: 2022-01-14
Also published as: JP2018507682A; GB201712299D0; US20170260590A1; JP6783768B2; EP3240911A4; US20240141432A9; AU2020264326A1; ES2923602T3; EP3766986A1; WO2016109452A1; ES2828279T3; US20210395837A1; CN107406876B; JP7145907B2; AU2023206196A1; GB2552267B; CA2972433A1; AU2015374259B2; AU2020264326B2; CN107406876A

Abstract

本公开提供了用于生成并施加治疗干预的方法等。该方法包括，例如，(a)对来自受试者的癌细胞的多核苷酸进行测序；(b)鉴别并定量该多核苷酸中的体细胞突变；(c)产生受试者中的肿瘤异质性谱，该谱指示该多核苷酸中多种体细胞突变的存在和相对量，其中不同的相对量指示肿瘤异质性；以及(d)确定用于表现出该肿瘤异质性的癌症的治疗干预，其中该治疗干预对于具有所确定的肿瘤异质性谱的癌症是有效的。

Description

疾病的检测和治疗以及用于传送测试结果的系统和方法

本申请是申请日为2015年12月28日、申请号为201580077268.8、发明名称为“表现出病变细胞异质性的疾病的检测和治疗以及用于传送测试结果的系统和方法”的中国专利申请(其对应PCT申请的申请日为2015年12月28日、申请号为PCT/US2015/067717)的分案申请。

相关申请的交叉引用

本申请要求于2014年12月31日提交的第62/098,426号美国临时申请和于2015年5月1日提交的第62/155,763号美国临时申请的权益，所述申请中的每一个均通过引用而全文并入本文。

背景技术

医疗保健目前刚开始有效地使用来自人类基因组的信息来诊断并治疗疾病。没有任何事比治疗癌症更重要，美国每年有760万人死于癌症，并且美国每年在治疗癌症上花费870亿美元。癌症是指特征在于易于侵入周围组织并转移到新身体部位的退行发育细胞的增殖的各种恶性肿瘤以及特征在于此类生长的病理状况的任何病症。

癌症难以治疗的原因之一是目前的测试方法可能无法帮助医生将具体的癌症与有效的药物治疗相匹配。并且它是活动的目标——癌细胞不断变化及突变。癌症可通过例如体细胞突变来积累遗传变体。这样的变体包括例如序列变体和拷贝数变体。肿瘤分析已经表明，肿瘤中的不同细胞可携带不同的遗传变体。肿瘤细胞之间这样的差异被称为肿瘤异质性。

癌症可随时间推移而演化，变得对治疗干预具有抗性。已知某些变体与对特定治疗干预的反应性或抗性相关。对于表现出肿瘤异质性的癌症的更有效治疗将是有益的。可用癌症对之响应的第二种不同的治疗干预来治疗这样的癌症。

DNA测序方法允许检测来自肿瘤细胞的DNA中的遗传变体。癌症肿瘤不断将其独特的基因组物质释放入血流。遗憾的是，这些警示性的基因组“信号”非常弱，以至于目前的基因组分析技术(包括新一代测序)可能只能偶尔或在具有末期高肿瘤负荷的患者中检测到这样的信号。其主要原因是这类技术受到错误率和偏差的困扰，所述错误率和偏差要比可靠地检测与癌症相关的从头基因组改变所需要的高几个数量级。

在类似的趋势下，为了了解遗传测试的临床意义，治疗专业人员必须具有基因遗传的基本原理的应用知识以及对概率数据进行解释的合理工具。一些研究表明，许多治疗专业人员对于解释疾病易感性的遗传测试尚未作好足够的准备。一些医生难以解释与诊断测试的临床应用相关的概率数据，诸如实验室测试的阳性或阴性预测值。

检测与癌症相关的从头基因组改变中的错误率和偏差以及对癌症的遗传测试不足的解释或暗示降低了对于癌症患者的护理质量。专业团体如美国病理学家协会(Collegeof American Pathologists)(CAP)和美国医学遗传学协会(American College ofMedical Genetics)(ACMG)已经公布了对于提供遗传测试的实验室的标准或指南，其要求含有遗传信息的报告包括全科医师可理解的说明性内容。

发明内容

在一个方面本文提供了一种方法，其包括：(a)对来自受试者的生物样品中癌细胞的多核苷酸进行测序；(b)鉴别并定量所述多核苷酸中的体细胞突变；(c)产生所述受试者中的肿瘤异质性谱，所述谱指示所述多核苷酸中多种体细胞突变的存在和相对量，其中不同的相对量指示肿瘤异质性；以及(d)确定针对表现出所述肿瘤异质性的癌症的治疗干预，其中所述治疗干预对于具有所确定的肿瘤异质性谱的癌症是有效的。在一些实施方案中，所述癌细胞是空间上不同的。在一些实施方案中，所述治疗干预对于呈现出所述多种体细胞突变的癌症比对于呈现出任一种而不是所有所述体细胞突变的癌症更有效。在一些实施方案中，所述方法进一步包括：(e)监测所述受试者中肿瘤异质性随时间推移的变化，并基于所述变化确定随时间推移的不同治疗干预。在一些实施方案中，所述方法进一步包括：(e)显示所述治疗干预。在一些实施方案中，所述方法进一步包括：(e)实施所述治疗干预。在一些实施方案中，所述方法进一步包括：(e)基于所述肿瘤谱生成肿瘤演化的系统发生；其中考虑到所述系统发生而确定所述治疗干预。

在一些实施方案中，借助于计算机执行的算法进行确定。在一些实施方案中，通过测序生成的序列读取值(reads)在鉴别和定量之前经历降噪。在一些实施方案中，降噪包括从所述样品中的单个多核苷酸生成的序列的分子追踪。

在一些实施方案中，确定治疗干预考虑到肿瘤相关的遗传改变的相对频率。在一些实施方案中，所述治疗干预包括联合施用或顺序地施用多种药物，其中每种药物对于呈现出以不同相对频率发生的不同种体细胞突变的癌症相对更有效。在一些实施方案中，对于呈现出以较高相对频率发生的体细胞突变的癌症相对更有效的药物以较高的量施用。在一些实施方案中，所述药物以分层的剂量递送以反映DNA中变体的相对量。在一些实施方案中，呈现出至少一种所述遗传变体的癌症对至少一种所述药物具有抗性。在一些实施方案中，确定治疗干预考虑到所述癌症的起源组织。在一些实施方案中，基于显示出对具有特征在于每种所述体细胞突变的肿瘤异质性的癌症具有治疗性的干预措施数据库来确定所述治疗干预。

在一些实施方案中，所述多核苷酸包括来自血液样品的cfDNA。在一些实施方案中，所述多核苷酸包括来自空间上不同的癌细胞的多核苷酸。在一些实施方案中，所述多核苷酸包括来自不同转移瘤部位的多核苷酸。在一些实施方案中，所述多核苷酸包括来自实体瘤或弥漫性肿瘤的多核苷酸。在一些实施方案中，所述多核苷酸包含在血液样品中或实体瘤活检物中。

在一些实施方案中，鉴别包括生成对于来自样品的亲代多核苷酸的多个序列读取值，并分解(collapsing)所述序列读取值以生成对每个亲代多核苷酸中碱基的一致判定(consensus calls)。在一些实施方案中，定量包括确定在来自所述生物样品的所述多核苷酸群体中检测到所述体细胞突变的频率。在一些实施方案中，所述生物样品包括来自非病变细胞的生物分子。在一些实施方案中，所述生物样品包括来自多个不同组织的生物分子。在一些实施方案中，所述生物分子包含在一个生物样品中。在一些实施方案中，所述生物分子包含在多个生物样品中。在一些实施方案中，所述多个生物样品是来自多个转移瘤的肿瘤。

在一些实施方案中，测序包括对受试者基因组中的全部或部分基因子集进行测序。在一些实施方案中，所述体细胞突变选自单核苷酸变异(SNV)、插入、缺失、倒位、颠换、易位、拷贝数变异(CNV)(例如，非整倍性、部分非整倍性、多倍性)、染色体不稳定性、染色体结构改变、基因融合、染色体融合、基因截短、基因扩增、基因复制、染色体损伤、DNA损伤、核酸化学修饰的异常变化、外遗传模式的异常变化和核酸甲基化的异常变化。在一些实施方案中，遗传基因座选自单个核苷酸、基因和染色体。

在一些实施方案中，所述癌症选自癌、肉瘤、白血病、淋巴瘤、骨髓瘤和中枢神经系统癌症(例如，乳腺癌、前列腺癌、结直肠癌、脑癌、食管癌、头颈癌、膀胱癌、妇科癌症、脂肪肉瘤和多发性骨髓瘤)。在一些实施方案中，所述肿瘤的癌细胞来源于共同的亲代病变细胞。在一些实施方案中，所述肿瘤的癌细胞来源于相同或不同癌症类型的不同亲代癌细胞。在一些实施方案中，所述方法进一步包括确定所述体细胞突变相对于一个或多个对照参考的量度以确定相对量。

在一些实施方案中，所述多核苷酸来源于循环癌症多核苷酸和实体瘤活检物。在一些实施方案中，对于来源于循环癌症多核苷酸和实体瘤活检物的多核苷酸分别产生谱。

在一个方面本文提供了一种方法，其包括为患有具有可推断肿瘤异质性的肿瘤谱的癌症的受试者提供治疗干预，其中所述治疗干预对具有所述肿瘤谱的癌症是有效的。在一些实施方案中，所述肿瘤谱指示多种更多体细胞突变的相对频率。在一些实施方案中，所述方法进一步包括监测所述受试者中所述相对频率随时间推移的变化，并根据所述变化确定随时间推移的不同治疗干预。在一些实施方案中，所述治疗干预对于呈现出每种所述体细胞突变的癌症比对于呈现出任一种而不是所有所述体细胞突变的癌症更有效。在一些实施方案中，所述治疗干预包括联合施用或顺序地施用多种药物，其中每种药物对于呈现出以不同相对频率发生的不同种体细胞突变的癌症相对更有效。在一些实施方案中，以较高的量施用对于呈现出以较高相对频率发生的体细胞突变的癌症相对更有效的药物。在一些实施方案中，所述药物以分层的剂量递送以反映DNA中变体的相对量。在一些实施方案中，呈现出至少一种所述遗传变体的癌症对至少一种所述药物具有抗性。在一些实施方案中，所述癌症选自癌、肉瘤、白血病、淋巴瘤、骨髓瘤和中枢神经系统癌症(例如，乳腺癌、前列腺癌、结直肠癌、脑癌、食管癌、头颈癌、膀胱癌、妇科癌症、脂肪肉瘤和多发性骨髓瘤)。

在一个方面本文提供了一种方法，其包括向受试者施加对表现出肿瘤异质性的肿瘤有效的治疗干预，其中所述治疗干预基于所述受试者中的肿瘤异质性谱，所述谱指示所述多核苷酸中多种体细胞突变的存在和相对量，其中不同的相对量指示肿瘤异质性。

在一个方面本文提供了一种包含计算机可读介质的系统，该计算机可读介质包含机器可执行代码，该机器可执行代码在被计算机处理器执行时实现包括如下步骤的方法：(a)将定位到遗传基因座的多核苷酸的序列读取值接收到存储器中；(b)在所述序列读取值之间，确定在定位到基因座的序列读取值的总数的基因座处与参考序列的碱基不同的碱基的身份；(c)报告所确定的碱基的身份和相对量及其在基因组中的位置；以及(d)基于(c)中的信息推断给定样品的异质性。在一些实施方案中，所实现的方法进一步包括将来源于多个不同时间的样品的序列读取值接收到存储器中，并计算两个样品之间的多个碱基的相对量和身份的差异。

在一个方面本文提供了一种试剂盒，其包含第一药物和第二药物，其中第一药物和第二药物的组合对于呈现出第一和第二体细胞突变的癌症比对于呈现出任一种而不是所有所述体细胞突变的癌症在治疗上更有效。在一些实施方案中，所述组合被包含在混合物中，或每种药物被包含在单独的容器中。

在一个方面本文提供了一种方法，其包括：(a)对来自受试者的病变细胞(例如，空间上不同的病变细胞)的生物分子聚合物进行生物分子分析；(b)鉴别并定量所述生物分子大分子中的生物分子变体；(c)产生所述受试者中病变细胞异质性的谱，所述谱指示所述生物分子大分子中多种变体的存在和相对量，其中不同的相对量指示病变细胞异质性；以及(d)确定针对表现出所述病变细胞异质性的疾病的治疗干预，其中所述治疗干预对于具有所确定的病变细胞异质性谱的疾病是有效的。在一些实施方案中，所述病变细胞是空间上不同的病变细胞。在一些实施方案中，基于显示出对具有特征在于每种所述体细胞突变的肿瘤异质性的癌症具有治疗性的干预措施数据库来确定所述治疗干预。

在一个方面本文提供了检测受试者中病变细胞异质性的方法，其包括：a)对在来自受试者的样品的多核苷酸中在多个遗传基因座中的每一个处携带序列变体的多核苷酸进行定量，其中所述样品包含来自体细胞和来自病变细胞的多核苷酸；b)对每个基因座确定关于携带所述序列变体的多核苷酸的拷贝数变异(CNV)的量度；c)根据所述基因座处的CNV对每个基因座确定在所述基因座处携带序列变体的多核苷酸的量的加权量度；以及d)比较所述多个基因座中的每一个处的所述加权量度，其中不同的加权量度指示病变细胞异质性。在一些实施方案中，所述病变细胞为肿瘤细胞。在一些实施方案中，多核苷酸包括cfDNA。

在本文提供的方面中的方法包括：a)使受试者经历一个或多个脉冲治疗循环，每个脉冲治疗循环包括：(i)期间以第一量施用一种或多种药物的第一阶段，和(ii)期间以减少的第二量施用(例如完全不施用)所述一种或多种药物的第二阶段；其中：(A)所述第一阶段的特征在于检测到的肿瘤负荷高于第一临床水平；并且(B)所述第二阶段的特征在于检测到的肿瘤负荷低于第二临床水平。在一些实施方案中，根据肿瘤多核苷酸中选择的体细胞变体的量来测量肿瘤负荷。在一些实施方案中，一种或多种药物是多种药物，并且每个循环中每种药物的每个量都根据肿瘤负荷来确定，该肿瘤负荷根据肿瘤多核苷酸中选择的多种不同体细胞变体中每一种的量来测量。在一些实施方案中，所述方法包括使所述受试者经受多个脉冲治疗循环。在一些实施方案中，所述方法进一步包括：b)当所述受试者表现出对所述一种或多种药物的抗性时，使所述受试者经受一个或多个脉冲治疗循环，每个脉冲治疗循环包括：(i)期间以第一量施用不同的一种或多种药物的第一阶段，和(ii)期间以减少的第二量施用(例如完全不施用)所述不同的一种或多种药物的第二阶段；其中：(A)所述第一阶段的特征在于检测到的肿瘤负荷高于第一临床水平；并且(B)所述第二阶段的特征在于检测到的肿瘤负荷低于第二临床水平。

在一个方面本文提供了一种方法，其包括：(a)对来自受试者的癌细胞的多核苷酸进行测序；(b)鉴别并定量所述多核苷酸中的体细胞突变；以及(c)产生所述受试者中的肿瘤异质性谱，以用于确定对于表现出肿瘤异质性的癌症有效的治疗干预，其中所述谱指示所述多核苷酸中多种体细胞突变的存在和相对量，其中不同的相对量指示肿瘤异质性。

在一个方面本文提供了一种方法，其包括向受试者提供治疗干预，其中所述治疗干预根据所述受试者中的病变细胞异质性谱而确定，其中所述谱指示所述多核苷酸中多种体细胞突变的存在和相对量，其中不同的相对量指示病变细胞异质性；并且其中所述治疗干预对于具有所确定的病变细胞异质性谱的疾病是有效的，例如，对于呈现出所述多种体细胞突变的疾病比对于呈现出任一种而不是所有所述体细胞突变的疾病更有效。

在一个方面本文提供了一种方法，其包括：a)确定跨越基因组的至少1kb、至少10kb、至少100kb、至少1mb、至少10mb或至少100mb的区域中，样品中多核苷酸的拷贝数距离集中趋势值的偏差的量度(例如，标准差、方差)；b)基于所述偏差的量度，推测来自所述样品中正在经历细胞分裂的细胞的DNA的负荷量度。在一些实施方案中，所述集中趋势值是平均值、中位数或众数。在一些实施方案中，所述确定包括将所述区域划分为多个非重叠区间，确定每个区间处的拷贝数的量度，以及根据每个区间处的拷贝数量度来确定偏差的量度。在一些实施方案中，所述区间不超过1个碱基、10个碱基、100个碱基、1kb碱基或10kb中的任一种。

在一个方面本文提供了推断来自样品中正在经历细胞分裂的细胞的DNA的负荷量度的方法，其包括测量由一个或多个基因组基因座与细胞复制起点邻近而诱导的拷贝数变异，其中增加的CNV指示细胞正在经历细胞分裂。在一些实施方案中，在无细胞DNA中测量所述负荷。在一些实施方案中，所述负荷的量度涉及所述样品中的肿瘤细胞的分数或来自肿瘤细胞的DNA的基因组当量。在一些实施方案中，从一组对照样品或细胞系推断出由于邻近复制起点而导致的CNV。在一些实施方案中，使用隐马尔可夫模型、回归模型、基于主成分分析的模型或基因型修正模型来估计由于复制起点而导致的变异。在一些实施方案中，所述负荷的量度是存在或不存在正在经历细胞分裂的细胞。在一些实施方案中，邻近是在复制起点1kb内。

在一个方面本文提供了通过改善由于邻近复制起点而导致的变异的作用来增加确定基因相关拷贝数变异的灵敏度和/或特异性的方法。在一些实施方案中，所述方法包括测量基因座处的CNV，确定由于所述基因座与复制起点邻近而导致的CNV的量，以及校正所测量的CNV以反映基因组CNV，例如，通过减去可由细胞分裂引起的CNV的量。在一些实施方案中，从无细胞DNA获得基因组数据。在一些实施方案中，所述负荷的量度涉及样品中的肿瘤细胞的分数或DNA的基因组当量。在一些实施方案中，从一组对照样品或细胞系推断由于复制起点而导致的变异。在一些实施方案中，使用隐马尔可夫模型、回归模型、基于主成分分析的模型或基因型修正模型来估计由于复制起点而导致的变异。

在一个方面本文提供了一种方法，其包括：a)确定来自一个或多个对照样品的一个或多个基因座处的DNA分子的拷贝的基线量度，其中一个或多个所述基因座包括复制起点，每个都含有来自正在经历预定水平的细胞分裂的细胞的DNA；b)确定测试样品中DNA分子的测试量度；其中所述测试样品中的量度来自被划分成一个或多个分区的一个或多个基因座，并且其中一个或多个所述基因座包括复制起点；c)比较所述测试量度和所述基线量度，其中在基线量度之上的测试量度指示所述测试样品中的DNA来自的细胞比向所述对照样品提供DNA的细胞以更快的速度分裂。在一些实施方案中，所述量度选自分子计数、跨分区的分子计数的集中趋势量度或跨分区的分子计数变化量度。

在一个方面本文提供了一种方法，其包括：(a)向受试者施加增加所述受试者的循环中来源于肿瘤的DNA的量的干预；以及(b)当所述量增加时，从所述受试者收集含有来源于肿瘤的DNA的样品。在一些实施方案中，所述干预优先杀死肿瘤细胞。在一些实施方案中，所述干预包括使所述受试者或所述受试者的疑似病变区域暴露于辐射。在一些实施方案中，所述干预包括使所述受试者或受试者的疑似病变区域暴露于超声。在一些实施方案中，所述干预包括使所述受试者或受试者的疑似病变区域暴露于物理震动(agitation)。在一些实施方案中，所述干预包括向所述受试者施用低剂量的化疗。在一些实施方案中，所述方法包括在收集样品前1周内向所述受试者施加所述干预。在一些实施方案中，所述样品选自血液、血浆、血清、尿液、唾液、脑脊髓液、阴道分泌物、黏液和精液。

在一个方面本文提供了一种方法，其包括汇编数据库，其中所述数据库对于具有癌症的多个受试者中的每一个包含对每个受试者在两个或更多个时间间隔收集的肿瘤基因组测试数据(包括体细胞改变)，在一个或多个时间向每个所述受试者施加的一种或多种治疗干预和所述治疗干预的功效，其中所述数据库对于推断所述治疗干预在具有肿瘤基因组谱的受试者中的功效是有用的。在一些实施方案中，所述多个是至少50个、至少500个或至少5000个。在一些实施方案中，通过连续活检、无细胞DNA、无细胞RNA或循环肿瘤细胞收集肿瘤基因组测试数据。在一些实施方案中，利用检测到的遗传变体的相对频率对治疗功效进行分类。在一些实施方案中，使用附加信息来帮助对治疗功效进行分类，包括但不限于体重、不良治疗反应、组织学测试、血液测试、放射照相信息、既往治疗和癌症类型。在一些实施方案中，通过附加测试来收集并定量分类每个患者的治疗反应。在一些实施方案中，所述附加测试是基于血液或尿液的测试。

在一个方面本文提供了一种方法，其包括使用数据库对具有癌症的受试者鉴别一种或多种有效的治疗干预，其中所述数据库对于具有癌症的多个受试者中的每一个包含对每个受试者在两个或更多个时间间隔收集的肿瘤基因组测试数据(包括体细胞改变)、在一个或多个时间向每个所述受试者施加一种或多种治疗干预和所述治疗干预的功效。在一些实施方案中，按照功效对所鉴别的治疗干预进行分层。在一些实施方案中，报告关于所预测的治疗干预功效或缺乏该功效的定量界限。在一些实施方案中，所述治疗干预使用响应于治疗的类似患者中预测的肿瘤基因组演化或所获得的抗性机制的信息。

在一些实施方案中，所述方法包括使用分类算法对治疗有效性进行分类，该分类算法例如是线性回归过程(例如，多元线性回归(MLR)、偏最小二乘(PLS)回归和主成分回归(PCR))、二叉决策树(例如，递归分割过程如CART-分类和回归树)、人工神经网络如反向传播网络、判别分析(例如，贝叶斯分类器或费舍尔分析)、逻辑分类器和支持向量分类器(例如，支持向量机)。

在一个方面本文公开了报告一种或多种遗传测试结果的方法，其包括：使用遗传分析仪在一个或多个测试点上捕获包括遗传变体及其定量量度在内的遗传信息；对所述定量量度进行归一化以用于呈现所述一个或多个测试点并生成比例因子；应用所述比例因子以呈现肿瘤响应图；以及生成遗传变体的汇总。在一些实施方案中，所述方法包括分析非CNV(拷贝数变异)突变等位基因频率。在一些实施方案中，所述方法包括将绝对值变换为相对度量以供呈现肿瘤响应图。在一些实施方案中，所述方法包括用突变等位基因频率乘以预定值并取其对数。在一些实施方案中，所述方法包括：用所述比例因子乘以对于每个基因的变换值以确定要在所述肿瘤响应图上呈现的量指示符；以及为可视小图(visual panel)中的每种改变分配独特的可视指示符。在一些实施方案中，所述方法包括在指示连续性的连续放置的小图中使所述量指示符Y居中或垂直居中。在一些实施方案中，所述分配进一步包括为每种改变提供独特的颜色。

在一些实施方案中，所述方法包括分析来自另一测试点或测试时间的遗传信息。在新的测试结果与先前的测试结果并非不同的一些实施方案中，所述方法包括呈现先前的可视小图。在如果改变仍然相同但量已经改变的一些实施方案中，所述方法包括：维持每种改变的顺序和独特的可视指示符；以及确定新的量指示符并生成针对所有测试点的新可视小图。在一些实施方案中，所述方法包括确定遗传信息的新改变并在现有改变的基础上添加所述改变。在一些实施方案中，所述方法包括确定遗传信息的新改变并确定新变换值和比例因子并为每种新改变分配独特的可视指示符。在一些实施方案中，所述方法包括确定遗传信息的新改变并重新生成肿瘤响应图，包括在当前测试点仍被检测到的来自先前测试点的改变以及新改变。在一些实施方案中，所述方法包括确定先前的改变是否不再存在，并且如果是，则包括当为后续测试点呈现所述先前改变的改变量时采用零高度。在一些实施方案中，所述方法包括确定先前的改变是否不再存在，并且如果是，则保留与先前改变相关联的独特可视指示符以供将来使用。

在一些实施方案中，所述方法包括分析CNV突变等位基因频率和甲基化突变等位基因频率。在一些实施方案中，所述方法包括将最大突变等位基因频率进行分组用于首先在所述肿瘤响应图上呈现。在一些实施方案中，所述方法包括以改变的突变等位基因频率的降序呈现所述基因的改变。在一些实施方案中，所述方法包括以降序呈现所述基因的改变。在一些实施方案中，所述方法包括选择具有次高突变等位基因频率的下一个基因。

在一些实施方案中，对于每个报告的改变，所述方法包括对不同测试点的改变生成趋势指示符。在一些实施方案中，所述方法包括生成改变的汇总。在一些实施方案中，所述方法包括生成治疗选项的汇总。在一些实施方案中，所述方法包括生成突变等位基因频率、无细胞扩增、临床批准指示和临床试验的汇总。在一些实施方案中，所述方法包括基于生物学途径生成小图。在一些实施方案中，所述方法包括基于证据水平生成小图。在一些实施方案中，所述遗传信息包括单核苷酸变异、拷贝数变异、插入和缺失以及基因重排中的一个或多个。在一些实施方案中，所述方法包括生成关于检测到的改变的临床相关性报告。在一些实施方案中，所述方法包括生成治疗结果汇总。

在一个方面本文提供了生成遗传报告的方法，其包括：使用遗传分析仪生成非拷贝数变异(CNV)数据；对于每种非CNV突变等位基因频率确定比例因子；对于首次测试，使用所述比例因子生成每种非CNV改变的可视小图；以及对于每次后续测试，使用所述比例因子对所述可视小图生成所述非CNV改变的变化。

在一些实施方案中，所述方法包括将绝对值变换为相对度量以供呈现。在一些实施方案中，所述方法包括用突变等位基因频率乘以预定值并对所述预定值取对数。在一些实施方案中，所述方法包括使用最大观测值来确定比例因子。在一些实施方案中，对于每种非CNV改变，所述方法包括用比例因子乘以对于每种基因变体的变换值作为量指示符以供使所述基因变体可视化。

在一些实施方案中，所述方法包括为每种改变分配独特的可视指示符。在一些实施方案中，对于后续测试，所述方法包括如果测试结果不变，则使用所述可视小图。在一些实施方案中，如果改变在后续测试中保持不变，则所述方法包括维持每种改变的顺序和独特的可视指示符；以及重新计算量指示符以供使所述变体可视化，并重新呈现现有小图和新小图中的更新值以供最新测试。在一些实施方案中，如果在后续测试中发现新改变，则所述方法包括在所有现有改变的基础上添加所述改变；计算变换值和比例因子；以及为每种新改变分配独特的可视指示符。

在一些实施方案中，所述方法包括：重新呈现先前测试点的改变和新改变；以及在指示连续性的连续放置的小图中使所述改变的图像垂直居中。在一些实施方案中，如果先前的改变在后续测试中不存在，则所述方法包括对后续呈现使用零高度作为所述改变的量。在一些实施方案中，所述方法包括呈现与改变变化相关联的受试者或干预信息。在一些实施方案中，所述方法包括用最大突变等位基因频率来鉴别改变。

在一些实施方案中，所述方法包括：以非CNV改变的突变等位基因频率的降序报告该基因的改变；以及以CNV值的降序报告该基因的CNV改变。在一些实施方案中，所述方法包括选择具有次高非CNV突变等位基因频率的下一个基因，并以非CNV改变的突变等位基因频率的降序报告该基因的改变；以及以CNV值的降序报告该基因的CNV改变。

在一些实施方案中，所述方法包括呈现不同测试日期的改变的趋势指示符。在一些实施方案中，所述方法包括将最大突变等位基因频率分组并生成包括生物学途径或证据水平的注释。在一些实施方案中，所述方法包括基于证据水平生成小图。在一些实施方案中，所述方法包括基于生物学途径生成小图。在一些实施方案中，所述遗传信息包括单核苷酸变异、拷贝数变异、插入和缺失以及基因重排中的一个或多个。

在一个方面本文提供了一种方法，其包括：a)提供来自受试者的多个核酸样品，所述样品在连续时间点收集；b)对来自所述样品的多核苷酸进行测序以生成序列；c)确定每个样品中所述多核苷酸之间多个遗传变体中的每一个的定量量度；d)对于在至少一个连续时间点以非零量存在的那些体细胞突变，通过计算机用图形表示遗传变体在每个连续时间点的相对量。在一些实施方案中，所述定量量度是定位到相同遗传基因座的所有序列中的所述遗传变体的频率。在一些实施方案中，所述相对量被表示为堆叠区域图。在一些实施方案中，所述相对量在最早时间点从最高至最低从所述图的底部至顶部堆叠，并且其中在稍后时间点首先以非零量出现的遗传变体堆叠在所述图的顶部。在一些实施方案中，所述区域由不同的颜色表示。在一些实施方案中，所述图形表示进一步指示对于每个时间点，主要遗传变体的定量量度。在一些实施方案中，所述图形表示进一步包括鉴别所述图上表示的遗传变体的关键。在一些实施方案中，图形表示包括归一化和缩放所述定量量度。

在一些实施方案中，所述多核苷酸包括cfDNA。在一些实施方案中，所述基因座位于癌基因中。在一些实施方案中，所述多个遗传变体定位到基因组中的不同基因。在一些实施方案中，所述多个遗传变体定位到基因组中的相同基因。在一些实施方案中，对至少10种不同癌基因进行测序。

在一些实施方案中，确定包括将所述序列接收到计算机存储器中并使用计算机处理器来执行软件以确定所述定量量度。在一些实施方案中，图形表示包括使用计算机处理器来执行软件，该软件将所述定量量度变换为图形格式并在电子图形用户界面如显示屏上表示所述图形格式。

在一个方面本文提供了从通过遗传分析仪生成的数据生成纸质或电子患者测试报告的方法，其包括：a)汇总来自两个或更多个测试时间点的数据，由此报告首次测试后每个后续测试点处所有非零测试结果的并集；以及b)将所述测试结果呈现在纸质或电子患者测试报告上。在一些实施方案中，通过用计算机处理器执行代码在计算机上进行汇总和呈现，以(i)鉴别所有非零测试结果，(ii)生成所述测试报告，以及(iii)在图形用户界面上显示所述测试报告。

在一个方面本文提供了由遗传分析仪所生成的数据来图形表示受试者中肿瘤的遗传变体演化的方法，其包括：a)通过计算机生成在所述受试者中在多个时间点中的每一个处检测到的遗传变体的堆叠表示，其中对应于遗传变体的所述堆叠中每一层的高度或宽度表示所述遗传变体在每个时间点对遗传变体的总量的定量贡献；以及b)在计算机监视器或纸质报告上显示所述堆叠表示。在一些实施方案中，所述方法进一步包括在基于体液的测试中使用检测到的遗传变体的大小的组合来推断疾病负荷。在一些实施方案中，所述方法进一步包括使用检测到的突变的等位基因分数、等位基因不平衡、基因特异性覆盖来推断疾病负荷。

在一些实施方案中，整体堆叠高度代表受试者中的总体疾病负荷或疾病负荷得分。在一些实施方案中，使用不同的颜色来表示每种遗传变体。在一些实施方案中，仅绘制检测到的遗传变体的子集。在一些实施方案中，基于成为驱动改变的可能性或与增加或减少的治疗响应的关联来选择子集。

在一些实施方案中，所述方法包括产生基因组测试的测试报告。在一些实施方案中，非线性比例用于表示每个所表示的遗传变体的高度或宽度。在一些实施方案中，在所述报告上描绘先前测试点的标绘图。在一些实施方案中，所述方法包括基于每个测试结果的变化率和/或定量准确度来估计疾病进展或缓解。在一些实施方案中，所述方法包括在干预测试点之间显示治疗干预。在一些实施方案中，显示包括：a)将表示所检测到的肿瘤遗传变体的数据接收到计算机存储器中；b)用计算机处理器执行代码以将每个遗传变体在时间点的所述定量贡献用图形表示为与所述相对贡献成比例的线或区域；以及c)在图形用户界面上显示所述图形表示。

附图说明

图1示出了确定和使用治疗干预的示例性方法的流程图。

图2示出了确定基于基因座处的CNV校正的样品中变体频率的示例性方法的流程图。

图3示出了提供可延缓抗药性的脉冲治疗循环的示例性方法的流程图。

图4示出了使用复制起点处的CNV检测来自分裂细胞的DNA以检测肿瘤负荷的示例性方法的流程图。

图5示出了示例性计算机系统。

图6示出了跨来自含有处于静息状态和处于细胞分裂状态下的细胞的样品的基因组区域，对CNV的示例性扫描。在基因座a和b中未观察到基因组CNV，但基因座c显示出基因重复。在静息状态细胞中，除了与基因重复的基因座重叠的那些区间之外，拷贝数在该区域的所有区间中基本相等。在含有来自正在经历细胞分裂的肿瘤细胞的DNA的样品中，拷贝数似乎在复制起点之后立即增加，从而在该区域提供了CNV的变化。在复制起点(c)处表现出CNV的基因座处偏差尤其显著。

图7示出了受试者中疾病的监测和治疗的示例性过程。

图8示出了在癌症中表现出遗传变异的70个基因的示例性小图。

图9A示出了用于传送癌症测试结果的示例性系统。

图9B示出了降低DNA序列读取中的错误率和偏差并为用户生成遗传报告的示例性过程。

图10A-10C示出了用于向用户报告遗传测试结果的示例性过程。

图10D-10I-2示出了来自示例性遗传测试报告的页面。

图10J-10P示出了各种示例性的修正流线图(streamgraph)。

图11A-11B示出了用于检测突变并向用户报告测试结果的示例性过程。

具体实施方式

本公开的方法可检测生物样品中的生物分子镶嵌(例如，遗传镶嵌)，诸如细胞或脱氧核糖核酸(DNA)的异质性基因组群体。遗传镶嵌可以在生物体水平上存在。例如，在发育早期出现的遗传变体可导致具有不同基因组的不同体细胞。个体可以是嵌合体，例如由两个合子融合产生。来自同种异体供体的器官移植可导致遗传镶嵌体，该遗传镶嵌体还可通过检查从移植器官释放入血液的多核苷酸来检测。病变细胞具有不同遗传变体的病变细胞异质性是遗传镶嵌的另一种形式。本文提供的方法可检测镶嵌，并且在疾病的情况下提供治疗干预。在某些实施方案中，本公开提供了通过使用循环多核苷酸进行生物分子镶嵌的全身谱分析的方法，该循环多核苷酸可衍生自或以其他方式来源于受试者身体的不同位置的细胞。

病变细胞如肿瘤可随时间推移而演化，导致具有新的遗传和表型特征的不同克隆亚群。这可以由细胞分裂时的自然突变引起，或可由靶向某些克隆亚群的治疗来驱动，从而允许克隆对治疗更有抗性而通过负选择增殖。携带不同基因型或表型特征的病变细胞亚群的存在在本文称为病变细胞异质性，或在癌症的情况下称为肿瘤异质性。

目前，根据癌症活检中发现的突变体形式来治疗癌症。例如，在相当少量乳腺癌细胞中发现Her2+可以指示乳腺癌，其可通过采用抗Her2+疗法进行治疗。作为另一个实例，可用KRAS反应性的疗法来治疗发现少量KRAS突变体的结直肠癌。

用于精细分析病变细胞(例如肿瘤)的工具允许检测病变细胞异质性。此外，来自位于全身的病变细胞的多核苷酸的分析允许对病变细胞异质性的全身谱分析。无细胞DNA或循环DNA的使用是特别有用的，因为血液中的多核苷酸不来源于在身体上定位的细胞。相反，它们包括来自全身的转移部位的细胞。例如，分析可显示乳腺癌细胞群体包含90％的Her2+和10％的Her2-。这可通过例如对样品中每种形式的DNA例如无细胞DNA(cfDNA)定量来确定，从而检测肿瘤中的异质性。

医疗保健提供者如医师可使用该信息来研发治疗干预。例如，具有异质肿瘤的受试者可如同他们具有两种肿瘤一样治疗，且治疗干预可治疗每种肿瘤。该治疗干预可包括例如包含对第一肿瘤类型有效的第一药物和对第二肿瘤类型有效的第二药物的联合疗法。可以反映检测到的突变体形式的相对量的量给予药物。例如，治疗所发现的较高相对量突变体形式的药物可比治疗较小相对量的突变体形式的药物以更大的剂量递送。或者，对于较小相对量的突变体的治疗可相对于较大量的突变体延迟或错开进行。

监测病变细胞异质性谱随时间推移的变化允许根据演化的肿瘤校准治疗干预。例如，分析可显示出携带抗药性突变体的多核苷酸的量增加。在该情况下，可修改治疗干预，以减少对治疗不携带抗药性突变体的肿瘤有效的药物量，并增加确实治疗携带抗药性标志物的肿瘤的药物的给药。

治疗干预可由医疗保健提供者或计算机算法或两者的组合来确定。数据库可包含针对具有各种病变细胞异质性谱的疾病的治疗干预的结果。在确定对于具有特定谱的疾病的治疗干预时，可参考该数据库。

本公开提供了确定用于具有表现出病变细胞异质性(例如，肿瘤异质性)的疾病如癌症的受试者的治疗干预的方法等。在一个实施方案中，该方法涉及分析来自患有该疾病的受试者的病变细胞(例如，空间上不同的病变细胞)的生物大分子(例如，对多核苷酸进行测序)。产生病变细胞异质性谱，该谱指示对于病变细胞特异的遗传变体的存在以及这些变体相对于彼此的量。该信息进而用于确定考虑到该谱的治疗干预。

病变细胞

本公开的方法的受试者是任何多细胞生物体。更具体地，该受试者可以是植物或动物、脊椎动物、哺乳动物、小鼠、灵长类动物、猿或人。动物包括但不限于家畜、运动动物和宠物。受试者可以是健康的个体，患有或疑似患有疾病或有患病倾向的个体，或需要治疗或疑似需要治疗的个体。受试者可以是患者，例如，处于专业医疗保健提供者照顾下的受试者。

受试者可具有病理状况(疾病)。表现出疾病病理学的细胞在本文称为病变细胞。

特别地，所述疾病可以是癌症。癌症是以分裂失去控制的异常细胞为特征的病况。癌症包括但不限于癌、肉瘤、白血病、淋巴瘤、骨髓瘤和中枢神经系统癌症。癌症更具体的实例是乳腺癌、前列腺癌、结直肠癌、脑癌、食管癌、头颈癌、膀胱癌、妇科癌症、脂肪肉瘤和多发性骨髓瘤。

其他癌症包括，例如，急性成淋巴细胞白血病(ALL)、急性髓样白血病(AML)、肾上腺皮质癌、卡波西肉瘤、肛门癌、基底细胞癌、胆管癌、膀胱癌、骨癌、骨肉瘤、恶性纤维组织细胞瘤、脑干胶质瘤、脑癌、颅咽管瘤、室管膜母细胞瘤、室管膜瘤、髓母细胞瘤、髓上皮瘤(medulloeptithelioma)、松果体实质瘤(pineal parenchymal tumor)、乳腺癌、支气管肿瘤、伯基特淋巴瘤、非霍奇金淋巴瘤、类癌瘤、宫颈癌、脊索瘤、慢性淋巴细胞白血病(CLL)、慢性髓性白血病(CML)、结肠癌、结直肠癌、皮肤T细胞淋巴瘤、原位导管癌、子宫内膜癌、食管癌、尤因肉瘤、眼癌、眼内黑素瘤、视网膜母细胞瘤、纤维组织细胞瘤、胆囊癌、胃癌、胶质瘤、毛细胞白血病、头颈癌、心脏癌、肝细胞(肝)癌、霍奇金淋巴瘤、下咽癌、肾癌、喉癌、唇癌、口腔癌、肺癌、非小细胞癌、小细胞癌、黑素瘤、口癌、骨髓增生异常综合征、多发性骨髓瘤、髓母细胞瘤、鼻腔癌、鼻窦癌、成神经细胞瘤、鼻咽癌、口癌、口咽癌、骨肉瘤、卵巢癌、胰腺癌、乳头瘤病、副神经节瘤、甲状旁腺癌、阴茎癌、咽癌、垂体瘤、浆细胞肿瘤、前列腺癌、直肠癌、肾细胞癌、横纹肌肉瘤、唾液腺癌、塞扎里综合征、皮肤癌、非黑素瘤、小肠癌、软组织肉瘤、鳞状细胞癌、睾丸癌、喉癌、胸腺瘤、甲状腺癌、尿道癌、子宫癌、子宫肉瘤、阴道癌、外阴癌、瓦尔登斯特伦巨球蛋白血症和/或维尔姆斯瘤。

肿瘤是癌细胞(癌病变细胞)的集合。这包括例如单个细胞团块(例如，实体瘤)中的细胞的集合、来自不同转移瘤部位的细胞的集合(转移瘤)以及弥漫性肿瘤(例如，循环肿瘤细胞)。肿瘤可包括单一癌症(例如，结直肠癌)或多种癌症(例如，结直肠癌和胰腺癌)的细胞。肿瘤可包括源自单个原始体细胞或源自不同体细胞的细胞。

在某些实施方案中，受试者中的病变细胞是空间上不同的。如果细胞在体内相距至少1cm、至少2cm、至少5cm或至少10cm，例如在不同的组织或器官内，或在相同的组织或器官内，则病变细胞是空间上不同的。在癌症的情况下，空间上不同的癌细胞的实例包括来自弥漫性癌症(诸如白血病)的癌细胞、位于不同转移部位的癌细胞以及相距至少1cm的来自同一肿瘤细胞团块的癌细胞。

病变细胞负荷(例如，“肿瘤负荷”)是受试者中病变细胞量的定量量度。病变细胞负荷的一个量度是样品中总生物大分子(其为疾病生物大分子)的分数，例如，无细胞多核苷酸样品中肿瘤多核苷酸的相对量。例如，如果来自第一个受试者的cfDNA具有10％的癌症多核苷酸，则该受试者可称为具有10％的无细胞肿瘤负荷。如果来自第二受试者的cfDNA具有5％的癌症多核苷酸，则第二受试者可称为具有第一受试者的无细胞肿瘤负荷的一半。因为尽管疾病负荷的水平不同，一个个体中的无细胞肿瘤负荷可能比另一个个体高或低很多，所以这些量度在受试者内的基础上比在受试者间的基础上更相关。然而，这些量度可非常有效地用于监测个体内的疾病负荷，例如，无细胞DNA肿瘤负荷从5％增加到15％可表明疾病的显著进展，而从10％降低到1％可表明对治疗的部分响应。

待测序的多核苷酸可来源于空间上不同的部位。这包括来自单个肿瘤块中不同位置的活检的多核苷酸。该多核苷酸还包括来源于位于不同转移瘤部位处的细胞的多核苷酸。细胞将多核苷酸释放入血液中，该多核苷酸在血液中可作为无细胞多核苷酸(例如，循环肿瘤DNA)被检测到。无细胞多核苷酸还可在其他体液如尿液中发现。因此，cfDNA比来源于单个肿瘤位置的DNA提供了跨整个病变细胞群体的更准确的肿瘤异质性谱。从身体中病变细胞群体的细胞取样的DNA被称为“疾病负荷DNA”，或在癌症的情况下称为“肿瘤负荷DNA”。

病变细胞如肿瘤可共享相同或相似的生物分子谱。例如，肿瘤可共享一种、两种、三种或多种遗传变体。这样的变体可共享相同的分层，例如最高频率、第二高频率等。谱还可共享相似的病变细胞负荷，例如cfDNA负荷，例如15％以内、10％以内、5％以内或2％以内。

分析物

如本文所用的，大分子是由单体亚单位形成的分子。形成生物大分子的单体亚单位包括例如核苷酸、氨基酸、单糖和脂肪酸。生物大分子包括例如生物聚合物和非聚合大分子。

多核苷酸是包含核苷酸聚合物的大分子。多核苷酸包括例如多脱氧核糖核苷酸(DNA)和多核糖核苷酸(RNA)。多肽是包含氨基酸聚合物的大分子。多糖是包含单糖聚合物的大分子。脂质是一组多样化的有机化合物，包括例如共享不与水有明显相互作用的功能特征的脂肪、油和激素。例如，甘油三酯是由三条脂肪酸链形成的脂肪。

癌症多核苷酸(例如，癌症DNA)是来源于癌细胞的多核苷酸(例如，DNA)。可从肿瘤、从分离的癌细胞或从生物流体(例如，唾液、血清、血液或尿液)以无细胞DNA(cfDNA)或无细胞RNA的形式提取癌症DNA和/或RNA。

无细胞DNA是体液中，例如血液或尿液中位于细胞外的DNA。循环核酸(CNA)是在血流中发现的核酸。血液中的无细胞DNA是循环核酸的一种形式。无细胞DNA被认为由濒死细胞将其DNA释放入血液中而产生。因为空间上不同的癌细胞将DNA释放入体液如血液中，所以癌症受试者的cfDNA通常包含来自空间上不同的癌细胞的癌症DNA。

生物样品

在本公开的方法中进行分析的分析物可来源于生物样品，例如包含生物大分子的样品。生物样品可来源于任何器官、组织或生物流体。生物样品可包括例如体液或固体组织样品。固体组织样品的实例是肿瘤样品，例如来自实体瘤活检。体液包括例如血液、血清、肿瘤细胞、唾液、尿液、淋巴液、前列腺液、精液、乳汁、痰、粪便和泪液。体液是来自空间上不同的病变细胞的生物大分子的特别好的来源，原因在于来自体内许多位置的这类细胞可将这些分子释放入体液中。例如，血液和尿液是无细胞多核苷酸的优质来源。与来源于局部疾病细胞团块的大分子相比，来自这类来源的大分子可提供更准确的病变细胞谱。

可增加体液样品中疾病多核苷酸的量。这样的增加可提高疾病多核苷酸的检测灵敏度。在一种方法中，将干预如治疗干预施加于受试者，该干预导致病变细胞裂解，将其DNA排空到周围流体中。这样的干预可包括施加化疗。该干预还可包括对受试者的全身或受试者身体的一部分(诸如引导至肿瘤或病变器官)施加辐射或超声。在施加干预后，并且当流体中疾病多核苷酸的量增加时，收集流体样品以供分析。施加干预与收集之间的间隔可长到足以使疾病多核苷酸增加，但不会长到使得它们从身体中被清除。例如，可在收集样品前约一周施加低剂量的化疗。

分析方法

本公开考虑到若干种类型的生物分子分析，包括例如基因组、外遗传(例如甲基化)、RNA表达和蛋白质组学分析。基因组分析可通过例如遗传分析仪进行，例如使用DNA测序。甲基化分析可通过例如甲基化碱基的转化及随后的DNA测序来进行。RNA表达分析可通过例如多核苷酸阵列杂交进行。蛋白质组学分析可通过例如质谱法进行。

如本文所用的，术语“遗传分析仪”是指包括用于生成DNA序列信息的DNA测序仪和包含执行针对DNA序列信息的生物信息学分析的软件的计算机的系统。生物信息学分析可包括但不限于组装序列数据、检测并定量样品中的遗传变体，包括种系变体(例如杂合性)和体细胞变体(例如癌细胞变体)。

分析方法可包括生成并捕获遗传信息。遗传信息可包括基因序列信息、倍性状态、一种或多种遗传变体的身份以及变体的定量量度。术语“定量量度”是指量的任何量度，包括绝对和相对量度。定量量度可以是例如数目(例如，计数)、百分比、频率、度或阈值量。

可通过本领域已知的任何方法分析多核苷酸。通常，DNA测序仪将采用新一代测序(例如，Illumina、454、Ion torrent、SOLiD)。可通过大规模平行测序进行序列分析，即，对至少100、1000、10,000、100,000、100万、1000万、1亿或10亿个中任何数目的多核苷酸分子进行同时(或快速接续)测序。测序方法可以包括但不限于：高通量测序、焦磷酸测序、合成测序、单分子测序、纳米孔测序、半导体测序、连接测序、杂交测序、RNA-Seq(Illumina)、数字基因表达(Digital Gene Expression)(Helicos)、新一代测序、单分子合成测序(SMSS)(Helicos)、大规模平行测序、克隆单分子阵列(Solexa)、鸟枪法测序、Maxam-Gilbert或Sanger测序、引物步移法，使用PacBio、SOLiD、Ion Torrent、Genius(GenapSys)或纳米孔(例如，Oxford Nanopore)平台的测序，和本领域中已知的任何其他测序方法。

DNA测序仪可应用基于DNA的化学修饰然后在特定碱基处切割的Gilbert测序方法，或可应用基于双脱氧核苷酸链终止的Sanger技术。Sanger法由于其效率高且放射性低而受到欢迎。DNA测序仪可使用不需要DNA扩增(聚合酶链反应-PCR)的技术，该技术可加快测序前的样品制备并减少错误。此外，从通过在互补链中添加核苷酸引起的反应实时收集测序数据。例如，DNA测序仪可利用被称为单分子实时(SMRT)的方法，其中由通过含有荧光染料的酶将核苷酸添加到互补链时发出的光(由相机捕获)产生测序数据。

基因组的测序可以是选择性的，例如针对感兴趣的基因组部分。例如，已知许多基因(和这些基因的突变体形式)与多种癌症相关。选定基因或基因部分的测序可满足所需分析的需要。可分离定位到作为感兴趣的对象的基因组中特定基因座的多核苷酸，以用于通过例如序列捕获或位点特异性扩增来测序。

核苷酸序列(例如，DNA序列)可以指原始序列读取值或经处理的序列读取值，诸如从原始序列读取值推断的独特的分子计数。

对从测序生成的序列读取值进行分析，包括例如鉴别遗传变体。这可包括鉴别序列变体并定量每个基因座处碱基判定的数目。定量可涉及例如对定位到特定遗传基因座的读取值数目进行计数。不同基因座处读取值的不同数目可指示拷贝数变异(CNV)。

当与非靶多核苷酸相比，样品中靶多核苷酸的数目较小时，降低噪声和畸变(distortion)的测序和生物信息学方法特别有用。当靶分子数目很小时，来自靶标的信号可能较弱。例如在无细胞DNA的情况下可能是这样，其中少数肿瘤多核苷酸可与来自健康细胞的较大数目的多核苷酸混在一起。分子追踪在这样的情况下可以是有用的。分子追踪涉及将序列读取值从测序方案追踪回衍生出读取值的原始样品中的分子(例如，扩增和/或测序之前)。某些方法涉及标记分子，使得由原始分子产生的多个序列读取值可被分组为来源于原始分子的序列家族。以这种方式，可滤掉代表噪声的碱基判定。这样的方法更详细地描述于例如WO 2013/142389(Schmitt等人)、US 2014/0227705(Vogelstein等人)和WO 2014/149134(Talasaz等人)中。上采样(Up-sampling)方法也可用于更准确地确定样品中分子的计数。在一些实施方案中，上采样方法涉及确定检测其两条链(Watson和Crick链)的单个DNA分子的定量量度；确定仅检测其一条DNA链的单个DNA分子的定量量度；从这些量度推断出其两条链都未检测的单个DNA分子的定量量度；以及使用这些量度来确定指示样品中单个双链DNA分子数目的定量量度。该方法更详细地描述于在2014年12月24日提交的PCT/US2014/072383中。

遗传变体

本发明的方法可用于检测遗传变体(也称为“基因改变”)。遗传变体是遗传基因座处的替代形式。在人类基因组中，约0.1％的核苷酸位置是多态性的，即以在群体的至少1％中出现的第二遗传形式存在。突变可将遗传变体引入种系中，并且还可引入病变细胞如癌症中。参考序列，如hg19或NCBI版本(Build)37或版本38，意在表示“野生型”或“正常”基因组。然而，鉴于它们具有单个序列，它们不鉴别也可被视为正常的常见多态性。

遗传变体包括序列变体、拷贝数变体和核苷酸修饰变体。序列变体是遗传核苷酸序列的变异。拷贝数变体是基因组部分的拷贝数与野生型的偏差。遗传变体包括，例如，单核苷酸变异(SNP)、插入、缺失、倒位、颠换、易位、基因融合、染色体融合、基因截短、拷贝数变异(例如，非整倍性、部分非整倍性、多倍性、基因扩增)、核酸化学修饰的异常变化、外遗传模式的异常变化和核酸甲基化的异常变化。

可通过将来自样品中多核苷酸的序列与参考(例如参考基因组序列)、索引或已知突变的数据库进行比较来检测遗传变体。在一个实施方案中，参考序列是可公开获得的参考序列，诸如人类基因组序列HG-19或NCBI版本37。在另一个实施方案中，参考序列是非公共数据库中的序列。在另一个实施方案中，参考序列是从来自生物体的测序多核苷酸推测或确定的生物体的种系序列。

体细胞突变或体细胞改变是在体细胞中出现的遗传变体。体细胞突变与出现于个体的种系细胞(即精子或卵子)或合子的基因组中的突变相区分。体细胞突变，例如在癌细胞中发现的那些突变，区别于出现癌症的受试者的种系基因组。它们还可通过将癌症基因组与种系基因组或与参考基因组进行比较来检测。还存在癌细胞中常见的已知遗传变体。人类癌症中的SNV数据库可在网站上找到：cancer.sanger.ac.uk/cancergenome/projects/cosmic/。

图8示出了已知在癌症中表现出点突变、扩增、融合和插入缺失的基因。

快速分裂细胞中的CNV偏差

在细胞周期的S期，细胞复制DNA。具有复制DNA的2N染色体的二倍体细胞可对应于约4X DNA含量，而不具有复制DNA的2N染色体的二倍体细胞可对应于约2X DNA含量。复制从复制起点开始。在哺乳动物中，复制起点以约15kb至300kb的间隔分隔。在该期期间，基因组的部分以多倍体形式存在。复制起点与聚合酶位置之间的那些区域被复制，而超出聚合酶位置(或刚好在复制起点之前)的区域在正在经历复制的链中仍为单拷贝数。当跨基因组扫描时，拷贝数显得不均匀或畸变，具有以多倍体形式存在的区域和以二倍体形式存在的区域。这样的扫描看上去有噪声。即使对于在静息状态下在基因组中不携带拷贝数变异的细胞也是如此。相比之下，G₀细胞中CNV的扫描显示了拷贝数在整个基因组中相对平滑或未畸变的谱。因为癌细胞快速分裂，所以无论基因组是否还在某些基因座处具有CNV，它们跨基因组的CNV谱都表现出畸变。

可利用这一事实从包含异质DNA(例如，疾病DNA和健康DNA的混合物，例如cfDNA)的样品来检测DNA中的肿瘤负荷。检测肿瘤负荷的一种方法涉及确定由于所检查的一个或多个基因座邻近多个复制起点而导致的拷贝数变异。包含复制起点的区域将在该基因座中具有非常接近4个拷贝的DNA(二倍体细胞中)，而远离复制起点的区域将具有更接近2个拷贝(二倍体细胞中)。在某些实施方案中，所检查的一个或多个基因座包含横跨整个染色体或横跨整个基因组的至少1kb、至少10kb、至少100kb、至少1mb、至少10mb、至少100mb。确定横跨该区域的复制起点CNV(ROCNV)的量度。这可以是例如拷贝数与集中趋势值的偏差量度。集中趋势值可以是例如平均值、中位数或众数。偏差量度可以是例如方差或标准差。该量度可与对照样品中跨相同区域的ROCNV的量度进行比较，该对照样品例如来自健康个体或处于静息状态的细胞。可通过将分析的一个或多个区域划分为不同长度的非重叠分区并在该分区中获取CNV的量度来确定ROCNV。CNV量度可由在测序后确定定位到那些区域的读取值或片段的数目而得到。分区可具有多种大小，以产生多种水平的分辨率，例如单碱基水平(碱基对碱基)、10个碱基、100个碱基、1kb、10kb或100kb。大于对照的偏差表明存在正在经历复制的DNA，这进而表明是恶性。偏差程度越大，来自样品中正在经历细胞分裂的细胞的DNA的量越大。

可使用多种方法来计算与基于复制起点的畸变不同的真实遗传拷贝数变异。例如，可利用位于受影响的CNV基因座处的杂合SNP位置通过计算距离50％的偏差或那些基因座处的等位基因不平衡来推断拷贝数变异。因为两个拷贝通常以相似的时间间隔复制，从而自归一化(尽管等位基因变化有可能改变两个等位基因变体之间的复制起点)，所以由复制起点邻近导致的畸变不应影响该不平衡。例如，可在约67％的读取值中检测到含有SNP的染色体区段的重复，而在约50％的读取值中将检测到由ROCNV导致的重复。在另一种方法中，将使用检测到的区段的密度或某个基因座处读取值的基于计数的技术用于计算相对拷贝数。这些技术通常受到泊松噪声和由于DNA样品制备而导致的系统性偏差以及测序偏差的限制。这些方法的组合也可获得更高的准确度。

可计算对于给定样品的ROCNV，并用其给出关于无细胞肿瘤负荷的值，尽管缺乏诸如SNV、基因特异性CNV、基因组重排、外遗传变体、杂合性缺失等传统体细胞变体的检测。ROCNV还可用于减去给定样品的畸变，以通过去除与复制起点邻近相关的变异而不是由于细胞中的真实拷贝数变化引起的变异来增加给定CNV检测/估算方法的灵敏度和/或特异性。相对于参照物具有已知拷贝数变化或无拷贝数变化的细胞系也可用作ROCNV的参考，用于估算其对给定样品的贡献。

在一个实施方案中，所述方法涉及确定来自一个或多个对照样品的一个或多个基因座处的DNA分子的拷贝的基线水平，每个样品均含有来自正在经历预定水平的细胞分裂的细胞的DNA，例如处于静息状态的细胞或快速分裂的肿瘤细胞。还确定测试样品中DNA分子的拷贝的量度。测试样品中的量度可来自划分为一个或多个分区的一个或多个基因座。在每种情况下，多个基因座各自包含复制起点。来自测试样品的拷贝的量度可以是跨所有分区的平均值或跨基因座的方差水平。将测试样品中拷贝数的集中趋势或变化的量度(例如，方差或标准偏差)与对照样品进行比较。在测试样品中比处于静息状态或缓慢分裂的细胞的对照中更大的量度表明测试样品中生成DNA的细胞比向对照样品提供DNA的细胞分裂得更快，例如是癌性的。类似地，测试样品与活跃分裂状态下的细胞对照之间相似的量度表明在测试样品中生成DNA的细胞以与快速分裂的细胞(例如是癌性的)相似的速率分裂。

病变细胞异质性

病变细胞异质性，例如肿瘤异质性，是具有不同遗传变体的病变细胞的出现。病变细胞异质性可通过检查从病变细胞分离的多核苷酸并检测其基因组的差异来确定。根据体细胞突变相对频率的差异，可从含有来自病变和健康细胞的多核苷酸的样品的多核苷酸检查来推断病变细胞异质性。例如，癌症的特征在于遗传水平上的变化，例如通过在不同的细胞克隆组中体细胞突变的积累。这些变化可促进癌细胞的无调节生长，或作为对各种治疗干预的反应性或非反应性的标志物。

肿瘤异质性是肿瘤的特征在于含有遗传变体的不同组合(例如，体细胞突变的不同组合)的癌细胞的状况。也就是说，肿瘤可具有含有不同基因改变或含有同一基因中不同改变的不同细胞。例如，第一细胞可包含BRAF的突变体形式，而第二细胞可包含BRAF和ERBB2二者的突变体形式。或者，第一癌细胞可包含单核苷酸多态性EGRF 55249063G>A，而第二细胞可包含单核苷酸多态性EGRF 55238874 T>A。(数字是指基因组参考序列中的核苷酸位置)

例如，原始肿瘤细胞可包含基因例如癌基因中的遗传变体。随着细胞继续分裂，携带原始突变的一些子代细胞可独立地在其他基因或相同基因的不同部分中产生遗传变体。在随后的分裂中，肿瘤细胞可积累更多遗传变体。

疾病异质性谱

本公开的方法允许定量和定性分析疾病镶嵌性，例如肿瘤异质性。在一个实施方案中，所述谱包含来自空间上不同的病变细胞的多核苷酸的信息。在一个实施方案中，所述谱是含有来自分布在全身的细胞的信息的全身谱。与肿瘤局部区域的取样相反，cfDNA中的多核苷酸的分析允许在肿瘤的整个位置范围上对DNA进行取样。特别地，它允许对弥漫性和转移性肿瘤的取样。这与通过肿瘤的局部取样仅检测肿瘤异质性存在的方法形成对比。所述谱可指示变体的确切核苷酸序列，或者可仅仅指示携带体细胞突变的基因。

在病变细胞异质性(如肿瘤细胞异质性)谱的一个实施方案中，所述谱鉴别遗传变异和每种变体的相对量。根据这些信息，可推断不同细胞亚群中变体的可能分布。例如，癌症可从携带体细胞突变X的细胞开始。作为克隆演化的结果，该细胞的一些子代可产生变体Y。其他子代可产生变体Z。在细胞水平上，分析后，肿瘤可以表征为50％X、35％XY和15％XZ。在DNA水平上(仅考虑来自肿瘤细胞的DNA)，所述谱可指示100％X、35％Y和15％Z。还可检测第一基因座处的CNV和第二基因座处的序列变体二者。

根据以不同频率发生的在不同基因座处的基因组变异的存在，可从癌症多核苷酸序列的分析检测肿瘤异质性。例如，在无细胞DNA(可能含有种系DNA以及癌症DNA)的样品中，可发现BRAF的序列变体以17％的频率发生，CDKN2A的序列变体以6％的频率发生，ERBB2的序列变体以3％的频率发生，并且ATM的序列变体以1％的频率发生。序列变体的这些不同频率指示了肿瘤异质性。类似地，表现出不同量的拷贝数变异的遗传序列也指示了肿瘤异质性。例如，样品的分析可显示出EGFR和CCNE1基因的不同扩增水平。这出表明了肿瘤异质性。

在无细胞DNA的情况下，体细胞突变的检测可通过将样品中的碱基判定与参考序列进行比较来进行，或在内部比较来进行，因为当较低频率的碱基判定与更常见的碱基判定相比时，推测是在种系序列中。在任一种情况下，在不同基因座处和以不同频率存在次优势形式(例如，小于总碱基判定的40％)指示病变细胞异质性。

无细胞DNA通常包含来自具有种系基因组序列的正常细胞的优势DNA，并且在疾病如癌症的情况下，包含来自癌细胞并具有癌症基因组序列的较小百分比的DNA。从cfDNA样品的多核苷酸产生的序列可与参考序列进行比较，以检测参考序列与cfDNA中的多核苷酸之间的差异。在任何基因座处，来自测试样品的所有或几乎所有多核苷酸可与参考序列中的核苷酸相同。或者，在样品中以接近100％的频率检测到的核苷酸可与参考序列中的核苷酸不同。这最有可能指示在该基因座处的正常多态性形式。如果与参考核苷酸相匹配的第一核苷酸以约50％检测到，并且与参考核苷酸不同的第二核苷酸以约50％检测到，这最可能指示正常的杂合性。杂合性可以以偏离50:50的等位基因比率存在，例如60:40，甚至70:30。然而，如果样品包含以低于(或高于)明确杂合子范围(例如，小于约45％、小于40％、小于30％、小于20％、小于10％或小于5％)的频率在噪声以上可检测到的核苷酸，则这可归因于在向cfDNA群体贡献DNA的一定百分比的细胞中存在体细胞突变。这些可来自病变细胞，例如癌细胞。(确切的百分比是肿瘤负荷的函数。)如果两个不同遗传基因座处的体细胞突变频率不同，例如在一个基因座处为16％，而在另一个基因座处为5％，则这指示病变细胞如癌细胞是异质的。

在DNA来自实体瘤的情况下(预计其主要包含肿瘤DNA)，还可通过与参考序列进行比较来检测体细胞突变。存在于100％肿瘤细胞中的体细胞突变的检测可能需要参考标准序列或关于已知突变体的信息。然而，在不同基因座处和以不同相对频率在多核苷酸库之间存在次优势序列指示肿瘤异质性。

所述谱可包含在基因中已知可对其采取措施的(actionable)遗传变体。了解这类变体可有助于选择治疗干预，原因在于治疗可靶向这样的变体。在癌症的情况下，许多可对其采取措施的遗传变体是已知的。病变细胞异质性中的CNV和SNV

通常，基因的拷贝数状态应该反映在样品中基因的遗传形式的频率中。例如，可以以与没有拷贝数变异的纯合性或杂合性一致的频率(例如，分别为约100％或约50％)检测到序列变体。这与种系多态性或突变相一致。可在基因座处以约67％(或者约33％)多核苷酸的频率检测到序列变体，并且还在以增加的拷贝数(通常为n＝2)测量的基因中检测到序列变体。这与种系中的基因复制相一致。例如，三体性将会以此方式呈现。然而，如果以与纯合性相一致的水平(例如，约100％)、但与拷贝数变异相一致的量检测到序列变体，这更可能反映已经经历基因扩增的病变细胞多核苷酸的存在。类似地，如果以与杂合性不一致的水平(例如，稍微偏离50％)、但与拷贝数变异相一致的量检测到序列变体，这也更可能反映病变细胞多核苷酸的存在；病变多核苷酸产生等位基因频率偏离50:50的一定水平的不平衡。

该观察可用来推断序列变体是更可能以种系水平存在还是由例如癌细胞中的体细胞突变导致。例如，如果在基因中还检测到拷贝数变异，则以与种系中的杂合性可能一致的水平检测到的该基因中的序列变体更可能是病变细胞中体细胞突变的产物。

另外，鉴于我们预期种系中的基因复制应具有与增加的遗传剂量(例如，对于基因座处的三体性为约67％)一致的变体，具有显著偏离该预期量的序列变体剂量的检测到的基因扩增表明，CNV的存在更可能是由于体细胞突变。

不同基因座处的体细胞突变可以以单个或多个拷贝数存在于同一病变细胞中的事实还可用来推断肿瘤异质性。更具体地，当两个基因以不同的频率检测到但其拷贝数相对等同时，可以推断出肿瘤异质性。或者，当两个序列变体之间的频率差异与这两个基因的拷贝数差异一致时，可以推断出肿瘤同质性。因此，如果EGFR变体以11％检测到而KRAS变体以5％检测到，并且在这些基因中没有检测到CNV，则频率的差异可能反映肿瘤异质性(例如，所有肿瘤细胞都携带EGFR突变体，并且一半的肿瘤细胞还携带KRAS突变体)。或者，如果携带突变体的EGFR基因以增加的拷贝数检测到，一种一贯的解释是肿瘤细胞的同源群体，每个细胞均在EGFR和KRAS基因中携带突变体，但在其中KRAS基因是重复的(duplicated)。因此，可确定序列变体的频率和样品中序列变体的基因座处CNV的量度。然后可通过基于从CNV量度确定的每个细胞的剂量对频率进行加权来校正频率以反映携带该变体的细胞的相对数目。该结果目前在携带变体的细胞数目方面与拷贝数不变的序列变体较为相当。

传送测试结果

来自遗传变体分析(例如，序列变体、CNV、病变细胞异质性及其组合)的结果的报告可由报告生成器提供，例如向医疗保健从业者如医师提供，以帮助解释测试结果(例如数据)并选择治疗选项。报告生成器生成的报告可提供附加信息，诸如临床实验室结果，该结果可用于诊断疾病和选择治疗选项。

现参见图9A，图示示出了具有用于报告例如癌症测试结果及其治疗选项的报告生成器1的系统。该报告生成器系统可以是被配置为通过通信链路与远程数据站点或实验室2、医学实践/医疗保健提供者(治疗专业人员)4和/或患者/受试者6直接建立通信的中央数据处理系统。实验室2可以是医学实验室、诊断实验室、医学设施、医学实践、照护点测试装置或能够生成受试者临床信息的任何其他远程数据站点。受试者临床信息包括但不限于实验室测试数据，例如遗传变体的分析；成像和X射线数据；检查结果；以及诊断。医疗保健提供者或实践6可包括医疗服务提供者，诸如医生、护士、家庭健康助手、技术人员和医师助理，并且该实践可以是配备有医疗保健提供者的任何医疗保健设施。在某些情况下，医疗保健提供者/实践还是远程数据站点。当要治疗的疾病是癌症时，受试者可患有癌症以及其他可能的疾病或病症。

癌症受试者6的其他临床信息可包括实验室测试的结果，例如遗传变体分析、代谢组、全血计数等；医学影像数据；和/或针对于诊断病况、提供预后、监测疾病进展、确定复发或缓解或其组合的医疗程序。癌症临床信息的适当来源列表包括但不限于CT扫描、MRI扫描、超声扫描、骨扫描、PET扫描、骨髓测试、钡餐X射线、内窥镜检查、淋巴管造影术、IVU(静脉尿道造影片)或IVP(IV肾盂造影片)、腰椎穿刺、膀胱镜检查、免疫学测试(抗毒曲菌素抗体筛选)和癌症标志物测试。

受试者6的临床信息可从实验室2手动或自动获得。在期望系统简单的情况下，可以预定或规律的时间间隔自动获取信息。规律的时间间隔可指通过本文所述的方法和系统基于诸如小时、天、周、月、年等的时间量度自动进行实验室数据收集的时间间隔。在一个实施方案中，数据的收集和处理至少每天进行一次。在一个实施方案中，数据的转移和收集以约每月一次、每两周一次、每周一次、每周若干次或每天一次中的任一种进行。或者，可以以预定的时间间隔进行信息检索，该间隔可以不是规律的时间间隔。例如，第一检索步骤可在一周后发生，而第二检索步骤可在一个月后发生。数据的转移和收集可根据正在管理的病症的性质和受试者所需的测试及医学检查的频率进行定制。

图9B示出了生成遗传报告的示例性过程，其包括肿瘤响应图和相关的改变汇总。肿瘤响应图是指示来自肿瘤的遗传信息随时间推移的变化(例如定性和定量变化)的遗传信息的图形表示。这样的变化可反映受试者对治疗干预的反应。该过程可以降低错误率和偏差，所述错误率和偏差可能比可靠地检测与癌症相关的从头遗传变体所需要的要高出几个数量级。该过程可包括首先通过收集作为遗传物质来源的体液样品(例如血液、唾液、汗液、尿液等)来捕获遗传信息。然后，该过程可以包括对物质进行测序(11)。例如，可对样品中的多核苷酸进行测序，产生多个序列读取值。包含多核苷酸的样品中的肿瘤负荷可估算为携带变体的序列读取值相对于从该样品生成的序列读取值的总数的相对数目。在分析拷贝数变体的情况下，肿瘤负荷可估算为在测试基因座和对照基因座处序列读取值的总数的相对过量(例如，在基因复制的情况下)或相对不足(例如，在基因消除的情况下)。例如，运行可产生定位到癌基因基因座的1000个读取值，其中900个对应于野生型，100个对应于癌突变体，指示该基因的拷贝数变体。关于示例性样本收集和遗传物质测序的更多细节下面在图10-11中讨论。

接下来，可处理遗传信息(12)。然后可鉴别遗传变体。该过程可包括确定含有遗传物质的样品中遗传变体的频率。如果该过程有噪声，则该过程可包括从噪声分离出信息(13)。

用于遗传分析的测序方法可具有错误率。例如，Illumina的mySeq系统可产生较低个位数的错误百分率。对于定位到基因座的1000个序列读取值，可预计约50个读取值(约5％)包含错误。某些方法如WO 2014/149134中描述的方法可显著降低错误率。错误产生可掩盖来自样品中以低水平存在的癌症的信号的噪声。例如，如果样品具有处于测序系统错误率左右的肿瘤负荷水平，例如约0.1％-5％，则可能难以区分对应于因癌症引起的遗传变体的信号与因噪声引起的信号。

遗传变体的分析可用于在噪声的存在下进行诊断。该分析可基于序列变体的频率或CNV的水平(14)，并且可建立用于检测噪声范围内的遗传变体的诊断置信度指示或水平(15)。

接下来，该过程可包括提高诊断置信度。这可使用多种测量进行以提高诊断的置信度(16)，或者使用多个时间点的测量来确定癌症是否在进展、缓解或稳定(17)。诊断置信度可用于鉴别疾病状态。例如，取自受试者的无细胞多核苷酸可包含来源于正常细胞的多核苷酸以及来源于病变细胞如癌细胞的多核苷酸。来自癌细胞的多核苷酸可携带遗传变体，诸如体细胞突变和拷贝数变体。当对来自受试者样品的无细胞多核苷酸进行测序时，将这些癌症多核苷酸检测为序列变体或拷贝数变体。

参数测量无论是否处于噪声范围内都可提供有置信区间。经过一段时间的测试，可通过随时间推移比较置信区间来确定癌症是否在进展、稳定或缓解。当置信区间重叠时，可能无法判断疾病在增加还是减少，原因是这些量度之间没有统计上显著的差异。然而，在置信区间不重叠的情况下，这指示了疾病的方向。例如，将一个时间点处置信区间上的最低点与第二时间点处置信区间上的最高点进行比较来指示该方向。

接下来，该过程可包括生成遗传报告/诊断。该过程可包括生成显示突变趋势的多次测量的遗传图(18)，以及生成显示治疗结果和选项的报告(19)。

图10A-10C更详细地示出了用于生成遗传报告和诊断(例如，报告/诊断)的一个实施方案。在一种实现方式中，图10C示出了由图9A的系统执行的示例性伪代码，以处理非CNV报告的突变等位基因频率。然而，该系统还可处理CNV报告的突变等位基因频率。

可在多个时间点，即连续地从受试者收集包含遗传物质如cfDNA的样品。可对遗传物质进行测序，例如使用高通量测序系统。例如，在癌症中，测序可靶向感兴趣的基因座以检测遗传变体、携带体细胞突变的基因、经历拷贝数变异的基因或参与基因融合的基因。在每个时间点，可确定发现的遗传变体的定量量度。例如，在cfDNA的情况下，定量量度可以是定位到基因座的多核苷酸之间遗传变体的频率或百分比，或定位到基因座的序列读取值或多核苷酸的绝对数目。随后，在至少一个时间点具有非零量的遗传变体可在所有时间点图示表示。例如，在1000个序列的集合中，可在时间点1、2和3处分别以50、30和0的量发现变体1。在这些时间点处，可以0、10和20的量发现变体2。对于变体1，这些量可被归一化为5％、3％和0％，而对于变体2可被归一化为0％、1％和2％。示出所有非零结果的并集的图形表示可在所有时间点处指示这两种变体的这些量。可缩放归一化的量，使得每个百分比由例如具有1mm高度的层表示。因此，例如，在该情况下，在时间点1处的高度将为：高度5mm(变体1)和0mm(变体2)；在时间点2处：高度3mm(变体1)和1mm(变体2)，在时间点3处：高度0mm(变体1)和2mm(变体2)。图形表示可为堆叠区域图的形式，例如流线图。“零”时间点(在第一个时间点之前)可由点表示，所有值均为0。图形表示中变体的量高度可以是例如相对于彼此的或彼此成比例的。例如，在一个时间点处5％的变体频率可用在相同时间点处具有2.5％频率的变体的两倍高度表示。可选择堆叠的顺序以便理解。例如，变体可按量从高到低的顺序从下向上堆叠。或者，它们可堆叠在中间具有最大初始量的变体的流线图中，并且在任一侧具有量渐减的其他变体。在某些实施方案中，该区域可基于变体进行颜色编码。相同基因中的变体可用相同颜色的不同色调显示。例如，KRAS突变体可用不同色调的蓝色显示，EGFR突变体可用不同色调的红色显示。

现在回到图10A，该过程可包括从DNA测序仪接收遗传信息(30)。该过程随后可包括确定特定的基因改变及其量(32)。

接下来，生成肿瘤响应图。为了生成该图，该过程可包括将对于每个基因改变的量进行归一化，以供在所有测试点上呈现，然后生成比例因子(34)。如本文所用的，术语“归一化”通常是指将在不同比例上所测量的值调整为在概念上共同的比例的手段。例如，转化/调整在不同点处测量的数据，以便可将所有值的大小都调整到共同比例。如本文所用的，术语“比例因子”通常是指对某一量进行缩放或相乘的数目。例如，在等式y＝Cx中，C是x的比例因子。C也是x的系数，并可称为y与x的比例常数。该值被归一化以允许在便于目测的共同比例上绘制。并且使用比例因子来了解与要绘制的值相对应的确切高度(例如，10％突变等位基因频率可在总高度为10cm的报告上表示1cm)。比例因子被应用于所有测试点，并因此被认为是通用比例因子。对于每个测试点，该过程可包括在肿瘤响应图上呈现信息(36)。在操作36中，该过程可包括使用所确定的比例因子呈现改变和相对高度(38)，并为每个改变分配独特的可视指示符(40)。除了响应图之外，该过程可包括生成改变和治疗选项的汇总(42)。此外，可将有助于特定遗传改变和其他有用治疗建议的临床试验信息，与术语解释、测试方法一起提供，并且将其他信息添加到报告中并呈现给用户。

在一种实现方式中，拷贝数变异可以报告为图表，指示基因组中的各个位置以及在各个相应位置处拷贝数变异的相应增加或减少或维持。另外，拷贝数变异可用于报告百分比得分，表明在无细胞多核苷酸样品中存在多少疾病材料(或具有拷贝数变异的核酸)。

在另一个实施方案中，所述报告包含注释，以帮助医师解释结果并推荐治疗选项。该注释可包括对于NCCN肿瘤学临床实践指南^TM(the NCCN Clinical Practice Guidelinesin Oncology^TM)或美国临床肿瘤学会(the American Society of Clinical Oncology)(ASCO)临床实践指南中的病况对报告进行注释。该注释可包括在报告中列出用于药物核准标示外使用的一种或多种FDA批准的药物、列于医疗保险和医疗补助服务中心(CMS)抗癌治疗目录中的一种或多种药物和/或科学文献中发现的一种或多种实验性药物。该注释可包括将列出的药物治疗选项与含有关于药物治疗选项的科学信息的参考文献联系起来。该科学信息可来自医学期刊的同行评审文章。该注释可包括在报告中提供关于药物治疗选项的临床试验信息的链接。该注释可包括在基于电子的报告中在提供的药物治疗选项附近的弹出框或悬浮框中展示信息。该注释可包括将信息添加到报告，该信息选自一种或多种药物治疗选项、关于一种或多种药物治疗选项的科学信息、关于一种或多种药物治疗选项的科学信息的一个或多个链接、关于一种或多种药物治疗选项的科学信息的引用的一个或多个链接以及关于一种或多种药物治疗选项的临床试验信息。

图10B示出了生成肿瘤响应图途径的示例性过程，该途径可由医疗保健从业者如医师用于例如进行患者医护决策。在该实施方案中，该过程可包括首先确定全局比例因子(43)。在一个实施方案中，对于所有非CNV(拷贝数变异)报告的突变等位基因频率，该过程可包括将绝对值变换为可更适合于绘制的相对度量/比例(例如，用突变等位基因频率乘以100以及取该值的对数)，并使用最大观测值确定全局比例因子。随后，该过程涉及使来自最早的测试数据集的信息可视化(44)。可视化可包括在用户界面(例如，计算机屏幕)上或以有形形式(例如，在一张纸上)图形表示信息。对于每种非CNV改变，该过程可以包括用比例因子乘以对于每个基因的变换值，并作为量指示符用于绘制该变体，之后为每种改变分配颜色/独特的可视指示符。然后，该过程可包括使用下列伪代码使后续测试点的信息可视化(45)：

如果测试结果的组成不变，则在新小图上继续先前的小图日期显示如果改变保持不变，但量已经变化

重新计算用于绘制该变体的量指示符，并针对最新测试日期在现有小图和新小图中重新绘制所有更新值。

如果添加新的改变

在所有现有改变的基础上添加所述改变

计算变换值

重新计算比例因子

重新画出响应图，重新绘制在当前测试日期仍然检测到的先前测试日期中的改变以及新出现的改变

如果先前存在的改变不在检测到的改变集之间

使用零高度，并绘制对于所有后续测试日期的改变的量

仍然包含颜色是不可用颜色的组集

指出测试日期的每个随后的小图还可包括可与该图的其余部分中看到的改变变化相关联的其他患者或干预信息。还可在CNV和其他类型的DNA改变(例如甲基化)上实现类似的缩放、绘制和变换，以在单独或组合的图表中展示这些量。这些附加注释本身也可以是可量化的，并且类似地绘制在图上。

所述过程随后可包括确定改变和治疗选项的汇总(46)。在一个实施方案中，对于具有最大突变等位基因频率的改变，进行下列行动：

以非CNV改变的突变等位基因频率的降序报告该基因的所有改变以CNV值的降序报告该基因的所有CNV改变

对于尚未报告的具有次高非CNV突变等位基因频率的下一个基因进行重复

对于每次报告的改变，该过程可包括在不同的测试日期点上包含该改变的趋势指示符。

最大突变等位基因频率的分组还可延伸到仅携带它们的基因之外，以包括更多注释，诸如生物学途径、证据水平等。

图10D-10I示出了由图9A的系统生成的示例性报告。在图10D中，患者鉴别部分52提供患者信息、报告日期和医师联系信息。肿瘤响应图54包含修正的流线图56，其对于每种突变基因用独特的颜色显示肿瘤活动。图56具有伴随的汇总解释文本框58。在改变和治疗选项的汇总部分60中提供了更多细节。改变62和64呈现在部分60中，伴随突变趋势、突变等位基因频率、无细胞扩增、FDA批准的药物适应症、FDA批准的具有其他适应症的药物以及临床药物试验信息。图10D-1、10D-2和10D-3提供了图10D的放大视图。

图10E示出了提供测试的定义、注释和解释的示例性报告部分。图10E-1和10E-2提供了图10E的放大视图。图10F示出了该报告的示例性详细治疗结果部分。图10F-1和10F-2提供了图10F的放大视图。图10G示出了检测到的改变的临床相关性的示例性讨论。图10G-1和10G-2提供了图10G的放大视图。图10H示出了正在经历临床试验的潜在可用药物。图10I示出了测试方法及其局限性。图10I-1和10I-2提供了图10I的放大视图。

图10J-10P示出了多种示例性的修正流线图56。流线图或流图是一种类型的堆叠区域图，它围绕中心轴位移，导致流动的有机形状。流线图是基线自由的堆叠区域图的概括。通过移动基线，可使单个系列中的斜率(或“摆动”)的变化最小化，从而使得更容易了解跨数据的任何给定层的厚度。

例如，图10J示出了在三个时间段以及“0”时间点(所有值为“0”)表示至少8个突变体的七个层。图10K示出了在4个时间段的单个突变体。在第二、第三和第四时间点未检测到突变体。图10L指示各时间点处显性等位基因的频率。图10M示出了在两个基因中共有四个突变体的单个时间点。根据在位置处改变的氨基酸(即EGFR T790M)鉴别突变体。

一个实施方案呈现流线图，使其不是x轴反映性的。该修正图应用独特的缩放比例来表示比例属性。该图可指示新属性随时间推移的添加。突变的存在或不存在可以以图形形式反映，指示基因组中的多个位置和在各个相应位置处的突变频率的相应增加或降低或维持。此外，突变可用于报告百分比得分，表明在无细胞多核苷酸样品中存在多少疾病材料。鉴于在非疾病参考序列中报告的位置处的典型变异的统计数据已知，置信得分可以伴随各个检测到的突变。突变还可以按照在受试者中的丰度的顺序排序或按照临床上可对其采取措施的重要性排序。

患有癌症的受试者的基因组位置和拷贝数变异的定位可指示特定的癌症是侵袭性的并且对治疗有抗性。该受试者可被监测一段时间并重新测试。如果在该期最后，例如如肿瘤响应图中所描绘的，拷贝数变异谱开始急剧升高，则这可指示当前的治疗不起作用。还可与其他受试者的遗传谱进行比较。例如，如果确定拷贝数变异的这种增加表明癌症正在进展，则所制定的原始治疗方案不再治疗该癌症，并且制定新的治疗。

这些报告可以经由因特网以电子方式提交和访问。序列数据的分析可在除受试者的位置之外的地点进行。可生成报告并将其发送到受试者的位置。通过支持因特网的计算机，受试者可访问反映其肿瘤负荷的报告。

接下来，公开了示例性基因测试过程的细节。现在转向图11A，示例性过程从血液样品或其他身体样品接收遗传物质(1102)。该方法可包括将来自遗传物质的多核苷酸转化为标记的亲代核苷酸(1104)。将标记的亲代核苷酸扩增以产生扩增的子代多核苷酸(1106)。对扩增的多核苷酸的子集进行测序以产生序列读取值(1108)，将该读取值分组为家族，每个家族由独特标记的亲代核苷酸产生(1110)。在选定的基因座处，该过程可包括为每个家族分配每个家族的置信度得分(1112)。接下来，使用先前的读取值确定一致性。通过回顾对于每个家族的先前置信度得分来确定一致性，并且如果存在一致的先前置信度得分，那么当前的置信度得分则增加(1114)。在一个实施方案中，如果存在先前的置信度得分，但它们不一致，则当前置信度得分不进行修改(1116)。在其他实施方案中，对于不一致的先前置信度得分，以预定方式调整置信度得分。如果这是第一次检测到该家族，则可减少当前的置信度得分，原因是它可能是错误的读取值(1118)。该过程可包括基于置信度得分来推断该组标记的亲代多核苷酸中在该基因座处的家族的频率。然后如上所述生成遗传测试报告(1120)。

虽然在图11A-11B中已经使用了时间信息来增强用于突变或拷贝数变异的信息的检测，但是可应用其他的一致方法。在其他实施方案中，历史比较可与定位到特定参考序列的其他共有序列一起使用以检测遗传变异的实例。可以测量定位至特定参考序列的共有序列并且相对于对照样品进行归一化。定位至参考序列的分子的量度可以在整个基因组上进行比较，以鉴别基因组中拷贝数变化或杂合性丢失的区域。一致方法包括，例如，由数字通信理论、信息论或生物信息学衍生的构建共有序列的线性或非线性方法(例如，选举、平均、统计、最大后验概率或最大似然检测、动态编程、贝叶斯、隐马尔可夫或支持向量机方法等)。在已经确定序列读取值覆盖度之后，使用随机建模算法将各个窗口区域的归一化的核酸序列读取值覆盖度转换成离散的拷贝数状态。在一些情况下，这种算法可包括下列中的一个或多个：隐马尔可夫模型、动态编程、支持向量机、贝叶斯网络、网格解码、维特比解码、期望最大化、卡尔曼过滤方法和神经网络。

如图11B所示，对于序列覆盖度与对照样品或参考序列的比较可有助于在整个窗口上的归一化。在该实施方案中，无细胞DNA从容易获得的体液如血液、汗液、唾液、尿等中提取和分离。例如，无细胞DNA可以使用本领域中已知的多种方法进行提取，包括但不限于异丙醇沉淀和/或基于二氧化硅的纯化。无细胞DNA可以从任何数目的受试者中提取，诸如未患有癌症的受试者、具有患癌风险的受试者或已知患有癌症的受试者(例如，通过其他手段)。

在分离/提取步骤后，可对无细胞多核苷酸样品进行许多不同测序操作中任何操作。样品在测序前可用一种或多种试剂(例如，酶、独特标识符(例如，条形码)、探针等)进行处理。在一些情况下，如果用独特标识符诸如条形码处理样品，则可用独特标识符单独地或成亚组地标记该样品或该样品的片段。标记的样品随后可用于下游应用，如测序反应，并可将单个分子追踪至亲本分子。

无细胞多核苷酸能够被标记或追踪以允许随后对特定多核苷酸的鉴别和起源确定。将标识符分配至多核苷酸的个体或亚组可以允许将独特的身份(identity)分配给单个序列或序列的片段。这可以允许从单个样品获取数据而不限于样品的平均值。在一些实例中，来源于单链的核酸或其他分子可以共享共同的标签或标识符并因此可以随后被鉴别为来源于该链。类似地，来自核酸的单链的所有片段可以用相同的标识符或标签来标记，由此允许随后鉴别来自亲本链的片段。在其他情况下，可以标记基因表达产物(例如，mRNA)以对表达进行定量。可以对条形码或对条形码与其所附接的序列的组合进行计数。在又另一些情况下，可以使用该系统和方法作为PCR扩增控制。在此类情况下，得自PCR反应的多个扩增产物可以用相同的标签或标识符进行标记。如果该产物随后被测序并证明有序列差异，则在具有相同标识符的产物之间的差异可归因于PCR错误。另外，可以基于读取值的序列数据自身的特征鉴别单个序列。例如，在单个测序读取值的开始(起始)和结束(终止)部分的独特序列数据的检测可以单独地使用，或与各个序列读取值的长度或碱基对数目相组合地使用，以便将独特的身份分配给单个分子。来自已经分配了独特身份的核酸单链的片段可以由此允许随后鉴别来自亲本链的片段。这可以与将初始起始遗传物质瓶颈化(bottlenecking)一起使用以限制多样性。

此外，使用在单个测序读取值的开始(起始)和结束(终止)部分的独特序列数据和测序读取值长度可以单独地使用或与条形码的使用相组合地使用。在一些情况下，条形码可以如本文所述是独特的。在另一些情况下，条形码自身可以不是独特的。在此情况下，非独特条形码与在单个测序读取值的开始(起始)和结束(终止)部分的序列数据以及测序读取值长度相组合的使用，可以允许将独特的身份分配给单个序列。类似地，来自已经分配了独特身份的核酸单链的片段可以由此允许随后鉴别来自亲本链的片段。

通常，本文提供的方法和系统对于准备无细胞多核苷酸序列以用于下游应用测序反应是有用的。通常，测序方法是经典的Sanger测序。测序方法可以包括但不限于：高通量测序、焦磷酸测序、合成测序、单分子测序、纳米孔测序、半导体测序、连接测序、杂交测序、RNA-Seq(Illumina)、数字基因表达(Digital Gene Expression)(Helicos)、新一代测序、单分子合成测序(Single Molecule Sequencing by Synthesis)(SMSS)(Helicos)、大规模平行测序、克隆单分子阵列(Clonal Single Molecule Array)(Solexa)、鸟枪法测序、Maxim-Gilbert测序、引物步移法和本领域中已知的任何其他测序方法。

测序方法通常包括样品制备，对所制成样品中的多核苷酸进行测序以产生序列读取值，以及对序列读取值进行生物信息学操作以产生关于样品的定量和/或定性的遗传信息。样品制备一般包括将样品中的多核苷酸转换成与所用测序平台兼容的形式。这种转换可以涉及标记多核苷酸。在本发明的某些实施方案中，标签包括多核苷酸序列标签。在测序中使用的转换方法可能不是100％有效的。例如，以约1-5％的转换效率来转换样品中的多核苷酸并不少见，也就是说，样品中的约1-5％的多核苷酸被转换成标记的多核苷酸。未转换成标记的分子的多核苷酸没有在用于测序的标记的文库中呈现。因此，具有在初始遗传物质中以低频率呈现的遗传变体的多核苷酸可能未在标记的文库中呈现，因此可能不被测序或检测。通过提高转换效率，在初始遗传物质中的多核苷酸将在标记的文库中呈现且因此通过测序检测出来的概率得到增加。此外，并非直接解决文库制备的转换效率低的问题，迄今为止的大多数方案要求大于1微克的DNA作为输入材料。然而，当输入样品材料受到限制或需要检测低呈现度的多核苷酸时，高转换效率可以有效地对样品进行测序和/或充分地检测此类多核苷酸。

通常，突变检测可以在纯化和分离的基因组或转录组的选择性富集的区域上进行(1302)。如本文所述，可从无细胞多核苷酸的总群体中选择性地扩增特定区域，该特定区域可以包括但不限于：基因、癌基因、肿瘤抑制基因、启动子、调节序列元件、非编码区、miRNA、snRNA等。这可如本文所述来进行。在一个实例中，在使用或不使用针对单个多核苷酸序列的条形码标记物下，可以使用多重测序。在其他实例中，可以使用本领域中已知的任何核酸测序平台进行测序。这一步骤生成多个基因组片段序列读取值(1304)。另外，从取自另一个受试者的对照样品获得参考序列。在一些情况下，对照受试者可以是已知不具有已知遗传异常或疾病的受试者。在一些情况下，这些序列读取值可包含条形码信息。在其他实例中，不采用条形码。

测序后，可对读取值分配质量得分。质量得分可以是读取值的表示，其表明这些读取值是否可基于阈值而用于随后的分析。在一些情况下，一些读取值不具有足够的质量或长度来执行后续的定位步骤。具有至少90％、95％、99％、99.9％、99.99％或99.999％的质量得分的测序读取值可以从数据集中过滤出来。在其他情况下，分配有至少90％、95％、99％、99.9％、99.99％或99.999％的质量得分的测序读取值可以从数据集中过滤出来。在步骤1306中，将满足规定的质量得分阈值的基因组片段读取值定位至已知不包含突变的参考基因组或者参考序列。定位对准后，对序列读取值分配定位得分。定位得分可以是定位回参考序列的表示或读取值，表明各个位置是否是或不是独特地可定位的。在一些实例中，读取值可以是与突变分析无关的序列。例如，一些序列读取值可以来源于污染物多核苷酸。具有至少90％、95％、99％、99.9％、99.99％或99.999％的定位得分的测序读取值可以从数据集中过滤出来。在其他情况下，分配有小于90％、95％、99％、99.9％、99.99％或99.999％的定位得分的测序读取值可以从数据集中过滤出来。

对于各个可定位的碱基，未满足可定位性的最小阈值的碱基或低质量碱基可以被替换为如在参考序列中发现的相应碱基。

在确定读取值覆盖度并鉴别了在各个读取值中相对于对照序列的变异碱基后，可以通过将含有变体的读取值的数目除以读取值的总数1308来计算变异碱基的频率。这可以表示为在基因组中的各个可定位位置的比值。

对于各个碱基位置，所有四种核苷酸即胞嘧啶、鸟嘌呤、胸腺嘧啶、腺嘌呤的频率可在与参考序列的比较下进行分析。可使用随机或统计建模算法转换各个可定位位置的归一化比值，以反映各个碱基变体的频率状态。在一些情况下，该算法可包括下列中的一个或多个：隐马尔可夫模型、动态编程、支持向量机、贝叶斯或概率建模、网格解码、维特比解码、期望最大化、卡尔曼过滤方法和神经网络。

可以采用各个碱基位置的离散突变状态来鉴别与参考序列的基线相比具有高变异频率的碱基变体。在一些情况下，基线可能表示至少0.0001％、0.001％、0.01％、0.1％、1.0％、2.0％、3.0％、4.0％、5.0％、10％或25％的频率。在其他情况下，基线可能表示至少0.0001％、0.001％、0.01％、0.1％、1.0％、2.0％、3.0％、4.0％、5.0％、10％或25％的频率。在一些情况下，具有碱基变体或突变的所有相邻碱基位置可合并成一个区段，以报告突变的存在或不存在。在一些情况下，各个位置可以在它们与其他区段合并前被过滤。

在计算各个碱基位置的变异频率后，来源于受试者的序列中的特定位置与参考序列相比具有最大偏倚的变体可被鉴别为突变。在一些情况下，突变可以是癌症突变。在另一些情况下，突变可能与疾病状态相关。

突变或变体可包含遗传异常，该遗传异常包括但不限于：单碱基置换或小插入缺失、颠换、易位、倒位、缺失、截短或基因截短。在一些情况下，突变可以是至多1、2、3、4、5、6、7、8、9、10、15或20个核苷酸的长度。在其他情况下，突变可以是至少1、2、3、4、5、6、7、8、9、10、15或20个核苷酸的长度。

接下来，使用先前的读取值确定一致性。通过回顾对于相应碱基的先前置信度得分来确定一致性，并且如果存在一致的先前置信度得分，那么当前的置信度得分则增加(1314)。在一个实施方案中，如果存在先前的置信度得分，但它们不一致，则当前置信度得分不进行修改(1316)。在其他实施方案中，对于不一致的先前置信度得分，以预定方式调整置信度得分。如果这是第一次检测到该家族，则可减少当前的置信度得分，原因是它可能是错误的读取值(1318)。该过程可包括随后将每个碱基的变异频率转化为每个碱基位置的不连续变体状态(1320)。

使用本文所述的方法和系统可检测多种癌症。癌细胞，如大部分细胞一样，其特征可以是更新率，其中旧细胞死亡并被较新的细胞所取代。通常，与给定受试者中的脉管系统相接触的死细胞可将DNA或DNA片段释放至血流中。在疾病不同阶段中的癌细胞也是如此。根据疾病的阶段，癌细胞的特征还可以是各种遗传异常，如拷贝数变异以及突变。这种现象可以用于使用本文所述的方法和系统检测癌症个体的存在或不存在。

例如，可以从具有患癌风险的受试者抽取血液并如本文所述制备以产生无细胞多核苷酸群体。在一个实例中，这可以是无细胞的DNA。本发明的系统和方法可用于检测可存在于某些现有癌症中的突变或拷贝数变异。该方法可以帮助检测体内癌细胞的存在，即使不存在疾病的症状或其他标志。

可检测到的癌症的类型和数目可包括但不限于：血癌、脑癌、肺癌、皮肤癌、鼻癌、喉癌、肝癌、骨癌、淋巴瘤、胰腺癌、皮肤癌、肠癌、直肠癌、甲状腺癌、膀胱癌、肾癌、口腔癌、胃癌、实体肿瘤、异质肿瘤、均质肿瘤等。

所述系统和方法可用于检测任何数目的可能导致或起因于癌症的遗传异常。这些可包括但不限于：突变、突变、插入缺失、拷贝数变异、颠换、易位、倒位、缺失、非整倍性、部分非整倍性、多倍性、染色体不稳定性、染色体结构改变、基因融合、染色体融合、基因截短、基因扩增、基因复制、染色体损伤、DNA损伤、核酸化学修饰的异常变化、外遗传模式的异常变化、核酸甲基化的异常变化、感染和癌症。

此外，本文所述的系统和方法还可以用于帮助表征某些癌症。从本发明的系统和方法产生的遗传数据可以帮助执业医生更好地表征癌症的具体形式。很多时候，癌症在组成和分期上是异质的。遗传谱数据可以允许表征癌症的具体亚型，该表征在该具体亚型的诊断或治疗中可能是重要的。此信息还可以向受试者或执业医生提供关于癌症具体类型的预后的线索。

本文提供的系统和方法可用于监测特定受试者中已知的癌症或其他疾病。这可以允许受试者或执业医生根据疾病的进展调整治疗选项。在该实例中，本文所述的系统和方法可用于构建疾病进程中特定受试者的遗传谱。在一些情况下，癌症可以进展，成为更具侵袭性和遗传学上不稳定性。在其他实例中，癌症可以保持为良性的、非活动的或休眠的。本发明的系统和方法可用于确定疾病进展。

此外，本文所述的系统和方法可用于确定特定治疗选项的功效。在一个实例中，如果治疗成功，则成功的治疗选项可实际上增加在受试者血液中检测到的拷贝数变异或突变的量，因为癌可能死亡并释放DNA。在其他实例中，这可能不会发生。在另一个实例中，也许某些治疗选项可能与癌症随时间推移的遗传谱相关联。这种相关性可用于选择疗法。此外，如果观察到癌症在治疗后缓解，则本文所述的系统和方法可用于监测残留疾病或疾病的复发。

本文所述的方法和系统可以不限于仅与癌症相关的突变和拷贝数变异的检测。各种其他疾病和感染可导致其他类型的可适合早期检测和监测的状况。例如，在某些情况下，遗传性病症或传染性疾病可在受试者中导致某些遗传镶嵌。这种遗传镶嵌可导致可观察到的拷贝数变异和突变。在另一实例中，本发明的系统和方法也可用于监测体内免疫细胞的基因组。免疫细胞，如B细胞，当存在某些疾病时可经历快速克隆扩增。使用拷贝数变异检测可监测克隆扩增并可监测某些免疫状态。在本实例中，拷贝数变异分析可随时间推移而进行，以产生特定疾病可能如何进展的谱。

此外，本发明的系统和方法还可以用于监测自身的系统性感染，其可以由病原体如细菌或病毒引起。拷贝数变异乃至突变的检测可用于确定病原体群体在感染过程中是如何变化的。这在慢性感染如HIV/AIDS或肝炎感染中可能特别重要，由此病毒可在感染过程中改变生命周期状态和/或突变成毒力更强的形式。

可以使用本发明的系统和方法的又一个实例是移植受试者的监测。通常，移植组织在移植后经历一定程度的身体排斥。当免疫细胞试图破坏移植组织时，本发明的方法可以用于确定或分析宿主体的排斥活动。这可用于监测移植组织的状态以及改变排斥的治疗或预防过程。

此外，本发明的方法可用于表征受试者的异常状况的异质性，所述方法包括产生受试者中的细胞外多核苷酸的遗传谱，其中该遗传谱包含由拷贝数变异和突变分析得到的多个数据。在一些情况下，包括但不限于癌症，疾病可以是异质的。疾病细胞可能不相同。在癌症的实例中，一些肿瘤已知包含不同类型的肿瘤细胞、在癌症不同阶段的一些细胞。在其他实例中，异质性可以包括疾病的多个病灶。再次，在癌症的实例中，可存在多个肿瘤病灶，或许其中一个或多个病灶是已从原发部位扩散的转移的结果。

本发明的方法可用于生成或分析数据指纹或数据集，该数据指纹或数据集是由异质性疾病中的不同细胞得到的遗传信息的总和。这种数据集可包含单独的或组合的拷贝数变异和突变分析。

此外，本发明的系统和方法可用于诊断、预后、监测或观察胎儿来源的癌症或其他疾病。也就是说，这些方法可用于妊娠的受试者，以诊断、预后、监测或观察未出生受试者的癌症或其他疾病，未出生受试者的DNA和其他多核苷酸可与母体分子共循环。

此外，这些报告经由因特网以电子方式进行提交和访问。在除受试者的位置外的地点进行序列数据的分析。生成报告并发送到受试者的位置。通过支持因特网的计算机，受试者访问反映其肿瘤负荷的报告。

医疗保健提供者可使用注释的信息来选择其他药物治疗选项并且/或者向保险公司提供关于药物治疗选项的信息。所述方法可包括对于例如NCCN肿瘤学临床实践指南^TM(the NCCN Clinical Practice Guidelines in Oncology^TM)或美国临床肿瘤学会(theAmerican Society of Clinical Oncology)(ASCO)临床实践指南中的病况注释药物治疗选项。

在报告中分层的药物治疗选项可通过列出附加的药物治疗选项在报告中进行注释。附加的药物治疗可以是用于药物核准标示外使用的FDA批准的药物。1993年统括预算调整法(Omnibus Budget Reconciliation Act)(OBRA)中的规定要求Medicare覆盖标准医学目录中包含的抗癌药物的药物核准标示外使用。用于注释列表的药物可在CMS批准的目录中找到，包括美国国家综合癌症网络(National Comprehensive Cancer Network，NCCN)药物和Biologics Compendium^TM、Thomson Micromedex

Elsevier GoldStandard的临床药理学目录和美国医院处方药服务机构-

(AmericanHospital Formulary Service—Drug Information

)。

药物治疗选项可通过列出可用于治疗具有特定状态的一种或多种分子标志物的癌症的实验药物进行注释。该实验药物可以是可获得体外数据、体内数据、动物模型数据、临床前试验数据或临床试验数据的药物。该数据可发表于在CMS医疗保险福利政策手册(CMS Medicare Benefit Policy Manual)中列出的期刊中发现的同行评审的医学文献中，该期刊包括例如American Journal of Medicine、Annals of Internal Medicine、Annalsof Oncology、Annals of Surgical Oncology、Biology of Blood and MarrowTransplantation、Blood、Bone Marrow Transplantation、British Journal of Cancer、British Journal of Hematology、British Medical Journal、Cancer、Clinical CancerResearch、Drugs、European Journal of Cancer(原名European Journal of Cancer andClinical Oncology)、Gynecologic Oncology、International Journal of Radiation,Oncology,Biology,and Physics、The Journal of the American Medical Association、Journal of Clinical Oncology、Journal of the National Cancer Institute、Journalof the National Comprehensive Cancer Network(NCCN)、Journal of Urology、Lancet、Lancet Oncology、Leukemia、The New England Journal of Medicine和RadiationOncology。

药物治疗选项可通过提供将列出的药物与关于该药物的科学信息相连接的基于电子的报告的链接进行注释。例如，可提供关于药物的临床试验的信息的链接(clinicaltrials.gov)。如果通过计算机或计算机网站提供报告，则该链接可以是脚注、到网站的超链接、弹出框或具有信息的悬浮框等。该报告和注释信息可提供于印刷表格上，并且该注释可以是例如对参考文献的脚注。

报告中用于注释一种或多种药物治疗选项的信息可由存储科学信息的商业实体提供。医疗保健提供者可用注释信息中列出的实验药物来治疗受试者如癌症患者，并且医疗保健提供者可访问注释的药物治疗选项、检索科学信息(例如，打印医学期刊文章)以及将其(例如，打印的期刊文章)连同用于提供药物治疗的报销请求一起向保险公司提交。医师可使用多种诊断相关组(DRG)代码中的任一种来实现报销。

报告中的药物治疗选项还可注释有关于药物影响的途径中其他分子组分的信息(例如，关于靶向作为药物靶标的细胞表面受体的下游激酶的药物的信息)。该药物治疗选项可注释有关于靶向一种或多种其他分子途径组分的药物的信息。与途径相关的信息的鉴别和/或注释可外包或分包给另一家公司。

注释的信息可以是，例如，药物名称(例如，用于药物核准标示外使用的FDA批准的药物、在CMS批准的目录中找到的药物和/或科学(医学)期刊文章中描述的药物)、关于一种或多种药物治疗选项的科学信息、关于一种或多种药物的科学信息的一个或多个链接、关于一种或多种药物的临床试验信息(例如，来自clinicaltrials.gov/的信息)、对关于药物的科学信息的引用的一个或多个链接等。

注释的信息可插入报告中的任何位置。注释的信息可插入报告上的多个位置。注释的信息可插入报告中分层药物治疗选项部分附近。注释的信息可插入报告中分层药物治疗选项之外的单独页面。不含分层药物治疗选项的报告可用信息进行注释。

所述系统还可包含关于药物对从受试者(例如，癌症患者)分离的样品(例如，肿瘤细胞)的作用的报告。可使用本领域技术人员已知的技术建立使用来自癌症患者的肿瘤的体外培养。该系统还可包括使用所述体外培养和/或异种移植模型对FDA批准的药物核准标示外使用的药物或实验药物的高通量筛选。该系统还可包括监测肿瘤抗原以供复发检测。

该系统可提供对患有癌症的受试者的报告的支持因特网的访问。该系统可使用手持式DNA测序仪或台式DNA测序仪。DNA测序仪是用于使DNA测序过程自动化的科学仪器。对于DNA样品，使用DNA测序仪确定四种碱基的顺序：腺嘌呤、鸟嘌呤、胞嘧啶和胸腺嘧啶。DNA碱基的顺序被报告为文本字符串，称为读取值。一些DNA测序仪也可被认为是光学仪器，原因是它们分析来源于附接于核苷酸的荧光染料的光信号。

数据由DNA测序仪通过直接连接或通过因特网发送到计算机进行处理。所述系统的数据处理方面可在数字电子电路中，或在计算机硬件、固件、软件或它们的组合中实现。本发明的数据处理装置可在机器可读存储设备中有形地体现的计算机程序产品中实现，以供由可编程处理器执行；并且本发明的数据处理方法步骤可由执行指令程序的可编程处理器进行，以通过操作输入数据并生成输出来行使本发明的功能。本发明的数据处理方面可在可编程系统上执行的一个或多个计算机程序中有利地实现，该可编程系统包含被耦合以从数据存储系统接收数据和指令并将数据和指令传输到数据存储系统的至少一个可编程处理器、至少一个输入设备和至少一个输出设备。如果需要的话，每个计算机程序可用高级程序性或面向对象的编程语言，或以汇编形式或机器语言来实现；并且在任何情况下，该语言可以是编译或解释语言。合适的处理器包括例如通用的和专用的微处理器。通常，处理器将会从只读存储器和/或随机存取存储器接收指令和数据。适用于有形地体现计算机程序指令和数据的存储设备包括所有形式的非易失性存储器，包括例如半导体存储设备，诸如EPROM、EEPROM和闪速存储器设备；磁盘，诸如内置硬盘和可移动磁盘；磁光盘；以及CD-ROM盘。上述任何存储设备都可补充有ASIC(专用集成电路)或并入ASIC中。

为了提供与用户的交互，本发明可使用具有用于向用户展示信息的显示设备如监视器或LCD(液晶显示器)屏幕以及可使用户向计算机系统提供输入的输入设备(诸如键盘、二维定位设备如鼠标或轨迹球、或三维定位设备如数据手套或陀螺仪鼠标)的计算机系统来实现。该计算机系统可被编程以提供图形用户界面，计算机程序通过该界面与用户交互。该计算机系统可被编程以提供虚拟现实的三维显示界面。

治疗干预

本公开的方法允许提供更准确地针对受试者中疾病形式的治疗干预，并随时间推移校准这些治疗干预。该准确度部分地反映了能够如肿瘤异质性中所反映的来对受试者全身肿瘤状态进行谱分析的准确度。因此，治疗干预对于具有该谱的癌症比对于具有这些变体中的任一种的癌症更有效。

治疗干预是产生治疗效果的干预(例如，是治疗上有效的)。治疗上有效的干预预防疾病、减缓疾病进展、改善疾病状况(例如，导致疾病缓解)或治愈疾病，该疾病例如是癌症。治疗干预可包括例如施加治疗，例如化疗、放疗、外科手术、免疫疗法、施用药物或营养品，或者改变行为，诸如饮食。治疗有效性的一个量度是在经历该干预的超过至少100名受试者中对至少90％的受试者的有效性。

癌症的药物靶标和对这些靶标有效的药物描述于表1和表2中(取自Bailey等人,Discovery Medicine,v.18#92,2/7/14)。

在一个实施方案中，基于疾病异质性谱，考虑到在病变细胞中发现的遗传变体的类型及其相对量(例如比例)来确定治疗干预。该治疗干预可如同每个克隆变体都是将要独立治疗的不同癌症一样治疗受试者。在一些情况下，当以小于亚临床量检测到一种或多种遗传变体时，例如，比检测到的优势克隆低至少5倍、低至少10倍或低至少100倍时，这些变体可排除在治疗干预之外，直到它们上升到临床阈值或显著的相对频率(例如，大于上述阈值)。

当以不同量如不同数目或不同相对量发现多种不同的遗传变体时，治疗干预可包括对具有每种遗传变体的疾病有效的治疗。例如，在癌症的情况下，可在若干个基因(例如，主要克隆和次要克隆)中检测到遗传变体，诸如基因或基因扩增的突变体形式。这些形式的每一种都可以是可对其采取措施的，也就是说，具有特定变体的癌症对其具有响应性的治疗可以是已知的。然而，肿瘤异质性谱可指示其中一种变体在多核苷酸中以例如其他两种变体中每一种的5倍水平存在。可确定涉及向受试者递送三种不同的药物的治疗干预，每种药物对于携带每种变体的癌症相对更有效。这些药物可作为混合物(cocktail)或顺序地递送。

在又一个实施方案中，药物可以以分层的剂量施用以反映DNA中变体的相对量。例如，对于最常见的变体有效的药物可比对于两种较不常见的变体有效的药物以更大的量施用。

或者，肿瘤异质性谱可显示携带对疾病通常对其反应的药物具有抗性的遗传变体的癌细胞亚群的存在。在该情况下，治疗干预可涉及包含对不具有抗性变体的肿瘤细胞有效的第一药物，以及对具有抗性变体的肿瘤细胞有效的第二药物。同样，可对剂量进行分层以反映在谱中检测到的每种变体的相对量。

在另一个实施方案中，随时间推移检查肿瘤异质性谱的变化，并发展治疗干预以治疗不断变化的肿瘤。例如，可在多个不同时间确定疾病异质性。使用本公开的谱分析方法，可作出关于肿瘤演化的更准确的推断。这允许从业者监测疾病的演化，特别是在通过第一波治疗实现缓解后新克隆亚群出现时。在该情况下，可随时间推移校准治疗干预，以治疗不断变化的肿瘤。例如，谱可显示癌症具有响应于某种治疗的形式。递送该治疗，并且观察到肿瘤负荷随时间推移而下降。在某些时刻，在肿瘤中发现遗传变体，表明存在对治疗不响应的癌细胞群体。确定靶向携带非响应性标志物的细胞的新治疗干预。

响应于化疗，主要的肿瘤形式可以最终通过达尔文选择改变为携带使癌症对治疗方案不响应的突变体的癌细胞。可以通过本发明的方法延缓这些抗性突变体的出现。在该方法的一个实施方案中，使受试者经历一个或多个脉冲治疗循环，每个脉冲治疗循环包含期间以第一量施用药物的第一阶段以及期间以减少的第二量施用药物的第二循环。第一阶段的特征在于检测到的肿瘤负荷高于第一临床水平。第二阶段的特征在于检测到的肿瘤负荷低于第二临床水平。在不同的脉冲治疗循环中，第一和第二临床水平可以是不同的。因此，例如，第一临床水平可以在随后的循环中较低。多个循环可包括至少2、3、4、5、6、7、8个或更多个循环。例如，BRAF突变体V600E可以在病变细胞的多核苷酸中以指示cfDNA中肿瘤负荷为5％的量检测到。化疗可以从达拉非尼(dabrafenib)开始。后续测试可以显示，cfDNA中BRAF突变体的量降低至低于0.5％或检测不到的水平。此时，可以停止或显著缩减达拉非尼治疗。进一步的后续测试可以发现，具有BRAF突变的DNA已上升至cfDNA中的多核苷酸的2.5％。此时，以例如与初始治疗相同的水平重新开始达拉非尼治疗。后续测试可以发现，具有BRAF突变的DNA已减少至cfDNA中的多核苷酸的0.5％。再次停止或减少达拉非尼治疗。可以多次重复该循环。

图7示出了受试者中疾病的监测和治疗的示例性过程。在抽血1时测试的受试者具有1.4％的肿瘤负荷并且呈现出在基因1、2和3中的遗传改变。用药物A治疗受试者。一段时间后，停止治疗。在稍后的第二时间，第二次抽血显示癌症缓解。在稍后的第三时间，第三次抽血表明癌症已经复发，在该情况下，呈现出在基因4中的遗传变体。该受试者目前正在进行药物B的疗程，具有该变体的癌症对药物B是响应性的。

在另一个实施方案中，可以在检测到对原始药物具有抗性的突变体形式增加时改变治疗干预。例如，具有EGFR突变L858R的癌症对埃罗替尼(erlotinib)治疗具有响应。然而，具有EGFR突变T790M的癌症对埃罗替尼具有抗性。然而，它们对鲁索替尼(ruxolitinib)是响应性的。本发明的方法包括监测肿瘤谱的变化，以及在与抗药性有关的遗传变体上升至预定的临床水平时改变治疗干预。

数据库

在另一个实施方案中，建立了数据库，其中记录了从癌症患者收集的连续样品的遗传信息。该数据库还可包含干预治疗和其他临床相关信息，诸如体重、不良反应、组织学测试、血液测试、射线照相信息、既往治疗、癌症类型等。可使用连续测试结果来推断治疗的功效，特别是当与血液样品一起使用时，其可以比自我报告或医学从业者的放射照相报告给出更公正的肿瘤负荷估计。治疗功效可按照具有相似基因组谱的患者簇集，反之亦然。可围绕例如初级遗传改变、次级遗传改变、这些遗传改变的相对量和肿瘤负荷对遗传谱进行组织。该数据库可用于对后续患者的决策支持。种系和体细胞改变二者也可用于确定治疗功效。当最初有效的治疗开始失效时，还可从数据库推断获得性抗性改变。通过放射照相、血液或其他手段可检测到该失效。用于推断获得性抗性机制的主要数据是在每位患者治疗后收集的基因组肿瘤谱。该数据还可用于对可能的治疗响应设置定量界限，以及预测治疗失效的时间。基于对于给定治疗和肿瘤基因组谱可能的获得性抗性改变，可修改治疗方案以抑制获得最可能的抗性改变。

计算机系统

本发明的方法可使用计算机系统或在其帮助下来实现。图5示出了被编程或以其他方式配置成实现本发明的方法的计算机系统1501。计算机系统1501包括中央处理单元(CPU，本文也称为“处理器”和“计算机处理器”)1505。计算机系统1501还包括存储器或存储器位置1510(例如，随机存取存储器、只读存储器、闪速存储器)、电子存储单元1515(例如，硬盘)、用于与一个或多个其他系统通信的通信接口1520(例如，网络适配器)和外围装置1525，如高速缓冲存储器、其他存储器、数据存储和/或电子显示适配器。存储器1510、存储单元1515、接口1520和外围装置1525通过通信总线(实线)来与CPU 1505通信。存储单元1515可以是用于存储数据的数据存储单元(或数据储存库)。计算机系统1501可以在通信接口1520的辅助下可操作地耦合至计算机网络(“网络”)1530。网络1530可以是因特网、互联网和/或外联网、或与因特网通信的内联网和/或外联网。在一些情况下，网络1530是电信和/或数据网络。网络1530可以包括一个或多个计算机服务器，这可以支持分布式计算，例如云计算。CPU 1505可以执行一系列的机器可读指令，该机器可读指令可以体现在程序或软件中。该指令可存储于存储器位置，如存储器1510中。存储单元1515可存储文件，如驱动程序、库和保存的程序。计算机系统1501可通过网络1530与一个或多个远程计算机系统进行通信。如本文所述的方法可通过机器(例如，计算机处理器)可执行代码来实现，该机器可执行代码存储于计算机系统1501的电子存储位置，诸如存储器1510或电子存储单元1515上。该机器可执行代码或机器可读代码可以以软件的形式提供。本文所提供的系统和方法的各方面，如计算机系统1501，可以在编程中体现。该技术的各个方面可以被认为是“产品”或“制造物品”，通常为在机器可读介质类型中执行或体现的机器(或处理器)可执行代码和/或相关数据的形式。机器可执行代码可存储于电子存储单元，例如存储器(例如，只读存储器、随机存取存储器、闪速存储器)或硬盘上。“存储”型介质可以包括计算机、处理器等的任何或所有有形存储器，或其相关模块，如各种半导体存储器、磁带驱动器、磁盘驱动器等，其可以在任何时间为软件编程提供非暂时性存储。该软件的全部或部分有时可以通过因特网或各种其他电信网络进行通信。计算机系统1501可包括电子显示器或与电子显示器进行通信，该电子显示器包括用于提供例如样品分析的一个或多个结果的用户界面(UI)。

本发明提供了包括但不限于以下实施方式：

1.一种方法，其包括：

(a)对来自受试者的生物样品中癌细胞的多核苷酸进行测序；

(b)鉴别并定量所述多核苷酸中的体细胞突变；

(c)产生所述受试者中的肿瘤异质性谱，所述谱指示所述多核苷酸中多种体细胞突变的存在和相对量，其中不同的相对量指示肿瘤异质性；以及

(d)确定针对表现出所述肿瘤异质性的癌症的治疗干预，其中所述治疗干预对于具有所确定的肿瘤异质性谱的癌症是有效的。

2.根据实施方式1所述的方法，其中通过测序生成的序列读取值在鉴别和定量之前经历降噪。

3.根据实施方式1所述的方法，其中确定治疗干预考虑到肿瘤相关的遗传改变的相对频率。

4.根据实施方式1所述的方法，其中所述治疗干预包括联合施用或顺序地施用多种药物，其中每种药物对于呈现出以不同相对频率发生的不同种体细胞突变的癌症相对更有效。

5.根据实施方式4所述的方法，其中对于呈现出以较高相对频率发生的体细胞突变的癌症相对更有效的药物以较高的量施用。

6.根据实施方式4所述的方法，其中所述药物以分层的剂量递送以反映DNA中变体的相对量。

7.根据实施方式4所述的方法，其中呈现出至少一种所述遗传变体的癌症对至少一种所述药物具有抗性。

8.根据实施方式1所述的方法，其中确定治疗干预考虑到所述癌症的起源组织。

9.一种方法，其包括为患有具有可推断肿瘤异质性的肿瘤谱的癌症的受试者提供治疗干预，其中所述治疗干预对具有所述肿瘤谱的癌症是有效的。

10.根据实施方式9所述的方法，其中所述肿瘤谱指示多种更多体细胞突变的相对频率。

11.根据实施方式10所述的方法，其进一步包括监测所述受试者中所述相对频率随时间推移的变化，并根据所述变化确定随时间推移的不同治疗干预。

12.根据实施方式10所述的方法，其中所述治疗干预对于呈现出每种所述体细胞突变的癌症相比于对于呈现出任一种而不是所有所述体细胞突变的癌症更有效。

13.根据实施方式10所述的方法，其中所述治疗干预包括联合施用或顺序地施用多种药物，其中每种药物对于呈现出以不同相对频率发生的不同种体细胞突变的癌症相对更有效。

14.一种方法，其包括向受试者施加对表现出肿瘤异质性的肿瘤有效的治疗干预，其中所述治疗干预基于所述受试者中的肿瘤异质性谱，所述谱指示多核苷酸中多种体细胞突变的存在和相对量，其中不同的相对量指示肿瘤异质性。

15.一种包含计算机可读介质的系统，该计算机可读介质包含机器可执行代码，该机器可执行代码在被计算机处理器执行时实现包括如下步骤的方法：

(a)将定位到遗传基因座的多核苷酸的序列读取值接收到存储器中；

(b)在所述序列读取值之间，确定在定位到基因座的序列读取值的总数的基因座处与参考序列的碱基不同的碱基的身份；

(c)报告所确定的碱基的身份和相对量及其在基因组中的位置；以及

(d)基于(c)中的信息推断给定样品的异质性。

16.根据实施方式15所述的方法，其中所实现的方法进一步包括将来源于多个不同时间的样品的序列读取值接收到存储器中，并计算两个样品之间的多个碱基的相对量和身份的差异。

17.一种试剂盒，其包含第一药物和第二药物，其中所述第一药物和所述第二药物的组合对于呈现出第一和第二体细胞突变的癌症相比于对于呈现出任一种而不是所有所述体细胞突变的癌症在治疗上更有效。

18.根据实施方式17所述的试剂盒，其中所述组合被包含在混合物中，或其中每种药物被包含在单独的容器中。

19.一种方法，其包括：

(a)对来自受试者的病变细胞(例如，空间上不同的病变细胞)的生物分子聚合物进行生物分子分析；

(b)鉴别并定量所述生物分子大分子中的生物分子变体；

(c)产生所述受试者中的病变细胞异质性谱，所述谱指示所述生物分子大分子中多种变体的存在和相对量，其中不同的相对量指示病变细胞异质性；以及

(d)确定针对表现出所述病变细胞异质性的疾病的治疗干预，其中所述治疗干预对于具有所确定的病变细胞异质性谱的疾病是有效的。

20.一种检测受试者中病变细胞异质性的方法，其包括：

a)对在来自受试者的样品的多核苷酸中在多个遗传基因座中的每一个处携带序列变体的多核苷酸进行定量，其中所述样品包含来自体细胞和来自病变细胞的多核苷酸；

b)对每个基因座确定关于携带所述序列变体的多核苷酸的拷贝数变异(CNV)的量度；

c)根据所述基因座处的CNV对每个基因座确定在所述基因座处携带序列变体的多核苷酸的量的加权量度；以及

d)比较所述多个基因座中的每一个处的所述加权量度，

其中不同的加权量度指示病变细胞异质性。

21.一种方法，其包括：

a)使受试者经历一个或多个脉冲治疗循环，每个脉冲治疗循环包括：(i)期间以第一量施用一种或多种药物的第一阶段，和(ii)期间以减少的第二量施用(例如完全不施用)所述一种或多种药物的第二阶段；其中：

(A)所述第一阶段的特征在于检测到的肿瘤负荷高于第一临床水平；并且

(B)所述第二阶段的特征在于检测到的肿瘤负荷低于第二临床水平。

22.根据实施方式21所述的方法，其中一种或多种药物是多种药物，并且每个循环中每种药物的每个量都根据肿瘤负荷来确定，该肿瘤负荷根据肿瘤多核苷酸中选择的多种不同体细胞变体中每一种的量来测量。

23.根据实施方式21所述的方法，其进一步包括：

b)当所述受试者表现出对所述一种或多种药物的抗性时，使所述受试者经历一个或多个脉冲治疗循环，每个脉冲治疗循环包括：(i)期间以第一量施用不同的一种或多种药物的第一阶段，和(ii)期间以减少的第二量施用(例如完全不施用)所述不同的一种或多种药物的第二阶段；其中：

24.一种方法，其包括：

(a)对来自受试者的癌细胞的多核苷酸进行测序；

(b)鉴别并定量所述多核苷酸中的体细胞突变；以及

(c)产生所述受试者中的肿瘤异质性谱，以用于确定对于表现出肿瘤异质性的癌症有效的治疗干预，其中所述谱指示所述多核苷酸中多种体细胞突变的存在和相对量，其中不同的相对量指示肿瘤异质性。

25.一种方法，其包括向受试者提供治疗干预，其中所述治疗干预根据所述受试者中的病变细胞异质性谱而确定，其中所述谱指示所述多核苷酸中多种体细胞突变的存在和相对量，其中不同的相对量指示病变细胞异质性；并且其中所述治疗干预对于具有所确定的病变细胞异质性谱的疾病是有效的，例如，对于呈现出所述多种体细胞突变的疾病相比于对于呈现出任一种而不是所有所述体细胞突变的疾病更有效。

26.一种方法，其包括：

a)确定跨越基因组的至少1kb、至少10kb、至少100kb、至少1mb、至少10mb或至少100mb的区域中，样品中多核苷酸的拷贝数距离集中趋势值的偏差的量度(例如，标准差、方差)；

b)基于所述偏差的量度，推测来自所述样品中正在经历细胞分裂的细胞的DNA的负荷量度。

27.根据实施方式26所述的方法，其中所述集中趋势值是平均值、中位数或众数。

28.根据实施方式26所述的方法，其中所述确定包括将所述区域划分为多个非重叠区间，确定每个区间处的拷贝数的量度，以及根据每个区间处的拷贝数量度来确定所述偏差的量度。

29.根据实施方式28所述的方法，其中所述区间不超过1个碱基、10个碱基、100个碱基、1kb碱基或10kb中的任一种。

30.一种推断来自样品中正在经历细胞分裂的细胞的DNA的负荷量度的方法，其包括测量由一个或多个基因组基因座与细胞复制起点邻近而诱导的拷贝数变异，其中增加的CNV指示细胞正在经历细胞分裂。

31.一种通过改善由于邻近复制起点而导致的变异的作用来增加确定基因相关拷贝数变异的灵敏度和/或特异性的方法。

32.一种方法，其包括：

a)确定来自一个或多个对照样品的一个或多个基因座处的DNA分子的拷贝的基线量度，其中一个或多个所述基因座包括复制起点，每个都含有来自正在经历预定水平的细胞分裂的细胞的DNA；

b)确定测试样品中DNA分子的测试量度；其中所述测试样品中的量度来自被划分成一个或多个分区的一个或多个基因座，并且其中一个或多个所述基因座包括复制起点；

c)比较所述测试量度和所述基线量度，其中在基线量度之上的测试量度指示所述测试样品中的DNA来自的细胞相比于向所述对照样品提供DNA的细胞以更快的速度分裂。

33.根据实施方式32所述的方法，其中所述量度选自分子计数、跨分区的分子计数的集中趋势量度或跨分区的分子计数变化量度。

34.一种方法，其包括：

(a)向受试者施加增加所述受试者的循环中来源于肿瘤的DNA的量的干预；以及

(b)当所述量增加时，从所述受试者收集含有来源于肿瘤的DNA的样品。

35.一种方法，其包括编译数据库，其中所述数据库对于具有癌症的多个受试者中的每一个包含对每个受试者在两个或更多个时间间隔收集的肿瘤基因组测试数据，包括体细胞改变，在一个或多个时间向每个所述受试者施加的一种或多种治疗干预和所述治疗干预的功效，其中所述数据库对于推断所述治疗干预在具有肿瘤基因组谱的受试者中的功效是有用的。

36.一种方法，其包括使用数据库对具有癌症的受试者鉴别一种或多种有效的治疗干预，其中所述数据库对于具有癌症的多个受试者中的每一个包含对每个受试者在两个或更多个时间间隔收集的肿瘤基因组测试数据，包括体细胞改变，在一个或多个时间向每个所述受试者施加的一种或多种治疗干预和所述治疗干预的功效。

37.根据实施方式36所述的方法，其中按照功效对所鉴别的治疗干预进行分层。

38.根据实施方式36所述的方法，其中报告关于所预测的治疗干预功效或缺乏该功效的定量界限。

39.根据实施方式36所述的方法，其中所述治疗干预使用响应于治疗的类似患者中预测的肿瘤基因组演化或所获得的抗性机制的信息。

40.报告一种或多种遗传测试的结果的方法，其包括：

使用遗传分析仪在一个或多个测试点上捕获包括遗传变体及其定量量度在内的遗传信息；

对所述定量量度进行归一化以用于呈现所述一个或多个测试点并生成比例因子；

应用所述比例因子以呈现肿瘤响应图；以及

生成遗传变体的汇总。

41.根据实施方式40所述的方法，其包括分析非CNV(拷贝数变异)突变等位基因频率。

42.一种生成遗传报告的方法，其包括：

使用遗传分析仪生成非拷贝数变异(CNV)数据；

对于每种非CNV突变等位基因频率确定比例因子；

对于首次测试，使用所述比例因子生成每种非CNV改变的可视小图；以及

对于每次后续测试，使用所述比例因子对所述可视小图生成所述非CNV改变的变化。

43.一种方法，其包括：

a)提供来自受试者的多个核酸样品，所述样品在连续时间点收集；

b)对来自所述样品的多核苷酸进行测序以生成序列；

c)确定每个样品中所述多核苷酸之间多个遗传变体中的每一个的定量量度；

d)对于在至少一个连续时间点以非零量存在的那些体细胞突变，通过计算机用图形表示遗传变体在每个连续时间点的相对量。

44.根据实施方式43所述的方法，其中所述定量量度是定位到相同遗传基因座的所有序列中的所述遗传变体的频率。

45.根据实施方式43所述的方法，其中所述相对量被表示为堆叠区域图。

46.根据实施方式45所述的方法，其中所述相对量在最早时间点从最高至最低从所述图的底部至顶部堆叠，并且其中在稍后时间点首先以非零量出现的遗传变体堆叠在所述图的顶部。

47.一种从通过遗传分析仪生成的数据生成纸质或电子患者测试报告的方法，其包括：

a)汇总来自两个或更多个测试时间点的数据，由此报告首次测试后每个后续测试点处所有非零测试结果的并集；以及

b)将所述测试结果呈现在纸质或电子患者测试报告上。

48.根据实施方式47所述的方法，其中通过用计算机处理器执行代码在计算机上进行汇总和呈现，以(i)鉴别所有非零测试结果，(ii)生成测试报告，以及(iii)在图形用户界面上显示所述测试报告。

49.一种由遗传分析仪所生成的数据来图形表示受试者中肿瘤的遗传变体演化的方法，所述方法包括：

a)通过计算机生成在所述受试者中在多个时间点中的每一个处检测到的遗传变体的堆叠表示，其中对应于遗传变体的所述堆叠中每一层的高度或宽度表示所述遗传变体在每个时间点对遗传变体的总量的定量贡献；以及

b)在计算机监视器或纸质报告上显示所述堆叠表示。

50.根据实施方式49所述的方法，其中显示包括：

a)将表示所检测到的肿瘤遗传变体的数据接收到计算机存储器中；

b)用计算机处理器执行代码以将每个遗传变体在时间点的所述定量贡献用图形表示为与所述相对贡献成比例的线或区域；以及

c)在图形用户界面上显示所述图形表示。

实施例

基因组中的核苷酸位置(例如，基因座)可用数字标出，如图2中所示。约100％的碱基判定与参考序列相同的位置或约100％的碱基判定与参考序列不同的位置被推断为表示cfDNA的纯合性(假设正常)。约50％的碱基判定与参考序列相同的位置被推断为表示cfDNA的杂合性(也假设正常)。基因座处碱基判定的百分比明显低于50％且高于碱基判定系统的检测极限的位置被推断为表示肿瘤相关的遗传变体。

实施例1.拷贝数变异检测方法

血液收集

在室温下收集10-30mL血样样品。将样品离心以去除细胞。在离心后收集血浆。

cfDNA提取

对样品进行蛋白酶K消化。用异丙醇沉淀DNA。在DNA纯化柱(例如，QIAamp DNABlood Mini Kit)上捕获DNA，并在100μl溶液中洗脱。通过Ampure SPRI磁珠捕获(PEG/盐)选择低于500bp的DNA。使所得的产物悬浮在30μl H₂O中。检查大小分布(主峰＝166个核苷酸；次峰＝330个核苷酸)并定量。5ng提取的DNA含有约1700个单倍体基因组当量(“HGE”)。DNA与HGE的量之间的一般关系如下：3pg DNA＝1HGE；3ng DNA＝1K HGE；3μg DNA＝1M HGE；10pg DNA＝3HE；10ng DNA＝3K HGE；10μg DNA＝3M HGE。

“单分子”文库制备

通过末端修复、A加尾以及与具有过载的发夹衔接子的2个不同八聚体的粘性末端连接(即，4种组合)来进行高效DNA标记(>80％)。使用2.5ng DNA(即，约800个HGE)作为起始材料。每个发夹衔接子在其非互补部分上均包含随机序列。每个DNA片段的两端均与发夹衔接子附接。可通过该发夹衔接子上的八聚体序列与插入序列的内源部分的组合来鉴定每个标记的片段。

将标记的DNA通过12个循环的PCR进行扩增，以产生约1-7μgDNA，其含有起始材料中800个HGE的每一个的约500个拷贝。

可以进行缓冲液优化、聚合酶优化和循环减少来优化PCR反应。还通过优化降低扩增偏差，例如，非特异性偏差、GC偏差和/或大小偏差。通过采用高保真度聚合酶降低噪声(例如，聚合酶引入的错误)。

可以如下富集序列：使用具有针对ROI的探针的生物素标记的珠子捕获具有感兴趣区域(ROI)的DNA。通过12个循环的PCR扩增ROI，以产生2000倍扩增。

大规模平行测序

使用0.1％至1％的样品(约100pg)进行测序。然后使所得的DNA变性、稀释至8pM并加载至Illumina测序仪中。

数字生物信息学

将序列读取值分组成家族，每个家族具有约10个序列读取值。通过对家族中的每个位置进行投票(例如，偏向投票)，将家族分解成共有序列。如果8或9个成员一致，则碱基被判定为共有序列。如果一致的成员不超过60％，则碱基不被判定为共有序列。

将所得的共有序列定位至参考基因组，诸如hg19。共有序列中的每个碱基被约3000个不同家族覆盖。计算每个序列的质量得分，并根据其质量得分过滤序列。将共有序列中每个位置处的碱基判定与HG-19参考序列进行比较。在碱基判定与参考序列不同的每个位置处，确定并报告不同的一个或多个碱基的身份以及它们相对于基因座处的总碱基判定的百分比。

通过对每个基因座处碱基的分布进行计数来检测序列变异。如果98％的读取值具有相同的碱基(纯合的)而2％具有不同的碱基，则该基因座可能具有推测来自癌症DNA的序列变体。

通过对定位至基因座的序列(碱基)的总数进行计数并与对照基因座进行比较来检测CNV。为了增加CNV检测，对特定区域进行CNV分析，该特定区域包括ALK、APC、BRAF、CDKN2A、EGFR、ERBB2、FBXW7、KRAS、MYC、NOTCH1、NRAS、PIK3CA、PTEN、RB1、TP53、MET、AR、ABL1、AKT1、ATM、CDH1、CSF1R、CTNNB1、ERBB4、EZH2、FGFR1、FGFR2、FGFR3、FLT3、GNA11、GNAQ、GNAS、HNF1A、HRAS、IDH1、IDH2、JAK2、JAK3、KDR、KIT、MLH1、MPL、NPM1、PDGFRA、PROC、PTPN11、RET、SMAD4、SMARCB1、SMO、SRC、STK11、VHL、TERT、CCND1、CDK4、CDKN2B、RAF1、BRCA1、CCND2、CDK6、NF1、TP53、ARID1A、BRCA2、CCNE1、ESR1、RIT1、GATA3、MAP2K1、RHEB、ROS1、ARAF、MAP2K2、NFE2L2、RHOA或NTRK1基因上的区域。

实施例2.通过确定样品中未发现的分子的总数校正碱基判定的方法

对片段进行扩增并且读取和比对扩增片段的序列后，对该片段进行碱基判定。扩增片段和未发现的扩增片段的数目的变异可能在碱基判定中引入错误。通过计算未发现的扩增片段的数目校正这些变异。

在对基因座A(任意基因座)进行碱基判定时，首先假设存在N个扩增片段。序列读出值可能来自两种类型的片段：双链片段和单链片段。以下是计算样品中未发现的分子的总数的理论实例。

N为样品中分子的总数。

假设检测到的双链体的数目为1000。

假设检测到的单链分子的数目为500。

P为发现链的概率。

Q为未检测到链的概率。

由于Q＝1-P。

1000＝NP(2)。

500＝N2PQ。

1000/P(2)＝N。

500÷2PQ＝N。

1000/P(2)＝500÷2PQ。

1000*2PQ＝500P(2)。

2000PQ＝500P(2)。

2000Q＝500P。

2000(1-P)＝500P

2000-2000P＝500P。

2000＝500P+2000P。

2000＝2500P。

2000÷2500＝P。

0.8＝P。

1000/P(2)＝N。

1000÷0.64＝N。

1562＝N。

未发现的片段的数目＝62。

实施例3.患者中癌症相关的体细胞变体中的遗传变体的鉴定

使用测定法来分析一组基因，从而以高灵敏性鉴定癌症相关的体细胞变体中的遗传变体。

从患者的血浆中提取无细胞DNA并通过PCR进行扩增。通过扩增的靶基因的大规模平行测序来分析遗传变体。对于一组基因，对全部外显子进行测序，因为这样的测序覆盖已显示出具有临床实用性(表3)。对于另一组基因，测序覆盖包括具有先前报道的体细胞突变的那些外显子(表4)。最小可检测的突变等位基因(检测极限)取决于患者的样品无细胞DNA浓度，该浓度从每mL外周血少于10个至超过1,000个基因组当量不等。在具有较低量的无细胞DNA和/或低水平基因拷贝扩增的样品中，可能检测不到扩增。某些样品或变体特性导致降低的分析灵敏度，如低样品质量或不恰当的采集。

在血液中循环的无细胞DNA中发现的遗传变体的百分比与此患者的独特的肿瘤生物学有关。影响在血液中循环的无细胞DNA中检测到的遗传变体的量/百分比的因素包括肿瘤生长、转变(turn-over)、大小、异质性、血管化、疾病进展或治疗。表5注释了在此患者中检测到的改变的循环无细胞DNA的百分比(％cfDNA)或等位基因频率。一些检测到的遗传变体按％cfDNA以降序列出。

在从该患者的血液样本中分离的循环无细胞DNA中检测到遗传变体。这些遗传变体是癌症相关的体细胞变体，其中一些与对特定治疗的临床响应的增加或降低有关。“次要改变”被定义为以小于“主要改变”的等位基因频率的10％被检测到的那些改变。主要改变是在基因座处的主要的改变。注释了检测到的这些改变的等位基因频率(表5)和对此患者的相关治疗。

表3和表4中列出的所有基因均作为试验的一部分得到分析。在从该患者的血液样本分离的循环无细胞DNA中没有检测到ERBB2、EGFR或MET的扩增。

包含遗传变体的患者测试结果在表6中列出。

参见表4，在13个位置处，样品中以至少98.8％的频率检测到的核苷酸与参考序列中的核苷酸不同，表明这些基因座处的纯合性。例如，在KRAS基因中的位置25346462处，在100％的情况下检测到T而不是参考核苷酸C。

在35个位置处，样品中以41.4％-55％的频率检测到的核苷酸与参考序列中的核苷酸不同，表明这些基因座处的杂合性。例如，在ALK基因中的位置29455267处，在50％的情况下检测到G而不是参考核苷酸C。

在3个位置处，以小于9％的频率检测到的核苷酸与参考序列中的核苷酸不同。这些包括BRAF(140453136A>T，8.9％)、NRAS(115256530G>T 2.6％)和JAK2(5073770G>T1.5％)中的变体。它们被推测是来自癌症DNA的体细胞突变。

计算肿瘤相关的遗传变体的相对量。BRAF:NRAS:JAK2的量的比率为8.9:2.6:1.5或1:0.29:0.17。从该结果可推断肿瘤异质性的存在。例如，一种可能的解释是100％的肿瘤细胞含有BRAF中的变体，83％的肿瘤细胞含有BRAF和NRAS中的变体，而17％的肿瘤细胞含有BRAF、NRAS和JAK2中的变体。然而，CNV的分析可显示BRAF的扩增，在这种情况下，100％的肿瘤细胞可同时具有BRAF和NRAS中的变体。

表3.所有外显子都得到测序的基因

LOD：检测极限。检测到80％的体细胞变体的该样本的最小可检测突变等位基因频率。

表4.具有先前报道的体细胞突变的外显子得到测序的基因

表5.该患者中检测到的改变的循环无细胞DNA的等位基因频率

表6.在选定基因中检测到的基因组改变

实施例4.确定通过测定分析的基因的患者特异性检测极限

使用实施例3的方法，检测患者的无细胞DNA中的遗传改变。这些基因的序列读取值包括外显子和/或内含子序列。

实施例5.通过比较Watson和Crick序列校正序列错误

从患者的血浆中分离双链无细胞DNA。使用16种不同的含气泡的衔接子标记无细胞DNA片段，每一个衔接子均包含独特的条形码。通过连接将含气泡的衔接子附接至每个无细胞DNA片段的两端。连接后，每个无细胞DNA片段可以被独特条形码的序列以及在该无细胞DNA片段两端处的两个20bp内源序列清楚地标识。

通过PCR扩增该标记的无细胞DNA片段。使用包含与一组癌症相关基因特异性结合的寡核苷酸探针的珠子富集该扩增的片段。因此，来自这组癌症相关基因的无细胞DNA片段被选择性富集。

将测序衔接子附接至富集的DNA分子，其中每一个测序衔接子均包含测序引物结合位点、样品条形码和流动池序列。通过PCR扩增所得到的分子。

对扩增的片段的两条链进行测序。因为每个含气泡的衔接子均包含非互补部分(例如，气泡)，所以含气泡的衔接子的一条链的序列与另一条链(互补链)的序列不同。因此，可以根据附接的含气泡的衔接子序列将来源于原始无细胞DNA的Watson链的扩增子的序列读取值与来自该原始无细胞DNA的Crick链的扩增子区分开。

将来自原始无细胞DNA片段的一条链的序列读取值与来自该原始无细胞DNA片段的另一条链的序列读取值进行比较。如果变体仅出现于来自原始无细胞DNA片段的一条链的序列读取值中，而不存在于另一条链中，则该变体将被鉴定为错误(例如，由PCR和/或扩增导致的)，而不是真正的遗传变体。

将序列读取值分组成家族。校正序列读取值中的错误。通过分解生成每个家族的共有序列。

实施例6.治疗干预

确定治疗干预以治疗癌症。具有BRAF突变体的癌症响应于维罗非尼、瑞格非尼、曲美替尼和达拉非尼的治疗。具有NRAS突变体的癌症响应于曲美替尼的治疗。具有JAK2突变体的癌症响应于鲁索替尼的治疗。包括施用曲美替尼和鲁索替尼的治疗干预被确定为比单独使用任一种上述药物的治疗对该癌症更有效。以5:1的剂量比用曲美替尼和鲁索替尼的组合来治疗受试者。

经过几轮治疗后，再次测试来自受试者的cfDNA的肿瘤异质性的存在。结果显示，BRAF:NRAS:JAK2的比例现在约为4:2:1.5。这表明该治疗干预已经减少了具有BRAF和NRAS突变体的细胞数目，并且已经停止了具有JAK2突变体的细胞的生长。确定第二治疗干预，其中确定曲美替尼和鲁索替尼在1:1的剂量比下是有效的。以该比率的量给予受试者化疗疗程。后续测试显示，BRAF、NRAS和JAK2突变体在cfDNA中以低于1％的量存在。

实施例7.治疗干预

从进行黑素瘤预处理的个体收集血液样品，并使用无细胞DNA分析确定该患者以2.8％的频率具有BRAF V600E突变，并且不具有可检测的NRAS突变。对该患者进行抗BRAF治疗(达拉非尼)。3周后，收集并测试另一个血液样品。确定BRAF V600E的水平已经下降到0.1％。停止治疗，并每2周重复测试。BRAF V600E水平再次上升，并当BRAF V600E水平上升到1.5％时重新开始治疗。当水平再次下降至0.1％时，再次停止治疗。重复该循环。

实施例8.基于ROCNV测量校正CNV

确定患者样品中的拷贝数变异。用于确定的方法可包括如上所述的分子追踪和上采样。使用基于复制起点的预期位置的隐马尔可夫模型来消除复制起点邻近对患者样品中估计的拷贝数变异的影响。每个基因的拷贝数变异的标准差随后降低40％。也使用复制起点邻近模型来推断患者中的无细胞肿瘤负荷。

在许多情况下，得到的无细胞肿瘤的水平可较低或低于特定技术的检测极限。当血浆中来源于肿瘤的DNA的人类基因组当量数目低于1个拷贝/5mL时，可能是这种情况。已显示放疗和化疗相比稳定的健康细胞更会影响快速分裂的细胞，由此证明了它们在治疗晚期癌症患者中的功效。因此，在血液采集前对患者施用具有最低不良反应的程序以优先提高所收集的来源于肿瘤的DNA的比例。例如，可向患者施用低剂量的化疗，并且可在24小时、48小时、72小时或少于1周内收集血液样品。对于有效的化疗，该血液样品因癌细胞的细胞死亡率可能较高而含有较高浓度的来源于肿瘤的无细胞DNA。或者，不采用低剂量化疗，而是通过全身放射照相仪施加低剂量放疗，或对患区局部施加低剂量化疗。也想到其他程序，包括使患者经受超声、声波、运动、压力等。

本说明书中提到的所有出版物、专利和专利申请均通过引用并入本文，其程度如同特别地且单独地指出每一个单独的出版物、专利或专利申请均通过引用而并入。

虽然本发明的优选实施方案已在本文中示出和描述，但对于本领域技术人员显而易见的是，这样的实施方案仅通过示例的方式提供。在不偏离本发明的情况下，本领域技术人员现将想到多种变化、改变和替换。应当理解，本文所述的本发明实施方案的各种替代方案可用于实施本发明。旨在用以下权利要求限定本发明的范围，并由此涵盖在这些权利要求范围内的方法和结构及其等同项。

Claims

1.一种方法，其包括：

(a)对来自受试者的生物样品中癌细胞的多核苷酸进行测序；

(b)鉴别并定量所述多核苷酸中的体细胞突变；

2.一种方法，其包括为患有具有可推断肿瘤异质性的肿瘤谱的癌症的受试者提供治疗干预，其中所述治疗干预对具有所述肿瘤谱的癌症是有效的。

3.一种方法，其包括向受试者施加对表现出肿瘤异质性的肿瘤有效的治疗干预，其中所述治疗干预基于所述受试者中的肿瘤异质性谱，所述谱指示多核苷酸中多种体细胞突变的存在和相对量，其中不同的相对量指示肿瘤异质性。

4.一种包含计算机可读介质的系统，该计算机可读介质包含机器可执行代码，该机器可执行代码在被计算机处理器执行时实现包括如下步骤的方法：

(d)基于(c)中的信息推断给定样品的异质性。

5.一种试剂盒，其包含第一药物和第二药物，其中所述第一药物和所述第二药物的组合对于呈现出第一和第二体细胞突变的癌症相比于对于呈现出任一种而不是所有所述体细胞突变的癌症在治疗上更有效。

6.一种方法，其包括：

(b)鉴别并定量所述生物分子大分子中的生物分子变体；

7.一种检测受试者中病变细胞异质性的方法，其包括：

d)比较所述多个基因座中的每一个处的所述加权量度，

其中不同的加权量度指示病变细胞异质性。

8.一种方法，其包括：

9.一种方法，其包括：

(a)对来自受试者的癌细胞的多核苷酸进行测序；

(b)鉴别并定量所述多核苷酸中的体细胞突变；以及

10.一种方法，其包括向受试者提供治疗干预，其中所述治疗干预根据所述受试者中的病变细胞异质性谱而确定，其中所述谱指示所述多核苷酸中多种体细胞突变的存在和相对量，其中不同的相对量指示病变细胞异质性；并且其中所述治疗干预对于具有所确定的病变细胞异质性谱的疾病是有效的，例如，对于呈现出所述多种体细胞突变的疾病相比于对于呈现出任一种而不是所有所述体细胞突变的疾病更有效。