CN108027373B

CN108027373B - 受益于阻断t细胞程序性细胞死亡1(pd-1)检查点蛋白的配体活化的抗体药物的黑素瘤患者的预测性测试和分类器开发方法

Info

Publication number: CN108027373B
Application number: CN201680052342.5A
Authority: CN
Inventors: J.勒德; K.迈尔; J.格里戈里瓦; M.蔡平; C.奥利贝拉; A.斯泰因格林森; H.勒德; S.阿斯梅拉什; K.塞耶斯; C.马赫; J.韦伯
Original assignee: Biodesix Inc
Current assignee: Biodesix Inc
Priority date: 2015-07-13
Filing date: 2016-07-12
Publication date: 2021-04-09
Anticipated expiration: 2036-07-12
Also published as: CN108027373A; US20170039345A1; EP3779998A1; CN112710723A; EP3322987A1; EP3322987B1; US10007766B2; US10950348B2; US20210098131A1; EP3322987A4; WO2017011439A1; US20180277249A1

Abstract

公开了一种预测癌症患者对免疫检查点抑制剂的反应的方法，所述免疫检查点抑制剂例如阻断程序性细胞死亡1(PD‑1)或CTLA4的配体活化的抗体药物。所述方法包括从患者的血液样本获得质谱数据，获得多个预定质谱特征的质谱数据中的积分强度值；以及使用实施分类器的程控计算机对质谱数据进行操作。分类器使用分类算法将积分强度值与从多个黑素瘤患者获得的经类别标记的质谱数据的训练集的特征值进行比较，并且为样本生成类别标记。类别标记“早期”或等效物预测患者可能从抗体药物中获得相对较少的益处，而类别标记“晚期”或等效物表明患者可能从抗体药物中获得相对较大的益处。

Description

受益于阻断T细胞程序性细胞死亡1(PD-1)检查点蛋白的配体活化的抗体药物的黑素瘤患者的预测性测试和分类器开发方法

优先权

本申请要求四个美国临时申请的优先权，即2015年7月13日提交的序列号62/191,895；2016年2月1日提交的62/289,587；2016年 5月24日提交的62/340,727和2016年4月8日提交的62/319,958。四个临时申请(包括其附录)中的每一个的内容通过引用整体并入本文。

领域

本发明涉及用于在治疗之前预测癌症患者是否可能受益于施用免疫检查点抑制剂(包括例如抗PD-1和/或抗CTLA4剂)的方法，所述抑制剂允许免疫系统攻击肿瘤。本申请还涉及从开发样本集来开发，即训练，由计算机实施的分类器的方法。

背景

黑素瘤是一种主要影响皮肤的癌症类型，这种癌症是由称为黑素细胞的含色素细胞发展而来的。黑素瘤的主要病因是在皮肤色素含量较低的患者中的紫外线(UV)暴露，这会对皮肤细胞中的DNA造成损害。紫外线可能来自太阳或晒黑装置。约有25％的黑素瘤来自痣。有许多痣、有家族成员病史或免疫功能差的个体都有患黑素瘤的风险。许多罕见的遗传缺陷也增加了患黑素瘤的风险。黑素瘤的诊断通常通过视觉检查任何有关的病变，然后进行活组织检查来完成。

黑素瘤的治疗通常是通过手术切除。在患有较大癌症的患者中，可能要检查附近淋巴结的扩散情况。如果扩散没有发生，大多数人可治愈。在黑素瘤扩散的患者中，免疫治疗、生物治疗、放射治疗或化疗可以提高存活率。在美国，通过治疗，在患有局部疾病的患者中，五年存活率是98％，而在已经出现扩散的患者中，五年存活率只有 17％。黑素瘤被认为是最危险的皮肤癌。全球范围内，2012年23.2 万人发病，5.5万人死亡。

肿瘤突变(包括与黑素瘤相关的突变)产生可被免疫系统识别的特异性新抗原。大约50％的黑素瘤与内源性T细胞反应有关。细胞毒性T细胞(CT细胞或细胞毒性T淋巴细胞(CTL))是摧毁病毒感染细胞和肿瘤细胞的白细胞，也涉及移植排斥反应。在其表面表达CD8糖蛋白的CTL也称为CD8+T细胞或CD8+CTL。肿瘤发展了多种免疫逃避机制，包括肿瘤微环境中的局部免疫抑制、诱导T细胞耐受性和免疫编辑。结果，即使T细胞浸润肿瘤，也不能杀死癌细胞。癌症中的这种免疫抑制的一个实例是由称为程序性细胞死亡1(PD-1)的蛋白质来介导的，该蛋白质在活化的T细胞表面上表达。如果称为程序性细胞死亡1配体1或程序性细胞死亡1配体2(PD-L1或PD-L2)的另一分子与PD-1结合，则T细胞变得无活性。产生PD-L1和PD-L2 是人体自然调节免疫系统的一种方式。许多癌细胞制造PD-L1，劫持这种自然系统，从而使癌细胞抑制T细胞攻击肿瘤。

一种治疗癌症的方法是干扰癌细胞产生的抑制性信号例如 PD-L1和PD-L2，以有效防止肿瘤细胞对免疫系统的限制。最近，美国食品和药物管理局批准了一种称为纳武单抗的作为

来销售的抗PD-1单克隆抗体，用于治疗患有不能对其他药物作出反应的不可切除或转移性黑素瘤的患者。此外，纳武单抗被批准用于治疗鳞状和非鳞状非小细胞肺癌和肾细胞癌。纳武单抗也被批准与抗细胞毒性T淋巴细胞相关蛋白4(CTLA4)抗体伊匹单抗组合用于治疗黑素瘤。纳武单抗通过阻断活化的T细胞上的PD-1受体的配体活化而作为免疫调节剂来起作用。与传统的化学疗法和靶向抗癌疗法(通过直接的细胞毒性或肿瘤生长抑制来发挥其作用)相比，纳武单抗通过阻断T细胞活化和反应的负性调节剂来起作用，从而允许免疫系统攻击肿瘤。PD-1阻断剂似乎只在肿瘤周围释放免疫系统，而不是更广泛地释放免疫系统，这可以减少这些药物的副作用。

抗PD-1治疗在黑素瘤患者中的当前临床结果是令人鼓舞的，总体结果产生优于替代疗法的无进展和总体存活结果。然而，这些疗法的真正希望在于约40％的黑素瘤患者亚组中的持久反应和长期临床益处。其余约60％的患者中有一部分使用替代疗法可获得更好效果。能够从治疗前样本中选择哪些患者从抗PD-1治疗中获得极少益处将实现更好的临床认识，并且增强这些患者的替代疗法的开发。与这些疗法相关的成本也相当高，例如，最近批准的伊匹单抗和纳武单抗组合治疗黑素瘤，虽然显示出惊人的结果，但是仅在大约55％的患者中有效，同时每疗程花费约295,000美元。(在ASCO 2015全体会议上， LeonardSaltz医学博士：“Opdivo+Yervoy组合价格约为金价的4000 倍($158/mg)”)。这导致按照标准医疗保险计划，患者自付60,000美元。通过只对于那些可能从这些治疗方法中受益的患者来选用这些治疗方法，可避免这种成本，从而为医疗保健系统和患者节约大量资金。目前还不清楚纳武单抗和伊匹单抗组合的益处是否由协同效应产生，或者仅仅是不同患者群体对于纳武单抗或伊匹单抗作出反应的总和。在任何情况下，对于纳武单抗益处进行检验可以弄清楚这个问题。

已经进行了许多研究来使用通过免疫组织化学(IHC)测量的 PD-L1的表达作为选择抗PD-1治疗的生物标志物。在一些研究中观察到抗PD-1疗效和结果之间的相关性，但是在其他研究中没有观察到。尤其成问题的是目前缺乏IHC染色方面的标准化和普遍接受的截止值，这使得对这些数据进行比较变得困难。更重要的问题是观察到PD-L1表达似乎是一种动态标志，即在肿瘤演变和治疗过程中， IHC表达变化。如果以严格的方式来使用通过IHC获得的PD-L1表达，则需要多次重复活检，对于患者来说相应的风险和成本较高。相反，基于血清的测试不会受到这些效应影响。

受让人Biodesix公司已经开发了分类器，其用于使用血液样本的质谱法来预测患者可受益于或不可受益于某些抗癌药物。代表性的专利包括美国专利7,736,905、8,914,238、8,718,996、7,858,389、7,858,390 和美国专利申请公开2013/0344111和2011/0208433。

概述

在一个方面中，并且如将在实施例9和10中更详细描述，公开了对用免疫治疗药物来治疗黑素瘤患者进行引导的实用方法。所述方法包括以下步骤：a)对于患者的血液样本进行质谱分析并获得质谱数据；(b)获得质谱数据中的多个质谱特征的积分强度值；和(c)利用实施分类器的程控计算机对质谱数据进行操作。在操作步骤中，所述分类器用分类算法将所述积分强度值与从用阻断程序性细胞死亡 1(PD-1)的配体活化的抗体药物来治疗的多个其他黑素瘤患者获得的血液样本获得的经类别标记质谱数据的参考集的特征值进行比较，并且为所述样本生成类别标记。类别标记“良好”或等效物(例如，在实施例10的描述中的晚期)预测患者可能从包含阻断PD-1的配体活化的抗体药物和靶向CTLA4的抗体药物的组合疗法获得类似益处，因此被引导至阻断PD-1的配体活化的抗体药物(例如，纳武单抗)的单一疗法，而类别标记“不好”或等效物(例如，实施例10的描述中的早期)指示与阻断程序性细胞死亡1(PD-1)的配体活化的抗体药物的单一疗法相比，患者可能从组合疗法中获得更大的益处，因此被引导至组合疗法。

在又一个实施方案中，公开了治疗黑素瘤患者的方法。所述方法包括执行上述方法，并且如果类别标记是良好的或者等效物，则对患者施用阻断PD-1的配体活化的抗体药物(例如，纳武单抗)的单一疗法，而如果报告“不好”或等效物的类别标记，对患者施用阻断PD-1 的配体活化的抗体药物和靶向CTLA4的抗体药物的组合治疗(例如纳武单抗和伊匹单抗的组合)。

在一个实施方案中，质谱特征包括附录A、附录B或附录C中列出的许多特征或与生物功能急性反应和伤口愈合相关的特征(参见实施例1、6和10)。在优选的实施方案中，分类器从使用正则化组合方法来组合的过滤小型分类器获得，例如使用图8或图54的程序。正则化组合方法可以采取对于经过滤的小型分类器重复执行具有极值丢弃的逻辑回归的形式。在一个实例中，根据表10中列出的标准来过滤小型分类器。如实施例9中所公开的，分类器可以采取以分级方式来组合的肿瘤分类器的集群(各自具有不同比例的患有大肿瘤和小肿瘤的患者)的形式。在实施例9的所示实施方案中，如果肿瘤分类器中的任何一个返回早期或等效物，则报告标记不好或等效类别标记，而如果所有肿瘤分类器返回晚期类别标记，则报告良好或等效类别标记。

在这种方法中，来自组合疗法标记的相对较大的益处意味着与单一疗法相比显著更大(更长)的总体存活。

在另一方面，参考集采取具有早期或等效物或晚期或等效物类别标记的开发样本集的经类别标记的质谱数据集的形式，其中具有早期类别标记的样本包括与具有晚期类别标记的样本相比，在用纳武单抗治疗时总体存活相对较短的样本。

在优选的实施方案中，使用MALDI-TOF质谱法从对于样本执行的至少100,000次激光照射获取质谱数据。所述方法在实施例1中和在实施例1中引用的现有专利文献中进行了描述。

在一个实施方案中，如实施例6和10所示，质谱特征根据其与至少一个生物功能的关联来选择，例如与生物功能急性反应和伤口愈合相关联的特征集。

另一方面，公开了一种实用的测试方法，用于预测黑素瘤患者对于阻断PD-1配体活化的抗体药物的反应。所述方法包括以下步骤： a)对于黑素瘤患者的血液样本进行质谱分析，并获得质谱数据；(b) 获得质谱数据中的多个预定质谱特征的积分强度值；和(c)利用实施分类器的程控计算机对质谱数据进行操作。在操作步骤中，分类器使用分类算法将在步骤(b)中获得的积分强度值与从用药物来治疗的多个其他黑素瘤患者来获得的经类别标记的质谱数据的参考集的特征值进行比较，并且为样本生成类别标记。类别标记“早期”或等效物预测患者可能从抗体药物中获得相对较少的益处，而类别标记“晚期”或等效物表明患者可能从抗体药物中获得相对较大的益处。在本公开中详细描述了从开发样本数据集来生成在该测试中使用的分类器的方法。

另一方面，描述了一种能够预测黑素瘤患者受益于阻断程序性细胞死亡1(PD-1)的配体活化的抗体药物的机器。该机器包括存储器，该存储器以从用抗体药物治疗的多个黑素瘤患者的血液样本的质谱分析获得的多个质谱特征的特征值的形式来存储参考集。存储器进一步存储定义一组主分类器的代码集合，每一个主分类器从使用正则化组合方法组合的多个经过滤的小型分类器来生成。所述机器还包括中央处理单元，所述中央处理单元对于所述代码集以及从黑素瘤患者的血液样本获得的所述参考集和质谱数据进行操作，并且作为响应来生成所述血液样本的类别标记，其中，所述类别标记“早期”或等效物预测患者可能从抗体药物获得相对较少的益处，而类别标记“晚期”或等效物表明患者可能从抗体药物中获得相对较大的益处。

另一方面，公开了一种预测患者受益于阻断PD-1的配体活化的抗体药物的系统，所述系统呈对于患者的血液样本进行质谱分析的质谱仪和如前一段落中所述的机器的形式。

在又一方面，公开了一种产生分类器的方法，所述分类器用于预测患者受益于阻断程序性细胞死亡1(PD-1)的配体活化的抗体药物。所述方法包括以下步骤：

1)从用抗体药物治疗的黑素瘤患者获得的开发血液样本集来获得质谱数据，其中从集合的每一个成员获得至少100,000次激光照射的质谱；

2)对来自开发样本集的质谱数据执行光谱预处理操作，包括背景估计和减法、对准、批次校正和正则化；

3)执行图8的步骤102-150的过程，包括基于过滤的小型分类器集合的正则化组合来生成主分类器；

4)评估根据步骤3)生成的主分类器的性能；和

5)基于步骤3)生成的主分类器来定义最终分类器。

在一个优选实施方案中，最终分类器包括训练集，其包括附录A、附录B或附录C中列出的特征集的特征值。在一个可能的实施方案中，所述方法可以包括从附录A的特征列表中取消选择对分类器性能没有贡献的特征并且使用缩减的特征列表来执行步骤3)、4)和5)的步骤。这样的缩减的特征列表可以采取附录B的集合的特征列表的形式或者附录C中的特征列表的形式。

在又一个实施方案中，公开了治疗黑素瘤患者的方法。所述方法包括执行所述的预测患者是否将受益于如上所述的阻断PD-1的配体活化的抗体药物的方法，并且如果患者具有其血液样本的晚期或等效物的类别标记，则执行向患者施用抗体药物的步骤。

在又一方面，公开了一种改进的通用计算机，其被配置为用于将来自人类癌症患者的血液样本进行分类的分类器，以便对于患者的存活或从药物获得益处的相对可能性进行预测。改进是以存储器的形式，所述存储器以从用免疫检查点抑制剂治疗的多个黑素瘤患者的血液样本的质谱分析获得的多个质谱特征的特征值的形式来存储参考集，和参考集中的每个血液样本的相关联类别标记。血液样本的数据形成用于开发分类器的集合。存储器进一步存储基于多个主分类器来定义最终分类器的一组计算机可执行代码，每个主分类器从一组经过滤的小型分类器生成，所述小型分类器执行分类算法，并使用正则化组合方法例如极值丢弃和逻辑回归来组合。多个主分类器是通过将开发集分离成分类器训练和测试集的许多不同的实现方式来获得的。该改进还包括中央处理单元，该中央处理单元对代码集、参考集和从待测试的癌症患者的血液样本获得的质谱数据进行操作，并生成血液样本的类别标记。

在一个实施方案中，存储器存储附录A中列出的至少50个特征的特征值。在另一个实施方案中，存储器存储缩减特征集的特征值，诸如附录B中列出的方法或附录C的特征列表之一的特征。

在一个实施方案中，免疫检查点抑制剂包含阻断PD-1配体活化的抗体。在另一个实施方案中，免疫检查点抑制剂包含阻断CTLA4 配体活化的抗体。

在更进一步的方面中，描述了一种实验室测试中心，所述实验室测试中心包括用于进行来自癌症患者的血液样本的质谱分析的质谱仪和被配置为分类器并且存储本文所述的质谱数据的参考集的机器。

在下面的实施例9中进一步描述了分类器开发的一般扩展，以便设计分类器集群的开发集，用于探索不同的临床组，例如不同比例的患有大肿瘤和小肿瘤的患者。在一个实施方案中，公开了一种从患者样本集生成分类器集群的方法，包括以下步骤：

a.从所述患者样本集来定义多个分类器开发样本集，其中每一个样本集具有不同的临床特征(例如具有大或小肿瘤的患者的比例或其他相关的临床分组)；

b.对于所述患者样本集进行质谱分析并存储质谱数据；

c.使用程控计算机，使用在步骤a.中定义的开发集中的每一个的质谱数据进行分类器开发练习，并将由此生成的分类器的参数存储在与计算机相关联的存储器中，从而生成分类器的集群；和

d.定义一个规则或一组规则，所述规则用于通过在步骤c.中生成的分类器的集群对于经受分类的测试样本生成类别标记。实施例8 和9中还公开了使用根据此方法生成的分类器集群来测试样本的方法。在这个方法中，步骤b.可以在步骤a.之前或之后执行。

虽然在实施例中详细描述了在黑素瘤和抗PD-1和抗CTLA4抗体药物方面的发现，但是在下面详细阐述的与类别标记相关的蛋白质研究使得能够推广这些发现。具体而言，我们可以预期，实施例1、实施例2和实施例3的分类器可能有关/适用于影响患者免疫学状态的多种药物，例如各种免疫检查点抑制剂、高剂量IL2、疫苗和/或组合治疗，例如抗PD-1和抗CTLA4组合治疗。此外，由于在血清中测量的效应反映整个生物体状态，并且发现与这些发现相关的补体系统不仅在肿瘤部位中，而且在全局水平上影响先天性和适应性免疫，因此预期分类器在不同适应症(例如肺癌、肾癌)中具有相似的性能，并且不限于黑素瘤。

另一方面，描述了一种分类器生成方法，包括以下步骤：

a)从开发样本集获得物理测量数据，并将测量数据提供给通用计算机，每个样本进一步与临床数据相关联；

b)基于临床数据、在开发集内识别多个不同的临床亚组1...N；

c)对于每个不同的临床亚组，根据与这些临床亚组相关联的开发集的每个成员的测量数据来进行分类器生成过程，从而生成临床亚组分类器C1...CN；和

d)在计算机的存储器中存储涉及步骤c)中开发的所有分类器 C1...CN的分类程序，每个分类器与参考集相关联，所述参考集包括用于生成分类器的开发集中的样本和相关测量数据。

另一方面，公开了一种多级分类器，其包括程控计算机，所述程控计算机实施对存储在存储器中的测试样本的质谱数据进行操作的分级分类器结构，并利用存储在存储器中的经类别标记的质谱数据的参考集。分类器包括(a)第一级分类器，用于将测试质谱数据分层成早期或晚期组(或者等效物，名称不重要)；(b)第二级分类器，用于将第一级分类器的早期组进一步分层为早期和晚期组(或更早期和更晚期组，或等效物)，如果第一级分类器将测试质谱数据分类至早期组，则执行第二级，并且第二级分类器产生的早期类别标记与异常不良预后相关；以及(c)第三级分类器，用于进一步将第一级分类器的晚期组分层成早期和晚期组(或更早期和更晚期组，或等效物)。如果第一级分类器将测试质谱数据分类到晚期组，则实施第三级分类器，其中由第三级分类器产生的晚期类别标记(或更晚期或等效物)与特别好的预后相关联。

在一个实施方案中，第三级分类器包括从用于生成第一级分类器的分类器开发集的一个或多个不同临床亚组开发的一个或多个分类器。在一个实例中，第三级分类器包括至少四个不同的分类器C1、 C2、C3和C4，每个分类器从不同的临床亚组来开发。在一个具体的实施方案中，其中多级分类器被配置为预测卵巢癌患者可能或不可能从铂化疗中受益，并且其中分类器C1、C2、C3和C4是从以下临床亚组开发的：

C1：从具有非浆液性组织学或浆液性组织学，伴有未知FIGO评分的患者的子集开发而来；

C2：从未用于开发分类器C1的具有浆液性组织学的患者的子集开发而来；

C3：从在手术后具有残余肿瘤的患者的子集开发而来；

C4：从在手术后没有残余肿瘤的患者的子集开发而来。

在又一方面，已经发现了一种产生分类器的方法，所述分类器用于将来自开发样本集的测试样本分类，每个样本与临床数据相关联。所述方法包括以下步骤：

(a)根据临床数据将开发样本集划分为不同的临床亚组1...N，其中N是至少2的整数；

(b)针对每个不同的临床亚组1...N执行分类器开发过程(例如图8的过程)，从而生成不同的分类器C1...CN；和

(c)定义最终的分类过程，其中由分类器C1...CN对患者样本进行分类。

又一方面，发现了一种产生用于将测试样本分类的分类器的方法，包括以下步骤：

(a)使用分类器开发过程，从开发样本集的测量数据生成第一分类器；

(b)使用第一分类器对开发样本集的测量数据进行分类，从而为开发样本集的每个成员分配二元分类方案中的类别标记(早期/晚期或等效物)；和

(c)使用分类器开发过程生成第二分类器，其中输入分类器开发集是通过第一分类器来分配二元分类方案中的两个类别标记中的一个(例如，早期组)的开发集的成员，从而第二分类器将具有第一类别标记的集合的成员分层为两个另外的亚组。所述方法可选地包括以下步骤：(d)将开发样本集划分为不同的临床亚组1...N，其中N是至少 2的整数；和(e)针对每个不同的临床组1...N重复分类器开发过程，从而生成不同的第三分类器C1...CN；和(f)定义分级分类过程，其中：

i.患者样本首先通过在步骤a)中生成的第一分类器来分类；

ii.如果第一分类器分配的类别标记是用于生成第二分类器的类别标记，则患者样本用第二分类器来分类；和

iii.如果第一分类器分配的类别标记不是用于生成第二分类器的类别标记，则患者样本用第三分类器C1...CN来分类；和

iv.作为分类步骤ii或步骤iii的结果，分配最终标记。

下面的实施例6描述了将特定质谱特征与血清中循环的蛋白质功能组相关联的能力，并使用这种相关性来训练分类器或监测生物过程中的变化。在一个实施方案中，公开了一种训练分类器的方法，包括以下步骤：

a)从受试者群体获得开发样本集，并且可选地从类似但不一定相同的受试者群体获得第二独立样本集；

b)对于所述开发样本集并且任选地对于所述第二样本集来进行质谱分析，并识别所述样本集的质谱中存在的质谱特征；

c)对于所述开发样本集中的每个样本或任选地所述第二样本集中的每个样本，从涵盖所关注的生物功能的大组蛋白质来获得蛋白质表达数据；

d)使用基因集富集分析方法，识别所述质谱特征中的一个或多个与按照其生物功能来分组的蛋白质组合之间的统计学显著关联；和

e)在计算机辅助下，利用在步骤d)中识别的一个或多个质谱特征、基于开发样本集来训练分类器，所述分类器呈一组参数的形式，所述参数根据程序指令向与开发样本集相同类型的样本分配类别标记。

在一个实施方案中，分类器是呈经受正则化程序的经过滤的小型分类器的组合的形式。开发集和任选的第二样本集中的样本是血液样本，例如来自人类患者的血清或血浆样本。

另一方面，公开了一种分类器开发系统，其包括：质谱仪，所述质谱仪用于对开发样本集和可选地第二独立样本集进行质谱分析，以生成质谱数据，所述数据包括多个质谱特征；平台，所述平台用于对开发样本集或任选的第二独立样本集进行基因集富集分析，并且识别一个或多个质谱特征与按照其生物功能来分组的蛋白质组的统计学显著关联；以及计算机，所述计算机被编程为使用由所述平台识别的一个或多个质谱特征针对所述开发样本集来训练分类器，所述分类器呈一组参数的形式，所述参数根据程序指令向与开发样本集相同类型的样本分配类别标记。在优选的实施方案中，开发样本集和可选的第二独立样本集是来自人类的血液样本。例如，用于开发样本集的血液样本获自用免疫治疗药物例如纳武单抗治疗之前获得的黑素瘤患者。

附图简述

图1显示用纳武单抗治疗的119名黑素瘤患者群组的进展时间 (TTP)(图1A)和总体存活(OS)(图1B)的Kaplan-Meier图，其中可获得的临床数据和光谱来自治疗前样本。

图2A和2B分别是所有119名患者的事件时间数据(TTP和OS) 的Kaplan-Meier图，其中可获得的临床数据和光谱来自按照以前治疗来分类的治疗前样本(以前没有使用伊匹单抗，以前使用伊匹单抗)。结果差异无统计学意义。

图3A和3B分别是所有119名患者的事件时间数据(TTP和OS) 的Kaplan-Meier图，其中可获得的临床数据和光谱来自群组5的患者的显示相对好结果的治疗前样本。

图4A和图4B是显示了所有119名患者的事件时间数据的 Kaplan-Meier图，其中可获得的临床数据和光谱来自被分为开发(N＝ 60)和验证(N＝59)集的治疗前样本(“DEV1”)；图4C和4D是所有119 名患者的事件时间数据的Kaplan-Meier图，其中可获得的临床数据和光谱来自被分成开发(N＝60)和验证(N＝59)集的治疗前样本，并将样本第二次分成开发和验证集(“DEV2”)。

图5是作为疾病控制(DC)的函数的区间正则化标量的图；区间方法用于比较所关注的临床组之间的正则化标量，以确保用于分类的窗口不被用于部分离子电流正则化。

图6是来自多个样本的质谱图，其显示在所关注的m/z范围内定义的若干特征定义；不同的临床性能组用形成鲜明对比的线性约定来显示。

图7是对于用于分类器生成的最终特征表中的特征执行的部分离子电流正则化，作为DC的函数的区间正则化标量的图。

图8A-8B是用于从纳武单抗试验中的黑素瘤患者的119个血清样本的样本集来开发本公开的黑素瘤/纳武单抗分类器的分类器开发过程的流程图。

图9-12是显示使用图8的分类器开发程序在实施例1中开发的分类器的分类器性能的Kaplan-Meier图。

图9A和9B分别显示了用于开发集的“方法1”(参见表10)的早期和晚期类别组的OS和TTP的Kaplan-Meier图，图9C和9D分别显示了用于验证集的方法1(参见表10)的早期和晚期类别组的OS和 TTP的Kaplan-Meier图。

图10A和10B分别显示了用于开发集的“方法2”(参见表10)的早期和晚期类别组的OS和TTP的Kaplan-Meier图，图10C和10D显示了OS的Kaplan-Meier图和TTP分别由早期和晚期类别组进行方法 2(参见表10)的验证集。

图11A和11B分别显示了用于开发集的“方法3”(参见表10)的早期和晚期类别组的OS和TTP的Kaplan-Meier图，图11C和11D分别显示了用于验证集的方法3(参见表10)的早期和晚期类别组的OS 和TTP的Kaplan-Meier图。

图12A和12B显示用于开发集的“方法4”(参见表10)的早期和晚期类别组的OS和TTP的Kaplan-Meier图，图12C和12D显示用于验证集的方法4(参见表10)的早期和晚期类别组的OS和TTP的 Kaplan-Meier图。

图13A和13B分别示出了表13中所示的第一种方法的早期和晚期类别组的OS和TTP的Kaplan-Meier图，所述第一种方法应用于作为根据图8的分类器生成的开发集(100)的全部119个样本集。图13C 和13D分别示出了表13中所示的第二种方法的早期和晚期类别组的OS和TTP的Kaplan-Meier图，所述第二种方法应用于作为根据图8 的分类器生成的开发集(100)的全部119个样本集。

图14是用于分析用抗PD-1抗体治疗的耶鲁群组患者的 Kaplan-Meier图，这个群组是用于验证使用图8开发的实施例1的分类器的独立样本集。

图15是包括质谱仪和通用计算机形式的机器的实验室测试中心的图示，所述通用计算机用于预测黑素瘤患者从阻断PD-1的配体活化的抗体药物中受益。

图16A和16B分别是ACORN NSCLC群组的所有173名非小细胞肺癌(NSCLC)患者的无进展存活(PFS)和总体存活(OS)的 Kaplan-Meier图，其中可获得临床数据和光谱来自治疗前样本。使用 ACORN NSCLC群组来开发和调整实施例2的分类器，以预测纳武单抗对黑素瘤患者有益。

图17A和17B是ACORN NSCLC群组的三个不同子集的无进展存活PFS和总体存活OS的图。在实施例2的分类器的生成中，使用一个子集(图中的“附加过滤”)来过滤小型分类器。使用一个子集(图中的“测试”)与黑素瘤开发样本集一起测试分类器性能。另一个子集(图中的“验证”)被用作内部验证集，除了已经为此目的而保持的黑素瘤子集外。图17A和17B的图中的相似性指示“附加过滤”子集的存活数据是其他子集的代表。

图18A-18H是样本开发和内部验证集的OS和TTP或PFS的 Kaplan-Meier图。具体而言，图18A-18D是黑素瘤/纳武单抗群组的开发和验证集的OS和TTP图。注意，图18A-18D显示了通过实施例2的分类器来标记为早期和晚期的样本在存活图方面的分离。图 18E-18H是ACORN NSCLC化疗群组的开发和验证集的OS和PFS 图。请注意，对于通过实施例2的分类器来标记为早期和晚期的样本来说，ACORN NSCLC群组中的图(图18E-18H)显示了相似的OS和PFS。

图19是用抗PD-1抗体治疗的患者的独立验证群组(耶鲁抗PD-1 群组)的Kaplan-Meier图，显示通过实施例2分类器来标记为早期和晚期的患者样本的OS图的分离。

图20是用抗CTLA4抗体治疗的黑素瘤患者的独立耶鲁验证群组的Kaplan-Meier图，显示了通过实施例2的分类器来标记为早期和晚期的患者样本的OS图的分离。

图21A和21B是手术后用铂-双联化学疗法治疗的卵巢癌患者的独立验证群组的OS(图21A)和无病存活(DFS，图21B)的Kaplan-Meier 图。与图18E-18G的图相似，图21A和21B的图显示了其样本通过实施例2的分类器来分类为早期或晚期的卵巢癌患者的OS和DFS 没有分离。

图22是耶鲁抗CTLA4群组的总体存活的Kaplan-Meier图。

图23是对于实施例1的“全集”分类器的抗CTLA4抗体治疗的耶鲁黑素瘤患者群组的Kaplan-Meier图，参见下表13。图23与图20 的相似之处在于，两个图均显示本公开的实施例1和实施例2的分类器能够预测黑素瘤患者在用抗CTLA4抗体治疗时具有相对较好或较差的结果。图23A和23B是从耶鲁抗-CTLA4群组开发的第二抗CTLA4抗体分类器的分类器性能的Kaplan-Meier图。

图24A和24B分别是用于开发实施例2的分类器的ACORN NSCLC群组的OS和PFS的Kaplan-Meier图。

图25A和25B分别是ACORN NSCLC群组的OS和PFS的 Kaplan-Meier图，其通过由实施例1的“全集”分类器产生的分类进行分类。注意在图25A中，通过实施例1的全集分类器来分类为早期和晚期的样本之间的总体存活图中的明显分离。在图25B中也显示早期和晚期类别样本之间的PFS分离。

图26A和26B是ACORNNSCLC群组通过分类和VeriStrat标记 (根据美国专利7,736,905的分类器和训练集来分配)的Kaplan-Meier 图。请注意，在通过实施例1的全集分类器来分类为早期的VeriStrat 良好(VS-G)和较差(VS-P)样本之间基本上没有分离，并且在由实施例 1的全集分类器分类为晚期的样本和分类为早期的样本之间有存活图中的明显分离。

图27A和27B是用于实施例2的分类器的内部验证的138名患者的卵巢癌化疗群组的OS和DFS的Kaplan-Meier图。

图28A和28B分别是通过实施例1的“全集”分类器产生的分类的卵巢癌化疗群组的OS和DFS的Kaplan-Meier图。注意在图28A 中，在通过实施例1的全集分类器分类为早期和晚期的样本之间有总体存活图中的明显分离。图28B也显示了早期和晚期类别样本之间在DFS中的明显分离。因此，这些图显示了实施例1的全集分类器预测化疗中卵巢癌存活的能力。

图29A和29B是卵巢癌化疗群组通过分类和VeriStrat标记的 Kaplan-Meier图。请注意，通过实施例1的全集分类器来分类为早期并且作为VeriStrat良好(VS-G)和较差(VS-P)来测试的样本之间基本上没有分离，并且在由实施例1的全集分类器分类为晚期的样本和分类为早期的样本之间有存活图中的明显分离。与NSCLC患者群组一样，很明显在分类为早期的患者组内，VeriStrat亚组之间的结果是相似的。

图30A-30F是初始(在治疗前，本文中为“基线”)在图30A和30B 中显示，在治疗7周后(WK7)如图30C和30D所示，以及13周后 (WK13)如图30E和30F所示，通过实施例1的全集分类器产生的按照早期和晚期组来分类的Kaplan-Meier图。

图31A和31B分别是由实施例1全集分类器产生的按照基线、 WK7和WK13三元分类来分组的总体存活和进展时间(TTP)的 Kaplan-Meier图。其他标记组合的患者太少，无法进行有意义的分析。

图32A和32B分别是总体存活和进展时间(TTP)的Kaplan-Meier 图，其显示了根据实施例2分类器产生的基线、WK7和WK13三元分类将患者分组时的结果。(E＝早期，L＝晚期)

图33A和33B是实施例1的开发样本集的104名患者的子集的 Kaplan-Meier图，显示了来自实施例1全集分类器产生的初始分类 (“初始”)和由新的“大”和“小”肿瘤分类器产生的分类(“TS调整”)的早期和晚期标记的患者。

图34A和34B分别是使用分类器分类为更早期和更晚期组的47 名早期患者(根据实施例1全集方法1分类器来分类)的总体存活和进展时间(TTP)的Kaplan-Meier图，所述分类器将这47个样本作为其开发集。将更早期类别组中的患者从产生分类器的开发样本集中移除，所述分类器考虑肿瘤大小。

图35A和35B是实施例1的初始开发集中的所有119个样本的 Kaplan-Meier图，其中通过仅使用大肿瘤开发的分类器对大肿瘤进行分类，通过仅使用小肿瘤开发的分类器对小肿瘤进行分类，并且将早期进展患者(图34的早期/更早期患者)分类为早期(其初始实施例1全集方法1分类)。这些组标记为“最终”，并与实施例1全集分类器(“初始”)产生的组进行比较。

图36A和36B是显示黑素瘤患者的类别识别的瀑布图，这些患者在用纳武单抗治疗的过程中具有增加或减小的肿瘤大小。图36A 显示了大肿瘤和小肿瘤分类器的数据，所述分类器将开发样本集的成员(在移除快速进展的患者之后)和快速进展的患者分类，并且利用分类为早期(“最终”)的可获得的肿瘤大小改变数据，而图36B示出了实施例1的全集分类器的数据。

图37是显示从开发样本集开发小肿瘤和大肿瘤分类器的过程的流程图。

图38是显示根据图37产生的大肿瘤和小肿瘤分类器如何用于测试癌症患者的样本的流程图，这取决于患者具有大肿瘤还是小肿瘤。

图39是示出了从开发集中移除快速进展样本的方法的流程图，图37的步骤3702。

图40A和40B分别是由7个分类器集群生成的分类的总体存活和进展时间的Kaplan-Meier图，其中每个分类器基于具有不同临床分组的不同分类器开发集(在此实施例中基于肿瘤大小)并且根据图8生成。分类器的集群由实施例1中描述的119个患者样本产生。一组规则定义了由分类器集群产生的标记的类别标记，如“较差”、“良好”和“其他”，其可以用于引导黑素瘤患者治疗，如以下实施例9中所解释。

图41是对于抗PD-1治疗验证群组中的30个样本，由实施例9 的7个分类器的集群构成的测试获得的分类的总体存活的 Kaplan-Meier图。

图42是对于用抗PD1单一疗法(纳武单抗)来治疗的黑素瘤患者以及用伊匹单抗和纳武单抗组合疗法来治疗的黑素瘤患者，由实施例 8的7个分类器的集群产生的良好和不好类别标记的总体存活的 Kaplan-Meier图。该图显示，与使用纳武单抗+伊匹单抗组合疗法的患者相比，具有良好类别标记的纳武单抗患者具有非常相似的存活。

图43是针对一个蛋白质组S_l在基因集富集分析(GSEA)中计算的运行总和(RS)评分(RS(S_l,p))的图的实例。

图44A和44B是在GSEA中使用的富集评分(ES)的两个定义的零点分布的实例，显示了计算的ES和经评估以确定p值的区域。

图45A和45B是“热图”，即由GSEA产生的p值的图，其将实施例1和6的纳武单抗研究中的全部351个定义质谱特征(附录A)与蛋白质功能组相关联。图45A是ES定义1的热图，图45B是ES定义2的热图。在x轴上只标记每个第5个光谱特征。

图46是实施例6的最终分类程序的概要。

图47A和47B示出了来自实施例6分类器1的分类组的黑素瘤/ 免疫治疗新分类器开发(NCD)群组的总体存活(OS)(图47A)和进展时间(TTP)(图47B)的Kaplan-Meier图。

图48A和48B分别示出了对于未被分类器1分类为“早期”的68 个样本，来自实施例6的分类器2的分类组的OS和TTP的 Kaplan-Meier图。

图49A和49B分别示出了通过由图46的分类器概要产生的总体分类的全部119个样本的OS和TTP的Kaplan-Meier图。

图50A-50D示出将实施例6中开发的分类器(“当前”)与实施例 1(图50A和50B分别为OS和TTP)(“IS2”)和实施例8(图50C和50D 分别为OS和TTP)(“IS6”)中开发的分类器的性能进行比较的 Kaplan-Meier图。

图51是实施例6的验证群组按照分类组的OS的Kaplan-Meier 图。

图52是分类器训练系统的框图，所述分类器训练系统包括：用于对于开发样本集(未示出，例如血清或血液样本)进行质谱分析的质谱仪；GSEA平台，包括蛋白质测定系统和具有GSEA分析模块的计算机；和计算机，所述计算机被编程为使用开发样本集中的与所关注的生物过程的特定蛋白质功能组相关联的质谱峰的多个集合来进行分类器训练程序。

图53A和53B是具有可获得临床数据和质谱数据的138名卵巢癌患者群组的无病存活(DFS，图53A)和总体存活(OS，图53B)的事件时间数据的Kaplan-Meier图，所述群组被用于开发实施例9的卵巢分类器。

图54A和54B是示出从开发样本集开发分类器的计算机实现的程序的流程图。在实施例9中，针对开发样本集的不同配置或子集执行图54A和54B的程序(直到并包括步骤350)不同次数，以导致创建分层或分级系列的分类器(被称为作为分类器A、B和C)，这将在实施例9的描述中更详细地解释。

图55A和55B是实施例9的卵巢开发样本集中的129名患者的事件时间数据的Kaplan-Meier图，所述患者具有可获得的临床数据、 DFS>1个月，以及来自治疗前样本的质谱数据，显示将样本集划分为开发(N＝65)和验证(N＝64)集。图55A显示了DFS图；图55B显示了OS图。请注意，开发和验证样本集的图基本上是相同的。

图56A-56D是对于分成开发和验证集的129名患者，通过实施例9的第一层或“分类器A”分类器产生的早期和晚期类别组的OS和 DFS的Kaplan-Meier图。图56A是开发集的OS图；图56B是开发集的DFS图；图56C是验证集的OS图；图56D是验证集的DFS图。

图57A和57B是对于全部138个样本运行的实施例9的“分类器 A”，早期和晚期类别组的OS和DFS的Kaplan-Meier图。

图58A和58B分别是对于开发分类器B的开发样本集的子集，由实施例9的分类器B分类器产生的分类组的OS和DFS的 Kaplan-Meier图。

图59是示出从实施例9的第一层“分类器A”分类器来分类为“早期”的那些开发集样本生成第二层分类器(“分类器B”)的过程的流程图。

图60是示出实施例9的第三层分类器C的生成过程的流程图；在这个特定的实例中，第三层由几个不同的分类器组成，每个分类器基于开发样本集的不同的和临床上独特的子集。

图61是示出第三层分类器C的结构以及如何可以基于第三层的每个成员的分类结果来生成“良好”类别标记的图。

图62是示出由三级分级分类器组成的最终分类器的结构的图或概要。

图63是示出替代最终分类器的结构的图或概要，其中三级分级分类器的第三级由从临床上不同的亚组开发的四个单独的分类器组成。

图64A和64B分别是使用图63和实施例9的最终分类器结构对于开发样本集产生的分类组的OS和DFS的Kaplan-Meier图。

图65A-65C是对于生物功能急性反应(图65A)、伤口愈合(图65B) 和补体系统(图65C)，作为来自实施例10的PC指数(方差降序)的函数的由每个主成分(PC)解释的“PROSE-厄洛替尼”数据集方差的平均百分比。

图66A-66D是实施例10中描述的四个样本集中的急性反应评分的分布。在图66A-66D所示的结果中，确定了二十九个质谱特征与 AR生物功能相关并用于计算相应的评分。

图67A-67D是在四个样本集中的急性反应评分的分布：“PROSE- 厄洛替尼”(具有可用的IS2标记的85个样本)，图67A；“PROSE-化疗”(含有可用IS2标记的122个样本)，图67B；“Moffitt”，图67C；和“Moffitt-7周”，图67D。图67A-67D还显示了来自实施例1分类器的样本的通过IS2类别标记来划分的评分。

图68A-68D是“PROSE-厄洛替尼”样本集的OS、PFS的 Kaplan-Meier图，图68A-68B，“PROSE-化疗”集合中的OS和PFS 的Kaplan-Meier图，图68C-68D是“Moffitt”集合中的OS和TTP的 Kaplan-Meier图，图68E-68F是根据如图中所示定义的AR评分阈值来定义的组。在每个图下方示出了每组中的样本的相应数量、风险比 (HR)、对数秩p值和中位数。

图69A-69D是在基线(治疗前)和第7周(治疗后)通过组合IS2标记来分组的Moffitt和Moffitt-7周集合中的107名患者的急性反应评分随时间的演变的图示。图中的每条线代表单个患者的评分。图69A 是在基线和第7周具有早期类别标记的患者的图；图69B是在基线和第7周具有晚期类别标记的患者的图；图69C是在基线具有早期和在第7周具有晚期类别标记的患者的图，并且图69D是在基线具有晚期和在第7周具有早期类别标记的患者的图。

图70A-70C是根据治疗反应来分组的具有“Moffitt”和“Moffitt-7 周”集合中的样本的107名患者的急性反应评分的演变图。每条线代表一个患者。图70A是PD：进行性疾病治疗反应的图；图70B是 PR：对治疗的部分反应的图，图70C是SD：稳定疾病治疗反应的图。

图71A和71B分别是根据AR评分增加还是有小的变化或降低而分组的在“Moffitt”和“Moffitt-7周”集合中的样本的OS和TTP的 Kaplan-Meier图。图显示AR评分的变化具有预后意义。

图72A-72D是实施例10中描述的四个样本集的伤口愈合评分的分布图。

图73A-73D是通过在基线(治疗前)和第7周(治疗后)的组合IS2 标记来分组的Moffitt和Moffitt-7周集合中的107名患者的伤口愈合评分随时间的演变的图示。图中的每条线代表单个患者的评分。图 73A是在基线和第7周具有早期类别标记的患者的图；图73B是在基线和第7周具有晚期类别标记的患者的图；图73C是在基线具有早期和在第7周具有晚期类别标记的患者的图，并且图73D是在基线具有晚期和在第7周具有早期类别标记的患者的图。

图74A-74C是根据治疗反应分组的具有“Moffitt”和“Moffitt-7周”集合中的样本的107名患者的伤口愈合评分的演变图。每条线代表一个患者。图74A是PD：进行性疾病治疗反应的图；图74B是PR：对治疗的部分反应的图，图74C是SD：稳定疾病治疗反应的图。

图75A-75D是实施例10中描述的四个样本集的补体系统评分的分布图。

图76A-76D是在基线(治疗前)和第7周(治疗后)通过组合IS2标记分组的Moffitt和Moffitt-7周集合中的107名患者的补体系统评分随时间的变化的图示。图中的每条线代表单个患者的评分。图76A 是在基线和第7周具有早期类别标记的患者的图；图76B是在基线和第7周具有晚期类别标记的患者的图；图76C是在基线具有早期和在第7周具有晚期类别标记的患者的图，并且图76D是在基线具有晚期和在第7周具有早期类别标记的患者的图。

图77A-77C是根据治疗反应分组的具有“Moffitt”和“Moffitt-7周”集合中的样本的107名患者的伤口愈合评分的演变图。每条线代表一个患者。图77A是PD：进行性疾病治疗反应的图；图77B是PR：对治疗的部分反应的图，图77C是SD：稳定疾病治疗反应的图。

图78A-78D是OS、PFS(“PROSE-化疗”)，图78A-78B是OS和 TTP(“Moffitt”集合)的Kaplan-Meier图，图78C和78D是由PROSE 集合中的三分位定义的AR评分阈值来定义的组。在每个图下方示出了每组中的样本的相应数量、风险比(HR)、对数秩p值和中位数。

图79A和79B是从根据图8的程序开发的分类器获得的分类组早期和晚期的Kaplan-Meier图，但是代替使用质谱特征，用于分类的特征是实施例10的生物功能评分，在这个实例中是急性反应评分、伤口愈合评分和补体评分。

图80是用于产生样本集的实施例10的生物功能评分的系统的示意图。

图81是显示从质谱数据计算实施例10的生物功能评分的步骤的流程图。

图82是用于计算实施例10的生物功能评分的样本集ss的部分特征表F^ss的图示。

图83是用于计算实施例10的生物功能评分的平均第一主成分向量

的图示。

详述

这个文件中公开了一种实用测试(方法)，用于预测癌症患者是否可能受益于免疫检查点抑制剂的施用，例如阻断活化的T细胞上的 PD-1的配体活化的单克隆抗体药物，例如纳武单抗。所述方法利用治疗前获得的患者的血清或血浆样本的质谱，以及配置为分类器的通用计算机，所述分类器将向质谱分配类别标记。类别标记可以采取“早期”或等效物，或“晚期”或等效物的形式，类别标记“晚期”指示患者是一类患者的成员，与具有“早期”类别标记的一类患者的成员相比，这类患者可能获得相对较大益处。用于类别标记的特定名称并不特别重要。

总体存活是评估阻断PD-1的配体活化的抗体药物的益处的主要指标。因此，当考虑早期和晚期标记的含义时，在一个优选的实施方案中，与晚期标记相关的“相对较大的益处”是指与具有早期类别标记的患者相比，其样本被分配了晚期标记的患者可能具有显著更大(更长)总体存活。

术语“阻断PD-1的配体活化的抗体药物”意图不仅包括结合这个 PD-1的抗体，还包括结合至配体(PD-L1和PD-L2)的那些抗体。抗 PD-L1或抗PD-L2单克隆抗体(mAb)也会阻断PD-1的配体活化。术语“免疫检查点抑制剂”意图包括阻断PD-1的抑制剂以及阻断 CLTA-4的抑制剂。术语免疫检查点抑制剂或“检查点阻断剂”被定义为靶向CTLA4样受体及其配体的免疫调节性mAb。参见Galluzzi L, Kroemer G,Eggemont A.Novel immune checkpointblocker approved for the treatment of advanced melanoma.Oncoimmunology 2014；3:e967147。FDA批准的此类药物包括伊匹单抗(抗CTLA4)、纳武单抗(抗PD-1)和派姆单抗(抗PD-1)。在过去13个月中发表的几篇出版物/摘要报告了涉及额外的检查点阻断剂(例如CTLA4-靶向mAb曲美木单抗(tremelimumab)、PD-1-靶向mAb pidilizumab和PD-L1-靶向mAb MEDI4736(durvalumab)、MPDL3280A(阿特珠单抗)和 MSB0010718C(avelumab)。参见Buqué A，Bloy N,Aranda F,Castoldi F,Eggermont A,Cremer I,Fridman WH,FucikovaJ,Galon J,Marabelle A,Spisek R,Tartour E,Zitvogel L,Kroemer G,GalluzziL.Trial Watch: Immunomodulatory monoclonal antibodies for oncologicalindications Oncoimmunology.2015Mar 2；4(4)。上面引用的科学出版物的内容通过引用并入本文。

实施例1解释了从黑素瘤/纳武单抗样本集来开发分类器，并提供了分类器性能的细节。

实施例2解释了实施例1的再开发，所述分类器经过调整以便对于纳武单抗有益于患者更具预测性和更少预后性。

实施例3解释了分类器的开发，所述分类器预测黑素瘤患者受益于另一免疫检查点抑制剂抗-CTLA4抗体。

实施例4解释了根据实施例1开发的分类器如何还能够预测非小细胞肺癌(NSCLC)和卵巢癌患者是否可能具有来自化疗的相对较高或较低的总体存活率。

实施例5和图15描述了用于在治疗之前对来自患者的血液样本进行本公开的测试的实际测试环境。

实施例6描述了在使用基因集富集分析的实施例1和实施例2分类器中与早期和晚期类别标记相关的蛋白质的研究，其允许将这些发现推广到其他免疫检查点抑制剂和其他类型的癌症，并且基于与特定蛋白质功能组相关的质谱特征来生成分类器。

实施例7描述了来自实施例1的患者样本的纵向研究，以及尤其如何使用由分类器产生的类别标记的变化来监测治疗效果并引导治疗。

实施例8描述了从实施例1开发样本集群体的不同临床子集来产生的分类器的集群，在该实施例中，所述开发样本集群体是具有大肿瘤和小肿瘤的黑素瘤患者。

实施例9进一步提供了从临床不同开发集来开发分类器集群的进一步实例，包括来自实施例的纳武单抗/黑素瘤集合的分类器集群的第一个实例和来自用化学疗法治疗的卵巢癌患者的研究的第二个实例。

实施例10描述了使用质谱数据来测量生物功能评分的方法。实施例10进一步描述了四种不同样本集中测量生物功能评分，每个血液样本来自患有癌症的人。实施例10描述了如何使用评分来引导治疗并且使用生物功能评分作为用于分类器训练的特征来构建分类器，例如使用图8的程序。实施例10还建立在实施例6中描述的发现上，包括生物功能与质谱峰的相关性。

实施例1

用于预测黑素瘤患者受益于阻断PD-1的配体活化的抗体药物的分类器和方法

从纳武单抗治疗黑素瘤的临床试验中获得样本来开发实施例1 的分类器。在下面简要描述这个试验。然后描述获得的患者样本，用于从样本获得光谱的质谱方法，包括光谱处理步骤。这些质谱法程序优选地根据美国专利9,279,798中所述的所谓“深MALDI”方法，其内容通过引用并入本文。然后，详细描述一种分类器生成过程，所述过程被用来定义最终分类器，所述分类器可以根据测试来向光谱分配类别标记。还在下面描述了分类器生成过程的结果，并且证明了它能够向来自血液样本的质谱分配类别标记，从而预测提供样本的患者是否可能从抗体药物获得相对较大或较小的益处。

分类器生成方法使用所谓“具有丢弃正则化的小型分类器的组合”或CMC/D，其在2014年9月15日提交的未决的美国专利申请序列号14/486442中描述，所述专利申请公开为美国专利申请公开 2015/0102216，其内容通过引用并入本文。用于开发分类器的这个程序在本文中也被称为DIAGNOSTIC CORTEX，这是Biodesix公司的商标。请参见下面的图8的论述。通过将这个程序应用于使用深 MATLDI光谱采集获得的来自黑素瘤患者的血清治疗前光谱，可识别“早期”和“晚期”临床组。在用抗PD-1疗法纳武单抗来治疗后，这些组在结果(进展时间(TTP)和总体存活(OS))上显示出显著差异。参见图 9-14和下面的论述。已经提出了一种测试程序，所述程序用于从治疗前样本中识别这些组，并在内部验证集和外部验证集中验证结果(参见图14)。

与其血清分类为“晚期”的患者相比，其血清分类为“早期”的患者表现出显著更快的进展和更短的存活，使得该测试适合作为纳武单抗疗法的生物标志物。“早期”和“晚期”临床组与PD-L1表达无关，即使其他临床特征包括在多变量分析中时，这种分类仍然是结果(TTP和 OS)的重要预测指标。

虽然测试开发的相关方法并不有助于深入了解可用于解释所确定的组之间的差异的生物学，但是我们已经进行了一些初步研究，这些研究将两个不同的组与急性期反应物和补体系统的差异联系起来。这些研究在实施例1中并且随后在这个文件中的实施例6中阐述。该项目的成功例证了深MALDI光谱采集与我们创造性的分类器开发方法相结合能够构建临床上有用的实际测试。

临床试验

样本可用于新分类器开发的试验是在患有不能切除的III期或IV 期黑素瘤的患者中使用或不使用肽疫苗的情况下的纳武单抗研究。所述试验在J.S.Weber等人,Safety,Efficacy,Biomarkers ofNivolumab With Vaccine in Ipilimumab-Refractory or

Melanoma,J.Clin. Oncol.vol.31pp.4311-4318(2013)的论文中描述，其内容通过引用并入本文。参加试验的患者在以前接受至少一种治疗后经历了进展，但以前没有接受PD-1或PD-L1治疗。所述试验由6个患者群组组成。群组1-3入选未接受伊匹单抗治疗的患者，而群组4-6中的患者之前在以前接受伊匹单抗疗法后发生进展。除了纳武单抗之外，群组1-5 接受肽疫苗，群组6接受单独纳武单抗。群组5仅入选在接受伊匹单抗治疗时出现3级剂量限制性毒性的患者，而群组4和群组6中的患者仅经历最高2级剂量限制性伊匹单抗毒性。群组1-3的纳武单抗剂量不同(1mg/kg、3mg/kg或10mg/kg)。以前的治疗方案数量没有限制。所有患者具有ECOG体能状态(PS)0-1。

对于这个新的分类器开发项目的目的，不认为纳武单抗的剂量以及肽是否与纳武单抗一起被施用是非常重要的。

样本

可用于本研究的样本是治疗前血清样本。临床数据和光谱可从 119名患者获得。可用的结果数据包括进展时间(TTP)、总体存活(OS) 和反应。表1列出了来自治疗前样本的可用光谱的患者的基线临床特征。(乳酸脱氢酶(LDH)已知在许多癌症类型中具有预后意义，并且经常用作评估黑素瘤患者预后的重要因素。)

表1：具有可用光谱的患者的基线特征

*需要进一步的数据审查；

参见以前临时申请的附录D的细节，^x不适用于一名患者，

^xxULN＝正常范围的上限

图1A和1B分别显示119名具有基线样本和来自治疗前样本的所获得光谱的患者的群组的进展时间(TTP)和总体存活(OS)的 Kaplan-Meier图。注意：在TTP Kaplan-Meier图的平衡区段上的14 名患者中，3名(21％)有SD而不是PR的客观反应。

图2A和2B显示了具有来自治疗前样本的可用临床数据和光谱的所有119名患者的事件时间数据的Kaplan-Meier图，这些患者按照以前的治疗(以前未接受伊匹型单抗，即“未接受Ipi”；以前接受伊匹单抗))来分组。结果差异无统计学意义。

图3A和3B分别是具有来自治疗前样本的可用临床数据和光谱的所有119名患者的事件时间数据(TTP和OS)的Kaplan-Meier图，其显示在绝对意义上以及与未接受伊匹单抗的患者和以前用伊匹单抗治疗的其他患者相比，群组5中的患者的特别好的结果。应回想起，纳武单抗研究中的群组5涉及在伊匹单抗治疗之前或之后发生进展的患者，并且仅入选在其以前接受伊匹单抗治疗时经历3级剂量限制性毒性的患者。

从研究中获得的样本的相对较大数目(119)允许将样本分成开发集和用于分类器开发的内部验证集。研究了两种不同的划分。第一种划分方法(在下面的论述中称为“DEV1”)是通过类似VeriStrat的分类、反应、对TTP的审查和TTP来进行分层。第二种划分方法(在下面的论述中称为“DEV2”)是通过群组、类似VeriStrat的分类、反应、对 TTP的审查和TTP来进行分层。(“类似VeriStrat的分类”是指使用美国专利7,736,905中描述的VeriStrat测试的分类算法和训练集，向质谱分配“良好”或“较差”类别标记。将单个样本分配到验证集或开发集在以前临时申请序列号62/289,587的附录E中列出。在表2A和2B 中列出了用于开发和验证划分的临床特征，并且在图4A-4D中显示了开发和验证集之间的事件时间数据的比较。

表2A：划分为开发和内部验证集的具有可用光谱的患者的基线特征(“DEV1”)

表2B：划分为开发和内部验证集的具有可用光谱的患者的基线特征(“DEV2”)

图4A、4B、4C和4D中显示了开发和验证集的进展时间(TTP) 和总体存活(OS)的Kaplan-Meier图。具体而言，图4A和4B显示了根据第一种划分方法(“DEV1”)划分成开发(N＝60)和验证(N＝59)集的具有来自治疗前样本的可用临床数据和光谱的所有119名患者的事件时间数据；图4C和4D显示了根据第二种划分方法(“DEV2”)划分成开发(N＝60)和验证(N＝59)集的具有来自治疗前样本的可用临床数据和光谱的所有119名患者的事件时间数据。

样本制备

将血清样本解冻，并将每种测试样本(来自用纳武单抗治疗的患者)和质量控制血清(从5名健康患者的血清获得的合并样本，购自 ProMedDx，“SerumP3”)的3μl等分试样滴到VeriStrat TM纤维素血清卡(Therapak)上。在环境温度下使卡片干燥1小时，然后用6mm皮肤活检穿孔器(Acuderm)将全部血清斑点冲钻取出。将每个穿孔器放入具有0.45μm尼龙膜(VWR)的离心过滤器中。将100μl HPLC级水 (JT Baker)加入到含有穿孔器的离心过滤器中。将穿孔器轻轻涡旋10 分钟，然后以14,000rcf离心2分钟。将流出物移除并转移回到穿孔器上以便进行第二轮提取。对于第二轮提取，轻轻地将这些穿孔器涡旋三分钟，然后以14,000rcf离心两分钟。然后将来自每个样本的二十微升滤液转移到0.5ml埃彭道夫管中用于MALDI分析。

所有后续的样本制备步骤都在定制设计的湿度和温度控制室 (Coy Laboratory)中进行。温度设定为30℃，相对湿度为10％。

将等体积的新鲜制备的基质(每1ml 50％乙腈:50％水加上 0.1％TFA，25mg芥子酸)加入到每个20μl血清提取物中，并将混合物涡旋30秒。将样本:基质混合物的前三个等分试样(2×2μl)弃置到管帽中。然后将8个等分试样的2μl样本:基质混合物滴在不锈钢MALDI 靶板(SimulTOF)上。在放入MALDI质谱仪之前，允许MALDI靶在腔室中干燥。

将这个样本集分三批处理以便进行MALDI分析。在每个批次运行的开始(两个制备物)和结束(两个制备物)时，添加QC样本。

光谱采集

使用MALDI-TOF质谱仪(SimulTOF 100s/n:LinearBipolar 11.1024.01，来自Virgin Instruments,Sudbury,MA,USA)获得MALDI 光谱。该仪器设置为以正离子模式运行，使用以0.5kHz的激光重复率运行的349nm、二极管抽运、三倍频Nd:YLF激光器产生的离子。使用由胰岛素(m/z 5734.51Da)、遍在蛋白(m/z，8565.76Da)、细胞色素C(m/z 12360.97Da)和肌红蛋白(m/z 16952.30Da)组成的标准蛋白质混合物(Bruker Daltonics,Germany)来执行外部校准。

当平台以0.25毫米/秒的速度移动时，当激光器在点上连续照射时，来自每个MALDI点(每个样本8个点)的光谱作为800发射光谱来收集，将这些光谱“硬件平均化”。使用0.01V的最小强度阈值来丢弃任何“平坦线”光谱。在没有任何进一步处理的情况下获取强度高于这个阈值的所有800发射光谱。

MALDI-TOF质谱数据采集和处理(用于获取用于分类器开发的一组数据的目的以及为了确定患者益处而对样本执行测试)任选地根据H.

等人的美国专利9,279,798所述的所谓“深度MALDI”方法来执行，其内容通过引用并入本文。这个“798专利描述了令人惊讶的发现，即收集来自同一个MALDI点的许多次激光照射(通常 100,000至500,000或更多)并且将这些照射加以平均化或将来自同一个样本的多个点的累积光谱加以组合，导致噪声与信号的相对水平降低，并且来自复杂生物样本的质谱的大量附加光谱信息得以揭示。这个文件还表明，在点上的蛋白质内容物完全耗尽之前，可以对于单个点运行数十万次照射。其次，通过对许多照射进行平均化来减少噪声导致出现先前不可见的峰值(即，在由典型的1,000次激光照射产生的光谱上不明显的峰值)。甚至先前可见的峰变得界限更分明，并且当样本受到非常多照射时，这允许更可靠地测量峰值强度和样本之间的比较。本公开的分类器利用深MALDI方法来深入研究血清样本的蛋白质组，并使用相对大量的峰(数百个)进行分类，否则在从

照射质谱所获得的常规“稀释和照射”光谱中不可观察到这些峰。参见例如附录A中列出的分类特征值的定义。

本文件的以下部分描述了对于来自质谱仪的初始光谱来使用的光谱处理，以构建用于分类器生成的特征表。以下程序在接收来自质谱仪的光谱的通用计算机中的软件中执行。例如定义用于分类的特征的一些步骤可以由操作人员通过检查质谱数据的图来部分地或全部地执行。

光谱处理

栅格光谱预处理

重新定标

仪器校准会引起峰值位置(质量(m)/电荷(z)＝m/z)的剧烈移位，这些移位在各批次之间、在高质量区域中最明显。这导致无法一致地使用预定义的工作流来处理依赖于峰位置和所设定对准容差的数据。为了克服这个问题，可以执行需要标准参考光谱的m/z数据的重新定标。将该标准与当前批次的光谱进行比较以确定常见血清峰的位置是否有变化。m/z位置从参考物来借用，但是应用任何“移位”来将光谱重新定标。结果是在各批次间具有可比较的m/z的重新定标的光谱。从某种意义上说，这是对于粗略对准问题的批次校正程序。

对准和过滤

这个工作流程执行纹波过滤器，因为观察到所得平均值在噪声方面得到改善。然后将光谱减去背景并发现峰值以执行对准。用于平均化的光谱是对准的纹波过滤光谱，无需其他任何预处理。校准步骤使用下表3中列出的一组43个对准点。额外的过滤参数要求光谱具有至少20个峰值，并使用至少5个对准点。

表3：用于对准栅格光谱的对准点

栅格平均化

平均值是从重新定标的、对准的和过滤的栅格光谱池中创建的。随机选择500个光谱进行平均化，以产生400,000个照射的最终样本光谱。每个点收集了多个800个照射光谱，以便在来自每个样本的8 个点的800照射栅格光谱的数量上，最终具有超过500个光谱的池。从这个池中随机抽取500个光谱，将其平均化，以获得最终400,000 照射平均深度的MALDI光谱。

深MALDI平均光谱预处理

背景估计和减法

对背景的估计是在对高质量区域进行额外考虑的情况下进行的。使用背景估计和减法的两窗口方法(表4)。

表4：背景估计窗口

宽窗口	m/Z	宽度
			3000	80000
	30000	80000
			31000	160000
中等窗口
			3000	5000
	30000	5000
			31000	10000

质谱背景减除的细节在本领域中是已知的，并且在先前的美国专利号7,736,905中描述，这类描述通过引用并入本文。

通过区间方法进行正则化

区间方法用于将所关注的临床组进行比较，以确保没有选择对分类有用的正则化窗口。本分析中使用的特征定义包括在先前临时申请序列号62/289,587的附录C中。所述方法按照临床组将特征值进行比较并计算所有样本的特征的方差系数(CV)。为p值和CV设定阈值以便移除显著区分所关注组或具有内在不稳定性(高CV)的任何区域。使用进行性疾病(PD)相比于稳定疾病(SD)和部分反应(PR)，即是否存在疾病控制(DC)的临床组比较，以便计算单变量p值。增加使用PR 相比于PD和SD的第二种比较。对于两种比较方法，p值截止值设定为0.22。为了计算正则化标量，不包括p值小于0.22的特征区间。使用的CV截止值是1.0。具有高于1.0的CV的特征也被排除在外。手动移除25kDa以上的特征，并且已知为内在不稳定的特征(17kDa 区域)也被移除。确定包括总共16个区间作为正则化窗口(参见表5)。

表5：迭代#1正则化区间

左侧	中央	右侧
			3530.679	3657.668	3784.658
3785.029	3931.884	4078.739
			4220.21	4271.637	4323.065
4875.581	4909.742	4943.903
			5260.635	5348.079	5435.524
5436.47	5559.451	5682.433
			6050.421	6213.614	6376.807
6510.852	6555.966	6601.081
			7751.414	7825.12	7898.826
10606.12	10751.66	10897.2
			10908.61	11132.56	11356.51
12425.27	12476.27	12527.26
			17710.35	18107.52	18504.69
19212.92	19978.37	20743.82
			22108.95	22534.05	22959.15
23738.5	24238.77	24739.04

对使用迭代#1区间来正则化的光谱进行按照区间的正则化的第二次迭代。第一次迭代后的CV一般较低。这允许设置0.68的CV的新阈值。增加p值的截止值，以增加要求严格性。评估中使用了相同的临床组。第二次迭代导致包括9个窗口作为正则化区间(参见表6)。

表6：迭代#2正则化分区间

对于每个光谱，发现使用这些窗口得到的标量，并且按照疾病对照组来进行比较，即将来自具有疾病控制的患者的光谱的标量与没有疾病控制的患者的光谱进行比较，以确保在标量上没有取决于临床组的显著差异。图5中显示的正则化标量的图表明，所得标量的分布在临床组之间没有显著差异，因此正则化区间对于分类没有用处。在这些窗口上，使用部分离子电流(PIC)对光谱进行正则化。

平均光谱对准

平均光谱的峰值对准通常非常好；然而，进行微调对准步骤以解决光谱中峰位置的微小差异。确定了一组对准点并应用于分析光谱 (表7)。

表7：用于校准光谱平均值的对准点

特征定义

在完成所有上述预处理步骤之后，分类器开发的过程通过识别和定义对分类有用的特征(m/z区域)来继续进行。所有119个平均光谱按照临床组PD、SD和PR来同时观察以选择用于分类的特征。这种方法可以保证仅在一部分光谱中发现的特征不被遗漏，并且特征定义足够宽以覆盖峰宽或位置的变化。为数据集定义了总共351个特征。参见附录A。将这些特征定义应用于所有光谱，以针对119个光谱中的每一个创建特征值的特征表(每个特征上的积分强度值)。所选特征的一个实例如图6所示，其中阴影区域代表为每个特征定义的m/z区域。

分析光谱的批次校正

参考样本“SerumP3”分析

在通过MALDI-TOF质谱仪来每次运行样本的开始(1,2)和结束 (3,4)时，将参考样本SerumP3的两个制备物进行铺涂。这些样本的目的是为了确保由于仪器性能的轻微变化(例如检测器的老化)所引起的批次变化可以校正。为了执行批次校正，必须将一个光谱作为这个批次的参考，所述光谱是来自这个批次的开始的一个制备物和结束的一个制备物的平均值。首先描述用于选择对的程序。

如上所述对参考样本进行预处理。所有351个特征(附录A)用于评估可能的组合(1-3、1-4、2-3、2-4)。使用函数来比较每个可能的重复组合：

A＝min(abs(1-ftrval1/ftrval2),abs(1-ftrval2/ftrval1))

其中ftrval 1(ftrval2)是重复对的第一个(第二个)重复的特征值。这个数量A给出了这个对的重复的相似程度的度量。对于每个特征，都会报告A。如果这个值大于0.5，那么这个特征被确定为不一致，或者“不好”。对于每个可能的组合，报告不好特征的计数。如果A的值<0.1，则确定这个特征是一致的并报告为“良好”。对于每个可能的组合，报告良好特征的计数。使用来自每种可能组合的坏和好特征的计数，计算坏/好的比率。具有最低比率的组合被报告为最相似的组合，不可能在任一参考光谱中包含任何系统的或局部的离群行为。如果没有发现小于0.12的比例，则说明这个批次是失败的。表8报告了对于每个批次发现最相似的组合。

表8：按批次发现最为相似的SerumP3制备物

批次	组合
		1	2_4
2	1_4
		3	2_4

批次校正

使用批次1作为基准批次来校正所有其他批次。通过以下程序，使用参考样本来找出批次2和3中的每一个的校正系数。

在每个批次j(2≤j≤3)内，对于以(m/z)_i为中心的每个第i个特征，定义比率

和平均幅度

其中

是在所校正的批次中的特征i的平均参考光谱幅度并且

是批次1(参考标准)中特征i 的参考光谱幅度。假定两个批次之间的幅度比率依赖于：

基于各个批次，通过最小化平方残差总和

并使用参考样本的实验数据来构建连续拟合。SerumP3参考样本用于计算校正函数。采取措施不包括离群点，以避免参数估计偏差。对于不同批次获得的系数a₀、a₁、b₀、b₁和c₀的值在先前临时申请序列号62/289,587的附录B(表B.1)中列出。在用于构建每批参考光谱拟合的

相对于(m/z)_i平面中的映射以及由拟合本身定义的表面在先前临时申请序列号62/289,587的附录B的图 B.1中显示。

一旦确定了每个批次的最终拟合

下一步就是根据

校正所有样本的所有特征(幅度A在(m/z))。在此校正之后，针对参考光谱计算的校正

特征值位于由r＝1定义的水平线周围，如在先前临时申请序列号62/289,587的附录B的图 B.1所示。计算校正后系数以与质量控制阈值进行比较。这些系数可以在附录B表B.2和先前临时申请序列号62/289,587的图B.2中的对应图中发现。

使用来自所有批次的351个特征和所有SerumP3样本，在批次校正之前和之后对特征值进行再现性评估。总之，批次校正前的中位数和平均CV分别为14.8％和18.3％。在批次校正后，中位数和平均CV 分别为15.0％和18.2％。正如在先前临时申请序列号62/289,587的附录B中发现的图所示，批次非常相似，需要很少的校正。这反映在所有的SerumP3样本中，CV的特征缺乏改善。

部分离子电流(PIC)正则化

发现在批次校正之前进行光谱正则化是有利的(参见上文)。然而，发现，在批次校正之后，如果进行另一次正则化，可以提高特征的方差系数(CV)，并获得更好的结果。这第二个PIC正则化是基于上面确定的各个峰周围的较小窗口。

使用部分离子电流(PIC)正则化方法对光谱进行正则化。关于部分离子电流正则化的背景信息在先前美国专利7,736,905中进行了描述，该描述通过引用并入本文。检查完整的特征表以发现用作最终正则化窗口的固有稳定性区域。首先，通过按照特征来比较DC组，从而发现单变量p值。p值小于0.15的特征被排除在PIC分析之外，因为这些特征可能为将要开发的测试提供有意义的信息。在PIC分析中使用221个特征的集合，其中30个特征用于最终正则化(表9)。

表9：用于PIC正则化的特征

为了正则化，将列出的特征求和以发现每个样本的正则化因子。然后将所有特征值除以正则化因子以得出图8的后续分类器生成方法中使用的最终特征表。按照DC组来检查正则化因子，以测试计算的因子不显著相关。图7的图示出了这些因子的分布。两个组的图非常相似，表明正则化标量适合使用。

使用Diagnostic Cortex TM的分类器开发

在创建了119个样本的质谱的特征表(如上所述)之后，开始使用图8中流程图所示的分类器生成方法来开发分类器。称为“具有丢弃正则化的小型分类器的组合”或“CMC/D”或DIAGNOSTIC CORTEX TM的这种方法在H.

等人的未决的美国专利申请公开号2015/0102216中详细描述，其全部内容通过引用并入本文。这里将首先提供方法的概述，然后结合图8详细说明产生黑素瘤/纳武单抗分类器的方法。

与在大型训练数据集可用时，着眼于开发分类器的机器学习的标准应用相比，在生物生命科学问题环境中的大数据挑战是不同的。在这里，有一个问题，即通常来自临床研究的可用样本的数量(n)通常是有限的，并且每个样本的属性(测量值)(p)的数量通常超过样本的数量。在这些深层数据问题中，人们不是从许多实例中获取信息，而是试图通过个体实例的深入描述来获取信息。目前的方法利用了这种见解，并且在这里，在p>>n的问题中特别有用。

所述方法包括第一步骤a)：从多个样本获得用于分类的测量数据，即反映样本的一些物理特性或特征的测量数据。每个样本的数据由多个特征值和一个类别标记组成。在这个实例中，数据采取质谱数据的形式，所述质谱数据呈特征值(在多个m/z范围或峰处的积分峰值强度值，参见附录A)以及指示样本的某种属性(例如，患者早期或晚期死亡或疾病进展)的标记的形式。在这个实例中，在调查与样本相关的临床数据之后，由操作人员将类别标记分配给每个样本。然后将开发样本集分成训练集和测试集，并在以下步骤b)、c)和d)中使用训练集。

所述方法继续进行步骤b)：使用来自样本的达到特征集合大小 s(s＝整数1...n)的特征值集合来构建多个单独小型分类器。例如，可以使用单个特征(s＝1)或者特征对(s＝2)或者三个特征(s＝3)或者甚至更高阶的包含超过3个特征的组合来构建多个单独的小型或者原子分类器。s的值的选择通常会足够小以允许实施所述方法的代码在合理的时间内运行，但是在某些情况下或者在更长的代码运行时间可接受的情况下可能会更大。s的值的选择也可以由数据集中的测量数据值(p)的数量决定，并且当p为数百、数千甚至数万时，s通常将是 1或2或可能是3，这取决于可用的计算资源。小型分类器执行监督式学习分类算法，例如k-最近邻(kNN)，其中将样本实例的特征的一个特征、特征对或三元特征组的值与训练集中的相同特征的值进行比较或识别s维特征空间中的最近邻(例如，k＝9)，并且通过多数投票将类别标记分配给每个小型分类器的样本实例。实际上，根据用于分类的特征的数量，可能有几千个这样的小型分类器。

所述方法继续进行过滤步骤c)，即测试每个单个小型分类器的性能(例如准确度)，以正确地对样本进行分类，或者通过一些其他度量来测量单个小型分类器性能(例如对于训练集样本，通过单个小型分类器的分类所定义的在各组之间获得的风险比(HR)之间的差异)，并且仅保留其分类准确度、预测能力或其他性能度量超过预定义阈值的那些小型分类器，从而获得经过滤(修剪)的小型分类器集。如果所选择的用于小型分类器过滤的性能度量是分类准确度，则可以将从分类操作得到的类别标记与预先知道的样本的类别标记进行比较。然而，可以使用其他性能度量，并且通过分类操作产生的类别标记来评估。只有那些在选定的性能度量下运行良好的小型分类器才能得到维护。可以使用替代的监督分类算法，例如线性判别式、决策树、概率分类方法、基于边缘的分类器如支持向量机，以及从一组标记的训练数据来训练分类器的任何其他分类方法。

为了克服由于子集偏差所导致的一些单变量特征选择方法存在偏差的问题，将所有可能特征的大部分作为小型分类器的候选。然后，使用达到预选大小(参数s)的特征集来建立所有可能的kNN分类器。这给出许多“小型分类器”：例如如果从每个样本100个特征开始(p＝ 100)，将从这些特征对(s＝2)的所有不同的可能组合中得到4950个“小型分类器”，使用三个特征(s＝3)的所有可能的组合，得到161,700个小型分类器等等。探索可能的小型分类器的空间和定义这些小型分类器的特征的其他方法当然是可能的，并且可以用来代替这种分级方法。当然，这些“小型分类器”中的许多将具有较差的性能，因此在过滤步骤c)中只使用那些通过预定标准的“小型分类器”。这些过滤标准是根据特定的问题来选择的：如果有一个两类别分类问题，那么只选择分类精确度超过预定义阈值，即在某种合理的程度上是预测性的那些小型分类器。即使对“小型分类器”进行过滤，也会得到成千上万的“小型分类器”候选者，其性能涵盖从模棱两可到相当不错到优异的性能。

所述方法继续执行步骤d)：通过使用正则化组合方法组合过滤的小型分类器来生成主分类器(MC)。在一个实施方案中，这种正则化的组合方法采用将一组经过滤的小型分类器相对于样本的类别标记重复进行逻辑训练。这种方法是通过以下步骤来进行的：由于从经过滤的小型分类器集合中执行极值丢弃(在此称为“丢弃正则化”的技术) 而随机选择一小部分经过滤的小型分类器，并且对于这些选定小型分类器进行逻辑训练。尽管在精神上类似于标准分类器组合方法(参见例如S.Tulyakov等人，Review of ClassifierCombination Methods, Studies in Computational Intelligence,第90卷,2008,第361-386页)，但会发生特定的问题，即一些“小型分类器”可能由于随机因素而人为地完美的，因此将在组合中占主导地位。为了避免这种过度拟合到特别主导的“小型分类器”，通过随机选择一小部分“小型分类器”用于每个这些逻辑训练步骤，产生许多逻辑训练步骤。这是本着深度学习理论中丢弃精神的对于问题的正则化。在这种情况下，在有很多小型分类器和较小训练集的情况下，使用极值丢弃，其中超过99％的经过滤的小型分类器在每次迭代中被丢弃。

更详细地说，每个小型分类器的结果是两个值中的一个，在这个实例中是“早期”或“晚期”。然后，可以使用逻辑回归，通过标准逻辑回归来定义获得“早期”标记的概率，从而本着逻辑回归的精神来将小型分类器的结果加以组合(参见例如 http://en.wikipedia.org/wiki/Logistic_regression)

方程(1)

其中如果应用于样本的特征值的小型分类器mc返回“早期”，那么I(mc(特征值))＝1，并且如果小型分类器返回“晚期”，则返回0。小型分类器的权重w_mc是未知的，并且需要通过上述公式对于训练集中所有样本的回归拟合来确定，相应地对于训练集中的晚期标记样本，对公式的左侧使用+1，对于早期标记的样本，使用0。由于有更多的小型分类器，因此权重比样本多，通常有数以千计的小型分类器，只有几十个样本，这样的拟合总是会导致近乎完美的分类，并且很容易被可能由于随机因素而非常适合特定问题的小型分类器所主导。不希望最终测试被一个特定的小型分类器所主导，这个分类器对于这个特定的集合性能很好，而且不能很好地推广。因此，设计了一个正则化这种行为的方法：代替同时将所有小型分类器的所有权重与训练数据相拟合的一个整体回归，只使用一些小型分类器进行回归，但重复这个过程多次，以便生成主分类器。例如，随机挑选三个小型分类器，对它们的三个权重执行回归，挑选另外一组三个小型分类器，并确定它们的权重，并重复这个过程多次，产生许多随机选择，即实现三个小型分类器。定义主分类器的最终权重是所有这些实现的权重的平均值。实现的数量应该足够大，以至于每个小型分类器在整个过程中很可能被选取至少一次。这种方法在精神上类似于“丢弃”正则化，这是在深度学习社区中使用的一种方法，它将噪声添加到神经网络训练中，以避免陷入目标函数的局部最小值。

可以使用的在步骤(d)中用于执行正则化组合方法的其他方法包括：

·逻辑回归，具有像脊回归这样的惩罚函数(基于Tikhonov正则化，Tikhonov,Andrey Nikolayevich(1943).

[On thestability of inverse problems].Doklady Akademii Nauk SSSR 39(5):195-198。)

·套索方法(Tibshirani,R.(1996).Regression shrinkage and selection viathe lasso.J.Royal.Statist.Soc B.,第58卷,第1期,pages 267-288)。

·通过丢弃来正则化的神经网络(Nitish Shrivastava,"Improving NeuralNetworks with Dropout",Master's Thesis,Graduate Department of ComputerScience,University ofToronto)，可从多伦多大学计算机科学系网站获得。

·一般正则化神经网络(Girosi F.et al,Neural Computation,(7), 219(1995))。

上述出版物通过引用并入本文。使用丢弃正则化的方法已经显示了避免过度拟合的希望，并增加了产生可推广测试的可能性，即可以在独立样本集中验证的测试。主分类器的性能然后通过对形成测试集的样本子集进行分类的良好程度来评估。

在步骤e)中，在程控计算机中重复步骤b)-d)，以不同地实现地将样本集分成测试和训练集，从而生成多个主分类器，每个主分类器实现将样本集分离成训练集和测试集。分类器的性能通过将开发样本集分离为训练集和测试集的所有实现来评估。如果在测试集中存在一些持续错误分类的样本，则所述过程可选地循环返回，并且针对这些错误分类样本、使用翻转类别标记来重复步骤b)、c)和d)和e)。

所述方法继续进行步骤f)：从多个主分类器中的一个或多个主分类器的组合中定义最终分类器。在本实例中，最终分类器被定义为由于样本集每次分离成训练集和测试集所导致的所有主分类器的多数投票或者平均概率截止。

现在转向图8，分类器开发过程将在黑素瘤/纳武单抗分类器的背景下进一步详细描述。

可用的119个样本的集合初始被随机地分成两个子集，用于验证生成的分类器的一组59个样本，剩下的60个样本是开发集(100)。如前所述，这种划分进行了两次(参见以上对DEV1和DEV2的论述)，伴以分层。

在步骤102，执行开发集100中的样本的两个类别标记(或组)的定义。虽然用于分类器开发的一些初步方法采用了定义明确的类别标记，例如反应类别，但是这些方法被证明是不成功的。本申请中论述的所有方法都利用事件时间数据来进行分类器训练。在这种情况下，初始类别标记定义(早期，晚期)并不明显，如图8所示，所述过程使用迭代方法在创建分类器的同时优化类别标记(请参见下面论述的循环146)。在开始的时候，针对类别标记进行初始的猜测。通常情况下，样本基于TTP或OS来进行排序，具有最低事件时间结果的一半样本被分配“早期”类别标记(早期死亡或进展，即不良结果)，而另一半则被分配“晚期”类别标记(晚期死亡或进展，即良好结果)。然后使用结果数据和这些类别标记来构建分类器。然后这个分类器可以被用来为所有的开发集样本生成分类，然后这些分类被用作分类器构建步骤的第二次迭代的新类别标记。这个过程迭代直到收敛。

虽然可以通过对于临床数据设定截止值来定义“早期”和晚期”，但是开始使用TTP(进展时间)数据来初步分配训练标记，30名TTP 最低的患者分配了“早期”类别标记，TTP最高的30名患者分配了“晚期”类别标记。需要注意的是，在后面的程序中，有一个对于持续错误分类的样本进行翻转类别标记的程序，所以这些初始类别标记分配不一定是固定的。在达到初始类别标记定义之后，基于如图8中的两个组104和106所指示的结果数据向样本分配早期和晚期类别。

在步骤108，开发集(100)的早期和晚期样本随后被随机分成训练 (112)和测试集(110)，每个集合30个患者。这种划分是以分层的方式进行的。通常将来自每个类别的二十个样本分配到训练集，剩余部分分配到测试集。偶尔，在类别标记翻转优化过程中，早期组中的样本的数量下降得太少，以至于不能将20个样本分配给训练集，并且仍然在测试集中具有合理数量的样本(例如超过7或8个)。在这些情况下，从每个类别中向训练集分配少量的样本，例如17或18个样本。在所有情况下，从每个类别分配到训练的样本数量是相同的。训练集 (112)然后经历步骤120、126和130。在步骤120中，使用来自所识别的351个质谱特征(参见附录A)的特征子集构建(定义)使用训练集作为其参考集的许多k-最近邻(kNN)小型分类器(mC)。对于进行的许多调查，检查了所有可能的单一特征和特征对(s＝2)；然而，当使用较少的特征时，有时也考虑三元组(s＝3)。尽管在初步研究中尝试了 kNN算法中k的不同值，但是实施例1中描述的方法全部使用k＝9。为了能够考虑单个、两个或三个特征的子集并提高分类器性能，有必要从351个特征集中取消选择对分类无用的特征。这是使用在先前临时申请序列号62/289,587的附录F中概述的袋装特征选择方法来完成的。关于此方法的进一步细节、其基本原理和益处在2016年4月5 日提交的J.Roder等人的美国专利申请序列号15/091,417和2016年4 月8日提交的美国临时申请序列号62/319,958中描述，其内容通过引用并入本文。附录B列出了用于不同分类方法的精选特征列表。

在步骤126中，使用过滤处理来仅选择具有有用或良好性能特征的小型分类器(mC)。这可以在图8中通过包含许多单独特征(由阴影线区域示出)的光谱124来理解，并且在特征空间122中指示单独和成对的特征。对于某些kNN小型分类器，这些特征(单个或成对)对于样本的分类性能良好，并且将这些小型分类器保留(由图8中128处的“+”符号来指示)，而由“-”符号指示的其他小型分类器不予保留。

为了针对具有一定性能特征的最终分类器，这些mC如下进行过滤。将每个mC应用于其训练集，并且根据训练集的结果分类来计算性能度量。只有满足这些性能度量阈值的mC才能通过过滤，以便在此过程中进一步使用。过滤失败的mC将被丢弃。对于这个项目，使用了准确性过滤和风险比过滤。有时，使用简单的单个过滤器，有时通过使用逻辑“与”操作将多个单个过滤器组合来构建复合过滤器。为了进行准确性过滤，将分类器应用于训练样本集或训练样本集的子集，并且所得分类的准确度必须位于预设范围内以便mC通过过滤。对于风险比过滤，将分类器应用于训练集或其子集。然后，在分类为早期的组与分类为晚期的其余组之间计算指定结果(TTP或OS)的风险比。风险比必须在特定范围内以便mC通过过滤。在这个特定的分类器练习中，根据早期/晚期之间的风险比(HR)和早期类别标记(TTP定义为<100天)和晚期(TTP定义为>365天)的准确性来过滤小型分类器。

表10：小型分类器和过滤中使用的参数

在这里，“方法”意味着不同的分类器开发练习。本质上，将图8 的过程重复不同次数，每次迭代使用深度参数s的不同值，并且如图 10所示，在图8的步骤126中使用不同的小型分类器过滤标准。请注意，对于将119个样本的整个集合两次分离成开发和验证集(DEV1和DEV 2)中的每一次分离，这个练习进行两次。

针对在步骤108将开发集分离为训练集和测试集的每次实现，在步骤130，生成主分类器(MC)。一旦mC的过滤完成，在步骤132，使用训练集类别标记训练的逻辑回归，将mC合并成一个主分类器 (MC)，步骤132。参见前面关于丢弃正则化的论述。为了避免过度拟合，回归使用极值丢弃来进行正则化，只有少数随机选择的mC被包括在每个逻辑回归迭代中。基于通过过滤的典型mC数目来选择丢弃迭代的次数，以确保每个mC可能被多次包括在丢弃过程中。实施例 1中概述的所有方法在每次迭代中留下10个随机选择的mC。只使用单个和成对特征的方法使用了10,000次丢弃迭代；使用单个、成对和三元组特征的方法使用了100,000次丢弃迭代。

在步骤134，评估在步骤132中达到的MC的性能以及对样本的测试集(110)进行分类的能力。随着步骤120、126、130、134的每次迭代，评估所得到的MC对于测试集110的成员进行分类的能力的性能。

在评估步骤134之后，所述过程经由循环135回到步骤108，并产生将开发集分离成训练集和测试集的不同实现。步骤108、120、 126、130、132、134的过程以及在135处循环返回将开发集重新分离为训练集和测试集(步骤108)被多次执行，并且在该项目中使用625次不同的实现(循环)。当训练集类别具有相同数量的样本时，图8的方法效果最好。因此，如果类别的成员数量不同，它们以不同的比例分成测试和训练。使用多个训练/测试划分(循环135以及步骤120、 126、130、132和134的后续执行)避免了为分类器创建而选择单个特别有利的或困难的训练集划分，并且避免了由于对于可能特别容易或难以分类的测试集进行测试所导致的性能评估中的偏差。

在步骤136，存在分析来自训练和测试分组的数据的可选程序，并且如方框138所示，从每个训练/测试集分组获得MC的性能特征及其分类结果。在这个项目中不执行可选步骤136和138。

在步骤144，确定是否存在在循环135的许多迭代期间在测试集 110中持续错误分类的样本。如果是的话，翻转这些错误分类样本的类别标记，并在循环146中回到步骤102的过程的开始，并重复图8 中所示的方法。

如果在步骤144没有持续错误分类的样本，则接着进行到步骤 150，并以几种方式之一来定义最终分类器，包括(i)每次实现将开发集分为训练集和测试集的每个主分类器(MC)的多数投票，或(ii)平均概率截止。定义每个MC(步骤132)的逻辑回归的输出可能是两个训练类别(早期或晚期)之一。这些MC概率可以平均化以产生样本的一个平均概率。当使用开发集(100)时，将这种方法调整以便对于给定样本不包括在训练集中的MC进行平均化(“袋外”估计)。这些平均概率可以通过应用阈值(截止值)转换为二元分类。在迭代分类器构建和标记优化过程中，通过以0.5的截止值获得的单个MC标记的多数投票来分配分类。对这个过程进行修改，以便只入选mC，其中对于开发集中的样本来说，所述样本不在训练集中(修改的或“袋外”多数投票)。这个程序给出了与对于MC上的平均概率使用0.5的截止值非常相似的分类。

在步骤150中定义了最终分类器之后，所述过程可选地继续进行验证步骤152，其中在步骤150中定义的最终分类器对于样本的内部验证集(如果可用的话)进行测试。在本实例中，119个样本的初始集合被划分为开发集(100)和单独的内部验证集，因此该验证集存在并且经历验证步骤152。理想地，在步骤154中，在步骤150中定义的这个最终分类器也对于独立样本集进行验证。稍后在此实例1中，描述了对于独立样本集的验证。

实施例1分类器的结果

这个练习的目标是确定根据图8定义的最终分类器是否可以证明早期和晚期类别标记之间的分离，换句话说，从治疗前血清样本的质谱来预测提供样本的患者是否很可能从纳武单抗的治疗癌症中获益。已经实现了这个目标，正如文件本部分的分类器性能数据所表明的那样。使用分类为早期和晚期的样本之间的TTP和OS的 Kaplan-Meier图以及相应的风险比(HR)和对数秩p值来评估分类器的性能。表11总结了表10中四种方法的结果。这个表列出了开发集(图 8中的100)和119个样本的集合的另一半(即，验证集)的分类器性能。在表11中注意到由图8中开发的分类器所确定的早期和晚期组之间的中位数OS和TTP的显著差异，显示分类器识别临床有用组的能力。

表11：表10的四种方法的最终分类器性能总结

对于四种方法，在图9-12中显示对应于表11中的数据的 Kaplan-Meier图。每种方法的每个样本的分类在先前临时申请序列号 62/289,587的附录G中列出。对于四种方法的每一种，基线临床特征在表12中按照分类组来总结。

表12：分类组的临床特征

表11-12和图9-12中的数据表明，有可能构建分类器，其能够通过从治疗前血清样本产生的质谱来鉴别用纳武单抗治疗具有更好和更差结果的患者。分类为晚期的患者比分类为早期的患者具有更好的 OS和TTP。另外，分类为晚期的患者比分类为早期的患者更可能在纳武单抗治疗中具有部分响应或稳定的疾病。表12说明在早期和晚期类别组中患者PD-L1阳性的比例是相似的，因此这两个量没有显著相关性，并且实施例1的血清分类器将向任何由PD-L1表达水平提供的信息提供额外的信息。

这些结果显示了在开发/验证集划分中识别具有纳武单抗疗法的更好和更差结果的患者的一致性，在验证和开发集性能之间具有良好的推广性。已经证明具有可观的验证性能，为了创建最强健的分类器，将所使用的两个小型分类器过滤方法应用于作为图8的开发集100的全部119个样本。结果总结在表13中，Kaplan-Meier图显示在图13 中。(根据图8构建的分类器使用在此和表13中解释的开发集中的全部119个样本，在本文后面被称为“实施例1的全集分类器”。)

表13：在作为开发集的全集119个样本上建立的两个分类器性能

这两种方法的性能非常相似，都与119个样本的开发/验证划分上建立的分类器非常一致。这进一步表明图8的程序产生具有良好推广性的可靠分类器。

在表14中，按照方法1(简单OS过滤)给出的分类组总结了临床特征。早期和晚期类别与PD-L1表达与任何截止或与性别或年龄无关。群组5中超过70％的患者被分类为晚期，而群组4和6中的患者在两个分类组之间大致均匀地划分。早期组LDH明显高于晚期组(Mann-Whitneyp值＝0.003)。

表14：全集分类器方法1的分类组的基线特征

^x一名患者数据缺失^xxULN＝正常范围的上限

多变量分析显示，当调整其他临床因素时，早期/晚期类别保持独立显著。

表15：OS和TTP的多变量分析

该表显示血清测试增加了其他可用临床特征的信息，即使在调整其他可用特征(包括PD-L1表达水平和LDH水平)时，血清类别标记仍然是TTP和OS两者的重要预测因子。特别值得注意的是，尽管 LDH水平和测试分类是相互关联的，但它们都是OS和TTP同时独立显著的预测指标。此外，检查了早期/晚期类别对肿瘤大小的依赖性。分类与肿瘤大小显著相关(Mann-Whitney p<0.001)，早期类别组的中位肿瘤大小为53cm，而晚期类别组的肿瘤大小为16cm。然而，尽管肿瘤大小在单变量分析中仅显示OS和TTP预测的显著性趋势 (分别为p＝0.065和p＝0.07)，但早期和晚期类别在调整肿瘤大小后对OS和TTP仍具有非常显著的预测能力(OS为p<0.001，TTP为p＝ 0.004)。

鉴于早期和晚期类别组之间的结果差异以及与其他临床信息的独立性，所开发的分类器可以向医生和患者提供额外的信息，以告知决定纳武单抗(或另一种抗PD-1抗体)或者替代疗法对于患者是适当的治疗。认为优选的最终分类器是从具有OS过滤的开发集中的全部 119个患者样本产生的分类器(表13中的方法1，图13C和13D的 Kaplan-Meier图)。这个分类器被称为全集分类器或本文后面的实施例1或“IS2”。

使用第二样本集来独立验证以图8生成的分类器

作为独立的验证群组，可以获得来自耶鲁大学的用抗PD-1抗体治疗的患者的一组30个治疗前样本。

从这些样本产生深MALDI光谱，并使用与图8的分类器开发中所用的程序相同的程序进行处理，如前所述。将整个集合的“方法 1”(表13方法1)的分类器应用于所得的特征表，对每个样本产生“早期”或“晚期”的分类。十个样本被分类为“早期”，其余的20个为“晚期”。总体存活的Kaplan-Meier曲线如图14所示，OS分析总结见表 16。与图13的情况一样，请注意图14中早期和晚期组之间的明显分离，表明了表13和图13的最终分类器在独立验证群组中正确分类样本的能力。

表16：耶鲁抗PD-1抗体治疗群组中分类器性能的总结

实施例1的分类器在用抗CTLA4抗体伊匹单抗治疗的48名黑素瘤患者的独立群组中也得到很好的验证。请参见下面的实施例3部分。

蛋白质识别

生成分类器的方法基于使用上文结合图8描述的CMC/D过程的将峰值强度与临床结果相关联的相关性分析。因此，在分类中使用的特征定义的基础蛋白质可能与治疗结果没有因果关系。将 MALDI-TOF实验中测量的峰与先前识别的蛋白质及其功能相关联也不是微不足道的。然而，通过研究在MALDI-TOF研究中观察到的血清蛋白的文献，仍然可以给出分类中使用的一些峰的名称。表17列出了暂定名单：

表17：用于分类的特征子集对于蛋白质/蛋白质片段的暂定分配

质量[Da]试验性的蛋白质识别

虽然急性期反应物如SAA和CRP的出现是预期的，但是惊奇地发现一些与补体系统(补体C3a、C1抑制剂、C1片段)相关的蛋白质的证据。补体系统涉及免疫反应和癌症免疫治疗(Markiewski等人， Is complementgood or badfor cancerpatients？Anewperspective on an olddilemma.Trends Immunol.30:286-292(2009))，并且最近被认为在 PD-1抑制中具有作用(Seng-Ryong Woo等人，Innate Immune Recognition ofCancer Annual Review of Immunology,第33卷. 445-474(2015)。

看来，早期和晚期组中的患者分类的至少一部分与急性期反应物和补体系统的活化之间的相互作用相关。关于分类特征与早期和晚期类别标记的生物功能之间的关系的更详细解释在本文件的后面实施例6中阐述。

关于在实施例1中开发的分类器的结论

将DIAGNOSTIC CORTEX TM程序(图8)应用于使用深度 MALDI光谱采集获得的来自黑素瘤患者的治疗前血清光谱，确定临床组“早期”和“晚期”。在用抗PD-1疗法纳武单抗来治疗后，这些组在结果(TTP和OS)上显示出显著差异。已经提出了一种测试程序，所述程序用于从治疗前样本中识别这些组，并在内部验证集和外部验证集中验证结果。

虽然测试开发的相关方法并不有助于深入了解可用于解释所确定的组之间的差异的生物学，但是我们已经进行了一些初步研究，这些研究将两个不同的组与急性期反应物和补体系统的差异联系起来。该项目的成功例证了深MALDI光谱采集与这些分类器开发方法相结合能够构建临床上有用的测试。

提供以下条款作为对实施例1中公开的发明的进一步描述。

1.一种预测黑素瘤患者受益于阻断程序性细胞死亡1(PD-1)的配体活化的抗体药物的方法，包括：

a)对于患者的血液样本进行质谱分析并获得质谱数据；

(b)获得多个质谱特征的质谱数据中的积分强度值；和

(c)利用实施分类器的程控计算机对质谱数据进行操作；

其中在所述操作步骤中，所述分类器用分类算法将所述积分强度值与从用所述药物治疗的多个其他黑素瘤患者获得的血液样本获得的类别标记的质谱数据的参考集的特征值进行比较，并且产生样本的类别标记，其中类别标记“早期”或等效物预测患者可能从抗体药物获得相对较少的益处，并且类别标记“晚期”或等效物表示患者可能从抗体药物获得相对较大的益处。

2.如条款1所述的方法，其中提供所述血液样本的黑素瘤患者先前已经用伊匹单抗进行治疗。

3.如条款2所述的方法，其中患者对伊匹单抗具有高度毒性。

4.如条款1-3中任一项的方法，其中质谱特征包括附录A、附录 B或附录C中列出的多个特征。

5.如条款1-4中任一项所述的方法，其中所述分类器是使用正则化组合方法从经过滤的小型分类器的组合中生成的。

6.如条款1-5中任一项的方法，其中所述质谱数据是从使用 MALDI-TOF质谱法对于所述样本执行的至少100,000次激光照射来获取的。

7.如条款6所述的方法，其中根据表10中列出的任何一个标准来过滤小型分类器。

8.如条款5所述的方法，其中所述分类器是根据从开发样本集的多种分离生成训练集和测试集而生成的多个主分类器来定义的。

9.如条款5所述的方法，其中所述分类器是从样本集开发的，所述样本集包括以前经和未经伊匹单抗治疗的患者。

10.如条款5所述的方法，其中所述正则化组合方法包括重复执行具有极值丢弃的逻辑回归。

11.如条款1-10中任一项的方法，其中所述抗体药物包含纳武单抗。

12.如条款1-11中任一项的方法，其中与所述晚期标记相关的相对较大的益处意味着与早期类别标记相比显著更大(更长)的总体存活。

13.如条款1-12中任一项的方法，其中所述参考集来源于来自用纳武单抗治疗的黑素瘤患者的类别标记的血液样本，其中参考集中的类别标记的血液样本具有类别标记早期或晚期或等效物，并且其中与早期样本相比，晚期样本在纳武单抗治疗时具有更高的总体存活。

14.预测黑素瘤患者受益于阻断程序性细胞死亡1(PD-1)的配体活化的抗体药物的机器(参见图15)，包括：

存储器，其存储以从用抗体药物治疗的多个黑素瘤患者的血液样本的质谱获得的多个质谱特征的特征值的形式的参考集；

所述存储器进一步存储基于多个主分类器定义最终分类器的代码集，每个主分类器从使用正则化组合方法组合的过滤的小型分类器生成；

中央处理单元，其对代码集以及参考集和从待测试的黑素瘤患者的血液样本获得的质谱数据进行操作，并且响应地生成所述血液样本的类别标记，其中所述类别标记“早期“或等效物的预测患者可能从抗体药物中获得相对较少的益处，并且类别标记“晚期”或等效物表明患者可能从抗体药物获得相对较大的益处。

15.如条款14所述的机器，其中开发集和样本的质谱数据是从使用MALDI-TOF质谱分析对形成开发集的样本和将要测试的样本进行至少100,000次激光照射获得的。

16.如条款14所述的机器，其中根据表10中列出的任何一个标准过滤小型分类器。

17.如条款14所述的机器，其中所述最终分类器是从多个主分类器中定义的，每个主分类器都从将分类器开发样本集分离成训练集和测试集而生成。

18.如条款14所述的机器，其中，所述参考集包括来自以前经和未经伊匹单抗治疗的患者的质谱数据。

19.如条款14的机器，其中正则化组合方法包括具有极值丢弃的逻辑回归。

20.如条款14-19中任一项的机器，其中所述药物包含纳武单抗。

21.如条款14-20中任一项的机器，其中质谱特征包括附录A、附录B或附录C中列出的多个特征。

22.如条款14-21中任一项的机器，其中与晚期标记相关的相对较大的益处意味着与早期类别标记相比显著更大(更长)的总体存活。

23.用于预测患者受益于阻断程序性细胞死亡1(PD-1)的配体活化的抗体药物的系统，

质谱仪和

如条款14-22中任一项所述的机器。

24.一种产生分类器的方法，所述分类器用于预测患者受益于阻断程序性细胞死亡1(PD-1)的配体活化的抗体药物，所述方法包括：

1),从用抗体药物治疗的黑素瘤患者获得的开发血液样本集来获得质谱数据，其中从集合的每一个成员获得至少100,000次激光照射的质谱；

3)执行图8的步骤102-150的过程，包括基于经过滤的小型分类器集合的正则化组合，以便将开发样本集每次分离为训练集和测试集，从而生成主分类器；

4)评估根据步骤3)生成的分类器的主分类器性能；和

5)基于步骤3)生成的主分类器来定义最终分类器。

25.如条款24所述的方法，其中所述最终分类器包括参考集，所述参考集包括附录A、附录B或附录C中列出的特征集的特征值。

26.如条款24所述的方法，其中对于附录A中列出的每个特征获得积分强度值，并且其中所述方法还包括从附录A的特征列表中取消选择对分类器性能没有贡献的特征并且使用缩减的特征列表来执行步骤3)、4)和5)。

27.如条款26所述的方法，其中缩减的特征列表包括附录B的集合中的特征列表或附录C中的特征列表。

28.如条款24的方法，其中过滤标准包括表10的过滤标准。

29.一种治疗黑素瘤患者的方法，包括

向患者施用阻断PD-1的配体活化的抗体药物，

其中所述患者的血液样本根据对于所述血液样本执行如条款1-13中任一项的方法，先前已经被分配了晚期或等效物的类别标记。

30.一种改进的通用计算机，其被配置为分类器，用于对来自人类癌症患者的血液样本进行分类，以预测患者的存活或从药物获得益处的相对可能性，包括：

存储器，其存储以多个质谱特征的特征值的形式的参考集，所述多个质谱特征来自用免疫检查点抑制剂处理的多个黑素瘤患者的血液样本的质谱分析，以及训练集中的每个血液样本的相关类别标记，血液样本形成分类器开发集；

所述存储器进一步存储基于多个主分类器定义最终分类器的一组计算机可执行代码，每个主分类器从执行分类算法的一组经过滤的小型分类器生成，并使用正则化组合方法进行组合；其中所述多个主分类器是从将所述开发集分离为分类器训练和测试集的许多不同实现中获得的；和

中央处理单元，其对于代码集、参考集和从待测试的癌症患者的血液样本获得的质谱数据进行操作，并生成血液样本的类别标记。

31.如条款30的改进的计算机，其中存储器存储附录A中列出的至少50个特征的特征值。

实施例2

黑素瘤患者受益于免疫检查点抑制剂的预测分类器

包括从样本集的一半构建的分类器和使用整个样本集构建的分类器的实施例1的分类器显示出类似的性能，并在两个独立的样本集上很好地验证。发现实施例1的分类器也将173名一线、用铂双联+ 西妥昔单抗治疗的晚期非小细胞肺癌(NSCLC)患者群组和另一批138 名手术后用铂-双联治疗的卵巢癌患者群组划分为较好和较差OS和无进展存活(PFS)的组。有关此发现的更多详细信息，请参见下面的实施例4。

有可能争辩说，上述实施例1的分类器具有强烈的预后成分，因为无论治疗是免疫疗法还是化学疗法，它们似乎都根据其结果对患者进行分层。虽然临床上这可能或可能不重要，但实施例2描述了分类器和测试的开发，该分类器和测试能够根据其结果来划分用免疫检查点抑制剂治疗的患者，而不将化疗的患者的结果分层-即免疫检查点抑制剂和化疗方案之间的预测性测试，这种测试具有较小预后成分。

患者样本

用于开发实施例2的分类器的样本是来自两个不同群组的治疗前血清样本。第一个群组是来自用纳武单抗治疗的黑素瘤患者的119 个样本，并在实施例1中详细论述，基线临床特征见表1，图1A和 1B等。这个集合被分成了开发和验证集，如上实施例1中所解释的。

被称为ACORNNSCLC群组的第二群组是来自用铂-双联加西妥昔单抗治疗的非小细胞肺癌(NSCLC)患者的173个治疗前血清样本的集合、临床数据和相关质谱。第二个群组的目的是调整分类器的开发，使得(a)预测患者受益于纳武单抗，而且(b)在用化学疗法治疗的 NSCLC患者中不预测结果。可用的结果数据包括无进展存活(PFS)和总体存活(OS)。表18中列出了来自治疗前样本的可用光谱的患者的选定临床特征。

表18：有可用光谱的NSCLC患者的基线特征

具有基线样本和获得的光谱的173例NSCLC患者的第二群组的无进展存活(PFS)和总体存活(OS)的Kaplan-Meier曲线图如图16A和 16B所示。

ACORN NSCLC群组被分成3个子集：58个样本(本文称为“AddFilt”子集)被指定用于小型分类器的附加过滤，如下面详细解释的；将58个样本(本文中的“测试”子集)用于与黑素瘤开发样本集一起测试分类器性能；和57个样本(本文中的“验证”子集)被用作内部验证集的一部分，除了已经为此目的而保持的黑素瘤验证子集之外。实施一种方法以便选择这个划分，同时确保3个子集是平衡的。如何产生这些划分的细节并不特别重要。可以说，已经分析了与总体存活相关的质谱特征，并选择了子集，使得这三个子集中的这些特征的差异最小化。对于表19中的每个子集列出了临床特征，并且在图17A和17B 中显示了事件时间数据的比较。

表19.对于3个创建的子集中的每一个，具有可用光谱的NSCLC 患者的基线特征

样本制备

ACORN NSCLC群组的血清样本的样本制备与纳武单抗群组相同，并在实施例1中详细描述。

光谱采集

ACORN NSCLC群组的质谱数据的采集与纳武单抗群组相同，并在实施例1中详细描述。

光谱处理

包括栅格光谱预处理、深度MALDI平均光谱预处理(背景减除、正则化、对准)和批次校正的质谱数据处理与实施例1中描述的相同。在实施例2的项目中，没有在分类器的开发中使用特征9109；但是，使用了附录A中列出的所有其他350个功能。

分类器开发

使用图8的分类器开发过程(在实施例1中详细描述)来开发实施例2的分类器。

类别标记的定义(步骤102，图8A)

实施例2的分类器开发使用来自黑素瘤/纳武单抗开发集的OS数据，以将分类组标记初始分配给开发集中的样本。在这种情况下，类别标记并不明显，如图8所示，分类器开发过程使用迭代方法在创建分类器的同时优化类别标记。参见图8B，步骤144和循环146。在步骤102所述方法的初始迭代中，初始猜测类别标记。样本按OS进行排序，其中具有最低事件时间结果的一半样本被分配“早期”类别标记 (早期死亡，即不良结果)，而另一半则被分配了“晚期”类别标记(晚期死亡，即好的结果)。然后根据图8使用结果数据和这些类别标记构建分类器。这个分类器被用来为所有的开发集样本生成分类。多次划分为训练和测试集而创建的主分类器的集群中持续错误分类(循环 146)的样本的标记得以翻转。然后，在步骤102，将该优化的类别标记集合用作所述方法的第二次迭代的新类别标记。这个过程迭代直到收敛，与实施例1完全一样。

选择训练和测试集(108，图8A)

开发集样本在多个不同的随机实现中被分成训练集和测试集(步骤108)。使用了625次实现(即通过循环135进行迭代)。图8的方法在早期和晚期的训练类别在通过循环135的每个实现或迭代中具有相同数量的样本时效果最好。因此，如果训练类别的成员数目不同，则它们按不同的比例分成测试和训练。

小型分类器的创建和过滤(120，126，图8A)

在步骤120中使用特征的子集构建使用训练集作为其参考集的许多k-最近邻(kNN)小型分类器(mC)。在这个项目中使用了k＝9。为了能够考虑单个和两个特征的子集并提高分类器性能，从350个的集合中取消了对于分类无用的特征的选择。这是使用在先前临时申请序列号62/289,587的附录F以及J.Roder等人的美国专利申请序列号 15/091417中所述的袋装特征选择方法完成的。

为了针对具有特定性能特征的最终分类器，如下在图8A的步骤 126中过滤这些mC。将每个mC应用于其训练集和“AddFilt”NSCLC 子集，并从结果分类中计算性能度量。只有满足这些性能度量阈值的 mC才能通过过滤，以便在此过程中进一步使用。过滤失败的mC将被丢弃。对于这个项目，使用基于OS过滤的风险比。表20示出了用于在分类器开发的每个标记翻转迭代(步骤146)中取消选择小型分类器的步骤126的过滤标准。在每一次迭代中，通过使用“与”操作将两个单个过滤器组合来构建复合过滤器，参见表21。这样的过滤标准被设计成使得用免疫疗法治疗的患者根据其OS结果划分，但用化学疗法治疗的患者不会。

表20：过滤步骤中使用的标准

表21小型分类器和过滤中使用的参数

使用逻辑回归和丢弃来将小型分类器组合(步骤130，132)

一旦mC的过滤完成，使用训练集类别标记训练的逻辑回归，将 mC合并成一个主分类器(MC)。为了避免过度拟合，回归使用极值丢弃来进行正则化，只有少数随机选择的mC被包括在每个逻辑回归迭代中。基于通过过滤的典型mC数目来选择丢弃迭代的次数，以确保每个mC可能被多次包括在丢弃过程中。在所有的标记翻转迭代中，在10,000次丢弃迭代的每次迭代中，随机选择了10个mC。

尽管ACORN NSCLC“AddFilt”样本子集已经如上所述用于过滤步骤，但是这样的样本不包括在组合mC(或kNN小型分类器的参考集)的逻辑回归的训练中。只有从开发集(黑素瘤样本)提取的训练子集用于此目的。

训练/测试划分(图8A的循环135)

在循环135中使用多个训练/测试划分，并且在这个实例中625 种不同的训练/测试集实现方式避免了为分类器创建而选择单个特别有利的或困难的训练集，并且避免了由于对于可能特别容易或难以分类的测试集进行测试所导致的性能评估中的偏差。

在步骤150中定义最终测试

定义每个MC的逻辑回归的输出是两个训练类别(早期或晚期)之一的概率。所有的625训练和测试集划分的这些MC概率可以被平均化以产生样本的一个平均概率。在使用开发集时，将这种方法调整以便对于给定样本不包括在训练集中的MC进行平均化(“袋外”估计)。这些平均概率可以通过应用阈值(截止值)转换为二元分类。在迭代分类器构建和标记优化过程中，通过以0.5的截止值获得的单个MC标记的多数投票来分配分类。对这个过程进行修改，以便只入选MC，其中对于开发集中的样本来说，所述样本不在训练集中(修改的或“袋外”多数投票)。这个程序给出了与对于MC上的平均概率使用0.5的截止值非常相似的分类。

结果

实施例2中开发的分类器的性能使用分类为早期和晚期的样本之间的OS的Kaplan-Meier图以及相应的风险比(HR)和对数秩p值来评估。该性能评估分别针对用纳武单抗治疗的黑素瘤患者和用化疗治疗的NSCLC样本进行。表22总结了每个样本集可用的时间终点的结果。在图18A-18H中示出对应于表22中的数据的Kaplan-Meier图。在ACORNNSCLC集的情况下，图18A-H的曲线图和表22的相应结果没有考虑任何“AddFilt”子集样本，因为它们直接用在所有625个训练/测试实现方式的mC过滤步骤中。黑素瘤群组中所有119个样本的分类在先前临时申请序列号62/289,587的附录I中列出，连同从实施例1得到的分类进行比较。附录C给出了这个分类器开发的最终标记翻转迭代中使用的特征。

表22：性能总结

注意，在图18A-18D中，对于黑素瘤/纳武单抗群组，OS和TTP 曲线在开发和验证集的早期和晚期类别之间存在明显的分离，而在 NSCLC/化疗群组中，在开发和验证集之间早期和晚期类别存在很少或根本没有分离。这表明在主分类器的开发和最终分类器的定义中使用NSCLC群组来过滤小型分类器可用于创建预测纳武单抗在黑素瘤中的益处的分类器，但不将用化疗治疗的NSCLC患者的结果分层。

表23列出了黑素瘤/纳武单抗样本集(开发+验证)的基线临床特征。表24按照分类组来总结了ACORN NSCLC样本集(“测试”+“验证”)的临床特征。

表23：分类组的临床特征(黑素瘤样本集)

^x一名患者数据缺失，^xxULN＝正常范围的上限

表24：分类组的临床特征(ACORNNSCLC样本集)

读者会注意到，表14中的数据与表23中的数据略有不同。特别值得注意的是，从实施例2的分类器获得的分类与从实施例1分类器得到的分类不完全一样；但是不出所料，对于两个分类器来说，相当大比例的样本得到了相同标记。参见之前的临时申请序列号 62/289,587的附录I，对于所有119个样本，由实施例1和实施例2 分类器产生的标记。读者还将注意到，附录C列出了用于实施例2 的最终分类器的350个特征的子集。

实施例2的分类器的附录C的缩减特征集的背后的思想是，代替仅采用给出纳武单抗治疗的预后行为的所有mC(和相关特征)，在实施例2分类器中，仅使用如下mC的子集，这些mC除了用于预测来自纳武单抗治疗的益处/无益处之外，在ACORNNSCLC群组中未显示分离。所以，使用所有mC的较小子集，因为对其行为有额外的限制。然后，当结合这些mC时，获得具有不同样本分类和不同行为的分类器(至少在ACORNNSCLC集合上)。为了在ACORN组上获得不同的行为，必须在黑素瘤组上获得一些不同的标记-但是还不足以破坏用实施例1分类器获得的早期和晚期群体之间的良好分离。先验不清楚是否可以做到这一点，但是实施例2的结果表明有可能产生这样的分类器。

表25显示了黑素瘤样本集(开发+验证)的多变量分析的结果。在这样的分析中没有考虑不可获得性别的两个样本和没有LDH水平的一个样本。

表25：黑素瘤集(开发+验证)的OS和TTP的多变量分析

尽管实施例2的分类与LDH水平显著相关(表23)，但两个数量在多变量分析中独立地是TTP和OS的显著预测因子。此外，对肿瘤大小的分析显示，尽管与早期和晚期类别有很强的相关性 (Mann-Whitneyp<0.001)，早期组和晚期组的中位肿瘤大小分别为48 cm和16cm，在调整肿瘤大小时，早期/晚期类别保留其作为OS和 TTP预测因子的显著性(对于OS，p＝0.014，对于TTP，p＝0.005)。因此除了LDH和肿瘤大小等其他预后因素之外，分类还具有独立的预测能力。

实施例2分类器的独立验证

将所开发的分类器应用于来自两种不同癌症类型(黑素瘤和卵巢) 和治疗(免疫检查点抑制剂和化学疗法)的几个样本集。对于所有样本，使用与开发中使用的程序相同的程序产生并处理深度MALDI谱。对于每个样本，获得“早期”或“晚期”的分类。对于每个群组，显示了可用时间终点的Kaplan-Meier图，并给出了事件时间的分析总结。

A.耶鲁抗PD-1群组

以下结果涉及在耶鲁大学(Yale University)，用抗PD-1抗体治疗的晚期不能切除的黑素瘤患者的一组30个治疗前样本。图19是耶鲁群组患者总体存活的Kaplan-Meier曲线。它显示了早期和晚期两个类别之间的存活曲线的明确分离。表26显示了结果的统计数据。

表26：耶鲁抗PD-1抗体治疗群组的分类器性能总结

这些结果表明，实施例2的分类器很好地推广到独立的样本集。

表27总结了该群组患者的基线临床数据。

表27：群组的基线特征

对于根据实施例1，表13，OS过滤所开发的全集分类器，在这个抗PD-1抗体治疗患者群组中获得了定性相似的结果。

B.耶鲁抗CTLA4群组

以下结果涉及在耶鲁大学(Yale University)用抗CTLA-4抗体(伊匹单抗或其他类似抗体)治疗的晚期不可切除的黑素瘤患者的一组48 个治疗前样本。表28总结了该群组患者可用的少量基线临床数据。

表28：耶鲁抗CTLA4群组的基线特征

图20是通过实施例2的分类器产生的分类的耶鲁抗CTLA4群组的总体存活的Kaplan-Meier图。注意到在该群组中由实施例2的分类器产生的早期和晚期类别的明显分离，表明分类器预测施用抗 CTLA4抗体的黑素瘤患者受益的能力。表29列出了分类器对于的该群组的性能的统计数据。

表29：分类器对于用伊匹单抗治疗的耶鲁群组的性能的总结

B.卵巢化疗

以下结果涉及一组来自卵巢癌患者的138个治疗前样本，其在手术后用铂双联化学疗法治疗。其中两名患者没有无病存活(DFS)数据。图21A(总体存活)和图21B(无病存活)显示了由实施例2的分类器产生的分类的卵巢癌群组的Kaplan-Meier图。请注意，分类器并没有在这个群组中产生早期和晚期类别组的分层。这与分类器不对用化疗治疗的NSCLC患者进行分层一致。在表30中列出了图21A和21B中所示的分类器性能的统计。

表30：手术后用铂双联化疗治疗的卵巢癌患者群组的分类器性能的总结

再现性

再运行两个样本集(黑素瘤/纳武单抗和耶鲁抗CTLA4群组)以评估实施例2的分类器的再现性。光谱是在从初始运行完全分开的批次中获得的。在所有情况下，用于初始质谱采集和再运行质谱采集的质谱仪在此期间在受让人的其他项目中使用。分类器标记的再现性总结在表31中。

A.黑素瘤/纳武单抗群组

在119个样本中的113个样本中，分类器在初始运行和再运行之间是一致的，总体一致性为95％。在再运行中，初始分类为早期的 43个样本中，38个分类为早期，5个分类为晚期。在再运行中，初始分类为晚期的76个样本中，75个被分类为晚期，1个分类为早期。

B.耶鲁抗CTLA4群组

分类器的再现性仅在群组的43个样本的子集中评估。在这43个样本中的40个样本中，分类器在初始运行和再运行之间是一致的，总体一致性为93％。在43个样本的子集中，在初始分类为早期的13 个样本中，12个分类为早期，1个分类为晚期。在再运行中，在初始分类为晚期的30个样本中，28个分类为晚期，2个分类为早期。

表31：预测分类器在不同样本集之间分类的再现性

样本集	标记一致性
		纳武单抗	113/119(95％)
抗CTLA4	40/43(93％)

实施例2结论

能够构建一个分类器，可以将接受免疫检查点抑制剂治疗的患者分为具有更好和更差的结果(TTP，OS)的组，同时不能根据结果(OS 和PFS或DFS)分离接受化疗的患者。使用从治疗前血清样本产生的深度MALDI质谱来构建分类器，并且使用纳武单抗治疗的一半可用 119个黑素瘤样本进行训练。使用铂双联加西妥昔单抗化疗治疗的 173例NSCLC样本中，三分之一用于调整分类器预测性，而不仅仅是预后。

该分类器通过将两个独立群组的用免疫检查点抑制剂治疗的黑素瘤患者按照结果进行分层，并且不会按照结果对手术后铂双联化疗治疗的第三群组卵巢癌患者进行分层来很好地推广。

分类器在两个独立的群组中显示出可接受的再现性，一致性为 93％或更高。

提供以下条款作为对实施例2中公开的发明的进一步描述：

1.一种改进的通用计算机，其被配置为分类器，用于对来自人类癌症患者的血液样本进行分类，以预测患者的存活或从药物获得益处相对可能性，包括：

中央处理单元，其对于代码集、参考集和从待测试的癌症患者的血液样本获得的质谱数据进行操作，并生成血液样本的类别标记；和

其中部分地通过小型分类器对从非小细胞肺癌(NSCLC)患者的血液样本获得的一组质谱数据的特征值的分类器性能来过滤小型分类器。

2.如条款1所述的改进的计算机，其中，所述代码集被编程以便为样本产生早期或等效物或晚期或等效物形式的类别标记，其中类别标记早期或等效物预测患者可能从免疫检查点抑制剂药物获得相对较少的益处，并且类别标记晚期或等效物表明患者可能从免疫检查点抑制剂获得相对较大的益处。

3.如条款2的改进的计算机，其中免疫检查点抑制剂包含阻断程序性细胞死亡1(PD-1)的配体活化的单克隆抗体。

4.如条款2的改进的计算机，其中提供待测试的血液样本的癌症患者已被诊断为患有肺癌、卵巢癌或黑素瘤。

5.如条款2的改进的计算机，其中与晚期标记相关的相对较大的益处意味着与早期类别标记相比显著更大(更长)的总体存活。

实施例3

用于预测黑素瘤患者受益于抗CTLA4抗体的分类器

上面的图20和表29表明，实施例2的分类器能够预测施用抗 CTLA4抗体给黑素瘤患者带来益处。伊匹单抗是这种药物的具体实例。据了解，耶鲁群组的大多数患者接受伊匹单抗治疗。不确定它们是否都接受伊匹单抗，而不是正在开发的其他抗CTLA4抗体。这些结果表明，有可能在治疗之前从血液样本预测黑素瘤患者是否可能从抗CTLA4抗体药物获益。进一步注意，用于预测患者对抗CTLA4 抗体药物的益处的分类器是从用抗-PD-1抗体纳武单抗治疗的患者样本集开发的。

进一步发现实施例1的全集分类器在这个群组中也得到了很好的验证。(术语“实施例1的全集分类器”是指根据图8在纳武单抗群组中的全部119名患者样本中开发的分类器，如上面实施例1中所解释的，参见表13的方法2的论述，OS小型分类器过滤。)图23显示了来自应用于这个群组的实施例1的全集分类器的早期和晚期组的Kaplan-Meier曲线。表32是对于实施例1的全集分类器，耶鲁抗 -CTLA4抗体治疗群组的分类器性能的总结。

表32：分类器性能总结

表33：按照分类组的群组的基线特征

来自该群组的43个样本(16个分类为早期，27个分类为晚期)的子集通过独立的样本制备和光谱采集来再运行。在43个样本中，41 个被分配了与初始运行相同的类别标记(95％一致性)。初始分类为早期的两个样本在再运行中被分类为晚期。

还开发了一种分类器，用于使用治疗前血清样本来识别抗 CTLA4疗法具有更好和更差结果的患者，所述样本来自随后用抗 CTLA4剂治疗的患者。现在将描述这个分类器开发练习的相关方面和从这个样本集开发的分类器的性能。

在这个分类器开发练习中，具有从患者群组中获得的48个治疗前血清样本以及相关的临床数据，所述患者随后用抗CTLA4剂治疗。大多数患者已知接受伊匹单抗，但是一些患者可能已经接受了另一种抗CTLA4抗体。这些与运行实施例1和实施例2验证测试的48名患者是相同的，在上文实施例3中已经对其进行了描述。总体存活(OS) 是唯一可用的终点。

对于这个分类器的开发，使用与在实施例1和2中相同的光谱和相同的光谱处理和特征，即相同的特征表。唯一的区别是特征9109 被从特征表中删除，因为担心它具有再现性问题并且分类的价值很小。

在分类器开发中使用了与图8相同的Diagnostic Cortex方法，如实施例1和2的描述中所详细描述的那样，带有标记翻转迭代。初始的类别定义基于更短或更长的OS。在训练集的分类组之间使用了基于OS的风险比的小型分类器过滤。

由此产生的分类器分配16名患者到早期组和32到晚期组。(这与实施例1全集分类器产生的早期组中的20名患者和晚期组中的28 名患者形成对比)。对于在抗CTLA4群组中训练的新分类器定义的组，分类器性能的Kaplan-Meier曲线如图23A所示。注意图23A的图中早期和晚期组之间总体存活的明显分离。早期组患者中没有一位存活3年以上。分类器性能统计如下：

图23B中显示了该结果与在耶鲁群组中运行的实施例1全集分类器所获得的分类器性能的比较。注意在图23B中，从黑素瘤，纳武单抗样本集(“实施例1全集分类器”)开发的分类器和从耶鲁抗CTLA4 群组(“早期”和“晚期”)开发的分类器中早期和晚期组之间的几乎完全的重叠。

因此，比较图23的Kaplan-Meier曲线图和两个分类器的统计数据，在抗CTLA4群组上开发的分类器的分类器性能结果似乎并不比使用纳武单抗治疗群组开发的分类器好得多。两个分类器使用完全不同的开发集产生非常相似的结果的事实支持了以下断言，即图8的 Diagnostic Cortex方法产生的测试不适合开发样本集，而是提取将泛化到其他样本集的信息。

在一个实施方案中，预测黑素瘤患者是否可能受益于抗CTLA4 抗体药物的测试方法涉及以下步骤：

(a)对于患者的血液样本进行质谱分析并获得质谱数据；

(b)获取多个预定质谱特征(例如附录A中列出的特征或其子集中的特征，例如在取消选择不显著地有助于分类器性能的噪音特征，例如附录B或附录C中的集合的特征之后)的质谱数据中的积分强度值；和

(c)利用实施分类器的程控计算机(例如，如实施例2中说明的根据图8生成的分类器或实施例1的全集分类器)对质谱数据进行操作。

在操作步骤中，分类器将积分强度值与从许多其他黑素瘤患者获得的血液样本获得的类别标记质谱数据的训练集的特征值相比较。该训练集可以是两种类型中的一种，即来自用阻断程序性细胞死亡 1(PD-1)的配体活化的抗体药物(例如纳武单抗)治疗的患者的样本集的类别标记的质谱数据。或者，该训练集可以是来自用抗CTLA4抗体治疗的患者的样本集的类别标记的质谱数据。分类器使用分类算法执行此比较。分类器为样本生成类别标记，其中类别标记“早期”或等效物预测患者可能获得相对较少的来自抗CTLA4抗体药物的益处，并且类别标记“晚期”或等效物表示患者可能从抗CTLA4抗体药物中获得相对较大的益处。

另外，优选地，使用MALDI-TOF质谱法从对于血液样本执行的至少100,000次激光照射获取质谱数据。

分类器优选使用正则化组合方法从过滤的小型分类器的组合中获得。如实施例2所述，可以通过保留在分类器生成期间定义的小型分类器来过滤小型分类器，使得用免疫疗法治疗的患者的质谱根据其 OS分类结果划分，但是当这样的小型分类器被应用于来自接受化疗的患者的质谱时，这些质谱不会划分。这被认为是可选的，因为可以在本测试中使用的实施例1的“全集”分类器是在对来自化疗群组的样本集不使用任何小型分类器的任何过滤的情况下开发的。

用于对黑素瘤患者的血液样本进行实施例3的测试的测试环境可以采取图15所示的系统的形式，并在下面的实施例5中详细描述。

提供以下条款作为对实施例3的公开发明的进一步描述。

1.预测黑素瘤患者对靶向CTLA-4的抗体药物的反应的方法，包括：

a)对于患者的血液样本进行质谱分析并获得质谱数据；

(b)获得质谱数据中多个预定质谱特征的积分强度值；和

(c)利用实施分类器的程控计算机对质谱数据进行操作；

其中在所述操作步骤中，所述分类器用分类算法将所述积分强度值与从由多个其他黑素瘤患者获得的血液样本获得的类别标记的质谱数据的参考集的特征值进行比较，所述其他黑素瘤患者用(1)靶向程序性细胞死亡1(PD-1)的抗体药物或(2)靶向CTLA4的抗体药物来治疗，并产生样本的类别标记，其中类别标记“早期”或等效物预测患者可能从靶向CTLA-4的抗体药物获得相对较少的益处，并且类别标记“晚期”或等效物表明患者可能从靶向CTLA4的抗体药物获得相对较大的益处。

2.如条款1的方法，其中预定质谱特征包括附录A、附录B或附录C中列出的多个特征。

3.如条款1所述的方法，其中所述分类器被配置为使用正则化组合方法的经过滤的小型分类器的组合。

4.如条款1所述的方法，其中使用MALDI-TOF质谱法从对于样本执行的至少100,000次激光照射获取质谱数据。

5.如条款1说是的方法，其中根据表10中列出的任何一个标准来过滤小型分类器。

6.如条款1所述的方法，其中所述分类器是根据从开发样本集多次分离生成训练集和测试集而生成的多个主分类器来定义的。

7.如条款1所述的方法，其中所述参考集是以从用靶向程序性细胞死亡1(PD-1)的抗体药物治疗的多个黑素瘤患者获得的血液样本获得的类别标记的质谱数据的形式。

8.预测靶向CTLA-4的抗体药物对黑素瘤患者有益的机器，包括：

存储器，其存储以从多个黑素瘤患者的血液样本的质谱获得的多个质谱特征的特征值的形式的参考集，所述黑素瘤患者(1)用阻断程序性细胞死亡1(PD-1)的配体活化的抗体药物来治疗或(2)用靶向 CTLA4的抗体药物来治疗；

中央处理单元，其对代码集以及参考集和从待测试的黑素瘤患者的血液样本获得的质谱数据进行操作，并且响应地生成所述血液样本的类别标记，其中所述类别标记“早期”或等效物预测患者可能从靶向 CTLA4的抗体药物获得相对较少的益处，并且类别标记“晚期”或等效物表明患者可能从靶向CTLA4的抗体药物获得相对较大的益处。

9.如条款8所述的机器，其中所述存储器存储附录A或附录B 或附录C中列出的多个特征的积分强度值。

10.一种治疗黑素瘤患者的方法，包括向患者施用靶向CTLA-4 的抗体药物的步骤，

其中已经通过对于患者的血液样本实施条款1-7中任一项的方法而预先选择患者用于这种给药，并且患者被分配了晚期或等效的类别标记。

实施例4

分类器用于预测接受化疗治疗的卵巢癌和NSCLC患者好转或恶化

发现实施例1的分类器将173名第一线、用铂双联+西妥昔单抗治疗的晚期非小细胞肺癌(NSCLC)患者的群组，以及在手术后经铂双联治疗的138名卵巢癌患者的另一群组划分为更好或更差OS和无进展(或无病)存活(PFS或DFS)的组。本节将描述用于预测卵巢癌和NSCLC患者更好或更差存活率的实际测试。本实施例4也将描述 ACORN NSCLC和卵巢癌群组的进一步细节。请注意，实施例2的分类器(使用用于小型分类器过滤的ACORN NSCLC群组)不能识别那些可能从化学疗法中受益的卵巢癌和NSCLC患者，因此用于预测铂化疗的卵巢和NSCLC的更好或更差存活的分类器和测试根据实施例1构建。

ACORNNSCLC群组

来自患有先前未治疗的晚期非小细胞肺癌(NSCLC)的患者的一组173个治疗前血液样本是可用的。患者接受基于铂类化疗，其中西妥昔单抗作为临床试验的一部分。可用于该患者群组的最重要的基线临床数据总结在表34中，整个群组的OS和无进展存活(PFS)分别显示在图24A和24B中。

表34：ACORNNSCLC群组的基线特征

已经从这些样本产生了深度MALDI光谱，但是采用与实施例1 中所描述的相同的方式，并且这些样本使用与实施例1的分类器的开发中使用的相同的程序进行处理。将实施例1的全集分类器应用于所得的特征表，对每个样本产生“早期”或“晚期”的分类。一百一十六个样本被分类为早期和其余的57个样本为晚期。图25A和25B显示了群组按分类组的总体存活率的Kaplan-Meier曲线，表35给出了OS 和PPFS的分析总结。表36中按照分类组总结了患者的基线特征。

表35：ACORNNSCLC群组中分类器性能的总结

表36：按照实施例1的全集分类器的分类的基线特征

图26A和26B示出了通过分类和VeriStrat标记(使用美国专利 7,736,905中描述的分类算法、特征定义和NSCLC训练集)分解的事件时间结果。显然，早期类别组中的两个VeriStrat组同样具有不良的结果。

卵巢癌群组

有来自卵巢癌患者观察试验的165个样本可用。接受手术的患者接受铂类化疗。在手术时取样。在这165名患者中，23名患者确实没有开始化疗，没有新诊断，或者已经接受了卵巢癌的预先治疗。另外4名患者没有结果数据。这里给出了其余的138名患者的数据。这些患者获得的最重要的基线临床数据总结在表37中，OS和无病存活率(DFS)显示在图27A和27B中。请注意，138名患者中的2名患者没有DFS可用。

表37：卵巢群组的基线特征

已经按照实施例1所述的相同方式从这些样本产生了深度 MALDI光谱，这些样本使用与在实施例1中描述的纳武单抗测试的开发中使用的相同的程序进行处理。实施例1全集分类器被应用于所得的特征表，对每个样本产生“早期”或“晚期”的分类。76个样本被分类为早期，其余62个被分类为晚期。图28A和28B中显示了按照分类的总体和无病存活的Kaplan-Meier图，表38给出了OS和PFS分析的总结。表39中按照分类组总结了患者的基线特征。

表38：实施例1的全集分类器在卵巢癌群组中性能的总结

表39：由实施例1的全集分类器产生的分类的基线特征

图29A和29B显示了通过分类和VeriStrat标记(根据美国专利 7,736,905进行测试)细分的事件结果时间。显然，由实施例1的全集分类器产生的早期类别中的良好和较差VeriStrat群组同样具有不良的结果。

总之，预测卵巢癌或NSCLC患者是否可能受益于化学疗法例如铂双联化疗的测试方法包括以下步骤：

a)对于患者的血液样本进行质谱分析并获得质谱数据；

(b)获取多个预定质谱特征(例如附录A中列出的特征或其子集中的特征，例如在取消选择不显著地有助于分类器性能的噪音特征，例如附录B中的集合的特征之后)的质谱数据中的积分强度值；和

(c)利用实施分类器的程控计算机(例如根据图8产生的分类器，实施例1的全集分类器)对质谱数据进行操作。

在操作步骤中，分类器采用分类算法将积分强度值与从用阻断程序性细胞死亡1(PD-1)的配体活化的抗体药物，例如纳武单抗来治疗的多个黑素瘤患者获得的血液样本获得的类别标记的质谱数据的训练集的特征值进行比较。分类器为样本生成类别标记，其中类别标记“早期”或等效物预测患者可能获得相对较少的益处和/或具有化学疗法的较差的结果，并且类别标记“晚期”或等效物表示患者可能获得相对较大的益处和/或从化疗获得更好的结果。在一个实施方案中，化学疗法是铂双联化疗。

分类器优选使用正则化组合方法从过滤的小型分类器的组合中获得。

对于卵巢癌和NSCLC患者进行检测的实际检测环境如图15和下一节所述。

提供以下条款作为对实施例4中公开的发明的进一步实例。

1.预测用化学疗法治疗的非小细胞肺癌(NSCLC)或卵巢癌患者的总体存活的方法，包括：

a)对于患者的血液样本进行质谱分析并获得质谱数据；

(b)获得质谱数据中多个预定质谱特征的积分强度值；和

(c)利用实施分类器的程控计算机对质谱数据进行操作；

其中在操作步骤中，分类器用分类算法将积分强度值与从用靶向程序性细胞死亡1(PD-1)的抗体药物治疗的多个黑素瘤患者获得的血液样本获得的类别标记质谱数据的参考集的特征值进行比较，并为样本生成类别标记，其中类别标记“早期”或等效物预测患者可能具有相对较少的益处和/或较差的结果(存活)，类别标记“晚期”或等效物表示患者可能获得相对较大的益处和/或化疗的较好结果(存活)。

2.如条款1所述的方法，其中所述化疗包括铂双联化疗。

3.如条款1所述的方法，其中所述化疗包括铂双联+西妥昔单抗化疗的组合。

4.如条款1所述的方法，其中预定质谱特征包括附录A或附录 B中列出的多个特征。

5.如条款1-4中任一项的方法，其中使用MALDI-TOF质谱法从对于样本执行的至少100,000次激光照射获取质谱数据。

6.如条款1-5中任一项的方法，其中分类器是从使用正则化程序组合的小型分类器的过滤组合获得的。

8.如条款6所述的方法，其中所述分类器是从开发样本集多次分离生成训练集和测试集而产生的多个主分类器中获得的。

9.预测用化学疗法治疗的非小细胞肺癌(NSCLC)或卵巢癌患者的总体存活的机器，包括：

存储器，以多个质谱特征的特征值的形式存储参考集，这些特征特征是从用阻断程序性细胞死亡1(PD-1)的配体活化的抗体药物治疗的多个黑素瘤患者的血液样本的质谱获得的；

中央处理单元，其对所述代码集以及参考集和从待测试的 NSCLC或卵巢癌患者的血液样本获得的质谱数据进行操作，并且响应地生成用于所述血液样本的类别标记，其中，类别标记“早期”或等效物预测患者可能具有相对较少的益处和/或较差的存活，并且类别标记“晚期”或等效物表示患者可能从化疗中获得相对更大的益处和/ 或更好的存活。

10.实验室检测中心，包括条款9的机器和配置用于对来自 NSCLC或卵巢癌患者的血液样本进行质谱分析的MALDI-TOF质谱仪。

11.一种治疗NSCLC或卵巢癌患者的方法，包括：

对NSCLC或卵巢癌患者施用化学疗法，

其中通过对患者的血液样本进行条款1-9中任一项的方法，患者先前已经被选择用于化学疗法，并且该样本被指定了晚期或等效的类别标记。

12.如条款11所述的方法，其中所述化疗包括铂双联化疗。

13.如条款11所述的方法，其中所述癌症患者是NSCLC患者，并且其中所述化疗包括铂双联加西妥昔单抗。

实施例5

实验室检测中心和配置为分类器的计算机

一旦结合实施例1、2、3、9(或其他实施例)描述的分类器已经被开发出来，其参数和参考集现在可以被存储和实施在通用计算机中，并且例如根据实施例1、2、3和4中所述的测试用于生成血液样本的类别标记。根据所要求的特定临床问题(以及从中获得样本的患者类型)，类别标记可以预先预测黑素瘤或其他癌症患者是否可能受益于免疫检查点抑制剂，例如阻断PD-1的配体活化的抗体或者例如预测黑素瘤或其他癌症患者受益于阻断CTLA4的抗体，例如纳武单抗，或者如果根据实施例1开发，则预测卵巢癌或NSCLC癌症患者是否可能化疗具有更好或更差的总体存活。

图15是使用根据图8生成的分类器来处理测试样本(在该实例中，来自黑素瘤、卵巢或NSCLC患者的血液样本)的实验室测试中心或系统的图示。该系统包括质谱仪1506和通用计算机1510，通用计算机1510具有实施被编码为机器可读指令的分类器1520的CPU 1512和存储包括类别标记的质谱数据的特征表1522的参考质谱数据集的存储器1514。形成特征表1522的该参考质谱数据集将被理解为与用于创建图8和实施例1-4的分类器的开发样本集相关联的质谱数据(预定义特征的积分强度值，参见附录A或附录B)。该数据集可以来自所有样本，例如，对于实施例1的全集分类器或样本的子集(例如，样本的一半的开发集)加上来自开发实施例2的分类器的NSCLC 患者的一组质谱数据。应理解，图15的质谱仪1506和计算机1510 可以用于根据图8的过程生成分类器1520。

图15的系统的操作将在如上所述进行预测性试验以预测患者受益或不受益于阻断PD-1的配体活化的抗体的情况下进行描述。下面的论述假定在使用分类器来产生用于测试样本的类别标记(早期或晚期，或等效物)时已经产生了分类器1520。用于其他试验(受益于抗 CTLA4药物，卵巢和NSCLC化疗的总体存活预测等)的图15的操作方法是相同的。

图15的系统获得多个样本1500，例如来自不同癌症(例如，黑素瘤)患者的血液样本(血清或血浆)，并按服务收费来产生样本的类别标记。分类器1520(在计算机1510中实现)使用样本1500来预测提供特定样本的患者是否可能受益于免疫检查点抑制剂疗法。测试的结果是分配给患者血液样本的二元类别标记，例如早期或晚期等。类别标记的特定名称并不特别重要，可以是通用的，例如“第1类”，“第2类”等，但是如前所述，类别标记与通过分类器来回答的问题有联系的某个临床属性是相关的。如前所述，在本文中，早期类别标记与总体存活相对较差的预测相关，晚期类别标记与预测免疫检查点抑制剂相对较好(较长)总体存活有关。

样本可以在血清卡片等上获得，其中血液样本被涂抹到纤维素或其他类型的卡片上。将样本的等分试样滴在MALDI-TOF样本“板”1502的一个或多个点上，并将板插入MALDI-TOF质谱仪1506 中。质谱仪1506从样本的每个点获取质谱1508。质谱以数字形式表示并提供给编程的通用计算机1510。计算机1510包括执行编程指令的中央处理单元1512。存储器1514存储表示质谱1508的数据。理想地，样本制备、点样和质谱步骤与用于根据图8和实施例1和2生成分类器的步骤相同。

存储器1514还存储表示分类器1520的数据集，其包括a)具有N 个类别标记的光谱的特征表的参考质谱数据集1522，其中N是某个整数，在该实例中是如上面解释的用于开发分类器的光谱的开发样本集或者开发样本集的一些子集(例如，上面的实施例1中的DEV1或DEV2，或者全部119个样本)。分类器1520包括b)代码1524，表示 kNN分类算法(其在小型分类器中实现，如上所述)，包括特征和kNN 算法的深度(参数s)和通过过滤的所有小型分类器的识别，c)程序代码 1526，用于对患者的质谱执行根据图8中生成的最终分类器，包括对数回归权重和表示形成最终分类器的主分类器的数据，包括概率截止参数，通过过滤的每个小型分类器的小型分类器参数等，以及d)用于存储分类结果的数据结构1528，分类结果包括用于测试样本的最终类别标记。存储器1514还存储用于实施在1550处示出的处理的程序代码1530，包括用于在步骤1552中从质谱仪获取质谱数据的代码(未示出)；用于实现背景减除、正则化和对准步骤1554(上面详述的细节) 的预处理例程1532，在每个点和多个MALDI点上的多个位置对800 个发射光谱进行过滤和平均，以形成单个100,000+发射平均光谱(如上所解释的)用于在背景减除、正则化和对准的光谱中的预定义的m/z 位置处计算积分强度值的模块(步骤1556)，以及对于在步骤1556获得的值、使用参考数据集特征表1522来实现最终分类器1520的代码例程1538。过程1558在步骤1560产生类别标记。模块1540报告在 1560处指示的类别标记(即，“早期”或“晚期”或等效物)。

程序代码1530可以包括附加和可选模块，例如用于校正质谱仪的性能波动的特征校正功能代码1536(在美国专利申请公开 2015/0102216中描述)，用于处理来自参考样本的光谱以便定义特征校正函数的一组例程，存储与特征相关的噪声特征并生成噪声特征值实现并将这些噪声特征值实现加以分类的模块，存储用于获取分类器对于噪声特征值实现的性能的统计数据的统计算法的模块或将从样本的多个单独重复测试中定义的类别标记加以组合以产生该样本的单个类别标记的模块。对于本领域技术人员而言显而易见的是，还可以包括其他可选的软件模块。

图15的系统可以实施为实验室测试处理中心，其从肿瘤学家、患者、诊所等获得多个患者样本，并且按服务收费来生成患者样本的类别标记。质谱仪1506不需要物理地位于实验室测试中心，而是计算机1510可以通过计算机网络获得表示测试样本质谱的数据。

实施例6

蛋白质功能组与分类组及质谱特征的相关性

当使用图8的程序构建测试时，能够确定哪些蛋白质对应于 MALDI TOF谱中的哪些质谱特征或者了解与这些特征相关的蛋白质的功能并不是必需的。过程是否产生有用的分类器完全取决于对于开发集的分类器性能以及分类器在分类新样本集时的性能如何。然而，一旦分类器被开发出来，研究蛋白质或蛋白质的功能可能是有意义的，这些蛋白质或蛋白质的功能与分类器中使用的质谱特征直接相关或有关联。另外，通过与测试分类组相关的其他平台来测量蛋白质表达或蛋白质功能可能是有益的。

先前临时申请序列号62/289,587的附录K阐述了旨在将蛋白质功能与实施例1和实施例2分类器的分类组以及深度MALDI谱中测量的质谱特征相关联的分析的结果。在附录K中，术语“IS2”对应于实施例1的全集方法1分类器，“IS4”对应于实施例2的分类器。本实施例中列出了使用的方法的有关细节和发现的结果的总结。所做出的发现导致了本公开的分类器如何被表征以及分类器被推广到其他免疫检查点抑制剂和黑素瘤以外的其他癌症适应症的新实例。

用于研究的数据包括对于由癌症患者和一些没有癌症的供体组成的一组49个血清样本(“分析集”)应用实施例1全集方法1分类器时创建的特征表。这是在实施例1全集方法1分类器中使用的59个特征(参见附录B)和未在实施例1全集方法1分类器中使用的292个其他特征(参见附录A)中的每一个的特征值的表格。特征值是从对于49 个样本中的每一个采用实施例1描述中定义的完全指定的光谱采集和光谱处理过程获得的MALDI-TOF质谱获得的。还在实施例1全集方法1分类器生成的分析集中使用对于49个样本获得的分类(早期/晚期)列表。还在实施例2分类器生成的分析集中使用对于49个样本获得的分类列表(早期/晚期)。还使用了对于分析集运行SomaLogic 1129蛋白/肽组获得的1129蛋白/肽表达测量结果的表格。

使用一种称为基因集富集分析(GSEA)的方法来应用于蛋白质表达数据。关于所述方法的背景信息在Mootha等人,PGC-1α-responsive genes involved in oxidativephosphorylation are coordinately downregulated in human diabetes.NatGenet.2003；34(3):267-73和 Subramanian等人,Gene set enrichment analysis:Aknowledge-based approach for interpreting genome-wide expressionprofiles.Proc Natl Acad Sci USA 2005；102(43):15545-50中阐述，其内容通过引用并入本文。根据SomaLogic 1129组目标列表和GeneOntology/AmiGO2和 UniProt数据库查询结果的交集创建特定的蛋白质组。

GSEA方法的实施使用Matlab进行。基本上，在这个方法中，评估了单个蛋白质和组标记(早期和晚期)之间的相关性r。一旦已经计算出每个蛋白质的这些相关性，按照从最大到最小的r值对蛋白质进行排序，其中较大的r值表示较大的相关性，并且r＝0的值意味着没有发现相关性。然后，计算富集评分(ES)(如上面Subramanian等人论文中所解释的)，其被设计成反映特定蛋白质组的元素在排序蛋白质列表的顶部或底部被过度表示的程度。考虑了富集评分的两个可能的定义，其细节在先前临时申请序列号62/289,587的附录K的第5页列出。还计算了相应的蛋白质的p值，以评估计算的富集评分与其随机分布平均值的偏差的显著性。还计算了运行总和(RS)，作为富集评分的计算的一部分，其细节在先前临时申请序列号62/289,587的附录K中进行了解释。

表40中示出了蛋白质组与49个样本的实施例1全集方法1分类器类别标记(早期或晚期)的相关性的结果。

表40：应用于分析集的蛋白质组和实施例1类别标记的GSEA 的结果

在p<0.05水平下，存在类别标记与对应于以下生物过程的蛋白质组的相关性：急性炎症反应、急性期和补体系统。对于伤口愈合蛋白质组，发现约0.1的p值的相关性。急性反应的相关性具有0.02的 p值。然后，使用统计学方法(参见先前临时申请序列号62/289,587 的附录K)来识别补体系统、急性期、急性反应和急性炎症反应蛋白质组的蛋白质子集，这些蛋白质组对这些相关性是最重要的，其结果分别示于表41A、41B、41C和41D中。

表41A：包括在补体(Amigo9)的延伸前缘组中的蛋白质。*表示位于RS最小值右侧的蛋白质，

表示具有至少与RS最大值相同幅度的反相关性的蛋白质。

表41B：包括在急性期(UniProt1)的延伸前缘组中的蛋白质。*表示位于RS最小值右边的蛋白质，

表示具有至少与RS最大值相同幅度的反相关性的蛋白质。

表41C：包括在急性反应(Amigol1)的延伸前缘组中的蛋白质。* 表示位于RS最小值右侧的蛋白质，

表示具有至少与RS最大值相同幅度的反相关性的蛋白质。

表41D：包括在急性炎症反应(Amigo1)的延伸前缘组中的蛋白质。*表示位于RS最小值右侧的蛋白质，

表示具有至少与RS最大值相同幅度的反相关性的蛋白质。

进一步研究了与从RS图中确定的蛋白质组相关的本体相关过程的相互作用。发现这些过程与补体活化、免疫系统的活化和调节以及先天免疫反应和炎症反应有关。显示这些关系的图表在先前临时申请序列号62/289,587的附录K中发现。附录K中，图8还显示了“热图”(即通过GSEA分析产生的p值的图，将质谱特征与实施例1，附录B的分类器使用的所有m/z特征的蛋白质表达值相关联)，展示了蛋白质组与用于实施例1全集方法1分类器的质谱特征的相关性的结果。也参见图45A和45B以及本文后面的论述。发现实施例1分类器中使用的许多质谱特征与以下生物学过程有关：(1)急性期，(2)急性反应，(3)补体系统和(4)急性炎症反应。使用的质谱特征中很少有与研究的特定免疫相关蛋白功能(即“先天免疫反应的活化”、“适应性免疫反应的调节”、“免疫T-细胞”、“免疫B-细胞”、“干扰素”、“白细胞介素-10”)相关。这些关系由在先前临时申请序列号62/289,587的附录K的图8的热图表示，较暗的区域与较低的p值有关，因此蛋白质和类别标记之间的相关性较高。图8显示了富集评分的两个不同定义的热图，但图相似。也参见本文件的图45A和45B以及下面的相关论述。

对蛋白质组与由实施例2的分类器产生的类别标记之间的相关性进行相同的分析。结果显示在表42中。注意与下列生物学过程相关的蛋白质与类别标记强烈相关：急性炎症反应、补体系统、急性反应和急性期。此外，与免疫反应2型相关的蛋白质也与类别标记强烈相关。

表42：应用于分析集的蛋白质组和实施例2类别标记的GSEA 的结果

在p<0.05水平下，存在类别标记与对应于急性炎症反应、急性反应、急性期、补体系统、白细胞介素-10(ES定义1)和免疫反应2 型的蛋白质组的相关性。对于伤口愈合蛋白质组，发现低于0.1的p 值的相关性。

进一步识别了来自补体系统、急性期、急性反应、急性炎症反应和白细胞介素-10的蛋白质，以及对于实施例2分类器重要的免疫反应2型过程。结果列于先前临时申请序列号62/289,587的附录K的表11A-11F中。表11A-11D中列出的许多蛋白质见表41A-41D。还计算了蛋白质组与实施例2分类器中使用的质谱特征和所产生热图的相关性，参见先前临时申请序列号62/289,587的附录K的图10和 11。实施例2分类中使用的许多质谱特征与补体系统和急性炎症/急性期反应有关。然而，与实施例1全集方法1分类器中使用的质谱特征相比，这些生物学过程在某种程度上不占优势。先前临时申请序列号62/289,587的附录K的表12显示了在各种显著性水平(p值)下与蛋白质组相关的质谱特征(在附录A中列出的351个特征中)的数目。通常，与其他过程相比，与急性炎症、补体系统、急性反应、急性期、 2型免疫反应和伤口愈合过程的蛋白质相关的质谱特征更多。

以上论述以及先前临时申请序列号62/289,587的附录K的报告证明了深度MALDI测量与GSEA的简单修改的组合显示了有希望提取关于与本公开的测试标记相关的生物功能的有用信息。它还使得能够深入了解与从血清样本中测量的质谱特征(深MALDI峰)相关的功能。

与实施例1全集方法1分类器中使用的质谱特征相关的蛋白质功能与类别标记相关的蛋白质功能(即急性期反应物和补体系统)一致。这些功能也与在相同实施例1分类器(表17，实施例1)中使用的特征的可用蛋白质ID的功能一致。其他合理的生物功能并没有显示与类别标记有任何显著的关联。这并不意味着这些其他功能与免疫疗法的生物学无关；这仅仅意味着没有证据表明它们在实施例1的全集方法 1分类器所产生的分类中起主要作用。然而，尽管测量了与大多数这些其他功能相关的特征(蛋白质)，但是它们并没有用于这些测试中，测试分类与这些蛋白质功能没有显著相关性。

在实施例2分类器的情况下，发现与实施例1相比，分类与急性期和补体功能的关联强度显著增加，这可能表明实施例2的分类器是“更纯洁”的测试，更少受到预后效果混淆。还观察到IL-10相关功能与实施例2类别组在p＝0.05显著性水平上相关。

这些数据存在局限性，这主要是由分析样本集的有限大小造成的，导致相当宽的零点分布，因此统计能力有限。最简单的方法就是在更多的样本上获得成对深MALDI/Somalogic数据。这也将使得能够独立验证这些结果。虽然Somalogic组中的蛋白质数量相当大，但也可以考虑使用额外的或扩展的组。

由于计算机资源的限制，没有对蛋白质组进行错误发现率分析。这样的分析还需要进一步的理论工作来评估Subramanian论文中建议的集合正则化的适用性，并且可能有改进的地方。虽然原则上应该这样做，但是观察到的效应，特别是对于某些质谱特征，是非常清楚和大的，所以不希望这个分析的主要结论有任何实质性的质变。

因为众所周知循环中的许多蛋白质与急性期反应物和补体系统有关，所以这两个功能似乎与用深度MALDI测量的许多质谱特征相关可能并不令人惊讶。但是，确实发现了其他显著的相关性，特别是在实施例2分类器的情况下，表明这些结果不是循环蛋白丰度的微不足道的反映。此外，在全集方法1实施例1分类器(参见附录B)中使用的特征子集中，与急性期和补体系统相关的特征的比例显著高于在附录A中列出的整个351深度MALDI特征集中所观察到的比例。

上述发现可用于构建用于引导癌症患者的免疫检查点抑制剂治疗的分类器。特别值得注意的是，这样的分类器包括存储器，该存储器存储从用免疫检查点抑制剂治疗的黑素瘤患者的血液样本获得的类别标记的质谱数据的参考集。质谱数据是呈多个质谱特征的特征值的形式，其中质谱特征至少与以下生物过程相关的血清中循环的蛋白质一致：(1)急性期、(2)急性反应、(3)补体系统，和(4)急性炎症反应。参见上面的论述以及在先前临时申请序列号62/289,587的附录K的图8、10和11的热图。分类器还包括对一组质谱数据执行分类算法的程控计算机(参见图15)，该组质谱数据包括从测试血液样本获得的多个质谱特征的特征值和参考集，并生成用于测试血液样本的类别标记。或者，质谱特征还可以包括与免疫反应2型和白细胞介素-10过程相关的特征。在一个实施方案中，这些特征包括附录A、附录B或附录C中列出的特征。

此外，将GSEA方法应用于使用SomaLogic组获得的数据，结合实施例1的全集方法1分类器的结果和进一步分析，使得能够将蛋白质的上调和下调与早期和晚期类别相关联。特别值得注意的是，表 41A-D中具有正相关系数的蛋白质与分类为早期的样本中的上调相关。

进一步分析补体蛋白质组的运行总和允许识别对相应蛋白质组与分类结果之间的相关性具有最大影响的蛋白质(表5，先前临时申请序列号62/289,587的附录K)。下表43列出了具有≤0.05的与类别标记相关性的P值，并且包括在补体蛋白质组的组1(前缘)中的蛋白质。

表43：与基因本体“补体系统”相关并且与实施例1的全集方法1 分类器相关的蛋白质。

可以看出，被分类为早期的组的特征在于补体系统的大部分组分的上调，从而提出了这种上调与分类为早期的患者的不良预后之间可能的生物学关系的问题，以及这些患者从PD-1抑制剂、可能还有其他类型的免疫治疗中获益甚微。

越来越多的证据表明，补体系统在肿瘤发生中起着复杂的作用，这取决于多种因素的复杂平衡，可以是促肿瘤或抗肿瘤作用。肿瘤转化伴随着活化补体的能力的增加。Pio,R.,Corrales,L.&Lambris,J.D. The role ofcomplement in tumorgrowth.Adv Exp MedBiol 772,229-62 (2014)。已显示活化的补体蛋白通过促进补体依赖性细胞毒性来抑制肿瘤生长(Janelle,V.&Lamarre,A.Role ofthe complement system in NK cell-mediatedantitumor T-cell responses.Oncoimmunology 3, e27897(2014))并抑制Treg功能。Mathern,D.R.&Heeger,P.S. Molecules Great and Small:The Complement System.ClinJ Am Soc Nephrol 10,1636-50(2015)。

另一方面，最近的数据表明活化的补体蛋白与先天性和适应性免疫系统的组分相互作用可促进癌发生。例如，在黑素瘤的小鼠模型中，显示“去补体作用”导致强大的抗肿瘤CD8+反应和NK细胞的改善的细胞毒性活性，而活化的补体系统导致肿瘤特异性细胞毒性T细胞 (CTL)的有限累积，同时利用抑制NK细胞和T细胞功能的免疫抑制性骨髓衍生抑制细胞(MDSc)促进肿瘤浸润。Janelle,V.等人 Transient complement inhibition promotesa tumor-specific immune response through the implication ofnatural killercells.Cancer Immunol Res 2,200-6(2014)。类似地，补体活化和C5a信号传导被证明与MDSCs向肿瘤的募集、效应物CD8+和CD4+T细胞的抑制、调节性 T细胞(Treg)的产生、Th2占主导的免疫反应以及促进乳腺癌和子宫颈癌模型中的肺和肝转移相关。Markiewski,M.M.等人Modulation of the antitumor immune response by complement.Nat Immunol 9,1225-35 (2008)；Vadrevu,S.K.et al.Complement c5a receptorfacilitates cancermetastasis by altering T-cell responses in the metastatic niche.Cancer Res74,3454-65(2014)。显示C5a促进Treg分化，引起对抗肿瘤活性的抑制。Gunn,L.等人Opposing rolesfor complement component C5a in tumorprogression and the tumormicroenvironment.J Immunol 189, 2985-94(2012)。补体可协助肿瘤细胞逃避免疫监视，支持慢性炎症，促进血管生成，活化促有丝分裂信号通路，维持细胞增殖和对细胞凋亡不敏感，并参与肿瘤侵袭和迁移。Pio等人，同上。在肺癌模型中，阻断C5a信号传导导致抑制肿瘤内的关键免疫抑制分子。这些分子包括IL-10、IL-6、CTLA4、LAF3和PDL18。

后面的发现对于癌症患者中免疫检查点抑制剂的活性，因此，对于实施例1和实施例2分类器的作用具有直接的意义。具体而言，观察到分类为早期的补体系统蛋白质的上调可能表明，这些患者具有与相应的免疫检查点的活化有关的更高水平的免疫抑制，和/或更高水平的促肿瘤炎症，因此对于纳武单抗、伊匹单抗、派姆单抗等的药物或靶向这些途径的其他药物的反应较小。有趣的是，已经显示补体蛋白C5a促进PD-1配体、PD-L1和PD-L2的表达。Zhang,J.Immunol. 2009；182:5123-5130。在这种情况下，人们可以设想过度补体上调可能与抑制PD-1的努力相竞争。另一方面，最近临床试验的结果表明，以PDL1高表达和Tregs存在为特征的肿瘤微环境的患者更可能对于抗PD-1、抗CTLA4或高剂量IL-2治疗有反应。虽然不知道补体系统的上调与实施例1和实施例2的分类如何确切地相关，但是这种联系与上面论述的生物效应是一致的。因此，可以预期实施例1和实施例2的分类器可能与影响患者免疫学状态的多种药物如各种免疫检查点抑制剂、高剂量IL-2、疫苗和/或组合治疗有关。此外，由于在血清中测量的效应反映整个生物体状态，并且补体系统在全局范围影响先天性和适应性免疫，不仅在肿瘤部位，因此预期分类器在癌症中的不同适应症中具有相似的性能(例如肺癌、肾癌)，并不限于黑素瘤。

与实施例1和实施例2早期和晚期类别相关的另一大基因本体蛋白质组是“急性炎症反应”。与来自这个集合的这些分类组相关的蛋白质(p≤0.05)列于表44。

表44.与基因本体“急性炎症反应”相关并且与全集方法相关1实施例1分类的蛋白质。

普遍认为癌症触发产生促肿瘤微环境的内在炎症反应(Mantovani, A.,Allavena,P.,Sica,A.&Balkwill,F.Cancer-related inflammation. Nature 454,436-44(2008))；“阴燃”炎症与大多数(如果不是全部的话)肿瘤相关并且支持其进展。Porta,C.等人Cellular and molecular pathways linking inflammation andcancer.Immunobiology 214,761-77 (2009).炎症与补体系统有内在联系，而补体系统在炎症的情况下促进肿瘤生长。因此，这两个系统与实施例1和实施例2分类显著相关似乎是合理的。

肿瘤相关的炎症反应可以通过癌症治疗来启动和/或调节。一方面它具有促肿瘤的功能，另一方面可以增强肿瘤抗原的呈递，进而诱导抗肿瘤免疫反应。Grivennikov,S.I.,Greten,F.R.&Karin,M. Immunity,inflammation,and cancer.Cell 140,883-99(2010)。虽然以 CD8+和CD4+淋巴细胞募集至肿瘤为特征的T细胞发炎微环境被认为是有效的免疫治疗性治疗的必要条件，但是急性炎症通路元件的活化可能与消极预后相关。确切的作用机制仍然知之甚少，但在早期组中的这一系统上调的数据似乎与现有的临床数据一致。

本公开内容展示了如何使用质谱数据将生物学见解结合到分类器开发练习(例如图8A和8B的方法)中。本公开还示出了如何使用质谱数据测试生物功能对于某些疾病状态的相关性的生物学动机假设。这是通过使用基因集富集分析、通过与这些功能相关的蛋白质子集将生物功能与从血清样本获得的质谱中的特征(峰)相关联，并且使用这样的识别特征、借助于计算机来训练分类器而实现的。

具体而言，公开了利用开发样本集的质谱的分类器开发和训练方法。从大组的蛋白质来获得蛋白质表达数据，对于开发样本集中的每个样本，或者更通常地，对于可获得质谱数据的另一个样本群组中的每个样本来说，所述大组的蛋白质涵盖所关注的生物功能。后一种情况是优选的，因为通过蛋白质测定来测量许多蛋白质的丰度需要大量样本，并且是昂贵且耗时的。因为可以从任何具有足够蛋白质覆盖的参考集推断质谱特征与功能的相关性，所以也没有必要为每个开发项目构建质谱峰与生物功能之间的关系。下面用两个选项交替地举例说明这些方法。

在这种方法中，确定了一个或多个质谱特征与按照其生物功能分组的蛋白质组的统计学显著关联。在计算机辅助下，使用这些被识别的一个或多个质谱特征(通常是10-50个这样的特征)来训练分类器。这种训练可以采取分类器开发练习的形式，其中一个实例如图8所示，并在前面详细描述。分类器是一组参数和相关的程序指令或代码的形式，当由计算机执行时，该程序指令或代码根据编程指令将类别标记分配给与开发样本集相同类型的样本的质谱数据。

如本实施例中所述，使用基因集富集分析(GSEA)方法，有可能寻找质谱特征与按照其生物功能分组的蛋白质组(“蛋白质功能组”)的统计学显著关联，避免直接的蛋白质识别，并利用质谱的高通量方面的优势。进行GSEA并将这类质谱特征与特定蛋白质功能组或子集相关联的系统或组件集合在本文中被称为“平台”或“GSEA平台”。这样的平台由已知的常规蛋白质表达测定系统(例如由Boulder CO的 SomaLogic提供的SOMAscan测定)和用于实施GSEA分析程序的计算机组成，所述GSEA分析程序用于识别与蛋白质功能组相关的质谱特征，如这个文件所描述。

必须将质谱数据(优选来自诸如“深MALDI”的高灵敏度方法，参见美国专利9,279,798，其内容通过引用并入本文)和来自涵盖一组血清样本中的所关注生物功能的大组蛋白质的蛋白质表达数据加以匹配。使用众所周知的蛋白质数据库，如UniProt或GeneOntology/AmiGO2，可以根据其生物功能定义全部测量蛋白质的蛋白质子集。首先根据每种蛋白质与所关注的质谱特征的相关性对整个测量蛋白质列表进行排序。然后在所有测量蛋白质的排序列表中， GSEA方法寻找包括在特定蛋白质功能子集中的蛋白质由排序来决定的过度或者不充分的表示，并提供评估其统计学显著性的方式。因此，可以评估所关注的质谱特征与不同蛋白质功能组的关联。对于尽可能多的光谱特征和许多蛋白质功能组，可以根据需要来重复该程序。设定关联程度的截止值或关联显著性的p值，可以确定与特定蛋白质功能子集相关联的所有质谱特征。然后使用这组质谱特征来训练分类器，例如k-最近邻(kNN)分类器。

优选用于分类器训练和开发的一种方法被称为Diagnostic Cortex，其在图8的上下文中被详细描述。已经证实，使用Diagnostic Cortex分类器开发程序，临床数据和深度MALDI质谱数据可以结合起来产生临床上有用的分子诊断测试。这种方法的一个优点是它允许对测试进行设计和调整以满足所需的临床实用标准。使用功能相关的质谱特征子集(从前面段落提到的程序来确定)代替所有可用的质谱数据为测试设计和优化提供了额外的选择。可以选择与一个或多个蛋白质功能子集关联的质谱特征，并将其与样本集的临床数据结合以创建新的分类器和相关测试，从而允许调查单个生物功能或生物功能组对于所需分类任务的相关性。

还描述了使用与不同蛋白质功能组相关的不同特征子集来创建多个不同分类器，并且例如通过简单多数投票，更复杂的集群平均化或一些基于规则的系统来将这些分类器组合以产生总体分类，这种分类包括各种生物功能的信息内容。在这种分类的一个变化中，在去除或者考虑到主要效应之后，通过在分类器中使用与功能组相关的峰值，并且根据生物功能的层级，使用这些新的相关峰值来构建新的分类器，可以发现在由分类器定义的各个组中，功能子集变得相关。例如，可以使用与急性反应功能相关的峰来训练第一级分类器。使用与伤口愈合蛋白功能相关的一组峰来训练第二分类器。然后，在第一级分类器上测试晚期(或等效物)的样本然后由第二级分类器分类。如果有一个足够大的集合，就可以进一步迭代这个过程，并在与第三个蛋白质功能关联的一组峰上定义第三级分类器，并将其用于由第二级分类器分类的组中等。由于经常有多个蛋白质功能组与给定的峰相关联，所以这种方法试图解开复合效应。

因此，在本公开的一个方面中，描述了一种生成分类器的方法，包括以下步骤：a)从受试者群体获得开发样本集；b)对开发样本集进行质谱分析，并识别存在于开发样本集的质谱中的质谱特征；c)从大组的蛋白质来获得蛋白质表达数据，对于开发样本集中的每个样本或者对于具有相关质谱数据的另外的样本群组中的每个样本来说，所述大组的蛋白质涵盖所关注的生物功能；d)使用具有匹配的质谱和蛋白质表达数据的样本集，识别一个或多个质谱特征与按照其生物功能分组的蛋白质组的统计学显著关联；和e)在计算机辅助下，使用步骤 d)中识别的一个或多个质谱特征和来自开发样本集的临床数据来训练分类器，所述分类器以一组参数的形式，所述参数根据程序指令，将类别标记分配给与开发样本集相同类型的样本。

在另一方面，本发明可以采取被配置为按照前一段的方法生成的分类器的程控计算机的形式。

另一方面，公开了一种测试样本的方法，其包括以下步骤：a)使用一组质谱特征来训练分类器，所述质谱特征集已经被确定为与按照其生物功能分组的蛋白质组具有统计学显著的关联；b)将包括该组质谱特征的特征表的分类器的参数存储在存储器中；c)对于测试样本进行质谱分析；和d)借助计算机用训练过的分类器将测试样本分类。在一个变型中，所述步骤包括使用与蛋白质的不同功能组相关联的不同特征子集来训练两个分类器，将包括质谱特征集合的特征表的第一和第二分类器的参数，以及用于将第一和第二分类器组合成最终分类器的逻辑指令存储在存储器中；c)对于测试样本进行质谱分析；和d) 借助计算机用最终分类器对测试样本进行分类。

另一方面，公开了一种被配置为分类器的计算机，其包括存储器，其以针对从生物样本获得的一组质谱特征的强度数据的形式存储特征表，其中该组质谱特征已被确定为与按照其生物功能分组的蛋白质组具有统计学显著关联，以及定义分类器的一组参数，所述分类器包括对来自测试样本的质谱数据和特征表进行操作的分类算法。

另一方面，公开了一种分类器开发系统，其包括质谱仪，所述质谱仪用于在开发样本集上进行质谱分析以产生质谱数据，所述数据包括多个质谱特征；平台，所述平台用于对开发样本集进行基因集合富集分析，或者更典型地对具有相关质谱数据的另一样本集进行基因集合富集分析，并且识别一个或多个质谱特征与由它们的生物功能来分组的蛋白质组的统计学显著关联；以及计算机，所述计算机被编程为使用由所述平台识别的所述一个或多个质谱特征来训练分类器，所述分类器以一组参数的形式按照程序指示将类别标记分配给与开发样本集相同类型的样本。

在上述方法和系统中，开发样本集可以采取来自人的血液样本 (血清或血浆)的形式，例如入选药物或药物组合的临床试验中的人。这样的人可以是癌症患者。在从用免疫治疗药物(即程序性细胞死亡 1(PD-1)检查点抑制剂)治疗的黑素瘤患者获得的开发集血液样本的背景中描述了本发明的方法和系统。

该文件证明，可以将质谱中的特征与生物功能相关联，而无需直接识别产生质谱特征的蛋白质或肽，并将生物学见解纳入用于可靠分类器训练或开发的质谱特征的选择中，例如，使用Diagnostic Cortex 平台。

将质谱特征直接与生物过程相关联是重要的，因为识别在质谱中产生单个峰的蛋白质或肽通常是困难和耗时的，并且有时是不可能的。这种方法避免了成千上万的蛋白质识别研究的需要，即使成功，也不总是允许生物过程与质谱峰的匹配(许多肽和蛋白质片段的特定功能仍有待确定)。

发现与生物过程可靠相关的由人血清产生的质谱特征的能力提供了以最小侵入性，高通量方式纵向监测这些过程的新方法。可以在治疗或疾病过程中的许多时间点从患者收集血清样本，并且可以从血清样本产生的质谱的分析中推断特定生物过程的变化。这种变化可能是由于干预(例如治疗)或疾病的自然演变。虽然这项研究考虑到了肿瘤学的应用，但这在许多疾病领域可能是有意义的。

将生物学见解纳入可靠的分子诊断测试开发的分类器训练中为设计和调整可以创建的测试提供了另一个途径。Diagnostic Cortex平台的经验表明，在某些情况下，尽管试图针对其他性能目标来进行调整，调整测试以满足临床需求的能力会降低，并且产生类似的测试。据认为，这是由于某些质谱特征占主导地位和特征之间的相关性，但以前试图消除这些主导的效应以允许调查其他附属但可能重要的效应已被证明是不成功的。确定哪些特征与单个生物过程相关联的能力提供了观察可用于分类的质谱特征的全体的一种新的方法，从而允许尝试分离出可能混淆彼此的效应或移除主宰分类的过程以便揭示可以提高测试性能和测试生物假说的其他过程。

基于GSEA的特征选择的应用可能非常广泛，并且可能导致对特定生物过程和相关治疗在任何疾病中的作用的理解得以延伸。例如，已知2型糖尿病是一种代谢紊乱。然而，也已知炎症起重要作用(参见G L King等人,The role ofinflammatory cytokines indiabetes and its complications.J Periodontol.2008Aug；79(8Suppl):1527-34.doi:10.1902/jop.2008.080246and A O Odegaard等人,Oxidative stress, inflammation,endothelial dysfunction and incidence of type 2diabetes. CardiovascDiabetol.2016Mar 24；15(1):51.doi: 10.1186/s12933-016-0369-6)。如果决定建立糖尿病的预后测试，可能会考虑选择不同的特征集：一个与胰岛素通路相关，另一个与炎症相关。使用本报告中概述的方法，可以尝试将这两个广泛的生物过程对于预后的影响分开，甚至估计它们每个对预后分类的相对影响。此外，如果试图发现一种新药的预测性测试，甚至可以更好地理解该治疗的作用机制，例如，只要一个假设相关的特征集合良好工作。

由于几乎没有疾病仅由单一过程中断来定义，所以本公开的方法的应用是非常广泛的，并且仅受到所选样本中相关蛋白质的适当测量，和这些蛋白质在特定生物过程中的作用的(不)充分理解的限制。因此，从理论上讲，这种方法可以让研究人员分离和测试与几乎任何疾病相关的多种生物过程的影响，以及更好地理解治疗的作用机制。虽然本研究涉及血清的MALDI质谱法，并且限于可以通过循环蛋白质和肽探索的方法，但是所述方法本身不取决于样本类型，因此甚至可以在已经宽泛的适用范围之外延伸。

现在将具体描述基于GSEA的特征选择与分类器开发中的应用的进一步细节和实例。

本研究中使用了两个样本集：

1.从45位非小细胞肺癌患者和4位无癌受试者中收集的49个血清样本集(“GSEA群组”或“分析”集或群组)，对其收集质谱数据并使用1129蛋白

适体组(SomaLogic，Boulder，CO)来生成蛋白质表达数据。使用这个集合来确定从GSEA分析中用于分类器训练的峰值。

2.使用抗程序性细胞死亡-1(PD-1)疗法纳武单抗治疗119位晚期黑素瘤患者的119个治疗前血清样本集，加入或不加入作为临床试验一部分的多肽疫苗(“NCD群组”，在本公开中也称为“Moffitt”)(试验详情可参见J.Weber等人,Safety,Efficacy,andbiomarkers with Vaccine in Ipilimumab-Refractory or—

Melanoma,J ClinOncol 2013 Dec 1；31(34)4311)。结果数据可用于该群组的患者，并从这些样本收集质谱数据。这个样本集被用于分类器训练。这个样本集在实施例1中描述。

生成蛋白质表达数据和GSEA平台

使用SomaLogic公司在其位于Boulder,CO的实验室的1129蛋白质SOMAscan适体组从GSEA群组收集蛋白质表达数据。测定中所含的1129种蛋白质的列表包括在2016年5月24日提交的先前临时申请序列号62/340,727的附录A中。关于识别与质谱特征相关的蛋白质组的进一步细节在本文件中稍后提出。

来自GSEA群组和NCD群组的质谱数据的产生和处理如之前在实施例1中详细解释的那样进行。

基因集富集分析(GSEA)方法的应用

GSEA(参见之前引用的Mootha等人和Subramanian等人的论文) 被引入作为辅助处理或尝试最小化基因表达分析研究中的一些基本问题的方法：识别基因集和在开发样本集中得到的测试不能推广到其他样本集(过度拟合)，多重测试问题，以及无法确定在多个相关基因中一致的较小表达变化，这些变化可能被数据集中随机发生的较大表达变化所覆盖。这些是处理“p>n”数据集所固有的问题，即，测量的表达值的数目大大超过可进行测量的样本的数目。所述方法不是逐个特征地(逐个基因地)查找表达差异，而是查找在预先指定的特征组或集合之间一致的表达差异。可以基于生物洞察力创建特征集，或者可以使用先前非假设性研究定义的特征集。与特征集而不是单个特征相关联提供了一些防止识别与研究组随机相关并且不会推广到其他样本集的孤立特征的一些保护。通常情况下，相关性测试的特征集的数量少于典型基因表达研究中的单个特征的数量，因此这可以减少多重测试问题。另外，因为所述方法在特征集中寻找一致的相关性，所以可以识别在幅度(每个特征)方面比可以针对单个特征识别的显著影响更小的显著影响。

蛋白质组的定义

根据SOMAscan1129组蛋白质列表和来自 GeneOntology/AmiGO2和UniProt数据库的查询结果，创建特定的蛋白质组。

AmiGO2查询按以下过滤：

-文件类别：注释

-分类群：智人

-证据类型：实验

表45列出了使用的各个过滤器。

表45：AmiGO2数据库中使用的过滤器

蛋白质组名称	关键字
		Amigo1	急性炎症反应
Amigo2	激活先天免疫反应
		Amigo3	适应性免疫应答的调节
Amigo4	糖酵解过程的正调节
		Amigo5	免疫T细胞
Amigo6	免疫B细胞
		Amigo7	细胞周期调节
Amigo8	自然杀手调节
		Amigo9	补体系统
Amigo11	急性反应
		Amigo14	细胞因子活性
Amigo16	伤口愈合
		Amigo17	干扰素
Amigo18	白细胞介素10
		Amigo20	生长因子受体信号
Amigo21	免疫反应
		Amigo22	免疫反应1型
Amigo23	免疫反应2型

UniProt查询按以下过滤：

生物体：智人

DB：审查(SwissProt)

表46列出了UniProt数据库中使用的各个过滤器。

表46：UniProt数据库中使用的过滤器

包括在每个蛋白质组中的蛋白质列在先前临时申请序列号 62/340,727的附录D中。(Uniprot 4癌症不包括在列表中，因为它包含400多种蛋白质。)

GSEA方法的实施

GSEA方法的实现是在通用计算机上使用Matlab(版本R2015a) 完成的。这个过程可以分解成几个步骤。

假设有一组N_s样本的数据，并且对于每个样本i，给出连续变量 Q_i，和N_f蛋白质的表达值

其中i在样本(1≤i≤N_s)上运行并且j在蛋白质(1≤j≤N_f)上运行。有k个预定义的蛋白质组S_l(1≤l≤k)，所关注的是这些组与质谱数据的关联。每个蛋白质组S_l由N_h ^l成员(1＜N_h ¹＜N_f)组成并且是N_f蛋白质的完整组的子集。

1.评估个体蛋白质和连续变量(质谱特征值)之间的相关性

计算完整蛋白质组中每个单独蛋白质j和与样本相关的连续变量之间的相关性r_j的强度。Spearman等级相关被用来评估相关程度。一旦已经计算出每个蛋白质j的相关性r_j，则N_f蛋白质按r_j从最大到最小排列。

2.计算富集评分

正如Subramanian等人在前面引用的论文中所解释的那样，富集评分ES_l被设计为反映特定蛋白质组S_l的元素在排列的蛋白质列表的顶部或底部被过度表示的程度。从等级列表的顶部开始，在等级列表上的项目p上构建一个运行总和RS(S_l,P)，从零开始，如果蛋白质j 是包括在S_l中，在排序列表中加上第j项目的项|r_j|/N_norm，并且如果蛋白质j不被包括在S_l中，则在排序列表中减去第j项目的项 1/(N-N_h ^l)，直到达到项目p。N_norm是由N_norm＝Σ|r_j|定义的正则化系数，其中总和在S_l中包含的所有蛋白质j上运行。计算的RS(S_l,P)的一个实例如图43所示。

3.计算相应的p值

为了评估计算的ES与其随机分布平均值的偏差的显著性，ES的零点分布通过在连续变量和蛋白质表达之间产生随机关联的许多实现，并评估每一个实现的ES来计算。这些实现是通过置换分配给每个样本的连续变量的值来创建的。请注意，这将维护每个样本的蛋白表达值内的相关结构。一旦生成零点分布，计算的ES的p值可以作为与计算的ES相比，产生远非随机(更极端)的ES的随机排列的比例来读出。(请注意，ES的第一个定义需要分别评估正性和负性ES)。图44A和44B显示了一个蛋白质组的零点和计算的ES的实例。对于每个比较(每个单独的连续变量(即每个质谱特征)和蛋白质组对)必须分别评估零点分布。对于与质谱特征值的相关性，生成了2000个实现。

4.校正多重测试

上述方法产生的p值没有考虑多重测试。有可能扩展分析以考虑多重测试，或者通过非常保守的Bonferroni校正，或者通过在连续变量上对所有蛋白质组的排列的蛋白质列表产生随机排列的许多排列，并计算每个实现的ES。后一种方法也需要对ES进行正则化，以允许跨不同蛋白质组的结果组合。目前这两种方法都没有实施，本报告的结果也没有经过多重测试的纠正。

GSEA结果

使用上述方法，对于每个蛋白质功能组的每个质谱特征获得 GSEA p值。在图45A和45B的热图中显示了GSEA群组的49个样本的蛋白质功能组与全部351个确定的质谱特征(附录A)的相关性结果。具体而言，图45A和45B示出了通过将所有351个定义的质谱特征与不同蛋白质功能组(生物学过程)相关联的GSEA分析生成的p 值。图45(a)显示ES定义1的p值，并且图45(b)显示ES定义2。注意：质谱特征按照m/z递增的顺序排列，并且在x轴上仅标记了第五个谱特征。

表47示出了与蛋白质功能组相关的质谱特征(在351个定义的质谱特征中)的数目(其中p值低于富集评分的定义1和定义2的每个蛋白质功能子集的各种阈值)。

表47：对于低于各种阈值的p值，与蛋白质功能组相关的质谱特征的数目

*表示ES大于(或小于)用于评估零点分布的任何实现中获得的 ES

很明显，许多351质谱特征与急性期反应物(急性反应、急性期、急性炎症)、补体系统或伤口愈合有关。然而，也存在与其他完全不同的蛋白质功能组如糖酵解过程、细胞周期或癌症相关的质谱特征。因此，潜在地可能使用已确定与来自患者的血清样本中的特定生物功能相关联的质谱特征的测量结果，以监测患者中的特定生物功能。

对于富集评分的第一个定义(ES定义1)和每个蛋白质功能子集，选择p＝0.05的截止值，从而GSEA p<0.05的质谱特征与生物功能相关联。先前临时申请62/340,727的附录E列出了与所研究的几种蛋白质功能子集(急性反应、伤口愈合、免疫反应)相关的质谱特征。

然后，继续使用图8A和8B的方法，和与特定蛋白质功能组相关的峰来开发分类器。首先，在新的分类器开发(NCD)群组中对所有 119个样本执行使用图8的步骤102-150的分类器开发，其中33个质谱特征的子集与急性响应蛋白质功能组相关联。使用图8的程序，创建了一个分类器，以下称为“分类器1”，其能够将黑素瘤/纳武单抗患者分层为在OS和TTP方面具有更好和更坏的预后的两个组(分类器 1)。没有使用特征取消选择，即在类别标记的每个优化步骤中使用与急性反应蛋白质功能组相关的全部33个质谱特征。将51个样本分配给性能不佳的组，并施用“早期”类别标记。由分类器生成的类别标记的名称的具体选择并不特别重要。

将分配给良好性能组的其余68个样本用作根据图8的步骤 102-150生成的第二分类器(称为“分类器2”)的开发集。该分类器接受 26个质谱特征的子集的训练，所述质谱已被确定为与伤口愈合有关，但与急性反应或免疫反应无关。第二分类器再次不使用特征取消选择，并且将患者分层成具有更好或更差的TTP的组。良好TTP组中的样本被分配了“晚期”分类，不良TTP组中的样本被分配了“早期”分类。

然后，将最终分类器定义为分类器1和分类器2的分级组合。得到的最终分类器(即，通过以分级方式使用的逻辑指令来组合的两个 Diagnostic Cortex分类器)使用本文件附录D中列出的总共59个特征。图46示意性地示出了如何基于与急性响应相关联的质谱特征的分类器1和基于与伤口愈合，但不与急性响应或免疫响应相关联的质谱特征的分类器2的组合，将分类分配给测试样本。具体而言，对于测试样本获得质谱(图46中的“测试谱”)，并且特别是获得了附录D的59 个特征的特征值。该数据被提供给分类器1和分类器1，然后为样本生成标记。如果报告的标记是早期的(或等效物)，则样本被分配早期类别标记。如果分类器1不产生早期标记，则光谱数据被提供给分类器2。如果分类器2生成早期标记，则样本将被分配早期类别标记。如果分类器2不生成早期标记，则将为该样本分配晚期类别标记。早期和晚期标记具有与先前在实施例1中解释的相同的临床意义。

请注意，这是使用与不同蛋白质功能组相关的不同特征子集来创建多个不同分类器，并且通过基于规则的系统来将这些分类器组合以产生总体分类的一个实例，这种分类包括各种生物功能的信息内容。在这个特定的实例中，在去除或者考虑到主要效应之后，通过使用与第一分类器中使用的功能组相关的峰值，并且根据生物功能的层级，使用新的相关峰值来构建新的或第二分类器，可以发现在由分类器定义的各个组中，功能子集变得相关。如果有一个足够大的集合，就可以进一步迭代这个过程，并在与第三个蛋白质功能关联的一组峰上定义第三级分类器，并将其用于由第二级分类器分类的组中等。由于经常有多个蛋白质功能组与给定的峰相关联，所以这种方法试图解开复合效应。

结果

1.单独分类器1

分类器1为119个样本中的51个分配了“早期”分类。图47A和 47B显示了分类器1为NCD群组提供的分类的OS和TTP的 Kaplan-Meier图。基于急性反应的分类器实现了好的和不良预后组之间的明确分离。

2.单独分类器2

分类器2为未被分类器1分类为“早期”的68个样本中的35个分配了“早期”分类，剩余的33个分配了“晚期”分类。图48A和48B示出了由分类器2提供的这68个样本的分类的OS和TTP的 Kaplan-Meier图。

分类器2使用与伤口愈合有关的特征，但不包括与急性反应或免疫反应相关的特征，进一步分层了未被分类器1分类为“早期”的68 个样本。

2.定义为分类器1和2的组合的最终分类器

如图46所示以分级方式组合分类器，可以获得全集119个样本的优越的二元分层。其中三十三个(28％)的样本被分类为“晚期”，88 个(72％)被分类为“早期”。这在图49A和49B中通过总体分类的119 个样本的整个NCD群组的OS和TTP的Kaplan-Meier图中进行了说明。表48给出了表征群组清晰分层的相关统计数据。

表48：与图49A和49B的Kaplan-Meier图相关的统计(CPH＝Cox 比例风险)

表49显示了一些具有里程碑意义的存活和无进展统计数据，表 50总结了反应数据。

表49：在关键时间点仍然存活和无进展的比例

	早期	晚期
			在1年内存活％	63	88
在2年内存活％	34	61
			在6个月内无进展％	31	67
在1年内无进展％	25	60

表50：按照测试分类的反应

	早期(n＝86)	晚期(n＝33)
			PR	19(22％)	12(36％)
SD	9(10％)	9(27％)
			PD	58(67％)	12(36％)

表51显示了分类组的基线患者特征。

表51：按照测试分类的基线患者特征

Fisher精确检验显示血清LDH水平<2ULN与分类有显著相关性 (p<0.001)，并且LDH水平与分类相关的Mann-Whitney p＝0.070。早期组的基线肿瘤大于晚期组(Mann-Whitneyp<0.001)。然而，分类在任何可用的截止值下都与PD-L1表达无关。

对事件发生时间结果的多变量分析可以调整其他已知预后特征 (如血清LDH水平)的效应大小(风险比)。这个分析的结果在表52中给出。除了血清LDH水平之外，分类仍然是OS和TTP的重要预测因子，表明该分类提供了纳武单抗治疗后结果的补充信息。

表52：事件时间终点的多变量分析

值得注意的是，使用生物假说选择的这些特征子集所获得的总体分类的性能可能优于此前在该样本群组中获得的性能。图50A-50D 将本分类的Kaplan-Meier曲线图与两个先前开发的分类器的曲线图进行比较，一个分类器(IS2＝实施例1的全集分类器)同时使用全部质谱特征而开发，另一个分类器(IS6)使用再次使用所有质谱特征的具有临床不同开发子集的分类器集群。(这些分类器分别在实施例1和实施例8中描述)。

来自也用抗PD1疗法进行治疗的30名患者群组的样本可用于分类器的独立验证。21名患者(70％)被分类为“早期”，9名(30％)被分类为“晚期”。图51显示了OS的Kaplan-Meier图，表53显示了相关的统计数据。(TTP不适用于这个观察性群组。)

表53：与图51的Kaplan-Meier图相关的统计

实施例6结论和论述

实施例6的这项研究已经证明可以：

1)将质谱中的特征与生物功能相关联，而不直接识别产生质谱特征的蛋白质或肽，和

2)将生物学见解纳入用于可靠分类器开发的质谱特征的选择中，例如使用图8的Diagnostic Cortex平台。

将进一步认识到，一旦如上所述已经开发了分类器，则将其作为设置参数存储在计算机的存储器中(例如，用于分类的质谱特征的特征表，小型分类器的识别，逻辑回归权重，kNN参数，用于执行一个或多个主分类器的程序代码以及定义最终分类器的逻辑，如图8的步骤150或图46等)。例如如图15所述的实验室测试中心包括这种计算机以及用于对于血液样本进行质谱分析的质谱仪。所产生的质谱经受预处理步骤(与对于分类器开发集的样本执行的步骤相同)，然后将分类器应用于样本的质谱数据。然后分类器产生一个类别标记，例如早期或晚期，并按服务收费将该类别标记提供给请求的医生或诊所。

参考图52，将进一步意识到，已经公开了分类器开发系统5200，其包括质谱仪5202，用于对于开发样本集或者替换地和更通常地另一个独立的样本集进行质谱分析，生成质谱数据。数据包括许多质谱特征的强度数据。该系统包括用于对开发样本集，或者更典型地，其他独立样本集进行基因集合富集分析的平台5204，包括蛋白质测定系统，例如SomaLogic的SOMAscan系统或等效物，以及用于识别一个或多个质谱特征与按照其生物功能分组的蛋白质组的统计学显著关联的计算机。该系统还包括计算机5206，其被编程为使用由 GSEA平台识别的一个或多个质谱特征(例如，使用图8的程序)在开发样本集上训练分类器。分类器是一组参数和程序指令的形式，它们根据编程的指令将类别标记分配给与开发样本集相同类型的样本。

在本文中，可交换地使用术语分类器训练和分类器开发，表示在计算机中构建分类器的过程(即，指定这样的分类器的参数)并测试其对样本集(开发样本集或其一些子集)分类的能力。通常，这个过程以迭代方式发生，以调整参数以优化分类器性能，诸如通过改进分配给开发集的成员的类别标记，改进过滤参数，特征取消选择，改变参数 k等。还将注意到，虽然本实例描述了使用具有多数投票的k最近邻作为分类算法，但原则上本发明可以使用其他监督学习分类算法，例如基于边缘的分类器，支持向量机，决策树等等，或者分类器，其被配置为使用正则化程序组合的多个经过滤的小型分类器，例如使用图 8的程序所生成的。

提供以下条款作为对实施例6中公开的发明的进一步描述。

1.一种用于引导癌症患者的免疫检查点抑制剂治疗的分类器，包括：

存储器，其存储从用免疫检查点抑制剂治疗的黑素瘤患者的血液样本获得的类别标记的质谱数据的参考集，所述质谱数据为至少50 个质谱特征的特征值的形式，其中质谱特征至少与以下生物过程相关的血清中循环的蛋白质一致：(1)急性期、(2)急性反应、(3)补体系统，和(4)急性炎症反应；以及

程控计算机，其对一组质谱数据执行分类算法，该组质谱数据包括从测试的血液样本获得的多个质谱特征的特征值和参考集，并为测试的血液样本生成类别标记。

2.如条款1所述的分类器，其中质谱特征包括附录A、附录B、附录C或附录D中所列的特征。

3.如条款1所述的分类器，其中质谱特征还包括与以下另外的生物学过程相关的特征：2型免疫反应和白细胞介素-10。

4.如条款1所述的分类器，其中使用MALDI-TOF质谱法对于样本执行的至少100,000次激光照射获取测试血液样本和参考样本集的质谱数据。

5.如条款1所述的分类器，其中所述测试血液样本获自黑素瘤患者。

6.如条款1所述的分类器，其中免疫疗法包含靶向程序性细胞死亡1(PD-1)的抗体药物。

7.如条款1所述的分类器，其中所述免疫疗法包含靶向CLTA4 的抗体药物。

8.一种训练分类器的方法，包括以下步骤：

c)对于所述开发样本集中的每个样本或所述第二样本集中的每个样本，从涵盖所关注的生物功能的大组蛋白质来获得蛋白质表达数据；

d)识别所述质谱特征中的一个或多个与按照其生物功能来分组的蛋白质组合之间的统计学显著关联；和

9.如条款8的方法，其中步骤d)还包括执行基因集富集分析的步骤。

10.如条款8或条款9所述的方法，其中分类器呈经受正则化程序的经过滤的小型分类器的组合的形式。

11.如条款8-10中任一项所述的方法，其中开发集和任选的第二样本集中的样本是血液样本。

12.如条款8-11中任一项所述的方法，其中步骤b)包括在 MALDI-TOF质谱法中对样本集中的样本中的每一个进行至少 100,000次激光照射。

13.如条款8所述的方法，其中在步骤e)中训练的分类器被认为是第一分类器，并且所述方法还包括针对第二组一个或多个质谱特征来重复步骤e)，所述质谱特征与不同生物功能有关的一组不同蛋白质相关联，从而训练出第二分类器。

14.如条款13所述的方法，还包括从所述第一分类器和所述第二分类器的组合中定义最终分类器的步骤。

15.如条款13所述的方法，其中所述第二分类器用于进一步分层由所述第一分类器分配的分类组的成员。

16.一种配置为分类器的计算机，所述分类器按照条款8-15中的任一项进行训练。

17.一种测试样本的方法，包括以下步骤：

a)按照条款8-11任何一项训练分类器；

b)将包括该组质谱特征的特征表的分类器的参数存储在存储器中；

c)对于测试样本进行质谱分析；和

d)借助计算机、使用训练好的分类器将测试样本进行分类。

18.一种测试样本的方法，包括以下步骤：

a)按照条款13训练第一分类器和第二分类器；

b)将第一和第二分类器的参数(包括质谱特征集的特征表)存储在存储器中，以及用于将第一和第二分类器组合成最终分类器的逻辑指令；

c)对于测试样本进行质谱分析；和

d)借助计算机使用步骤b)中定义的最终分类器将测试样本进行分类。

19.一种配置为分类器的计算机，包括：

存储器，以强度数据的形式存储特征表，该特征表针对从生物开发样本集获得的一组质谱特征，其中该组质谱特征已经被确定为与存在于生物样本中的按照生物功能分组的蛋白质组合具有统计学显著关联；

定义分类器的一组参数，所述分类器包括对来自测试样本和特征表的质谱数据进行操作的分类算法。

20.一种分类器开发系统，包括：

质谱仪，所述质谱仪用于对开发样本集和可选地第二独立样本集进行质谱分析，以生成质谱数据，所述数据包括多个质谱特征；

平台，所述平台用于对开发样本集或任选的第二独立样本集进行基因集富集分析，并且识别一个或多个质谱特征与按照其生物功能来分组的蛋白质组的统计学显著关联；以及

计算机，所述计算机被编程为使用由所述平台识别的一个或多个质谱特征针对所述开发样本集来训练分类器，所述分类器呈一组参数的形式，所述参数根据程序指令向与开发样本集相同类型的样本分配类别标记。

21.如条款20所述的系统，其中开发样本集和任选的第二独立样本集是来自人的血液样本。

22.如条款21所述的系统，其中从用免疫治疗药物治疗的黑素瘤患者获得用于开发样本集的血液样本。

23.一种分类器训练方法，包括以下步骤：

a)从受试者群体中获得开发样本集，以及任选的第二独立样本集：

b)对开发样本集和可选的第二样本集进行质谱分析，识别样本集质谱中存在的质谱特征；

c)从大组的蛋白质来获得蛋白质表达数据，对于开发样本集中的每个样本或可选的第二样本集中的每个样本来说，所述大组的蛋白质涵盖所关注的生物功能；

d)识别一个或多个质谱特征与按照其生物功能分组的蛋白质组之间的统计学显著关联；

e)在计算机辅助下，使用步骤d)中识别的一个或多个质谱特征对来自开发样本集的样本进行第一分类器的训练，所述分类器以一组参数的形式根据编程指令将类别标记分配给与开发样本集相同类型的样本，分类器生成至少第一类别标记和第二类别标记，以及

f)在计算机辅助下，使用与由不同生物功能分组的不同蛋白质组相关联的步骤d)中识别的不同组的一个或多个质谱特征来训练第二分类器，以及

g)用第一分类器对样本进行分类，其中如果第一分类器生成第一类别标记，报告类别标记并且如果第一分类器生成第二类别标记，使用第二分类器来进一步分层样本。

24.一种分类器训练方法，包括以下步骤：

(a)对于开发血液样本集执行质谱分析和基因集富集分析，或者对于开发集血液样本，和第二独立的血液样本集执行质谱分析，并且对于第二样本集执行基因集富集分析；

(b)识别与按照其生物功能分组的蛋白质组具有统计学显著关联的多组质谱峰；

(c)在计算机中使用步骤b)中识别的与第一蛋白质功能组相关联的峰集合中的一个，执行分类器训练程序，分类器训练程序对开发样本集或其子集的质谱数据进行分类。

25.如条款24所述的方法，还包括对步骤b)中识别的与不同于第一蛋白质功能组的第二蛋白质功能组相关的第二组峰来重复步骤 c)。

26.如条款25所述的方法，还包括针对步骤b)中识别的不同于所述第一和第二蛋白质功能组的第三蛋白质功能组的第三组峰来重复步骤c)。

27.一种测试受试者的方法，包括：

按照条款24训练分类器；

在第一时间点利用分类器对来自受试者的样本进行分类；

利用分类器在稍后的时间点对从受试者获得的第二样本进行分类。

28.如条款27所述的方法，其中所述样本由入选药物的临床试验中的患者提供，其中所述第一时间点在所述药物的治疗之前，并且其中所述较晚的时间点在治疗开始之后并且患者仍然参加临床试验。

29.一种评估人体内生物过程的方法，包括以下步骤：

a)按照条款24训练分类器；

b)对来自人体的血液样本进行质谱分析；

c)使用从步骤b)获得的数据和步骤a)中训练的分类器对样本进行分类，从而获得样本的第一类别标记；

d)对于在获得步骤b)的样本之后的较晚的时间点从人体采集的第二血液样本进行质谱分析；

e)使用从步骤3)获得的数据和步骤a)中训练的分类器分类第二血液样本，从而获得第二类别标记；

f)比较第一和第二类别标记，其中比较提供关于在人体内发生的生物过程的信息。

30.一种评估人体内生物过程的方法，包括以下步骤：

a)从受试者群体获得开发血液样本集，并且可选地从类似但不一定相同的受试者群体获得第二独立血液样本集；

b)对于开发血液样本集和任选地对于第二血液样本集进行质谱分析，并且识别存在于所述血液样本集的质谱中的质谱特征；

c)对于所述开发样本集中的每个血液样本或所述第二血液样本集中的每个样本，从涵盖所关注的生物功能的大组蛋白质来获得蛋白质表达数据；

e)对于来自人类的血液样本进行质谱分析，包括获得在步骤d) 中识别的一个或多个质谱特征的质谱特征值。

31.如条款30所述的方法，还包括以下步骤：从人获得第二血液样本，并且对来自人的第二血液样本进行质谱分析，包括获得步骤 d)中确定的一个或多个质谱特征的质谱特征值。

32.如条款31所述的方法，其中人参与药物或药物组合的临床试验。

33.如条款30所述的方法，其中所述人参与药物或药物组合的临床试验，并且其中所述方法还包括以下步骤：在所述人入选所述临床试验的过程中，从所述人重复获得血液样本，并且对血液样本进行质谱分析，包括在质谱中获得在步骤d)中与按照其生物功能分组的蛋白质组一起识别的一个或多个质谱特征的特征值。

33.监测入选临床试验中的一组患者的方法，包括对参加临床试验的每个患者实施条款30所述的方法。

34.如条款33所述的方法，还包括在试验过程中从入选临床试验中的患者反复获得血液样本，并且对于所述血液样本进行质谱分析，包括在质谱中获得在条款30的步骤d)中识别为与按照其生物功能分组的蛋白质组相关联的一个或多个质谱特征的特征值。

实施例7

纵向研究

对纳武单抗研究(实施例1中描述)的治疗期间，具体地在试验的第7周(“WK7”)和第13周(“WK13”)收集的样本进行了分析。使用实施例1的全集分类器和实施例2的分类器探索了对给定患者的分类如何随时间变化。发现，在一些患者中，标记改变了，例如在治疗开始时晚期的初始类别标记，然后在第7周为晚期并且在第13周为早期。作为另一个实例，一些患者在开始治疗时具有早期类别标记，然后在第7周为早期并且在第13周为晚期。

图30A-30F中示出了使用实施例1全集分类器的纵向研究的结果。图30A和30B是基线分类定义的早期和晚期组的总体存活(图30A) 和进展时间(TTP)(图30B)的Kaplan-Meier图。图30C和30D分别是由第7周分类定义的早期和晚期组的总体存活和TTP的Kaplan-Meier 图。图30E和30F分别是根据第13周分类定义的早期和晚期组的总体存活和TTP的Kaplan-Meier图，对于在所有三个时间点都有类别标记的90名患者。表54是图30A-30F的图的存活分析的表格。

表54

	HR(95％CI)	对数秩p值	中位数
				基线OS	0.45(0.21-0.78)	0.008	早期：84周，晚期：未达到
WK7OS	0.39(0.14-0.64)	0.002	早期：60周，晚期：113周
				WK13OS	0.33(0.14-0.54)	<0.001	早期：61周，晚期：未达到
基线TTP	0.53(0.24-1.01)	0.055	早期：91天，晚期：457天
				WK7TTP	0.37(0.10-0.61)	0.003	早期：91天，晚期：782天
WK13TTP	0.58(0.25-1.15)	0.112	早期：112天，晚期：457天

表55显示了所有样本在三个时间点的分类分布情况。

表55：三个时间点分类的分布：基线、WK7、WK13。缺失分类用“-”表示。

大多数分类在可用时间点内保持不变(82/119＝69％)。从早期到晚期比从晚期到早期有相应的更多变化，从早期到晚期的大部分变化发生在WK7，在WK13保持晚期。这可能是由于免疫疗法治疗的开始。在样本可用的情况下，在WK7从晚期到早期变化的一半患者在WK13恢复到晚期。在WK7分类为晚期的患者中有12例(16％)在 WK13期间改变为早期，其中一半在70和93天之间进展，尽管其中三例在1000天以上经历无进展间隔。

图31A和31B显示Kaplan-Meier曲线，其绘制根据基线、WK7 和WK13三元分类将患者分组时的结果。图31A是总体存活率的图；图31B是进展时间图。在这些图中，这些组首先由基线类别标记，其次为WK7分类并且最后为WK13分类(即“早期晚期早期”表示早期基线分类、早期WK7分类和早期WK13分类)。重复早期类别标志特别差的OS和TTP，并且至少在OS中，在WK 13具有早期标记表示较差的预后，即使前两个分类是晚期。然而，WK13和WK7的晚期标记对应于更好的结果，即使基线分类是早期的。注意：其他标记序列的患者太少，无法进行有意义的分析。

表56示出了图31A和31B的曲线的中位数。

表56

对于实施例2分类器随着时间的推移产生的分类，重复了这个分析。结果大体上类似于这里针对实施例1全集分类器所呈现的结果。大多数分类在所有时间点都保持不变(三个时间点59/90＝66％，前两个时间点83/107＝78％)。从早期到晚期比从晚期到早期有相应的更多变化，从早期到晚期的大部分变化发生在WK7，在WK13保持晚期。这可能是由于免疫疗法治疗的开始。在样本可用的情况下，在 WK7从晚期到早期变化的大部分患者在WK13恢复到晚期。

图32A和图32B是Kaplan-Meier曲线图，显示了根据实施例2 分类器产生的基线、WK7和WK13三元分类将患者分组时的结果。图32A是总体存活率的图；图32B是进展时间的图。这些组首先由基线类别标记，其次是WK7分类，最后是WK13分类。重复早期类别标志特别差的OS和TTP，而重复晚期类别表示特别好的OS和 TTP。在WK7上从早期到晚期变化，在WK13保持晚期导致与在所有三个时间点具有晚期类别相似的结果。

图32A的统计数据在表57中列出。

表57：图32A的OS图的中位数

	中位数OS(周)
		早期早期早期(N＝9)	47
早期早期晚期(N＝5)	99
		早期晚期晚期(N＝11)	未达到
晚期早期晚期(N＝5)	99
		晚期晚期早期(N＝6)	78
晚期晚期晚期(N＝50)	113

图32B的统计数据列于表58中。

表58：图32B的TTP图的中位数

有一些理论解释为什么类别标记随着时间而改变。纳武单抗治疗开始后患者的生物学改变可能诱发类别标记改变。这种变化可能是由于对类别标记的肿瘤大小的影响(参见下面的论述)，以及一些患者实现的较大肿瘤缩小。不管变化起因，确实观察到大多数患者保持其基线标记。在随着时间的推移类别标记变化的患者中，观察到当标记从基线的早期改变为稍后(第7或13周)的晚期时，这些患者的结果相对较好，类似于具有晚期基线类别标记的患者。因此，在一个实施方案中，实施例1或2的测试可以在整个治疗过程中定期进行，例如，每 4、6或8周。通过比较治疗期间随时间推移的结果和类别标记的进展，可以监测纳武单抗治疗的治疗效果，或者预测患者的预后或总体存活。这种治疗监测可以是直接的，即通过类别标记测量的某些免疫状态的直接变化，或者是间接的，即，类别标记的变化是肿瘤收缩/ 扩张测量的替代或近似。在治疗过程中，想要进行测试和确定患者的类别标记的频率也可能取决于是否类别标记的变化是由于药物对患者免疫系统的直接作用所导致的，或是否必须等待治疗对肿瘤缩小 (或缺乏)的间接作用。

随着时间的推移，患者的标记从晚期到早期的变化可能是药物缺乏效力的早期迹象。可以任选地通过对患者进行放射学研究，例如 CT扫描来确定与基线相比的肿瘤大小和变化，从而证实这种疗效的缺失。潜在地，如果从晚期到早期的变化是由于药物直接改变患者的免疫状态而引起的，并且如果这种情况发生在相对较短的时间间隔内 (例如4周左右)发生，基线晚期标记可能是开始用纳武单抗治疗的指示，并且随后的早期标记可以用于停止治疗、将治疗改变至不同的治疗(例如组合纳武单抗和伊匹单抗)或采取其他行动。另一种可能性是在治疗的前几周定期进行监测，并使用类别标记来指示患者需要多久，才能服用纳武单抗。目前，患者服用药物直至疾病进展。这可能是很长的时间，药物非常昂贵。因此，如果在初始几个月内有一种方法可以告诉患者是否可以停止纳武单抗治疗而不损害结果，那么可能会节省一些医疗保健费用。无论如何，在一个可能的实施方案中，实施例1和2的测试是在治疗过程中定期进行的。在治疗过程中将类别标记进行比较。治疗过程中类别标记的状态可用于引导治疗或预测患者的预后，维持治疗，停止治疗或以某种方式改变治疗，例如在组合治疗方案中将纳武单抗与另一种药物组合。

在可以如何进行监测测试的一个具体实例中，使用图15的系统 (如上所述)根据实施例1或实施例2至少在治疗的前四周内再次确定初始类别标记，并且至少在治疗的前四周之后再次确定。

提供以下条款作为对实施例7中描述的发明的进一步描述。

1.首先根据实施例1、2、3、4或6的方法对患者样本进行分类，并且在治疗过程中或在患者入选临床试验的过程中重复地从患者获得样本，对样本进行质谱分析，并用分类器分类样本，从而重复产生类别标记。

2.如条款1所述的方法，还包括以下步骤：确定类别标记是否在治疗过程中改变，并使用类别标记中的改变来引导患者的治疗。

3.如条款1所述的方法，还包括以下步骤：确定类别标记在治疗过程中是否没有改变，并且使用类别标记中没有改变来引导患者的治疗。

4.如条款1的方法，其中重复进行步骤在治疗之前首先进行，至少在治疗的前四周内再次进行，并且至少在治疗的前四周之后再次进行。

5.如实施例6中所示，(例如，使用GSEA)确定生物功能和从血液样本获得的质谱特征之间的关联的方法，通过从患者重复获得血液样本并且对该样本进行质谱，并且在一段时间内分析来自样本的质谱数据以观察或了解随时间的生物功能的变化，例如上调或下调与生物功能相关的特定蛋白质，例如在治疗或在患者参与临床试验的过程中。

6.如条款5的发明，还包括使用由开发样本集训练的计算机实现的分类器和与生物功能相关联的一组质谱特征来执行每个血液样本的分类的步骤。

实施例8

根据肿瘤大小信息训练分类器

已经发现了一种生成分类器的方法，该分类器考虑了在基线处的肿瘤大小，这改善了分类器的性能。这个方法及其在实际中的使用方法将在本节中解释。注意下面描述的研究使用了与实施例1相同的 119个样本，提供所有患者的肿瘤大小数据，并且使用了与实施例1 相同的样本特征表数据(附录A中的特征的质谱数据)。唯一的区别是特征m/z 9109从特征表中被删除，因为它具有可能的再现性问题并且分类的价值很小。

在为用纳武单抗治疗的黑素瘤患者分配预后标记时，考虑肿瘤大小的初始尝试表明，对于在治疗时可获得肿瘤大小随访数据的患者，基线的肿瘤大小对于应该分配给开发集中的样本的分类有确定的影响。上述结论的发现过程如下：获取初始掌握基线和随访肿瘤大小数据的104名患者的数据，并将集合划分成两部分：一部分在基线时肿瘤较小，另一部分在基线时肿瘤较大。然后，使用图8中的分类器开发方法，就像对于实施例1的分类器那样，并且分别产生分类器，一个用于肿瘤较小的患者，另一个用于肿瘤较大的患者。然后，继续使用大肿瘤或小肿瘤分类器对开发集中的样本进行分类，这取决于基线处肿瘤的大小。

注意到，由实施例1全集分类器分类为晚期的一些较小肿瘤现在得到了早期类别，并且由实施例1全集分类器分类为早期的一些较大肿瘤现在分类为晚期。特别值得注意的是，一些以前被分类为晚期并且在治疗中表现出巨大肿瘤生长的小肿瘤现在被分类为早期并且一些以前被分类为早期，并且在治疗前26周显著缩减的大肿瘤现在被分类为晚期。如图33A和33B所示，对104名患者的这个子集绘制 Kaplan-Meier图，根据治疗前肿瘤大小所定义的两个分类器的分类增加了新的早期和晚期组之间的风险比。在这些图中，“初始早期/晚期”是使用实施例1全集分类器(方法1)为104名患者子集定义的分类组，而“TS调整早期/晚期”是由用于较小和较大肿瘤的新分类器产生的分类，这些分类器分别应用于较小和较大肿瘤的样本。

表58给出了针对肿瘤大小调整的早期和晚期组之间存活分析比较的结果。

表58：根据肿瘤大小调整的104名患者子集的分类性能

这些结果表明，在对最小和最大肿瘤的一些样本进行分类时没有作出最佳决定，并且在设计和生成实施例1的分类器时可以通过考虑肿瘤大小来改善。

然后获得了其余15个样本的基线肿瘤大小数据。当将这些新的分类器应用到这些样本(取决于它们是在小肿瘤大小组还是在大肿瘤大小组中)，并且将这些患者加入到Kaplan-Meier分析中时，注意到改善的分离几乎消失。显然，在分类这15个样本方面做得比以前做得更差。也试图如同对所有119个样本进行上述训练一样执行相同方法，但是结果是与初始分类相比，或多或少没有改善。这些观察结果使得出这样的结论：初始省略的这15名患者本质上是不同的-实际上他们被忽略，是因为他们没有达到随访肿瘤大小评估，具有非常早期的进展(所有15名患者在78天前进展)。假设对于进展速度非常快的患者，肿瘤大小的作用远远低于对于长时间无进展的患者的作用。为了保持达到26周评估的104名患者的上述改善，并正确分类其他 15例样本，决定首先发现一个分类器移除进展最快的患者，然后对于剩下的样本，按照肿瘤大小来重复进行分类器开发。也就是说，希望从分类器开发中移除进展最快患者的那些样本，然后根据肿瘤大小进行新的分类器开发，并生成“小肿瘤”分类器和“大肿瘤”分类器。这些新的分类器被设计用于随后用于测试患者的免疫检查点抑制剂益处，在测试患者是否患有“大”或“小”肿瘤的数据时的附加输入，然后使用适当的大或小肿瘤分类器。从下面的论述中可以明显看出，在下面描述的方法可能通常有助于在肿瘤学环境中产生“小肿瘤”和“大肿瘤”分类器。

为了排除进展最快的患者，回到全集实施例1分类器。使用这个分类器，将开发集中的样本分为早期(N＝47)和晚期(N＝72)组。采用 47个样本的早期组，并使用与上面详述的图8相同的方法，使用47 个样本的早期组作为输入开发样本集。在执行新的分类器开发中，以迭代的方式对错误分类的样本执行标记翻转，直到收敛，从而将这 47个样本分成两个亚组，称之为“更早期”和“更晚期”。初始的类别定义(图8，步骤102)基于更短和更长的OS，并且基于训练集的分类组之间的OS的风险比，使用过滤(图8步骤126)。这产生了一个分类器，将47名早期患者分成两组，分别具有更好的(“更晚期”)和更差的 (“更早期”)结果。

图34A和34B示出了由该分类器产生的组的OS和TTP的 Kaplan-Meier图。22名患者被分配到更早期组，25名被分配到更晚期组。表59给出了更早期和更晚期存活分析比较的结果。

表59：仅在全集分类器“早期”样本上开发的分类器的性能

很明显，更早期组在TTP和OS方面的结果特别差。决定从进一步的分析中删除这22个样本，并保留它们已经分配的“早期”分类。然后，使用初始开发样本集的剩余97个样本，使用图8的程序进行了两个新的分类器开发，其中一个用于大肿瘤和一个用于小肿瘤。根据肿瘤大小将这97个样本分成两组：最小的49个样本用于生成一个分类器(小肿瘤分类器)，最大的48个样本用于生成另一个分类器(大肿瘤分类器)。两个分类器按照以前的方式使用图8的程序以迭代的方式进行训练，标记翻转用于错误分类的样本直到收敛，初始类别分配“早期”和“晚期”(图8，步骤102)基于OS的持续时间来定义。

当肿瘤较大、肿瘤较小和病程较快的患者(早期/更早期类别)患者的数据合并时，获得图35A和35B的Kaplan-Meier图。早期和晚期组的存活分析比较的结果在表60中给出。

表60：首先取消了22例分类为结果特别差的患者，在对肿瘤大小进行校正时，所有119名患者的分类性能

最后的晚期组的结果稍好于原来的晚期组，并且由明显较少的患者组成。最后早期组的成果与初始的早期组的结果非常相似，尽管它的规模增加了28％。对于两个终点，各组之间的风险比稍好于初始的实施例1分类。

在这种情况下分类器性能的调查也可以通过以下来进行：对于开发集的每个成员，绘制肿瘤大小从基线到较晚的时间点(例如治疗开始后26周)的百分比变化，并且在这样的绘图中指出数据点是否代表早期或晚期类别患者。图36A和36B示出了这种被称为“瀑布图”的图。瀑布图显示了在26周评估时可评估的104名患者的肿瘤大小的减少百分比。图36A是“最终”分类器的图(即，考虑肿瘤大小并使用大或小肿瘤分类器)。图36B是初始实施例1全集分类器的图。

从比较图36A和36B的曲线可以看出，使用肿瘤大小分类器的新的最终分类在将患有肿瘤生长的患者分类为早期时明显更好。也就是说，当使用肿瘤大小分类器时，在治疗过程中具有显著肿瘤生长的大部分患者被分类为早期，正如鉴于早期类别标记的临床意义所预期的那样。而且，在治疗过程中大部分肿瘤大小明显缩小的患者被分类为晚期，这也是预期的。然而，比较图36A和36B的右侧，与实施例1全集分类器相比，使用肿瘤大小数据的新分类器在将肿瘤缩小的患者识别为晚期方面性能稍差。

可以用流程图的形式总结和解释在开发样本集中使用肿瘤大小数据生成分类器的优选方法。现在参考图37，分类器开发过程在3700 处示出并且包括从开发样本集中移除在开始治疗后进展最快的患者的样本的第一步骤3702。该步骤3702在图39中详细示出，并将在下面详细解释。

在步骤3704，一旦将这些样本从开发集中移除，则将在开发集中的剩余样本基于基线的肿瘤大小分别分类为小肿瘤组和大肿瘤组 3706和3707。

在步骤3708，使用图8的程序，使用小肿瘤样本(相关联的质谱数据，附录A中列出的特征的特征值)作为用于生成小肿瘤分类器的开发集。

在步骤3710，然后通过使用分类器对小肿瘤样本3706进行分类来验证在步骤3708中开发的分类器的性能。

在步骤3712，然后存储在步骤3708中生成的小肿瘤分类器的参数，以便稍后用于对具有小肿瘤的患者的测试样本进行分类。这些参数尤其包括识别形成用于分类的参考集的小肿瘤样本质谱数据集的数据；在参考集的预定质谱特征处的特征值；通过过滤的小型分类器的识别和kNN参数；来源于小型分类器通过丢弃正则化来进行组合的逻辑回归权重；以及在小肿瘤开发样本集上执行图8的过程中产生的主分类器的最终分类器的定义(图8B，步骤150)。

对于大肿瘤样本3707执行步骤3714、3716和3718，与上述步骤3708、3710和3712完全相同。

图38显示了根据图37生成的分类器的使用方式。将分类器用于进行黑素瘤或其他癌症患者的血液样本的测试，以确定他们是否可能从免疫检查点抑制剂(例如抗PD-1抗体或抗CTLA4抗体)获得治疗癌症的益处。这个过程显示在3800。在步骤3802，获得患者的肿瘤大小数据。这些数据可以从患者的CT或PET扫描数据中获得。理想情况下，肿瘤大小数据将伴随提供用于测试的血液样本。或者，可以使用肿瘤大小数据的一些代用或替代(例如，单独的质谱特征或与通过替代方法如ELISA测量的其他血清蛋白组合的一些组合)。在步骤3804，再次使用这个数据做出关于肿瘤是“大”还是“小”的确定。该确定的标准可以采用图37的步骤3704中用于分类样本的标准的形式。

如果肿瘤大小为“小”，则在步骤3806，使用图15的系统，使用在图37的步骤3712处生成并存储的小肿瘤分类器对样本进行分类。也就是说，对血液样本进行质谱分析，质谱数据经受图15所示的步骤，用于分类的分类器是图37中生成的小肿瘤分类器。在步骤3808，类别标记早期或晚期被分配给样本。如果患者被确定为晚期，预计患者从免疫检查点抑制剂中获益，并且与类别标记早期相比具有改善的总体存活。

如果在步骤3804肿瘤尺寸是“大的”，则使用图15的系统，使用图37的大肿瘤分类器来分类患者的血液样本。在步骤3812，报告分类器的早期或晚期类别标记。“早期”和“晚期”标记的含义与前一段中的解释相同。

图39是示出作为生成图37的大肿瘤分类器和小肿瘤分类器的预备步骤的从开发集中移除最快进展样本的程序3702的流程图。在步骤3904，使用图8的程序在开发样本集中的所有样本上生成分类器。这样的一个实例是上面描述的实施例1的全集分类器。

在步骤3906，然后使用该分类器对开发样本集中的所有样本进行分类。然后将开发样本集的每个成员分类为早期或晚期。早期和晚期患者分为两组，分别为3908和3910。

在步骤3912，使用图8的过程生成新的分类器，其中早期患者组3908形成图8的开发样本集。图8的过程是为了将早期患者分成更早期和更晚期亚组而进行的。在本文的这个部分的开始部分描述了这样的一个实例，并且在图34A和34B中显示了结果。在步骤3914，在生成了分类器3912之后，将其应用于所有早期样本(3908)，并且执行将早期患者分类为“更早期”和“更晚期”亚组3916和3918的所得分类。之后，更早期患者3916被识别并从开发样本集中移除。图37的过程然后在步骤3704继续，开发样本集减去这个“更早期”患者亚组以产生小肿瘤和大肿瘤分类器。

根据以上论述，显而易见的是，公开的发明的一个方面是被编程为用于将癌症患者分类为可能或不可能受益于免疫检查点抑制剂的分类器的机器(例如，图15，1510)。机器1510包括存储小肿瘤分类器和大肿瘤分类器的参数的存储器1514以及用于小肿瘤分类器和大肿瘤分类器中的每一个的类别标记质谱数据的参考集。如上所述，参考集是从用免疫检查点抑制剂治疗的其他癌症患者的血液样本获得的。该机器还包括执行由存储在存储器中的参数定义的分类器的处理单元(图15，1512)。在优选实施方案中，定义用于小肿瘤分类器和大肿瘤分类器中的每一个的分类器的参数包括定义分类器的参数，该分类器被配置为使用丢弃正则化的经过滤的小型分类器的组合，例如由图8的步骤102-150的程序得到。在一个可能的实施方案中，质谱数据是通过对血液样本进行MALDI-TOF质谱分析获得的，并且其中每个样本进行至少100,000次激光照射，使用实施例1中所述的所谓深度MALDI方法。

另一方面，已经描述了一种产生用于将癌症患者分类为可能或不可能从药物中受益的分类器的方法，所述方法包括以下步骤：1)获得多个血液样本形式的开发样本集(图8，100)；2)在开发样本集上进行质谱分析(参见实施例1)；3)从开发样本集中移除在开始药物治疗之后疾病进展相对较快的来自患者的样本；(步骤3702，图37)4)基于基线(开始治疗)的肿瘤大小将剩余的样本分选成大肿瘤和小肿瘤组；(图 37的步骤3704)；5)对于小肿瘤组：a)使用小肿瘤组作为分类器开发练习中的输入开发样本集，产生小肿瘤分类器；(图37，步骤3708)b) 验证小肿瘤分类器在小肿瘤样本集成员分类中的性能；(图37，步骤 3710)和c)存储小肿瘤分类器的参数；(图37，步骤3712)；和6)对于大肿瘤组：a)使用大肿瘤组作为分类器开发练习中的输入开发样本集，产生大肿瘤分类器；(图37步骤3714)b)验证大肿瘤分类器在大肿瘤样本集成员分类中的性能；(图37步骤3716)和c)存储大肿瘤分类器的参数(图37，3718)。

优选地，如本部分上面所解释的，步骤5a)和步骤6a)的分类器开发练习采取实施图8的步骤102-150的程序的形式。

又一方面，考虑了将癌症患者分类为可能或不可能从药物获益的方法。所述方法包括以下步骤：a)确定患者具有大肿瘤还是小肿瘤； (图38，3802)；b)如果患者具有大肿瘤，则使用上述方法产生的大肿瘤分类器将患者的血液样本分类为可能或不可能从该药物获益(图 38，3806)和c)如果患者具有小肿瘤，则使用如上所述产生的小肿瘤分类器将患者的血液样本分类为可能或不可能从该药物获益。

又一方面，考虑了将癌症患者分类为可能或不可能从药物获益的方法。所述方法包括以下步骤：a)对分类为小肿瘤和大肿瘤组的开发样本集进行两个分类器生成练习，导致产生大肿瘤分类器和小肿瘤分类器，并将大肿瘤和小肿瘤分类器存储在程控计算机中(图37)。开发样本集是经受质谱分析的血液样本。所述方法包括步骤b)：直接从肿瘤测量数据确定患者具有大肿瘤还是小肿瘤，或间接使用肿瘤测量数据的替代物(图38步骤3084)来确定患者具有大肿瘤还是小肿瘤。所述方法还包括对于癌症患者的血液样本进行质谱分析的步骤c)(图 15，1506，1508)。如果患者具有大肿瘤，则所述方法包括使用步骤 a)中生成的大肿瘤分类器和步骤c)中获得的质谱数据用程控计算机一起将患者分类为可能或不可能从中受益的步骤，如果患者具有小肿瘤，则使用步骤a)中产生的小肿瘤分类器和步骤c)中获得的质谱数据用程控计算机将患者分类为可能或不可能从该药物获益。

在一个实例中，癌症患者是黑素瘤患者，并且该药物是靶向程序性细胞死亡1(PD-1)的抗体药物。然而，图37-39中描述的方法适用于其他类型的癌症患者和药物。

提供以下条款作为对实施例8的公开发明的进一步描述。

1.被编程为分类器的机器，用于将癌症患者分类为可能或不可能受益于免疫检查点抑制剂，包括：

存储器，其存储小肿瘤分类器和大肿瘤分类器的参数，针对小肿瘤分类器和大肿瘤分类器中的每一个的类别标记的质谱数据的参考集，参考集从用免疫检查点抑制剂治疗的其他癌症患者的血液样本获得；和

处理单元，其执行由所述存储器中存储的参数定义的所述大肿瘤分类器或所述小肿瘤分类器，以分类所述癌症患者的血液样本的质谱数据，并向所述样本分配类别标记，所述类别标记指示患者是否可能受益于免疫检查点抑制剂。

2.条款1的机器，其中定义用于小肿瘤分类器和大肿瘤分类器中的每一个的分类器的参数包括定义分类器的参数，所述分类器被配置为通过丢弃正则化来实现的小型分类器的组合。

3.条款1或条款2的机器，其中质谱数据是通过对血液样本执行MALDI-TOF质谱获得的，并且其中每个样本经受至少100,000次激光照射。

4.一种产生用于将癌症患者分类为可能或不可能受益于药物的分类器的方法，包括以下步骤：

1)获得以多种血液样本形式的开发样本集；

2)对开发样本集进行质谱分析；

3)从开发样本集中删除在开始用药治疗之后疾病进展相对较快的患者的样本；并用计算机：

4)根据基线(治疗开始时)的肿瘤大小，将剩余的样本分成大肿瘤和小肿瘤组；

5)对于小肿瘤组：

a)使用小肿瘤组作为分类器开发练习中的输入开发样本集生成小肿瘤分类器；

b)验证小肿瘤分类器在小肿瘤样本集成员分类中的性能；和

c)存储小肿瘤分类器的参数；

和

6)对于大肿瘤组：

a)使用大肿瘤组作为分类器开发练习中的输入开发样本集生成大肿瘤分类器；

b)验证大肿瘤分类器在大肿瘤样本集成员分类中的性能；和

c)存储大肿瘤分类器的参数。

5.条款4的方法，其中步骤5a)和步骤6a)的分类器开发练习包括图8的步骤102-150的程序。

6.一种将癌症患者分类为可能或不可能受益于药物的方法，包括以下步骤：

a)直接通过肿瘤测量数据或间接使用肿瘤大小数据的替代来确定患者具有大肿瘤还是小肿瘤；

b)如果患者患有大肿瘤，使用如条款4生成的大肿瘤分类器将患者的血液样本分类为可能或不可能从该药物获益，以及

c)如果患者患有小肿瘤，使用如条款4生成的小肿瘤分类器将患者的血液样本分类为可能或不可能从该药物获益。

7.一种将癌症患者分类为可能或不可能受益于药物的方法，包括以下步骤：

a)对分类为小肿瘤和大肿瘤组的开发样本集进行两个分类器生成练习，导致产生大肿瘤分类器和小肿瘤分类器，并且将大肿瘤和小肿瘤分类器存储在程控计算机中；其中所述开发样本集是经受质谱分析的血液样本；

b)直接根据肿瘤测量数据或间接使用肿瘤测量数据的替代指标来确定患者具有大肿瘤还是小肿瘤；

c)对于癌症患者的血液样本进行质谱分析；

d)如果患者具有大肿瘤，使用步骤a)中产生的大肿瘤分类器和步骤c)中获得的质谱数据与程控计算机一起将患者分类为可能或不可能从该药物获益，以及

e)如果患者具有小肿瘤，使用步骤a)中产生的小肿瘤分类器和步骤c)中获得的质谱数据与程控计算机一起将患者分类为可能或不可能受益于该药物。

8.条款7的方法，其中步骤a)的分类器生成练习包括图8的步骤102-150的程序。

9.条款7或条款8的方法，其中所述癌症患者是黑素瘤患者，并且其中所述药物是靶向程序性细胞死亡1(PD-1)的抗体药物。

实施例9

从临床上不同的分类器开发集来开发分类器集群并用于引导治疗

在实施例8中描述的工作利用了使用临床上不同的开发集的不同分类器的开发，即一个集合来自“小肿瘤”患者，另一个集合来自“大肿瘤”患者。在这个实例中，更广泛地扩展了开发分类器的这种方法，并且描述了不同分类器的集群，每个分类器均来源于临床上不同的开发集。在该实施例的一个实施方案中，每个开发集代表在黑素瘤患者群体中的不同的肿瘤大小或肿瘤大小的不同比例。从这种方法中，发现了一种可重复的三元分类方法和系统，它能更好地鉴别在免疫检查点抑制剂抗PD-1上反应如此糟糕的患者，以至于他们可能最好不要服用，可能更重要的是，它能更好地鉴别在抗PD-1单药治疗方面反应很好的其他人，以至于他们可能较好地服用抗PD-1单药治疗，而不是接受抗PD1/抗CTLA4组合治疗，这会产生巨大的额外费用，并且可能会有严重的毒性副作用。后面的实例中，描述了分类器集群的开发和实现，以预测卵巢癌患者在化疗中的存活率。

因此，在本节中，描述了一种之前没有考虑过的分类器开发的不同方法，即设计一组分类器的开发集以探索不同的临床组，并使用从这样的开发集获得的分类器集群来产生例如三元(三级)分类方案。进一步描述了从这个分类器集群产生的类别标记如何可用于引导癌症患者的治疗或预测癌症患者的存活。本领域技术人员应理解，通过实例而非限制的方式提供了设计具有不同临床组的一组分类器的开发集的本实例，并且所述方法可以一般地扩展到其他分类器开发场景，包括特别是预测患者从药物治疗获益或存活的其他分类器开发。

A.从纳武单抗中获益的黑素瘤患者的分类器集群

在本实施例的黑素瘤/纳武单抗部分中，来自Moffitt癌症中心用纳武单抗治疗的患者的治疗前血清样本的深MALDI特征表(参见实施例1和附录A)用于分类器的开发。对于分类器开发，使用了可获得肿瘤大小随访数据的患者的104个样本。根据基线肿瘤大小将这104个样本分成两组：50个最小肿瘤患者和54个最大肿瘤患者。将这些子集中的每一个用作使用图8的过程来开发分类器的开发集，其中袋装特征被取消选择并且根据总体存活来过滤小型分类器。这些方面已经在本文先前临时申请序列号62/289,587的实施例8和附录F中描述过。

另外，104个样本分类器开发集中的另外五个子集被定义为附加或替代开发集。其中第一个子集采用肿瘤最小的50名患者的集合，丢弃其中10名，用54名患者的集合中的肿瘤较大的10名患者来替换。其中第二个子集采用肿瘤最小的50名患者的集合，丢弃其中20名，用54名患者的集合中的20名患者来替换。定义了三个其他的开发集，进一步扩展了这个方法。第五个分类器因此是初始54个大肿瘤大小集合的子集。通过这种方式，生成了50个患者样本的5个开发集，其中包含不同比例的较大和较小肿瘤大小的患者(80％-20％， 60％-40％，40％-60％，20％-80％和0％-100％)。对于这5个开发集中的每一个，使用与上面详细描述的图8相同的程序来生成分类器，即，将每个分类器定义为最终分类器(图8，步骤150)，所述最终分类器是从用于该分类器的开发集的625个测试/训练划分中生成的625个主分类器的集群平均，每个主分类器是多个小型分类器的逻辑回归组合，其通过总体存活性能过滤标准，并通过极值丢弃来正则化。每个分类器为样本产生一个二元类别标记，早期或晚期，早期和晚期都具有与实施例1中所解释的相同的临床意义。因此，获得了7个不同分类器(如本文所述开发的5个，加上在实施例8“并入肿瘤大小信息的分类器”部分中描述的“大”和“小”肿瘤分类器)的集群，其中每一个在临床上不同的分类器开发集上来开发。将会注意到，在“并入肿瘤大小信息的分类器”部分中描述的“大”肿瘤分类器和由50个“大”肿瘤患者产生的新分类器中的第五个是类似的，但是不同之处在于它们是由不同组的患者来形成。这七个分类器的集群在本文中被称为“IS6”或“IS6分类器”。

定义具有不同临床分组的分类器开发集的另一种方法如下：

1.根据肿瘤大小排列104个样本。

2.将50个最小肿瘤大小的样本用于一个分类器开发，剩下的54 个最大肿瘤大小的样本用于另一个分类器开发，就像这里一样。

3.如下定义5个其他的分类器开发集

a.丢弃10个最小肿瘤大小的样本，并将后续50个样本作为分类器开发集。

b.丢弃20个最小肿瘤大小的样本，并将后续50个样本作为第二分类器开发集。

c.丢弃30个最小肿瘤大小的样本，并将后续50个样本作为第三个分类器开发集。

d.丢弃40个最小肿瘤大小的样本，并将后续50个样本作为第四个分类器开发集。

e.丢弃50个最小肿瘤大小的样本，并将后续50个样本作为第五个分类器开发集。

然后使用图8的步骤102-150的程序从这七个分类器开发集的每一个开发分类器。然后建立规则来组合来自这七个分类器的分类结果，例如，如下所述。这种设计分类器开发集的方法可以具有与从前面段落中描述的开发集生成的分类器类似的性能，但是可以更加具有可重现性，例如在再运行样本的过程中或者在识别具有特别好或差的结果的患者中。

为了对患者的血液样本进行测试，如上面在图15的描述中所描述的那样对样本进行质谱分析。得到的质谱数据(在分类器开发练习中使用的分类特征中的积分强度值，例如附录A或附录B)然后使用图15的一般程序由集群中的7个分类器中的每一个进行分类。7个分类器中的每一个生成一个类别标记(早期/晚期或类似)。根据一组规则，使用7个类别标记的集合来定义测试样本的总体分类。在一个特定的实例中，集群中的所有分类器返回良好预后“晚期”标记的样本被分类为“良好”，所有分类器返回不良预后“早期”标记的样本被分类为“不良”，并且具有混合标记的所有其他样本被分类为“其他”。当然，也可以使用这个三元类别标记方案的其他名称，而名称的特定选择并不特别重要。下面给出了使用这个规则来组合7个分类器的标记所获得的分类结果。当然也可以使用将7个标记组合的其他规则。

图40A和40B显示了将这7个分类器应用于Moffitt癌症中心样本集中的所有119个样本并使用上述规则生成三元分类的结果的 Kaplan-Meier图。图40A描绘总体存活的Kaplan-Meier图，图40B 描绘进展时间的Kaplan-Meier图。集群中每个分类器开发中使用的样本根据从修改过的多数投票(袋外估计)定义的最终分类器进行分类，其他样本根据定义为所有625个主分类器的平均值的最终分类器进行分类。30个样本(25％)分类为坏，33个(28％)为好。分类为良好的患者表现出非常好的结果：总体存活在60％达到稳定水平，进展时间稳定在30％。相比之下，分类为不良的患者表现出非常差的结果，一年中36％存活，两年中仅6％，6个月时10％无进展，1年时7％无进展。

当将分类器的集群应用于来自也用抗-PD1抗体治疗的30名患者的血液样本的质谱数据的验证集时，测试显示了类似的性能。这在图 41中示出，这是通过7个分类器的集群针对抗PD1治疗的验证群组中的30个样本获得的分类的总体存活的Kaplan-Meier图。13名患者 (43％)被分类为良好，6名患者(20％)被分类为不良。

良好组中的具有对治疗持久的长期反应和长期总体存活的患者的高比例与纳武单抗和伊匹单抗组合治疗患者达到的疗效相似，这是新批准的黑素瘤治疗方案。然而，这种组合疗法不仅非常昂贵(治疗一年的定价超过25万美元，另见ASCO 2015全体会议的Leonard Saltz 医学博士：“Opdivo+Yervoy组合价格约为4000X黄金价格(158美元 /mg)”)，而且也有显著的毒性。良好组患者的优异性能表明，在这组患者中，患者可能不需要使用抗PD-1药物和抗CTLA4药物的组合来治疗，但事实上单独使用抗-PD-1药物(如纳武单抗)，可能达到类似的结果以及降低的严重毒性风险。

此外，不良组的结果很差，表明这些患者从纳武单抗或其他抗 PD-1药物获得持久益处的可能性非常低。这样的患者可以被引导至具有相似功效的成本较低的疗法，在这些患者具有更好疗效的疗法，如果可以发现这些疗法的话，或者接受临床试验或姑息治疗。

在本实施例中由分类器集群产生的“其他”的类别标记也是有用的，并且在这个具体应用中，三元分类器在引导黑素瘤治疗决定方面是非常合适的并且甚至是期望的：良好患者应该得到纳武单抗单一疗法，其他患者将成为纳武单抗加伊匹单抗的良好候选人(因为至少在 Moffitt集中，他们似乎从纳武单抗中获得了一些好处，但是可能在组合治疗中效果更好，因为组合治疗在未选择的群体中表现出更好的结果)，并且不良患者似乎没有从纳武单抗获得任何益处，并且可能不会通过加入伊匹单抗(抗-CTLA4抗体，YervoyTM)而被拯救，因此应当被引导至某种其他类型的治疗，或可能的临床试验或姑息治疗。

如上所述，为分类器集群定义的规则可以变化，并且在一个可能的实施方案中，对集群中的7个分类器的多数投票可以用于将类别标记分配给测试样本。在这个特定的实例中，多数投票给出了类别标记，无论是早期还是晚期。由多数投票产生的分类非常接近由实施例1的全集方法1分类器(本文中的“IS2”)产生的类别标记，这可能并不令人惊讶，因为两者都是在覆盖广泛的肿瘤大小的开发集上产生的。

从具有不同分布的基线肿瘤大小提取的开发子集创建的七个肿瘤大小分类器的集群(在本文中称为“IS6”)也被应用于从两个患者群组收集的治疗前血清样本：在观察性研究中用抗PD-1疗法治疗的30 名患者(用于IS6的验证集和图41中所示的验证集，并用作2015年7 月13日提交的临时申请序列号62/191,895的分类器1和2的独立验证集)以及21名用抗PD-1剂纳武单抗和抗CTLA4剂伊匹单抗的组合治疗的患者。作为观察研究的一部分，这两个群组都是在单一机构收集的。

已经注意到，IS6识别了一组使用抗PD-1剂治疗时具有特别好的结果的患者。因为识别这组表现很好患者是这里的目标，所以不是将IS6的三个结果组绘图，而是观察最佳结果组，“良好”组，并且将另外两个分类组，中间预后组(“其他”)和不良结果组(“坏”)组合成一个组，称之为“不好”(即“不好”＝“其他”+“坏”)。当这两个患者群组的总体存活的Kaplan-Meier曲线在同一图上以“好”与“不好”作图时，得到的结果如图42所示。

从图42可以看出，与单独用纳武单抗治疗的患者相比，组合治疗(伊匹单抗+纳武单抗)治疗的患者“良好”和“不好”之间的结果差异较小。更重要的是，没有证据表明被分类为“良好”的患者从伊匹单抗加上纳武单抗治疗中获益。虽然这个比较应该谨慎地进行，因为这两个群组不是随机试验的两个臂组，但是这两个群组是从同一机构治疗的患者收集的，并且由于组合治疗可能经历显著的毒性，可能预计群体之间的任何偏差将有利于组合治疗的患者获得更好的预后因素。这些结果将表明可以使用IS6分类器或其他类似性能分类器(例如由与特定蛋白质功能相关的质谱特征子集构建的实施例6的分类器)来识别一组用类别标记“良好”或等效物来识别的患者，这些患者用纳武单抗达到与纳武单抗和伊匹单抗的组合相似的结果。因此，除纳武单抗外，这些患者接受伊匹单抗治疗并没有显著的益处，而对这些患者的组合治疗仍然需要相当大的额外费用，使患者面临严重的毒性和副作用风险。另一方面，那些血清被IS6分类器分类为“不好”的患者(即，分类器集群中的任何一个分类器返回早期类别标记)，与纳武单抗单药治疗相比，该患者可能受益于将伊匹单抗添加至纳武单抗。如上所述，实施例9的IS6分类器提供了与实施例6中的分类器类似的分类结果，所述实施例6分类器使用根据其与急性反应和伤口愈合的生物功能的关联而选择的特征而开发。

推广该发现(并且考虑下面的实施例10的内容，特别是对图50C 和50D的论述，其中公开了从与生物功能相关联的质谱特征开发的分类器具有与IS6类似的分类器性能)，可以说描述一种对用免疫治疗药物来治疗黑素瘤患者进行引导的方法，包括以下步骤：a)对于患者的血液样本进行质谱分析并获得质谱数据；(b)获得多个质谱特征的质谱数据中的积分强度值；和(c)利用实施分类器的程控计算机对质谱数据进行操作；其中在所述操作步骤中，所述分类器用分类算法将所述积分强度值与从用阻断程序性细胞死亡1(PD-1)的配体活化的抗体药物来治疗的多个其他黑素瘤患者获得的血液样本获得的类别标记质谱数据的参考集的特征值进行比较，并且为样本生成类别标记。类别标记“良好”或等效物(例如，在实施例10的描述中的晚期)预测患者可能从包含阻断PD-1的配体活化的抗体药物和靶向CTLA4的抗体药物的组合疗法获得类似益处，因此被引导至阻断PD-1的配体活化的抗体药物(例如，纳武单抗)的单一疗法，而类别标记“不好”或等效物(例如，实施例10的描述中的早期)指示与阻断程序性细胞死亡 1(PD-1)的配体活化的抗体药物的单一疗法相比，患者可能从组合疗法中获得更大的益处，因此被引导至组合疗法。

在一个实施方案中，质谱特征包括附录A、附录B或附录C中列出的许多特征，或者与生物功能急性反应和伤口愈合有关的特征。在优选的实施方案中，分类器从使用正则化组合方法组合的过滤小型分类器获得，例如使用图8或图54的程序。正则化组合方法可以采取对于经过滤的小型分类器重复执行具有极值丢弃的逻辑回归的形式。在一个实例中，根据表10中列出的标准来过滤小型分类器。如本实例中所公开的，分类器可以采取以分级方式组合的肿瘤分类器集群的形式。在所示实施方案中，如果肿瘤分类器中的任何一个返回早期或等效标记，则报告不好或等效类别标记，而如果所有肿瘤分类器返回晚期类别标记，则报告良好或等效类别标记。

在另一方面，参考集采取具有类别标记早期或等效物或晚期或等效物的开发样本集的一组类别标记质谱数据的形式，其中具有类别标记早期的样本包括与具有晚期类别标记的样本相比，用纳武单抗治疗具有相对较短总体存活的样本。

在优选的实施方案中，使用MALDI-TOF质谱法对于样本执行的至少100,000次激光照射获取质谱数据。

在一个实施方案中，如实施例6和10所示，质谱特征根据它们与至少一个生物功能的关联来选择，例如与生物功能急性反应和伤口愈合相关的特征集。

B.预测卵巢癌患者受益于铂类化疗的分类器集群

本实施例还公开了分类器的开发，所述分类器预先预测卵巢癌患者是否可能在用铂类化疗治疗卵巢癌时具有铂难治性或铂抗性。在一个实施方案中，分类器包括：a)机器可读存储器，其存储从用铂类化疗治疗的其他卵巢癌患者的血液样本获得的类别标记的质谱数据的参考集。质谱数据是以许多质谱特征的强度值的特征表的形式。类别标记的形式为早期或等效物，表明样本来自铂类化疗相对较差的患者，或晚期或等效物的患者，表明样本来自在铂类化疗中性能相对较好的患者。分类器还包括b)程控计算机，其实现将待测试样本的质谱数据与参考集进行比较的分类算法，并生成待测样本的类别标记。

特别值得注意的是，分类算法实现了包括分类至少第一级(以下描述中的“分类器A”)和第二级(以下描述中的“分类器B”)的串联分级多级分类。在第一级处的分类算法产生早期或晚期或等效物的类别标记。类别标记“晚期”或等效物确认患者在用铂类化疗治疗卵巢癌时可能不是铂难治性或铂抗性。如果在第一级分配的类别标记是早期或等效物，则分类算法进行到第二级。第二级的分类器使用以类别标记早期或类似物来标识的患者形式的参考集的子集，并且进一步分层为早期和晚期类别标记(或更早期或更晚期标记或等效物)。第二级的分类算法产生了类别标记不良或等效物，确认患者可能对铂类化疗性能很差，即铂难治性或铂抗性。

在一个实施方案中，分级多级分类包括第三分类级别(以下描述中的“分类器C”)，其中在第三分类级别下分配的类别标记被用于确认患者可能在铂类化疗中具有特别好的结果，并将其应用于由第一级分类器分配了晚期(或等效物)类别标记的样本。

发现在用于生成第一级分类器的分类器开发集内，开发来自不同临床亚组的分类器是可取的。例如，可以从一个或多个不同的临床亚组开发第一分类级别的分类器(例如四个不同的分类器C1、C2、C3 和C4)，每个分类器从不同的临床亚组开发而来。在卵巢癌情景中，这些临床亚组可以采取以下形式：C1：具有非浆液性组织学或浆液性组织学以及未知的FIGO(癌症评分系统)评分的患者子集；C2：不用于开发分类器C1的患者子集(例如，具有浆液性组织学和已知的 FIGO评分的患者)；C3：手术后残余肿瘤患者的子集；C4：手术后无残余肿瘤的患者子集。

下面将结合一组卵巢癌患者样本来描述所述方法的另一个实例。

样本

从卵巢癌患者的观察性试验中获得了一组165个血液(血清)样本。接受手术的患者接受铂类化疗。在手术时取样(铂类化疗前)。该群组已经在实施例4中描述，并且群组的基线特征显示在以上的表 37中。

具有基线样本和获得的光谱的138名患者的群组的无病存活 (DFS)和总体存活(OS)的Kaplan-Meier曲线图，如图27A和27B所示。

样本制备、光谱采集和光谱数据处理与实施例1中的描述类似，因此在此省略详细描述。

现在转到图54A，分类器开发过程将在卵巢/铂化疗分类器的背景下进一步详细描述。

从138名患者的整个群组中选择129名具有可用的DFS数据和已知超过1个月的DFS的子集。然后将这个子集按照结果分层为两半，并考虑特征与每一半内的结果的相关程度(如在先前临时申请 62/319,958的附录B中所解释的)以产生匹配的开发和内部验证集。在下面的论述中，使用由此产生的65个样本的开发集来开发初始或一级分类器，称为分类器A。应理解，也可以从整个群组开发分类器，例如，在另一个样本群组可用于验证练习的情况下。

在步骤302，执行开发集300中的样本的两个类别标记(或组)的定义。虽然用于分类器开发的一些初步方法采用了定义明确的类别标记，例如响应类别或化疗抗性(是/否)，但是这些方法被证明是不成功的。在实施例9的本节中论述的所有方法都利用事件时间数据来进行分类器训练。在这种情况下，类别标记并不明显，如图54A和54B 所示，所述方法使用迭代方法在创建分类器的同时优化类别标记(循环346)。在步骤302，对类别标记进行初始猜测。通常情况下，样本基于DFS或OS来进行排序，具有最低事件时间结果的一半样本被分配“早期”类别标记(早期死亡或进展，即不良结果)，而另一半则被分配“晚期”类别标记(晚期死亡或进展，即良好结果)。然后使用结果数据来构建分类器(步骤330)，并且用于许多不同训练集(312)的这些类别标记从经分类的开发集和关联的测试集(310)中提取。在多次训练测试集划分(循环335)中，在测试集中的持续错误分类的样本的类别标记被翻转(344和循环346)，然后将所得到的新的一组类标记用于分类器建构步骤的第二次迭代。这个过程迭代直到收敛。早期和晚期组显示在304和306。

在步骤308，开发集(300)的早期和晚期样本随后被随机分成训练 (312)和测试集(310)。训练集(312)然后经历步骤320、326和330。在步骤320中，使用训练集作为其参考集的许多k-最近邻(kNN)小型分类器(mC)使用来自所识别的缩减光谱特征集合的特征子集来构建(定义)。对于这些调查，检查了所有可能的单一特征和特征对(s＝2)；然而，可以选择使用三元组(s＝3)或甚至更高阶的特征组合来更深入地探索缩减的特征空间。实施例9的这个部分中描述的所有方法都使用 k＝9，但是可以考虑诸如7或11的k的其他值。

在步骤326中，使用过滤处理来仅选择具有有用或良好性能特征的小型分类器(mC)。这可以在图54A中通过包含许多单独特征(由阴影区域示出)的光谱324来理解，并且在缩减特征空间322中指示单独和成对的特征。对于某些kNN小型分类器，这些特征(单个或成对) 对于样本的分类性能良好，并且将这些小型分类器保留(由图54A中 328处的“+”符号来指示)，而由“-”符号指示的其他小型分类器不予保留。

为了针对具有一定性能特征的最终分类器，这些mC如下进行过滤。将每个mC应用于其训练集，并且根据训练集的结果分类来计算性能度量。只有满足这些性能度量阈值的mC才能通过过滤，以便在此过程中进一步使用。过滤失败的mC将被丢弃。对于这个项目使用风险比过滤。对于风险比过滤，分类器被应用于训练集。然后计算 OS分类为早期和其余分类为晚期的风险比。风险比必须在特定范围内以便mC通过过滤。

针对在步骤308将开发集分离为训练集和测试集的每次实现，在步骤330，生成主分类器(MC)。一旦mC的过滤完成，在步骤332，使用训练集类别标记训练的逻辑回归，将mC合并成一个主分类器 (MC)，步骤332。为了避免过度拟合，回归使用极值丢弃来进行正则化，只有少数随机选择的mC被包括在每个逻辑回归迭代中。基于通过过滤的典型mC数目来选择丢弃迭代的次数，以确保每个mC可能被多次包括在丢弃过程中。实施例9的本节中概述的所有方法在每次丢弃迭代中留下10个随机选择的mC，并使用10,000次丢弃迭代。

在步骤334，评估在步骤332中达到的MC的性能以及对测试样本集(310)进行分类的能力。对于经由循环335的步骤320、326、330、 334的每次迭代，评估所得到的MC对其对分类测试集310的成员的能力的性能。特别值得注意的是，在评估步骤334之后，所述过程经由循环335循环回到步骤308，并产生将开发集分离为训练集和测试集的不同实现。步骤308、320、326、330、332、334的过程以及循环回335到开发集到训练和测试集的新分离(步骤308)被执行许多次。使用多个训练/测试划分避免了为分类器创建而选择单个特别有利的或困难的训练集，并且避免了由于对于可能特别容易或难以分类的测试集进行测试所导致的性能评估中的偏差。

在步骤336，存在分析来自训练和测试分组的数据的可选程序，并且如方框338所示，从每个训练/测试集分组获得MC的性能特征及其分类结果。在这个项目中不执行可选步骤336和338。

在步骤344，确定是否存在在循环335的许多迭代期间在测试集 310中持续错误分类的样本。如果是的话，翻转这些错误分类样本的类别标记，并在步骤346循环回到步骤302的过程的开始，并重复图 54A和54B所示的方法。

如果在步骤344没有持续错误分类的样本，则接着进行到步骤 350，并以几种方式之一来定义最终分类器，包括(i)每次实现将开发集分为训练集和测试集的每个主分类器(MC)的多数投票，或(ii)平均概率截止。

定义每个MC的逻辑回归(332)的输出可能是两个训练类别(早期或晚期)之一。这些MC概率可以平均化以产生样本的一个平均概率。当使用开发集300时，将这种方法调整以便对于给定样本不包括在训练集中的MC进行平均化(“袋外”估计)。这些平均概率可以通过应用阈值(截止值)转换为二元分类。在迭代分类器构建和标记优化过程中，通过以0.5的截止值获得的单个MC标记的多数投票来分配分类。对这个过程进行修改，以便只入选MC，其中对于开发集中的样本来说，所述样本不在训练集中(修改的或“袋外”多数投票)。这个程序给出了与对于MC上的平均概率使用0.5的截止值非常相似的分类。

在步骤350中定义了最终分类器之后，所述过程可选地继续进行验证步骤352，其中在步骤350中定义的最终分类器对于内部验证样本集(如果可用的话)进行测试。在本实例中，初始样本集被划分为开发集(300)和单独的内部验证集，并且因此这个验证集存在并且经历验证步骤352。参见图55A和55B，用于开发和验证集的DFS和OS的 Kaplan-Meier图。理想地，在步骤354中，在步骤350中定义的这个最终分类器也对于独立样本集进行验证。

图54A示出了从将来自初始特征空间的特征取消选择，以便产生缩减的特征空间的步骤52。这是使用在先前临时申请序列号 62/319,958中描述的袋装特征取消选择程序完成的，参见图3和4，为了简洁起见省略了其细节。

分类器A开发

使用129个样本，使用上面详细描述的图54A和54B的过程进行初始的新的分类器开发。这是一个缩减的集合，只包括DFS大于1 个月的患者。样本数量允许分成开发集和内部验证集以便进行分类器开发。根据DFS和OS的审查进行分层来分为开发和验证集。分别在先前临时申请序列号62/319,958的附录A和附录B中详细显示和描述了将单个样本分配到验证或开发集。开发集有65名患者，验证集有64名患者。表61列出了开发和验证分组的临床特征。

表61：分为开发(n＝65)和内部验证(n＝64)集的有可用光谱的患者的基线特征

如上所述，在图54A和54B的程序中使用该开发样本集及其相关的临床数据来生成能够将患者分层为具有更好(“晚期”＝晚期进展) 和更差(“早期”＝早期进展)的结果的两组的分类器(分类器A)。分类器 A中使用的特征(在图54A的循环346的最后一次迭代中由特征取消选择而产生的缩减特征空间)在先前临时申请序列号62/319,958的附录E中列出。分类器的性能在开发集内使用之前描述的袋外估计进行评估。然后将分类器应用于验证集，以评估其在开发分类器时根本不使用的内部验证集中的性能(图54B中的352)。

分类器A的性能

分类器A的性能使用分类为早期和晚期的样本之间的DFS和OS 的Kaplan-Meier图以及对应的风险比(HR)和对数秩p值来评估。结果总结在表62和63中。

表62：分类器A的性能总结

表63：在所有138*样本上运行的分类器的性能总结

*注意：138个样本的2个样本没有DFS事件时间数据。

对应于表62中的数据的Kaplan-Meier图显示在图56A-56D中，表63中的数据显示在图57A和57B中。每个样本的分类在先前临时申请序列号62/319,958的附录C中列出。

值得注意的是化疗抗性的预测：早期组6个月时DFS为74％，晚期组为93％，早期组12个月时DFS为58％，而晚期组为80％。在 4个月或更少的DFS的14例患者中，9个(64％)被分类为早期，在6 个月或更少的DFS的20名患者中，14个(70％)被分类为早期，参见表64。

表64：4个月、6个月、10个月和12个月前的DFS

基线临床特征按照分类组在表65中总结。

表65：在138个样本上运行时按照分类组的临床特征

*1+2vs 3，

1-3vs 4

测试分类与组织学、FIGO评分和转移性疾病的存在显著相关。表66显示了整个群组的OS和DFS的多变量分析结果。

表66：整个群组的多变量分析

当针对已知的预后因素来调整时，测试分类保留作为OS和DFS 预测因子的显著性趋势。

第二分类器开发(“分类器B”)

虽然分类器A的性能相当有希望，但希望能够提高性能。特别值得注意的是，已经成功地分离了展现特别差结果的患者的亚组，方法是采用通过初始分类来分类为早期的患者亚组，并通过使用该亚组来训练第二个后续分类器而在这个群体中进一步分层。这种方法被用来创建分类器B。

该分类器通过分类器A使用来自开发集(n＝25)或验证集(n＝24) 的被分类为“早期”的样本开发，并且添加在分类器A的开发中没有使用的来自特别差的结果(DFS少于2个月)的患者的9个样本。具有相关临床数据的该样本子集被用于如上所述的图5A和5B的分类器开发程序中，以创建新的分类器，分类器B，向缩减开发集中的每个样本再次分配两个分类“早期”或“晚期”。为了避免与分类器A分配的早期和晚期类别标记混淆，可以将这些标记称为“更早期”或“更晚期”。名称的特定选择并不特别重要。重要的是，由分类器A确定的这些早期，性能较差的患者，被分类器B进一步分层为两组，一组性能相对较好(晚期或更晚期)，另一组性能特别差(早期或更早期)。分类器B 中使用的特征(在图54的循环346的最终迭代中由特征取消选择而产生的缩减的特征空间)在先前临时申请序列号62/319,958的附录E中列出。特别值得注意的是，如图58A和58B的Kaplan-Meier曲线所示，该分类器能够将其开发集中的患者分为具有更好和更差的DFS 和OS的两组。开发中使用的58个样本中有28个被分类为早期。请注意，在图58A和58B中，由分类器B分类为更早期的那些样本比分类为更晚期的那些患者具有差得多的OS和DFS。

用于生成分类器B的程序在图59中以流程图形式示出为程序 902。在步骤904，使用分类器A为整个开发集中的所有样本生成早期或晚期标记。在步骤906，整理出所有早期样本。在步骤908，基于在执行图54的分类器开发过程的步骤302中的DFS和OS数据，为这个样本子集进行更早期或更晚期的初始标记分配。然后，在步骤 910，对于作为开发集的该样本子集，重复图54A-54B的分类器生成方法(增加了9个样本，已经决定在分类器A的开发或验证集中不使用这些样本，因为它们的DFS是一个月或更少)。所述过程产生新的最终分类器(步骤350)，其参数在步骤912被保存。这些参数包括用于分类器开发的样本集的识别，在小型分类器中通过过滤的特征，小型分类器定义，在步骤332中计算的逻辑回归权重，在小型分类器中的k值以及在步骤350的最终分类器的定义。

第三分类器开发“分类器C”

通过识别患者群组的临床上不同的亚组，并且如上文在图54A 和54B中所描述的，针对每个不同的亚组来开发分类器，已经成功地分离了显示特别好的结果的患者的亚组。将这些多个分类器应用于一个测试样本，如果样本总是按照多个分类器中的每一个来分类来“晚期”，就分配“良好”的总体分类以指示特别好的预后可能性。这种方法被用来创建分类器C(由多个分类器C1、C2、C3和C4组成)。

分类器C使用全部138个可用样本创建。使用与用于分类器A 和分类器B的图54A和54B相同的程序生成四个不同的分类器(C1、 C2、C3和C4)，其中开发集被选择为138名患者的总群组的临床上不同的子集。考虑到可用的临床数据，选择组织学和手术后残余肿瘤的存在/不存在以确定临床上不同的子集。

·分类器C1是在具有非浆液性组织学或浆液性组织学以及未知的FIGO评分的60名患者子集上开发而来的。

·分类器C2是在不用于开发分类器C1的78名患者的子集上开发的。这些患者都有浆液性组织学和已知的FIGO评分。

·分类器C3是从在手术后残余肿瘤的53名患者的子集上开发而来的。

·分类器C4是在手术后没有残余肿瘤的85名患者的子集上开发的。

注意：当诊断为卵巢癌时，进行分期(通常使用FIGO评分)，并由医生根据在手术时获得的肿瘤组织来评定组织学类型和分级(通常在卵巢癌中避免活检，因为整体移除肿瘤更好)。卵巢癌的主要组织学亚型是浆液性的。其他不太常见的类型包括难控制的癌、子宫内膜样癌和透明细胞癌。最后3个被合并成“非浆液性”组织学类型。非浆液性组织学与浆液性组织学相比是一个积极的预后因素。

由于分类器C的目标是能够鉴别可能在铂化疗中特别好的卵巢癌患者，因此用于单独产生分类器的临床亚组的选择是在选择已知具有不同预后的临床上不同的亚组和发现哪些患者总是表现较好的主导思想下进行的。特别是为了使患者表现很好，理想情况下，他们应该被分类为与所有可能的临床不同群体相比表现良好。因此，如何选择临床亚组并不重要，但是他们必需在临床上有所不同，理想情况下应该在患者预后方面明显不同。在某些情况下，可以根据肿瘤大小选择临床亚组。在这里，观察了已经知道是预后因素的可用临床特征 (FIGO评分、组织学、残余肿瘤)。针对这些因素中的每一个，将这个群组分为两个，并且产生2个分类器，每个分类器在每个子集上产生。然后看看是否由于每个因素的两个分类器而导致产生的分类是非常不同的。结果表明，组织学和残余肿瘤效果最好并相互补充，并且添加基于FIGO评分的分类器并没有太大地改变分类器的性能。原来的计划是，然后使用一个或多个这些因素，产生更多的亚组。但是发现，对于组织学和残余肿瘤中的每一个，仅仅使用两种分类器已经运作得很好，所以并没有追求更多的临床亚组，但理论上肯定有可能这样做。通过观察两个最不同的亚组，例如，全部无残余肿瘤vs全部残余肿瘤，可以从这种方法中获得最大的优势。通过两个极端组的混合来加入其他亚组，并不能在这些组的原则优化方面增加较多，但它确实防止了产生两个极端亚组分类器之一的可能性，这种可能性是由于开发集的特殊性，而不是由于临床上不同的子集。与往常一样，如果患者样本的数量相对较少，那么总是存在这种危险，每个临床特征有两个以上的亚组可能有助于避免这种情况。

创建所有四个分类器以便将样本分成两类，即早期和晚期。然后将每个分类器应用于全部138个样本。每个分类器的开发集内的样本分类是使用袋外估算来产生的。这为每个样本提供了四个分类，分别来自四个分类器C1、C2、C3和C4中的一个。从所有四个分类器中接收“晚期”分类的样本被分配“良好”类别标记。

上述用于生成分类器C的方法在图60中以流程图形式示出为程序1102。在步骤1104，例如通过检查与每个样本相关的临床数据，从分类器开发集中定义多达N个临床上不同的患者亚组。然后将开发集分为子集1、2、3、...N，其中N通常是2或更大的整数。在步骤1108，对于每个子集1...N，重复分类器开发过程(图54A和54B)。在目前的卵巢情况下，N＝4，并且亚组如上所述。在步骤1110，对于每个子集保存在步骤350从图54A和54B的程序得到的最终分类器，从而产生分类器C1、C2、...CN。用于分类器C1、C2、C3和C4 的特征(对于四个分类器中的每一个，在图54A循环346的最终迭代中由特征取消选择所创建的缩减特征空间)在先前临时申请序列号 62/319,958的附录E中列出。

分类器C的概要或组成如图61所示。测试光谱1200(用于分类测试样本的特征的特征值)被提供给分类器1202、1204、1206和1208 中的每一个。每个分类器都会生成一个标记，在这个实例中是早期或者晚期。在步骤1210，进行检查以确定每个分类器C1...C4产生了晚期类别标记。如果是，则在步骤1214报告类别标记良好。在目前的情况下，这个类别标记表明预测卵巢癌患者对铂化疗有特别好的结果。相反地，如果在步骤1210分类器在生成晚期类别标记方面不一致，则在步骤1218报告类别标记“其他”(或等效物)。应该注意的是，图61的分类器C(严格来说，包括参考集、逻辑回归权重、小型分类器的特征的识别等的存储在存储器中的参数集)不仅包括根据图54A 定义的基础分类器C1...C4，而且还包括用于比较每个分类器C1... C4的结果并根据分类器C1...C4的结果生成最终类别标记的逻辑。

分类器的分级组合

分类器A、B和C可以以分级或有序组合的形式使用。例如，分类器A可以用来对测试样本进行初始分类，如果分类器A产生了早期类别标记，则分类器B被用来产生类别标记。如果分类器B产生早期或更早期标记，则提供样本的患者预期在铂化疗(铂难治性或铂抗性)上性能特别差。如果分类器A产生晚期类别标记，则预计患者在铂化疗中性能良好。

作为另一个实例，分类器A和C可以组合使用。分类器A可用于初始对测试样本进行分类，如果分类器A产生早期类别标记，则预测患者在铂化疗上性能特别差(铂难治性或铂抗性)。如果分类器A 产生晚期类别标记，则患者样本随后被分类器C分类。如果分类器C 产生了晚期类别，提供样本的患者预计在铂化疗中性能良好，并返回良好类别标记。如果分类器C生成早期类别标记，则可以返回其他类别标记。其他类别标记的含义和用法解释如下。

此外，分类器A、B和C也可以以分级或有序方式使用，如图 62所示。测试样本首先被分类器A分类，步骤1302。如果它被分类为早期(步骤1304)，则其被分类器B分类(1306)。在步骤1308，检查分类器B产生的类别标记。如果分类器B也返回早期类别(分支1310)，则返回“不良”的整体标记(不良预后，铂难治性或铂抗性)。如果分类器B返回晚期类别(分支1316)或分类器A返回晚期类别(分支1314)，则样本被分类器C分类(1318)。分类器C被训练以识别在治疗中性能特别好的患者。在步骤1320，检查由分类器C产生的类别标记。如果分类器C返回“晚期”分类(分支1322)，则将整体“良好”分类分配给样本(1324)。如果分类器C不返回“晚期”分类(分支1326)，则样本接收总体“其他”分类(1328)。

图63显示了图62的最终分类器的结构变化。样本初始由分类器 A分类(1402)。在步骤1404，检查类别标记。如果标记是早期的，则样本按分类器B分类。在步骤1408，检查由分类器B分配的类别标记。如果分类器B也产生早期类别(分支1410)，则分配不良类别标记1412。如果在步骤1404，分类器A产生了晚期类别标记(1414)，或者如果分类器B产生了晚期类别标记，则样本由四个第三级分类器 1418A、1418B、1418C和1418D分类，在该实例中对应于上面解释的C1...C4分类器。在步骤1420，进行检查以查看四个分类器中的每个分类器是否产生了晚期类别标记。如果是这样，则采用分支1422 并报告良好类别标记。如果在步骤1420，四个分类器不是全部产生晚期类别标记，则采用分支1426并报告其他类别标记。

与图61的分类器构建的情况一样，图62和63中所示的“最终分类器”是各个分类器A、B和C(或图63中的C1...C4)的组合，加上一组逻辑指令用于检查由分类器(包括亚组分类器)生成的类别标记，并分配如图所示最终类别标记。

根据图63构建的最终分类器的结果。

在定义和构建了图63的“最终分类器”之后，将开发集中的样本集经受图63所示的分类程序。二十八个样本(20％)被分类为坏，61 个(44％)为其他，另外49个(36％)被分类为好。

患者的按照分类的临床特征见表67。

表67：在所有138个样本上运行分类器的测试分类的患者特征

作为研究者指定的铂抗性的测试，分类不良与其他或良好相比具有35％的灵敏度和92％的特异性。

分类与FIGO评分的已知预后因素、组织学、转移性疾病的存在以及术后残余肿瘤的存在密切相关。

图64A和64B显示了由图63的分类器产生的用于OS和DFS的分类组的Kaplan-Meier图。相关的存活分析统计在表68和69中给出。请注意，标记为不良的组的结果特别差，尤其是DFS，标记为良好的组的结果特别好。

表68：分类组的事件时间终点的中位数

表69：分类组之间的存活分析统计

这些结果表明，图63所示的分级分类器能够将患者分为三组，分别有更好、更差和中等的结果。从表70和表71中的数据可以看出，分类为良好的样本的患者可能对铂类化疗具有良好的长期结果，而分类为不良的样本的患者不太可能对铂类化疗具有良好的长期结果。

表70：在关键时间点仍然存活和无病的比例

	差	其他	良好
				在1年内存活％	46	88	96
在2年内存活％	28	72	89
				在6个月内无进展％	54	90	96
在1年内无进展％	35	75	88

表71：在关键时间点无病患者的数量

在预测6个月无疾病存活状态方面，与其他或良好相比的不良分类具有60％的灵敏度和88％的特异性(优势比＝0.09Wald 95％CI： 0.03-0.27)。为了预测12个月无疾病存活状态，与其他或良好相比的不良分类具有45％的灵敏度和91％的特异性。

表72显示分类差与不差(即其他或良好)的多变量分析。这表明，虽然分类与其他预后因素密切相关(参见表67)，但当对于其他已知的预后因素来调整时，仍然是OS和DFS的明显统计学显著预测因子。这表明分类可以为医生可获得的其他预后因素提供额外的信息。

表72：OS和DFS的多变量分析

就预测6个月无病存活状态而言，可以使用逻辑回归对可能的混杂因素进行分析。结果显示在表73中。

表73：对于可能的混杂因素，预测6个月时DFS的优势比的调整

协变量	优势比(95％CI)	P值
			(其他或良好)vs差	0.18(0.05-0.65)	0.009
FIGO1-3vs4	0.31(0.08-1.20)	0.089
			FIGONAvs4	0.26(0.05-1.40)	0.118
浆液性vs非浆液性	4.36(1.17-16.17)	0.028
			肿瘤残余(是vs否)	3.05(0.83-11.25)	0.094

即使对于潜在的混杂因素来调整，分类(不良相比于其他或良好) 仍然是6个月时DFS状态的重要预测指标。

来自卵巢癌/铂化疗分类器的结论

能够从治疗前血清样本的质谱图来构建分类器，其将经手术和铂类化疗治疗的卵巢癌患者分成具有更好或更差结果的组。使用缩减的 129个开发样本集的一半构建的分类器(分类器A)在其余的用于内部验证的样本上得到很好的验证，整个群组的结果表明有希望的性能。虽然测试分类与已知具有预后意义的基线临床因素相关，但是仍然显示对于预测结果提供额外信息的统计学显著性的趋势。

通过从整个群组中选择临床上不同的患者亚组用于分类器开发，可以构建由多个分级分类器组成的分类系统，其可以将卵巢癌患者分成三类：一类具有非常好的结果(“良好”)，一个结果具有很差的结果 (“坏”)，第三类具有中间结果(“其他”)。这种分类也与其他预后因素密切相关，但即使在多变量分析中对于其他预后因素进行调整，“坏”相比于“其他”或“良好”分类仍保留其预测结果的能力，并具有明显的统计学意义。这表明该分类可能对于医生为这种适应症的患者提出建议或作出治疗决定具有直接的临床效用，对于从患者的临床特征获得的信息提供补充的信息。

在确诊铂抗性或铂难治性患者的测试方面来解释，坏相比于其他或良好的分类对于在手术6个月内患者进展的确诊显示出60％的灵敏度和88％的特异度(优势比0.09)。在对于潜在的混杂因素来调整之后，它仍然是六个月时DFS状态的强有力统计学显著的预测指标，表明它再次为医生提供了额外信息来通知患者护理。

总之，在这个实例中，已经描述了一个生成分类器集成的方法。所述方法包括以下步骤：

a.从患者样本集来定义多个分类器开发样本集，其中每一个样本集具有不同的临床特征(在这个实例中，不同比例的肿瘤大小，但是实际上这可能是不同比例的任何临床特征，涉及年龄或年龄组，吸烟状况，疾病分期，血清或组织蛋白或基因表达水平，突变状态，体能状态，手术切除状态，绝经状态，先前接受的治疗选项或种类的数目，对于先前治疗选项的反应，组织学分类或等级等，肿瘤大小或将开发样本集分为不同临床组的其他类型的分组)

b.对于所述患者样本集进行质谱分析并存储质谱数据(例如使用深MALDI并为附录A中列出的质谱特征生成特征表；应理解，深 MALDI和附录A特征不是必要的且以实例而非限制的方式提供)

c.使用程控计算机，使用步骤a.中定义的每个开发集的质谱数据进行分类器开发练习，并将由此生成的分类器的参数存储在与计算机相关联的存储器中(应当理解，图8的步骤102-150的程序是作为实例而非限制提供的)，从而生成分类器的集群；

和

d.定义一个规则或一组规则，所述规则用于通过在步骤c.中生成的分类器的集群对于经受分类的测试样本生成类别标记。例如，规则可以是如果所有的分类器产生相同的类别标记，给测试样本分配类别标记，或者一些新的类别标记例如“坏”(集群中的所有分类器分配早期类别标记)或好(集群中的所有分类器分配晚期类别标记)。作为另一个实例，规则可以基于分类器集群的多数投票来给测试样本分配标记。作为另一个实例，根据三元分类方案向测试样本分配标记，其中如果由的分类器集群为测试样本产生的类别标记不是全部相同，则分配类别标记“其他”或等效物，并且如果集群中的所有分类器都生成相同的类别标记，则将类别标记分配给样本，该类别标记表示分类的一致性，如实施例5中的好或坏。

作为另一个实例，设想了使用分类器集群来测试样本的方法，其中使用步骤a.、b.、c.和d.生成分类器的集群，测试样本的质谱数据被集群中的每个成员来分类，并且根据规则或规则集将类别标记分配给测试样本。

提供以下条款作为对实施例9中公开的发明的进一步描述：

1.一种从患者样本集生成分类器集群的方法，包括以下步骤：

a.从所述患者样本集来定义多个分类器开发样本集，其中每一个样本集具有不同的临床特征；

b.对于所述患者样本集进行质谱分析并存储质谱数据；

c.使用程控计算机，使用步骤a.中定义的每个开发集的质谱数据进行分类器开发练习，并将定义由此生成的分类器的参数存储在与计算机相关联的存储器中，从而生成分类器的集群，每个分类器针对每个分类器开发样本集；

和

d.定义一个规则或一组规则，所述规则用于通过在步骤c.中生成的分类器的集群对于经受分类的测试样本生成类别标记。

2.如条款1所述的方法，其中所述患者样本是来自癌症患者的样本，并且其中每个所述开发集具有不同比例的具有给定临床特征的患者。

3.条款2的方法，其中临床特征是肿瘤大小。

4.条款3的方法，其中步骤c.包括执行图8的步骤102-150的程序。

5.如条款1所述的方法，其中所述临床特征是以下中的至少一个：年龄或年龄组、吸烟状况、疾病分期、血清或组织蛋白或基因表达水平、突变状态、体能状态、手术切除状态、绝经状态、先前接受的治疗选项或种类的数目、对于先前治疗选项的反应、肿瘤大小和组织学分类或等级。

6.一种测试血液样本的方法，包括以下步骤：

通过对血液开发样本集执行条款1的方法来生成分类器的集群；

对血液样本进行质谱分析，获得质谱数据，以及

利用集群中的每个成员对血液样本的质谱数据进行分类，并根据规则或规则集将类别标记分配给测试样本。

7.一种多级分类器，包括：

程控计算机，实现对存储在存储器中的测试样本的质谱数据进行操作的分级分类程序，并利用存储在该存储器中的经类别标记的质谱数据的参考集；

其中所述分类程序还包括：

第一级分类器，用于将测试质谱数据分层成早期或晚期组或等效物；

第二级分类器，用于将第一级分类器的早期组进一步分层为早期和晚期组(或更早期和更晚期组，或等效物)，如果第一级分类器将测试质谱数据分类为早期组，那么第二级分类器对测试样本的质谱数据进行操作，并且其中由第二级分类器产生的早期或更早期类别标记或等效物与特别差的预后相关；和

第三级分类器，用于将第一级分类器的晚期组进一步分层为早期和晚期组(或更早期和更晚期组，或等效物)，如果第一级分类器将测试质谱数据分类到晚期组，那么第三级分类器对测试样本的质谱数据进行操作，其中由第三级分类器产生的晚期或更晚期类别标记或等效物与特别良好的预后相关联。

8.如条款7所述的多级分类器，其中第三级分类器包括从用于生成第一级分类器的分类器开发集的一个或多个不同临床亚组开发的一个或多个分类器。

9.一种生成用于分类测试样本的分类器的方法，包括以下步骤：

(b)使用第一分类器对开发样本集的测量数据进行分类，从而为开发样本集的每个成员分配二元分类方案中的类别标记(早期/晚期或等效物)；

(c)使用分类器开发过程生成第二分类器，其中输入分类器开发集是通过第一分类器来分配二元分类方案中的两个类别标记中的一个的开发集的成员，从而第二分类器将具有第一类别标记的输入分类器开发集的成员分层为两个另外的亚组。

10.条款9的方法，还包括以下步骤：

(d)将开发样本集划分为不同的临床亚组1...N，其中N是至少 2的整数；

(e)针对每个不同的临床亚组1...N重复分类器开发过程，从而生成不同的第三分类器C1...CN；和

(f)定义分级分类过程，其中：

i.患者样本首先通过在步骤a)中生成的第一分类器来分类；

iv.作为分类步骤ii或步骤iii的结果，生成最终标记。

11.一种分类器生成方法，包括：

b)从开发样本集的测量数据中生成第一分类器(分类器A)；

c)基于临床数据、在开发集内识别多个不同的临床亚组C1... CN；

d)针对每个不同的临床亚组，根据与这些临床亚组相关联的开发集的每个成员的测量数据来进行分类器生成过程，从而生成临床亚组分类器C1...CN；

e)在计算机的存储器中存储涉及分类器A和在步骤d)中生成的分类器C1...CN的分类程序。

12.如条款11所述的方法，其中步骤b)和d)的分类器开发是根据图8的步骤102-150的程序进行的。

13.条款11或条款12的方法，其中所述方法还包括进行袋装过滤操作以过滤从样本获得的测量数据以取消选择测量数据中的垃圾特征或选择测量数据中的具有显著分类性能的特征子集的步骤。

14.如条款13所述的方法，其中所述分类器生成过程通过袋装过滤操作迭代地执行以取消选择垃圾特征或选择具有显著分类性能的特征子集。

15.如条款11-14中任一项所述的方法，其中测量数据包括 MALDI-TOF质谱数据。

16.如条款15中任一项所述的方法，其中，从其中开发集中的每个样本经受至少100,000次激光照射的过程中获取MALDI-TOF质谱数据。

17.一种方法，包括生成分类器集群，每个分类器基于不同比例的患有大肿瘤和小肿瘤的患者，并且由计算机从来自开发样本集的血液样本的质谱数据生成，并且使用分类器集群来定义分类程序。

18.如条款17所述的方法，其中分类器的集群包括在本文件中被标识为IS6的分类器的集群。

19.一种引导黑素瘤患者治疗的方法，包括对来自患者的血液样本进行质谱分析，并使用如条款17生成的分类器集群生成血液样本的类别标记，并使用类别标记引导患者治疗黑素瘤。

20.条款19的方法，其中所述治疗包括施用纳武单抗。

21.条款19的方法，其中引导治疗包括不施用纳武单抗和伊匹单抗的组合。

实施例10

使用质谱数据测量生物功能评分的方法和系统及其用途，包括引导治疗、预测存活以及开发分类器

该实施例详述了为了获得测量给定患者的特定生物功能的新颖和有用评分(例如数值)而使用的方法和系统，所述生物功能例如急性反应、伤口愈合、补体系统或其他。根据血清样本的质谱数据计算这样的生物功能评分。作为实例而非限制，在本实例中，使用如本文先前实施例1中所述的深MALDI技术获得质谱数据。

实施例10中使用的数据

为了获得实施例10中呈现的结果，使用以下五个样本集：

“分析”集-由49名患者组成，大多数患有非小细胞肺癌 (NSCLC)，但少数患有慢性阻塞性肺疾病(COPD)但无癌症。对于这些样本，可以使用匹配的质谱数据(298个特征)和从运行SomaLogic 1129组获得的1129种蛋白质/肽的蛋白质表达(参见实施例6)。

“PROSE-厄洛替尼”集-来自厄洛替尼治疗PROSE试验的85名患者。所有患者先前接受过晚期NSCLC治疗。质谱数据(298个特征) 和由实施例1“IS2”分类器产生的相应的类别标记可从治疗前样本获得。

“PROSE-化疗”集-来自接受单药化疗治疗的PROSE试验的123 名患者。所有患者先前接受过晚期NSCLC治疗。质谱数据(298个特征)和由实施例1“IS2”分类器产生的相应类别标记可从治疗前样本获得。

“Moffitt”集-在Moffitt癌症中心用纳武单抗(抗PD1剂)治疗的 119名黑素瘤患者，参见实施例1。治疗前收集样本。质谱数据(298 个特征)和由实施例1“IS2”分类器产生的对应类别标记是可用的。

“Moffitt-7周”集-来自“Moffitt”群组的107名患者的子集，在治疗开始后7周收集。参见实施例7。质谱数据(298个特征)和由实施例 1“IS2”分类器产生的相应的类别标记是可用的。

样本制备和预处理

制备样本并使用实施例1中解释的标准深度MALDI采集程序采集质谱。改进了一些处理参数，但是细节并不特别重要，与目前的结果没有任何主要的区别。例如，使用了与实施例6中使用的定义稍有不同的特征定义，并排除了显示了一些再现性问题的若干功能。因此，对于固定的p值，与特定蛋白质组或功能组相关的特征的数量可以不同于实施例6中指定的并且用于实施例6中的分类器开发的数量。

PSEA蛋白质组富集分析

本实施例中描述的每个质谱(MS)特征与生物功能的相关性通过对于“分析”集来运行蛋白质组富集分析PSEA(基因集富集分析方法的变体，应用于蛋白质表达数据)来计算。PSEA将MS特征与多种蛋白质的表达相关联，而不是单个蛋白质的表达，从而在某种程度上防止识别随机相关和不可泛化相关特征。这种方法还可以识别在幅度 (每个蛋白质)方面比可以在单变量分析中识别的显著影响更小的显著影响。根据SomaLogic 1129组目标列表和GeneOntology/AmiGO2和UniProt数据库查询结果的交集创建蛋白质组。对于每个MS特征和蛋白质组对，PSEA返回反映相关程度的富集评分ES和p值，所述p 值与无相关性的零点分布进行比较来反映ES的显著性。有关更多详细信息，请参见实施例6和Mootha等人和Subramanian等人在实施例6中引用的论文。

生物功能评分-方法

在给出生物功能，例如伤口愈合或急性反应的情况下，使用“分析”集的PSEA结果，确定在α＝0.05显著性水平(未对多重比较进行调整)下，哪些MS特征与相应的蛋白质组相关。然后使用来自“PROSE-厄洛替尼”集的N_S＝85个样本进行主成分分析(PCA)。PCA 是统计和数据分析中的一种已知方法，用于将复杂的数据集降低到较低的维度，并揭示其隐藏的简化动态。如图81所示，生物功能评分的计算程序以流程图的形式在8100处示出。应理解，图81的流程图和下面的描述可以被本领域技术人员简化成一组编程指令。在步骤 8102中，计算样本集(ss)的特定特征表，集合F^SS。在步骤8104，在开发样本集的子集的许多实现上执行PCA。在步骤8106，计算PCA 装袋程序并达到第一主成分

在步骤8108，计算生物功能评分：

对于样本集的每个成员，

在步骤8110，计算其他样本集(如果存在的话)的生物功能评分。由于可用于计算的样本数量很小，因此容易导致随机偏差的PCA解决方案，所以实施了PCA步骤 8106的袋装版本。更详细的程序如下：

1.步骤8102构建样本集的部分特征表，这里是“PROSE-厄洛替尼”集

a.对于“PROSE-厄洛替尼”集中的每个样本，从总共298个可用特征中提取出与生物功能显著相关的MS特征的子集(如使用“分析”集的PSEA所确定的)。这导致了“部分特征表”：F^厄洛替尼＝f_si，其中1 ≤i≤N_f(N_f是显著相关的MS特征的数量)，1≤s≤N_S(N_S＝85个样本)遍布样本指数。图82是给定样本集(ss)(例如PROSE-厄洛替尼样本集) 的部分特征表矩阵F^SS的图示。

2.步骤8104在样本集的许多子集实现上执行PCA

a.从85个样本中随机选取N_S’＝56个样本的子集(使用

R2015a randperm函数)。(请注意，85个样本中的56个样本的子集的选择是任意的。这个子集被选择为群组的约2/3，这是子集中足够的样本以及子集实现的多样性之间的良好折衷。)

b.使用

R2015a pca函数实现PCA，这个函数返回一个包含一定维度的主成分系数C的矩阵，如果N_f<N_s’，则所述维度为 N_f×N_f，如果N_f≥N_s’，则所述维度为N_f×(N_S’-1)。该矩阵允许将在 MS特征空间中表示的数据点(样本)转换至超空间中，其基向量

或

的列)定义数据中方差减小的方向。 pca函数还返回每个主成分解释的总数据差异的百分比列表。发现对于这里给出的研究蛋白质组(生物功能)，第一主成分解释了大部分 (65％或更多)，而第二主成分解释了小于15％的方差(参见图 65A-65C)。因此，为了计算对应于C的第一列的生物功能评分，只考虑第一主成分(PC)，

请注意，u₁是每个N_f特征的第一个PC的标量值的向量。

c.步骤1a.和1b.重复N_r＝2¹⁷＝131,072次，在每次迭代中从“PROSE-厄洛替尼”集中提取56个样本的不同子集。

3.步骤8106PCA装袋

a.目前已经计算出总共2¹⁷个第一主成分。获取2个第一主成分的子集，然后对每一对进行平均，得到的平均值按照以下计算进行正则化：

等式(2)：

其中1≤k≤2¹⁶

b.步骤a.再重复16次，每次迭代得到与前一次迭代一半多的平均化和正则化的第一主成分，直到获得一个最终的第一主成分

(第一主成分)是具有用于每个质谱特征的条目的向量。更具体地说，

只是样本集实现上u₁的平均值。将PCA装袋以便给出第一主成分向量的更强大的估计。图83是最终的装袋(或平均)第一主成分

的图示。

4.步骤8108生物功能评分计算

a.然后计算“PROSE-厄洛替尼”样本的生物功能评分向量b^厄洛替尼，其由样本MS特征向量在第一主成分

的方向上的映射组成：

等式(3)：

标量数字b₁、b₂、...b_S...b_Ns分别是在样本集中的样本1、2、... s、...Ns的生物功能评分。在等式(3)中，

的第一个元素乘以第一个特征以使其贡献于评分，

的第二个元素乘以第二个特征使其贡献于评分，对于所有特征依此类推，这些评分加总来给出最后的评分。换句话说，给定样本的评分是该样本的特征值的向量在第一主成分向量

上的映射。如以下结果部分所示，生物功能评分通常在-5到+50 之间。尽管数量的大小是重要的，并且能够洞察与评分相关的给定生物功能，尤其是在一段时间内从一系列样本中获得时更是这样，但是可能更重要的是其相对于来自合适患者群体中的其他患者的样本的值，例如黑素瘤或NSCLC患者。评分的含义和用法将在后面的实施例10中进行解释。

例如，当希望获得开发样本集中不同生物功能的生物功能评分时，可以执行图81的过程许多次。

5.步骤8110计算其他样本集的生物评分

a.类似于步骤4，使用在“PROSE-厄洛替尼”集中确定的平均第一主成分

(步骤3)计算本实施例的其他四个样本集的生物功能评分

实施例10结果

急性反应评分

通过PSEA将29个MS特征与相应于急性反应(AR)的蛋白质组相关联，并将其用于计算相应的急性反应评分。图66A-66D分别显示了“PROSE-厄洛替尼”、“PROSE-化疗”、“Moffitt”和“Moffitt-7周”样本集中急性反应评分(AR评分)的分布。值得注意的是，在所有样本集之间，甚至在NSCLC和黑素瘤样本集之间，急性反应评分在-2 和+4之间的分布是非常相似的。

图1A和1B中已经显示了所有119名“Moffitt”集患者的总体存活 (OS)和进展时间(TTP)的Kaplan-Meier图。使用AR评分作为单个解释变量应用于这些事件时间数据的Cox模型产生表74中的统计数据。表75显示了在考虑包括已知基线预后因素的多变量分析时的相同统计数据。

表74：通过使用AR评分作为单个解释变量将Cox模型应用于“Moffitt”集的事件时间数据而获得的统计数据

表75：从“Moffitt”集的多变量分析中获得的统计数据

AR评分不使用结果数据来定义。在独立的样本集上，它是OS 和TTP的重要预测指标，当对于其他已知的预后因素来调整时，它仍然是OS和TTP的重要独立预测指标。

图67A-67D显示了通过IS2类别标记划分的“PROSE-厄洛替尼”、“PROSE-化疗”、“Moffitt”和“Moffitt-7周”样本集中AR评分的分布。 (应回想起，“IS2”是指实施例1中在Moffitt纳武单抗样本集中开发的“全集”分类器)。进行了t检验以及Mann-Whitney检验以调查AR评分与IS2分类组的相关性，并且对于所有样本集获得p值<0.001。基于“PROSE-化疗”数据集中的IS2早期和IS2晚期样本的评分分布，选择了-1.25的暂定阈值(AR评分)，以便定义具有更高和更低AR功能的样本，根据它们的评分分别高于或低于阈值。图68A-68F显示了按照如所选阈值所定义的组，“PROSE-化疗”、“PROSE-厄洛替尼”和“Moffitt”集的事件时间结果(OS和无进展存活(PFS)或TTP)的 Kaplan-Meier图。请注意，图68A-68F的存活曲线中存在分离，即与评分<-1.25的患者组相比，评分>-1.25的患者组的OS和PFS相对较差。图68A-68F的图例中显示了存活图的统计数据。

因此，图68A-69F显示可以将AR评分与截止值一起使用，将患有黑素瘤和NSCLC的患者分成具有更好和更差的事件结果的两组。

图69A-69D显示样本同时在“Moffitt”和“Moffitt-7周”集中的107 名患者的急性反应评分的变化，这些患者通过基线(治疗前)和第7周 (在治疗期间)的IS2的组合来分组。图70A-70C显示了样本同时在“Moffitt”和“Moffitt-7周”集中的107名患者的急性反应评分的变化，这些患者按照治疗反应来分组。如从图69A-69D的图所预期的，具有“早期”IS2分类的患者通常具有较高的AR评分。IS2标记从“早期”到“晚期”的变化与AR评分的降低相关，对于从“晚期”到“早期”的变化，反之亦然。回顾实施例1，类别标记“晚期”表示患者是一类患者的成员，与具有“早期”类别标记的一类患者的成员相比，这类患者可能在黑素瘤治疗中从纳武单抗获得相对较大的益处。这些纵向评估显示，在治疗过程中患者的AR评分可以改变。因此，通过收集一系列血清样本和评估AR评分，可以监测癌症患者的急性反应水平。

为了进一步探索AR评分监测的价值，调查了评分变化对预后的影响。除了基线AR评分(表76)之外，第7周和基线之间的AR评分的变化是“Moffitt”集的OS和TTP的独立显著预测因子。因此，监测用纳武单抗治疗的黑素瘤患者的AR评分为AR评分的基线评估提供了额外的信息。

表76：将基线和第7周之间的AR评分和AR评分变化作为解释变量，通过将Cox模型应用于“Moffitt”集的事件时间数据而获得的统计数据

为了进一步说明监测AR评分的预后价值，图71A和71B中显示了具有基线和第7周时的样本的“Moffitt”集中的107名患者的 Kaplan-Meier图，其中患者根据从基线至第7周的AR评分变化来分组。治疗过程中AR评分增加的患者的TTP和OS明显短于其余患者，这与高基线AR评分的不良预后价值一致。

伤口愈合评分

确定25个MS特征与相应于伤口愈合(WH)的蛋白质组相关，但与急性反应或免疫反应无关。这些特征用于根据上述生物功能评分计算程序计算伤口愈合评分。图72A-72D分别显示了“PROSE-厄洛替尼”、“PROSE-化疗”、“Moffitt”和“Moffitt-7周”样本集中的评分分布。注意在图中伤口愈合的图例使用缩写WH-AR-IR，这意味着该特征集包含与伤口愈合相关的特征，但与急性反应(AR)或免疫反应(IR)无关。为了达到这一组缩减的特征，不仅仅关注在p<0.05下与伤口愈合有关的所有MS特征，而是识别在p<0.05处与伤口愈合有关的那些特征，排除在p<0.05下与急性反应或免疫反应相关的那些特征，因此术语WH-AR-IR。如果不排除与AR和IR相关的特征(这也是重叠的)，将(可能)得到类似的AR和WH评分的行为，因为AR特征倾向于主导行为。最理想的是在更大的样本集上运行更大，即更完整的蛋白质组；那么可以使用更优化、更宽泛的生物功能来开始，并且在每个集合中仍然有足够的测量蛋白质进行有意义的分析。按照实际情况来说，所拥有的蛋白质组是广泛的并且往往重叠。在下面的论述中，术语伤口愈合和伤口愈合评分是指与伤口愈合生物功能相关但与AR 或IR不显著相关的质谱特征(和相关评分)的集合。

图73A-73D显示了样本同时在“Moffitt”和“Moffitt-7周”集中的 107名患者的在Y轴(图中“WH-AR-IR”)上绘制的伤口愈合评分的变化，这些患者通过基线(治疗前)和第7周(在治疗期间)的IS2的组合来分组。图74A-74C显示了通过治疗反应，即进行性疾病(图74A)、部分反应(图74B)和稳定疾病(图74C)来分组的相同的107名患者的伤口愈合评分的变化。

如图72A-72D所示，根据肿瘤类型，伤口愈合评分似乎具有稍微不同的分布，其中与NSCLC的分布(PROSE图72A和72B)相比，黑素瘤的分布(Moffitt图72C和72D)集中在较低的WH评分。IS2分类与WH评分的关联显著低于AR评分。然而，对于“Moffitt”集，OS 和TTP的Cox比例风险模型显示WH评分是结果的高度显著预测因子(表77)。此外，将从基线到第7周的WH评分的变化作为额外的解释变量包括在Cox模型中显示这是独立显著的，因此在治疗期间对 WH评分的监测提供了额外的预后信息。

表77：以WH评分作为单一解释变量(模型1)并且以基线WH评分和从基线到第7周的WH评分变化作为同时解释变量(模型2)的“Moffitt”集的OS和TTP的Cox比例风险分析

补体系统评分

确定一百五十七(157)个MS特征与对应于补体系统的蛋白质组相关(参见实施例6)。这些特征用于计算补体系统评分，使用上述包括等式(2)和(3)的程序。图75A-75D显示了“PROSE-厄洛替尼”、“PROSE-化疗”、“Moffitt”和“Moffitt-7周”样本集中评分的分布。图76A-76D显示样本同时在“Moffitt”和“Moffitt-7周”集中的107名患者的补体系统评分的变化，这些患者通过基线(治疗前)和第7周(在治疗期间)的IS2的组合来分组。图77A-77D显示了通过治疗反应，即进行性疾病(图77A)、部分反应(图77B)和稳定疾病(图77C)来分组的相同的107名患者的补体系统评分的进展。

图75A-75D再次表明依赖于肿瘤类型，补体系统评分分布的位置存在一些差异，与黑素瘤相比较，NSCLC集中在更高水平的补体评分处。与早期的IS2分类相比，晚期的IS2分类(实施例1)通常与稍高的补体评分相关联，并且从早期到晚期的分类变化显示补体评分普遍下降，对于从晚期到早期的变化，反之亦然。

请注意，因为第一主成分仅定义为乘以-1的乘法因数，并且通常与给定生物功能相关的蛋白质组将包含当此生物功能更相关或更活跃时，具有更高水平和更低水平的蛋白质，从观察评分来判定是否高分或低分对应于更相关或活跃的生物功能是不明显的。在IS2分类的 PSEA分析(实施例6)中，观察到补体和急性反应在IS2早期类别组中与IS2晚期类别组相比升高。该观察结果与实施例10中呈现的结果相一致，因为补体评分应该解释为使得特征和暂时识别的相应蛋白质 (实施例1蛋白质识别)的升高水平对应于该补体评分的较低水平。

生物功能评分用于治疗和监测

总结上述结果，设想生物功能评分的几个应用，涉及到现有的类别标记，或在没有分类结果的情况下。为了进一步论述，将使用与急性反应(AR)功能相关的评分，但是这些建议适用于可以与质谱特征相关联的任何生物功能。

1.与现有分类相关的生物功能评分

在第一种情况下，通过IS2(实施例1全集分类器)获得的使用类别标记，例如早期和晚期，可以评估两组中评分值的分布之间是否存在显著差异(图68A-68D)。在所有研究的实例中，AR评分的分布在 IS2分类之间的差异极显著(p<0.001)，如t检验和Mann-Whitney检验评估。

这种差异的证据可以作为与评分相关的生物功能对分类的影响的额外支持。

通过分析由分类定义的分组中的评分分布，可以选择可用于将患者分配给特定亚组的截止点，例如，“高”、“中”和“低”，这可能与结果、预后或某种其他临床相关的度量有关。

例如，基于IS2分类，基于PROSE化疗NSCLC集的AR评分来选择的截止值(-1.25)将该组以及Moffitt集(由经纳武单抗治疗的黑素瘤患者组成)中的患者分离成具有显著不同的OS和PFS(或TTP，在 Moffitt的情况下)的两组(参见图69)。换句话说，通过使用本实施例中描述的程序为患者样本分配生物功能评分并且将评分与截止值(例如，从开发样本集获得的评分中定义)进行比较，可以为样本分配类别标记并且通过将评分与相对于阈值具有相似评分的患者组的评分比较来对他们的反应或存活以及他们的存活或反应特征进行预测。

2.独立于其他分类的生物功能评分

重要的是，可以独立于任何类别标记来使用和分析生物功能评分。

因此，考虑到附加的临床信息(参见前面的表74和75)，可以使用Cox比例风险模型(在单变量或多变量分析中)评估作为结果的解释变量的评分的显著性。当用于Moffitt集时，AR评分是单变量和多变量分析中OS和TTP的高度显著预测因子。

另外，在多变量方法中，可以基于其评分来评估几种生物功能的效果，以评估其对于结果的同时影响的显著性，这可能是不同生物功能对结果的相对作用的假设。

与生物功能相关的评分可以用于对患者进行分类，例如，使用基于训练集中评分的分位数定义的截止值，然后应用于新的样本。在下面的实例中，基于将与PROSE化疗子集相关联的评分的较低两个三分位(定义为AR评分低，≤-0.744)组合并且与高三分位>-0.744(定义为AR评分高)相比较来定义截止值，并将这些阈值应用于Moffitt数据。结果可以在图78A-78D中看到。这些图是根据PROSE集合中由三分位定义的AR评分阈值定义的组的OS、PFS(“PROSE-化疗”)和 TTP(“Moffitt”集)的Kaplan-Meier图。在每个图下方示出了每组中的样本的相应数量、风险比(HR)、对数秩p值和中位数。值得注意的是，与AR高评分的患者相比，AR低评分患者的OS和PFS更高。

在该实施例中，在由纳武单抗治疗的黑素瘤患者的独立群组中，通过AR生物评分、使用来自NSCLC患者的数据来定义的预后分类器显示为按照OS和TTP来将患者显著分离，参见图78C-78D。

或者，可以使用若干生物功能的评分来创建更复杂的分类器，例如，使用图8中描述的Diagnostic Cortex方法。作为一个实例，使用上面定义的三个评分(急性反应、伤口愈合和补体系统)作为使用 Diagnostic Cortex的Moffitt集合进行分类器开发的特征，而不是如图 8的先前实例中的质谱特征。为了创建小型分类器，使用了一个、两个和三个特征(评分)的所有可能的组合来给出7个可能的小型分类器 (图8A，步骤120)。使用小型分类器过滤(图8A中的步骤126中的7 个可能的小型分类器)，但是没有在循环135的进一步迭代中做任何特征取消选择，如同在图54A的步骤52中的类似程序中那样。因此，所有7个小型分类器被考虑用于过滤，但并不是全部都通过了循环 335的每个迭代，所以没有在逻辑回归中使用全部7个小型分类器来形成每个主分类器。实际上，对于一些测试/训练的划分实现，7个可能的小型分类器都没有通过过滤，然后这个实现被丢弃而根本不被使用。

当根据图8开发分类器并应用于Moffitt集合时，所述方法产生两个分类组，“早期”(不良结果，早期进展)和“晚期”(良好结果，晚期进展)。图79A和79B显示了这些分类组的Kaplan-Meier图，图79A 显示了分类组的总体存活率，图79B显示了分类组的进展时间。从三个生物功能评分作为唯一的特征开发出来的分类器，优异地将患者分成较好和较差结果的组。

也可以将个体患者的评分与针对相同适应症患者群体获得的评分的分布相关联，以获得个体患者是否具有所考虑生物功能的特别高或低的活化水平的指示。例如，AR评分大于1的黑素瘤患者在其适应症AR评分的第90百分位以上，表明急性反应水平非常高。这可能被用来选择患者接受某些疗法或表示禁忌某些疗法。参见G Simpson,SD Heys,PHWhiting等人,Acute phase proteins and recombinant IL-2 therapy:prediction ofresponse and survival in patients with colorectal cancer.Clin Exp Immunol1995；99:143-147。

因此，在本公开的一个方面中，从开发样本集上的一组生物功能评分来开发/训练分类器，并且可以使用这样的分类器和相关联的参考集(类别标记和评分)来分类新样本。对新样本进行质谱分析，针对与每个生物功能的PCA第一主成分向量相关联的集合中的特征获得特征值，并且使用相同的程序将一组生物功能评分分配给样本以便在开发样本集中生成生物功能评分。然后使用分类器对样本进行分类，并生成标记，例如早期或晚期或等效的标记。然后，类别标记可用于引导治疗或预测患者反应或存活。

3.使用生物评分进行患者监测

如例如图70A-70D所示，在一些情况下，在治疗过程中患者的评分的数值变化可以与分类的变化相关联：因此，AR评分的降低似乎与从早期到第7周的晚期的分类的变化相关，从晚期到早期的变化似乎与评分的增加一致。

观察评分随时间的变化或在特定适应症的评分分布中观察到的评分百分位数的变化以监测特定生物功能水平的变化是可能的。这可以用来调查疗法的有效性或测试患者的状态是否改变以允许开始治疗。例如，如果在急性反应水平高的情况下已知疗法无效，则患者可能需要等待，直到他的AR评分减少，无论是自然的还是通过某种干预，直到他开始该特定疗法。这种方法也可以用来监测慢性疾病，试图预测疾病的发作或进展。

此外，已经证明(参见例如图71A-B和表76)，除了评分的基线评估之外，评分的改变可以是显著的预后因素，为医生提供了额外的信息以告知患者预后。

4.识别不同肿瘤类型中的生物功能的相对重要性差异

实施例10的结果显示，尽管黑素瘤患者和NSCLC患者的AR评分分布非常相似，但WH-AR-IR评分和补体评分的分布是不同的。因此，检查不同适应症中的评分分布可能揭示不同生物功能和相关途径在不同肿瘤类型中的相对重要性的差异，并且可用于例如调查为什么一些治疗在某些肿瘤类型中比在其他类型中更有效。

总之，生物功能评分可以用来表征生物功能在现有分类器中的作用，也可以独立地对患者进行分类，并有可能定义具有不同结果和预后的组。它也可以用来监测生物功能水平的变化，这可能有助于评估疾病的进程，治疗的有效性，或什么时候患者能够最佳地开始治疗。

虽然这里的实例是具体的，但是使用的方法相当一般，可以通过几种方式扩展。

1.在PCA中选择使用哪些功能

在这些实例中，在PSEA中，使用了与特定生物功能相关的蛋白质组相关的特征，p值为0.05。这种关联水平截止的选择是任意的，可以采用更大或更小的截止，从而带来与特定生物功能相关的更大或更小的特征集。

2.只使用PCA的一个主成分

在这里探讨的实例中，第一主成分主导了数据集内的变化。参见图65A-65C和前面的论述。这可能并非总是如此，可能有必要扩展这个方法，用一系列评分而不是单一评分来表征特定生物功能的水平。或者，可能有必要将几个主成分上的映射或这些映射的群体分布中的位置组合，以创建更精确地反映生物功能的单一评分。

3.PCA的替代

在这里使用与生物功能相关的特征集上的简单PCA来将特征值减小到一个评分。可以使用其他方法来进行这种降维，例如称为内核 PCA的技术。请参见wikipedia.org及其中的参考资料上关于此技术的描述。

图80以框图形式总结了用于创建生物功能评分的系统和方法。如8000所示，有例如来自参与药物临床试验或全部患有疾病例如癌症的患者群体的N个样本1、2、3、...N的开发集。本实例中的样本是例如在治疗前获得的血液样本，例如血清。样本如8002所示进行质谱分析。此外，将样本在平台8004(例如SomaLogic，Inc.，Boulder CO的SOMAscan系统或等效物)中进行蛋白质表达测定。将多个蛋白质的蛋白质表达数据，理想地至少1000个这样的蛋白质和质谱数据提供给计算机8006。计算机8006使用实施例6中解释的方法，进行蛋白质组富集分析(PSEA)，包括推导ES评分和使与特定生物功能相关联的蛋白质组与质谱特征相关联的p值。根据这些数据，计算机使用上面解释的程序为从PSEA分析确定的生物功能产生生物功能评分。这可以是开发样本集8000中每个成员的评分数组。此外或替代地，如果样本的临床数据或类别标记也可用于分类器训练，则可以使用图8将开发集中的评分用作上述分类的特征来开发分类器。样本集的评分连同开发集成员的类别标记一起被存储在计算机8006的存储器中，例如以后在分类样本时使用。

作为另一个实例，获得具有与开发样本集相似的特征的来自新患者的样本，对样本执行质谱分析，并且获得与生物功能相关联的特征的特征值，并且将评分分配给样本。然后将评分与样本集8000中的评分或者来自开发样本集中评分的阈值进行比较，新样本的评分用于引导治疗或预测患者结果或预后。

如图80所示，在一个替代方案中，可以获得第二组M个样本1、2、3....M 8000A，并且可以在该第二样本集上进行平台8004中的蛋白质表达测定。PSEA分析可以在这组蛋白质表达数据上完成，而不是第一样本集。这个第二样本集也可以经受质谱和计算机8006中进行的处理。

提供以下条款作为对实施例10中公开的发明的进一步描述。

1.一种用于表征人类中的生物功能的系统，包括：

质谱仪，其对于人类血液样本进行质谱分析；和

计算机，其使用编程指令来操作以便根据从与生物功能相关联的血液样本的质谱分析所获得的质谱特征的特征表生成生物功能评分，所述生物功能评分映射到从质谱特征和呈许多其他血液样本形式的样本集获得的第一主成分向量的方向上。

2.如条款1所述的系统，其进一步包含蛋白质表达测定系统，其从大组的蛋白质来获得蛋白质表达数据，对于开发样本集中的每个样本或替代地第二样本集中的每个样本来说，所述大组的蛋白质涵盖所关注的生物功能；并且其中所述计算机可操作以执行蛋白质组富集分析，所述蛋白质组富集分析将来自所述大组的蛋白质的蛋白质或蛋白质组与所述生物功能相关联。

3.一种评估从人的群体获得的一组血液样本的方法，包括以下步骤：

a)获得样本集；

b)对该样本集进行质谱分析，并获得包括一组质谱特征的特征值的质谱数据；

c)确定质谱特征集与生物功能的关联；和

d)通过将包含与生物功能相关联的质谱特征的特征值的特征表映射到从质谱特征和一组血液样本获得的第一主成分向量的方向上来计算该样本集中的每个成员的生物功能评分。

4.条款3的方法，包括重复步骤c)以识别与第二生物功能相关联的第二组特征，并通过计算第二生物功能的生物功能评分来重复步骤d)。

5.条款3或4的方法，其中生物功能包括急性反应、伤口愈合或补体系统。

6.条款3的方法，其中对第二组血液样本执行步骤a)、b)和d)。

7.一种评估人类生物过程的方法，包括以下步骤：

a)对于开发样本集执行条款4的过程，并针对至少两种不同的生物功能获取开发样本集中每个成员的生物功能评分；

b)从开发样本集的生物功能评分来开发分类器；和

c)对来自人类的血液样本进行质谱分析，并且获得与所述至少两种不同生物功能相关联的质谱特征集的特征值，以及

d)针对来自人的血液样本，计算至少两种生物功能中的每一种的生物功能评分，以及

e)用步骤b)中开发的分类器、根据步骤d)中计算的生物功能评分将样本进行分类。

8.如条款7所述的方法，还包括利用从所述开发样本集的质谱数据训练出的分类器和与所述开发样本集相关联的类别标记，生成所述样本的类别标记。

9.条款7的方法，其中在步骤b)中开发的分类器被组织以基于生物功能评分中的阈值来分类样本。

10.条款7的方法，其中开发样本集包括来自用免疫检查点抑制剂治疗的黑素瘤患者的样本集。

11.一种分类器开发的方法，包括以下步骤：

a)从多个人获得血液样本的开发集；

b)对开发样本集进行质谱分析，并获得包括一组质谱特征的特征值的质谱数据；

c)识别质谱特征集与至少一种生物功能的关联；

d)通过将包含与生物功能相关联的质谱特征的特征值的特征表映射到从质谱特征和开发样本集或替代地第二样本集上获得的第一主成分向量的方向上，计算开发样本集中的每个成员的生物功能评分；和

e)用至少一种生物功能的生物功能评分训练分类器。

12.如条款11所述的方法，其中执行步骤c)和d)以将至少两组质谱特征与至少两个生物功能相关联，并计算所述开发样本集中的每个成员的至少两个生物功能评分；并且其中步骤e)包括用至少两个生物功能评分来训练分类器。

13.条款12的方法，其中训练步骤e)包括图8的程序。

14.如条款3所述的方法，还包括计算包含与生物功能相关联的质谱特征的特征值的特征表在从质谱特征和样本集获得的第二主成分向量的方向上的映射。

15.如条款3所述的方法，其中，第一主成分向量是从对于样本集的子集的许多不同实现方式的主成分分析程序来计算的。

16.如条款15所述的方法，还包括以下步骤：对第一主成分进行迭代平均化和正则化，直到获得袋装的第一主成分向量

提供所附权利要求作为对所公开发明的进一步描述。

附录

附录A：特征定义

附录B：分类器中包含的特征(实施例1)

附录C：实施例2的分类器中使用的特征的子集

附录D

实施例6的分类器1或分类器2中使用的质谱特征

3465	7274
		3679	7287
3703	7334
		3842	7536
4032	7883
		4133	7913
4545	8331
		4590	8391
4718	8902
		4818	8928
4891	9430
		4999	9641
5068	10012
		5129	10924
5158	12291
		5180	12351
5290	12413
		5377	13275
5430	13762
		5496	13798
5550	14098
		6438	14541
6681	14595
		6761	15751
6809	16630
		6881	17033
6898	18275
		6992	18637
7022	23249
		7035

Claims

1.预测黑素瘤患者受益于免疫治疗的机器，包括：

存储器，其存储以从用免疫治疗来治疗的多个黑素瘤患者的血液样本的质谱获得的多个质谱特征的特征值的形式的参考集，其中所述多个质谱特征包括附录A、附录B或附录C中列出的多个特征；

中央处理单元，其对代码集以及参考集和从待测试的黑素瘤患者的血液样本获得的质谱数据进行操作，并且响应地生成所述血液样本的类别标记，其中与阻断程序性细胞死亡1的配体活化的抗体药物的单一疗法相比，类别标记“良好”或等效物预测患者可能从包含阻断程序性细胞死亡1的配体活化的抗体药物和靶向细胞毒性T淋巴细胞相关蛋白4的抗体药物的组合疗法中获得相似的益处，并且类别标记“不好”或等效物表明所述患者可能从所述组合疗法中获得更大的益处。

2.如权利要求1所述的机器，其中参考集和样本的质谱数据是从使用MALDI-TOF质谱分析对形成参考集的样本和将要测试的样本进行至少100,000次激光照射获得的。

3.如权利要求1所述的机器，其中根据以下标准的任何一个过滤小型分类器：

(a)深度s为3，开发和内部验证集为1，以及对于时间进展的风险比及对于时间进展小于100天和时间进展大于365天的分类准确性的过滤器；

(b)深度s为2，开发和内部验证集为1，以及对于总体存活的风险比的过滤器；

(c)深度s为2，开发和内部验证集为2，以及对于时间进展的风险比及对于时间进展小于100天和时间进展大于365天的分类准确性的过滤器；

(d)深度s为2，开发和内部验证集为2，以及对于总体存活的风险比的过滤器。

4.如权利要求1所述的机器，其中所述最终分类器是从多个主分类器中定义的，每个主分类器都从将分类器开发样本集分离成训练集和测试集而生成。

5.如权利要求1所述的机器，其中，所述参考集包括来自经纳武单抗治疗的患者和经伊匹单抗与纳武单抗二者治疗的患者的质谱数据。

6.如权利要求1所述的机器，其中正则化组合方法包括具有极值丢弃的逻辑回归。

7.一种训练分类器的方法，所述方法包括以下步骤：

a)从受试者群体获得开发样本集，并且任选地从类似的受试者群体获得第二独立样本集；

b)对于所述开发样本集并且任选地对于所述第二独立样本集来进行质谱分析，并识别所述样本集的质谱中存在的质谱特征；

c)对于所述开发样本集中的每个样本或任选地所述第二独立样本集中的每个样本，从涵盖所关注的生物功能的大组蛋白质来获得蛋白质表达数据；

d)识别所述质谱特征中的一个或多个与按照其生物功能来分组的蛋白质组合之间的统计学显著关联；其中所述质谱特征包括附录A、附录B或附录C中列出的多个特征，和

e)在计算机辅助下，利用在步骤d)中识别的一个或多个质谱特征、基于所述开发样本集来训练分类器，所述分类器呈一组参数的形式，所述参数根据程序指令向与所述开发样本集相同类型的样本分配类别标记。

8.如权利要求7所述的方法，其中步骤d)还包括执行基因集富集分析的步骤。

9.如权利要求7所述的方法，其中所述分类器呈经受正则化程序的经过滤的小型分类器的组合的形式。

10.如权利要求7所述的方法，其中所述开发样本集和任选的第二独立样本集中的样本是血液样本。

11.如权利要求7所述的方法，其中步骤b)包括在MALDI-TOF质谱法中，对所述样本集中的样本中的每一个进行至少100,000次激光照射。

12.如权利要求7所述的方法，其中在步骤e)中训练的分类器被认为是第一分类器，并且所述方法还包括针对第二组的一个或多个质谱特征来重复步骤e)，所述质谱特征与不同生物功能有关的一组不同蛋白质相关联，从而训练出第二分类器。