CN111263965A

CN111263965A - 利用测量分析物改善疾病诊断的系统和方法

Info

Publication number: CN111263965A
Application number: CN201880065502.9A
Authority: CN
Inventors: 格莱娜·克拉西克; 基思·林根费尔特
Original assignee: Otraces Inc
Current assignee: Otraces Inc
Priority date: 2017-08-09
Filing date: 2018-08-09
Publication date: 2020-06-09
Also published as: EP3665694A4; CA3072212A1; US20210035662A1; WO2019032858A1; JP2023087100A; EP3665694A1; IL272484A; RU2020109551A; RU2020109551A3; JP2020530928A; IL292917A

Abstract

公开了用于诊断例如前列腺癌、乳腺癌、肺癌、卵巢癌等疾病及其分期的系统和方法。在某些实施方案中，所公开的系统和方法采集患者样本，计算生物标记物的浓度和邻近度评分，并使用这些计算来产生训练集模型，该训练集模型用于将生物标记物浓度和邻近度评分与疾病诊断和疾病状态(例如癌症分期)关联。在某些实施例中，所使用的关联技术包括简单回归、ROC曲线面积最大化、拓扑稳定或空间邻近度相关性分析。

Description

利用测量分析物改善疾病诊断的系统和方法

相关申请的交叉引用

本申请要求2017年8月9日提交的美国临时申请号62/542,865的优先权，其全部内容通过引用并入本文。

相关专利申请2014年3月13日提交的国际申请号PCT/US2014/000041(其全部公开内容通过引用并入本文)描述了使用自变量进行相关分析以改善疾病预测的方法，该自变量不直接是测量的分析物的浓度，而是称为“邻近度评分”的计算值，该计算值是根据浓度计算得出的值，同时还针对特定年龄(或其他生理参数)进行了标准化，以消除当疾病状态从非疾病转变为疾病时，浓度值随生理参数(例如年龄、绝经状态等)的偏移或变化的非线性以及年龄偏移。

技术领域

本发明涉及用于提高疾病诊断的准确性的方法以及相关联的诊断测试，其涉及将所测量的分析物与二进制结果(例如，非疾病或疾病)以及更高阶结果(例如，疾病的几个分期之一)之间的相关性。

背景技术

使用三个或更多个自变量来关联二进制结果(例如给定疾病的存在或不存在)的关联方法通常使用空间邻近度相关性方法(也称为聚类或邻域搜索方法)、回归方法和小波方法。在疾病预测的情况下，测量血液或血清的常见成分，并使用这些浓度作为各种疾病状态预测的自变量来尝试相关性。在结果是“疾病”或“非疾病”的给定疾病状态的情况下，通常使用逻辑回归方法。其他技术涉及例如遗传算法。这些方法的预测能力高度依赖于为该方法选择的成分分析物。本领域技术人员认识到，许多看起来具有预测能力的分析物和参数在实践中并不能提高诊断和分析能力。

回归方法使用自变量中的趋势来关联结果。线性方法基于线性趋势，而逻辑回归基于对数趋势。在生物疾病预测中，最常见的是，用逻辑回归来确定结果。

群体空间邻近度方法调查变量相关拓扑，以对相似结果进行分组。空间邻近度方法的优势在于，其能够在非连续的但具有拓扑局部反转的趋势中找到相关性。虽然，这种方法是高度非线性的，并且容易受到高度局部变量结果的影响，但测量误差较小，能够在生物学应用中更具预测性。此外，此处讨论的两种方法都能够与小范围应用的空间邻近度方法组合以创建合并的整体回归方法。

然而，在逻辑上似乎具有相关性的一些自变量在实践中并未显示出预测趋势。因此，需要一种通过利用迄今尚未对疾病状态的诊断贡献有用信息的患者特定和群体特定的变量来提高诊断准确性的方法。

已经进行了许多研究来发现生物标记物，这样的生物标记物单独或作为组合能够预测疾病状态，其具有足够的可再现性和预测能力以供临床使用。这项研究成果有限，甚至没有成功。已经对高丰度蛋白质(HAP)进行了大量研究，以找到能够做出此预测的单个蛋白质。已经发现了许多示例，但是没有一个示例具有足够低的假阴性水平，以允许用标记物筛查患者的疾病。

因此，除了用于前列腺癌的PSA之外，这种单一生物标记物仅用于治疗监测。此测试要求指示活检适当的浓度会严重偏斜以降低假阴性，从而导致很高的假阳性水平。实际上，多达80％的表示需要进行活检的男性对前列腺癌呈阴性。还发现在某些情况下，对于癌症的亚型，DNA标记非常好，但是由于与上述HAP相同的原因，DNA标记也不适合用于筛选。

利用多种蛋白质，还研究了蛋白质组学方法。这项工作再次集中在HAP或高水平的效应蛋白上。这项工作受到蛋白质测量的多种方法的主导，例如免疫测定、芯片和质谱法。非常早期的工作在卵巢癌方面取得了一些成功。但是，所有这些方法的问题在于，所选择的许多蛋白质与从健康到疾病的进展都没有很强的相关性(并且许多蛋白质与疾病状态之间没有已知的生物学联系，例如，质谱分析通常就是这种情况)。此外，由于用分光光度计检查整个血清样本中的蛋白质水平，因此质谱法存在严重的过采样问题，因此难以训练相关性算法。在质谱的情况下，整个血清样本可能具有200多种蛋白质和10,000个质谱峰。

诊断领域还需要利用比HAPS更有用的低丰度蛋白质的技术，以及用于分析低丰度生物标记物的分析技术。

诊断医学长期以来一直在寻找一种简单、准确的基于血清的血液检测方法，以检测癌症并检测癌症是严重的还是非活动性的。例如，当前的测试，用于前列腺癌的前列腺特异抗原(PSA)的假阳性率非常高，而真实检测的假阴性率高达十分之一。该测试的预测能力约为57％。此外，被诊断为低级前列腺癌的男性可能不需要进行多年或一生的治疗。当今，只有通过PCa活检才能准确地获得这种诊断。当前的PSA测试会不加区分地将所有PSA水平高于4.0ng/ml的患者(90％，漏掉十分之一)送交活检，而无论格里森(Gleason)评分如何，只有约20％的患者获得PCa。除此之外，低级PCa的男性在以后的生命中有转换为高级PCa的风险，而准确诊断这一点的唯一可靠方法是进行更多的活检。由于成本原因，医学界不接受用于监测的其他活检，并且由于疼痛和副作用患者也无法接受。因此，对低级PCa的男性的持续监测通过是定期进行PSA测试，同时进行数字直肠检查(DRE)有时还有CT扫描。在很多情况下，进行预防性治疗，即前列腺在医学上可能不是必要的情况下切除前列腺。此专利教导了一种新的基于血清的测试，该测试能够将没有PCa的男性与高级PCa的男性区分开，并且能够检测具有低级PCa并且日后可能转变的男性。此外，此专利教导了一种基于血液的测试，能够区分早期实体瘤癌症，例如肺癌、乳腺癌或癌症分期。

当前的PSA筛查测试已于1980年代中期获得批准，现已不具备专利保护。OPKO作为“实验室开发的测试”提供的新的所谓4K评分测试未经监管部门批准。其旨在检测患有高级PCa的男性，并将这种情况与低级PCa区分开。通常，高级PCa被认为是(在活检中获得的)格里森评分为7(4+3)或更高(8、9或10)，而低级被认为是7(3+4)或更低。用于检测所有PCa等级的男性的PSA测试的预测能力约为约57％，对于90％的敏感度，假阳性率约为80％(四分之一的阳性实际上是阴性)。4K评分测试的预测能力约为64％。因此，对于十分之一的假阴性率，假阳性率约为50％或十分之五实际上是阴性。这是当今医学中PCa诊断测试的当前状态。

当前，尚没有被监管机构批准的通过简单血液检测来检测例如肺癌和乳腺癌等疾病的方法。此外，这些疾病的严重性只能通过活检来评估。我们还提出其他测试，这些测试使用血清作为这些蛋白质的替代物，在肿瘤微环境中再次使用活性细胞因子来评估肿瘤分期。

为了减轻本领域的这些和其他缺陷，本文示例性地描述了在肿瘤微环境中使用活性细胞因子的新测试，其中血清充当这些蛋白质的替代物。

附图说明

当结合附图考虑时，通过参考下面的具体实施方式，能够更好地理解并容易获得对本发明及其许多伴随优点的更完整的认识，其中：

图1是显示对于前列腺癌的格里森评分中生物标记物浓度激增的图表；

图2是显示对于肺癌的格里森评分中生物标记物浓度激增的图表；

图3是显示对应于乳腺癌分期的生物标记物浓度的平均上调率的图表；

图4是显示侵袭性前列腺癌和非癌症的VEGF受试者工作特征(“ROC”)曲线的图表；

图5是显示侵袭性前列腺癌和非癌症的TNFαROC曲线的图表；

图6是显示侵袭性前列腺癌和非癌症的PSA ROC曲线的图表；

图7是显示侵袭性前列腺癌和非癌症的IL 6ROC曲线的图表；

图8是显示晚期肺癌和早期肺癌的IL 10ROC曲线的图表；

图9是显示晚期肺癌和早期肺癌的IL 6ROC曲线的图表；

图10是显晚期肺癌和早期肺癌的VEGF ROC曲线的图表；

图11是示出根据本公开的诊断方法的实施例的具有两个样本的盲测结果的图表，所述两个样本未通过拓扑不稳定性测试并且被不一致算法校正；

图12是示出根据本公开诊断方法的实施例的乳腺癌临床研究结果的图表，在此实例中，使用10个双标记平面示出针对训练集模型I的训练集癌症评分；

图13是示出根据本公开诊断方法的实施例的乳腺癌临床研究结果的图表，在此示例中，使用105个双标记平面示出针对训练集模型II的训练集癌症评分；

图14是示出根据本公开诊断方法的实施例的对进行临床研究的盲样进行实际诊断的结果的图表；

图15是示出针对十个双标记平面之一的双标记平面的图表，其示出根据本公开诊断方法的实施例使用的生物标记物中两个生物标记物的邻近度评分；

图16是示出根据本公开诊断方法的实施例的具有训练集数据点的双标记平面的图表；

图17是示出根据本公开诊断方法的实施例的不具有训练集数据点的双标记平面的图表；

图18是示出根据本公开诊断方法的实施例的具有阴影区域的双标记平面的图表，在该阴影区域中对免疫系统应答的影响是降低的；

图19是示出根据本公开诊断方法的实施例的具有阴影区域的双标记平面的图表，在该阴影区域中对拓扑稳定性问题的影响是降低的；

图20是示出根据本公开诊断方法的实施例的具有阴影区域的双标记平面的图，其中对于已知的试验测量的不确定性的影响是降低的；

图21是示出根据本公开诊断方法的实施例的具有两个样本的盲测结果的图表，所述两个样本未通过拓扑不稳定性测试并且被不一致算法校正；

图22是示出根据示例性实施例的本发明的软件遵循的通用逻辑路径的流程图；

图23是表示构建训练集模型(或诊断模型)、然后为盲样生成诊断评分的过程的流程图，所述盲样评估患病或未患病状态的风险；

图24示出典型的群体分布，在这种情况下的细胞因子是白介素6(IL6)；

图25是表示生物标记物浓度向邻近度评分(一种伪浓度)变换的图；以及

图26示出根据示例性实施例的用于实施本发明的软件的硬件的典型示意图。

发明内容

在不限制前述内容的情况下，在优选的实施例中，本发明涉及使用多变量(多变型)相关性方法改进预测疾病状态方法的预测能力和诊断准确性。这些方法包括蛋白质组学、代谢组学和其他涉及确定体液和组织样本中发现的各种生物标记物的水平的技术。

发明人设想的并且在本申请中讨论的各种实施例包括使用元变量，特别是使用调整所测生物标记物分析物对相关性评分的影响的方法。可以基于免疫系统应答的特殊知识和可能的测量误差的知识来识别此类元变量。这些方法既能够应用于训练集模型的构建，也能够应用于诊断中的盲样。

一方面，本发明涉及一种用于诊断疾病的方法，包括以下步骤：a)确定来自对象的盲样中至少三种预定分析物的浓度；b)选择与对象相关联的一个或更多个元变量，所述一个或更多个元变量在与该对象相关联的群体中对于已知患有或未患有该疾病的群体成员而有所不同；c)将分析物的浓度转换为一个或更多个群体分布特征和该一个或更多个元变量的函数，以计算代表每种分析物的邻近度评分；d)将邻近度评分与对于已知患有或未患有该疾病的群体成员确定的邻近度评分的训练集模型进行比较；以及e)确定该比较是否表明对象患有该疾病。可以预期，确定预定分析物的浓度(或水平)的步骤(a)可以在与本方法的其余步骤不同的时间和地点进行。类似地，本方法的其他步骤可以在不同的时间和地点全部或部分地实施。因此，本发明人将仅包含步骤(b)-(f)的方法确定为其发明。

具体实施方式

在描述附图中所示的本发明的优选实施例时，为了清楚起见，将采用特定术语。然而，本发明不旨在限于如此选择的特定术语，并且应当理解，每个特定术语包括以相似方式操作来实现相似目的的所有技术等同物。为了说明的目的，描述了本发明的几个优选实施例，应当理解，本发明可以以未在图中具体示出的其他形式实施。

针对本申请的，使用特定术语来更好地描述本发明的优选实施例，这些术语定义如下：

“分析灵敏度”定义为零校准器之上的三个标准偏差。对于低于此水平的浓度，诊断的表示被认为是不准确的。因此，临床上，低于该水平的相关浓度被认为是不准确的，并且在临床实验室中不用于诊断目的。

“针对个体的基线分析物测量值”是针对个体患者从非疾病状态到疾病状态的转变的所关注的生物标记物的测量集合，该测量集合是在一段时间内针对单个个体进行多次测量获得的。当个体患者没有疾病时，对非疾病状态的基线分析物测量值进行测量，或者，当个体患者患有疾病时，对疾病状态的基线分析物测量值进行确定。这些基线测量值被认为对于个体患者而言是唯一的，并且可以有助于诊断该个体患者从非疾病到疾病的转变。疾病状态的基线分析物测量值可以对于诊断该个体中第二次或更多次出现该疾病是有用的。

“生物样本”是指从对象抽取的组织或体液，例如血液或血浆，并且可以从中确定诊断信息分析物(也称为标记物或生物标记物)的浓度或水平。

“生物标记物”或“标记物”是指对象的生物样本的生物成分，其通常是在体液中测量的蛋白质或代谢组学分析物，例如血清蛋白。示例包括细胞因子、肿瘤标记物等。本发明还预期其他指标为“生物标记物”和“标记物”，包括但不限于：身高、眼睛颜色、地理因素、环境因素等。通常，此类指标将包括在群体中不同并保持可测量、可确定或可观察的任何测量值或属性。

“盲样”是从未诊断有给定疾病并且需要预测该疾病存在与否的对象中提取的生物学样本。

“疾病相关功能”是生物标记物的特征，其是疾病继续或生长的活动，或者是身体阻止疾病发展的活动。在癌症的情况下，肿瘤通过要求血液循环生长而作用于人体来生存和壮大，并且免疫系统将增强促炎作用以杀死肿瘤。这些生物标记物与不具有疾病相关功能的肿瘤标记物相比，会脱落到循环系统中，因此能够被测量。功能性生物标记物的示例可以是增强免疫系统的作用的白细胞介素6，也可以是肿瘤分泌的使局部血管生长的VEGF。非功能性示例可以是CA 125。其是位于眼睛和人类女性生殖道中的一种结构蛋白，其对人体没有杀死肿瘤的作用，也没有帮助肿瘤生长的作用。

“检测极限”(LOD)定义为浓度值比“零”浓度校准器的值高2个标准偏差。通常，将零校准器重复运行20次或更多次，以获得测量的标准偏差的准确表示。例如，对于病毒或细菌的检测，低于该水平的浓度测定被认为是零或不存在。为了本发明的目的，当样本重复使用时能够使用1.5个标准偏差，尽管优选重复使用20次。需要单个浓度数值的诊断表示通常不会低于此水平。在检测极限的水平的测量值在统计学上处于95％的置信度水平。使用此处讨论的方法对疾病状态的预测并非基于单个浓度，并且预测被示出为在测量值低于基于LOD的浓度的水平时是可能的。

“低丰度蛋白质”是血清中水平非常低的蛋白质。该水平的定义在文献中没有明确限定，但是如本说明书中所使用的，在所抽取的样本的血清或血浆以及其他体液中，该水平小于约1皮克/毫升。

“元变量”是指除了分析物和生物标记物的浓度或水平之外，表征给定对象的信息，但其不一定对该对象是个体化的或独特的。这样的元变量的示例包括但不限于对象的年龄、绝经状态(绝经前、围绝经期和绝经后)以及其他情况和特征，例如青春期、体重、患者居住地的地理位置或区域、生物样本的地理来源、体脂率、年龄、种族或种族的混合或时代。

“群体分布”是指给定对象群体的生物样本中特定分析物的浓度范围。具体的“群体”指的是但不限于：选自地理区域、特定种族或特定性别的个体。并且本申请所述选择使用的群体分布特征还考虑了在定义的更大群体中使用两个不同的亚群体，其是被诊断为具有给定疾病状态的子群体(疾病亚群体)的和没有疾病状态的亚群体(非疾病亚群体)。群体能够是需要疾病预测的任何团体。此外，预期合适的群体包括那些具有相对于疾病发展的其他分期已经发展到特定临床分期的疾病的对象。

“群体分布特征”可在生物标记的群体分布内确定，例如特定分析物浓度的平均值、其中值浓度值、浓度的动态范围或种群分布如何被分到可识别成不同峰的组，这些峰是当患者经历从非疾病到疾病状态的生物学转变或进展时，疾病的发作和进展影响各种所关注的生物标记物和原变量的上调或下调的程度。

“预测能力”是指诊断化验或测试的敏感度和特异性的平均值，或者是一减去错误预测(假阴性和假阳性)总数除以样本总数。

“邻近度评分”是指所测量的生物标记物浓度的替代值或替换值，并且实际上是能够被用于诊断相关性分析的新的自变量。邻近度评分与所测量的生物标记物分析物的浓度有关并且是根据其计算得出的，其中此类分析物对给定的疾病状态具有预测能力。如国际公开号WO 2017/127822和国际公开号WO 2014/158287中所公开的，使用所关注的元变量调整后的群体分布特征来计算邻近度评分，以转换期望诊断的给定患者的预测生物标记物的实际测量浓度。“邻近度评分”和“伪浓度”具有相同的定义，可以互换使用。

“特异性”是测试的真假阳性率。从数学上讲，其是一减去测试的假阳性测量值个数除以测得的真阴性样本的总数。

“不一致训练集模型”(或“次要算法”)是次要训练集模型，该模型使用了不同的现象学数据约简方法，使得在主要相关性训练集模型和该次要算法中，双标记平面网格上的单个点都不可能不稳定。

“空间邻近度相关性方法”(或邻域搜索或聚类分析)是一种用于确定自变量与二进制结果之间的相关性关系的方法，其中，自变量绘制在正交轴上。对盲样的预测基于对已知结果的多个(3、4、5或更多个)所谓的“训练集”数据点的邻近度。二进制结果评分基于从多维上的盲点到相反输出的训练集点来计算出的总距离。最短距离确定单个盲数据点的评分。同样的分析能够应用于穿过多维网格的双标记平面上，在该平面上，单个双标记平面评分与其他平面的评分相结合以得出总计。这样在整个空间中使用切割或二维正交投影能够减少计算时间。

“训练集”是一组具有已知生物标记物浓度、已知元变量值和已知诊断的患者(通常达到200个或更多，以获得统计学意义)。训练集被用于确定“双标记”平面的轴值“邻近度评分”以及来自空间邻近度分析的网格点评分，该空间邻近度分析用于对单个盲样进行评分。

“训练集模型”是根据训练集构建的一种算法或算法组，该算法或算法组可以就有关对象(或患者)患有或未患有疾病的可能性的预测结果来评估盲样。然后“训练集模型”用于计算盲样的评分，以用于临床和诊断目的。为此，在任意范围内提供评分，该范围表示疾病或非疾病的可能性百分比或者是正在为患者进行诊断的医疗保健提供者优选的一些其他预定指标读数。

“受试者工作特性(ROC)曲线”是图形方法，用于表示在假阳性率、假阴性率与检测信号的强度之间的权衡的决策的信号传输方法的性能。在此图形表示中，曲线的纵坐标包含测试方法的灵敏度，而横坐标具有假阳性率。对于对疾病跳变点具有向上作用的生物标记物(或信号)，曲线将位于从图的原点(0,0)到图的右上方(1.0,1.0)的45°零线上方。曲线下方的区域表示生物标记物在做出预测方面的表现如何。

“ROC曲线的‘曲线下面积’(AUC)”是生物标记物特征曲线和横坐标之间的面积。对于完全没用的生物标记物，AUC为0.5，且其面积在上述45°零线以下。完美测试的AUC为1.0，并且从原点开始直到纵坐标一直延伸到100％灵敏度点，然后跨越ROC曲线到达右上角的1.0,1.0点。

“肿瘤微环境”浸没在肿瘤间质液(TIF)中，是肿瘤存在于其中的细胞环境，包括周围的血管、免疫细胞、纤维母细胞、骨髓源性炎性细胞、淋巴细胞、信号分子和细胞外基质。

“肿瘤标记物”是蛋白质标记物，其脱落到TME或没有明显功能的血液供应中，或者是肿瘤分泌的肿瘤赘生物，或者是免疫系统的肿瘤抑制物。

近年来，癌症免疫疗法研究对肿瘤微环境(TME)越来越感兴趣，肿瘤微环境为开发和发展新疗法提供了理想的研发平台，并代表了潜在的庞大诊断内容库。浸没在肿瘤间质液(TIF)中的TME是肿瘤存在的细胞环境，包括周围的血管、免疫细胞、纤维母细胞、骨髓源性炎性细胞、淋巴细胞、信号分子和细胞外基质。

TIF还是将肿瘤(和TME)连接到血液供应的运输液，并且TIF很重要，因为其是免疫系统用来试图抑制肿瘤或表达肿瘤以帮助其生长的活性蛋白的“战场信使”。这些相互竞争的蛋白质或细胞因子经常相互斗争，它们属于低水平信号蛋白的几个功能类别：促炎和抗炎、抗肿瘤发生(或细胞凋亡)、血管生成和血管形成。

尽管被认为是丰富的诊断信息的潜在来源，但是TIF分析作为癌症筛查手段的开发尚未取得进展，因为对这种液体进行采样非常困难，并且这样做意味着知道肿瘤的位置因而知道是否已经存在肿瘤。更具挑战性的是在没有这些知识的情况下检测TME/TIF的存在，从而检测恶性肿瘤的存在。这需要用于临床诊断的更容易接触的液体，例如血清，并需要结合可以与疾病的存在或不存在有关的对多种蛋白质的分析，称为蛋白质组学。血清在这方面存在一些问题，因为其更多地是患者体内各种疾病的混合物，因而不是检测活性TME(从而检测肿瘤)存在的直接途径。

在本公开中，我们讨论了一种分析血清中存在的特定细胞因子的方法，以作为TME和TIF中活性蛋白的精确替代物。该方法涉及几个步骤，包括两个专有过程，称为蛋白质组噪声抑制和多维(或空间)相关性。我们描述的方法能够为TIF中发现的蛋白质的作用提供准确的代替物，因此可用于检测生物体中是否存在活性TME，从而检测肿瘤。本质上，此方法可分离血清中TME的标记并指示是否存在活性TME，表明存在活性肿瘤。除此之外，此方法还可以测量这些蛋白质的调节作用，从而获得有关肿瘤状态、侵袭作用程度和分期的有价值的信息，以及有关免疫系统抑制肿瘤进展方面的信息。

所关注的生物标记物

本公开中所关注的生物标记物是：促炎性物(白介素6，IL 6，或其他)；抗炎物(白介素10，IL 10，或其他)；抗肿瘤或杀死肿瘤的细胞因子(肿瘤坏死因子α，TNFα，或其他)；和循环生长因子，例如血管生成(白介素8，IL 8，或其他)；以及血管化细胞因子(血管内皮生长因子，VEGF，或其他)。这些是与免疫系统对肿瘤或肿瘤对人体的作用的反应具有直接相关功能的细胞因子。血管化因子VEGF是肿瘤在生长肿瘤的大部分区域内生长循环系统的作用。肿瘤抗生成因子TNFα是免疫系统杀死肿瘤(细胞凋亡)的作用，促炎因子IL6是整体免疫系统作用的介体。抗炎物IL 10是由肿瘤分泌到肿瘤组织液中用来抑制免疫系统。最后，血管生成因子例如IL 8是由肿瘤分泌的，以在周围组织中增加血管形成。

通常，癌症是一种促炎性疾病，其中例如IL-6的因子被上调。然而，在本文所述的三种情况下，肿瘤在其晚期会分泌抗炎细胞因子到肿瘤间质液(以及血液)中。已显示该作用发生在癌症的晚期，肺癌和乳腺癌的第3或第4期以及在更高格里森评分的前列腺癌(格里森8、9或10)中。在这一点上，抗炎作用倾向于下调生物体免疫系统的促炎反应。在某些情况下，患有乳腺癌的血管生成反应在晚期也被抑制。最终，乳腺癌和肺癌的3或4期以及前列腺癌的格里森评分的8、9和10，随着肿瘤尺寸的增大，肿瘤的血管生成作用如人们预期的那样增加。在肿瘤微环境中发生所有这些作用都能够通过对生物体的血清进行采样并采用所引用的国际公开号WO 2017/127822和WO 2014/158287中所述的方法来辨别。

在癌症的特定情况下，近期高度的治疗研究兴趣集中在用于开发治疗方式的所谓的“肿瘤微环境”(TME)上。抑制或增强对在TME中发现的肿瘤组织液(TIF)中的活性蛋白的调节被认为是这些治疗的富有成果的发展途径。TIF中被认为是良好指标的蛋白质通常来自五个功能性细胞因子组：促炎和抗炎、抗肿瘤发生(或细胞凋亡)、血管生成和血管化。

这些蛋白质活性的测量能够提供对肿瘤活性和治疗效果的了解。例如，能够在TIF中监测促进或抑制蛋白质活性的治疗方式，以确定疗效。尽管适用于已知存在癌症的治疗应用，但仍未对TIF进行采样以用于诊断目的。根据定义，由于TIF(以及TME的TIF)的存在意味着患者患有活性肿瘤且位置已知，因此将其用作诊断工具是没有意义的。除此之外，还没有考虑过访问存在于其他体液(例如血清或尿液)中的这些蛋白质进行诊断，因为到目前为止，蛋白质组噪声问题使得这些蛋白质无法使用。

本文中，我们描述了一种系统和方法，该系统和方法通过使用易于获取的代替物液——在这种情况下为血清(可以是其他液体，例如尿液)——来产生用于使用TIF中的活性蛋白的TME活性的准确代替物。应当注意，血清是整个生物体状况的混合物(称为“蛋白质组噪声”)，并且对肿瘤不是特异性的。我们建议的方法还可以消除蛋白质组噪声，从而可以准确评估患者的病情。

总之，本文公开的系统和方法包括：1)选择指示TME中状况的活性TIF蛋白，2)在血清代替物中测量这些蛋白质，3)抑制蛋白质组噪声，以清晰地识别蛋白质中对癌症相关的活性，4)然后执行相关性方法，以在多维矩阵中放大这些蛋白质的作用，5)对蛋白质活性进行评分，以表明癌症的存在与否以及在癌症存在的情况下表明癌症的发展分期。首先要做的是创建代表整个群体的训练集，以此作为衡量标准，然后将其与各个样本进行比较以确定其状态——患病或无病。

生物标记物联合作用

这些细胞因子生物标记物在高等级前列腺癌中非常活跃，并且与“健康”男性的水平相比被高度上调或下调，因此是非常好的疾病状态的指示。还应注意，细胞因子生物标记物活跃于肺癌和乳腺癌中。图1、2和3示出这种随着肿瘤进展的作用。注意，在非小细胞肺癌和前列腺癌中，如图1和2所示，IL6在晚期癌症或高格里森评分8、9或10中下调。还要注意，在这两种情况下，在从低级肺癌或低格里森评分前列腺癌的转变中，肿瘤分泌的白介素10升高会导致IL 6的下调。还应注意，IL 10向肿瘤组织液中的分泌以及因此向血液中的分泌与患者预后不良相关联。这通常意味着存在晚期乳腺癌。因此，通过使用促炎和抗炎细胞因子的组合，改善了疾病状态相关性分析中IL 6和IL 10的组合。此外，请注意，随着肿瘤发展到晚期或更具侵袭性，血管化细胞因子通常会继续上调。

这些生物标记物中的三种生物标记物具有独特的ROC曲线特征，这些ROC曲线特征于肿瘤生物标记物来说并不常见的。对于某些更低水平的生物标记物浓度，其具有100％灵敏度下的平坦部分。它们具有相当大的曲线下面积(AUC)，表明它们是该疾病(高级前列腺癌(PCa)和非PCa)的非常好的生物标记物。它们中的一个具有从[0，0]沿纵坐标上升的垂直截面，指示样本在该信号范围一定具有PCa、假阳性率为零。

在科学文献中，有关本说明书中提及的几种选择的生物标记物的出版物有限。而且没有与高级PCa对普通群体(也就是说，没有PCa的患者)的检测相关联的。在VEGF的情况下，文献确实指出了生物标记物的上调，但是没有关于癌症的分期或特别是格里森评分的记载。许多文献仅限于将VEGF用作已诊断为PCa的男性的预后指标。TNFα也没有涉及与肿瘤的分期、特别是格里森评分有关的生物标记物作用的区分。对白介素6的科学调查得出了相同的信息。对白介素6的科学调查得出了相同的信息。实际上，在低级PCa中，一些文献表明生物标记物略有上调。我们的措施不能证明这一点，因为低级PCa会出现轻微的下调，但是高格里森评分PCa会出现非常强烈的下调，这使得这种细胞因子以及别的细胞因子成为高级PCa存在的有力指标。许多文献涉及将这些生物标记物用作患有PCa的男性的预后指标以及PCa细胞系中蛋白质的体外表达，并研究了出于治疗目的抑制该表达(特别是VEGF)的方法。

前列腺癌的ROC曲线

VEGF

对于VEGF的侵袭性(格里森评分7(4+3)、8、9和10)的ROC曲线如图4所示。注意到灵敏度为100％的ROC顶部的较大平坦部分。在此敏感度水平或低于约50pg/ml的VEGF浓度水平不具有高级PCa，且未检测到此疾病。这种疾病/非疾病比较的生物标记物的AUC为0.87。此外，低于50pg/ml的水平且没有假阳性独特的形状使其成为高级“PCa”与“非PCa”生物标记物的很好的候选者，因为低于约50pg/ml的浓度水平表明根本没有PCa。

TNFα

如图5所示，关于TNFα的评论与针对侵袭性(格里森评分7(4+3)、8、9和10)的ROC曲线的特征相同。在这种情况下，AUC为0.85，再次很高，并且相同的跳变点表示在低于6.5pg/ml左右没有假阴性结果。对于高于约9.85pg/ml的样本，TNFα还示出一部分曲线的假阳性率(横坐标)为零。在这个区域，没有假阳性结果。

PSA

如图6所示，关于PSA的评论与针对侵袭性(格里森评分7(4+3)、8、9和10)的ROC曲线的特征相同。在这种情况下，AUC为0.85，再次很高，并且相同的跳变点表示在低于2ng/ml左右没有假阴性结果。通用PSA化验的PCa所有格里森评分的ROC曲线作为参考示出为绿色(示出为“All PCa”)。

IL 6

相反，如图7所示，IL 6在一般群体中的侵袭性(格里森评分7(4+3)、8、9和10)表现出强烈的下调(曲线必须倒转以说明这种下调)，其中AUC约为当前用于检测PCa的PSA的两倍。推测可能是高级PCa在抑制免疫系统方面有效，但这不是本讨论的重点。事实是该生物标记物示出强烈的下调。有限的文献表明对一般的PCa略有上调。我们对所有格里森评分PCa的测量均示出轻微的下调。然而，在高格里森评分的情况下，细胞因子示出强烈的下调。PCa的总群体大约80％是低级的，因此在对PCa进行抽样时，低级将主导该群体的特征。这种下调可能是当肿瘤发展至侵略性格里森评分7(4+3)或更高时，由抗炎细胞因子(IL 10)的分泌引起的。

肺癌的ROC曲线

IL 10

图8示出在将低级非小细胞肺癌(1期和2期)与晚期(3期和4期)非小细胞肺癌分开的情况下的白细胞介素10的ROC曲线。请注意，其在从早期(1和2期)到晚期(3和4期)的过渡中上调。这对应于白介素6的下调，并且其是由将IL 10分泌到肿瘤微环境并随后分泌到血流中的肿瘤的抗炎作用引起的。

IL 6

IL 6的ROC曲线如图9所示，同样是针对早期(1和2期)和晚期(3和4期)非小细胞肺癌的情况。如图9所示，IL 6的这种作用被肿瘤的抗炎作用所抑制。

VEGF

VEGF的ROC曲线示出在图10中，该图示出了在其他癌症中发现的随着肿瘤的生长和发展到晚期的血管化因子的上调。

对于侵袭性或晚期与非侵袭性或早期癌症的测试

这些生物标记物能够组合在一起，以开发出一种非常简单的蛋白质组学算法，用于监测男性从低级格里森评分5、6或7(3+4)前列腺癌向高级格里森评分7(4+3)、8、9或10的高级PCa的过渡。而且，这些生物标记物能够将3或4期与早期、即1或2期癌症区分开。具有相反作用的IL 6和IL 10的组合能够(使用简单的相关性方法，例如逻辑回归)产生80％的预测能力。增加蛋白质组噪声抑制和空间邻近度相关性方法的会产生90％的预测能力。将VEGF的作用添加到生物标记物组会使预测能力提高至95％以上。

对于侵袭性前列腺癌与无癌男性的测试

实际上，VEGF本身会产生具有76％预测能力、100％敏感度和76％特异性(24％假阳性率)的测试。这个简单的模型排除在ROC曲线将非PCa排除的那些浓度范围内的非PCa，并且再次包括在ROC曲线包括PCa的那些区域包括PCa。然后，其使用简单的跳点计数以及对不在排除或包括标准之内的每个生物标记的阳性和阴性评分的计数。对于未预先排除或未包括的计数，计数必须超过4分之3。这个简单的模型产生了100％代表性的具有高格里森评分(定义为7(4+3)及更高)的100个PCa样本和100个非PCa样本。结合VEGF、IL 6、TNFα和PSA将产生90％的预测能力。此外，该测试将预测PSA升高但细胞因子不升高的男性“未患癌症”。这些男性患有前列腺增生症或其他非恶性前列腺疾病，构成了当前针对前列腺癌的PSA筛查测试的众多假阳性结果的大部分。包含这些细胞因子的测试解决了这个假阳性问题。

预测癌症分期

从莫斯科Gertsen研究所监测的乳腺癌研究中获得的数据能够使用以下所述的设备和试剂高精度地预测乳腺癌的分期。获得了189例乳腺样本，并带有分期信息(0至4)。测量的是肿瘤标记物PSA和记录的四种细胞因子，即促炎(IL 6)、抗肿瘤发生(TNFα)、血管生成(IL 8)和血管化(VEGF)。在这种情况下，目标是针对从活检中获得的可能的分期信息对每个样本进行评分。相关性方法本质上都是二进制的，如果没有一些操作，其无法对四个不同的结果进行评分。因此，分期组被结合为代表所有分期组的二进制的组；1加2、3、4；2加1、3、4；3加1、2、4以及4加1、2、3。使用国际公开号WO 2017/127822和国际公开号WO 2014/158287中描述的年龄标准化、噪声抑制和空间邻近度相关性方法对所有这四个组进行建模和评分。然后，使用每个样本的每个个体小组评分加上基于每个样本对个体小组的贡献的权重(1或1/3)来计算每个样本的评分。该模型产生了99％的精确度。

在本说明书中已经描述了几种改善传统蛋白质组学相关性方法对疾病诊断的预测能力的方法。这些方法包括：1)使用元变量和邻近度评分值用于相关性，以及2)使用拓扑稳定性和化验测量特性的特殊知识来调整训练集模型中的双标记平面影响。并且，描述了使用不一致训练集模型来发现和校正特定训练集模型所特有的盲样稳定性问题的方法。另外，描述了用于发现和校正部分模仿给定疾病状态的训练集模型的非疾病状况的方法。所有这些方法都是互补的，能够同时使用。例如，针对极不稳定的区域调整训练集模型无法完全从盲样预测计算中消除此问题，因此这两种方法均能够被用于提高预测能力。发明人已经发现，组合这些方法能够产生超过95％的预测能力，并且在下面的示例1中讨论的乳腺癌研究产生了超过98％的预测能力(100％的敏感度，97.5％的特异性)。

示例1：评估乳腺癌血液测试的临床研究

在一项测试中评估了OTraces BC Sera Dx测试套件和OTraces CDx免疫化学仪器系统(www.otraces.com)用于评估存在乳腺癌风险的性能。该测试套件可测量五种非常低水平的细胞因子和组织标记物的浓度，并使用如上所述开发的训练集模型来计算评分CSl和CSq，以评估患乳腺癌的风险。测定的蛋白质是IL-6、IL-8、VEGF、TNFα和PSA。该实验包括测量大约300个患者样本，这些样本大致分为50％被活检诊断的乳腺癌病例50％和假定为未患病(或在本示例为中没有乳腺癌)的患者。在该组中，200个样本的活检结果准确地分为50％的非疾病和50％的患有乳腺癌疾病，并且每组进一步细分为指定的年龄组。

样本分析结果用于建立可预测疾病状态的训练集模型。然后将剩余的样本(约110个)通过训练集模型处理为盲样，以获得最终的癌症风险数字评分，并将这些评分公开给主办临床中心。随后，由临床中心对这些盲样评分进行分析，以对结果的临床准确性进行评估。

为此实验开发了两个诊断模型，在本说明书中将其称为算法I和算法II。两种算法均使用了空间邻近度分析法。对象的年龄不用作自变量，而用作元变量，用于将测得的浓度转换为直接用于相关性分析的新的自变量，在本说明书中称为邻近度评分。算法I和算法II之间的区别在于在相关性中使用的新自变量的数量。算法I在十维群集空间中使用五个邻近度评分变量。算法I的下限是二维的，其并非基于特定的方法，而是基于执行相关性的事实。相关性固有地涉及一个以上的维度。算法I的上限理论上是无穷大，但实际上受计算时间和功率的限制。人眼可以通过投影查看群集空间，也能够切开该多维空间以查看二维双标记平面。在算法I的该示例性实施例中，存在十个这样的平面。

算法II使用十倍创建的自变量，因此大约有100个双标记平面。预期200个样本对于训练集模型而言是足够的，因此可以合理地对一般群体进行建模。次要或不一致训练集模型是根据相同的200个样本训练数据集开发的。训练集模型是用于描述此说明书中结果的主要评分方法。不一致训练集模型用于裁定主要训练集模型计算出的被认为不稳定的癌症评分；也就是，拓扑不稳定的区域的评分。尽管不一致训练集模型在盲样上的准确性较差，但其仍能够裁定主要训练集模型，从而提高预测能力。

相对于逻辑回归，前述空间邻近度分析方法具有明显的优势，因为其能够适应用于产生计算结果的自变量中的高度非线性趋势。结果是疾病或非疾病(在这种情况下为癌症或非癌症)，并且该结果基于训练集模型计算的邻近度评分。这种方法的缺点是高度非线性的区域能够与非常陡峭的拓扑坡度关联。因此，未知样本(或盲样)可以位于陡峰或深尖谷，其作用是放大计算出的邻近度评分中的小错误。我们使用专有的稳定性测试评估了计算评分的稳定性，然后使用算法II针对表现出稳定性的样本对算法I进行裁定。

图11、12和13示出了算法I训练集的结果。该模型本身包含10个双标记平面，每个平面具有40,000个拓扑点，每个拓扑点均被空间邻近度方法针对非疾病和疾病(此处为乳腺癌)进行了评分。这些图中示出了模型对非癌症组和癌症组进行分离的能力。该模型必须根据非常接近或优选地精确为50％x50％或非常接近两个结果状态之一来构建。同样，该方法使用年龄作为转换后的元变量。训练集样本的样本分布在所有关注的年龄组中。算法I的模型(图12)由100位健康女性和98位乳腺癌女性组成。图12中的汇总表示数值结果，其中N＝198是样本数。CI被正确地称为样本，FI被错误称为样本，并且有4个样本被认为不确定。开发了次要训练集模型以区分由于使用主要训练集模型而导致的四个不确定样本。该模型是不一致训练集模型。该次要模型使用与主要模型相同的训练集数据。图13示出不一致训练集模型计算的结果。算法II示出100％的分离以及超过60个分离点。

乳腺癌研究中盲样的测试结果

图14示出在临床研究中盲样的评估结果。结果示出100％的敏感度和97.5％的特异性。临床研究中心的肿瘤学家设置了诊断转换值，以便正确识别出乳腺癌阳性样本。因此，两个非疾病样本被称为癌症阳性。这在医学上是合理的，因为被判断为阳性的样本都将进入下一步的诊断，即乳腺摄影相术。许多女性没有进行乳房摄影术，因为她们居住的地方距离医疗设施太远。但是，她们的血液能够从临床实验室远程抽取，然后用冰运送到大城市的实验室。

示例2：使用元变量“年龄”来提高诊断准确性

表1(如下)示出了针对868名乳腺癌受试者的临床研究的列表结果。

情况	组群	正确识别	不确定	错误识别
					乳腺癌	495	98.0％	1.0％	1.0％
健康女性	373	98.0％	0.5％	1.5％

表1：乳腺癌诊断准确性汇总

表2(如下)示出各种相关性计算方法的比较。标准方法(逻辑回归)仅示出82％的预测能力。标准空间邻近度分析对此进行了改进，以线性形式产生了约88％的预测能力，以对数形式产生了90％的预测能力。本说明书中所述的方法使用元变量和加权方法、拓扑稳定性条件、免疫系统应答分组和加权条件进行化验性能-结合盲样的不稳定性测试和不一致算法校正-产生了超过97％的预测能力。

表2：疾病相关性计算的比较预测能力

示例3：在卵巢癌研究中使用元变量“年龄”提高诊断准确性

表3(下表)示出使用本文实施方案中描述的元变量方法对107名患有卵巢癌或未患有卵巢癌的女性的研究结果。这项研究并未使用本说明书中描述的所有预测能力改进，但仍获得了约95％的相对较好的预测能力。

情况	组群	正确识别	不确定	错误识别
					卵巢癌	51	94.1％	3.9％	0.0％
健康女性	56	96.4％	3.6％	0.0％

表3：卵巢癌诊断准确性汇总

示例4：使用元变量“年龄”提高前列腺癌的诊断准确性

表4(如下)示出了使用本说明书中所述的元变量方法对259名患有前列腺癌或良性前列腺增生(BPH)的男性进行研究的结果。该研究也未使用本文所述的所有预测能力改进，但仍实现了约94％的相对较好的预测能力。注意，在目前的前列腺癌PSA测试中，BPH是迄今为止导致假阳性结果的最常见情况。在前列腺癌的常规诊断中，具有BPH的男性约五分之四为阳性，导致大多数前列腺癌活检均为阴性。如上所述，元变量方法能够校正这些错误的诊断。

情况	组群	正确识别	不确定	错误识别
					前列腺癌	111	93.70％	0.90％	5.40％
前列腺增生/肥大	148	95.90％	0.00％	4.10％

表4：前列腺癌诊断准确性汇总

前述示例3和4中的结果(分别针对卵巢癌和前列腺癌)未使用元变量或影响调整方法(LOD、亚群体分组和不稳定性)，也未使用盲样稳定性方法。

为了进一步提高预测能力，对这些年龄或分组调整后的浓度进行条件化以对其进行标准化，并减少或消除跨多维分组标记图的聚类中的间隔偏差(也称为空间偏差)，以进行空间邻近度分析。参见图15的示例，其示出IL-6和VEGF的双标记平面。五种生物标记物乳腺癌测试组中有十个平面。在这种情况下，对计算出的邻近度评分值进行标准化并移位以产生零到二十的任意值，其中高度上调的浓度被高度压缩。

对在从年龄/分组分析得出的浓度上相同的标准化间隔上的多维标记平面的双标记投影中的每一个进行压缩，并针对年龄调整的均值以及年龄(或整个群体)调整后的亚组进行标准化。

使用可调整的双标记平面影响水平提高训练集模型的预测能力

通常，用非疾病和疾病的二进制数(例如+1和-1)对双标记平面评分。通过选择性地调整这两个二进制数的影响水平，本文所述的邻近度评分方法适于进一步改善预测能力。下面的方法是在训练集模型中开发的，并且一旦设定则固定在模型中。

图16和图17示出了用于五个生物标记物的情况的一个双标记平面的投影，用于预测疾病状态的存在，在这种情况下是使用五个标记物IL-6、IL-8、TNFα、VEGF和PSA来预测乳腺癌的存在。图16示出了训练集模型，其中的数据用于通过空间邻近度分析方法对图中的网格点进行评分。图17示出了没有数据的训练集模型。这构成了训练集模型。不需要使用用于创建模型的训练集数据，因为可以对40,000个网格点中的每个点进行评分，并且可以通过其落在网格上的位置来对盲样进行评分。拓扑示出红色为癌症阳性，蓝色为癌症阴性。在这种情况下，在计算总评分时，将非疾病网格点设置为+1，将疾病(癌症)网格点设置为-1。对该五个生物标记物示例中的每个双标记物在五个正交空间中进行分析，其中图16是一个二维的投影。在该图上示出了免疫系统应答的各个亚组的拓扑。在这种情况下，所有网格点(在这种情况下为2000x2000或40,000)都按照常规方式进行评分，分配给疾病状态阳性(乳腺癌)的值为-1，非疾病值为+1。如上所述，此双标记平面通过邻近度评分间隔针对元变量年龄进行了标准化。

图18示出相同的双标记模型，另外还示出灰色区域内的免疫应答分组(参见图24)。调整灰色区域的影响以反映以下事实：每个灰色封闭区域对患者为非疾病或疾病的可能性都有不同的影响。这种调整既能够通过人工估计并通过训练集验证来进行，也能够通过严格的计算机多变量增量分析来进行。这些调整改善了训练集模型。为两个结果创建了两个单独的双标记平面，分别是疾病状态和非疾病状态。在这种情况下，免疫应答组IV中的盲数据点更可能是疾病，其影响会稍微增加(绝对值)(例如，将评分从-1更改为-1.1)。该增量的实际量优选地通过计算机分析或可能通过严格的手动方法来确定。该方法适用于相关性分析的空间邻近度(也称为伪浓度)方法，但也可以使用其他方法达到相同的效果。这些加权疾病关联影响的方法能够使预测能力提高约1％。在预测能力高于95％时，这非常重要。

图19再次示出相同的双标记平面，其灰色区域被非线性、快速变化的疾病与非疾病拓扑的复杂区域圈出。能够通过在模型中插入带有注入噪声(例如+/-10％)的测试盲样值，然后注入测量的噪声量来识别这些区域。这些盲点中的大多数在疾病(此处为癌症)评分上不会有实质性变化。但是，在这种噪声调整之后，可以发现一些网格点从非疾病评分急剧上升到疾病评分。在这些区域中，大多数或所有双标记平面都具有快速变化的拓扑，该拓扑与多维总体双标记平面重叠。通过仔细减少这些区域的影响，能够在噪声基准点位于宽的平面上的几个相关双标记平面中增加权重，而不靠近结果边界。该方法已被证明可以纠正错误的预测。在上述情况下，红色癌症区域的影响下移(绝对值)，例如，从-1.0下移到-0.9。或者蓝色非疾病区域将从+1.0下移到-0.9。最优改变的水平可以通过严格的计算机分析确定。

化验噪声能够影响相关分析的准确性。该噪声在等于或低于化验的检测极限的水平下尤其成问题。也能够通过减少测量点对这些不稳定区域中单个生物标记物的影响来减轻这种噪声。图20再次示出乳腺癌组的PSA和IL-6的双标记平面。图左下方灰色矩形区域内的区域均低于化验的传统检测极限(LOD)。传统上，LOD定义为20个零校准器的两个标准偏差加上二十个零校准器的平均值。在两个标准偏差内，此水平上的值的统计确定性为95％，并且当然，当测量的样本低于LOD时，测量确定性就会下降。数据仍可以具有有用的信息，但应以更小的影响应用于分析。在这种情况下，减少了对灰色区域内盲样基准点的影响，例如，对于灰色区域内的训练集模型的基准点的影响从+1.0降到了-0.9。这会增加此测试样本的基准点的影响，这些影响超出其其他双标记平面上的检测极限。前述方法是互补的，并且能够串联实施。

通过测试盲样的不稳定性来提高预测能力的方法

训练集模型完成并固定后，即可用于计算患者盲样的癌症评分。发明人使用两种优选的方法来产生癌症评分。第一种称为线性方法(CSl)，将拓扑位置评分(+1或-1)乘以该双标记平面的预测能力。然后将它们相加并缩放并移位以产生0到200的评分。通过使用这些相同值的平方和的平方根来计算第二个评分，称为q评分(CSq)。第二种方法强调了个体双标记评分的差异，可用于整体医师的最终诊断。

由于空间邻近度相关性方法的高度非线性特性，拓扑不稳定性仍然保留在双标记平面中，并且无法完全消除。根据本发明的其他方面，能够将涉及注入噪声的稳定性测试和技术应用于盲数据集。不一致训练集模型能够被用于裁定或校正癌症评分。对于本发明的这个方面，为每个盲患者数据集注入固定水平的噪声(例如，正负10％)。如果盲样集大约有100名患者，则实际训练集模型计算机将针对300个样本集进行计算，每个样本一式三份(原始数据加噪声和减噪声)。然后测试所得的一式三份数据集的稳定性(a为-10％，b为+10％，c点为原始数据)。表5(如下)示出了针对临床研究数据的稳定性测试结果。注意，三个样本在癌症评分中显示出非常高的不稳定性。样本138、207、34和29均显示出很高的品质因数。品质因数(越低越好)应涵盖评分变化的程度，尤其是评分是否变化，以预测从癌症到健康的状况，反之亦然。来自盲样的这些数据集很有可能在预测诊断中不准确。

表5.拓扑不稳定性测试

不一致训练集模型能够被用于裁定未通过品质噪声测试的“处于风险中”的患者样本数据集。这些点由于不可避免的测量噪声而处于危险之中，由于随机样本数据点在大多数(如果不是所有的双标记平面)双标记平面上位于非常陡的坡度这一事实而导致的随机性或系统地与极端拓扑不稳定性结合，使得小的扰动会产生较大的评分波动。表5示出注入了噪声的样本。每个样本具有三个值：1)加噪声，2)减噪声以及3)原始数据无噪声。这些样本示出在±10％的噪声注入的情况下从疾病到无疾病以及从无疾病到疾病的癌症评分。在这种情况下，这些样本数据被判断为不稳定。不稳定水平未得到准确定义，其能够针对各种噪声注入水平进行调整。在这种情况下，可以用±10％的噪声和大于200的稳定性评分(注意，稳定性评分和癌症评分是两个不同含义的明显不同的数字)进行校正。

能够使用这种第二不一致算法(算法II)来裁定测量噪声。即使其预测能力比主要算法略低，但用于裁定的不一致算法(由于其将提高该点正确的几率)也能够用来校正这些“处于风险中”的患者样本集。在本示例中下，有两个已得到校正(参见图21)；样本138的非疾病评分为85，并通过不一致算法将其校正为195(该点对于算法I是稳定的)，样本34的评分为102(线性方法)，利用算法II校正为198。样本29和207没有被不一致算法更改。

不一致训练集模型(算法II)使用了105个双标记平面，因此与主要训练集模型(算法I)不一致，因为这些相同的样本在算法II稳定性测试中显示为稳定。测试不一致训练集模型的方法与主要训练集模型的方法完全相同。注意，逻辑回归方法也可用于计算这些样本的评分。算法II具有很高的预测能力，因此被使用。即使裁定预测集的预测能力比主要算法要小(优选地，尽管它的预测能力不低于50％)，也能够使用裁定训练集模型，只要其具有可能的正确结果并且不会不稳定。请注意，对于未通过噪声测试的相关盲样，校正是显著的。这些样本实际上都是高评分癌症。这些样本的十个双标记平面中的八个在具有非常高的不稳定网格点的拓扑上。因此，评分处于风险之中，实际上是不正确的(一个不正确，一个不确定，其中评分为100/120)。在这种情况下，校正了一个样本以将预测能力从97％提高到98％，极大地减少了误差(50％)。尽管不确定，但其中一个样本已变为癌症并也进行了校正。

通过排除部分模仿原发病分析结果的状态之一的独立状态来提高疾病状态校正二进制结果预测能力的方法

空间邻近度分析通常使用三个或更多个自变量，通常是患者的血清蛋白浓度。相关性算法只能够对非疾病或疾病的二进制结果起作用，但是其产生的连续评分与实际结果的可能性更紧密相关，该实际结果为两个二进制条件。在某些情况下，存在名义上归类为非疾病的其他条件，这些条件部分地模仿了所用生物标记物的种群分布内的疾病状态。在某些情况下，此非疾病“MIMIC”状态能够导致相关性分析的假阳性结果。针对这种假阳性结果的解决方案是创建与非疾病或疾病分析完全不同的新的相关性分析。该新的相关性分析优选地使用与非疾病或疾病相关性完全相同的生物标记物测量数据，或者其可以使用一些或全部不同的生物标记物。这种新的相关性分析提供了“非疾病MIMIC”或“疾病”的结果，或者至少产生允许对患者的真实状态做出判断的评分。非疾病或疾病分析的不确定或接近转变评分连同非疾病MIMIC或疾病相关性中的非常低或非常高的评分，能够帮助医生改善疾病状态判断并减少假阳性评分。

非疾病状态模仿疾病状态的这种情况的一个示例是非恶性情况良性前列腺肥大(BPH)。这种情况通常会表现出高水平的至少一种用于诊断前列腺癌的生物标记物。例如，在患有BHP的以及前列腺癌的男性中，生物标记物前列腺特异性抗原(PSA)升高。表4显示，这种额外的相关性分析方法能够区分BHP和前列腺癌，同样，使用相同的生物标记物但使用不同的训练集模型，能够区分假定处于非疾病状态的男性和已确认患有前列腺癌的疾病状态的男性。在一小部分男性中，非疾病对癌症训练集模型会导致假阳性，但这将由BHP对癌症训练集模型加以区分。在这些情况下，两项评分，一项针对推断的非疾病对癌症，一项针对BHP对癌症，其将帮助医师或其他卫生保健从业者决定接下来的诊断步骤。例如，对于两种模型的总评分(对于CSl或CSq)，其评分均为0至200，“非前列腺癌或前列腺癌”的评分为110，表示癌症阳性的评分较弱，但还要考虑，BPH或癌症的第二个评分30向医师表明BPH而非癌症的可能性很高。医师将使用此添加的信息以及其他医学信息和患者历史记录来决定接下来的诊断步骤。

方法的详细讨论

分析步骤/算法

根据本发明的用于开发分析模型的过程通常遵循以下描述的逻辑路径，如图22所例示的：

在步骤2200，收集患者样本，软件将收集一大批已知的非疾病和疾病患者样本。通常不对样本进行任何其他无关条件(癌症不是恶性的)的筛查，而是进行收集，以使样本集在统计学上看起来像一般群体。

在步骤2202，测量生物标记物浓度，软件使用本领域已知的方法和设备测量生物标记物参数浓度。

在步骤2204，计算每个生物标记物的邻近度评分，软件计算每个生物标记物的邻近度评分曲线并为每个生物标记物设置区域，如图25所示。

在步骤2206，将样本评分为癌症或非癌症，软件运行模型程序以使用空间邻近度相关性方法对样本进行评分。模型使用对于这4个区域都是唯一的压缩或重标准化方程式(请参见下面的方程式1)。

在步骤2208，测试和校正评分，软件测试单个样本的拓扑稳定性，并校正对不一致算法失败的样本。首先，以通常的方式测试所有癌症评分的拓扑稳定性，方法是在所测量的浓度水平上注入正负噪声，计算进行了噪声处理的邻近度评分，并将其应用于主要空间邻近度模型。如果这些进行了噪声处理的癌症评分超出了预定的限制，则将拒绝使用主模型计算出的癌症评分。然后，使用次要模型或不一致模型将测试失败的原始浓度水平转换为新的邻近度评分。然后，将这些失败样本的这些新的邻近度评分应用于空间邻近度相关性模型。然后，以相同的方式用次要模型来测试这些新的癌症评分的稳定性。如果这些样本通过了稳定性测试，则将其报告为已通过不一致模型的分析。如果主要模型和次要模型都不稳定，则样本被报告为不确定。

最后，在步骤2210，软件在训练集模型上输出上述结果以对疾病或非疾病进行分类。

用于乳腺癌验证研究的设备和试剂：测试平台说明

OTraces CDx仪器系统

下文所包含的且对于上文所述的大部分工作的测试数据是在设备上测量的，并且使用了下面提到的试剂。数据在OTraces LFMS系统上处理，或者在某些情况下，计算是在基于PC的软件上完成的。所有计算软件均由OTraces公司编写和验证。对于本领域的普通技术人员而言，很显然，可以使用其他等效的硬件、设备和试剂来获得相似的结果。

CDx仪器系统基于Hamilton MicroLab Starlet系统。它是通过编程定制的，可以将OTraces免疫测定方法转移到Hamilton高速ELISA机器人上。Hamilton公司是一家备受尊敬的公司，在全球范围内销售包括MicroLab Starlet在内的自动化液体处理系统。该单元由Hamilton为OTraces定制，以提供全自动化。OTraces CDx系统包括集成的微孔板清洗器系统和读取器。这两个额外的设备使系统在初始设置后，无需操作员干预即可在一轮中完成测试组中所有五种免疫测定的完整运行。所配置的系统每天将完成40次癌症评分。增强功能包括一次执行一种目标分析物的软件。在完整的测试运行中出现错误时，需要此功能才能重新运行特定的测试。

BC Sera DX测试套件

该测试套件包括执行120个癌症测试评分的所有试剂和一次性设备，包括所有缓冲液、封闭液、洗涤液、抗体和校准物。完全商业化该测试套件所需的增强功能包括添加两个参照样本。这些参照提供了独立的验证，即“盲”测试样本可产生适当的癌症评分。这两个参照被设计为分别产生50和150的邻近度评分。LIMS系统(见下文)QC程序会验证这些参照是否正确，从而验证现场的各个测试运行。测试套件内置于GMP工厂，并已获得CE标志。微量滴定板在出厂时已预涂了捕获抗体和蛋白质封闭溶液。

实验室信息管理系统(LIMS)

当今销售的临床化学系统，例如由Roche和Abbott共同开发的，全部都包括软件提供的图形界面，其足以管理患者数据、控制仪器质量和化学操作、帮助测试样本识别以及介绍测试系统。这些菜单已集成到所提供的化学系统中。OTraces的业务模型是将这些功能包括在位于OTraces美国工厂的OTraces计算机服务器上，并使用云计算通过互联网将CDx仪器整体连接到这些服务器。这产生了几个明显的优点：1)LIMS软件结合了FDA兼容的归档软件，因此来自现场部署的每个CDx系统的所有测试运行的数据都在OTraces服务器上运行。应用来自安装的基础的反馈，输入关键机构关于患者的结果，允许OTraces收集FDA符合性数据以用于基于美国FDA市场的清关文件。2)优选地使用条形码试剂包装，使仪器和LIMS能够连接工厂QC测试的所有QC测试结果。这些数据可以在现场进行测试时实时获得，以进一步验证现场测试结果。3)CDx系统仅运行经过OTraces验证的试剂，因此会使用非OTraces试剂进行测试。该系统是操作员的典型用户界面，其中所有功能实时运行，并且在测试运行完成后即可提供患者报告。

用于开发训练集模型和计算风险评分的分步过程如图23的流程图所示。在本发明的某些实施例中，该过程可以用软件来实现。首先完成训练集模型的构建，由于在分析未知患者样本(称为盲样)时，尚不知道正确的诊断方法，其最终产品可以为这些盲样生成诊断结果。通常，本发明向健康护理提供者提供风险评分，然后该健康护理提供者考虑该评分以及其他患者因素以对给定疾病状态的存在或不存在做出医学判断。

步骤2302到2318概述了创建训练集模型的过程。在步骤2302，软件根据诊断需求定义训练集样本需求，诊断需求可以是由本领域普通技术人员设置的预定标准。例如，这些标准可以是疾病对非疾病状态，更具体地，例如，乳腺癌，将乳腺癌阳性与已知未患有乳腺癌的样本进行比较。

在步骤2304，软件定义要计算的元变量以及要测量的自变量(即生物标记物)。

在步骤2306，软件根据在步骤2302至2304中设置的参数收集训练集样本。在步骤2308，软件为每个训练集样本使用合适的医疗设备来确定测得的自变量和元变量以及与那些结果相关的正确的疾病诊断。在步骤2310，软件为每个训练集样本计算双标记拓扑。在步骤2312，软件为以下各项计算最优的双标记拓扑加权或影响调整：(1)检测不确定度的极限，例如，确定为低于检测的经典极限的样本；(2)极端拓扑不稳定性，例如由第17页倒数第二段中描述的方法并遵循上面的拓扑稳定性讨论来确定。在步骤2314，认为计算已完成，并且冻结了主要训练模型以诊断疾病(例如，癌症)。在步骤2316，软件使用基本不一致相关性建模来构建次要训练模型(例如，参见图10)。在步骤2318，当创建用于诊断疾病状态的次要训练模型时，计算被认为是完成的和冻结的。以这种方式，创建了用于诊断疾病的训练模型集。步骤2320至2338描述了本发明的软件如何使用开发的训练模型来诊断诸如癌症的疾病。在步骤2320，软件使用类似于训练集模型构建中所使用的医疗设备来测量盲样自变量，例如生物标记物。在步骤2322，软件获得或测量并计算每个盲样的元变量数据。在步骤2324，软件使用该数据来计算对于使用主要训练集模型的盲样的初始疾病状态风险评分。在步骤2326，软件确定患者盲样评分的拓扑稳定性。在步骤2328，软件检查评分是否通过拓扑稳定性测试。通过/失败的标准需要确定不稳定性引起的错误有多大，最重要的是评分是否从疾病的阳性转变为阴性，以及从阴性转变成阳性。在步骤2330，如果发现评分通过稳定性测试，则输出和/或发布诊断报告和风险评分。如果评分未通过，则在步骤2332，软件进一步使用上述不一致方法算法(算法II)来计算次要疾病状态风险评分。在步骤2334，软件再次检查评分是否通过拓扑稳定性测试。在步骤2336，如果发现评分通过稳定性测试，则输出和/或发布诊断报告和风险评分。在评分仍未通过的情况下，在步骤2338中，软件准备诊断报告，并且输出和/或发布不确定疾病状态是否存在的结果。

如本文所计算的，邻近度评分具有几个独特的属性。在某些实施例中，蛋白质的平均值被嵌入对数压缩中，作为与该年龄患者的实际测量浓度的比率。本质上，该方法创建了一个具有类似方程式的函数，每个方程式对于例如患者群体的年限都是唯一的。每个未知样本都会获得一个针对样本年龄的唯一方程式。

能够使用包括针对非疾病和疾病的年龄调整平均值和患者实际样本浓度的以下形式的关系：

公式1

邻近度评分＝(K)*ln((C_i/C_(c或h))-(C_h/C_c))²，其中：

K＝比例常数；

C_i＝实际患者分析物的测量浓度；

C_(c或h)＝患者年龄调整后的该患者分析物的浓度；根据患者是否处于非疾病状态或疾病状态来调整该值；

C_h＝患者年龄调整后的非疾病患者分析物的平均浓度；以及

C_c＝患者年龄调整后的疾病患者分析物的平均浓度。

公式1被设计为根据上调分组区域来调整压缩和扩展，如图25所示。上面的邻近度评分公式可以满足此要求；然而，对于本领域技术人员显而易见的是，能够实现该方程的许多其他形式。例如，C_i、C_h和C_c可以是实际浓度，或是与平均值、中值的浓度距离，或是与上述亚组中位数或动态范围边缘的距离。该计算的其他变型如下面的公式2和3所示。

公式2

邻近度评分＝K*ln(((未知样本浓度)/(未知样本年龄的癌症平均值的浓度))-((未知样本年龄的非癌症平均值的浓度)/(在未知样本年龄的癌症平均值浓度)))²。

当未知样本等于未知样本年龄的非癌症平均值时，该方程将产生负无穷(自然对数为零)。如图25所示，实际细节公式将其覆盖为设定值，该值例如是2。换句话说，测试超出预设范围的值，由软件将其重置为预设范围极限的值。

公式3

邻近度评分＝K*ln(((未知样本浓度)/(未知样本年龄的非癌症平均值的浓度))-((未知样本年龄的癌症平均值的浓度)/(未知样本年龄的非癌症平均值浓度)))²。

当未知样本等于未知样本年龄的癌症平均值时，公式3产生的负无穷自然对数为零。当未知样本的浓度高于非癌症与处于未知样本年龄的癌症均值之间的中点浓度(可能是癌症)时，使用方程式的该实施例。在这种情况下，当未知样本的年龄为癌症平均值时，整个方程式将变为正无穷。在实际细节公式中，此无穷大被覆盖为一个设置值，例如18。图25中的图形示出针对所关注的年龄范围的方程组。这些公式分别在图25示出的四个区域中的每个区域上运行。这些区域是：1)低于非疾病群体的平均值；(2)高于非疾病平均值且低于非疾病与疾病平均值之间的导出中点(非疾病/疾病转变)；(3)非疾病/疾病平均值与群体疾病平均值之间的导出中点；(4)高于疾病状态的平均值。注意，这些区域并不表示位于该区域内的样本是疾病状态还是非疾病状态。单个样本的真实诊断可能是其中之一，并且如果“不正确”，可能是由于另一种影响生物标记物的状况所致。我们称其为蛋白质组噪声。这些区域仅表示各个样本与均值之间的关系，并为公式(1)中的示例性压缩或重新标准化提供了基础。注意，每个方程仅代表一个年龄值，整个集合构成多个方程，每个方程代表一个年龄值。当实际浓度恰好等于平均值时，整个方程组旨在将所有年龄的邻近度评分值设置为相同的预定值。显示的年龄是35、50和65。整套设备看起来像函数，每个未知样本年龄都有一个公式。

如上所述示例性地计算邻近度评分(无单位，因此不是浓度或水平)，然后将其用于空间邻近度相关性多维图进行分析。同样，所有分区图均按照群体分布的共同特征标准化；按照：非疾病和疾病的年龄平均值(年龄已调整或未调整)、中位数或分组的动态范围标准化。这些方法能够将预测能力提高5个或更多个百分点。

本发明的系统和方法的前述示例性实施例可以以在联网和非联网硬件上运行的软件来实现。结合图26描述了用于实现本发明的硬件的示例性实施例。在示例性系统2600中，一个或更多个外围设备2610通过网络2630连接到一个或更多个计算机2620。外围设备2610的示例包括智能电话、智能手表、平板电脑、可穿戴电子设备(例如EKG和血压监视器的医疗设备)以及收集本领域已知的生物标记数据的任何其他设备。网络2630可以是例如因特网之类的广域网，或者例如内网之类的局域网。因为网络2630，外围设备2610和计算机2620的物理位置对本发明的功能没有影响。在本文中描述了两种实施方式，并且除非另有说明，否则可以预期外围设备2610和计算机2620可以在相同或不同的物理位置。系统的硬件组件之间的通信可以以许多已知的方式来完成，例如使用网络连接组件，例如调制解调器或以太网适配器。外围设备2610和计算机2620都包括或附接到通信设备。预期通信是通过例如HTTP的行业标准协议来进行的。

每个计算机2620包括中央处理单元2622、存储介质2624、用户输入设备2626和显示器2628。可以使用的计算机示例包括：市售的个人计算机、开源计算设备(例如RaspberryPi)、商用服务器、以及市售的便携式设备(例如智能手机、智能手表、平板电脑)。在一个实施例中，系统的每个外围设备2610和每个计算机2620可以具有与安装在其上的系统有关的软件。在这样的实施例中，生物标记物数据可以本地存储在联网的计算机2620上，或者可替代地，存储在一个或更多个远程服务器2640上，该远程服务器2640可以通过网络2630访问任何联网的计算机2620。在替代的实施例中，软件在外围设备2610上作为应用程序运行。

尽管已经如本文中所描述的那样描述了实施方式的某些特征，但是本领域技术人员会设想许多修改、替换、改变和等同物。因此，应当理解，本发明不限于所公开的特定实施例或布置，而是旨在覆盖在所附权利要求所限定的本发明的范围和精神内的任何改变、改编或修改。本文引用的所有参考文献(包括专利和申请)的公开内容通过引用整体并入本文。

Claims

1.一种用于诊断疾病的计算机实现的方法，包括以下步骤：

(a)接收来自第一患者样本的一个或更多个第一生物标记物的第一组浓度值，其中，所述第一患者样本包括非疾病诊断；

(b)接收来自第二患者样本的一个或更多个第一生物标记物的第二组浓度值，其中，所述第二患者样本包括疾病诊断；

(c)根据第一组浓度值计算第一组邻近度评分，并根据第二组浓度值计算第二组邻近度评分；以及

(d)根据第一组浓度值和第二组浓度值以及第一组邻近度评分值和第二组邻近度评分值，计算第一生物标记物与疾病诊断的相关性，其中所述相关性是简单回归、ROC曲线面积最大化、拓扑稳定性或空间邻近度分析之一。

2.根据权利要求1所述的计算机实现的方法，其中，针对多达五种生物标记物重复步骤(a)-(d)。

3.根据权利要求1所述的计算机实现的方法，其中，所述相关性将简单回归、ROC曲线面积最大化、拓扑稳定性和空间邻近度分析中的两个或更多个进行组合。

4.根据权利要求1所述的计算机实现的方法，其中，所述第一患者样本和所述第二患者样本包括血液样本、尿液样本或组织样本中的至少一种。

5.根据权利要求1所述的计算机实现的方法，其中，诊断的疾病是前列腺癌、乳腺癌、肺癌或卵巢癌之一。

6.根据权利要求5所述的计算机实现的方法，其中，诊断的疾病是基于格里森评分的前列腺癌、乳腺癌、肺癌或卵巢癌的分期。

7.根据权利要求6所述的计算机实现的方法，其中，所述第一患者样本和所述第二患者样本包括癌症分期数据，并且其中，所述癌症分期数据被分类为多个二进制组。

8.根据权利要求7所述的计算机实现的方法，其中，对所述二进制组中的每一个进行评分。

9.根据权利要求1所述的计算机实现的方法，其中，所述生物标记物选自细胞因子的功能组，并且其中细胞因子的功能是以下中的至少三种：促炎、抗炎、抗肿瘤发生、细胞凋亡和血管化。

10.根据权利要求1所述的计算机实现的方法，其中，所述第一生物标记物是VEGF。

11.一种非暂时性计算机可读介质，所述非暂时性计算机可读介质存储有程序，所述程序促使计算机执行包括以下的操作：

(d)根据第一组浓度值和第二组浓度值以及第一组邻近度评分值和第二组邻近度值，计算第一生物标记物与疾病诊断的相关性，其中该相关性是简单回归、ROC曲线面积最大化、拓扑稳定性或空间邻近度分析之一。

12.根据权利要求11所述的非暂时性计算机可读介质，其中，针对多达五种生物标记重复步骤(a)-(d)。

13.根据权利要求11所述的非暂时性计算机可读介质，其中，所述相关性将简单回归、ROC曲线面积最大化、拓扑稳定性和空间邻近度分析中的两个或更多个进行组合。

14.根据权利要求11所述的非暂时性计算机可读介质，其中，所述第一患者样本和所述第二患者样本包括血液样本、尿液样本或组织样本中的至少一种。

15.根据权利要求11所述的非暂时性计算机可读介质，其中，诊断的疾病是前列腺癌、乳腺癌、肺癌或卵巢癌之一。

16.根据权利要求15所述的非暂时性计算机可读介质，其中，诊断的疾病是基于格里森评分的前列腺癌、乳腺癌、肺癌或卵巢癌的分期。

17.根据权利要求16所述的非暂时性计算机可读介质，其中，所述第一患者样本和所述第二患者样本包括癌症分期数据，并且其中，所述癌症分期数据被分类为多个二进制组。

18.根据权利要求7所述的非暂时性计算机可读介质，其中，对所述二进制组中的每一个进行评分。

19.根据权利要求11所述的非暂时性计算机可读介质，其中，所述生物标记物选自细胞因子的功能组，并且其中细胞因子的功能是以下中的至少三种：促炎、抗炎、抗肿瘤发生、细胞凋亡和血管化。

20.根据权利要求11所述的非暂时性计算机可读介质，其中，所述第一生物标记物是VEGF。