CN103415624A

CN103415624A - 胰腺癌生物标记及其用途

Info

Publication number: CN103415624A
Application number: CN2011800494082A
Authority: CN
Inventors: S·A·威廉森; M·里尔-米恩; R·M·奥斯特罗夫
Original assignee: Somalogic Inc
Current assignee: Private Placement Protein Body Operation Co ltd
Priority date: 2010-08-13
Filing date: 2011-08-12
Publication date: 2013-11-27
Anticipated expiration: 2031-08-12
Also published as: JP5931874B2; MX341517B; SG187045A1; AU2015202907B2; EP2603622A4; CA2804857A1; EP2603622A2; MX2013001042A; AU2011289284A1; SG10201710447QA; BR112013003391A2; CA2804857C; KR20130100096A; IL224014A; KR101857462B1; WO2012021795A3; US20140073522A1; US11041866B2; JP2013541697A; US20180045739A1

Abstract

本公开包括用于一般检测和诊断癌症以及具体检测和诊断胰腺癌的生物标记、方法、装置、试剂、系统和试剂盒。在一方面，本公开提供生物标记，其可以单独或在各种组合中使用以一般诊断癌症或具体诊断胰腺癌。在另一方面，本公开提供了诊断个体的胰腺癌的方法，其中所述方法包括在来自个体的生物学样品中检测至少一个生物标记值，所述至少一个生物标记值对应于选自表1提供的生物标记的组的至少一个生物标记，其中基于所述至少一个生物标记值，所述个体分类为患有胰腺癌，或者确定所述个体患有胰腺癌的似然性。在另一方面，本公开提供了一般诊断个体的癌症的方法，其中所述方法包括在来自个体的生物学样品中检测至少一个生物标记值，所述至少一个生物标记值对应于选自表19提供的生物标记的组的至少一个生物标记，其中基于所述至少一个生物标记值，所述个体一般分类为患有癌症，或者确定所述个体患有癌症的似然性。

Description

胰腺癌生物标记及其用途

相关申请

本申请要求于2010年8月13日提交的美国临时申请系列号61/373,687、于2010年12月1日提交的美国临时申请系列号61/418,689、于2011年5月4日提交的美国临时申请系列号61/482,347以及于2011年5月4日提交的美国临时申请系列号61/482,480的权益，这些申请每个整体援引加入本文。

发明领域

本申请一般涉及个体中生物标记的检测和癌症的诊断，并且更具体地涉及用于诊断个体的癌症，更特别是胰腺癌的一种或多种生物标记、方法、装置、试剂、系统和试剂盒。

背景技术

下面的描述提供了本申请相关信息的概述，并非承认任何本文提供的信息或引用的出版物是本申请的现有技术。

胰腺癌是美国癌症相关死亡的第四主要原因。虽然5年生存率仅5％，但是据显示这随着早期手术干预而增加：在20％适合“根治性”切除的个体中，生存率增加至15-20％。在诊断时，超过一半的患者患有远端疾病，而另外25％具有区域传播。这是因为该疾病在其早期阶段出名地难以诊断。约20％患有“可手术”疾病[阶段IIb或更少]的患者进行“根治性”切除，并且5年生存率从低于5％增加至15-20％。

胰腺癌可以起因于胰的外分泌和内分泌部分。在胰腺肿瘤中，95％发展自胰的外分泌部分，包括导管上皮、腺泡细胞、结缔组织和淋巴组织。所有胰腺癌的约75％发生在胰的头部或颈部内，15-20％发生在胰体中，并且5-10％发生在尾部中。

复发可以是局部的(在其开始的相同地方或附近)或远端的(扩散至诸如肝、肺或骨的器官)。当胰腺外分泌癌复发时，其主要用与转移性癌症相同的方式治疗，并且如果患者可以忍受，可能包括化疗。通常，胰腺癌首先转移至区域淋巴结，然后至肝，并且较不常见的，至肺。其还可以直接侵入周围内脏器官，例如十二指肠、胃和结肠，或者通过腹膜扩散转移至腹腔中的任何表面。可以导致腹水，并且这具有不祥预后。胰腺癌可以扩散至皮肤，作为痛性结节转移。胰腺癌罕见地转移至骨。

基于血液的胰腺癌测试的两个临床应用是用于无症状的高风险群体中的临床前诊断以及有症状的群体中的鉴别诊断。这两种指征的临床用途如下文所列。

无症状的高风险群体中的筛选：2010年在美国有估计43,140例胰腺癌新病例和36,800例死亡。遗传、家族史、慢性胰腺炎、吸烟和大量饮酒增加胰腺癌的风险，囊性纤维化也是如此。风险的增加报道为：

吸烟：＜25/天为2x风险，＞25/天为3x风险

酒精：超过3杯/天产生1.6倍风险增加

家族史：与疾病相关的第一程度产生5x增加

患有囊性纤维化的成年：31x风险

BRCA2基因突变10x风险

在有效筛选范式不存在的情况下，在无症状但是有风险的群体中，癌症在症状出现时简单地检测。这可能晚了。早期检测测试的存在会增加适合根治性手术的患者的比例。目前20％早期检测个体中20％的治愈率仅为总群体的4％。如果根治性手术的适用性通过早期检测在无症状的群体中从目前的20％增加，则可治愈的总数会增加，每年拯救的生命的数量也会增加。因为胰腺癌为低流行性疾病，即使在这种高风险群体中，高特异性也是筛选测试的重要属性。低假阳性率对于减少不必要的后续程序所致的费用和减少患者的焦虑极为重要。

有症状的患者中的鉴别诊断。胰腺癌可能难以与良性疾病状况如胰腺炎或胃肠病症区分。原发性外分泌胰腺癌的鉴别诊断包括慢性胰腺炎、胰腺内分泌肿瘤、自身免疫性胰腺炎、淋巴瘤以及各种其他罕见疾病状况。与胰腺癌相关的常见但非特异性症状包括：

腹痛-特别是在放射至背部时

阻塞性黄疸

突然原因不明的糖尿病

体重减轻

厌食、疲劳

恶心、呕吐

急性或慢性胰腺炎

下表示出具有这些相关症状中的至少两种的急诊室和医院出现的患者的数量；第一症状是所列症状中的任一种，而第二症状是表中所列的症状。急诊室数据来自：(http://hcupnet.ahrq.gov/)，而门诊数据来自CDC 2008National Ambulatory Medical Care Survey2006(number8)。

可切除的疾病的灵敏检测对于这种指征的临床应用非常重要。胰腺癌的迅速检测增加可治愈的疾病的诊断机会。胰腺癌的诊断通常通过发现胰内的团块来放射显影进行，所述团块常阻塞胰管或胆道。然而，成像可以是侵入性和昂贵的。确定哪些患者需要包括诊断成像在内的后续的血液测试会有益于患者并简化诊断。

特定疾病状态的生物标记选择包括首先鉴定与对照群体相比在疾病群体中具有可测量和统计上显著的差异的标记用于特定医学应用。生物标记可以包括分泌或脱落(shed)的分子，其与疾病发展或进程平行，并且容易对肿瘤响应而从胰腺癌组织或者从周围组织和循环细胞扩散入血流。鉴定的生物标记或生物标记的集合(set)通常临床上进行验证，或者证实为对其所选的原始预期用途是可靠的指示物。生物标记可以包括小分子、肽、蛋白和核酸。影响生物标记鉴定的一些关键问题包括可用数据的过拟合(over-fitting)及数据偏差。

已使用各种方法来试图鉴定生物标记和诊断疾病。对于基于蛋白的标记，这些方法包括二维电泳、质谱和免疫测定方法。对于核酸标记，这些方法包括mRNA表达谱、微RNA谱、FISH、基因表达系列分析(SAGE)和大规模基因表达阵列。

二维电泳的应用由于以下问题而受限：低检测灵敏度；与蛋白溶解性、电荷及疏水性相关的问题；凝胶再现性；以及单个斑点代表多种蛋白的可能性。对于质谱，取决于所用形式，限制围绕样品加工和分离、对低丰度蛋白的灵敏性、信噪比考虑以及不能立即鉴定检测的蛋白而出现。免疫测定方法发现生物标记的限制集中在基于抗体的多重测定不能测量大量分析物。可以简单地印刷高质量抗体的阵列，并且无需夹心而测量与这些抗体结合的分析物。(这会是使用全基因组核酸序列通过杂交测量有机体或细胞中的全部DNA或RNA序列的方式上的等同物。因为杂交可以是同一性的严紧测试，所以杂交实验可行。甚至非常好的抗体在选择它们的结合配偶体中也并非足够严紧来在血液或甚至是细胞提取物环境中工作，因为那些基质中的蛋白总体(ensemble)具有极其不同的丰度。)因此，必须使用不同的基于免疫测定的方法以发现生物标记-需要使用多重ELISA测定(即夹心)以获得足够严紧性来同时测量许多分析物，从而决定哪些分析物的确是生物标记。夹心免疫测定不放大至高含量，因此使用标准阵列形式不能用严紧夹心免疫测定发现生物标记。最后，抗体试剂产生相当大的批次差异和试剂不稳定性。本发明的蛋白生物标记发现平台克服了这个问题。

许多这些方法依赖或需要在分析前一些类型的样品的分级。因此进行设计为在一系列良好限定的样品群体中鉴定和发现统计学相关生物标记的足够有效的研究所需的样品制备是极其困难、昂贵和耗时的。在分级期间，大范围的变异性可以被引入各种样品。例如，一种潜在的标记可能对于方法是不稳定的，标记的浓度可能变化，不合适的聚集或解聚可能发生，无意的样品污染可能发生，并因此掩盖预期的早期疾病中的微小变化。

广泛接受的是使用这些技术的生物标记发现和检测方法对于鉴定诊断性生物标记具有严重限制。这些限制包括不能检测低丰度生物标记，不能持续覆盖蛋白质组的完整动态范围，样品加工和分级中的不可再现性，以及方法的整体不可再现性和缺乏稳健性(robustness)。另外，这些研究在数据中引入了偏差，针对鉴定和验证靶疾病群体内的生物标记所需的分布和随机化方面，没有充分解决包括适当对照在内的样品群体的复杂性。

尽管旨在发现新的和有效的生物标记的努力已进行了几十年，但是这些努力大部分是不成功的。针对各种疾病的生物标记通常在学术性实验室中鉴定，通常通过进行一些疾病过程的基础研究时偶然发现。基于所述发现和少量临床数据，发表的论文提示鉴定了新的生物标记。然而大多数这些建议的生物标记未证实是真实或有用的生物标记，这主要是因为测试的少量临床样品对于已确实发现有效的生物标记仅提供弱统计学证据。也就是说，最初的鉴定对于统计学的基本元素是不严格的。在1994-2003年的每一年中，检索科学文献显示公开了上千篇关于生物标记的参考文献。然而，在同时期内，FDA一年最多批准3种新蛋白生物标记的诊断应用，并且在若干年中没有批准新的蛋白生物标记。

基于失败的生物标记发现努力的历史，已建议了数学理论以进一步促进通常理解，即针对疾病的生物标记很少且难以发现。基于2D凝胶或质谱的生物标记研究支持这些观点。通过这些方法鉴定了非常少的有用生物标记。然而，通常忽视2D凝胶和质谱测量血液中存在的约1nM或更高浓度的蛋白，这种蛋白的总体很可能是最不可能随疾病变化的。除了本发明的生物标记发现平台，尚不存在能够精确测量低得多的浓度的蛋白表达水平的蛋白质组生物标记发现平台。

关于复杂的人生物学的生物化学途径已知许多。许多生物化学途径以在病理学内局部发挥作用的分泌的蛋白达到顶点或开始，例如分泌生长因子以刺激病理学中其他细胞的复制，以及分泌其他因子以避开免疫系统等。尽管许多这些分泌的蛋白以旁分泌方式发挥作用，但是一些在身体的远端运行。具有生物化学途径基本了解的本领域技术人员会理解，许多病理学特异性蛋白应当以低于(甚至远低于)2D凝胶和质谱检测极限的浓度存在于血液中。在这种相对丰富数目的疾病生物标记的鉴定之前必须有一种蛋白质组平台，其可以分析低于2D凝胶或质谱可以检测的浓度的蛋白。

因此，亟需生物标记、方法、装置、试剂、系统和试剂盒，其允许(a)区分胰腺癌与良性疾病状况；(b)筛选胰腺癌的无症状的高风险个体；(c)检测胰腺癌生物标记；以及(d)诊断胰腺癌。

发明概述

本申请包括用于检测和诊断癌症，更特别是胰腺癌的生物标记、方法、试剂、装置、系统和试剂盒。本申请的生物标记使用实施例1详述的基于多重适配体的测定来鉴定。通过使用本文所述的基于适配体的生物标记鉴定方法，本申请描述了可用于检测和诊断胰腺癌的惊人的大量胰腺癌生物标记以及可用于检测和诊断更一般的癌症的大量癌症生物标记。在鉴定这些生物标记中，测量了来自数百个个体样品的超过800种蛋白，其中一些的浓度在低毫微微摩尔(femtomolar)范围。这比用2D凝胶和/或质谱进行的生物标记发现实验低约4个数量级。

尽管某些所述胰腺癌生物标记可单独用于检测和诊断胰腺癌，但是本文所述的方法用于分组用作一组生物标记的胰腺癌生物标记的多个子集。一旦鉴定了单独的生物标记或生物标记的子集，则个体中胰腺癌的检测或诊断可以使用能够测量生物学样品中所选生物标记或多种生物标记的水平差异的任何测定平台或形式来完成。

然而，仅仅通过使用本文所述的基于适配体的生物标记鉴定方法，其中超过800个单独的潜在生物标记值从先前已经诊断为患有或不患有胰腺癌的大量个体中逐个进行了筛选，才可能鉴定本文公开的胰腺癌生物标记。这种发现方法与从条件培养基或裂解的细胞发现生物标记截然相反，因为其询问无需翻译为人病理学的更加患者相关的系统。

因此，本申请一方面提供一种或多种生物标记以用于单独或以各种组合来诊断胰腺癌，或者允许鉴别诊断胰腺癌与良性胃肠(GI)疾病状况如急性或慢性胰腺炎(或两者)、胰腺梗阻、GERD、胆石或后来发现为良性的异常成像。示例性实施方案包括表1第2列提供的生物标记，如上所述，这些生物标记用实施例1中一般描述并在实施例2中更具体描述的基于多重适配体的测定鉴定。表1提供的标记可用于诊断高风险的无症状的群体中的胰腺癌以及区分急性或慢性胰腺炎(或两者)、胰腺梗阻、GERD、胆石或后来发现为良性的异常成像与胰腺癌。

尽管某些所述胰腺癌生物标记可以单独用于检测和诊断胰腺癌，但是本文所述的方法还用于分组胰腺癌生物标记的多个子集，其各自可用作两个或更多个生物标记的组。因此，本申请的各个实施方案提供了包含N个生物标记的组合，其中N是至少2个生物标记。在其他实施方案中，N选自2-65个生物标记中的任意数。

仍然在其他实施方案中，N选自2-7、2-10、2-15、2-20、2-25、2-30、2-35、2-40、2-45、2-50、2-55或2-65中的任意数。在其他实施方案中，N选自3-7、3-10、3-15、3-20、3-25、3-30、3-35、3-40、3-45、3-50、3-55或3-65中的任意数。在其他实施方案中，N选自4-7、4-10、4-15、4-20、4-25、4-30、4-35、4-40、4-45、4-50、4-55或4-65中的任意数。在其他实施方案中，N选自5-7、5-10、5-15、5-20、5-25、5-30、5-35、5-40、5-45、5-50、5-55或5-65中的任意数。在其他实施方案中，N选自6-10、6-15、6-20、6-25、6-30、6-35、6-40、6-45、6-50、6-55或6-65中的任意数。在其他实施方案中，N选自7-10、7-15、7-20、7-25、7-30、7-35、7-40、7-45、7-50、7-55或7-65中的任意数。在其他实施方案中，N选自8-10、8-15、8-20、8-25、8-30、8-35、8-40、8-45、8-50、8-55或8-65中的任意数。在其他实施方案中，N选自9-15、9-20、9-25、9-30、9-35、9-40、9-45、9-50、9-55或9-65中的任意数。在其他实施方案中，N选自10-15、10-20、10-25、10-30、10-35、10-40、10-45、10-50、10-55或10-65中的任意数。应当理解N可以选自包含类似但更高级(order)的范围。

在另一方面，本发明提供了一种诊断个体的胰腺癌的方法，所述方法包括在来自个体的生物学样品中检测至少一个生物标记值，所述至少一个生物标记值对应于选自表1第2列提供的生物标记的组的至少一个生物标记，其中所述个体基于所述至少一个生物标记值分类为患有胰腺癌。

在另一方面，本发明提供了一种诊断个体的胰腺癌的方法，所述方法包括在来自个体的生物学样品中检测生物标记值，所述生物标记值每个对应于选自表1第2列所列的生物标记的组的至少N个生物标记之一，其中基于所述生物标记值确定所述个体患有胰腺癌的似然性(likelihood)。

在另一方面，本发明提供了一种诊断个体的胰腺癌的方法，所述方法包括在来自个体的生物学样品中检测生物标记值，所述生物标记值每个对应于选自表1第2列所列的生物标记的组的至少N个生物标记之一，其中基于所述生物标记值将所述个体分类为患有胰腺癌，并且其中N＝2-10。

在另一方面，本发明提供了一种诊断个体的胰腺癌的方法，所述方法包括在来自个体的生物学样品中检测生物标记值，所述生物标记值每个对应于选自表1第2列所列的生物标记的组的至少N个生物标记之一，其中基于所述生物标记值确定所述个体患有胰腺癌的似然性，并且其中N＝2-10。

在另一方面，本发明提供了一种诊断个体不患有胰腺癌的方法，所述方法包括在来自个体的生物学样品中检测至少一个生物标记值，所述至少一个生物标记值对应于选自表1第2列所列的生物标记的组的至少一个生物标记，其中基于所述至少一个生物标记值将所述个体分类为不患有胰腺癌。

在另一方面，本发明提供了一种诊断个体不患有胰腺癌的方法，所述方法包括在来自个体的生物学样品中检测生物标记值，所述生物标记值每个对应于选自表1第2列所列的生物标记的组的至少N个生物标记之一，其中基于所述生物标记值将所述个体分类为不患有胰腺癌，并且其中N＝2-10。

在另一方面，本发明提供了一种诊断胰腺癌的方法，所述方法包括在来自个体的生物学样品中检测生物标记值，所述生物标记值每个对应于一组N个生物标记中的生物标记，其中所述生物标记选自表1第2列所列的生物标记的组，其中所述生物标记值的分类指示所述个体患有胰腺癌，并且其中N＝3-10。

在另一方面，本发明提供了一种诊断胰腺癌的方法，所述方法包括在来自个体的生物学样品中检测生物标记值，所述生物标记值每个对应于一组生物标记中的生物标记，所述一组生物标记选自表2-11所列的生物标记的组，其中所述生物标记值的分类指示所述个体患有胰腺癌。

在另一方面，本发明提供了一种诊断胰腺癌不存在的方法，所述方法包括在来自个体的生物学样品中检测生物标记值，所述生物标记值每个对应于一组N个生物标记中的生物标记，其中所述生物标记选自表1第2列所列的生物标记的组，其中所述生物标记值的分类指示所述个体中不存在胰腺癌，并且其中N＝3-10。

在另一方面，本发明提供了一种诊断不存在胰腺癌的方法，所述方法包括在来自个体的生物学样品中检测生物标记值，所述生物标记值每个对应于一组生物标记中的生物标记，所述一组生物标记选自表2-11提供的生物标记的组，其中所述生物标记值的分类指示所述个体中不存在胰腺癌。

在另一方面，本发明提供了一种诊断个体的胰腺癌的方法，所述方法包括在来自个体的生物学样品中检测生物标记值，所述生物标记值对应于选自表1第2列所列的生物标记的组的至少N个生物标记之一，其中基于偏离预定阈值的分类评分将所述个体分类为患有胰腺癌，并且其中N＝2-10。

在另一方面，本发明提供了一种诊断个体中不存在胰腺癌的方法，所述方法包括在来自个体的生物学样品中检测生物标记值，所述生物标记值对应于选自表1第2列所列的生物标记的组的至少N个生物标记之一，其中基于偏离预定阈值的分类评分将所述个体分类为不患有胰腺癌，并且其中N＝2-10。

在另一方面，本发明提供了一种指示胰腺癌的似然性的计算机执行方法。所述方法包括：在计算机上检索个体的生物标记信息，其中所述生物标记信息包括生物标记值，所述生物标记值每个对应于选自表1第2列所列的生物标记的组的至少N个生物标记之一，其中N如上定义；用计算机对每个所述生物标记值进行分类；以及基于多个分类指示所述个体患有胰腺癌的似然性。

在另一方面，本发明提供了一种将个体分类为患有或不患有胰腺癌的计算机执行方法。所述方法包括：在计算机上检索个体的生物标记信息，其中所述生物标记信息包括生物标记值，所述生物标记值每个对应于选自表1第2列提供的生物标记的组的至少N个生物标记之一；用计算机对每个所述生物标记值进行分类；以及基于多个分类指示所述个体是否患有胰腺癌。

在另一方面，本发明提供了一种指示胰腺癌的似然性的计算机程序产品。所述计算机程序产品包括包含程序代码的计算机可读取介质，所述程序代码可由计算装置或系统的处理器执行，所述程序代码包括：检索归因于来自个体的生物学样品的数据的代码，其中所述数据包括生物标记值，所述生物标记值每个对应于所述生物学样品中选自表1第2列所列的生物标记的组的至少N个生物标记之一，其中N如上定义；以及执行分类方法的代码，所述分类方法将所述个体患有胰腺癌的似然性指示为所述生物标记值的函数。

在另一方面，本发明提供了一种指示个体的胰腺癌状态的计算机程序产品。所述计算机程序产品包括包含程序代码的计算机可读取介质，所述程序代码可由计算装置或系统的处理器执行，所述程序代码包括：检索归因于来自个体的生物学样品的数据的代码，其中所述数据包括生物标记值，所述生物标记值每个对应于所述生物学样品中选自表1第2列提供的生物标记的组的至少N个生物标记之一；以及执行分类方法的代码，所述分类方法将所述个体的胰腺癌状态指示为所述生物标记值的函数。

在另一方面，本发明提供了一种指示胰腺癌的似然性的计算机执行方法。所述方法包括：在计算机上检索个体的生物标记信息，其中所述生物标记信息包括生物标记值，所述生物标记值对应于选自表1第2列所列的生物标记的组的生物标记；用计算机对所述生物标记值进行分类；以及基于所述分类指示所述个体患有胰腺癌的似然性。

在另一方面，本发明提供了一种将个体分类为患有或不患有胰腺癌的计算机执行方法。所述方法包括：从计算机检索个体的生物标记信息，其中所述生物标记信息包括生物标记值，所述生物标记值对应于选自表1第2列提供的生物标记的组的生物标记；用计算机对所述生物标记值进行分类；以及基于所述分类指示所述个体是否患有胰腺癌。

在另一方面，本发明提供了一种指示胰腺癌的似然性的计算机程序产品。所述计算机程序产品包括包含程序代码的计算机可读取介质，所述程序代码可由计算装置或系统的处理器执行，所述程序代码包括：检索归因于来自个体的生物学样品的数据的代码，其中所述数据包括生物标记值，所述生物标记值对应于所述生物学样品中选自表1第2列所列的生物标记的组的生物标记；以及执行分类方法的代码，所述分类方法将所述个体患有胰腺癌的似然性指示为所述生物标记值的函数。

在另一方面，本发明提供了一种指示个体的胰腺癌状态的计算机程序产品。所述计算机程序产品包括包含程序代码的计算机可读取介质，所述程序代码可由计算装置或系统的处理器执行，所述程序代码包括：检索归因于来自个体的生物学样品的数据的代码，其中所述数据包括生物标记值，所述生物标记值对应于所述生物学样品中选自表1第2列提供的生物标记的组的生物标记；以及执行分类方法的代码，所述分类方法将所述个体的胰腺癌状态指示为所述生物标记值的函数。

尽管某些所述癌症生物标记可单独用于检测和诊断癌症，但是本文所述的方法用于分组用作一组生物标记的癌症生物标记的多个子集。一旦鉴定了单独的生物标记或生物标记的子集，则个体中癌症的检测或诊断可以使用能够测量生物学样品中所选生物标记或多种生物标记的水平差异的任何测定平台或形式来完成。

然而，仅仅通过使用本文所述的基于适配体的生物标记鉴定方法，其中超过800个单独的潜在生物标记值从先前已经诊断为患有或不患有癌症的大量个体中逐个进行了筛选，才可能鉴定本文公开的癌症生物标记。这种发现方法与从条件培养基或裂解的细胞发现生物标记截然相反，因为其询问无需翻译为人病理学的更加患者相关的系统。

因此，在本发明的一方面，提供了一种或多种生物标记用于单独或在各种组合中使用以诊断癌症。示例性实施方案包括表19提供的生物标记，这些生物标记用实施例1中一般描述并在实施例7中更具体描述的基于多重适配体的测定鉴定。表19提供的标记可用于区分患有癌症的个体与不患有癌症的个体。

虽然某些所述癌症生物标记可以单独用于检测和诊断癌症，但是本文所述的方法还用于分组癌症生物标记的多个子集，其各自用作三个或更多个生物标记的组。因此，本申请的各个实施方案提供了包含N个生物标记的组合，其中N是至少三个生物标记。在其他实施方案中，N选自3-65个生物标记中的任意数。

在其他实施方案中，N选自3-7、3-10、3-15、3-20、3-25、3-30、3-35、3-40、3-45、3-50、3-55、3-60或3-65中的任意数。在其他实施方案中，N选自4-7、4-10、4-15、4-20、4-25、4-30、4-35、4-40、4-45、4-50、4-55、4-60或4-65中的任意数。在其他实施方案中，N选自5-7、5-10、5-15、5-20、5-25、5-30、5-35、5-40、5-45、5-50、5-55、5-60或5-65中的任意数。在其他实施方案中，N选自6-10、6-15、6-20、6-25、6-30、6-35、6-40、6-45、6-50、6-55、6-60或6-65中的任意数。在其他实施方案中，N选自7-10、7-15、7-20、7-25、7-30、7-35、7-40、7-45、7-50、7-55、7-60或7-65中的任意数。在其他实施方案中，N选自8-10、8-15、8-20、8-25、8-30、8-35、8-40、8-45、8-50、8-55、8-60或8-65中的任意数。在其他实施方案中，N选自9-15、9-20、9-25、9-30、9-35、9-40、9-45、9-50、9-55、9-60或9-65中的任意数。在其他实施方案中，N选自10-15、10-20、10-25、10-30、10-35、10-40、10-45、10-50、10-55、10-60或10-65中的任意数。应当理解N可以选自包含类似但更高级的范围。

在另一方面，本发明提供了一种诊断个体的癌症的方法，所述方法包括在来自个体的生物学样品中检测至少一个生物标记值，所述至少一个生物标记值对应于选自表19提供的生物标记的组的至少一个生物标记，其中基于所述至少一个生物标记值就所述个体分类为患有癌症。

在另一方面，本发明提供了一种诊断个体的癌症的方法，所述方法包括在来自个体的生物学样品中检测生物标记值，所述生物标记值每个对应于选自表19所列的生物标记的组的至少N个生物标记之一，其中基于所述生物标记值确定所述个体患有癌症的似然性。

在另一方面，本发明提供了一种诊断个体的癌症的方法，所述方法包括在来自个体的生物学样品中检测生物标记值，所述生物标记值每个对应于选自表19所列的生物标记的组的至少N个生物标记之一，其中基于所述生物标记值将所述个体分类为患有癌症，并且其中N＝3-10。

在另一方面，本发明提供了一种诊断个体的癌症的方法，所述方法包括在来自个体的生物学样品中检测生物标记值，所述生物标记值每个对应于选自表19所列的生物标记的组的至少N个生物标记之一，其中所述个体患有癌症的似然性基于所述生物标记值来确定，并且其中N＝3-10。

在另一方面，本发明提供了一种诊断个体不患有癌症的方法，所述方法包括在来自个体的生物学样品中检测至少一个生物标记值，所述至少一个生物标记值对应于选自表19所列的生物标记的组的至少一个生物标记，其中基于所述至少一个生物标记值将所述个体分类为不患有癌症。

在另一方面，本发明提供了一种诊断个体不患有癌症的方法，所述方法包括在来自个体的生物学样品中检测生物标记值，所述生物标记值每个对应于选自表19所列的生物标记的组的至少N个生物标记之一，其中基于所述生物标记值将所述个体分类为不患有癌症，并且其中N＝3-10。

在另一方面，本发明提供了一种诊断癌症的方法，所述方法包括在来自个体的生物学样品中检测生物标记值，所述生物标记值每个对应于一组N个生物标记中的生物标记，其中所述生物标记选自表19所列的生物标记的组，其中所述生物标记值的分类指示所述个体患有癌症，并且其中N＝3-10。

在另一方面，本发明提供了一种诊断癌症的方法，所述方法包括在来自个体的生物学样品中检测生物标记值，所述生物标记值每个对应于一组生物标记中的生物标记，所述一组生物标记选自表20-29所列的生物标记的组，其中所述生物标记值的分类指示所述个体患有癌症。

在另一方面，本发明提供了一种诊断癌症不存在的方法，所述方法包括在来自个体的生物学样品中检测生物标记值，所述生物标记值每个对应于一组N个生物标记中的生物标记，其中所述生物标记选自表19所列的生物标记的组，其中所述生物标记值的分类指示所述个体中不存在癌症，并且其中N＝3-10。

在另一方面，本发明提供了一种诊断不存在癌症的方法，所述方法包括在来自个体的生物学样品中检测生物标记值，所述生物标记值每个对应于一组生物标记中的生物标记，所述一组生物标记选自表20-29提供的生物标记的组，其中所述生物标记值的分类指示所述个体中不存在癌症。

在另一方面，本发明提供了一种诊断个体的癌症的方法，所述方法包括在来自个体的生物学样品中检测生物标记值，所述生物标记值对应于选自表19所列的生物标记的组的至少N个生物标记之一，其中基于偏离预定阈值的分类评分将所述个体分类为患有癌症，并且其中N＝3-10。

在另一方面，本发明提供了一种诊断个体中不存在癌症的方法，所述方法包括在来自个体的生物学样品中检测生物标记值，所述生物标记值对应于选自表19所列的生物标记的组的至少N个生物标记之一，其中基于偏离预定阈值的分类评分将所述个体分类为不患有癌症，并且其中N＝3-10。

在另一方面，本发明提供了一种指示癌症的似然性的计算机执行方法。所述方法包括：在计算机上检索个体的生物标记信息，其中所述生物标记信息包括生物标记值，所述生物标记值每个对应于选自表19所列的生物标记的组的至少N个生物标记之一，其中N如上定义；用计算机对每个所述生物标记值进行分类；以及基于多个分类指示所述个体患有癌症的似然性。

在另一方面，本发明提供了一种将个体分类为患有或不患有癌症的计算机执行方法。所述方法包括：在计算机上检索个体的生物标记信息，其中所述生物标记信息包括生物标记值，所述生物标记值每个对应于选自表19提供的生物标记的组的至少N个生物标记之一；用计算机对每个所述生物标记值进行分类；以及基于多个分类指示所述个体是否患有癌症。

在另一方面，本发明提供了一种指示癌症的似然性的计算机程序产品。所述计算机程序产品包括包含程序代码的计算机可读取介质，所述程序代码可由计算装置或系统的处理器执行，所述程序代码包括：检索归因于来自个体的生物学样品的数据的代码，其中所述数据包括生物标记值，所述生物标记值每个对应于所述生物学样品中选自表19所列的生物标记的组的至少N个生物标记之一，其中N如上定义；以及执行分类方法的代码，所述分类方法将所述个体患有癌症的似然性指示为所述生物标记值的函数。

在另一方面，本发明提供了一种指示个体的癌症状态的计算机程序产品。所述计算机程序产品包括包含程序代码的计算机可读取介质，所述程序代码可由计算装置或系统的处理器执行，所述程序代码包括：检索归因于来自个体的生物学样品的数据的代码，其中所述数据包括生物标记值，所述生物标记值每个对应于所述生物学样品中选自表19提供的生物标记的组的至少N个生物标记之一；以及执行分类方法的代码，所述分类方法将所述个体的癌症状态指示为所述生物标记值的函数。

在另一方面，本发明提供了一种指示癌症的似然性的计算机执行方法。所述方法包括：在计算机上检索个体的生物标记信息，其中所述生物标记信息包括生物标记值，所述生物标记值对应于选自表19所列的生物标记的组的生物标记；用计算机对所述生物标记值进行分类；以及基于所述分类指示所述个体患有癌症的似然性。

在另一方面，本发明提供了一种将个体分类为患有或不患有癌症的计算机执行方法。所述方法包括：从计算机检索个体的生物标记信息，其中所述生物标记信息包括生物标记值，所述生物标记值对应于选自表19提供的生物标记的组的生物标记；用计算机对所述生物标记值进行分类；以及基于所述分类指示所述个体是否患有癌症。

在另一方面，本发明提供了一种指示癌症的似然性的计算机程序产品。所述计算机程序产品包括包含程序代码的计算机可读取介质，所述程序代码可由计算装置或系统的处理器执行，所述程序代码包括：对归因于来自个体的生物学样品的数据进行检索的代码，其中所述数据包括生物标记值，所述生物标记值对应于所述生物学样品中选自表19所列的生物标记的组的生物标记；以及执行分类方法的代码，所述分类方法将所述个体患有癌症的似然性指示为所述生物标记值的函数。

在另一方面，本发明提供了一种指示个体的癌症状态的计算机程序产品。所述计算机程序产品包括包含程序代码的计算机可读取介质，所述程序代码可由计算装置或系统的处理器执行，所述程序代码包括：检索归因于来自个体的生物学样品的数据的代码，其中所述数据包括生物标记值，所述生物标记值对应于所述生物学样品中选自表19提供的生物标记的组的生物标记；以及执行分类方法的代码，所述分类方法将所述个体的癌症状态指示为所述生物标记值的函数。

在另一方面，本发明提供了一种诊断胰腺癌的方法，所述方法包括在来自个体的生物学样品中除了生物标记值，检测肿瘤标记CA19-9，所述生物标记值每个对应于一组生物标记中的生物标记，所述一组生物标记选自表1所列的生物标记的组，其中组合的CA19-9和生物标记值的分类指示所述个体患有胰腺癌。

附图说明

图1A是检测生物学样品中的胰腺癌的示例方法的流程图。

图1B是用朴素贝叶斯(

Bayes)分类方法检测生物学样品中的胰腺癌的示例方法的流程图。

图2示出单个生物标记CTSB的ROC曲线，其使用用于检测胰腺癌的测试的朴素贝叶斯分类器(classifier)。

图3示出2至10个生物标记的生物标记组的ROC曲线，其使用用于检测胰腺癌的测试的朴素贝叶斯分类器。

图4说明当生物标记的数目从1增加至10时分类评分(AUC)的增加，其使用用于胰腺癌组的朴素贝叶斯分类。

图5示出对于组合的GI和正常对照(实线)和胰腺癌疾病组(虚线)，作为log转化的RFU形式的累积分布函数(cdf)的CTSB的测量的生物标记分布，以及它们的曲线拟合为正态cdf(短划线)，以用于训练(train)朴素贝叶斯分类器。

图6说明与本文所述的各种计算机执行方法一起使用的示例计算机系统。

图7是一实施方案的指示个体患有胰腺癌的似然性的方法的流程图。

图8是一实施方案的指示个体患有胰腺癌的似然性的方法的流程图。

图9说明可以用于检测生物学样品中一个或多个胰腺癌生物标记的示例适配体测定。

图10示出从聚集的潜在生物标记的集合使用哪些生物标记来构建分类器以区分胰腺癌与GI和正常对照的频率的柱状图。

图11A示出一对柱状图，其总结了使用表1所列的生物标记(实线)和随机标记的集合(虚线)的所有可能的单蛋白朴素贝叶斯分类器评分(AUC)。

图11B示出一对柱状图，其总结了使用表1所列的生物标记(实线)和随机标记的集合(虚线)的所有可能的二蛋白蛋白朴素贝叶斯分类器评分(AUC)。

图11C示出一对柱状图，其总结了使用表1所列的生物标记(实线)和随机标记的集合(虚线)的所有可能的三蛋白朴素贝叶斯分类器评分(AUC)。

图12示出使用选自完全组(菱形)的2-10个标记的朴素贝叶斯分类器的AUC，以及通过在分类器产生期间放弃最好的5个、10个和15个标记而获得的评分。

图13示出三个不同分类器的性能：单独CA19-9、SOMAmer组以及SOMAmer和CA19-9的组合。

图14示出CA19-9加上1个(HAMP)或2个(HAMP和CTSB)SOMAmer生物标记的性能。

图15示出10个标记的随机森林分类器(random forest classifier)的性能。

图16A示出一组ROC曲线，其从表14中的数据对1至5个标记的组建模。

图16B示出一组ROC曲线，其从图12A的1至5个标记的组的训练数据计算。

图17A和17B示出通过贪婪选择方法选择的10个生物标记(表19)与10个“非标记”生物标记的1,000个随机样品集合之间性能的比较。表19中10个生物标记的平均AUC显示为虚线垂直线。在图17A中，10个生物标记的集合随机选自未通过贪婪方法选择的所有3个癌症研究中存在的所有10种分析物。在图17B中，使用与17A相同的方法；然而，采样仅限于未通过贪婪方法选择的来自表1的剩余的55个生物标记。

图18示出表19所列的3个朴素贝叶斯分类器的接受者操作特征(ROC)曲线。对于每个研究，曲线下面积(AUC)也在图例旁边示出。

发明详述

现在详细描述本发明的代表性实施方案。虽然本发明结合列举的实施方案进行描述，但是应理解本发明并不限于这些实施方案。相反，本发明旨在涵盖可以包括在如权利要求书所限定的本发明范围内的所有替代、修饰和等价物。

本领域技术人员会知道与本文所述的方法和材料相似或等价的许多方法和材料，其可以使用并在本发明的实践的范围内。本发明不以任何方式限制于所述方法和材料。

除非另有定义，本文所用的技术和科学术语具有本发明所属领域技术人员通常理解的相同含义。尽管与本文所述的方法、装置和材料相似或等价的任何方法、装置和材料可以用于实施或测试本发明，但是现在描述优选的方法、装置和材料。

本申请中引用的所有出版物、公开的专利文件和专利申请指示本申请所属领域的技术水平。本文引用的所有出版物、公开的专利文件和专利申请援引加入本文，与每个单独的出版物、公开的专利文件或专利申请具体地和单独地指明援引加入本文的程度相同。

如在包括所附权利要求书在内的本申请中所用，除非特别说明，单数形式“一个(a)”、“一个(an)”和“这个(the)”包括复数形式，且与“至少一个”和“一个或多个”可互换使用。因此，提及的“一个适配体”包括适配体的混合物，提及的“探针”包括探针的混合物等。

如本文所用，术语“约”表示数值的不明显更改或变化，由此该数值所涉及的项目的基本功能未改变。

如本文所用，术语“包含(comprises)”、“包含(comprising)”、“包括(includes)”、“包括(including)”、“含有(contains)”、“含有(containing)”及它们的任何变体意图覆盖非排他的包含，由此包含、包括或含有一个元件或者一系列元件的过程、方法、方法限定产品或组成(composition of matter)不仅包括这些元件，而且可以包括未明确列举或这样的过程、方法、方法限定产品或组成固有的其他元件。

本申请包括用于检测和诊断胰腺癌和更一般的癌症的生物标记、方法、装置、试剂、系统和试剂盒。

在一方面，本发明提供了一种或多种生物标记，其单独或以各种组合用于诊断胰腺癌，允许鉴别诊断胰腺癌与非恶性GI疾病状况，包括急性或慢性胰腺炎(或两者)、胰腺梗阻、GERD、胆石或后来发现为良性的异常成像，监测胰腺癌复发或者寻址(address)其他临床指征。如下文详细描述，示例性实施方案包括表1第2列提供的生物标记，这些生物标记使用基于多重适配体的测定来鉴定，所述测定在实施例1中一般描述，并且在实施例2中更具体地描述。

表1第2列列出获得自以下分析的发现：来自胰腺癌病例的几百个个体血液样品，以及来自GI和正常对照的几百个等价个体血液样品。GI和正常对照组设计为匹配胰腺癌诊断测试可以具有最大益处的群体，包括无症状的个体和有症状的个体。正常对照组代表具有胰腺癌的高风险的无症状的个体。胰腺癌的高风险包括胰腺癌的家族史、肥胖、吸烟、糖尿病、囊性纤维化、慢性或遗传性胰腺炎、BRCA突变载体、p16突变以及波-杰综合征(Brand E et a1.Gut2007：56：1460)。GI对照组包括非特异性腹部症状如急性或慢性胰腺炎(或两者)、胰腺梗阻、GERD、胆石或者后来发现为良性的异常成像。将来自正常对照的样品与GI对照合并以发现可用于筛选高风险无症状的个体和有症状的个体的鉴别诊断的生物标记。潜在的生物标记在单独的样品而不是在混合疾病和对照血液中测量；这允许更好地理解与疾病(在这种情况下是胰腺癌)的存在和不存在相关的表型中个体和组的变化。由于对每个样品进行823个蛋白测量，并且单独测量来自每个疾病和对照群体的几百个样品，所以表1第2列得自非常大的数据集合的分析。使用本文“生物标记的分类和疾病评分计算”章节中描述的方法分析测量结果。表1第2列列出发现可用于区分得自患有胰腺癌的个体的样品与得自GI和正常对照的样品的65个生物标记。GI对照包括具有急性或慢性胰腺炎(或两者)、胰腺梗阻、GERD、胆石或者后来发现为良性的异常成像的个体。

虽然某些所述胰腺癌生物标记可单独用于检测和诊断胰腺癌，但是本文还描述了胰腺癌生物标记的多个子集的分组方法，其中每个分组或者子集选择可作为一组三个或更多个生物标记使用，这在本文中可互换地称为“生物标记组”和一组。因此，本申请的各个实施方案提供了包含N个生物标记的组合，其中N是至少2个生物标记。在其他实施方案中，N选自2-65个生物标记。

在其他实施方案中，N选自2-7、2-10、2-15、2-20、2-25、2-30、2-35、2-40、2-45、2-50、2-55或2-65中的任意数。在其他实施方案中，N选自3-7、3-10、3-15、3-20、3-25、3-30、3-35、3-40、3-45、3-50、3-55或3-65中的任意数。在其他实施方案中，N选自4-7、4-10、4-15、4-20、4-25、4-30、4-35、4-40、4-45、4-50、4-55或4-65中的任意数。在其他实施方案中，N选自5-7、5-10、5-15、5-20、5-25、5-30、5-35、5-40、5-45、5-50、5-55或5-65中的任意数。在其他实施方案中，N选自6-10、6-15、6-20、6-25、6-30、6-35、6-40、6-45、6-50、6-55或6-65中的任意数。在其他实施方案中，N选自7-10、7-15、7-20、7-25、7-30、7-35、7-40、7-45、7-50、7-55或7-65中的任意数。在其他实施方案中，N选自8-10、8-15、8-20、8-25、8-30、8-35、8-40、8-45、8-50、8-55或8-65中的任意数。在其他实施方案中，N选自9-15、9-20、9-25、9-30、9-35、9-40、9-45、9-50、9-55或9-65中的任意数。在其他实施方案中，N选自10-15、10-20、10-25、10-30、10-35、10-40、10-45、10-50、10-55或10-65中的任意数。应当理解N可以选自包含类似但更高级的范围。

在一实施方案中，可用于生物标记子集或组的生物标记的数目基于生物标记值的特定组合的灵敏性和特异性值。本文所用术语“灵敏性”和“特异性”是关于基于在个体的生物学样品中检测的一个或多个生物标记值来正确分类个体患有胰腺癌或不患有胰腺癌的能力。“灵敏性”指生物标记或多个生物标记关于正确分类患有胰腺癌的个体的性能。“特异性”指生物标记或多个生物标记关于正确分类不患有胰腺癌的个体的性能。例如，用于测试一组对照样品和胰腺癌样品的一组标记的85％特异性和90％灵敏性指85％的对照样品由该组正确分类为对照样品，并且90％的胰腺癌样品由该组正确分类为胰腺癌样品。期望或优选的最小值可以如实施例3所述确定。代表性组如表4-11所示，其示出一系列3-10个生物标记的100个不同的组，其具有所示的每组的特异性和灵敏性水平。这些组的每个中每个标记出现的总数目在每个表的底部示出。

在一方面，在个体中通过以下方法检测或诊断胰腺癌：对来自所述个体的生物学样品进行测定并检测生物标记值，所述生物标记值每个对应于生物标记CTSB、C5a或C5中的至少一个以及选自表1第2列的生物标记列表的至少N个额外的生物标记，其中N等于2、3、4、5、6、7、8或9。在另一方面，在个体中通过以下方法检测或诊断胰腺癌：对来自所述个体的生物学样品进行测定并检测生物标记值，所述生物标记值每个对应于生物标记CTSB、C5a或C5以及选自表1第2列的生物标记列表的至少N个额外的生物标记之一，其中N等于1、2、3、4、5、6或7。在另一方面，在个体中通过以下方法检测或诊断胰腺癌：对来自所述个体的生物学样品进行测定并检测生物标记值，所述生物标记值每个对应于生物标记CTSB以及选自表1第2列的生物标记列表的至少N个额外的生物标记之一，其中N等于2、3、4、5、6、7、8或9。在另一方面，在个体中通过以下方法检测或诊断胰腺癌：对来自所述个体的生物学样品进行测定并检测生物标记值，所述生物标记值每个对应于生物标记C5a以及选自表1第2列的生物标记列表的至少N个额外的生物标记之一，其中N等于2、3、4、5、6、7、8或9。在另一方面，在个体中通过以下方法检测或诊断胰腺癌：对来自所述个体的生物学样品进行测定并检测生物标记值，所述生物标记值每个对应于生物标记C5以及选自表1第2列的生物标记列表的至少N个额外的生物标记之一，其中N等于2、3、4、5、6、7、8或9。

本文鉴定的胰腺癌生物标记表示较大数目的可以用于有效检测或诊断胰腺癌的生物标记的子集或组的选择。期望数目的这类生物标记的选择取决于所选生物标记的特定组合。重要的是记住：用于检测或诊断胰腺癌的生物标记的组还可以包括在表1第2列中未发现的生物标记，并且包括在表1第2列中未发现的额外的生物标记可以减少选自表1第2列的特定子集或组中的生物标记的数目。如果额外的生物医学信息与生物标记值联合用于建立对于给定测定可接受的灵敏性和特异性值，则用于子集或组的来自表1第2列的生物标记的数目也可以减少。

可以影响用于生物标记的子集或组的生物标记数目的另一因素是用于从进行胰腺癌诊断的个体中获得生物学样品的方法。在精心控制的样品获取环境中，满足期望的灵敏性和特异性值所必需的生物标记的数目会低于在样品收集、处理和贮存中可以存在更多变化的情况中的数目。在研究表1第2列所列的生物标记列表中，利用多个样品收集位点来收集数据以进行分类器训练。这提供了更稳健的生物标记，其对于样品收集、处理和贮存中的变化较不敏感，但是如果训练数据全部在非常相似的条件下获得，则还可以要求子集或组中更大的生物标记数目。

本申请的一方面可以参考图1A和1B来一般性描述。生物学样品获得自所关注的一个或多个个体。然后测定该生物学样品以检测所关注的一个或多个(N个)生物标记的存在，并且确定所述N个生物标记的每一个的生物标记值(在图1B中称为标记RFU)。一旦检测生物标记并指定生物标记值，则如本文详细描述地对每个标记进行评分或者分类。然后组合标记评分以提供总诊断评分，其表示获取样品的个体患有胰腺癌的似然性。

“生物学样品”、“样品”和“测试样品”在本文中可互换使用，指获得自或以另外的方式源自个体的任何材料、生物液体、组织或者细胞。这包括血液(包括全血、白细胞、外周血单核细胞、血沉棕黄层(buffy coat)、血浆和血清)、痰、泪液、粘液、洗鼻液(wash)、鼻抽吸物(aspirate)、呼吸物(breath)、尿、精液、唾液、腹腔灌洗液、腹水、囊液、脑膜液(meningealfluid)、羊水、腺体液(glandular fluid)、胰液、淋巴液、胸膜液、乳头抽吸物、支气管抽吸物、支气管刷检(brushing)、滑液、关节抽吸物、器官分泌物、细胞、细胞提取物和脑脊液。其还包括上述所有材料的实验分离级分。例如，血液样品可以分级分离为血清、血浆或者含有诸如红细胞或白细胞(white blood cell)(白细胞(leukocyte))的特定类型血细胞的级分。如果需要，样品可以是来自个体的样品的组合，如组织与液体样品的组合。术语“生物学样品”还包括含有均质固体材料的材料，如来自粪便样品、组织样品或组织活检样品的材料。术语“生物学样品”还包括源自组织培养或者细胞培养的材料。可以采用获得生物学样品的任何合适方法；示例性方法包括如静脉切开放血术、拭子(如口腔拭子)以及细针抽吸活检方法。易受细针抽吸影响的示例性组织包括淋巴结、肺、肺洗液、BAL(支气管肺泡灌洗液)、甲状腺、乳腺、胰和肝。样品还可以通过显微切割(如激光捕获显微切割(LCM)或激光显微切割(LMD))、膀胱冲洗、涂片(如PAP涂片)或导管灌洗收集。获得自或源自个体的“生物学样品”包括在获得自所述个体之后已经通过任何合适方式处理的任何此类样品。

此外，应当认识到生物学样品可以通过从许多个体中取得生物学样品并将它们混合或混合每个个体的生物学样品的等份而获得。混合的样品可以作为来自单个个体的样品进行处理，并且如果在混合的样品中确定癌症的存在，则可以将每个个体的生物学样品再进行测试以确定哪个/哪些个体患有胰腺癌。

为了本说明书的目的，短语“归因于来自个体的生物学样品的数据”指所述数据以某种形式源自所述个体的生物学样品或利用所述个体的生物学样品产生。数据在产生后可以被重新格式化、修改或以数学方式改变至某种程度，例如通过从一种测量系统中的单位转变为另一测量系统中的单位；但是应当理解，数据源自所述生物学样品或利用所述生物学样品产生。

“靶标”、“靶分子”和“分析物”在本文中可互换使用，指可能存在于生物学样品中的任何所关注的分子。“所关注的分子”包括特定分子的任何微小变化，如在蛋白的情况下，例如氨基酸序列的微小变化、二硫键形成、糖基化、脂质化、乙酰化、磷酸化或者任何其他操作或修饰，如与基本不改变分子同一性的标记组分偶联。“靶分子”、“靶标”或“分析物”是一种类型或种类的分子或多分子结构的一组拷贝。“靶分子”、“靶标”和“分析物”指一组以上这样的分子。示例性靶分子包括蛋白、多肽、核酸、碳水化合物、脂质、多糖、糖蛋白、激素、受体、抗原、抗体、affybodies、抗体模拟物(mimic)、病毒、病原体、毒性物质、底物、代谢物、过渡态类似物、辅因子、抑制剂、药物、染料、营养素、生长因子、细胞、组织以及前述任何物质的任何片段或部分。

如本文所用，“多肽”、“肽”和“蛋白”在本文中可互换使用，指任何长度的氨基酸聚合物。聚合物可以是线性或支化的，其可以包含修饰的氨基酸，并且其可以被非氨基酸中断。该术语还涵盖已经被天然修饰或者通过干预修饰的氨基酸聚合物；例如，二硫键形成、糖基化、脂质化、乙酰化、磷酸化或任何其他操作或修饰，如与标记组分偶联。该定义还包括例如含有一个或多个氨基酸类似物(包括例如非天然氨基酸等)以及本领域已知的其他修饰的多肽。多肽可以是单链或缔合(associated)链。该定义还包括前蛋白和完整的成熟蛋白；衍生自成熟蛋白的肽或多肽；蛋白的片段；剪接变体；蛋白的重组形式；具有氨基酸修饰、缺失或取代的蛋白变体；消化；以及翻译后修饰，如糖基化、乙酰化、磷酸化等。

如本文所用，“标记”和“生物标记”可互换使用，指指示个体中正常或异常过程或者个体中疾病或其他疾病状况的迹象或者是个体中正常或异常过程或者个体中疾病或其他疾病状况的迹象的靶分子。更具体地，“标记”或“生物标记”是与无论正常与否的特定生理状态或过程的存在相关的解剖学、生理学、生物化学或分子参数，并且如果是异常的，则无论是慢性或急性的。生物标记可以通过各种方法检测和测量，包括实验室测定和医学成像。当生物标记是蛋白时，还可以使用相应基因的表达作为生物学样品中相应蛋白生物标记的量或存在或不存在或者编码该生物标记的基因或控制该生物标记表达的蛋白的甲基化状态的替代测量。

如本文所用，“生物标记值”、“值”、“生物标记水平”和“水平”可互换使用，指使用任何分析方法来检测生物学样品中的生物标记而进行的测量，其示出所述生物学样品中的生物标记、对于所述生物标记或对应于所述生物标记的存在、不存在、绝对量或浓度、相对量或浓度、效价、水平、表达水平、测量水平的比率等。所述“值”或“水平”的确切性质取决于用于检测生物标记的特定分析方法的具体设计和组分。

当生物标记表示个体中异常过程或疾病或其他疾病状况或者是个体中异常过程或疾病或其他疾病状况的迹象时，该生物标记通常描述为与表示个体中正常过程或不存在疾病或其他疾病状况或者是个体中正常过程或不存在疾病或其他疾病状况的迹象的生物标记的表达水平或值相比时是过表达或低表达的。“上调”、“上调的”、“过表达”、“过表达的”及其任何变体可互换使用，指生物学样品中生物标记的值或水平高于通常在来自健康或正常个体的相似生物学样品中检测的所述生物标记的值或水平(或者值或水平的范围)。该术语还可以指生物学样品中生物标记的值或水平高于在特定疾病的不同阶段检测的生物标记的值或水平(或者值或水平的范围)。

“下调”、“下调的”、“低表达”或“低表达的”及其任何变体可互换使用，指生物学样品中生物标记的值或水平低于通常在来自健康或正常个体的相似生物学样品中检测的生物标记的值或水平(或者值或水平的范围)。该术语还可以指生物学样品中生物标记的值或水平低于在特定疾病的不同阶段检测的所述生物标记的值或水平(或者值或水平的范围)。

此外，过表达的或低表达的生物标记还可以指与所述生物标记的“正常”表达水平或值相比是“差异表达的”或者具有“不同水平”或“不同值”，所述“正常”表达水平或值表示个体中正常过程或不存在疾病或其他疾病状况或者是个体中正常过程或不存在疾病或其他疾病状况的迹象。因此，生物标记的“差异表达”还可以指与所述生物标记的“正常”表达水平不同。

术语“不同的基因表达”和“差异表达”可互换使用，指在患有指定疾病的对象中基因(或其相应的蛋白表达产物)的表达被激活至相对于其在正常或对照对象中的表达较高或较低的水平。该术语还包括基因(或其相应的蛋白表达产物)的表达在相同疾病的不同阶段被激活至较高或较低水平。还应当理解差异表达的基因可以在核酸水平或蛋白水平激活或抑制，或者可以进行可变剪接以获得不同的多肽产物。这样的差异可以通过许多改变来证实，包括多肽的mRNA水平、表面表达、分泌或其他分配(partitioning)。不同的基因表达可以包括比较两个或更多个基因或者它们的基因产物之间的表达；或者比较两个或更多个基因或者它们的基因产物之间的表达的比率；或者甚至比较相同基因的两种不同加工的产物，其在正常对象与患病对象之间或者在相同疾病的不同阶段之间是不同的。差异表达包括在例如正常和患病细胞或者经历不同疾病事件或疾病阶段的细胞中的基因或其表达产物在时间或细胞表达模式中的定量以及定性的差异。

如本文所用，“个体”指测试对象或患者。个体可以是哺乳动物或非哺乳动物。在许多实施方案中，个体是哺乳动物。哺乳动物个体可以是人或非人。在许多实施方案中，个体是人。健康或正常个体是其中通过常规诊断方法不可检测出所关注的疾病或疾病状况(包括例如胰腺疾病、胰腺相关疾病或其他胰腺疾病状况)的个体。

“诊断(Diagnose)”、“诊断(diagnosing)”、“诊断(diagnosis)”及其变体指基于个体相关的一种或多种迹象、症状、数据或其他信息对所述个体的健康状态或疾病状况的检测、确定或识别。个体的健康状态可以诊断为健康/正常(即诊断为不存在疾病或疾病状况)或者诊断为患病/异常(即诊断为存在疾病或疾病状况或者对疾病或疾病状况的特征的评价)。对于特定疾病或疾病状况，术语“诊断(diagnose)”、“诊断(diagnosing)”、“诊断(diagnosis)”等涵盖对疾病的初始检测；对疾病的表征或分类；疾病的进展、缓解或复发的检测；以及在给予个体治疗或疗法后疾病应答的检测。胰腺癌的诊断包括区分患有癌症与不患有癌症的个体。其还包括区分GI和正常对照与胰腺癌。

预后“(Prognose)”、“预后(prognosing)”、“预后(prognosis)”及其变体指预测患有疾病或疾病状况的个体中所述疾病或疾病状况的未来进程(如预测患者存活)，并且这类术语涵盖在给予个体治疗或疗法后评价疾病的应答。

“评价(Evaluate)”、“评价(evaluating)”、“评价(evaluation)”及其变体涵盖“诊断”和“预后”，并且还涵盖对不患病个体的疾病或疾病状况的未来进程的确定或预测以及确定或预测在表面上已经治愈疾病的个体中所述疾病或疾病状况复发的似然性。术语“评价”还包括评价个体对疗法的应答，例如预测个体是否可能对治疗剂顺利地应答，或者不大可能对治疗剂应答(或者会例如经历毒性或其他不期望的副作用)；选择给予个体的治疗剂；或者监测或确定个体对已经给予该个体的疗法的应答。因此，“评价”胰腺癌可以包括例如以下任何方面：预后个体中胰腺癌的未来进程；预测表面上已经治愈胰腺癌的个体中胰腺癌的复发；或者确定或预测个体对于胰腺癌治疗的应答；或者基于确定源自个体生物学样品的生物标记值来选择给予该个体的胰腺癌治疗。

任何如下实例均可以称作“诊断”或“评价”胰腺癌：最初检测胰腺癌的存在或不存在；确定胰腺癌的具体阶段、类型或亚型或者其他分类或特征；确定可疑团块是否为良性病变或恶性胰腺肿瘤；或者检测/监测胰腺癌进展(如监测肿瘤生长或转移扩散)、缓解或复发。

如本文所用，“额外的生物医学信息”指除了使用本文所述的任何生物标记之外的对个体所做的与癌症风险或更具体地与胰腺癌风险相关的一个或多个评价。“额外的生物医学信息”包括任何以下方面：个体的物理描述(physical descriptor)，包括通过任何具有三维重建的对比增强的多层(多检测器)螺旋计算机断层扫描(CT)、经皮或内镜超声(US或EUS)、内镜逆行胰胆管造影(ERCP)、磁共振成像(MRI)、MR胰胆管造影(MRCP)或者腹部超声观察到的胰腺团块；个体的身高和/或体重；体重变化；个体的种族；职业史；胰腺癌(或其他癌症)的家族史；个体或家族成员中与胰腺癌(或其他癌症)的高风险相关的遗传标记的存在；胰腺团块或其他腹部团块的存在或不存在；团块的大小；团块的位置；团块和相关腹部区域的形态学(例如通过成像观察的)；临床症状如腹部疼痛、体重减轻、厌食、早饱、腹泻、或脂肪泻、黄疸、最近发生的非典型糖尿病、最近但原因不明的血栓静脉炎历史、或者以前的胰腺炎攻击等；基因表达值；个体的物理描述，包括通过放射成像观察到的物理描述；个体的身高和/或体重；个体的性别；个体的种族；吸烟史；酒精使用历史；职业史；暴露于已知的致癌物(如暴露于任何石棉、氡气、化学品、来自火的烟以及空气污染，这可以包括来自静止或移动来源的排放物，如工业/工厂或汽车/海运/飞机排放物)；暴露于二手烟；以及胰腺癌或其他癌症的家族史。生物标记水平的测试联合任何额外的生物医学信息的评价，包括其他实验室测试(例如，CA19-9、血清胆红素浓度、碱性磷酸酶活性、贫血的存在)与单独测试生物标记或单独评价额外的生物医学信息的任何特定项目(例如，单独的超声成像)相比，可以例如改善检测胰腺癌(或其他胰腺癌相关用途)的灵敏性、特异性和/或AUC。额外的生物医学信息可以通过使用本领域已知的常规技术得自个体，如通过使用常规患者问卷调查或健康史问卷调查等得自个体自身，或者得自医学从业人员等。生物标记水平的测试联合任何额外的生物医学信息的评价与单独测试生物标记或单独评价额外的生物医学信息的任何特定项目(如单独的CT成像)相比，可以例如改善检测胰腺癌(或其他胰腺癌相关用途)的灵敏性、特异性和/或AUC。

癌症相关抗原19-9(CA19-9)是已知的胰腺癌的血液标记。报道的CA19-9对胰腺癌的灵敏性和特异性分别为80-90％。然而，这些值与肿瘤大小密切相关。CA19-9鉴定患有小型手术可切除的癌症的患者的准确性有限。CA19-9需要Lewis血型抗原(糖基转移酶)的存在以表达。在具有Lewis阴性表型的个体(估计5-10％的群体)中，CA19-9水平不是可用的肿瘤标记。CA19-9的特异性也是有限的。CA19-9经常在患有各种良性胆胰病症的患者中升高。CA19-9升高的程度(在最初出现和手术后环境中)与长期预后有关。此外，在看来患有潜在的可切除的疾病的患者中，CA19-9水平的数量级还可以有助于预测放射显影隐匿性转移性疾病的存在。CA19-9水平的系列监测可用于随访潜在的根治性手术后的患者以及接受晚期疾病的化疗的患者。升高的CA19-9水平通常在复发性疾病的放射显影出现之前，但是疾病发展的证实应当通过成像研究和/或活组织检查来进行。生物标记水平的检测联合CA19-9与单独CA19-9相比，可以例如改善检测胰腺癌(或其他胰腺癌相关用途)的灵敏性、特异性和/或AUC。

术语“曲线下面积”或“AUC”指接受者操作特征(ROC)曲线下的面积，这两个术语均为本领域所熟知。AUC测量可用于比较完整数据范围内的分类器的精确性。具有较大AUC的分类器具有较大的能力来正确分类两个所关注的组(如胰腺癌样品与正常或对照样品)之间的未知情况。ROC曲线可用于对特定特征的性能作图(如本文描述的任何生物标记和/或任何额外的生物医学信息项目)，以在两个群体之间进行区分(如患有胰腺癌的病例与无胰腺癌的对照)。通常，整个群体(如病例与对照)的特征数据基于单个特征的值递增分类。然后，对于该特征的每个值，计算数据的真阳性率和假阳性率。真阳性率通过计数高于该特征值的病例数，然后除以病例总数来确定。假阳性率通过计数高于该特征值的对照数，然后除以对照总数来确定。尽管这个定义指其中特征在病例中与在对照中相比升高的情况，但是这个定义还适用于其中特征在病例中与在对照中相比降低的情况(在这种情况下，计数低于该特征值的样品)。ROC曲线可以对单个特征以及其他单个输出产生，例如两个或更多个特征的组合可以是数学组合(如加、减、乘等)以提供单个的和值，并且该单个的和值可以在ROC曲线中绘制。此外，其中组合产生单个输出值的多个特征的任意组合可以在ROC曲线中绘制。这些特征的组合可以包括测试。ROC曲线是测试的真阳性率(灵敏性)对测试的假阳性率(1-特异性)的作图。

如本文所用，“检测”或“确定”生物标记值包括使用观察和记录对应于生物标记值的信号所需的设备以及产生该信号所需的材料。在各种实施方案中，生物标记值使用任何合适的方法检测，包括荧光、化学发光、表面等离子共振、表面声波、质谱、红外线光谱、拉曼光谱、原子力显微术、扫描隧道显微术、电子化学检测方法、核磁共振、量子点等。

“固体支持物”在本文中指具有分子可以直接或间接，通过共价键或非共价键附着的表面的任何支持物。“固体支持物”可以具有各种物理形式，可以包括例如膜；芯片(如蛋白芯片)；玻片(如载玻片或盖玻片)；柱；空心、固体、半固体、有孔或有腔的颗粒，例如珠；凝胶；纤维，包括光学纤维材料；基质；以及样品容器。示例性样品容器包括样品孔、管、毛细管、小瓶以及能够容纳样品的任何其他容器、沟槽或凹陷。样品容器可以包含于多样品平台上，如微量滴定板、玻片、微流体装置等。支持物可以由天然或合成材料、有机或无机材料组成。其上附着捕获剂的固体支持物的成分通常取决于附着方法(如共价附着)。其他示例性容器包括微滴和微流体控制的或大量的油/水性乳液，在其中可以进行测定和相关操作。合适的固体支持物包括例如塑料、树脂、多糖、硅石或基于硅石的材料、官能化玻璃、改性的硅、碳、金属、无机玻璃、膜、尼龙、天然纤维(例如丝、羊毛和棉)、聚合物等。包含固体支持物的材料可以包含反应基团，例如羧基、氨基或羟基以用于捕获剂的附着。聚合固体支持物可以包括如聚苯乙烯、聚对苯二甲酸乙二醇酯、聚乙酸乙烯酯、聚氯乙烯、聚乙烯吡咯烷酮、聚丙烯腈、聚甲基丙烯酸甲酯、聚四氟乙烯、丁基橡胶、苯乙烯丁二烯橡胶、天然橡胶、聚乙烯、聚丙烯、(聚)四氟乙烯、(聚)偏氟乙烯、聚碳酸酯和聚甲基戊烯。可以使用的合适的固体支持物颗粒包括例如编码的颗粒，如Luminex-型编码的颗粒、磁性颗粒以及玻璃颗粒。

生物标记的示例性用途

在许多示例性实施方案中，本发明提供了诊断个体的胰腺癌的方法，所述方法通过检测对应于个体的循环如血清或血浆中存在的一个或多个生物标记的一个或多个生物标记值来进行，并且通过任何数目的分析方法来进行，包括本文所述的任何分析方法。这些生物标记例如在胰腺癌个体中与在无胰腺癌个体相比差异表达。生物标记在个体中的差异表达的检测可以用于例如允许胰腺癌的早期诊断，区分良性和恶性团块(例如，在计算机断层扫描(CT)、MRI或超声上观察到的团块)，监测胰腺癌复发，或者用于鉴别诊断其他临床疾病状况如急性或慢性胰腺炎(或两者)、胰腺梗阻、GERD、胆石或者后来发现为良性的异常成像。

本文所述的任何生物标记可以用于胰腺癌的各种临床指征，包括以下任何方面：检测胰腺癌(例如在高风险个体或群体中)；表征胰腺癌(例如，确定胰腺癌类型、亚型或阶段)，如通过区分胰腺癌(胰腺癌)与急性或慢性胰腺炎(或两种)、胰腺梗阻、GERD、胆石或者后来发现为良性的异常成像和/或区分腺癌与其他恶性细胞类型(或者以其他方式促进组织病理学)；确定胰腺团块是否为良性或恶性胰腺肿瘤；确定胰腺癌预后；监测胰腺癌进展或缓解；监测胰腺癌复发；监测转移；治疗选择；监测对治疗剂或其他治疗的应答；对个体的内镜超声(EUS)筛查分层(stratification)(例如，鉴定面临较高胰腺癌风险从而最可能受益于放射学筛查的那些个体，因此增加EUS的阳性预测值)；组合生物标记测试与额外的生物医学信息如吸烟或饮酒史等，或者CA19-9水平，指示胰腺癌的高风险的遗传标记的存在等，或者与团块大小，形态学，腹水的存在等(例如以提供与CA19-9测试或其他生物标记测试或者与团块大小、形态学等相比具有增加的诊断性能的测定)；促进腹部团块为恶性或良性的诊断；促进一旦在CT、MRI、PET或EUS上观察到腹部团块则作出临床决定(例如，如果认为腹部团块是低风险的，例如如果基于生物标记的测试是阴性的，有或无团块大小的分类，则进行重复放射扫描，或者如果认为该团块是中高风险的，例如如果基于生物标记的测试是阳性的，有或无团块大小或组织侵袭程度的分类，则考虑活组织检查)；或者促进关于临床随访的决定(例如，在成像上观察到腹部团块后是否进行重复放射成像扫描、细针活组织检测或手术)。生物标记测试可以单独提高高风险个体的EUS筛查的阳性预测值(PPV)。除了联合EUS筛查之外，本文所述的生物标记还可以与用于与胰腺癌癌的任何其他成像方式如CT、MRI或PET扫描联合使用。此外，所述生物标记还可用于在通过成像方式或其他临床相关性检测胰腺癌指征之前或者在症状出现之前允许这些应用的某一些。其还包括区分急性或慢性胰腺炎(或两者)、胰腺梗阻、GERD、胆石或者后来发现为良性的异常成像与胰腺癌。

本文所述的任何生物标记可以用于诊断胰腺癌的示例性方式是：未知患有胰腺癌的个体中一个或多个所述生物标记的差异表达可以表明该个体患有胰腺癌，从而使得可以在治疗最有效的疾病早期检测胰腺癌，也许在通过其他方式检测胰腺癌之前或者在症状出现之前检测胰腺癌。胰腺癌期间一个或多个生物标记的过表达可以指示胰腺癌的进展，如胰腺肿瘤生长和/或转移(并且因此表示不良预后)；而一个或多个生物标记差异表达程度的降低(即在随后的生物标记测试中，个体中的表达水平趋向或接近“正常”表达水平)可以指示胰腺癌的缓解，如胰腺肿瘤缩小(并且因此提示良好或较好的预后)。相似地，在胰腺癌治疗期间一个或多个生物标记差异表达的程度增加(即在随后的生物标记测试中，个体中的表达水平进一步远离“正常”表达水平)可以指示胰腺癌的进展，并因此表示所述治疗是无效的；而在胰腺癌治疗期间一个或多个生物标记的差异表达降低可以指示胰腺癌的缓解，并因此表示该治疗是成功的。此外，在个体看起来已经治愈胰腺癌之后一个或多个生物标记的差异表达的增加或降低可指示胰腺癌的复发。在这种情况下，例如可以在早期对个体重新启动治疗(或者如果个体维持治疗，则修改治疗方案以增加剂量和/或频率)，否则直至晚期还未检测到胰腺癌的复发。此外，个体中一个或多个生物标记的差异表达水平可以预测个体对特定治疗剂的应答。在监测胰腺癌复发或进展中，生物标记表达水平的改变可以指示需要重复成像(如重复EUS)，例如来确定胰腺癌活性或确定需要改变治疗方案。

本文所述的任何生物标记的检测可以特别地在胰腺癌治疗后使用或者与胰腺癌治疗联合使用，如评价治疗的成功或者监测治疗后胰腺癌的缓解、复发和/或进展(包括转移)。胰腺癌治疗可以包括例如给予个体治疗剂、进行手术(如手术切除至少一部分胰腺肿瘤或者去除胰腺和周围组织)、给予放疗或本领域所用的任何其他类型的胰腺癌治疗方法以及这些治疗的任意组合。例如，任何生物标记可以在治疗后检测至少一次，或者可以在治疗后检测多次(如定期检测)，或者可以在治疗之前和之后检测。个体中任何生物标记随时间的差异表达水平可以指示胰腺癌的进展、缓解或复发，其实例包括以下方面：生物标记的表达水平在治疗后与治疗前相比增加或降低；生物标记的表达水平在治疗后较晚时间点与治疗后较早时间点相比增加或降低；以及生物标记的表达水平在治疗后的一个时间点与该生物标记的正常水平相比不同。

作为具体的实例，本文所述的任何生物标记的生物标记水平可以在手术前和手术后(例如手术后2-8周)的血清或血浆样品中确定。手术后样品与手术前样品相比生物标记表达水平的增加可以指示胰腺癌的进展(如不成功的手术)；而手术后样品与手术前样品相比生物标记表达水平的降低可以指示胰腺癌的消退(如成功除去胰腺肿瘤的手术)。生物标记水平的相似分析可以在其他形式的治疗之前和之后进行，如在放疗或者给予治疗剂或癌症疫苗之前和之后进行。

除了作为独立运行的诊断测试的生物标记水平测试之外，生物标记水平还可以联合SNP或者指示疾病易感性风险增加的其他遗传病变或变异性的确定来进行。(参见，例如，Amos et al.，Nature Genetics40，616-622(2009))。

除了作为独立运行的诊断测试的生物标记水平测试之外，生物标记水平还可以联合放射筛查进行。除了作为独立运行的诊断测试的生物标记水平测试之外，生物标记水平还可以联合相关症状或遗传测试进行。本文所述的任何生物标记的检测可以在已通过成像观察到胰腺团块之后用来辅助诊断胰腺癌并指导适当的个体临床护理，包括由适当的外科专家或者在不可切除的患者中通过姑息疗法来护理。除了联合相关症状或风险因素测试生物标记水平，关于生物标记的信息还可以联合其他类型的数据进行评价，特别是指示个体的胰腺癌风险的数据(例如，患者临床史、症状、胰腺癌家族史、吸烟或饮酒史、糖尿病的突然发生、黄疸、风险因素如存在遗传标记、和/或其他生物标记的状态等)。这些不同数据可以通过自动化方法评价，如计算机程序/软件，其可以在计算机或其他设备/装置中实施。

除了在高风险个体中联合放射筛查测试生物标记水平之外(如联合在成像扫描上观察到的胰腺团块的大小或其他特征评价生物标记水平)，关于生物标记的信息还可以联合其他类型的数据进行评价，特别是指示个体的胰腺癌风险的数据(例如，患者临床史、症状、癌症家族史、风险因素如个体是否是吸烟者、酗酒者和/或其他生物标记的状况等)。这些不同数据可以通过自动化方法评价，如计算机程序/软件，其可以在计算机或其他设备/装置中实施。

任何所述生物标记还可以用于成像测试。例如，显像剂可以与任何所述生物标记偶联，这可以用于辅助胰腺癌诊断、监测疾病进展/缓解或转移、监测疾病复发或者监测对治疗的应答等。

生物标记和生物标记值的检测和确定

本文所述的生物标记的生物标记值可以使用任何已知的分析方法来检测。在一实施方案中，生物标记值使用捕获试剂(capture reagent)检测。如本文所用，“捕获剂(capture agent)”或“捕获试剂”指能够特异性结合生物标记的分子。在许多实施方案中，捕获试剂可以在溶液中暴露于生物标记，或者可以暴露于生物标记，同时该捕获试剂固定在固体支持物上。在其他实施方案中，捕获试剂含有与固体支持物上的第二特征反应的特征。在这些实施方案中，捕获试剂可以在溶液中暴露于生物标记，然后该捕获试剂上的特征可以联合固体支持物上的第二特征来将所述生物标记固定在固体支持物上。捕获试剂基于进行的分析类型加以选择。捕获试剂包括但不限于适配体、抗体、adnectin、锚蛋白、其他抗体模拟物(mimetic)及其他蛋白支架、自身抗体、嵌合物、小分子、F(ab′)₂片段、单链抗体片段、Fv片段、单链Fv片段、核酸、凝集素、配体-结合受体、affybodies、纳米抗体(nanobodies)、印迹聚合物(imprinted polymer)、高亲合性多聚体(avimer)、肽模拟物(peptidomimetic)、激素受体、细胞因子受体及合成受体以及这些物质的修饰物和片段。

在一些实施方案中，生物标记值使用生物标记/捕获试剂复合物来检测。

在其他实施方案中，生物标记值得自生物标记/捕获试剂复合物，并且例如作为生物标记/捕获试剂相互作用之后的反应结果间接检测，但是依赖于生物标记/捕获试剂复合物的形成。

在一些实施方案中，生物标记值从生物学样品中的生物学标记直接检测。

在一实施方案中，生物标记使用多重形式检测，这允许在生物学样品中同时检测两个或更多个生物标记。在多重形式的一实施方案中，捕获试剂直接或间接、共价或非共价地固定在固体支持物上分散的位置。在另一实施方案中，多重形式使用分离的固体支持物，其中每个固体支持物具有与该固体支持物相关的独特捕获试剂，例如量子点。在另一实施方案中，单独的装置用于检测生物学样品中待检测的多个生物标记的每一个。可以配置单独的装置以允许同时处理生物学样品中的每个生物标记。例如，可以使用微量滴定板，由此该板中的每个孔用于独特地分析生物学样品中待检测的多个生物标记之一。

在一个或多个前述实施方案中，可以使用荧光标签(tag)来标记生物标记/捕获复合物的组分以允许检测生物标记值。在许多实施方案中，使用已知技术可以将荧光标记(fluorescent label)与对本文所述的任何生物标记特异性的捕获试剂偶联，然后该荧光标记可以用于检测相应的生物标记值。合适的荧光标记包括稀土元素螯合物、荧光素及其衍生物、罗丹明及其衍生物、丹磺酰、别藻蓝蛋白、PBXL-3、Qdot 605、丽丝胺(Lissamine)、藻红蛋白、德克萨斯红及其他这样的化合物。

在一实施方案中，荧光标记是荧光染料分子。在一些实施方案中，荧光染料分子包括至少一个取代的吲哚环(indolium ring)体系，其中吲哚环的3-碳上的取代基含有化学反应性基团或偶联的物质。在一些实施方案中，染料分子包括AlexFluor分子，例如AlexaFluor 488、AlexaFluor 532、AlexaFluor 647、AlexaFluor 680或AlexaFluor 700。在其他实施方案中，染料分子包括第一类型和第二类型的染料分子，如两种不同的AlexaFluor分子。在其他实施方案中，染料分子包括第一类型和第二类型的染料分子，并且两种染料分子具有不同的发射光谱。

荧光可以用与大范围的测定形式相容的许多仪器测量。例如，已经设计了分光荧光计来分析微量滴定板、显微镜载玻片、印刷阵列(printedarray)、小杯等。参见Principles of Fluorescence Spectroscopy，by J.R.Lakowicz，Springer Science+Business Media，Inc.，2004。参见Bioluminescence &Chemiluminescence：Progress & Current Applications；Philip E.Stanley andLarry J.Kricka editors，World Scientific Publishing Company，January2002。

在一个或多个前述实施方案中，化学发光标签可以任选地用于标记生物标记/捕获复合物的组分以允许检测生物标记值。合适的化学发光材料包括任何草酰氯、Rodamin 6G、Ru(bipy)₃ ²⁺、TMAE(四三(二甲基氨基)乙烯(tetrakis(dimethylamino)ethylene))、连苯三酚(1，2，3-三羟基苯(1，2，3-trihydroxibenzene))、光泽精、过氧草酸酯(peroxyoxalate)、芳基草酸酯、吖啶酯(acridinium ester)、二氧杂环丁烷(dioxetane)等。

在其他实施方案中，检测方法包括酶/底物组合，其产生对应于生物标记值的可检测信号。通常，酶催化生色底物的化学改变，这种改变可以使用多种技术测量，包括分光光度法、荧光及化学发光。合适的酶包括例如萤光素酶、萤光素、苹果酸脱氢酶、脲酶、辣根过氧化物酶(HRPO)、碱性磷酸酶、β-半乳糖苷酶、葡糖淀粉酶、溶菌酶、葡萄糖氧化酶、半乳糖氧化酶及葡萄糖-6-磷酸脱氢酶、尿酸氧化酶、黄嘌呤氧化酶、乳过氧化物酶、微过氧化物酶等。

在其他实施方案中，检测方法可以是产生可测量信号的荧光、化学发光、放射性核素或酶/底物组合的组合。多种方式的信号在生物标记测定形式中可以具有独特且有利的特征。

更特别地，本文所述的生物标记的生物标记值可以使用已知的分析方法来检测，包括单重适配体测定、多重适配体测定、单重或多重免疫测定、mRNA表达谱、miRNA表达谱、质谱分析、组织学/细胞学方法等，这在下文中详细地描述。

使用基于适配体的测定确定生物标记值

检测和定量生物学样品及其他样品中生理学上有意义的分子的测定在科学研究和卫生保健领域是重要的工具。一类这样的测定包括使用包含固定在固体支持物上的一个或多个适配体的微阵列。所述适配体各自能够以高特异性方式和非常高的亲和力结合靶分子。参见例如题为“核酸配体”的美国专利第5,475,096号；还参见例如美国专利第6,242,246号、美国专利第6,458,543号和美国专利第6,503,715号，这些专利的题目均为“核酸配体诊断生物芯片”。一旦使微阵列与样品接触，则适配体结合所述样品中存在的它们各自的靶分子，从而允许确定对应于生物标记的生物标记值。

如本文所用，“适配体”指对靶分子具有特异性结合亲和力的核酸。应当了解到亲和相互作用的问题关键是程度；然而在本文中，适配体对其靶标的“特异性结合亲和力”指适配体通常以与其结合测试样品中其他组分的亲和力相比更高程度的亲和力结合其靶标。“适配体”是一种类型或物种的核酸分子的一系列拷贝，其具有特定的核苷酸序列。适配体可以包含任何合适数目的核苷酸，包括任何数目的化学修饰的核苷酸。“适配体”指多于一个的这种系列的分子。不同的适配体可以具有相同或不同数目的核苷酸。适配体可以是DNA或RNA或化学修饰的核酸，并且可以是单链、双链的或者含有双链区，以及可以包含高级结构。适配体还可以是光适配体(photoaptamer)，其中该适配体中包含光反应性或化学反应性官能团以允许其与其对应靶标共价连接。本文公开的任何适配体方法可以包括使用特异性结合相同靶分子的两种或更多种适配体。如下文进一步描述，适配体可以包含标签。如果适配体包含标签，则该适配体的所有拷贝不需要具有相同的标签。此外，如果不同的适配体各自包含标签，则这些不同的适配体可以具有相同的标签或者不同的标签。

适配体可以使用任何已知方法鉴定，包括SELEX方法。一旦鉴定，则可以根据任何已知方法制备或合成适配体，这些已知方法包括化学合成方法和酶促合成方法。

如本文所用，“SOMAmer”或低解离速率修饰的适配体指具有改善的解离速率特征的适配体。SOMAmer可以使用题为“产生具有改善的解离速率的适配体的方法”的美国公开第2009/0004667号所述的改进的SELEX方法来产生。

术语“SELEX”和“SELEX方法”在本文中可互换使用，通常指(1)与(2)的组合，其中(1)是选择以期望的方式与靶分子相互作用的适配体，例如以高亲和力结合蛋白，(2)是扩增那些选择的核酸。SELEX方法可以用于鉴定对特定靶标或生物标记具有高亲和力的适配体。

SELEX通常包括制备核酸的候选混合物；使所述候选混合物与期望的靶分子结合以形成亲和复合物；分离所述亲和复合物与未结合的候选核酸；使核酸与所述亲和复合物分开并分离所述核酸；纯化所述核酸；以及鉴定特异性适配体序列。所述方法可以包括多次循环以进一步精制所选适配体的亲和力。所述方法可以包括在该方法的一个或多个点的扩增步骤。参见例如题为“核酸配体”的美国专利第5,475,096号。SELEX方法可以用于产生与适配体的靶标共价结合的适配体，以及与适配体的靶标非共价结合的适配体。参见例如题为“通过指数富集的核酸配体的系统进化：Chemi-SELEX”的美国专利第5,705,337号。

SELEX方法可以用于鉴定含有修饰的核苷酸的高亲和力适配体，所述修饰的核苷酸赋予该适配体改善的特征，例如改善的体内稳定性或改善的递送特征。此类修饰的实例包括核糖和/或磷酸和/或碱基位置的化学取代。通过SELEX方法鉴定的含有修饰的核苷酸的适配体描述于题为“含有修饰的核苷酸的高亲和力核酸配体”的美国专利第5,660,985号，其描述了含有在嘧啶的5′-和2′-位置处经化学修饰的核苷酸衍生物的寡核苷酸。见上文，美国专利第5,580,737号描述了高特异性适配体，其含有用2′-氨基(2′-NH2)、2′-氟(2′-F)和/或2′-O-甲基(2′-OMe)修饰的一个或多个核苷酸。还参见题为“SELEX和PHOTOSELEX”的美国专利申请公开20090098549，其描述了具有扩展的物理和化学性质的核酸文库及其在SELEX和photoSELEX中的用途。

SELEX还可以用于鉴定具有期望的解离速率特征的适配体。参见题为“产生具有改善的解离速率的适配体的方法”的美国专利申请公开20090004667，其描述了产生可以结合靶分子的适配体的改进SELEX方法。描述了产生与各自的靶分子具有较慢解离速率的适配体和光适配体的方法。所述方法包括使候选混合物与靶分子接触；允许形成核酸-靶标复合物；以及进行缓慢解离速率富集过程，其中具有快解离速率的核酸-靶标复合物解离并不再形成，而具有慢解离速率的复合物会保持完整。此外，所述方法包括在产生候选核酸混合物中使用修饰的核苷酸，以产生具有改善的解离速率性能的适配体。

这种测定的变化使用包含光反应性官能团的适配体，这允许适配体与其靶分子共价结合或“光交联”。参见例如题为“核酸配体诊断生物芯片”的美国专利第6,544,776号。这些光反应性适配体也称作光适配体。参见例如美国专利第5,763,177号、美国专利第6,001,577号和美国专利第6,291,184号，所述专利的题目均是“通过指数富集的核酸配体的系统进化：核酸配体的光选择和溶液SELEX”；还参见例如题为“核酸配体的光选择”的美国专利第6,458,539号。在使微阵列与样品接触并使光适配体具有结合其靶分子的机会之后，将该光适配体光激活并洗涤固体支持物以除去任何非特异性结合的分子。可以使用严格洗涤条件，因为结合光适配体的靶分子由于该光适配体上光激活的官能团所产生的共价键而通常未被除去。在这种方式中，测定允许检测对应于测试样品中的生物标记的生物标记值。

在这两种测定形式中，适配体在与样品接触之前固定在固体支持物上。然而，在某些情况下，在与样品接触之前固定适配体也许无法提供最佳的测定。例如，预固定适配体可能导致适配体与靶分子在固体支持物表面上的无效混合，这可能导致漫长的反应时间及因此延长的温育时间以允许适配体与其靶分子有效结合。此外，当光适配体用于测定并且取决于用作固体支持物的材料时，该固体支持物可能趋于分散或吸收用于实现光适配体与其靶分子之间的共价键形成的光。此外，根据所用的方法，结合适配体的靶分子的检测可能不准确，因为固体支持物的表面也可能暴露于且受所用的任何标记剂的影响。最后，适配体固定在固体支持物上通常包括在适配体暴露于样品之前的适配体制备步骤(即固定)，这个制备步骤可能影响适配体的活性或功能性。

还描述了适配体测定，其允许适配体在溶液中捕获其靶标，然后在检测之前使用设计为除去适配体-靶标混合物中特定组分的分离步骤(参见题为“测试样品的多重分析”的美国专利申请公开20090042206)。所述适配体测定方法允许检测和定量测试样品中的非核酸靶标(如蛋白靶标)，这通过检测和定量核酸(即适配体)进行。所述方法产生核酸替代物(surrogate)(即适配体)以检测和定量非核酸靶标，由此允许包括扩增在内的许多核酸技术用于包括蛋白靶标在内的更大范围的期望靶标。

可以构建适配体以促进从适配体生物标记复合物(或光适配体生物标记共价复合物)分离测定组分，以及允许分离适配体以进行检测和/或定量。在一实施方案中，这些构建体可以包含适配体序列中可裂解或可释放的元件。在其他实施方案中，可以在适配体中引入额外的官能性，例如标记的或可检测的组分、间隔组分或者特异性结合标签或固定元件。例如，适配体可以包含通过可裂解部分与适配体连接的标签、标记、分隔标记与可裂解部分的间隔组分。在一实施方案中，可裂解元件是光可裂解接头(linker)。光可裂解接头可以连接至生物素部分和间隔区段，可以包含NHS基团以用于胺的衍生化，以及可以用于在适配体中引入生物素基团，从而允许适配体在测定方法中较晚地释放。

用溶液中所有测定组分进行的均质测定在检测信号之前不需要分离样品与试剂。这些方法是快速且易于使用的。这些方法基于分子捕获或与其特异性靶标反应的结合试剂产生信号。对于胰腺癌，分子捕获试剂是适配体或抗体等，特异性靶标是表1第2列的胰腺癌生物标记。

在一实施方案中，一种信号产生方法利用由于荧光团-标记的捕获试剂与其特异性生物标记靶标的相互作用而导致的各向异性信号改变。当标记的捕获剂与其靶标反应时，增加的分子量导致附着于该复合物的荧光团的旋转运动变得更慢，从而改变各向异性值。通过监测各向异性改变，结合事件可以用于定量测量溶液中的生物标记。其他方法包括荧光偏振测定、分子信标方法、时间分辨荧光猝灭法、化学发光、荧光共振能量转移等。

可以用于检测对应于生物学样品中生物标记的生物标记值的基于溶液的示例性适配体测定包括以下步骤：(a)通过使所述生物学样品与适配体接触来制备混合物，所述适配体包含第一标签并具有对所述生物标记的特异性亲和力，其中当所述样品中存在所述生物标记时形成适配体亲和复合物；(b)使所述混合物暴露于包含第一捕获元件的第一固体支持物，并且允许所述第一标签与所述第一捕获元件结合；(c)除去未与所述第一固体支持物结合的混合物的任何组分；(d)使第二标签附着于所述适配体亲和复合物的生物标记组分；(e)从所述第一固体支持物释放所述适配体亲和复合物；(f)使释放的适配体亲和复合物暴露于包含第二捕获元件的第二固体支持物，并且允许所述第二标签与所述第二捕获元件结合；(g)通过分离未复合的适配体与所述适配体亲和复合物来从所述混合物除去任何未复合的适配体；(h)从固体支持物洗脱适配体；以及(i)通过检测所述适配体亲和复合物的适配体组分来检测所述生物标记。

本领域已知的任何方法可以用于通过检测适配体亲和复合物的适配体组分来检测生物标记值。许多不同的检测方法可以用于检测亲和复合物的适配体组分，例如，杂交测定、质谱分析或QPCR。在一些实施方案中，核酸测序方法可以用于检测适配体亲和复合物的适配体组分，从而检测生物标记值。简单地说，可以使测试样品进行任何种类的核酸测序方法以鉴定和定量测试样品中存在的一种或多种适配体的序列或多个序列。在一些实施方案，序列包括整个适配体分子或者可以用来唯一地鉴定该分子的该分子的任何部分。在其他实施方案中，鉴定序列是添加至适配体的特定序列；这类序列常称为“标签”、“条形码”或“邮政编码”。在一些实施方案中，测序方法包括酶促步骤以扩增适配体序列，或者将任何种类的核酸(包括在任何位置包含化学修饰的RNA和DNA)转化为适合测序的任何其他种类的核酸。

在一些实施方案中，测序方法包括一个或多个克隆步骤。在其他实施方案中，测序方法包括没有克隆的直接测序方法。

在一些实施方案中，测序方法包括具有靶向测试样品中的一种或多种适配体的特异性引物的直接方法。在其他实施方案中，测序方法包括靶向测试样品中的所有适配体的鸟枪法。

在一些实施方案中，测序方法包括酶促步骤以扩增测序靶向的分子。在其他实施方案中，测序方法直接测序单一分子。可以用来检测对应于生物学样品中的生物标记的生物标记值的示例性基于核酸测序的方法包括以下步骤：(a)通过酶促步骤将包含化学修饰的核苷酸转化为未修饰的核酸；(b)用大规模平行测序平台鸟枪测序所得的未修饰的核酸，例如454测序系统(454Life Sciences/Roche)、Illumina测序系统(Illumina)、ABI SOLiD测序系统(Applied Biosystems)、HeliScope单分子测序仪(Helicos Biosciences)、或Pacific Biosciences实时单分子测序系统(Pacific BioSciences)或PolonatorG测序系统(Dover Systems)；以及(c)通过特异性测序和测序计数来鉴定和定量混合物中存在的适配体。

使用免疫测定确定生物标记值

免疫测定方法基于抗体与其对应靶标或分析物的反应，并且根据特定测定形式可以检测样品中的分析物。为了改进基于免疫反应性的测定方法的特异性和灵敏性，通常由于单克隆抗体的特异性表位识别而使用单克隆抗体。多克隆抗体由于其与单克隆抗体相比增加的靶标亲和力而成功地用于各种免疫测定中。免疫测定已经设计为用于大范围生物学样品基质。免疫测定形式已经设计为提供定性、半定量和定量结果。

定量结果通过使用已知浓度的待检测的特定分析物产生的标准曲线来产生。将来自未知样品的应答或信号在标准曲线上作图，并确定该未知样品中对应于靶标的量或值。

已经设计了许多免疫测定形式。ELISA或EIA可以定量检测分析物。这种方法依赖于标记对分析物或抗体的附着，并且标记组分直接或间接包括酶。ELISA测试可以设计为直接、间接、竞争性或者夹心检测分析物。其他方法依赖于标记，如放射性同位素(I125)或荧光。其他技术包括例如凝集反应、浊度测定法、比浊法、蛋白印迹、免疫沉淀、免疫细胞化学、免疫组织化学、流式细胞术、Luminex测定等(参见ImmunoAssay：A PracticalGuide，edited by Brian Law，published by Taylor & Francis，Ltd.，2005edition)。

示例性测定形式包括酶联免疫吸附测定(ELISA)、放射性免疫测定、荧光、化学发光以及荧光共振能量转移(FRET)或时间分辨的-FRET(TR-FRET)免疫测定。检测生物标记的方法的实例包括生物标记免疫沉淀及随后允许辨别大小和肽水平的定量方法，如凝胶电泳、毛细管电泳、平面电色谱等。

检测和/或定量可检测标记或信号产生材料的方法取决于所述标记的性质。由合适的酶催化的反应产物(其中所述可检测标记是酶，见上文)可以是但不限于荧光、发光或放射性的，或者它们可以吸收可见光或紫外光。适合于检测这样的可检测标记的检测仪的实例包括但不限于X光照片、放射性计数器、闪烁计数器、分光光度计、比色计、荧光计、发光计和光密度计。

可以通过允许适当准备、处理和分析反应的任何方式来进行任何检测方法。这可以例如在多孔测定板(如96孔或384孔)中进行，或者使用任何合适的阵列或微阵列进行。可以人工或自动化制备各种试剂的储液，使用能够检测可检测标记的可商购的分析软件、机器人技术和检测仪器自动化进行所有随后的移液、稀释、混合、分配、洗涤、温育、样品读取、数据收集和分析。

使用基因表达谱确定生物标记值

测量生物学样品中的mRNA可以用作检测该生物学样品中相应的蛋白水平的替代。因此，本文所述的任何生物标记或生物标记的组还可以通过检测适当的RNA来检测。

mRNA表达水平通过逆转录定量聚合酶链式反应(RT-PCR及随后的qPCR)测量。RT-PCR用于从mRNA产生cDNA。cDNA可以用于qPCR测定以随DNA扩增过程的进展而产生荧光。通过与标准曲线比较，qPCR可以产生绝对测量度，如每细胞的mRNA拷贝数。RNA印迹、微阵列、Invader测定以及与毛细管电泳组合的RT-PCR全部已经用于测量样品中mRNA的表达水平。参见Gene Expression Profiling：Methods and Protocols，Richard A.Shimkets，editor，Humana Press，2004.

miRNA分子是小RNA，其不编码但是可以调节基因表达。适合测量mRNA表达水平的任何方法均可以用于相应的miRNA。最近，许多实验室已经研究了miRNA作为疾病的生物标记的用途。许多疾病涉及广泛的转录调节，并且毫不意外地发现miRNA可以作为生物标记。miRNA浓度与疾病之间的关联通常不如蛋白水平与疾病之间的关联明确，但是miRNA生物标记值可能是重要的。当然，随着疾病期间任何RNA的不同表达，开发体外诊断产品所面临的问题包括需要miRNA在患病细胞中存活及易于提取以进行分析，或者miRNA被释放进入血液或其他基质中，在此它们必须存活足够长的时间以进行测量。蛋白生物标记具有相似的要求，尽管许多潜在的蛋白生物标记以旁分泌方式在疾病期间于病变和功能部位有意地分泌。许多潜在的蛋白生物标记设计为在合成那些蛋白的细胞外起作用。

使用体内分子成像技术检测分子标记

任何所述的生物标记(见表1第2列)还可以用于分子成像测试。例如，显像剂可以与任何所述生物标记偶联，这可以用于辅助胰腺癌诊断、监测疾病进展/缓解或转移、监测疾病复发或者监测对治疗的应答等。

体内成像技术提供了用于确定个体体内特定疾病状态的非侵入性方法。例如，身体的所有部分或者甚至整个身体均可以作为三维图像观察，从而提供关于身体内形态学和结构的有价值的信息。这样的技术可以与检测本文所述的生物标记组合以提供关于个体的癌症状态，特别是胰腺癌状态的信息。

体内分子成像技术的应用由于该技术的各种进展而得以扩展。这些进展包括新造影剂或标记的开发，如放射性标记和/或荧光标记，其可以在身体内提供强信号；以及开发更强的新成像技术，其可以从身体外部检测和分析这些信号，并且具有足够的灵敏性和精确度以提供有用的信息。造影剂可以在适当的成像系统中观察，从而提供所述造影剂所处位置的身体部分或多个部分的图像。造影剂可以与捕获试剂结合或缔合，例如适配体或抗体，例如和/或结合或缔合肽或蛋白，或寡核苷酸(例如为了检测基因表达)，或者复合物，所述复合物含有任何这些物质及一种或多种大分子和/或其他颗粒形式。

造影剂还是可用于成像的放射性原子的特征。对于闪烁照相研究，合适的放射性原子包括锝-99m或碘-123。其他易于检测的部分包括例如磁共振成像(MRI)的自旋标记物，如碘-123、碘-131、铟-111、氟-19、碳-13、氮-15、氧-17、钆、锰或铁。这样的标记为本领域熟知，并且可以由本领域技术人员容易地选择。

标准成像技术包括但不限于磁共振成像、计算机断层扫描、正电子发射断层扫描(PET)、单光子发射计算机断层扫描(SPECT)等。对于诊断性体内成像，可用的检测设备的类型是选择指定造影剂的主要因素，如用于靶标(蛋白、mRNA等)的指定放射性核素和特定生物标记。所选的放射性核素通常具有通过指定类型设备可检测的衰变类型。此外，当选择用于体内诊断的放射性核素时，其半衰期应当足够长以允许在靶组织最大吸收时进行检测，但是也应当足够短，以最小化宿主所受的有害辐射。

示例性成像技术包括但不限于PET和SPECT，这是将放射性核素全身(synthetically)或局部地给予个体的成像技术。随后，随时间测量放射性示踪剂的吸收，并用于获得关于靶向的组织与生物标记的信息。由于所用的特定同位素的高能(γ-射线)发射以及用于检测它们的设备的灵敏性和完善(sophistication)，可以从身体外部推导出放射性的二维分布。

PET中常用的正电子发射核素包括例如碳-11、氮-13、氧-15和氟-18。通过电子捕获和/或γ-发射衰变的同位素用于SPECT中，并且包括例如碘-123和锝-99m。用锝-99m标记氨基酸的示例性方法是在螯合前体的存在下还原高锝酸盐离子以形成不稳定的锝-99m-前体配合物，其又与双官能修饰的趋化肽的金属结合基团反应，形成锝-99m-趋化肽偶联物。

抗体常用于这样的体内成像诊断方法。用于体内诊断的抗体的制备和用途为本领域熟知。可以将特异性结合表1第2列的任何生物标记的标记的抗体注入疑似患有某种类型癌症(如胰腺癌)的个体，并且根据所用的特定生物标记的可检测性来诊断或评价所述个体的疾病状态。如上文所述，使用的标记根据所用的成像形式来选择。标记的定位允许确定癌症的扩散。器官或组织内标记的量还允许确定该器官或组织中癌症的存在与否。

相似地，适配体可以用于这样的体内成像诊断方法。例如，用于鉴定表1第2列所述的特定生物标记的适配体(并且因此特异性结合该特定生物标记)可以适当地进行标记并注入疑似患有胰腺癌的个体，并且根据该特定生物标记的可检测性来诊断或评价所述个体的胰腺癌状态。如上文所述，使用的标记根据所用的成像形式来选择。标记的定位允许确定癌症的扩散。器官或组织内标记的量还允许确定该器官或组织中癌症的存在与否。适配体定向的显像剂与其他显像剂相比可以具有关于组织渗透、组织分布、动力学、消除、效力和选择性方面独特且有利的特征。

这样的技术还可以任选地用标记的寡核苷酸进行，例如通过用反义寡核苷酸成像检测基因表达。这些方法用于原位杂交，例如用荧光分子或放射性核素作为标记。检测基因表达的其他方法包括例如检测报道基因的活性。

另一种常见类型的成像技术是光学成像，其中对象体内的荧光信号通过所述对象体外的光学设备检测。这些信号可以是由于实际的荧光和/或生物发光。光学检测设备灵敏性的改进增加了光学成像在体内诊断测定中的应用。

体内分子生物标记成像的用途日益增加，包括临床试验，例如在新癌症疗法的试验中更快速地测量临床效力，和/或避免对诸如多发性硬化的那些疾病的长期安慰剂治疗，其中这样的长期治疗可能被认为是存在伦理问题的。

关于其他技术的综述，参见N.Blow，Nature Methods，6，465-469，2009。

使用组织学/细胞学方法确定生物标记值

对于胰腺癌的评价，许多组织样品可用于组织学或细胞学方法。样品选择取决于原发肿瘤位置和转移的部位。例如，在内镜逆行胰胆管造影(ERCP)或内镜超声(EUS)指导的FNA时采集的组织样品(钳夹活检、细针抽吸(FNA)和/或刷检(brush cytology))可以用于组织学。腹水或腹腔灌洗液或胰液可以用于细胞学。本文鉴定的在胰腺癌个体中表现出上调的任何生物标记(见表1第6列)可以用于染色组织学样本作为疾病的指征。

在一实施方案中，对于相应的生物标记是特异性的一种或多种捕获试剂用于胰细胞样品的细胞学评价，并且可以包括以下一个或多个方面：收集细胞样品、固定细胞样品、脱水、透明(clearing)、将细胞样品固定在显微镜载玻片上、使细胞样品透化、分析物检索处理、染色、脱色、洗涤、封闭以及在缓冲溶液中与一种或多种捕获试剂反应。在另一实施方案中，细胞样品从细胞块(cell block)中产生。

在另一实施方案中，对于相应的生物标记是特异性的一种或多种捕获试剂用于胰腺组织样品的组织学评价，并且可以包括以下一个或多个方面：收集组织样本、固定组织样品、脱水、透明、将组织样品固定在显微镜载玻片上、使组织样品透化、分析物检索处理、染色、脱色、洗涤、封闭、再水合以及在缓冲溶液中与一种或多种捕获试剂反应。在另一实施方案中，固定和脱水用冷冻代替。

在另一实施方案中，使对于相应的生物标记是特异性的一种或多种适配体与组织学或细胞学样品反应，并且可以作为核酸扩增方法中的核酸靶标。合适的核酸扩增方法包括例如PCR、q-β复制酶、滚环扩增、链置换、解旋酶依赖性扩增、环介导的等温扩增、连接酶链式反应以及限制和环化辅助的滚环扩增。

在一实施方案中，将对于用于组织学或细胞学评价的相应生物标记是特异性的一种或多种捕获试剂在缓冲溶液中混合，所述缓冲溶液可以包含任何以下成分：封闭材料、竞争剂、去污剂、稳定剂、载体核酸、聚阴离子材料等。

“细胞学方案”通常包括样品收集、样品固定(fixation)、样品固定(immobilization)和染色。“细胞制备”可以包括样品收集后的一些处理步骤，包括使用一种或多种慢解离速率的适配体来染色制备的细胞。

样品收集可以包括直接将样品置于未处理的转运容器中，将样品置于含有一些类型的介质的转运容器中，或者将样品直接置于玻片上(固定)而不进行任何处理或固定。

样品固定可以通过将一部分收集的样本涂在用聚赖氨酸、明胶或硅烷处理的载玻片上而改进。玻片可以通过在玻片上涂有薄且均匀的细胞层而制备。通常采取小心操作以最小化机械扭转和干燥假象。液体样本可以通过细胞块方法处理。或者，液体样本可以与固定溶液在室温下1∶1混合约10分钟。

细胞块可以从剩余的积液、痰、尿液沉淀、胃肠液、细胞刮取物或细针抽吸物中制备。通过离心或膜过滤浓缩或压实细胞。已经开发了许多细胞块制备方法。代表性方法包括固定的沉淀、细菌琼脂或膜过滤方法。在固定的沉淀方法中，将细胞沉淀与诸如鲍音液(Bouins)、苦味酸或缓冲的福尔马林的固定剂混合，然后将混合物离心以沉淀固定的细胞。除去上清，尽可能完全地干燥细胞团块(pellet)。收集团块并包在镜头纸中，然后置于组织盒(tissue cassette)中。将组织盒置于包含其他固定剂的罐子中并作为组织样品进行处理。琼脂方法与上述方法非常相似，只是取出团块并在纸巾上干燥，然后切成两半。将切面置于载玻片上一滴熔化的琼脂中，然后将该团块用琼脂包被，保证琼脂中无气泡形成。使琼脂变硬，然后除去任何过多的琼脂。将其置于组织盒中，完成组织处理。或者，可以将团块直接悬浮于在65℃的2％液体琼脂中并离心样品。使琼脂细胞团块在4℃下固化1小时。可以从离心管中取出固体琼脂并切成两半。将琼脂包在滤纸中，然后置于组织盒中。从这点开始的处理与上述方法相同。在任何这些方法中可以用膜过滤代替离心。任何这些方法均可以用于产生“细胞块样品”。

细胞块可以使用专门的树脂制备，包括Lowicryl树脂、LR White、LRGold、Unicryl和MonoStep。这些树脂具有低粘度，并且可以在低温下及用紫外(UV)光聚合。包埋方法依赖于在脱水期间逐渐冷却样品，将样品转移至树脂以及于最终低温下在合适的UV波长处聚合细胞块。

细胞块切片可以用苏木精-伊红染色以进行细胞形态学检查，而其他切片用于特异性标记检查。

无论方法是细胞学方法或组织学方法，可以在进一步处理之前将样品固定以防止样品降解。这种方法称作“固定”，并且描述了可以互换使用的许多材料和方法。基于待检测的靶标和待分析的特定细胞/组织类型，根据经验最佳地选择样品固定方案和试剂。样品固定依赖于试剂，如乙醇、聚乙二醇、甲醇、福尔马林或异丙醇。样品应当尽可能在收集及附着在玻片上后很快固定。然而，所选的固定剂可以在各种分子靶标中引入结构改变，这使得随后更难以检测。固定(fixation)和固定(immobilization)方法及其顺序可以改变细胞的外观，并且这些改变必须是由细胞学技术人员预期及认可的。固定剂可以导致某些类型细胞收缩，并且导致细胞质出现颗粒或网状物。许多固定剂通过使细胞组分交联而起作用。这可以破坏或改变特异性表位，产生新表位，导致分子缔合以及降低膜通透性。福尔马林固定是一种最常用的细胞学/组织学方法。福尔马林在相邻蛋白之间或在蛋白内形成甲基桥。沉淀或凝固也用于固定，乙醇常用于这种类型的固定。交联与沉淀的组合也可以用于固定。牢固的固定方法在保留形态学信息方面是最佳的，而较弱的固定方法对于保留分子靶标方面是最佳的。

代表性固定剂是50％无水乙醇、2mM聚乙二醇(PEG)、1.85％甲醛。这种制剂的变化包括乙醇(50％-95％)、甲醇(20％-50％)以及仅福尔马林(甲醛)。另一种常用的固定剂是2％PEG1500、50％乙醇以及3％甲醇。将玻片在室温下置于固定剂中约10-15分钟，然后取出并干燥。一旦玻片被固定，可以用诸如PBS的缓冲溶液对其进行漂洗。

许多染料可以用于差异地突出和反差或“染色”细胞、亚细胞和组织特征或形态学结构。苏木精(hematoylin)用于将核染色为蓝色或黑色。橘黄G-6和天青伊红(Eosin Azure)均将细胞质染色。橘黄G将含有角蛋白和糖原的细胞染成黄色。伊红Y用于将核仁、纤毛、红细胞和表面上皮扁平细胞染色。罗曼诺夫斯基(Romanowsky)染色用于空气干燥的玻片，并且可以用于增强复型及区分细胞外与细胞质内材料。

染色方法可以包括增加细胞对染色的通透性的处理。用去污剂处理细胞可以用于增加通透性。为了增加细胞和组织通透性，可以将固定的样品用溶剂、皂苷类或非离子型去污剂进一步处理。酶促消化还可以改进组织样品中特异性靶标的可接近性。

染色后，使用渐增的醇浓度进行连续醇漂洗将样品脱水。最终的洗涤使用二甲苯或诸如柑桔萜的二甲苯取代物，其具有接近在载玻片上应用的盖玻片的折射率。这个最后的步骤称作透明。一旦使样品脱水及透明，应用封固剂。所选的封固剂具有接近玻璃的折射率，并且能够使盖玻片与载玻片粘合。其还抑制细胞样品另外的干燥、收缩或褪色。

无论使用的染色或处理，对胰细胞学样本的最后评价通过一些类型的显微镜检查进行以允许通过肉眼观察形态学并确定标记的存在与否。示例性显微镜检查方法包括明视野显微镜、相差显微镜、荧光显微镜和微分干涉相差显微镜方法。

如果在检查后需要对样品进行次级测试，则可以除去盖玻片并对载玻片进行脱色。脱色包括使用用于染色该载玻片的最初未加入染料的原始溶剂系统，并以与原始染色程序相反顺序进行。脱色还可以通过将该载玻片浸泡在酸醇中直至细胞无色来完成。一旦无色，则将载玻片用水浴充分漂洗并进行第二染色程序。

此外，通过使用特异性分子试剂，如抗体或者核酸探针或适配体，可以将特异性分子区分与细胞形态学分析组合。这改进了诊断细胞学的精确性。显微切割可以用于分离细胞的子集以进行另外的评价，特别是用于遗传学评价异常染色体、基因表达或突变。

制备用于组织学评价的组织样品包括固定、脱水、浸润(infiltration)、包埋和切片。用于组织学的固定试剂与用于细胞学的固定试剂非常相似或相同，并且在以诸如个体蛋白的分子为代价的情况中具有相同的保持形态学特征的问题。如果组织样品不进行固定和脱水而是代之以冷冻然后在冷冻时切片可以节省时间。这是更温和的处理程序，并且可以保留更多的个体标记。然而，冷冻对于组织样品的长期保存不可接受，因为由于冰晶体的引入引起亚细胞信息丧失。冷冻组织样品中的冰也妨碍切片过程产生极薄的切片，并且因此可以丧失一些显微镜分辨力和亚细胞结构的图像。除了福尔马林固定之外，四氧化锇也用于固定和染色磷脂(膜)。

组织的脱水是通过用渐增浓度的醇连续洗涤来完成。透明使用可以与醇和包埋材料混溶的材料，并且包括从50∶50醇∶澄清试剂开始至100％澄清试剂(二甲苯或二甲苯取代物)的逐步处理过程。浸润包括将组织与液体形式的包埋剂(温热的蜡，硝化纤维素溶液)一起温育，首先是50∶50包埋剂∶澄清剂，随后是100％包埋剂。包埋通过将组织置于模具或盒中并充填熔化的包埋剂如蜡、琼脂或明胶来完成。使包埋剂硬化。然后将硬化的组织样品切成薄切片以用于染色和随后的检查。

在染色之前，将组织切片脱蜡并再水合。用二甲苯使切片脱蜡，可以更换一次或多次二甲苯，并且通过在递减浓度的醇中连续洗涤来再水合。在脱蜡之前，可以将组织切片于约80℃下在载玻片上热固定约20分钟。

激光捕获显微切割允许从组织切片分离细胞的子集以进行进一步分析。

在细胞学中，为了增强显微特征的观察，可以将组织切片或薄片用各种染色方法染色。许多可商购的染色方法可以用于增强或鉴定特定的特征。

为了进一步增加分子试剂与细胞学/组织学样品的相互作用，已经开发了许多“分析物检索(analyte retrieval)”技术。第一种这样的技术使用高温加热固定的样品。这种方法也称作热诱导的表位检索或HIER。已经使用了许多加热技术，包括蒸汽加热、微波、高压蒸汽、水浴以及加压蒸煮或这些加热方法的组合。分析物检索溶液包括例如水、柠檬酸盐和普通盐水缓冲液。分析物检索的关键是高温的时间，但是较低温度进行较长时间也已经成功使用。分析物检索的另一关键是加热溶液的pH。据发现低pH提供最佳的免疫染色，但是也产生经常需要使用第二组织切片作为阴性对照的背景。无论缓冲液组成，使用高pH溶液通常获得最一致的益处(增加免疫染色而不增加背景)。对特异性靶标的分析物检索方法根据经验对使用加热的靶标、时间、pH和缓冲液组成的变量加以优化。使用微波分析物检索方法允许用抗体试剂顺序染色不同的靶标。但是在染色步骤之间获得抗体与酶复合物所需的时间也证实使细胞膜分析物降解。微波加热方法也改进原位杂交方法。

为了开始分析物检索过程，首先将切片脱蜡并水合。然后将玻片置于平皿或罐子中的10mM柠檬酸钠缓冲液pH6.0中。代表性程序使用1100W微波，以100％功率对玻片微波处理2分钟，随后在确保玻片保留覆盖于液体中之后使用20％功率对玻片微波处理18分钟。然后使玻片在敞口容器中冷却，随后用蒸馏水漂洗。HIER可以与酶促消化组合使用以改进靶标对免疫化学试剂的反应性。

一种这样的酶促消化方案使用蛋白酶K。20g/ml浓度的蛋白酶K在50mM Tris碱、1mM EDTA、0.5％Triton X-100、pH8.0缓冲液中制备。该方法首先包括将切片在更换2次的二甲苯中脱蜡，每次5分钟。然后将样品在更换2次的100％乙醇中水合，每次3分钟，在95％和80％乙醇中水合，每次1分钟，然后在蒸馏水中漂洗。将切片用蛋白酶K工作溶液覆盖，于37C下在加湿室中温育10-20分钟(最佳温育时间可以根据组织类型和固定程度而变化)。将切片在室温下冷却10分钟，然后在PBS吐温(Tween)20中漂洗2次2分钟。如果需要，可以将切片封闭以消除来自内源化合物和酶的潜在干扰。然后将切片用在一抗稀释缓冲液中适当稀释的一抗在室温下温育1小时或者在4C下温育过夜。然后将该切片用PBS吐温20漂洗2次2分钟。如果需要特定的应用，可以进行另外的封闭，随后用PBS吐温20再漂洗3次2分钟，然后最后完成免疫染色方案。

在室温下用1％SDS简单处理也已经证实改进了免疫组织化学染色。分析物检索方法已经应用于玻片固定切片(slide mounted section)以及自由浮动切片(free floating section)。另一处理选择是将玻片置于pH6.0的含有柠檬酸和0.1诺纳德(Nonident)P40的罐子中，并加热至95℃。然后将该玻片用诸如PBS的缓冲溶液洗涤。

对于组织的免疫学染色，可以通过将切片浸入诸如血清或脱脂奶粉的蛋白溶液中来封闭抗体与组织蛋白的非特异性结合。

封闭反应可以包括需要降低内源生物素的水平；消除内源电荷作用；失活内源核酸酶；和/或失活内源酶如过氧化物酶和碱性磷酸酶。内源核酸酶可以通过以下方式失活：用蛋白酶K降解；热处理；使用螯合剂，如EDTA或EGTA；引入载体DNA或RNA；用离液剂处理，如尿素、硫脲、盐酸胍、硫氰酸胍、高氯酸锂等或焦碳酸二乙酯。碱性磷酸酶可以通过用0.1NHCl在室温下处理5分钟或用1mM左旋咪唑处理来失活。过氧化物酶活性可以通过用0.03％过氧化氢处理来消除。内源生物素可以通过将玻片或切片在室温下浸入抗生物素蛋白(链霉抗生物素蛋白，可以取代中性链亲和素(neutravidin))溶液中至少15分钟来封闭。然后将玻片或切片在缓冲液中洗涤至少10分钟。这个步骤可以重复至少3次。然后将玻片或切片浸入生物素溶液中10分钟。这个步骤可以重复至少3次，每次使用新鲜的生物素溶液。重复缓冲液洗涤程序。应当减少封闭方案以防止破坏所关注的细胞或组织结构或者靶标或多个靶标，但是可以组合一种或多种这样的方案以“封闭”玻片或切片，然后与一种或多种慢解离速率适配体反应。参见BasicMedical Histology：the Biology of Cells，Tissues and Organs，authored byRichard G.Kessel，Oxford University Press，1998。

使用质谱方法确定生物标记值

许多质谱仪的配制(configuration)可以用于检测生物标记值。一些类型的质谱仪可以获得或可以用各种配制生产。通常，质谱仪具有以下主要部件：样品入口、离子源、质量分析仪、检测仪、真空系统以及设备控制系统和数据系统。样品入口、离子源和质量分析仪的差异通常限定设备的类型及其能力。例如，入口可以是毛细管柱液体层析源，或者可以是直接探针或镜台(stage)如用于基质辅助激光解吸电离中。常用的离子源是例如电喷射，包括纳米喷射(nanospray)和微喷射(microspray)；或者基质辅助激光解吸电离。常用的质量分析仪包括四极滤质器(quadrupole mass filter)、离子阱质量分析仪和飞行时间质量分析仪。其他质谱方法为本领域熟知(参见Burlingame et al.Anal.Chem.70：647R-716R(1998)；Kinter and Sherman，New York(2000))。

蛋白生物标记和生物标记值可以通过任何以下方式检测和测量：电喷射离子化质谱(ESI-MS)、ESI-MS/MS、ESI-MS/(MS)n、基质辅助激光解吸离子化飞行时间质谱(MALDI-TOF-MS)、表面增强激光解吸/离子化飞行时间质谱分析(SELDI-TOF-MS)、硅表面解吸/离子化(DIOS)、二次离子质谱(SIMS)、四极飞行时间(Q-TOF)、称作ultraflex III TOF/TOF的串联式飞行时间(TOF/TOF)技术、大气压化学离子化质谱(APCI-MS)、APCI-MS/MS、APCI-(MS)N、大气压光电离质谱(APPI-MS)、APPI-MS/MS和APPI-(MS)N、四极质谱、傅里叶变换质谱(FTMS)、定量质谱以及离子阱质谱。

样品制备策略用于在对蛋白生物标记进行质谱表征及确定生物标记值之前标记和富集样品。标记方法包括但不限于用于相对和绝对定量的等量异位标签(iTRAQ)和在细胞培养中用氨基酸稳定同位素标记(SILAC)。在质谱分析之前用于选择性富集候选生物标记蛋白样品的捕获试剂包括但不限于适配体、抗体、核酸探针、嵌合物、小分子、F(ab’)2片段、单链抗体片段、Fv片段、单链Fv片段、核酸、凝集素、配体-结合受体、affybodies、纳米抗体、锚蛋白、结构域抗体、可变抗体支架(例如双抗体等)印刷的聚合物、高亲合性多聚体、肽模拟物、拟肽、肽核酸、苏糖核酸、激素受体、细胞因子受体及合成的受体以及这些物质的修饰和片段。

使用邻位连接技术确定生物标记值

邻位连接技术可以用来确定生物标记值。简单地说，使测试样品与一对亲和性探针接触，所述一对亲和性探针可以是一对抗体或一对适配体，这对的每个成员延伸出寡核苷酸。这对亲和性探针的靶标可以是一个蛋白上的两个不同决定簇或者两个不同蛋白中每一个上的一个决定簇，其可以作为同源或异源多聚复合物存在。当探针结合靶决定簇时，寡核苷酸延伸的游离端足够接近以杂交在一起。寡核苷酸延伸的杂交通过常见的连接寡核苷酸来促进，所述连接寡核苷酸在位置足够接近时用于将寡核苷酸延伸连接在一起。一旦探针的寡核苷酸延伸杂交，延伸的末端通过酶促DNA连接而连接在一起。

每个寡核苷酸延伸包含用于PCR扩增的引物位点。一旦寡核苷酸延伸连接在一起，寡核苷酸形成连续的DNA序列，通过PCR扩增，其显示关于靶蛋白的性质和量的信息，以及当靶决定簇在两个不同蛋白上时关于蛋白-蛋白相互作用的信息。邻位连接可以通过使用实时PCR提供实时蛋白浓度和相互作用信息的高度灵敏和特异性的测定。不结合所关注的决定簇的探针不具有邻近的相应的寡核苷酸延伸，并且不可以进行连接或PCR扩增，导致没有信号产生。

前述测定允许检测可用于诊断胰腺癌的方法的生物标记值，其中所述方法包括在来自个体的生物学样品中检测至少N个生物标记值，所述至少N个生物标记值每个对应于选自表1第2列提供的生物标记的组的生物标记，其中如下文详述，利用生物标记值的分类指示所述个体是否患有胰腺癌。尽管某些所述胰腺癌生物标记可以单独用于检测和诊断胰腺癌，但是本文所述的方法还用于分组胰腺癌生物标记的多个子集，其各自可用作三个或更多个生物标记的组。因此，本申请的各个实施方案提供了包含N个生物标记的组合，其中N是至少三个生物标记。在其他实施方案中，N选自2-65个生物标记中的任意数。应当理解N可以选自任何上述范围以及相似但更高级范围中的任意数。根据本文所述的任何方法，可以单独检测和分类生物标记值，或者可以共同检测和分类生物标记值，例如以多重测定形式。

在另一方面，本发明提供了检测胰腺癌不存在的方法，所述方法包括在来自个体的生物学样品中检测至少N个生物标记值，所述至少N个生物标记值每个对应于选自表1第2列提供的生物标记的组的生物标记，其中如下文详述，生物标记值的分类指示所述个体中不存在胰腺癌。尽管某些所述胰腺癌生物标记可以单独用于检测和诊断胰腺癌不存在，但是本文所述的方法还用于分组胰腺癌生物标记的多个子集，其各自可用作三个或更多个生物标记的组。因此，本申请的各个实施方案提供了包含N个生物标记的组合，其中N是至少三个生物标记。在其他实施方案中，N选自2-65个生物标记中的任意数。应当理解N可以选自任何上述范围以及相似但更高级范围中的任意数。根据本文所述的任何方法，可以单独检测和分类生物标记值，或者可以共同检测和分类生物标记值，例如以多重测定形式。

生物标记分类和疾病评分计算

给定诊断测试的生物标记“特征”含有标记的集合，每个标记在所关注群体中具有不同水平。在这方面，不同水平可以指针对两个或更多个组中个体的标记水平的不同平均值(mean)，或者两个或更多个组中的不同的方差，或者这两者的组合。对于最简单形式的诊断测试，这些标记可以用于将来自个体的未知样品分配到两组中的一组中，疾病组或非疾病组。将样品分配于两个或更多个组中的一组称为分类，用于实现这种分配的程序称为分类器或分类方法。分类方法也可以称为评分方法。有许多分类方法可以用于从生物标记值的集合构建诊断分类器。通常，分类方法最容易用监督学习技术进行，其中用获得自希望区分的两个(或更多个，对于多个分类状态)不同组内的个体的样品收集数据集合。因为每个样品所属的类别(组或群体)事先对于每个样品均是已知的，所以可以训练分类方法以获得期望的分类应答。还可以使用无监督学习技术来产生诊断分类器。

开发诊断分类器的常用方法包括决策树；bagging，boosting，forests和随机forests；基于规则推论的学习(rule inference based learning)；Parzen窗方法(Parzen Windows)；线性模型；逻辑；神经网络方法；无监督聚类；K-means；分级上升/下降(hierarchical ascending/descending)；半监督学习；原型方法；近邻取样(nearest neighbor)；核密度估计(kernel densityestimation)；支持向量机(support vector machine)；隐马尔可夫模型(hiddenMarkov model)；玻尔兹曼学习(Boltzmann Learning)；并且分类器可以简单组合或者以最小化特定目标函数的方式组合。综述参见例如PatternClassification，R.O.Duda，et al.，editors，John Wiley & Sons，2nd edition，2001；还参见The Elements of Statistical Learning-Data Mining，Inference，andPrediction，T.Hastie，et al.，editors，Springer Science+Business Media，LLC，2nd edition，2009；它们均整体援引加入本文。

为了用监督学习技术产生分类器，获得称为训练数据的样品集合。在诊断测试的情况下，训练数据包括来自未知样品稍后会被分配的不同组(类别)的样品。例如，收集自对照群体的个体和特定疾病群体的个体的样品可以组成训练数据以开发可以分类未知样品(或者，更特别地，样品所来自的个体)为患有该疾病或无该疾病的分类器。从训练数据开发分类器已知为训练该分类器。分类器训练的具体细节取决于监督学习技术的性质。作为示例，训练朴素贝叶斯(

Bayesian)分类器的实例在下文进行描述(参见例如Pattern Classification，R.O.Duda，et al.，editors，John Wiley & Sons，2ndedition，2001；还参见The Elements of Statistical Learning-Data Mining，Inference，and Prediction，T.Hastie，et al.，editors，Springer Science+BusinessMedia，LLC，2nd edition，2009)。

由于通常在训练集合中存在比样品多得多的潜在生物标记值，所以必须小心避免过拟合。当统计学模型描述随机误差或噪声而非潜在关系时发生过拟合。过拟合可以由各种方式避免，这包括例如限制开发分类器中使用的标记数目，假设标记应答互相独立，限制采用的潜在统计学模型的复杂性，以及保证潜在统计学模型符合数据。

使用生物标记的集合开发诊断测试的说明性实例包括应用朴素贝叶斯分类器，这是一种基于贝叶斯(Bayes)定理的简单或然性分类器，具有生物标记的严格独立处理。每个生物标记由针对每种类别中测量的RFU值或logRFU(相对荧光单位)值的类别依赖性概率密度函数(pdf)描述。一个类别中的标记的集合的共同pdf(joint pdf)假定为每个生物标记的个体类别依赖性pdf的积。在这种情况下训练朴素贝叶斯分类器意味着分配参数(“参数化”)以表征类别依赖性pdf。类别依赖性pdf的任何潜在模型均可以使用，但是模型应该通常符合在训练集合中观察到的数据。

具体地，测量疾病类别中生物标记i的值x_i的类别依赖性概率写作p(x_i|d)，并且观察具有值

的n个标记的整体朴素贝叶斯概率写作

其中各个x_i是以RFU或log RFU表示的测量的生物标记水平。对于未知的分类分配通过以下方法来促进：对于相同测量值，计算与不患病(对照)的概率

相比的具有测量的

的患病概率

这些概率的比率通过应用贝叶斯定理从类别依赖性pdf计算，即

其中p(d)为适合测试的群体中疾病的发病率。对这一比率的两边取对数并从以上代入朴素贝叶斯类别依赖性概率，获得

\ln (\frac{p (d | \tilde{x})}{p (c | \tilde{x})}) = Σ_{i = 1}^{n} \ln (\frac{p (x_{i} | \overset{&OverBar;}{d})}{p (x_{i} | c)}) + \ln (\frac{p (\overset{&OverBar;}{d})}{1 - p (d)}) .

这种形式已知为log似然比，并简单地表示不患有特定疾病比患有所述疾病的log似然性，并且主要由n个单独生物标记的单独log似然比的总和组成。在其最简单的形式中，未知样品(或者，更特别地，样品所来自的个体)分类为不患有疾病，如果上述比率大于0；而分类为患有疾病，如果所述比率小于0。

在一示例性实施方案中，类别依赖性生物标记pdf p(x_i|c)和p(x_i|d)假定为在测量的RFU值x_i中为正态分布或log正态分布，即

p (x_{i} | c) = \frac{1}{\sqrt{2 π} σ_{c, i}} \exp (- \frac{{(x_{i} - μ_{c, i})}^{2}}{2 σ_{c, i}^{2}}),

并且对于具有相似表达。模型的参数化要求估计来自训练数据的每个类别依赖性pdf的两个参数，平均值μ和方差δ²。这可以通过许多方式实现，包括例如最大似然估计、最小平方以及本领域技术人员已知的任何其他方法。将正态分布代入上文所定义的log-似然比，获得以下表达式：

\ln (\frac{p (d | \tilde{x})}{p (c | \tilde{x})}) = Σ_{i = 1}^{n} \ln (\frac{σ_{c, i}}{σ_{d_{i}}}) - \frac{1}{2} Σ_{i = 1}^{n} [{(\frac{x_{i} - μ_{d, i}}{σ_{d, i}})}^{2} - {(\frac{x_{i} - μ_{c, i}}{σ_{c, i}})}^{2}] + \ln (\frac{p (d)}{1 - p (d)})

一旦μ和δ²的集合已对来自训练数据的每个类别的每个pdf定义，并且确定群体中的疾病发病率，则贝叶斯分类器完全确定并且可以用于分类具有测量值的未知样品。

朴素贝叶斯分类器的性能取决于用于构建和训练分类器的生物标记的数目和质量。如以下实施例3所定义，单个生物标记根据其KS-距离(柯尔莫可洛夫-斯米洛夫(Kolmogorov-Smirnov))运行。如果分类器性能度量(metric)定义为接受者操作特征曲线(AUC)下的面积，则完美分类器的评分为1，而随机分类器的平均评分为0.5。大小为n和m的两个集合A和B之间的KS-距离的定义为值D_n，m＝sup_x|F_A，n(x)-F_B，m(x)|，其为两个基于经验的累积分布函数(cdf)之间的最大差异。n个观察X_i的集合A的基于经验的cdf定义为

F_{A, n} (x) = \frac{1}{n} Σ_{i = 1}^{n} I_{X_{i} \leq x},

其中

为指示物函数，如果X_i＜x，其等于1，否则其等于0。通过定义，这个值介于0和1之间，其中1的KS-距离表示基于经验的分布不重叠。

具有良好KS距离(例如＞0.3)的后续标记的加入通常会改善分类性能，如果后续加入的标记独立于第一标记。使用灵敏性加特异性作为分类器评分，用贪婪算法的变体会直接产生许多高评分分类器。(贪婪算法是那些应用了解决问题的元启发式(metaheuristic)算法，这些算法使得本地优化选择在每个阶段都可以找到全方位的最优化。)

此处使用的算法在实施例4中详细描述。简单地说，从潜在生物标记表中产生所有单分析物分类器并加入到列表中。接下来，向每个存储的单分析物分类器进行所有可能的第二分析物的加入，在一个新列表上储存预定数目的最佳评分配对，例如一千个。用这个最佳二-标记分类器的新列表开发所有可能的三标记分类器，再次储存其中最佳的一千个。继续这个过程直至评分进入平稳状态或开始随着额外标记的加入而变差。可以评价那些在收敛后仍保留的高评分分类器对于目标用途的期望性能。例如，在一种诊断应用中，具有高灵敏性和中等特异性的分类器可以比中等灵敏性和高特异性是更期望的。在另一诊断应用中，具有高特异性和中等灵敏性的分类器可以是更期望的。期望的性能水平通常基于在假阳性和假阴性数之间必须进行的交换(trade-off)而选择，所述假阳性和假阴性可以针对特定诊断应用而各自容忍。这种交换通常取决于假阳性或假阴性误差的医学后果。

现有技术已知各种其他技术，并且可以用来使用朴素贝叶斯分类器从生物标记列表产生许多潜在分类器。在一实施方案中，所谓的遗传算法可以使用上文定义的适合度评分用于组合不同的标记。遗传算法特别适合开发潜在分类器的大且多样的群体。在另一实施方案中，所谓的蚁群优化(antcolony optimization)可以用于产生分类器的集合。现有技术已知的其他策略也可以采用，包括例如其他进化策略以及模拟退火和其他随机检索方法。还可以采用元启发式方法如和声搜索(harmony search)。

示例性实施方案使用表1第2列所列的任意数目的胰腺癌生物标记以各种组合来产生用于检测胰腺癌的诊断测试(如何鉴定这些生物标记的详细描述见实施例2)。在一实施方案中，诊断胰腺癌的方法使用朴素贝叶斯分类方法联合表1第2列所列的任意数目的胰腺癌生物标记。在说明性实例(实施例3)中，用于从GI和正常对照群体检测胰腺癌的最简单的测试可以使用诸如CTSB的单生物标记来构建，CTSB在胰腺癌中差异表达，KS-距离为0.52。使用来自表16的针对CTSB的参数μ_c，i、σ_c，i、μ_d，i和σ_d，i以及上述log-似然性的等式，可以产生具有0.79的AUC的诊断测试，见表15。这个测试的ROC曲线示于图2。

例如，具有0.40的KS-距离的生物标记C5a的添加将分类器性能显著改善至0.85的AUC。注意，由两个生物标记构建的分类器的评分不是KS-距离的简单加和；当组合生物标记时KS-距离不是加合性时，要使用许多较弱标记来实现与强标记相同的性能水平。例如，加入第三标记C5将分类器性能增加至0.88的AUC。加入额外的生物标记例如CCL18、CSF1R、KLK7、ETHE1、C5-C6、KLK8和VEGFA产生了一系列胰腺癌测试，总结在表15中，并在图3中显示为一系列ROC曲线。作为分类器构建中使用的分析物数目的函数的分类器评分示于图4。这种示例性10-标记分类器的AUC为0.91。

表1第2列所列的标记可以许多方式组合以产生用于诊断胰腺癌的分类器。在一些实施方案中，根据所选的特定诊断性能标准，生物标记的组由不同数目的分析物组成。例如，生物标记的某些组合会产生比其他组合更灵敏(或更特异性)的测试。

一旦组限定为包括来自表1第2列的生物标记的特定集合，并且从训练数据集合构建分类器，则诊断测试的定义完整。在一实施方案中，用于分类未知样品的程序示于图1A。在另一实施方案中，用于分类未知样品的程序示于图1B。将生物学样品适当稀释，然后进行一个或多个测定以产生用于分类的相关定量生物标记水平。测量的生物标记水平用作分类方法的输入，该方法输出所述样品的分类和任选的评分，这反映了类别分配的置信度。

表1鉴定了可用于诊断胰腺癌的65种生物标记。当与在生物标记发现的尝试中通常发现的相比时，这比预期令人惊讶地高，可能归因于所述研究的规模，其涵盖在几百个个体样品中测量的超过800种蛋白，在一些情况下浓度为低毫微微摩尔范围。据推测，发现的大量生物标记反映了在肿瘤生物学和身体对肿瘤存在的应答中涉及的不同生物化学途径；每种途径和过程均涉及许多蛋白。结果显示没有一小组蛋白的单个蛋白对这样复杂的过程独特提供信息；相反，多种蛋白包括在相关过程中，如凋亡或细胞外基质修复。

鉴于在所述研究中鉴定的许多生物标记，可以预期能够衍生大量高性能分类器，它们可以用于各种诊断方法。为测试这个观点，用表1的生物标记评价了几万个分类器。如实施例4所述，表1所示的生物标记的许多子集可以组合以产生有用的分类器。例如，提供了用于检测胰腺癌的包含1、2和3个生物标记的分类器的描述。如实施例4所述，用表1的生物标记构建的所有分类器比用“非标记”构建的分类器明显更好。

还测试了通过随机排除表1的一些标记获得的分类器的性能，随机排除产生了较小的子集，从这些子集来构建分类器。如实施例4部分3所述，从表1中标记的随机子集构建的分类器的表现类似于用表1中标记的完全列表构建的最佳分类器。

还测试了通过从10-标记聚集中排除“最佳”单个标记而获得的10-标记分类器的性能。如实施例4部分3所述，未用表1的“最佳”标记构建的分类器也表现良好。表1所列生物标记的许多子集表现接近最佳，甚至在除去表中所列最好的15个标记之后也如此。这暗示任何特定分类器的性能特征可能不是由于生物标记的一些小核心组所致，并且疾病过程可能影响许多生物化学途径，其改变许多蛋白的表达水平。

实施例4的结果提示一些可能的结论：首先，大量生物标记的鉴定允许它们聚集成巨大数目的分类器，其提供相似的高性能。第二，分类器可以这样构建：特定生物标记可以以反映冗余的方式取代其他生物标记，所述冗余无疑遍及潜在疾病过程的复杂性。也就是说，由表1中鉴定的任何单个生物标记贡献的有关疾病的信息与由其他生物标记贡献的信息重叠，由此表1中特定生物标记或生物标记的小组无需包括在任何分类器中。

示例性实施方案使用从表16的数据构建的朴素贝叶斯分类器以分类未知样品。图1A和1B中示出了程序。在一实施方案中，将生物学样品任选地稀释并且进行多重适配体测定。将来自所述测定的数据如实施例3所述正态化及校准，将所得生物标记水平用作贝叶斯分类方案的输入。对于每个测量的生物标记单独计算log-似然比，然后求和以产生最终分类评分，其也称为诊断评分。可以报道所得分配及总体分类评分。任选地，还可以报道对每个生物标记水平计算的个体log-似然性风险因子。分类评分计算的细节示于实施例3。

试剂盒

表1第2列的生物标记(以及额外的生物医学信息)的任何组合可以通过使用合适的试剂盒检测，如用于进行本文公开的方法的试剂盒。此外，任何试剂盒可以含有本文所述的一种或多种可检测标记，如荧光部分等。

如本文进一步描述，在一实施方案中，试剂盒包含：(a)一种或多种捕获试剂(如至少一种适配体或抗体)，以检测生物学样品中的一种或多种生物标记，其中所述生物标记包括表1第2列所列的任何生物标记，及任选存在的(b)一种或多种软件或计算机程序产品，以将从其中获得所述生物学样品的个体分类为患有或不患有胰腺癌，或者确定所述个体患有胰腺癌的似然性。或者，除了一种或多种计算机程序产品之外，可以提供人工进行上述步骤的一种或多种操作指南。

固体支持物与相应捕获试剂及信号产生材料的组合在本文中称作“检测装置”或“试剂盒”。试剂盒还可以包含使用该装置和试剂、处理样品以及分析数据的使用说明书。此外，试剂盒可以与计算机系统或软件一起使用以分析和报道生物学样品的分析结果。

试剂盒还可以含有一种或多种试剂(如增溶缓冲液、去污剂、洗涤剂或缓冲液)，以对生物学样品进行处理。本文所述的任何试剂盒还可以包含例如缓冲液、封闭剂、质谱基质材料、抗体捕获剂、阳性对照样品、阴性对照样品、软件以及信息如方案、指导和参考数据。

在一方面，本发明提供了分析胰腺癌状态的试剂盒。试剂盒包含用于选自表1第2列的一个或多个生物标记的PCR引物。试剂盒还可以包含使用及生物标记与胰腺癌相关性的指导。试剂盒还可以包含DNA阵列，其含有选自表1第2列的一个或多个生物标记的补体、用于扩增或分离样品DNA的试剂和/或酶。试剂盒可以包含用于实时PCR的试剂，例如TaqMan探针和/或引物，以及酶。

例如，试剂盒可以包含：(a)试剂，其至少包含用于定量测试样品中的一种或多种生物标记的捕获试剂，其中所述生物标记包括表1第2列所列的生物标记或本文所述的任何其他生物标记或生物标记组；以及任选存在的(b)一种或多种算法或者计算机程序，以进行以下步骤：比较所述测试样品中定量的每个生物标记的量与一个或多个预定截断值，基于所述比较分配定量的每个生物标记评分，组合定量的每个生物标记的分配评分以获得总评分，比较该总评分与预定评分，以及使用所述比较确定个体是否患有胰腺癌。或者，除了一种或多种算法或计算机程序之外，可以提供人工进行上述步骤的一种或多种操作指南。

计算机方法和软件

一旦选择生物标记或生物标记组，则诊断个体的方法可包括以下步骤：1)收集或以其他方式获得生物学样品；2)进行分析方法以检测和测量所述生物学样品中的生物标记或生物标记组；3)进行用于收集生物标记值的方法所需的任何数据归一化或标准化；4)计算标记评分；5)组合所述标记评分以获得总诊断评分；以及6)报告所述个体的诊断评分。在这种方法中，诊断评分可以是从所有标记计算的总和确定的单一数值，将该数值与指示疾病存在与否的预设阈值比较。或者，诊断评分可以是一系列带(bar)，其各自代表生物标记值，并且可以将应答模式与预设模式比较以确定疾病的存在与否。

本文所述方法的至少一些实施方案可以使用计算机实施。计算机系统100的实例在图6中示出。参考图6，系统100示出包含通过总线108电耦合的硬件元件，包括处理器101、输入设备102、输出设备103、存储设备104、计算机可读取的存储介质读取器105a、通讯系统106、处理加速(如DSP或特定用途处理器)107和存储器109。计算机可读取存储介质读取器105a与计算机可读取的存储介质105b进一步耦合，该组合全面地代表远程、局域、固定和/或可移动的存储装置加上存储介质、存储器等，以暂时和/或更长久地含有计算机可读取的信息，这可以包括存储设备104、存储器109和/或任何其他这样的可存储系统100资源。系统100还包含软件元件(显示目前位于工作内存191中)，包括操作系统192及其他编码193，如程序、数据等。

关于图6，系统100具有广泛的灵活性和可配置性。因此，例如单一计算机结构(single architecture)可以用于完成一个或多个服务器，其可以根据目前期望的方案、方案变化、扩展等进一步配置。然而，本领域技术人员应当了解可以根据更具体的应用要求更好地利用实施方案。例如，一个或多个系统元件可以在系统100部件内作为子元件执行(如在通讯系统106内)。也可以使用定制的硬件和/或特定元件可以在硬件、软件或者硬件和软件中执行。此外，虽然可以使用与其他计算设备如网络输入/输出设备(未示出)连接，但是应当理解也可以利用有线、无线、调制解调器和/或与其他计算设备的其他连接或多个连接。

在一方面，所述系统可以包含含有胰腺癌特征性生物标记的特征的数据库。生物标记数据(或生物标记信息)可以用作计算机的输入以用作计算机执行方法的一部分。所述生物标记数据可以包括本文所述的数据。

在一方面，所述系统还包含一个或多个装置以将输入数据提供给一个或多个处理器。

所述系统还包含用于存储分等级的数据元件的数据集合的存储器。

在另一方面，用于提供输入数据的装置包括检测仪以检测数据元件的特征，如质谱仪或者基因芯片读取器。

所述系统还可以包含数据库管理系统。用户请求或询问可以通过数据库管理系统理解的适当语言格式化，该数据库管理系统处理所述询问以从训练集合的数据库中提取相关信息。

所述系统可以与网络连接，所述网络连接网络服务器以及一个或多个客户端。网络可以是本领域已知的局域网(LAN)或广域网(WAN)。优选地，服务器包括运行计算机程序产品(如软件)所需的硬件，以进入数据库数据来处理用户请求。

所述系统可以包含操作系统(如UNIX或Linux)，以执行来自数据库管理系统的命令。在一方面，操作系统可以在全球通讯网络上运行，如在国际互联网上运行，并且利用全球通讯网络服务器来连接这样的网络。

所述系统可以包括这样的一个或多个装置，其包含图形显示界面，该界面包括界面元件如按钮、下拉菜单、滚动条、输入文本的信息栏等，这些是本领域已知的图形用户界面的常见元件。用户界面上登录的请求可以传给系统中的应用程序以格式化从而在一个或多个系统数据库中搜寻相关信息。用户登录的请求或询问可以任何合适的数据库语言建立。

图形用户界面可以通过作为操作系统一部分的图形用户界面编码产生，并且可以用于输入数据和/或显示输入的数据。处理的数据的结果可以在界面上显示，在与该系统通讯的打印机上打印，存储在存储装置中，和/或上传至网络或者可以计算机可读取介质的形式提供。

所述系统可以与输入装置通讯，以将关于数据元件的数据提供给系统(如表达值)。在一方面，输入装置可以包括基因表达谱系统，包括如质谱仪、基因芯片或阵列读取器等。

根据各个实施方案分析胰腺癌生物标记信息的方法和设备可以通过任何合适的方式执行，例如使用在计算机系统上运行的计算机程序。可以使用常规的计算机系统，其包含处理器和随机存取存储器，如可远程登录的应用服务器、网络服务器、个人电脑或工作站。其他计算机系统部件可以包括存储装置或信息存储系统，如大量存储系统和用户界面，例如常规的监视器、键盘和跟踪装置。计算机系统可以是单机系统，或者是包含服务器以及一个或多个数据库的计算机网络的一部分。

胰腺癌生物标记分析系统可以提供完整数据分析的运算(function)和运行，如数据收集、处理、分析、报告和/或诊断。例如，在一实施方案中，计算机系统可以执行计算机程序，该程序可以接收、储存、搜寻、分析和报告关于胰腺癌生物标记的信息。计算机程序可以包含进行各种运算或运行的多个模块，如处理原始数据和产生补充数据的处理模块，以及分析原始数据和补充数据以产生胰腺癌状态和/或诊断的分析模块。诊断胰腺癌状态可以包括产生或收集任何其他信息，包括额外的生物医学信息、关于个体相对于疾病的状况，鉴定是否需要进一步检测，或者另外评价个体的健康状态。

关于图7，可以看出根据公开的实施方案的原理利用计算机的方法的一个实例。在图7中，示出了流程图3000。在模块(block)3004中，可以检索个体的生物标记信息。所述生物标记信息可以从计算机数据库中检索，例如在测试个体的生物学样品之后。生物标记信息可以包含生物标记值，所述生物标记值每个对应于选自由表1第2列提供的生物标记组成的组的至少N个生物标记之一，其中N＝2-65。在模块3008中，计算机可以用于将每个生物标记值分类。在模块3012中，基于多个分类可以确定个体患有胰腺癌的似然性。可以将该指示输出至显示器或其他显示装置，以供人观察。因此，例如该指示可以在计算机的显示器屏幕或其他输出装置上显示。

现在关于图8，通过流程图3200举例说明了根据另一实施方案利用计算机的可选方法。在模块3204中，可以利用计算机检索个体的生物标记信息。生物标记信息包含生物标记值，所述生物标记值对应于选自表1第2列提供的生物标记的组的生物标记。在模块3208中，可以用计算机将生物标记值进行分类。并且，在模块3212中，基于所述分类可以对个体患有胰腺癌的似然性作出指示。可以将该指示输出至显示器或其他显示装置，以供人观察。因此，例如该指示可以在计算机的显示器屏幕或其他输出装置上显示。

本文所述的一些实施方案可以执行以包含计算机程序产品。计算机程序产品可以包括具有包含于介质中的计算机可读取程序编码的计算机可读取介质，以使得应用程序可以在具有数据库的计算机上执行。

如本文所用，“计算机程序产品”指自然或程序设计语言语句形式的组织化的指令集合，其包含于任何性质的物理介质上(如书写、电子、磁性、光学或其他性质)，并且可以与计算机或其他自动化数据处理系统一起使用。这样的程序设计语言语句在由计算机或数据处理系统执行时，使得所述计算机或数据处理系统根据语句的特定内容起作用。计算机程序产品包括但不限于：包含于计算机可读取介质中的源代码和目标码和/或测试或数据库中的程序。此外，允许计算系统或数据处理设备以预选方式起作用的计算机程序产品可以以多种形式提供，包括但不限于源代码(original sourcecode)、汇编码(assembly code)、目标码、机器语言、前述代码的加密或压缩形式以及任何和所有等价物。

在一方面，本发明提供了一种指示胰腺癌的似然性的计算机程序产品。所述计算机程序产品包括包含程序代码的计算机可读取介质，所述程序代码可由计算装置或系统的处理器执行，所述程序代码包括：检索归因于来自个体的生物学样品的数据的代码，其中所述数据包括生物标记值，所述生物标记值每个对应于所述生物学样品中选自表1第2列提供的生物标记的组的至少N个生物标记之一，其中N＝2-65；以及执行分类方法的代码，所述分类方法将所述个体的胰腺癌状态指示为所述生物标记值的函数。

在另一方面，本发明提供了一种指示胰腺癌的似然性的计算机程序产品。所述计算机程序产品包括包含程序代码的计算机可读取介质，所述程序代码可由计算装置或系统的处理器执行，所述程序代码包括：检索归因于来自个体的生物学样品的数据的代码，其中所述数据包括生物标记值，所述生物标记值对应于所述生物学样品中选自表1第2列提供的生物标记的组的生物标记；以及执行分类方法的代码，所述分类方法将所述个体的胰腺癌状态指示为所述生物标记值的函数。

虽然已经描述了本发明的方法或设备的各种实施方案，但是应当理解所述实施方案可以通过与计算机耦合的代码执行，如在计算机上或可由计算机登录的代码。例如，软件和数据库可以用于执行许多上述方法。因此，除了由硬件完成的实施方案之外，还应当注意到这些实施方案可以通过使用这样的产品实现，所述产品包含具有在其中包含计算机可读取程序代码的计算机可用介质，其允许行使本文公开的功能。因此，期望所述实施方案也可以被视为由本专利以其程序代码方式等保护。此外，所述实施方案可以体现为存储在实际上任何类型的计算机可读取存储器中的代码，包括但不限于RAM、ROM、磁性介质、光学介质或磁-光学介质。更通常地，所述实施方案可以在软件或硬件或者它们的任何组合中实施，包括但不限于在通用处理器、微代码、PLA或ASIC上运行的软件。

还期望所述实施方案可以作为包含于载波中的计算机信号以及通过传送介质传送的信号(如电信号和光信号)实现。因此，上述各种类型的信息均可以在结构中格式化，如数据结构，并且作为电信号通过传送介质传送，或者存储在计算机可读取介质中。

还应当注意，本文所列举的许多结构、材料和条文可以列举为用于行使功能或行使功能的步骤的方式。因此，应当理解这样的语言有权覆盖本说明书公开的所有的这些结构、材料或条文以及它们的等价物，包括通过引用并入本文的内容。

关于胰腺癌，上文详细描述了生物标记鉴定过程、本文公开的生物标记的利用以及确定生物标记值的各种方法。然而，所述过程的应用、鉴定的生物标记的用途以及确定生物标记值的方法完全可以应用于其他特定类型的癌症，一般的癌症，任何其他疾病或医学状况，或者鉴定可能或可能不受益于辅助医学治疗的个体。除了当从上下文清楚地看出指与胰腺癌相关的特定结果时，本文中提到胰腺癌可以理解为包括其他类型的癌症、一般的癌症或者任何其他疾病或医学状况。

实施例

下述实施例仅用于示例目的而不意图限制所附权利要求限定的本申请的范围。本文描述的所有实施例用本领域技术人员公知的常规标准技术进行。下述实施例描述的常规分子生物学技术可以如标准实验室手册所述进行，如Sambrook et al.，Molecular Cloning：A Laboratory Manual，3rd.ed.，ColdSpring Harbor Laboratory Press，Cold Spring Harbor，N.Y.，(2001)。

实施例1.样品的多重适配体分析

本实施例描述用于分析样品和对照以鉴定表1第2列所列的生物标记(见图9)和鉴定表19所列的癌症生物标记的多重适配体测定。对于胰腺癌、肺癌和间皮瘤研究，多重分析使用823个适配体，每个对于特定靶标是独特的。

在这个方法中，每次添加溶液均更换移液器尖头。

而且，除非另有说明，大多数溶液转移和洗涤添加使用BeckmanBiomek FxP的96孔头(head)。除非另有说明，手工移液的方法步骤使用12通道P200 Pipetteman(Rainin Instruments，LLC，Oakland，CA)。称为SB17的定制缓冲液由内部(in-house)制备，其包含40mM HEPES、100mM NaCl、5mM KCl、5mM MgCl2、1mM EDTA，pH7.5。称为SB18的定制缓冲液由内部制备，其包含40mM HEPES、100mM NaCl、5mM KCl、5mMMgCl2，pH7.5。除非另有说明，所有步骤均在室温下进行。

1.适配体储液的制备

对于不具有光可裂解生物素接头的适配体，用合适的光可裂解生物素酰化引物在1x SB17，0.05％吐温-20中以8x浓度制备用于10％、1％和0.03％血浆的定制适配体储液，其中所得的引物浓度是相关适配体浓度的3倍。引物与全部或部分相应适配体杂交。

将3种8x适配体溶液的每一种分别以1∶4稀释入1xSB17，0.05％吐温-20(1500μL的8x储液稀释入4500μL的1xSB17，0.05％吐温-20)以实现2x浓度。然后将每种稀释的适配体主混合物(master mix)分配到4个2mL螺旋盖试管中，每个试管1500μL，并且加热至95℃保持5分钟，随后在37℃下温育15分钟。温育后，将对应于特定适配体主混合物的4个2mL试管组合入试剂槽(trough)，将55μL的2x适配体混合物(对于所有三种混合物)手工移液入96孔Hybaid平板并用箔将平板密封。最终结果是3个96孔箔密封的Hybaid平板。各个适配体浓度为0.5nM。

2.测定样品制备

将储存在-80℃的100％血浆的冷冻等份置于25℃水浴中保持10分钟。将融化的样品置于冰上，温和地涡漩(设为4)8秒钟，然后再置于冰上。

在4℃下，用50μL的8通道多通道移液器(spanning pipettor)将16μL样品转移至96孔Hybaid平板中以制备20％样品溶液，每个孔含有64μL合适的样品稀释物(对于血浆，0.8x SB18、0.05％吐温-20、2μM Z-block_2、0.6mM MgCl₂)。将这个平板保存在冰上直至开始下一个样品稀释步骤。

为了开始样品和适配体平衡，将20％样品平板短暂离心并置于Beckman FX上，在此将其用96孔移液器上下移液来混合。然后通过将10μL的20％样品稀释至90μL的1xSB17，0.05％吐温-20中来制备2％样品。然后，将6μL所得的2％样品稀释至194μL的1xSB17，0.05％吐温-20中以制备0.06％样品平板。在Beckman Biomek FxP上进行稀释。每次转移后，通过上下移液来将溶液混合。然后，通过将55μL样品加入到55μL合适的2x适配体混合物中，将3个样品稀释平板转移至它们各自的适配体溶液。将样品和适配体溶液通过上下移液在机器人(robot)上混合。

3.样品平衡结合

将样品/适配体平板用箔密封，并且置于37℃培养箱中保持3.5小时，然后进行Catch1步骤。

4.制备Catch2珠平板

将5.5mL的MyOne(Invitrogen Corp.，Carlsbad，CA)链霉抗生物素蛋白C1珠等份(10mg/mL)用等体积的20mM NaOH洗涤2次(每次洗涤温育5分钟)，用等体积的1x SB17，0.05％吐温-20洗涤3次，并且重悬浮于5.5mL的1x SB17，0.05％吐温-20中。用12-通道(span)多通道移液器将50μL该溶液手工移液至96孔Hybaid平板的每个孔中。然后将平板用箔覆盖，并保存在4℃用于测定。

5.制备Catch1珠平板

将3个0.45μm的Millipore HV平板(Durapore membrane，Cat#MAHVN4550)用100μL的1x SB17，0.05％吐温-20平衡至少10分钟。然后通过平板过滤平衡缓冲液，向每孔中加入133.3μL的7.5％链霉抗生物素蛋白-琼脂糖珠浆液(于1x SB17，0.05％吐温-20中)。为了在将链霉抗生物素蛋白-琼脂糖珠转移入滤板时保持它们悬浮，将珠溶液用200μL，12-通道移液器手工混合15次。在将珠分配于3个滤板中之后，施加真空以除去珠上清。最后，将珠在滤板中用200μL的1x SB17，0.05％吐温-20洗涤，然后重悬于200μL的1x SB17，0.05％吐温-20中。将滤板的底部吸干(blot)，并将平板储存以用于测定。

6.装载Cytomat

将cytomat用所有尖头、平板、槽中的所有试剂(除了NHS-生物素试剂，其在即将加入到平板之前制备)、3个制备的Catch1滤板和1个制备的MyOne平板装载。

7.Catch1

3.5小时平衡时间之后，将样品/适配体平板从培养箱中移出，离心约1分钟，除去箔，置于Beckman Biomek FxP平台上。开始Beckman Biomek FxP程序。除非另有说明，Catch1中的所有后续步骤均由Beckman Biomek FxP机器人完成。在该程序内，向Catch1滤板施加真空以除去珠上清。将100微升10％、1％和0.03％平衡结合反应的每一种加入到它们各自的Catch1滤板，每个板用即用(on-deck)轨道摇床(orbital shaker)以800rpm混合10分钟。

通过真空过滤除去未结合的溶液。通过分配溶液并立即施加真空以使溶液通过平板过滤，将Catch1珠用190μL的1x SB17，0.05％吐温-20中的100μM生物素洗涤，然后用190μL的1x SB17，0.05％吐温-20洗涤。

然后，将190μL的1x SB17，0.05％吐温-20加入Catch1平板中。用即用吸干装置(blot station)将平板吸干以除去液滴，然后用轨道摇床在800rpm、25℃下温育10分钟。

机器人通过真空过滤除去这个洗涤液，并且用即用吸干装置吸干滤板底部以除去液滴。

8.标记(Tagging)

将NHS-PEO4-生物素等份在37℃下融化6分钟，然后用标记缓冲液(pH＝7.25的SB170.05％吐温-20)以1∶100稀释。将NHS-PEO4-生物素试剂在无水DMSO中溶解为100mM的浓度，并且冷冻保存于-20℃。在机器人辅助下，将稀释的NHS-PEO4-生物素试剂手工加入即用槽中，手工重新启动机器人程序以将100μL的NHS-PEO4-生物素分配到每个Catch1滤板的每个孔中。将这个溶液用Catch1珠在轨道摇床上以800rpm振荡温育5分钟。

9.动力学攻击(Kinetic Challenge)和光裂解

通过向Catch1平板加入150μL的1x SB17，0.05％吐温-20中的20mM甘氨酸来中止标记反应，同时仍含有NHS标签。然后将平板在轨道摇床上以800rpm温育1分钟。通过真空过滤除去NHS-标签/甘氨酸溶液。然后，将190μL的20mM甘氨酸(1x SB17，0.05％吐温-20)加入到每个平板，并在轨道摇床上以800rpm温育1分钟，之后通过真空过滤除去。

将190μL的1x SB17，0.05％吐温-20加入到每个平板，并通过真空过滤除去。

然后，通过加入190μL的1x SB17，0.05％吐温-20，将平板置于轨道摇床上以800rpm保持1分钟随后真空过滤来将Catch1平板的孔洗涤3次。最后一次洗涤后，将平板置于1mL深孔平板的顶部并从平台上移开。将Catch1平板在1000rpm下离心1分钟以在洗脱之前从琼脂糖珠上尽可能除去无关的体积。

将平板放回Beckman Biomek FxP上，并向滤板的每孔中加入85μL的1x SB17，0.05％吐温-20中的10mM DxSO₄。

将滤板从平台上移开，置于Variomag Thermoshaker(Thermo FisherScientific，Inc.，Waltham，MA)上，在BlackRay(Ted Pella，Inc.，Redding，CA)光源下，以800rpm振荡同时照射10分钟。

通过首先将10％Catch1滤板置于1mL深孔平板的顶部并以1000rpm离心1分钟来将光裂解的溶液依次从每个Catch1平板洗脱入同一个深孔平板。然后，将1％和0.03％Catch1平板依次离心入相同的深孔平板。

10.Catch2珠捕获

将含有合并的Catch1洗脱物的1mL深孔块(block)置于用于Catch2的Beckman Biomek FxP的平台上。

机器人将所有光裂解洗脱物从1mL深孔平板转移至含有先前制备的Catch 2 MyOne磁珠的Hybaid平板上(通过磁性分离除去MyOne缓冲液后)。

将溶液在Variomag Thermoshaker(Thermo Fisher Scientific，Inc.，Waltham，MA)上于25℃以1350rpm振荡温育5分钟。

机器人将平板转移至即用磁性分离器。将平板在磁体上温育90秒，然后除去并弃去上清。

11.37℃30％甘油洗涤

将Catch2平板移到即用保温摇床上，并且将75μL的1x SB17，0.05％吐温-20转移到每孔中。将平板在37℃下以1350rpm混合1分钟以重悬并加热珠。在37℃下，向Catch2平板的每个孔中转移75μL的60％甘油，并且将平板继续在37℃下以1350rpm再混合1分钟。机器人将平板转移到37℃磁性分离器上，在此将其在磁体上温育2分钟，然后机器人除去并弃去上清。将这些洗涤再重复2次。

将第三30％甘油洗涤液从Catch2珠除去后，将150μL的1x SB17，0.05％吐温-20加入每孔中，并且在37℃下以1350rpm振荡温育1分钟，然后在37℃磁体上通过磁性分离除去。

将Catch2珠用150μL的1x SB19，0.05％吐温-20在25℃下以1350rpm振荡温育1分钟来进行最后洗涤一次，然后进行磁性分离。

12.Catch2珠洗脱和中和

通过向每孔加入105μL含1M NaCl，0.05％吐温-20的100mM CAPSO来将适配体从Catch2珠洗脱。将珠用这种溶液以1350rpm振荡温育5分钟。

然后，将Catch2平板置于磁性分离器上保持90秒，然后将90μL洗脱物转移至每孔含有10μL的500mM HCl、500mM HEPES、0.05％吐温-20的新96孔平板中。转移后，通过移液90μL上下5次来机器混合溶液。

13.杂交

Beckman Biomek FxP转移20μL中和的Catch2洗脱物至新鲜的Hybaid平板，向每孔加入5μL含有10x峰值(spike)杂交对照的10x AgilentBlock。然后，将25μL的2x Agilent Hybridization缓冲液手工移液入含有中和的样品和封闭缓冲液的平板的每孔中，并且通过手工缓慢移液25μL上下15次以避免大量泡沫形成而将溶液混合。将平板以1000rpm离心1分钟。

将gasket slide置于Agilent杂交室中，将40μL每种含有杂交和封闭溶液的样品手工移液至每个gasket中。以减少气泡形成的方式使用8-通道可调(variable)多通道移液器。然后将定制Agilent微阵列玻片(AgilentTechnologies，Inc.，Santa Clara，CA)以条形码朝上缓慢下降到gasket slide上(参见Agilent手册的详细描述)。

将杂交室上部置于玻片/背衬(backing)夹心结构上，将夹紧支架(clamping bracket)盖在整个装置上。通过旋紧螺旋来夹紧这些装置。

目视检查每个玻片/背衬玻片夹心结构以确保溶液气泡可以在样品内自由活动。如果气泡不自由活动，则轻拍杂交室装置以释放靠近垫片(gasket)的气泡。

将组装的杂交室在Agilent杂交炉中在60℃下以20rpm旋转温育19小时。

14.杂交后洗涤

将约400mL的Agilent Wash Buffer1置于两个单独的玻璃染色皿的每一个中。将一个染色皿置于磁力搅拌板上，将玻片架和搅拌棒置于缓冲液中。

通过将搅拌棒置于空玻璃染色皿中来制备用于Agilent Wash2的染色皿。

将第四玻璃染色皿置于一旁以用于最终乙腈洗涤。

分解6个杂交室中的每一个。逐个将玻片/背衬夹心结构从其杂交室移开并浸入含有Wash1的染色皿中。用一对镊子将玻片/背衬夹心结构撬开，同时仍浸没微阵列玻片。将玻片快速转移至磁力搅拌板上的Wash1染色皿中的玻片架中。

将玻片架缓慢上升和降低5次。将磁力搅拌器以低设定开启，并且将玻片温育5分钟。

当Wash1剩余1分钟时，将在培养箱中预热至37℃的Wash Buffer2加入第二制备的染色皿中。将玻片架快速转移至Wash Buffer2中，并且通过将其在染色皿顶部刮擦来除去玻片架底部的任何过量缓冲液。将玻片架缓慢上升和降低5次。将磁力搅拌器以低设定开启，并且将玻片温育5分钟。

将玻片架从Wash2中缓慢取出，将玻片从溶液中取出需要约15秒。

当在Wash2中剩余1分钟时，将乙腈(ACN)加入第四染色皿中。将玻片架转移至乙腈染色皿中。将玻片架缓慢上升和降低5次。将磁力搅拌器以低设定开启，并且将玻片温育5分钟。

将玻片架缓慢从ACN染色皿中取出并置于吸水纸上。将玻片底部边缘快速干燥，并且将玻片置于干净的玻片盒中。

15.微阵列成像

将微阵列玻片置于Agilent扫描仪玻片容器中，并根据厂商指导装载至Agilent微阵列扫描仪中。

将玻片在Cy3通道中以5μm分辨率在100％PMT设定及XRD选项为0.05的条件下成像。将所得的tiff图像用Agilent特征抽取软件版本10.5处理。

实施例2.生物标记鉴定

进行潜在的胰腺癌生物标记的鉴定，用于诊断无症状的个体以及患有急性或慢性胰腺炎(或两者)、胰腺梗阻、GERD、胆石或者后来发现为良性的异常成像的有症状的个体(统称为GI和正常对照)中的胰腺癌。这个研究的招收标准是年龄18岁或更大，能够签署知情同意书，并且提供血浆样品以及胰腺癌或良性发现的记录诊断。对于病例，在治疗或手术之前采集血液样品，随后诊断为胰腺癌。排除标准包括抽血的5年内癌症(除了皮肤的鳞状细胞癌)的早期诊断或治疗。血浆样品采集自2个不同部位，并且包括143个胰腺癌样品和115个对照组样品。用实施例1所述的多重适配体亲和测定测量和报道这些258个样品中每一个的823个分析物的RFU值。因为血浆样品在相似方案下获得自2个独立研究和部位，所以在生物标记发现分析之前进行位点差异的检测。

每个病例和对照群体分别通过产生823个分析物中每一个的类别依赖性累积分布函数(cdf)来比较。来自样品的两个集合的值之间的KS-距离(柯尔莫可洛夫-斯米洛夫统计量)是如下程度的非参数测量，即来自一个集合(集合A)的值的经验分布与来自另一集合(集合B)的值的分布的差异程度。对于阈值T的任何值，来自集合A的某些比例的值小于T，并且来自集合B的某些比例的值小于T。KS-距离测量对于任何T选择来自两个集合的值的比例之间的最大(无符号)差异。

潜在生物标记的这个集合可以用于构建分类器，该分类器将样品分配至对照或疾病组。事实上，许多这样的分类器是从这些生物标记的集合产生的，并且确定了任何生物标记用于良好评分分类器的频率。在顶级评分分类器中最常出现的那些生物标记对于产生诊断测试是最有用的。在本实施例中，贝叶斯分类器用于开发分类空间，但是许多其他监督学习技术可以为此目的而采用。任何单独分类器的评分适合度使用贝叶斯表面分类器的接受者操作特征曲线下面积(ROC的AUC)而判断，假定疾病发病率为0.5。这个评分度量从0到1变化，1是无误差分类器。从生物标记群体测量构建贝叶斯分类器的细节如实施例3所述。

使用表1中的65个分析物，发现总计973个10-分析物分类器具有诊断胰腺癌与对照组的0.90的AUC。从分类器的这个集合，发现总计11个生物标记存在于30％或更多的高评分分类器中。表13提供这些潜在生物标记的列表，并且图10为鉴定的生物标记的频率图。

实施例3.胰腺癌的朴素贝叶斯分类

从鉴定为可用于区分胰腺癌和对照的生物标记列表，选择一组10个生物标记并构建朴素贝叶斯分类器，见表16。将类别依赖性概率密度函数(pdf)p(x_i|c)和p(x_i|d)建模为log-正态分布函数，其中x_i为生物标记i的测量的RFU值的log，c和d指对照和疾病群体，该函数的特征在于平均值μ和方差σ²。10个生物标记的pdf的参数列于表16，拟合为正态pdf的原始数据与模型的实例示于图5。如图5所示，潜在的假设看起来拟合数据非常好。

这样的模型的朴素贝叶斯分类在下述等式中给出，

\ln (\frac{p (d | \tilde{x})}{p (c | \tilde{x})}) = Σ_{i = 1}^{n} \ln (\frac{σ_{c, i}}{σ_{d_{i}}}) - \frac{1}{2} Σ_{i = 1}^{n} [{(\frac{x_{i} - μ_{d, i}}{σ_{d, i}})}^{2} - {(\frac{x_{i} - μ_{c, i}}{σ_{c, i}})}^{2}] + \ln (\frac{p (d)}{1 - p (d)})

，其中P(d)为适合测试的群体中的疾病发病率，并且n＝10。求和中的每一项是单个标记的log似然比，不患有所关注的疾病(即在这种情况下是胰腺癌)比患有该疾病的样品的总log似然比

是这些单独项加上表示疾病发病率的项的简单加和。为简便起见，我们假设p(d)＝0.5，从而

\ln (\frac{p (d)}{1 - p (d)}) = 0 .

鉴于6.3、9.3、8.7、10.8、7.4、11.4、11.7、9.0、8.0、7.3的10个生物标记中每一个的以log(RFU)计的未知样品测量，分类的计算在表16中详述。将包含疾病比对照类别的log似然比的单个组分制成表格，并且可以从表16中的参数和

的值计算。个体log似然比的总和为-3.044，或者没有疾病比患有疾病的个体的似然性为21，其中似然性e^3.044＝21。前3个生物标记值具有与疾病组更一致的似然性(log似然性＞0)，但是据发现剩余的7个生物标记全部一致有利于对照组。将似然性相乘给出上述相同结果；未知样品不患有疾病的似然性为21。事实上，这个样品来自训练集合中的对照群体。

实施例4.选择用于分类器的生物标记组的贪婪算法

本实施例描述了从表1选择生物标记以形成可以在本文所述的任何方法中用作分类器的组。选择表1的生物标记的子集以构建具有良好性能的分类器。这个方法还用于确定哪些潜在标记包括为实施例2中的生物标记。

此处所用的分类器性能的测量是AUC；0.5的性能是随机(抛硬币(cointoss))分类器的基线预期值，比随机差的分类器的评分在0.0至0.5之间，比随机性能好的分类器的评分在0.5至1.0之间。无误差的完美分类器具有1.0的灵敏性和1.0的特异性。可以将实施例4的方法用于性能的其他常规测量，如F-测量、灵敏性和特异性之和或者灵敏性和特异性之积。特别地，可能想要用不同加权处理灵敏性和特异性，从而选择具有较高特异性而损失一些灵敏性的那些分类器，或者选择具有较高灵敏性而损失一些特异性的那些分类器。因为本文所述的方法仅涉及“性能”的一个测量，因此可以使用导致单个性能测量的任何加权方案。不同应用对于真阳性和真阴性发现会有不同益处，以及与假阳性发现和假阴性发现相关的不同成本。例如，筛选无症状的高风险个体以及鉴别诊断胰腺癌与良性GI症状通常不具有相同的特异性与灵敏性之间的最佳平衡(trade-off)。两种测试的不同需求通常需要对阳性和阴性误分类设定不同的加权，反映在性能测量中。改变性能测量通常会改变对于给定数据集合的选自表1第2列的确切标记子集。

对于实施例3所述的区分胰腺癌样品与对照样品的贝叶斯方法，通过生物标记在疾病和良性训练样品中的分布来将分类器完全参数化，并且生物标记列表选自表1；即，给定训练数据集合，选择包括的标记子集以一对一的方式确定分类器。

此处采用的贪婪方法用于从表1检索最佳标记子集。对于小数目标记或具有较少标记的分类器，列举每个可能的标记子集并评价用该特定标记集合构建的分类器的性能(见实施例4，部分2)。(这种方法在统计学领域公知为“最佳子集选择”；参见例如Hastie等人)。但是，对于本文所述的分类器，多个标记的组合的数目可能非常大，并且评价10个标记的每个可能的集合是不可行的，因为可以从仅30个总分析物的列表产生30,045,015种可能的组合。因为通过每个标记子集检索不切实际，所以单个最佳子集可能不能发现；但是，通过使用这种方法，发现了许多优异的子集，并且在许多情况下，任何这些子集可以代表最佳的子集。

代替评价每个可能的标记集合，可以进行“贪婪”正向逐步方法(″greedy″forward stepwise approach)(参见例如Dabney AR，Storey JD(2007)Optimality Driven Nearest Centroid Classification from Genomic Data.PLoSONE2(10)：e1002.doi：10.1371/journal.pone.0001002)。使用这种方法，分类器以最佳的单个标记(基于各个标记的KS-距离)开始，并且在每步通过依次尝试标记列表中目前不是分类器中的标记集合的成员的每个成员而成长。将与现有分类器组合评分最佳的一个标记加入到分类器中。重复直至不再实现性能的进一步改善。不幸地，这种方法可能错过有价值的标记组合，一些单独的标记在方法终止前没有全部被选择。

此处使用的贪婪方法是前述正向逐步方法的加工，为了扩大检索，而不是在每个步骤中保持仅单个候选分类器(标记子集)，保持候选分类器列表。该列表用每个单个标记子集(使用表中每个标记自身)播种。通过从目前在列表中的分类器衍生新的分类器(标记子集)并将它们加入列表中来逐步扩大列表。通过加入不是该分类器的部分的来自表1的任何标记(其加入到子集不会复制现有子集)(这些称为“允许标记”)延伸目前在列表上的每个标记子集。每个现有标记子集通过来自列表的每个允许标记延伸。很明显，这种方法最终会产生每个可能的子集，并且该列表会用完空间。因此，所有产生的分类器仅保持到列表小于某些预定大小时(通常足以保持所有三个标记子集)。一旦列表达到预定大小限制，其变成精英(elitist)；即，仅显示一定水平性能的那些分类器保持在列表上，其他分类器跌落到列表末尾并被丢弃。这通过保持按照分类器性能顺序分选的列表来实现；插入至少与目前列表上最差分类器一样好的新的分类器，使得强制排除当前末尾的后进者。一种进一步执行细节是列表在每个产生步骤被完全置换；因此，列表上的每个分类器具有相同数目的标记，在每个步骤每个分类器的标记数目增加一个。

由于这个方法使用不同标记组合产生候选分类器列表，所以人们会询问是否可以组合分类器以避免可能由最佳单个分类器或由最佳分类器的少数组产生的误差。这类“总体”和“专家委员会(committee of experts)”方法是统计学和机器学习领域公知的，并且包括例如“Averaging”、“Voting”、“Stacking”、“Bagging”和“Boosting”(参见例如Hastie等人)。简单分类器的这些组合提供了通过包括一些不同分类器及因此来自生物标记表的更大的标记集合的信息来降低分类中由于任何特定标记集合中的噪声所导致的方差的方法，这有效地在分类器之间平均。这种方法的有用性的实例是其可以防止单个标记中的异常值(outlier)负面影响单个样品的分类。测量更大数目信号的需求在常规的“一次一个标记”抗体测定中可能是不切实际的，但是对于完全多重适配体测定没有下降趋势(downside)。这些技术获益于更广泛的生物标记表，并且使用有关疾病过程的多种信息来源以提供更稳健的分类。

表1中选择的生物标记给出的分类器表现好于用“非标记”(即具有不满足包括在表1中的标准的信号的蛋白(如实施例2所述))构建的分类器。

对于仅含有一个、两个和三个标记的分类器，用表1的生物标记获得的所有可能的分类器被列举并检查性能分布，与从随机选择的非标记信号的相似表构建的分类器进行比较。

在图11中，AUC用作性能的测量；0.5的性能是随机(抛硬币)分类器的基线预期值。分类器性能的柱状图与来自从65个非标记信号的“非标记”表构建的分类器的相似穷举的性能的柱状图进行比较；所述65个信号随机选自未证实对照与疾病群体之间的差异信号的适配体。

图11显示从表14的生物标记参数构建的所有可能的单标记、二标记和三标记分类器对于可以区分对照组和胰腺癌的生物标记的性能的柱状图，并且将这些分类器与用65个“非标记”适配体RFU信号构建的所有可能的单标记、二标记和三标记分类器进行比较。图11A示出单标记分类器性能的柱状图，图11B示出二标记分类器性能的柱状图，而图11C示出三标记分类器性能的柱状图。

在图11中，实线表示使用表14中GI和正常对照以及胰腺癌的生物标记数据的所有单标记、二标记和三标记分类器的分类器性能的柱状图。虚线是使用对照和胰腺癌的数据但是使用随机非标记信号集合的所有单标记、二标记和三标记分类器的分类器性能的柱状图。

从表1所列的标记构建的分类器形成了独特的柱状图，对于所有单标记、二标记和三标记比较，与用来自“非标记”的信号构建的分类器分离良好。从表1的生物标记构建的分类器的性能和AUC评分随标记数增加也比从非标记构建的分类器更快，随着每个分类器标记数增加，标记和非标记分类器之间的分离增加。用表14所列的生物标记构建的所有分类器比用“非标记”构建的分类器表现更好。

分类器性能的分布显示有许多可能的多标记分类器可以来源于表1的分析物的集合。虽然如通过单一分析物的分类器评分的分布和AUC所证实的，一些生物标记本身比其他生物标记好，但是确定构建高性能分类器是否需要这类生物标记是可取的。为了进行这种确定，通过去掉一定数量的最佳生物标记来检测分类器性能的行为。图12比较了用表1的生物标记的完整列表构建的分类器的性能与用排除顶级标记的来自表1的生物标记的子集构建的分类器的性能。

图12证实未用最佳标记构建的分类器表现良好，这暗示分类器的性能不是由一些小的核心组标记所决定，并且与疾病相关的潜在过程中的变化反映在许多蛋白的活性中。表1中的许多生物标记子集表现接近最佳，甚至在除去表1的65个标记的最好的15个之后也是如此。从表1去掉15个顶级标记(通过KS-距离评级)后，分类器性能随着选自该表的标记的数目增加至达到几乎0.87的AUC，与选自生物标记的完整列表的0.91的最佳分类器评分的性能接近。

最后，图16示出根据实施例3从表14中的参数列表构建的典型分类器的ROC性能。用CTSB、C5a、C5、CCL18和CSF1R构建5分析物分类器。图16A示出模型的性能，假设这些标记的独立性，如实施例3，并且图16B示出从用于定义表14的参数的研究数据集合产生的经验ROC曲线。如通过AUC证实的，可以看出给定数目的所选标记的性能在定性上是一致的，并且定量一致性一般很好，虽然模型计算倾向于高估分类器性能。这与以下观点一致，即有关疾病过程的任何特定生物标记贡献的信息与表1提供的其他生物标记贡献的信息是冗余的，而模型计算假设完全独立性。因此图16证实表1联合实施例3所述的方法允许构建和评价可用于区分胰腺癌与对照组的许多分类器。

实施例5.并入CA19-9

癌症相关抗原19-9(CA19-9)是已知的胰腺癌的血清标记。报道的CA19-9对胰腺癌的灵敏性和特异性分别为80-90％。然而，CA19-9鉴定患有小型手术可切除的癌症的患者的准确性有限。CA19-9的特异性也是有限的；CA19-9经常在患有各种良性胆胰病症的患者中升高。

CA19-9在胰腺癌中升高的程度与长期预后有关。此外，在看来患有潜在的可切除的疾病的患者中，CA19-9水平的数量级还可以有助于预测放射显影隐匿性转移性疾病的存在。CA19-9水平的系列监测可用于随访潜在的根治性手术后的患者以及接受晚期疾病的化疗的患者。升高的CA19-9水平通常在复发性疾病的放射显影出现之前，但是疾病发展的证实应当通过成像研究和/或活组织检查来进行。生物标记水平的检测联合CA19-9与单独CA19-9相比，可以改善检测胰腺癌(或其他胰腺癌相关用途)的灵敏性、特异性和/或AUC。

升高的CA19-9水平据认为是血清中35-40U/ml。

我们收到了训练样品的子集的临床CA19-9测量。最初的100个病例和69个对照中，我们具有99个病例和52个对照的CA19-9测量。因此，我们利用表1中的SOMAmer的子集在样品的这个子集上训练随机森林模型的新集合。我们还训练新的分类器，其并入CA19-9测量与我们的SOMAmer组(合并的组)。

三种不同方法(SOMAmer、CA19-9及合并的组)的分类器性能如图13所示。SOMAmer组和CA19-9表现相似，然而当这两者合并入单个分类器时，性能显著提高。对于100％的特异性，SOMAmer组和CA19-9具有正好低于50％的灵敏性，而合并的分类器具有约75％的灵敏性。

进一步分析显示当CA19-9包括在分类器中时，相同的相对性能所需的SOMAmer数目减少。图14示出使用CA19-9以及一个或两个额外的SOMAmer的随机森林分类器的性能。左图示出利用CA19-9和HAMP训练的模型的性能，而右图示出CA19-9、HAMP和CTSB的性能。

实施例6.临床生物标记组

随机森林分类器构建自可能最适合用于临床诊断测试的所选生物标记的组。不像通过朴素贝叶斯贪婪正向算法选择的模型，随机森林分类器不假设生物标记是随机分布的。因此这个模型可以利用在朴素贝叶斯分类器中无效的来自表1的生物标记。

使用利用随机森林分类器提供的基尼重要性度量的反向淘汰法选择组。基尼重要性是生物标记正确分类训练集合中的样品的有效性的度量。生物标记重要性的这种度量可以用来淘汰对于分类器的性能较不重要的标记。反向淘汰法通过构建包括表1中所有65个的随机森林分类器开始。然后淘汰最不重要的生物标记，并且用剩余的生物标记构建新模型。继续这个过程直至仅剩单个生物标记。

所选的最终的组提供最大AUC与模型中标记的最低数目之间的最佳平衡。满足这些标准的10个生物标记的组由以下分析物组成：APOA1、CTSB、C2、MMP7、HAMP、TFPI、C5、c5a、SFRP1和ETHE1。这个生物标记组的ROC曲线的图如图15所示。该图示出箭头所示的两种可能的决定截断值：有症状的截断值，其中84％或更多的灵敏性可以与至少80％特异性一起获得；以及无症状的截断值，其中97.5％的特异性可以与至少60％灵敏性一起获得。

实施例7.用于诊断癌症的生物标记

鉴定用于癌症的一般诊断的潜在生物标记。评价来自3种不同类型的癌症(胰腺癌、肺癌和间皮瘤)的病例和对照样品。在采集部位中，包括标准是至少18岁，签署知情同意书。病例和对照均排除除考虑的癌症之外的已知恶性肿瘤。

胰腺癌.病例和对照样品如实施例2所述获得。

肺癌.病例和对照样品获得自3个学术癌症中心生物数据库(biorepositories)和一个商业生物数据库以鉴定潜在的标记，用于鉴别诊断非小细胞肺癌(NSCLC)与高风险吸烟者的对照组和具有良性肺小结的个体。该研究由采集自吸烟者和具有良性小结的患者以及320个诊断患有NSCLC的个体的978个样品组成。

胸膜间皮瘤.

病例和对照样品获得自学术癌症中心数据库以鉴定潜在的标记，用于鉴别诊断恶性胸膜间皮瘤与具有石棉接触史或良性肺疾病的患者，包括后来诊断为非恶性的可疑放射学发现。该研究由采集自接触石棉的个体的30个样品和采集自间皮瘤患者的41个样品组成。

癌症生物标记的最终列表通过组合3个不同癌症研究中的每一个考虑的生物标记的集合来鉴定。利用贪婪算法成功构建了使用增加大小的生物标记集合的贝叶斯分类器(如本实施例的7.2节更详细地描述)。将可用于在所述癌症类型中一般诊断癌症的生物标记的集合(或组)汇编为函数集合(或组)大小并分析它们的性能。这个分析导致表19所示的10个癌症生物标记的列表，其中每一个存在于这些连续标记集合的至少一个中，所述连续标记集合的大小为3-10个标记。作为说明性实例，我们描述如表32所示的由10个癌症生物标记组成的特定组的产生。

7.1癌症的朴素贝叶斯分类

如本实施例的7.2节所述，从表1中生物标记的列表，利用生物标记选择的贪婪算法选择10个潜在癌症生物标记的组。给这3个中的每一个构建不同的朴素贝叶斯分类器。将类别依赖性概率密度函数(pdf)、p(x_i|c)和p(x_i|d)建模为log-正态分布函数，其中x_i为生物标记i的测量的RFU值的log，c和d指对照和疾病群体，该函数的特征在于平均值μ和方差σ²。由10个潜在生物标记组成的3个模型的pdf的参数如表31所列。

这样的模型的朴素贝叶斯分类在下述等式中给出，

\ln (\frac{p (d | \tilde{x})}{p (c | \tilde{x})}) = Σ_{i = 1}^{n} \ln (\frac{σ_{c, i}}{σ_{d_{i}}}) - \frac{1}{2} Σ_{i = 1}^{n} [{(\frac{x_{i} - μ_{d, i}}{σ_{d, i}})}^{2} - {(\frac{x_{i} - μ_{c, i}}{σ_{c, i}})}^{2}] + \ln (\frac{p (d)}{1 - p (d)})

，其中P(d)为适合测试的群体中的疾病发病率，并且n＝10。求和中的每一项是单个标记的log似然比，不患有所关注的疾病(即在这种情况下，来自3种不同癌症类型的每种特定疾病)比患有该疾病的样品的总log似然比

\ln (\frac{p (d)}{1 - p (d)}) = 0 .

鉴于10.1、8.9、8.8、8.8、9.1、7.3、8.2、9.5、6.7、7.7的10个生物标记中每一个的以log(RFU)计的未知样品测量，分类的计算在表32中详述。将包含疾病比对照类别的log似然比的单个组分制成表格，并且可以从表31中的参数和

的值计算。个体log似然比的总和为-4.568，或者没有疾病比患有疾病的个体的似然性为96，其中似然性e^4.568＝96。仅1个生物标记值具有与疾病组更一致的似然性(log似然性＞0)，但是据发现剩余的9个生物标记全部一致有利于对照组。将似然性相乘给出上述相同结果；未知样品不患有疾病的似然性为96。事实上，这个样品来自NSCLC训练集合中的对照群体。

7.2选择用于分类器的癌症生物标记组的贪婪算法

部分1

选择表1中生物标记的子集以构建潜在的分类器，其可以用来确定哪些可以用作一般癌症生物标记以检测癌症。

考虑到标记的集合，为3个癌症研究中的每一个训练不同的模型，所以需要性能的全面测量以选择能够同时分类许多不同类型的癌症的生物标记的集合。这里使用的分类器性能的测量是所有朴素贝叶斯分类器的ROC曲线下面积的平均值。ROC曲线单个分类器真阳性率(灵敏性)对假阳性率(1-特异性)的作图。ROC曲线下面积(AUC)范围为0-1.0，其中1.0的AUC对应于完美分类，而0.5的AUC对应于随机(抛硬币)分类器。可以应用性能的其他常规测量如F-测量或者灵敏性和特异性之和或之积。特别地，可能想要用不同加权处理灵敏性和特异性，以便选择具有较高特异性而损失一些灵敏性的那些分类器，或者选择具有较高灵敏性而损失特异性的那些分类器。我们选择使用AUC，因为它在单一测量中涵盖灵敏性和特异性的所有组合。不同应用对于真阳性和真阴性发现会有不同益处，并且会具有与假阳性发现和假阴性发现相关的不同成本。改变性能测量可能改变选择用于数据的给定集合的标记的确切子集。

对于本实施例7.1节所述的区分癌症样品与对照样品的贝叶斯方法，通过生物标记在3个癌症研究中的每一个中的分布来将分类器完全参数化，并且生物标记列表选自表19。即，给定训练数据集合，选择包括的标记子集以一对一的方式确定分类器。

代替评价每个可能的标记集合，可以进行“贪婪”正向逐步方法(参见例如Dabney AR，Storey JD(2007)Optimality Driven Nearest CentroidClassification from Genomic Data.PLoS ONE 2(10)：e1002.doi：10.1371/journal.pone.0001002)。使用这种方法，分类器以最佳的单个标记(基于各个标记的KS-距离)开始，并且在每步通过依次尝试标记列表中目前不是分类器中的标记集合的成员的每个成员而成长。将与现有分类器组合评分最佳的一个标记加入到分类器中。重复直至不再实现性能的进一步改善。不幸地，这种方法可能错过有价值的标记组合，一些单独的标记在方法终止前没有全部被选择。

此处使用的贪婪方法是前述正向逐步方法的加工，为了扩大检索，而不是在每个步骤中保持仅单个标记子集，保持候选标记集合的列表。该列表用单个标记的列表播种。通过从目前在列表中的标记子集衍生新的标记子集并将它们加入列表中来逐步扩大列表。通过加入不是该分类器的部分的来自表1的任何标记(其加入到子集不会复制现有子集)(这些称为“允许标记”)延伸目前在列表上的每个标记子集。每次定义标记的新集合，利用这些标记训练由每个癌症研究各一个组成的分类器的集合，并且通过全部3个研究的平均AUC测量全面性能。为了避免潜在的过拟合，通过10倍交叉验证方法计算每个癌症研究模型的AUC。每个现有标记子集通过来自列表的每个允许标记延伸。很明显，这种方法最终会产生每个可能的子集，并且该列表会用完空间。因此，所有产生的标记集合仅在列表小于某些预定大小时保持。一旦列表达到预定大小限制，其变成精英；即，仅显示一定水平性能的那些分类器集合保持在列表上，其他分类器跌落到列表末尾并被丢弃。这通过保持按照分类器集合性能顺序分选的列表来实现；插入其分类器整体上至少与目前列表上最差分类器一样好的新标记集合，使得强制排除当前实现分类器集合下的末尾。一种进一步执行细节是列表在每个产生步骤被完全置换；因此，列表上的每个标记集合具有相同数目的标记，在每个步骤每个分类器的标记数目增加一个。

在一实施方案中，可用于构建诊断一般癌症与非癌症的分类器的生物标记的集合(或组)是基于用于分类方案的生物标记的特定组合的平均AUC。我们鉴定了许多能够有效分类不同癌症样品与对照的衍生自表19的标记的生物标记组合。代表性组如表22-29所示，其示出一系列3-10个生物标记的100个不同的组，其具有所示的每组的验证(CV)AUC平均值。这些组的每个中每个标记出现的总数目在每个表的底部示出。

表19所选的生物标记产生表现比用“非标记”构建的分类器更好的分类器。在图17中，我们示出与其他可能的分类器相比的我们的10生物标记分类器的性能。

图17A示出分类器的平均AUC分布，所述分类器构建自10个“非标记”的随机采样集合，其采自存在于所有3个研究中的10的整个集合，排除表19中的10个标记。10个潜在的癌症生物标记的性能显示为垂直虚线。这个图清楚显示这10个潜在的生物标记的性能远远超过其他标记组合的分布。

图17B显示与图17A相似的分布，然而，随机采样集合限于通过10分析物分类器的贪婪生物标记选择方法未选择的来自表1的55个生物标记。这个图证实通过贪婪算法选择的10个标记代表生物标记的子集，其推广至类型的癌症，远优于用剩余的55个生物标记构建的分类器。

最后，图18示出3个癌症研究分类器中每一个的分类器ROC曲线。上述实施方案和实施例仅作为实例示出。没有特定实施方案、实施例或者特定实施方案或实施例的要素被认为是任何权利要求关键的、需要的或必需的要素或特征。另外，本文描述的要素不是实施所附权利要求所需的，除非明确描述为“必需”或“关键的”。可以对所公开的实施方案进行各种改变、修饰、取代和其他变化而不背离所附权利要求限定的本申请的范围。包括附图和实施例的说明书是示例性而非限制性的，所有这样的修饰和取代包括在本申请范围内。因此，本申请的范围应当由所附的权利要求及其法律等价物限定而非由上述实施例限定。例如，任何方法或过程权利要求中列举的步骤可以任何可行顺序执行而不限于任何实施方案、实施例或权利要求中的顺序。另外，在任何上述方法中，表1或表19的一个或多个生物标记可以作为单个生物标记或作为来自任何组的生物标记特别地排除。

表1：癌症生物标记

表1：续前页

表2：一种生物标记的组

表2：续前页

表3：二种生物标记的组

表3：续前页

表3：续前页

表4：三种生物标记的组

表4：续前页

表4：续前页

表5：四种生物标记的组

表5：续前页

表5：续前页

表6：五种生物标记的组

表6：续前页

表6：续前页

表7：六种生物标记的组

表7：续前页

表7：续前页

表7：续前页

表7：续前页

表8：七种生物标记的组

表8：续前页

表8：续前页

表8：续前页

表9：八种生物标记的组

表9：续前页

表9：续前页

表9：续前页

表9：续前页

表10：九种生物标记的组

表10：续前页

表10：续前页

表10：续前页

表10：续前页

表11：十种生物标记的组

表11：续前页

表11：续前页

表11：续前页

表11：续前页

表12：生物标记组中的标记计数

表12：续前页

生物标记	3	4	5	6	7	8	9	10
									NRP1	44	20	12	5	2	2	2	1
PLAT	48	54	92	123	143	145	165	177
									SERPINA5	5	0	0	0	0	0	0	0
SERPINF2	5	3	3	0	0	0	0	0
									SGTA	3	2	1	0	0	0	0	0
TFPI	100	60	51	46	57	70	91	111
									THBS2	4	0	0	0	0	0	0	0
THBS4	66	110	146	193	243	276	334	354
									TIMP1	22	2	0	0	0	0	0	0
TNFRSF18	8	9	3	0	1	3	2	2
									TNFRSF1B	20	12	8	6	4	1	0	0
top1	6	3	0	0	0	0	0	0
									VEGFA	16	33	47	51	75	142	268	455
VEGFC	5	4	2	1	0	0	0	0

表13：10标记分类器中的分析物

CTSB	C5a
		ETHE1	CSF1R
CCL18	C5
		KLK7	VEGFA
KIT	THBS4
		LTF

表14：源自朴素贝叶斯分类器训练组的参数

生物标记	μ_c	μ_d	σ_c	σ_d
					CSF1R	10.712	10.995	0.398	0.399
CTSB	8.836	9.398	0.287	0.621
					IL1RL1	9.702	10.189	0.533	0.780
GDF11	8.889	8.578	0.291	0.379
					ETHE1	7.373	7.443	0.119	0.121
CCL23	8.795	8.975	0.312	0.329
					FGFR3	6.992	7.166	0.178	0.225
KIT	9.770	9.623	0.287	0.318
					FSTL3	8.787	9.029	0.290	0.374
THBS2	7.481	7.922	0.270	0.633
					SERPINF2	9.264	9.175	0.115	0.162
TNFRSF1B	10.748	11.028	0.380	0.452
					TNFRSF18	12.308	12.279	0.139	0.168
BMP6	7.958	8.138	0.142	0.239
					GFRA1	7.324	7.465	0.182	0.200
CRP	11.965	12.304	0.735	0.233
					SERPINA5	10.309	10.101	0.300	0.419
KLKB1	11.802	11.666	0.159	0.211
					APOE	8.081	8.314	0.406	0.656
SFRP1	7.096	7.219	0.221	0.309
					C2	11.506	11.611	0.100	0.132
CKM	7.313	7.192	0.154	0.116
					TFPI	10.179	10.490	0.261	0.352
INSR	8.480	8.633	0.224	0.255
					NID2	8.595	8.806	0.213	0.384
HAMP	10.424	11.079	0.788	0.617
					MDK	8.034	8.495	0.570	0.578
CDK5-CDK5R1	6.937	6.994	0.108	0.111
					NID1	9.771	9.941	0.213	0.357
VEGFC	7.454	7.540	0.118	0.126
					C9	11.911	12.076	0.234	0.233
LTF	10.120	9.870	0.442	0.419
					IL12A-IL12B	7.311	7.273	0.052	0.057
C5	9.485	9.603	0.119	0.143
					IL18R1	7.643	7.845	0.186	0.475
CCL18	11.320	11.616	0.477	0.398
					VEGFA	8.532	8.601	0.170	0.134
IDUA	8.428	8.694	0.366	0.558
					top1	6.892	6.842	0.088	0.091
C5-C6	6.506	6.593	0.133	0.144
					TIMP1	9.815	10.148	0.264	0.430
C5a	11.354	11.606	0.254	0.246
					THBS4	10.013	9.794	0.359	0.400
ENTPD1	7.225	7.299	0.110	0.103
					LBP	9.102	9.489	0.439	0.548
KLK3-SERPINA3	9.034	9.287	0.353	0.422
					MCM2	7.794	7.975	0.226	0.359
SGTA	5.920	5.883	0.060	0.079
					ESM1	9.715	9.919	0.330	0.476

表14：续前页

生物标记	μ_c	μ_d	σ_c	σ_d
					PLAT	8.517	8.838	0.461	0.502
KLK7	8.322	7.989	0.321	0.391
					CCL23	7.909	8.097	0.227	0.267
ACP5	10.198	10.436	0.292	0.343
					NRP1	8.832	9.047	0.243	0.256
MMP7	9.084	9.574	0.437	0.706
					ACY1	9.898	10.411	0.628	0.919
ALPL	10.577	10.290	0.377	0.417
					IL11RA	7.312	7.213	0.110	0.107
APOA1	9.701	9.480	0.171	0.295
					CKB-CKM	7.506	7.025	0.653	0.479
KLK8	7.361	7.421	0.100	0.178
					AHSG	11.914	11.826	0.133	0.167
HINT1	5.835	5.793	0.086	0.104
					MRC1	9.628	9.995	0.370	0.490
FCGR3B	10.920	11.145	0.255	0.269

表15：生物标记的示例性组合的AUC

#

AUC

1

CTSB

0.791

2

CTSB

C5a

0.853

3

CTSB

C5a

C5

0.880

4

CTSB

C5a

C5

CCL18

0.890

5

CTSB

C5a

C5

CCL18

CSF1R

0.895

6

CTSB

C5a

C5

CCL18

CSF1R

KLK7

0.895

7

CTSB

C5a

C5

CCL18

CSF1R

KLK7

ETHE1

0.906

8

CTSB

C5a

C5

CCL18

CSF1R

KLK7

ETHE1

C5-C6

0.902

9

CTSB

C5a

C5

CCL18

CSF1R

KLK7

ETHE1

C5-C6

KLK8

0.903

10

CTSB

C5a

C5

CCL18

CSF1R

KLK7

ETHE1

C5-C6

KLK8

VEGFA

0.913

表16：源自朴素贝叶斯分类器训练组的计算

表17：训练组的临床特征

表18：10生物标记分类器蛋白质

表19：一般癌症的生物标记

ACY1	APOA1
		C5	CCL23
CKB-CKM	CKM
		ENTPD1	GDF11
HAMP	HINT1
		KIT	KLK3-SERPINA3
LBP	SERPINF2
		THBS2	TIMP1
C9	FSTL3
		IL12A-IL12B	CDK5-CDK5R1
CCL23

表20：一种生物标记的组

表21：二种生物标记的组

表21：续前页

表22：三种生物标记的组

表22：续前页

表22：续前页

表23：四种生物标记的组

表23：续前页

表23：续前页

表24：五种生物标记的组

表24：续前页

表24：续前页

表25：六种生物标记的组

表25：续前页

表25：续前页

表25：续前页

表25：续前页

表26：七种生物标记的组

表26：续前页

表26：续前页

表26：续前页

表26：续前页

表27：八种生物标记的组

表27：续前页

表27：续前页

表27：续前页

表27：续前页

表28：九种生物标记的组

表28：续前页

表28：续前页

表28：续前页

表28：续前页

表29：十种生物标记的组

表29：续前页

表29：续前页

表29：续前页

表30：生物标记组中标记的计数

表31：源自朴素贝叶斯分类器癌症数据组的参数

表32：源自朴素贝叶斯分类器训练组的计算

Claims

1.诊断个体患有或不患有胰腺癌的方法，所述方法包括：

在来自个体的生物学样品中检测生物标记值，所述生物标记值每个对应于选自表1的至少N个生物标记之一，其中基于所述生物标记值将所述个体分类为患有或不患有胰腺癌、或者确定所述个体患有胰腺癌的似然性，并且其中N=2-65。

2.权利要求1的方法，其中所述诊断包括鉴别诊断胰腺癌与良性疾病状况如胰腺炎或胃肠病症。

3.权利要求1的方法，其中所述个体具有腹部团块。

4.权利要求1的方法，其中检测所述生物标记值包括进行体外测定。

5.权利要求4的方法，其中所述体外测定包括对应于每个所述生物标记的至少一种捕获试剂，并且还包括从适配体、抗体和核酸探针选择所述至少一种捕获试剂。

6.权利要求5的方法，其中所述至少一种捕获试剂为适配体。

7.权利要求4的方法，其中所述体外测定选自免疫测定、基于适配体的测定、组织学或细胞学测定以及mRNA表达水平测定。

8.权利要求1的方法，其中所述生物学样品选自全血、血浆、血清和胰液。

9.权利要求8的方法，其中所述生物学样品为血浆。

10.权利要求1的方法，其中所述生物学样品为胰组织，并且其中所述生物标记值源自所述胰组织的组织学或细胞学分析。

11.权利要求1的方法，其中所述个体为人。

12.权利要求1的方法，其中N=3-10。

13.权利要求1的方法，其中N=3-15。

14.权利要求1的方法，其中N=2-10。

15.权利要求1的方法，其中N=4-10。

16.权利要求1的方法，其中N=5-10。

17.权利要求1的方法，其中所述个体由于吸烟、饮酒或胰腺癌家族史而具有胰腺癌的高风险。

18.权利要求1的方法，其中所述生物标记选自表18。

19.权利要求1的方法，其还包含生物标记CA19-9。

20.指示胰腺癌的似然性的计算机执行方法，所述方法包括：

在计算机上检索个体的生物标记信息，其中所述生物标记信息包括生物标记值，所述生物标记值每个对应于选自表1的至少N个生物标记之一；

用计算机对每个所述生物标记值进行分类；以及基于多个分类指示所述个体患有胰腺癌的似然性，并且其中N=2-65。

21.权利要求20的方法，其中指示所述个体患有胰腺癌的似然性包括在计算机显示器上显示所述似然性。

22.指示胰腺癌的似然性的计算机程序产品，所述计算机程序产品包括：

包含程序代码的计算机可读取介质，所述程序代码可由计算装置或系统的处理器执行，所述程序代码包括：

对归因于来自个体的生物学样品的数据进行检索的代码，其中所述数据包括生物标记值，所述生物标记值每个对应于选自表1的至少N个生物标记之一，其中在所述生物学样品中检测所述生物标记；以及执行分类方法的代码，所述分类方法将所述个体的胰腺疾病状态指示为所述生物标记值的函数；并且其中N=2-65。

23.权利要求22的计算机程序产品，其中所述分类方法使用概率密度函数。

24.权利要求23的计算机程序产品，其中所述分类方法使用两种或更多种类别。

25.对胰腺癌无症状高风险个体进行筛选的方法，所述方法包括：

26.权利要求25的方法，其中检测所述生物标记值包括进行体外测定。

27.权利要求26的方法，其中所述体外测定包括对应于每个所述生物标记的至少一种捕获试剂，并且还包括从适配体、抗体和核酸探针选择所述至少一种捕获试剂。

28.权利要求27的方法，其中所述至少一种捕获试剂为适配体。

29.权利要求26的方法，其中所述体外测定选自免疫测定、基于适配体的测定、组织学或细胞学测定、以及mRNA表达水平测定。

30.权利要求25的方法，其中所述生物学样品选自全血、血浆、血清和胰液。

31.权利要求30的方法，其中所述生物学样品为血浆。

32.权利要求25的方法，其中所述生物学样品为胰组织，并且其中所述生物标记值源自所述胰组织的组织学或细胞学分析。

33.权利要求25的方法，其中所述个体为人。

34.权利要求25的方法，其中N=3-10。

35.权利要求25的方法，其中N=3-15。

36.权利要求25的方法，其中N=2-10。

37.权利要求25的方法，其中N=4-10。

38.权利要求25的方法，其中N=5-10。

39.权利要求25的方法，其中所述个体由于吸烟、饮酒或胰腺癌家族史而具有胰腺癌的高风险。

40.权利要求25的方法，其中所述生物标记选自表18。

41.权利要求25的方法，其还包含生物标记CA19-9。

42.指示胰腺癌的似然性的计算机执行方法，所述方法包括：

43.权利要求42的方法，其中指示所述个体患有胰腺癌的似然性包括在计算机显示器上显示所述似然性。

44.指示胰腺癌的似然性的计算机程序产品，所述计算机程序产品包括：

对归因于来自个体的生物学样品的数据进行检索的代码，其中所述数据包括生物标记值，所述生物标记值每个对应于选自表1的至少N个生物标记之一，其中在所述生物学样品中检测所述生物标记；以及

执行分类方法的代码，所述分类方法将所述个体的胰疾病状态指示为所述生物标记值的函数；并且其中N=2-65。

45.权利要求44的计算机程序产品，其中所述分类方法使用概率密度函数。

46.权利要求45的计算机程序产品，其中所述分类方法使用两种或更多种类别。

47.诊断个体患有或不患有癌症的方法，所述方法包括：

在来自个体的生物学样品中检测生物标记值，所述生物标记值每个对应于选自表19的至少N个生物标记之一，其中基于所述生物标记值将所述个体分类为患有或不患有癌症、或者确定所述个体患有癌症的似然性，并且其中N=2-21。

48.权利要求47的方法，其中所述诊断的癌症包括肺癌、胰腺癌或间皮瘤中的一种或多种。

49.权利要求47的方法，其中检测所述生物标记值包括进行体外测定。

50.权利要求49的方法，其中所述体外测定包括对应于每个所述生物标记的至少一种捕获试剂，并且还包括从适配体、抗体和核酸探针选择所述至少一种捕获试剂。

51.权利要求50的方法，其中所述至少一种捕获试剂为适配体。

52.权利要求49的方法，其中所述体外测定选自免疫测定、基于适配体的测定、组织学或细胞学测定、以及mRNA表达水平测定。

53.权利要求47的方法，其中所述生物学样品选自全血、血浆和血清。

54.权利要求53的方法，其中所述生物学样品为血浆。

55.权利要求47的方法，其中所述个体为人。

56.权利要求47的方法，其中N=2-10。

57.权利要求47的方法，其中N=2-15。

58.权利要求47的方法，其中N=3-10。

59.权利要求47的方法，其中N=3-15。

60.权利要求47的方法，其中N=4-10。

61.指示癌症的似然性的计算机执行方法，所述方法包括：

在计算机上检索个体的生物标记信息，其中所述生物标记信息包括生物标记值，所述生物标记值每个对应于选自表19的至少N个生物标记之一；

用计算机对每个所述生物标记值进行分类；以及基于多个分类指示所述个体患有癌症的似然性，并且其中N=2-21。

62.权利要求61的方法，其中指示所述个体患有癌症的似然性包括在计算机显示器上显示所述似然性。

63.指示癌症似然性的计算机程序产品，所述计算机程序产品包括：

包含程序代码的计算机可读取介质，所述程序代码可由计算装置或系统的处理器执行，所述程序代码包括：对归因于来自个体的生物学样品的数据进行检索的代码，其中所述数据包括生物标记值，所述生物标记值每个对应于选自表19的至少N个生物标记之一，其中在所述生物学样品中检测所述生物标记；以及

执行分类方法的代码，所述分类方法将所述个体的癌症状态指示为所述生物标记值的函数；并且其中N=2-21。

64.权利要求63的计算机程序产品，其中所述分类方法使用概率密度函数。

65.权利要求64的计算机程序产品，其中所述分类方法使用两种或更多种类别。

66.权利要求1或25的方法，其中基于所述生物标记值以及至少一项对应于所述个体的额外的生物医学信息，将所述个体分类为患有或不患有胰腺癌、或者确定所述个体患有胰腺癌的似然性。

67.权利要求47的方法，其中基于所述生物标记值以及至少一项对应于所述个体的额外的生物医学信息，将所述个体分类为患有或不患有癌症、或者确定所述个体患有癌症的似然性。

68.权利要求66或67的方法，其中所述至少一项额外的生物医学信息独立地选自

(a)对应于胰腺团块或其他腹部团块存在或不存在的信息，

(b)对应于所述个体的物理描述的信息，

(c)对应于所述个体的体重变化的信息，

(d)对应于所述个体的种族的信息，

(e)对应于所述个体的性别的信息，

(f)对应于所述个体的吸烟史的信息，

(g)对应于所述个体的饮酒史的信息，

(h)对应于所述个体的职业史的信息，

(i)对应于所述个体的胰腺癌或其他癌症家族史的信息，

(j)对应于所述个体中与所述个体或所述个体家族成员的胰腺癌或癌症高风险相关的至少一种遗传标记存在或不存在的信息，

(k)对应于所述个体的临床症状的信息，

(l)对应于其他实验室测试的信息，

(m)对应于所述个体的基因表达值的信息，以及

(n)对应于所述个体暴露于已知致癌物的信息。

69.包含表18的生物标记的分类器。