CN102209968A - 肺癌生物标记及其用途 - Google Patents

肺癌生物标记及其用途 Download PDF

Info

Publication number
CN102209968A
CN102209968A CN200980144620XA CN200980144620A CN102209968A CN 102209968 A CN102209968 A CN 102209968A CN 200980144620X A CN200980144620X A CN 200980144620XA CN 200980144620 A CN200980144620 A CN 200980144620A CN 102209968 A CN102209968 A CN 102209968A
Authority
CN
China
Prior art keywords
biomarker
lung cancer
individuality
value
sample
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN200980144620XA
Other languages
English (en)
Other versions
CN102209968B (zh
Inventor
L·戈尔德
M·斯坦顿
E·N·布罗迪
R·M·奥斯特罗夫
D·济奇
A·A·E·斯图尔特
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Private Placement Protein Body Operation Co ltd
Original Assignee
Somalogic Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Somalogic Inc filed Critical Somalogic Inc
Publication of CN102209968A publication Critical patent/CN102209968A/zh
Application granted granted Critical
Publication of CN102209968B publication Critical patent/CN102209968B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N33/00Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
    • G01N33/48Biological material, e.g. blood, urine; Haemocytometers
    • G01N33/50Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing
    • G01N33/68Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing involving proteins, peptides or amino acids
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N33/00Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
    • G01N33/48Biological material, e.g. blood, urine; Haemocytometers
    • G01N33/50Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing
    • G01N33/53Immunoassay; Biospecific binding assay; Materials therefor
    • G01N33/574Immunoassay; Biospecific binding assay; Materials therefor for cancer
    • G01N33/57407Specifically defined cancers
    • G01N33/57423Specifically defined cancers of lung
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F17/00Digital computing or data processing equipment or methods, specially adapted for specific functions
    • G06F17/10Complex mathematical operations
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N2800/00Detection or diagnosis of diseases
    • G01N2800/12Pulmonary diseases
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02ATECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
    • Y02A90/00Technologies having an indirect contribution to adaptation to climate change
    • Y02A90/10Information and communication technologies [ICT] supporting adaptation to climate change, e.g. for weather forecasting or climate simulation

Landscapes

  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Immunology (AREA)
  • Biomedical Technology (AREA)
  • Molecular Biology (AREA)
  • Chemical & Material Sciences (AREA)
  • Hematology (AREA)
  • Urology & Nephrology (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Biotechnology (AREA)
  • General Health & Medical Sciences (AREA)
  • Microbiology (AREA)
  • Biochemistry (AREA)
  • Food Science & Technology (AREA)
  • Pathology (AREA)
  • Analytical Chemistry (AREA)
  • Medicinal Chemistry (AREA)
  • Cell Biology (AREA)
  • Hospice & Palliative Care (AREA)
  • Oncology (AREA)
  • Genetics & Genomics (AREA)
  • General Engineering & Computer Science (AREA)
  • Organic Chemistry (AREA)
  • Data Mining & Analysis (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Mathematical Physics (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Theoretical Computer Science (AREA)
  • Algebra (AREA)
  • Software Systems (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Databases & Information Systems (AREA)
  • Biophysics (AREA)
  • Plant Pathology (AREA)
  • Pure & Applied Mathematics (AREA)
  • Mathematical Optimization (AREA)
  • Mathematical Analysis (AREA)

Abstract

本发明包括检测和诊断肺癌的生物标记、方法、装置、试剂、系统和试剂盒。在一方面,本发明提供了生物标记,其可以单独使用或以各种组合使用来诊断肺癌或允许区分诊断肺小结为良性或恶性的。在另一方面,本发明提供了诊断个体的肺癌的方法,其中所述方法包括在来自个体的生物学样品中检测至少一个生物标记值,所述至少一个生物标记值对应于选自表1第2列提供的生物标记的组的至少一个生物标记,其中基于所述至少一个生物标记值,所述个体分类为患有肺癌,或者确定所述个体患有肺癌的似然性。

Description

肺癌生物标记及其用途
相关申请
本申请要求于2008年9月9日提交的美国临时申请第61/095,593号以及于2009年2月16日提交的美国临时申请第61/152,837号的权益,这两个临时申请的题目均为“肺癌样品的多重分析”并且这两个临时申请的全文通过引用的方式并入本文以用于所有目的。
发明领域
本申请一般地涉及个体中生物标记的检测及癌症的诊断,更具体地涉及用于诊断个体的癌症,更特别是肺癌的一种或多种生物标记、方法、装置、试剂、系统和试剂盒。
背景技术
下面的描述提供了本申请相关信息的概述,并非承认本文提供的信息或者引用的出版物是本申请的现有技术。
更多的人死于肺癌而非其他癌症类型。这对于男性和女性都是如此。2005年在美国(目前有统计数字的最近年份),肺癌死亡比乳腺癌、前列腺癌和结肠癌死亡的组合还多。在那一年,107,416名男性和89,271名女性诊断患有肺癌,并且90,139名男性和69,078女性死于肺癌。在美国男性中,肺癌是白人男性、黑人男性、亚裔/太平洋岛男性、美国印第安男性/阿拉斯加土著男性以及西班牙裔男性中第二常见的癌症。在美国女性中,肺癌是白人女性、黑人女性、美国印第安女性/阿拉斯加土著女性中第二常见的癌症,并且是亚裔/太平洋岛女性和西班牙裔女性中第三常见的癌症。对于不戒烟的人,肺癌死亡率为15%,甚至对于50-59岁的戒烟的人仍为5%以上。仅美国在肺癌上每年保健费用就为950亿美元。
91%由吸烟所致的肺癌是非小细胞肺癌(NSCLC),其占所有肺癌的约87%。所有肺癌中剩余的13%是小细胞肺癌,虽然混合细胞肺癌确有发生。因为小细胞肺癌罕见且迅速致死,所以早期检测机会不大。
NSCLC有三种主要类型:鳞状细胞癌、大细胞癌和腺癌。腺癌是最常见形式的肺癌(30%-40%,且据报道高达50%),并且是在吸烟者和非吸烟者中最常发现的肺癌。鳞状细胞癌占所有肺癌的25-30%,并且通常在近端支气管中发现。早期NSCLC倾向于局部化,如果早期检测到,其通常可以手术治疗,并且结果有利且存活率改善。其他治疗选择包括放疗、药物疗法和这些方法的组合。
NSCLC根据肿瘤大小及其在包括淋巴结在内的其他组织中的存在来分期。在隐藏期,癌细胞在痰样品或灌洗样品中发现,在肺中检测不到肿瘤。在0期,仅肺最深的内衬(lining)表现出癌细胞,肿瘤没有生长通过内衬。在IA期,癌症被认为是侵袭性的,并且已生长深入肺组织,但是肿瘤横向(across)小于3cm。在这个时期,在支气管或淋巴结中未发现肿瘤。在IB期,肿瘤横向大于3cm或者已生长入支气管或胸膜,但是尚未生长入淋巴结。在IIA期,肿瘤横向大于3cm,并且已生长入淋巴结。在IIB期,肿瘤在淋巴结中发现并且横向大于3cm,或者已生长入支气管或胸膜;或者癌症不在淋巴结中但是在胸壁、膈、胸膜、支气管或围绕心脏的组织中发现。在IIIA期,癌细胞在肺和支气管附近的淋巴结中以及肺之间的淋巴结中,不在在肿瘤所位于的胸的一侧上。在IIIB期,癌细胞位于胸的肿瘤的对侧及在颈中。肺附近的其他器官也可以具有癌细胞,并且在一个肺叶中可以发现多个肿瘤。在IV期,肿瘤在相同肺或两个肺多于一个的肺叶中发现,并且癌细胞在身体其他部分发现。
目前肺癌诊断方法包括测试痰的癌细胞、胸部X-射线、呼吸道的纤维光学评价和低剂量螺旋计算机断层扫描(CT)。痰细胞学的灵敏性非常低。胸X-射线也较不灵敏,而且要求病灶的大小大于1cm以可见。支气管镜检查要求肿瘤在支气管镜可及的呼吸道内可见。最广泛认可的诊断方法是CT,但是常与X-射线一起,CT的应用涉及电离辐射,其本身可以导致癌症。CT还有明显的限制:扫描需要高技术水平以解释,并且许多观测的异常事实上不是肺癌,在跟踪CT发现中产生很大保健花费。最常见伴随发现是良性肺小结。
肺小结是较圆的病灶或异常组织区域,其位于肺中且大小可变。肺小结可以是良性或癌性的,但是大多数是良性的。如果小结小于4mm,则发病率仅为1.5%,如果小结为4-8mm,则发病率为约6%,如果超过20mm,则发病率为约20%。对于小和中等大小的小结,建议患者在3个月至1年内重复扫描。对于许多大小结,患者接受生物活检(其是侵入性的并且可能导致并发症),即使大部分小结是良性的。
因此,亟需可以替代或补充CT的诊断方法以减少进行的手术数量及降低手术并发症的风险。另外,甚至当不存在或未知肺小结时,需要在早期检测肺癌的方法以改善患者的结局。仅16%的肺癌病例诊断为局部早期癌症,其中5年存活率为46%,相比之下,在晚期诊断的为84%,其中5年存活率仅为13%。这证实依赖于症状诊断是无用的,因为它们中的许多是其他肺疾病常见的。这些症状包括久咳、血痰、胸痛和复发性支气管炎或肺炎。
当存在癌症早期诊断方法时,益处通常是医疗行业所接受的。广泛使用筛查方案的癌症具有最高5年的存活率,如乳腺癌(88%)和结肠癌(65%),相比之下肺癌为16%。但是,如果癌症在1期通过筛查诊断,则88%的肺癌患者存活10年或更长。这证实明显亟需可以可靠地检测早期NSCLC的诊断方法。
特定疾病状态的生物标记的选择首先涉及鉴定标记,该标记对特定医疗应用在疾病群体中具有与对照群体相比可测量且统计学显著的差异。生物标记可以包括分泌或脱落(shed)的分子,其与疾病发展或进程平行,并且容易从肺组织或远端组织对病灶响应而扩散入血流。鉴定的生物标记或生物标记的集合(set)通常临床上进行验证,或者证实为对其所选的原始预期用途是可靠的指示物。生物标记可以包括小分子、肽、蛋白和核酸。影响生物标记鉴定的一些关键问题包括可用数据的过拟合(over-fitting)及数据偏差。
已使用各种方法来试图鉴定生物标记及诊断疾病。对于基于蛋白的标记,这些方法包括二维电泳、质谱和免疫测定方法。对于核酸标记,这些方法包括mRNA表达谱、微RNA谱、FISH、基因表达系列分析(SAGE)和大规模基因表达阵列。
二维电泳的应用由于如下问题而受限:低检测灵敏度;与蛋白溶解性、电荷及疏水性相关的问题;凝胶再现性;以及单个斑点代表多个蛋白的可能性。对于质谱,取决于所用形式,限制围绕样品加工和分离、对低丰度蛋白的灵敏性、信噪比考虑及不能立即鉴定检测的蛋白而出现。免疫测定方法发现生物标记的限制集中在基于抗体的多重测定不能测量大量分析物。可以简单地印刷高质量抗体的阵列,并且无需夹心而测量与这些抗体结合的分析物。(这会使用全基因组核酸序列经杂交测量有机体或细胞中的全部DNA或RNA序列的方式上的等同物。因为杂交可以是同一性的严紧测试,所以杂交实验可行。甚至非常好的抗体在选择它们的结合配偶体中也并非足够严紧来在血液或甚至是细胞提取物环境中工作,因为那些基质中的蛋白总体(ensemble)具有极其不同的丰度。)因此,必须使用不同的基于免疫测定的方法以发现生物标记—需要使用多重ELISA测定(即夹心)以获得足够严紧性来同时测量许多分析物从而决定哪些分析物确实是生物标记。夹心免疫测定不放大到高含量,因此使用标准阵列形式不能用严紧夹心免疫测定发现生物标记。最后,抗体试剂容易产生相当大的批次差异和试剂不稳定性。本发明的蛋白生物标记发现平台克服了这个问题。
许多这些方法依赖或需要在分析前一些类型的样品的分级。因此进行设计为在一系列良好限定的样品群体中鉴定/发现统计学相关生物标记的足够有效的研究所需样品制备是极其困难、昂贵和耗时的。在分级期间,大范围的各种变异性可能被引入各种样品。例如,一个潜在的标记可能对于方法是不稳定的,标记的浓度可能变化,不合适的聚集或解聚可能发生,无意的样品污染可能发生,并因此掩盖预期在早期疾病中的微小变化。
广泛接受的是使用这些技术的生物标记发现和检测方法对于鉴定诊断性生物标记具有严重限制。这些限制包括不能检测低丰度生物标记,不能持续覆盖蛋白质组的完整动态范围,样品加工和分级中的不可再现性,以及方法的整体不可再现性和缺乏稳健性(robustness)。另外,这些研究在数据中引入了偏差,针对鉴定和验证靶疾病群体内的生物标记所需的分布和随机化方面,没有充分解决包括合适的对照在内的样品群的复杂性,。
尽管意图发现有效的新生物标记的努力已进行了几十年,但是这些努力大部分是不成功的。针对各种疾病的生物标记通常在实验室中鉴定,通常通过进行一些疾病过程的基础研究时偶然发现。基于所述发现及少量临床数据,发表的论文提示鉴定了新的生物标记。然而大多数这些建议的生物标记未证实是真实或有用的生物标记,这主要是因为测试的少量临床样品对于已确实发现有效的生物标记仅提供弱统计学证据。也就是说,最初的鉴定对于统计学基本元素是不严格的。在1994-2003年的每一年中,检索科学文献表明公开了上千篇关于生物标记的参考文献。然而,在同时期内,FDA一年最多批准3种新蛋白生物标记的诊断应用,并且在若干年中没有批准新的蛋白生物标记。
基于失败的生物标记发现努力的历史,已建议了数学理论以进一步促进通常理解,即针对疾病的生物标记很少且难以发现。基于2D凝胶或质谱的生物标记研究支持这些观点。通过这些方法鉴定了非常少的有用生物标记。然而,通常忽视2D凝胶和质谱测量血液中存在的约1nM或更高浓度的蛋白,这种蛋白的总体很可能是最不可能随疾病变化的。除了本发明的生物标记发现系统,尚不存在能够精确测量低得多的浓度的蛋白表达水平的蛋白质组生物标记发现平台。
关于复杂的人生物学的生物化学途径已知许多。许多生物化学途径以在病理学内局部发挥作用的分泌的蛋白达到顶点或开始,例如分泌生长因子以刺激病理学中其他细胞的复制,分泌其他因子以避开免疫系统等。尽管许多这些分泌的蛋白以旁分泌方式发挥作用,但是一些在身体的远端运行。具有生物化学途径基本了解的本领域技术人员会理解,许多病理学特异性蛋白应当以低于(甚至远低于)2D凝胶和质谱检测极限的浓度存在于血液中。在这种相对丰富数目的疾病生物标记的鉴定之前必须有一种蛋白质组平台,其可以分析低于2D凝胶或质谱可以检测的浓度的蛋白。
因此,亟需生物标记、方法、装置、试剂、系统和试剂盒,其允许(a)区分良性肺小结与恶性肺小结;(b)检测肺癌生物标记;和(c)诊断肺癌。
发明概述
本申请包括用于检测和诊断癌症,更特别是肺癌的生物标记、方法、试剂、装置、系统和试剂盒。本申请的生物标记使用实施例1详述的基于多重适配体的测定鉴定。通过使用本文所述的基于适配体的生物标记鉴定方法,本申请描述了可用于检测和诊断肺癌的惊人的大量肺癌生物标记。在鉴定这些生物标记中,测量了来自几百个个体样品的超过800种蛋白,其中一些的浓度在低毫微微摩尔(femtomolar)范围。这比用2D凝胶和/或质谱进行的生物标记发现实验低约4个数量级。
尽管一些所述肺癌生物标记可单独用于检测和诊断肺癌,但是本文所述的方法用于分组用作一组生物标记的肺癌生物标记的多个子集。一旦鉴定了单独的生物标记或生物标记的子集,则个体中肺癌的检测或诊断可以用能够测量生物学样品中所选生物标记或多个生物标记的水平差异的任何测定平台或者形式完成。
然而,仅仅通过使用本文所述的基于适配体的生物标记鉴定方法,其中超过800个单独的潜在生物标记值从先前已经诊断为患有或不患有肺癌的大量个体中逐个进行了筛查,才可能鉴定本文公开的肺癌生物标记。这种发现方法与从条件培养基或裂解的细胞发现生物标记截然相反,因为其询问无需翻译为人病理学的更加患者相关的系统。
因此,本申请一方面提供了一种或多种生物标记以用于单独或以各种组合来诊断肺癌或者允许将肺小结区分诊断为良性或恶性。示例性实施方案包括表1第2列提供的生物标记,如上所述,这些生物标记用实施例2所述的基于多重适配体的测定鉴定。表1第5列提供的标记可以用于区分良性小节与癌性小结。表1第6列提供的标记可以用于区分无症状吸烟者与患有肺癌的吸烟者。
尽管一些所述肺癌生物标记可以单独用于检测和诊断肺癌,但是本文所述的方法也用于分组肺癌生物标记的多个子集,其各自用作三个或更多个生物标记的组。因此,本申请各个实施方案提供了包含N个生物标记的组合,其中N是至少2个生物标记。在其他实施方案中,N选自2-61个生物标记的任意数。
仍然在其他实施方案中,N选自2-7、2-10、2-15、2-20、2-25、2-30、2-35、2-40、2-45、2-50、2-55或2-61中的任意数。在其他实施方案中,N选自3-7、3-10、3-15、3-20、3-25、3-30、3-35、3-40、3-45、3-50、3-55或3-61中的任意数。在其他实施方案中,N选自4-7、4-10、4-15、4-20、4-25、4-30、4-35、4-40、4-45、4-50、4-55或4-61中的任意数。在其他实施方案中,N选自5-7、5-10、5-15、5-20、5-25、5-30、5-35、5-40、5-45、5-50、5-55或5-61中的任意数。在其他实施方案中,N选自6-10、6-15、6-20、6-25、6-30、6-35、6-40、6-45、6-50、6-55或6-61中的任意数。在其他实施方案中,N选自7-10、7-15、7-20、7-25、7-30、7-35、7-40、7-45、7-50、7-55或7-61中的任意数。在其他实施方案中,N选自8-10、8-15、8-20、8-25、8-30、8-35、8-40、8-45、8-50、8-55或8-61中的任意数。在其他实施方案中,N选自9-15、9-20、9-25、9-30、9-35、9-40、9-45、9-50、9-55或9-61中的任意数。在其他实施方案中,N选自10-15、10-20、10-25、10-30、10-35、10-40、10-45、10-50、10-55或10-61中的任意数。应理解N可以选自包含类似但更高级(order)的范围。
在另一方面,本发明提供了一种诊断个体的肺癌的方法,所述方法包括在来自个体的生物学样品中检测至少一个生物标记值,所述至少一个生物标记值对应于选自表1第2列提供的生物标记的组的至少一个生物标记,其中所述个体基于所述至少一个生物标记值分类为患有肺癌。
在另一方面,本发明提供了一种诊断个体的肺癌的方法,所述方法包括在来自个体的生物学样品中检测生物标记值,所述生物标记值每个对应于选自表1第2列所列的生物标记的组的至少N个生物标记之一,其中所述个体患有肺癌的似然性(likelihood)基于所述生物标记值确定。
在另一方面,本发明提供了一种诊断个体的肺癌的方法,所述方法包括在来自个体的生物学样品中检测生物标记值,所述生物标记值每个对应于选自表1第2列所列的生物标记的组的至少N个生物标记之一,其中所述个体基于所述生物标记值分类为患有肺癌,其中N=2-10。
在另一方面,本发明提供了一种诊断个体的肺癌的方法,所述方法包括在来自个体的生物学样品中检测生物标记值,所述生物标记值每个对应于选自表1第2列所列的生物标记的组的至少N个生物标记之一,其中所述个体患有肺癌的似然性基于所述生物标记值确定,其中N=2-10。
在另一方面,本发明提供了一种区分具有良性小结的个体与具有恶性小结的个体的方法,所述方法包括在来自个体的生物学样品中检测至少一个生物标记值,所述至少一个生物标记值对应于选自表1第5列所列的生物标记的组的至少一个生物标记,其中基于所述至少一个生物标记值,所述个体分类为具有恶性小结,或者确定所述个体具有恶性小结的似然性。
在另一方面,本发明提供了一种区分具有良性小结的个体与具有恶性小结的个体的方法,所述方法包括在来自个体的生物学样品中检测生物标记值,所述生物标记值每个对应于选自表1第5列所列的生物标记的组的至少N个生物标记之一,其中基于所述生物标记值,所述个体分类为具有恶性小结,或者确定所述个体具有恶性小结的似然性,其中N=2-10。
在另一方面,本发明提供了一种筛查吸烟者的肺癌的方法,所述方法包括在来自吸烟者个体的生物学样品中检测至少一个生物标记值,所述至少一个生物标记值对应于选自表1第6列所列的生物标记的组的至少一个生物标记,其中基于所述至少一个生物标记值,所述个体分类为患有肺癌,或者确定所述个体患有肺癌的似然性。
在另一方面,本发明提供了一种筛查吸烟者的肺癌的方法,所述方法包括在来自吸烟者个体的生物学样品中检测生物标记值,所述生物标记值每个对应于选自表1第6列所列的生物标记的组的至少N个生物标记之一,其中基于所述生物标记值,所述个体分类为患有肺癌,或者确定所述个体患有肺癌的似然性,其中N=2-10。
在另一方面,本发明提供了一种诊断个体不患有肺癌的方法,所述方法包括在来自个体的生物学样品中检测至少一个生物标记值,所述至少一个生物标记值对应于选自表1第2列所列的生物标记的组的至少一个生物标记,其中基于所述至少一个生物标记值,所述个体分类为不患有肺癌。
在另一方面,本发明提供了一种诊断个体不患有肺癌的方法,所述方法包括在来自个体的生物学样品中检测生物标记值,所述生物标记值每个对应于选自表1第2列所列的生物标记的组的至少N个生物标记之一,其中基于所述生物标记值,所述个体分类为不患有肺癌,其中N=2-10。
在另一方面,本发明提供了一种诊断肺癌的方法,所述方法包括在来自个体的生物学样品中检测生物标记值,所述生物标记值每个对应于一组N个生物标记中的生物标记,其中所述生物标记选自表1第2列所列的生物标记的组,其中所述生物标记值的分类指示所述个体患有肺癌,其中N=3-10。
在另一方面,本发明提供了一种诊断肺癌的方法,所述方法包括在来自个体的生物学样品中检测生物标记值,所述生物标记值每个对应于一组N个生物标记中的生物标记,其中所述生物标记选自表1第2列所列的生物标记的组,其中所述生物标记值的分类指示所述个体患有肺癌,其中N=3-15。
在另一方面,本发明提供了一种诊断肺癌的方法,所述方法包括在来自个体的生物学样品中检测生物标记值,所述生物标记值每个对应于选自表2-27所列组的集合的一组生物标记中的生物标记,其中所述生物标记值的分类指示所述个体患有肺癌。
在另一方面,本发明提供了一种区分具有良性小结的个体与具有恶性小结的个体的方法,所述方法包括在来自个体的生物学样品中检测生物标记值,所述生物标记值每个对应于一组N个生物标记中的生物标记,其中所述生物标记选自表1第5列所列的生物标记的组,其中基于所述生物标记值,所述个体分类为具有恶性小结,或者确定所述个体具有恶性小结的似然性,其中N=3-10。
在另一方面,本发明提供了一种区分具有良性小结的个体与具有恶性小结的个体的方法,所述方法包括在来自个体的生物学样品中检测生物标记值,所述生物标记值每个对应于一组N个生物标记中的生物标记,其中所述生物标记选自表1第5列所列的生物标记的组,其中基于所述生物标记值,所述个体分类为具有恶性小结,或者确定所述个体具有恶性小结的似然性,其中N=3-15。
在另一方面,本发明提供了一种筛查吸烟者的肺癌的方法,所述方法包括在来自吸烟者个体的生物学样品中检测生物标记值,所述生物标记值每个对应于一组N个生物标记中的生物标记,其中所述生物标记选自表1第6列所列的生物标记的组,其中基于所述生物标记值,所述个体分类为患有肺癌,或者确定所述个体患有肺癌的似然性,其中N=3-10。
在另一方面,本发明提供了一种筛查吸烟者的肺癌的方法,所述方法包括在来自吸烟者个体的生物学样品中检测生物标记值,所述生物标记值每个对应于一组N个生物标记中的生物标记,其中所述生物标记选自表1第6列所列的生物标记的组,其中基于所述生物标记值,所述个体分类为患有肺癌,或者确定所述个体患有肺癌的似然性,其中N=3-15。
在另一方面,本发明提供了一种诊断肺癌不存在的方法,所述方法包括在来自个体的生物学样品中检测生物标记值,所述生物标记值每个对应于一组N个生物标记中的生物标记,其中所述生物标记选自表1第2列所列的生物标记的组,其中所述生物标记值的分类指示所述个体患有肺癌,其中N=3-10。
在另一方面,本发明提供了一种诊断肺癌不存在的方法,所述方法包括在来自个体的生物学样品中检测生物标记值,所述生物标记值每个对应于一组N个生物标记中的生物标记,其中所述生物标记选自表1第2列所列的生物标记的组,其中所述生物标记值的分类指示所述个体患有肺癌,其中N=3-15。
在另一方面,本发明提供了一种诊断肺癌不存在的方法,所述方法包括在来自个体的生物学样品中检测生物标记值,所述生物标记值每个对应于选自表2-27提供的组的集合的一组生物标记中的生物标记,其中所述生物标记值的分类指示所述个体中不存在肺癌。
在另一方面,本发明提供了一种诊断个体的肺癌的方法,所述方法包括在来自个体的生物学样品中检测生物标记值,所述生物标记值对应于选自表1第2列所列的生物标记的组的至少N个生物标记之一,其中基于偏离预定阈值的分类评分,所述个体分类为患有肺癌,其中N=2-10。
在另一方面,本发明提供了一种区分具有良性小结的个体与具有恶性小结的个体的方法,所述方法包括在来自个体的生物学样品中检测生物标记值,所述生物标记值每个对应于一组N个生物标记中的生物标记,其中所述生物标记选自表1第5列所列的生物标记的组,其中基于偏离预定阈值的分类评分,所述个体分类为具有恶性小结,或者确定所述个体具有恶性小结的似然性,其中N=3-10。
在另一方面,本发明提供了一种区分具有良性小结的个体与具有恶性小结的个体的方法,所述方法包括在来自个体的生物学样品中检测生物标记值,所述生物标记值每个对应于一组N个生物标记中的生物标记,其中所述生物标记选自表1第5列所列的生物标记的组,其中基于偏离预定阈值的分类评分,所述个体分类为具有恶性小结,或者确定所述个体具有恶性小结的似然性,其中N=3-15。
在另一方面,本发明提供了一种筛查吸烟者的肺癌的方法,所述方法包括在来自吸烟者个体的生物学样品中检测生物标记值,所述生物标记值每个对应于一组N个生物标记中的生物标记,其中所述生物标记选自表1第6列所列的生物标记的组,其中基于偏离预定阈值的分类评分,所述个体分类为患有肺癌,或者确定所述个体患有肺癌的似然性,其中N=3-10。
在另一方面,本发明提供了一种筛查吸烟者的肺癌的方法,所述方法包括在来自吸烟者个体的生物学样品中检测生物标记值,所述生物标记值每个对应于一组N个生物标记中的生物标记,其中所述生物标记选自表1第6列所列的生物标记的组,其中基于偏离预定阈值的分类评分,所述个体分类为患有肺癌,或者确定所述个体患有肺癌的似然性,其中N=3-15。
在另一方面,本发明提供了一种诊断个体中不存在肺癌的方法,所述方法包括在来自个体的生物学样品中检测生物标记值,所述生物标记值对应于选自表1第2列所列的生物标记的组的至少N个生物标记之一,其中基于偏离预定阈值的分类评分,所述个体分类为不患有肺癌,其中N=2-10。
在另一方面,本发明提供了一种指示肺癌的似然性的计算机执行方法。所述方法包括:在计算机上检索个体的生物标记信息,其中所述生物标记信息包括生物标记值,所述生物标记值每个对应于选自表1第2列所列的生物标记的组的至少N个生物标记之一,其中N如上定义;用计算机对每个所述生物标记值进行分类;以及基于多个分类指示所述个体患有肺癌的似然性。
在另一方面,本发明提供了一种将个体分类为患有或不患有肺癌的计算机执行方法。所述方法包括:在计算机上检索个体的生物标记信息,其中所述生物标记信息包括生物标记值,所述生物标记值每个对应于选自表1第2列提供的生物标记的组的至少N个生物标记之一;用计算机对每个所述生物标记值进行分类;以及基于多个分类指示所述个体是否患有肺癌。
在另一方面,本发明提供了一种指示肺癌的似然性的计算机程序产品。所述计算机程序产品包括包含程序代码的计算机可读取介质,所述程序代码可由计算装置或系统的处理器执行,所述程序代码包括:检索归因于来自个体的生物学样品的数据的代码,其中所述数据包括生物标记值,所述生物标记值每个对应于所述生物学样品中选自表1第2列所列的生物标记的组的至少N个生物标记之一,其中N如上定义;以及执行分类方法的代码,所述分类方法指示作为所述生物标记值的函数的所述个体患有肺癌的似然性。
在另一方面,本发明提供了一种指示个体的肺癌状态的计算机程序产品。所述计算机程序产品包括包含程序代码的计算机可读取介质,所述程序代码可由计算装置或系统的处理器执行,所述程序代码包括:检索归因于来自个体的生物学样品的数据的代码,其中所述数据包括生物标记值,所述生物标记值每个对应于所述生物学样品中选自表1第2列提供的生物标记的组的至少N个生物标记之一;以及执行分类方法的代码,所述分类方法指示作为所述生物标记值的函数的所述个体的肺癌状态。
在另一方面,本发明提供了一种指示肺癌的似然性的计算机执行方法。所述方法包括:在计算机上检索个体的生物标记信息,其中所述生物标记信息包括生物标记值,所述生物标记值对应于选自表1第2列所列的生物标记的组的生物标记;用计算机对所述生物标记值进行分类;以及基于所述分类指示所述个体患有肺癌的似然性。
在另一方面,本发明提供了一种将个体分类为患有或不患有肺癌的计算机执行方法。所述方法包括:从计算机检索个体的生物标记信息,其中所述生物标记信息包括生物标记值,所述生物标记值对应于选自表1第2列提供的生物标记的组的生物标记;用计算机对所述生物标记值进行分类;以及基于所述分类指示所述个体是否患有肺癌。
在另一方面,本发明提供了一种指示肺癌的似然性的计算机程序产品。所述计算机程序产品包括包含程序代码的计算机可读取介质,所述程序代码可由计算装置或系统的处理器执行,所述程序代码包括:检索归因于来自个体的生物学样品的数据的代码,其中所述数据包括生物标记值,所述生物标记值对应于所述生物学样品中选自表1第2列所列的生物标记的组的生物标记;以及执行分类方法的代码,所述分类方法指示作为所述生物标记值的函数的所述个体患有肺癌的似然性。
在另一方面,本发明提供了一种指示个体的肺癌状态的计算机程序产品。所述计算机程序产品包括包含程序代码的计算机可读取介质,所述程序代码可由计算装置或系统的处理器执行,所述程序代码包括:检索归因于来自个体的生物学样品的数据的代码,其中所述数据包括生物标记值,所述生物标记值对应于所述生物学样品中选自表1第2列提供的生物标记的组的生物标记;以及执行分类方法的代码,所述分类方法指示作为所述生物标记值的函数的所述个体的肺癌状态。
附图说明
图1A是检测生物学样品中的肺癌的示例方法的流程图。
图1B是用朴素贝叶斯(
Figure BPA00001368927800121
Bayes)分类方法检测生物学样品中的肺癌的示例方法的流程图。
图2示出单个生物标记SCFsR的ROC曲线,其使用用于检测无症状吸烟者中的肺癌的测试的朴素贝叶斯分类器(classifier)。
图3示出1至10个生物标记的生物标记组的ROC曲线,其使用用于检测无症状吸烟者中的肺癌的测试的朴素贝叶斯分类器。
图4示出随生物标记的数目从1增加到10的分类评分(特异性+灵敏性)的增加,其使用用于良性小结-肺癌组的朴素贝叶斯分类。
图5示出对于良性小结对照组(实线)和肺癌疾病组(虚线),作为log转化的RFU形式的累积分布函数(cdf)的SCFsR的测量的生物标记分布,以及它们的曲线拟合为正态cdf(短划线),以用于训练(train)朴素贝叶斯分类器。
图6示出与本文所述的各种计算机执行方法一起使用的示例计算机系统。
图7是一实施方案的指示个体患有肺癌的似然性的方法的流程图。
图8是一实施方案的指示个体患有肺癌的似然性的方法的流程图。
图9示出可以用于检测生物学样品中一个或多个肺癌生物标记的示例适配体测定。
图10示出从聚集的潜在生物标记的集合使用哪些生物标记来构建分类器以区分NSCLC与良性小结的频率的柱状图。
图11示出从聚集的潜在生物标记的集合使用哪些生物标记来构建分类器以区分NSCLC与无症状吸烟者的频率的柱状图。
图12示出从位点一致(site-consistent)的潜在生物标记的集合使用哪些生物标记来构建分类器以区分NSCLC与良性小结的频率的柱状图。
图13示出从位点一致的潜在生物标记的集合使用哪些生物标记来构建分类器以区分NSCLC与无症状吸烟者的频率的柱状图。
图14示出从得自聚集和位点一致的标记组合的潜在生物标记的集合使用哪些生物标记来构建分类器以区分NSCLC与良性小结的频率的柱状图。
图15示出从得自聚集和位点一致的标记组合的潜在生物标记的集合使用哪些生物标记来构建分类器以区分NSCLC与无症状吸烟者的频率的柱状图。
图16示出得自pull-down实验的凝胶图像,其示出作为蛋白LBP、C9和IgM的捕获剂的适配体的特异性。对于每个凝胶,泳道1是来自链霉抗生物素蛋白-琼脂糖珠的洗脱物,泳道2是最终洗脱物,泳道是MW标记泳道(主要条带从上至下是110、50、30、15和3.5kDa)。
图17A示出一对柱状图,其总结了使用表1第5列(实线)所列的生物标记和随机标记的集合(虚线)的所有可能的单蛋白朴素贝叶斯分类器评分(灵敏性+特异性)。
图17B示出一对柱状图,其总结了使用表1第5列(实线)所列的生物标记和随机标记的集合(虚线)的所有可能的二蛋白朴素贝叶斯分类器评分(灵敏性+特异性)。
图17C示出一对柱状图,其总结了使用表1第5列(实线)所列的生物标记和随机标记的集合(虚线)的所有可能的三蛋白朴素贝叶斯分类器评分(灵敏性+特异性)。
图18A示出一对柱状图,其总结了使用表1第6列(实线)所列的生物标记和随机标记的集合(虚线)的所有可能的单蛋白朴素贝叶斯分类器评分(灵敏性+特异性)。
图18B示出一对柱状图,其总结了使用表1第6列(实线)所列的生物标记和随机标记的集合(虚线)的所有可能的二蛋白朴素贝叶斯分类器评分(灵敏性+特异性)。
图18C示出一对柱状图,其总结了使用表1第6列(实线)所列的生物标记和随机标记的集合(虚线)的所有可能的三蛋白朴素贝叶斯分类器评分(灵敏性+特异性)。
图19A示出使用选自完全组(◆)的2-10个标记的朴素贝叶斯分类器的灵敏性+特异性评分,以及通过在用于良性小结对照组的分类器产生期间放弃最好的5个(■)、10个(▲)和15个(x)标记获得的评分。
图19B示出使用选自完全组(◆)的2-10个标记的朴素贝叶斯分类器的灵敏性+特异性评分,以及通过在用于吸烟者对照组的分类器产生期间放弃最好的5个(■)、10个(▲)和15个(x)标记获得的评分。
图20A示出一组ROC曲线,其从表38和39中的数据对1至5个标记的组建模。
图20B示出一组ROC曲线,其从对图19A的1至5个标记的组训练数据计算。
发明详述
现在详细描述本发明的代表性实施方案。虽然本发明结合列举的实施方案进行描述,但是应理解本发明并不限于这些实施方案。相反,本发明旨在涵盖可包含在如权利要求书所限定的本发明范围内的所有替代、修饰和等价物。
本领域技术人员应意识到与本文所述的方法和材料相似或等价的许多方法和材料可用于或在本发明的范围内。本发明决不限于本文描述的方法和材料。
除非特别说明,本文所用技术和学术术语具有本发明所属领域技术人员通常了解的相同含义。尽管与本文所述的方法、装置和材料相似或等价的任何方法、装置和材料可用于实施或测试本发明,但是现在描述一些优选的方法、装置和材料。
本申请书中列举的所有出版物、公开的专利文件和专利申请均表示本申请所属领域技术人员的水平。本文列举的所有出版物、公开的专利文件和专利申请在此以如同每个单独的出版物、公开的专利文件或专利申请特别且单独指示相同的程度并入本文作参考。
如在包括所附权利要求书在内的本申请中所用,除非特别说明,单数形式“一个(a)”、“一个(an)”和“这个(the)”包括复数形式,且与“至少一个”和“一个或多个”可以互换使用。因此,提及的“一个适配体”包括适配体的混合物,提及的“探针”包括探针的混合物等。
如本文所用,术语“约”表示数值的不明显更改或变化,由此该数值所涉及的项目的基本功能未改变。
如本文所用,术语“包含(comprises)”、“包含(comprising)”、“包括(includes)”、“包括(including)”、“含有(contains)”、“含有(containing)”及它们的任何变体意图覆盖非排他的包含,由此包含、包括或含有一个元件或者一系列元件的过程、方法、方法限定产品或组成(composition of matter)不仅包括这些元件,而且可以包括未明确列举或这样的过程、方法、方法限定产品或组成固有的其他元件。
本发明包括用于检测和诊断肺癌的生物标记、方法、装置、试剂、系统和试剂盒。
在一方面,本发明提供了一种或多种生物标记,其单独或以各种组合用于诊断肺癌,允许区分诊断肺小结是良性或恶性的,监测肺癌复发或寻址(address)其他临床指征。如下文详细描述,示例性实施方案包括表1第2列提供的生物标记,这些生物标记使用基于多重适配体的测定来鉴定,所述测定在实施例1中,更特别是在实施例2中描述。
表1第2列列出得自以下分析的发现:来自NSCLC癌症病例的几百个个体血液样品以及来自吸烟者和来自诊断为具有良性肺小结的个体的几百个等价个体血液样品。吸烟者和良性小结组的设计使得肺癌测试与群体匹配可以具有最大益处。(这些病例和对照得自多个临床场所以模拟这样的测试可以应用的真实世界条件的范围)。潜在的生物标记在单独的样品而不是在混合疾病和对照血液中测量;这允许更好地理解与疾病(在这种情况下是肺癌)的存在和不存在相关的表型中个体和组的变化。由于对每个样品进行800个以上的蛋白测量,并且单独测量来自每个疾病和对照群体的几百个样品,所以表1第2列得自非常大的数据集合的分析。使用本文“生物标记的分类和疾病评分计算”章节中描述的方法分析测量结果。
表1第2列列出了发现可用于区分得自NSCLC个体的样品与得自吸烟者和良性肺小结个体的“对照”样品的生物标记。使用本文所述的多重适配体测定,发现了38个生物标记,其区分得自患有肺癌的个体的样品与得自吸烟者对照组中个体的样品(见表1第6列)。相似地,使用多重适配体测定,发现了40个生物标记,其区分得自NSCLC个体的样品与得自具有良性肺小结的人的样品(见表1第5列)。总之,这两列38和40个生物标记由61个独特的生物标记组成,因为区分NSCLC与良性小结的生物标记的列表与区分NSCLC与不患有肺癌的吸烟者的生物标记的列表之间有相当大的重叠。
虽然某些所述肺癌生物标记可单独用于检测和诊断肺癌,但是本文还描述了肺癌生物标记的多个子集的分组,其中每个分组或者子集选择可作为一组三个或更多个生物标记使用,这在本文中互换地称为“生物标记组”和一组。因此,本申请的各种实施方案提供了包含N个生物标记的组合,其中N是至少两个生物标记。在其他实施方案中,N选自2-61个生物标记。
仍然在其他实施方案中,N选自2-7、2-10、2-15、2-20、2-25、2-30、2-35、2-40、2-45、2-50、2-55或2-61中的任意数。在其他实施方案中,N选自3-7、3-10、3-15、3-20、3-25、3-30、3-35、3-40、3-45、3-50、3-55或3-61中的任意数。在其他实施方案中,N选自4-7、4-10、4-15、4-20、4-25、4-30、4-35、4-40、4-45、4-50、4-55或4-61中的任意数。在其他实施方案中,N选自5-7、5-10、5-15、5-20、5-25、5-30、5-35、5-40、5-45、5-50、5-55或5-61中的任意数。在其他实施方案中,N选自6-10、6-15、6-20、6-25、6-30、6-35、6-40、6-45、6-50、6-55或6-61中的任意数。在其他实施方案中,N选自7-10、7-15、7-20、7-25、7-30、7-35、7-40、7-45、7-50、7-55或7-61中的任意数。在其他实施方案中,N选自8-10、8-15、8-20、8-25、8-30、8-35、8-40、8-45、8-50、8-55或8-61中的任意数。在其他实施方案中,N选自9-15、9-20、9-25、9-30、9-35、9-40、9-45、9-50、9-55或9-61中的任意数。在其他实施方案中,N选自10-15、10-20、10-25、10-30、10-35、10-40、10-45、10-50、10-55或10-61中的任意数。应理解N可以选自包含类似但更高级的范围。
在一实施方案中,可用于生物标记子集或者组的生物标记的数目基于生物标记值特定组合的灵敏性和特异性值。本文所用术语“灵敏性”和“特异性”是关于基于在个体的生物学样品中检测的一个或多个生物标记值来正确分类个体患有肺癌或不患有肺癌的能力。“灵敏性”指生物标记或多个生物标记关于正确分类患有肺癌的个体的性能。“特异性”指生物标记或多个生物标记关于正确分类不患有肺癌的个体的性能。例如,用于测试一组对照样品和肺癌样品的一组标记的85%特异性和90%灵敏性指85%的对照样品由该组正确分类为对照样品,并且90%的肺癌样品由该组正确分类为肺癌样品。期望或优选的最小值可以如实施例3所述确定。代表性标记组在表2-27中示出,其列出了一系列100个不同的3-15个生物标记的组,其具有每组的特异性和灵敏性的标示水平。这些组中每一个的每个标记出现的总数在每个表的底部示出。
在一方面,在个体中通过以下方法检测或诊断肺癌:对来自所述个体的生物学样品进行测定,并检测生物标记值,所述生物标记值每个对应于生物标记ERBB1、LRIG3或SCFsR的至少一个和选自表1第2列的生物标记列表的至少N个额外的生物标记,其中N等于2、3、4、5、6、7、8、9、10、11、12、13、14或15。在另一方面,在个体中通过以下方法检测或诊断肺癌:对来自所述个体的生物学样品进行测定,并检测生物标记值,所述生物标记值每个对应于生物标记ERBB1、LRIG3和SCFsR和选自表1第2列的生物标记列表的至少N个额外的生物标记之一,其中N等于1、2、3、4、5、6、7、8、9、10、11、12或13。在另一方面,在个体中通过以下方法检测或诊断肺癌,对来自所述个体的生物学样品进行测定,并检测生物标记值,所述生物标记值每个对应于生物标记ERBB1和选自表1第2列的生物标记列表的至少N个额外的生物标记之一,其中N等于2、3、4、5、6、7、8、9、10、11、12、13、14或15。在另一方面,在个体中通过以下方法检测或诊断肺癌:对来自所述个体的生物学样品进行测定,并检测生物标记值,所述生物标记值每个对应于生物标记LRIG3和选自表1第2列的生物标记列表的至少N个额外的生物标记之一,其中N等于2、3、4、5、6、7、8、9、10、11、12、13、14或15。在另一方面,在个体中通过以下方法检测或诊断肺癌:对来自所述个体的生物学样品进行测定,并检测生物标记值,所述生物标记值每个对应于生物标记SCFsR和选自表1第2列的生物标记列表的至少N个额外的生物标记之一,其中N等于2、3、4、5、6、7、8、9、10、11、12、13、14或15。
本文鉴定的肺癌生物标记表示较大数目的可用于有效检测或诊断肺癌的生物标记的子集或组的选择。期望数目的这类生物标记的选择取决于所选生物标记的特定组合。重要的是记住:用于检测或诊断肺癌的生物标记的组也可以包含在表1第2列中未发现的生物标记,并且包含在表1第2列中未发现的额外的生物标记可以减少选自表1第2列的特定子集或组中生物标记的数目。如果额外的生物医学信息与生物标记值联合用于建立对于给定测定可接受的灵敏性和特异性值,则用于子集或组的来自表1第2列的生物标记的数目也可以减少。
可能影响用于生物标记的子集或组的生物标记数目的另一因素是用于从进行肺癌诊断的个体中获得生物学样品的方法。在精心控制的样品获取环境中,符合期望的灵敏性和特异性值必需的生物标记的数目会低于在样品收集、处理和贮存中可以存在更多变化的情况中的数目。在研究表1第2列所列的生物标记列表中,利用多个样品收集位点来收集数据以进行分类器训练。这提供了更稳健的生物标记,其对于样品收集、处理和贮存中的变化较不敏感,但是如果训练数据都在非常相似条件下获得,则还可以要求子集或组中更大的生物标记数目。
本申请的一方面可以参考图1A和B来一般性描述。生物学样品获得自所关注的一个或多个个体。然后测定该生物学样品以检测所关注的一个或多个(N个)生物标记的存在,并确定所述N个生物标记的每一个的生物标记值(在图1B中称为标记RFU)。一旦检测生物标记并指定生物标记值,则如本文详细描述地对每个标记进行评分或者分类。然后组合标记评分以提供总诊断评分,其表示获取样品的个体患有肺癌的似然性。
如本文所用,“肺(lung)”与“肺(pulmonary)”可互换使用。
如本文所用,“吸烟者”指具有吸烟历史的个体。
“生物学样品”、“样品”和“测试样品”在本文可互换使用,指获得自或以另外的方式源自个体的任何材料、生物液体、组织或者细胞。这包括血液(包括全血、白细胞、外周血单核细胞、血沉棕黄层(buffy coat)、血浆和血清)、痰液、泪液、粘液、洗鼻液(wash)、鼻抽吸物(aspirate)、呼吸物(breath)、尿液、精液、唾液、脑膜液(meningeal fluid)、羊水、腺体液(glandular fluid)、淋巴液、乳头抽吸物、支气管抽吸物、滑液、关节抽吸物、细胞、细胞提取物和脑脊液。其还包括上述所有材料的实验分离级分。例如,血液样品可以分级分离为血清或含有诸如红细胞或白细胞(淋巴细胞)的特定类型血细胞的级分。如果需要,样品可以是来自个体的样品的组合,如组织与液体样品的组合。术语“生物学样品”也包括含有均质固体材料的材料,如来自粪便样品、组织样品或组织活检样品的材料。术语“生物学样品”也包括源自组织培养或者细胞培养的材料。可以使用获得生物学样品的任何合适方法;示例性方法包括如静脉切开放血术、拭子(如口腔拭子)以及细针抽吸活检方法。易受细针抽吸影响的示例性组织包括淋巴结、肺、肺洗液、BAL(支气管肺泡灌洗液)、甲状腺、乳腺和肝。样品也可以通过显微切割(如激光捕获显微切割(LCM)或激光显微切割(LMD))、膀胱冲洗、涂片(如PAP涂片)或导管灌洗收集。获得自或源自个体的“生物学样品”包括在获得自所述个体之后已经通过任何合适方式处理的任何此类样品。
此外,应认识到生物学样品可以通过从多个体中取得生物学样品并将它们混合或混合每个个体的生物学样品的等份而获得。混合的样品可以作为来自单个个体的样品进行处理,并且如果在混合的样品中确定癌症的存在,则可以将每个个体的生物学样品再进行测试以确定哪个/哪些个体患有肺癌。
对于本说明书的目的,短语“归因于来自个体的生物学样品的数据”指所述数据以某种形式源自所述个体的生物学样品或利用所述个体的生物学样品产生。数据在产生后可以被重新格式化、修改或以数学方式改变至某种程度,例如通过从一种测量系统中的单位转变为另一测量系统中的单位;但是应理解,数据源自所述生物学样品或利用所述生物学样品产生。
“靶标”、“靶分子”和“分析物”在本文可互换使用,指可能存在于生物学样品中的任何所关注的分子。“所关注的分子”包括特定分子的任何微小变化,如在蛋白的情况下,例如氨基酸序列的微小变化、二硫键形成、糖基化、脂质化、乙酰化、磷酸化或者任何其他操作或修饰,如与基本不改变分子同一性的标记组分偶联。“靶分子”、“靶标”或“分析物”是一种类型或种类的分子或多分子结构的一组拷贝。“靶分子”、“靶标”和“分析物”指一组以上这样的分子。示例性靶分子包括蛋白、多肽、核酸、碳水化合物、脂质、多糖、糖蛋白、激素、受体、抗原、抗体、affybodies、抗体模拟物(mimic)、病毒、病原体、毒性物质、底物、代谢物、过渡态类似物、辅因子、抑制剂、药物、染料、营养素、生长因子、细胞、组织以及前述物质的任何片段或部分。
如本文所用,“多肽”、“肽”和“蛋白”在本文可互换使用,指任何长度的氨基酸聚合物。聚合物可以是线性或支化的,其可以包含修饰的氨基酸,并且其可以被非氨基酸中断。该术语还涵盖已经被天然修饰或者通过干预修饰的氨基酸聚合物;例如,二硫键形成、糖基化、脂质化、乙酰化、磷酸化或任何其他操作或修饰,如与标记组分偶联。该定义还包括例如含有一个或多个氨基酸类似物(包括例如非天然氨基酸等)以及本领域已知的其他修饰的多肽。多肽可以是单链或缔合(associated)链。该定义还包括前蛋白和完整的成熟蛋白;源生自成熟蛋白的肽或多肽;蛋白的片段;剪接变体;蛋白的重组形式;具有氨基酸修饰、缺失或取代的蛋白变体;消化;以及翻译后修饰,如糖基化、乙酰化、磷酸化等。
如本文所用,“标记”和“生物标记”可互换使用,指指示个体中正常或异常过程或者个体中疾病或其他病症的迹象或者是个体中正常或异常过程或者个体中疾病或其他病症的迹象的的靶分子。更具体地,“标记”或“生物标记”是与无论正常与否的特定生理状态或过程的存在相关的解剖学、生理学、生物化学或分子参数,并且如果是异常的,则无论是慢性或急性的。生物标记可以通过各种方法检测和测量,包括实验室测定和医学成像。当生物标记是蛋白时,也可以使用对应的表达作为生物学样品中对应蛋白生物标记的量或存在或不存在或者编码该生物标记的基因或控制该生物标记表达的蛋白的甲基化状态的替代测量。
如本文所用,“生物标记值”、“值”、“生物标记水平”和“水平”在本文可互换使用,指使用任何分析方法来检测生物学样品中的生物标记而进行的测量,其示出所述生物学样品中的生物标记、对于所述生物标记或对应于所述生物标记的存在、不存在、绝对量或浓度、相对量或浓度、效价、水平、表达水平、测量水平的比率等。所述“值”或“水平”的确切性质取决于用于检测生物标记的特定分析方法的具体设计和组分。
当生物标记表示个体中异常过程或疾病或其他病症或者是个体中异常过程或疾病或其他病症的迹象时,该生物标记通常描述为与表示个体中正常过程或不存在疾病或其他病症或者是个体中正常过程或不存在疾病或其他病症的迹象的生物标记的表达水平或值相比时是过表达或低表达的。“上调”、“上调的”、“过表达”、“过表达的”及其任何变体在本文可互换使用,指生物学样品中生物标记的值或水平高于通常在来自健康或正常个体的相似生物学样品中检测的所述生物标记的值或水平(或者值或水平的范围)。该术语也可以指生物学样品中生物标记的值或水平高于在特定疾病的不同阶段检测的生物标记的值或水平(或者值或水平的范围)。
“下调”、“下调的”、“低表达”或“表达低的”及其任何变体在本文可互换使用,指生物学样品中生物标记的值或水平低于通常在来自健康或正常个体的相似生物学样品中检测的生物标记的值或水平(或者值或水平的范围)。该术语也指生物学样品中生物标记的值或水平低于在特定疾病的不同阶段检测的所述生物标记的值或水平(或者值或水平的范围)。
此外,过表达的或低表达的生物标记也可以指与所述生物标记的“正常”表达水平或值相比是“差异表达的”或具有“不同水平”或“不同值”,所述“正常”表达水平或值表示个体中正常过程或不存在疾病或其他病症或者是个体中正常过程或不存在疾病或其他病症的迹象。因此,生物标记的“差异表达”也可以指与所述生物标记的“正常”表达水平不同。
术语“不同的基因表达”和“差异表达”在本文可互换使用,指在患有指定疾病的对象中基因(或其对应蛋白表达产物)的表达被激活至相对于其在正常或对照对象中的表达较高或较低的水平。该术语还包括基因(或其对应的蛋白表达产物)的表达在相同疾病的不同各阶段被激活至较高或较低水平。也应理解差异表达的基因可以在核酸水平或蛋白水平激活或抑制,或者可以进行可变剪接以获得不同的多肽产物。这样的差异可以通过许多改变证实,包括多肽的mRNA水平、表面表达、分泌或其他分配(partitioning)。不同的基因表达可以包括比较两个或更多个基因或者它们的基因产物之间的表达;或者比较两个或更多个基因或者它们的基因产物之间的表达的比率;或者甚至比较相同基因的两种不同的加工产物,其在正常对象与患病对象之间或者在相同疾病的不同阶段之间是不同的。差异表达包括在例如正常和患病细胞或者经历不同疾病事件或疾病阶段的细胞中的基因或其表达产物在时间或细胞表达模式中的定量以及定性的差异。
如本文所用,“个体”指测试对象或患者。个体可以是哺乳动物或非哺乳动物。在一些实施方案中,个体是哺乳动物。哺乳动物个体可以是人或非人。在一些实施方案中,个体是人。健康或正常个体是其中通过常规诊断方法未检测出所关注的疾病或病症(包括例如肺疾病、肺相关疾病或其他肺病症)的个体。
“诊断(Diagnose)”、“诊断(diagnosing)”、“诊断(diagnosis)”及其变体指基于个体相关的一种或多种迹象、症状、数据或其他信息对所述个体的健康状况或病症的检测、确定或识别。个体的健康状况可以诊断为健康/正常(即诊断为不存在疾病或病症)或者诊断为患病/异常(即诊断为存在疾病或病症或者对疾病或者病症的特性的评价)。对于特定疾病或病症,术语“诊断(Diagnose)”、“诊断(diagnosing)”、“诊断(diagnosis)”等涵盖对疾病的初始检测;对疾病的表征或分类;疾病进展、缓解或复发的检测;以及在给予个体治疗或疗法后疾病应答的检测。肺癌的诊断包括区分患有癌症与不患有癌症的个体,包括吸烟者和非吸烟者。其还包括区分良性肺小结与癌性肺小结。
“预后(Prognose)”、“预后(prognosing)”、“预后(prognosis)”及其变体指预测患有疾病或病症的个体中所述疾病或病症的未来进程(如预测患者存活),这个术语涵盖在给予个体治疗或疗法后评价疾病的应答。
“评价(Evaluate)”、“评价(evaluating)”、“评价(evaluation)”及其变体涵盖“诊断”和“预后”,也涵盖对不患病个体的疾病或病症的未来进程的确定或预测以及确定或者预测在表面上已经治愈疾病的个体中所述疾病或病症复发的似然性。术语“评价”还包括评价个体对疗法的应答,例如预测个体是否可能对治疗剂顺利地应答,或者不大可能对治疗剂应答(或者会例如经历毒性或其他不期望的副作用);选择给予个体的治疗剂;或者监测或确定个体对已经给予该个体的疗法的应答。因此,“评价”肺癌可以包括例如以下任何方面:预后个体中肺癌的未来进程;预测表面上已经治愈肺癌的个体中肺癌的复发;或者确定或预测个体对于肺癌治疗的应答;或者基于确定源自个体生物学样品的生物标记值来选择给予该个体的肺癌治疗。
任何如下实例均可以称作“诊断”或“评价”肺癌:最初检测肺癌的存在或不存在;确定肺癌的具体阶段、类型或亚型或者其他分类或特性;确定肺小结是良性病变或恶性肺肿瘤;或者检测/监测肺癌进展(如监测肺肿瘤生长或转移扩散)、缓解或复发。
如本文所用,“额外的生物医学信息”指除了使用本文所述任何生物标记之外的对个体所做的与肺癌风险相关的一个或多个评价。“额外的生物医学信息”包括如下任何方面:个体的物理描述(physical descriptor)、通过CT成像观察到的肺小结的物理描述、个体的身高和/或体重、个体的性别、个体的种族、吸烟史、职业史、暴露于已知致癌物(如暴露于任何石棉、氡气、化学品、来自火的烟以及空气污染,这可包括来自静止或移动来源的排放物,如工业/工厂或汽车/海运/飞机排放物)、暴露于二手烟、肺癌(或其他癌症)家族史、肺小结的存在、小结的大小、小结的部位、小结的形态学(如通过CT成像、磨玻璃影(GGO)观察,实体、非实体)、小结的边界特点(如平滑、分叶、锐利及光滑、针状、浸润)等。吸烟史通常以术语“包年(pack year)”量化,其指一个人吸烟的年数乘以每天吸烟的平均包数。例如,平均每天吸一包烟共35年的人称作吸烟史为35包年。额外的生物医学信息可以通过使用本领域已知的常规技术得自个体,如通过使用常规患者问卷调查或健康史问卷调查等得自个体自身,或者得自医学从业人员等。或者,额外的生物医学信息可以得自常规成像技术,包括CT成像(如低剂量CT成像)和X-射线检查。生物标记水平的测试联合任何额外的生物医学信息的评价与单独测试生物标记或单独评价额外的生物医学信息的任何特定项目(如单独的CT成像)相比,可以例如改善检测肺癌(或其他肺癌相关用途)的灵敏性、特异性和/或AUC。
术语“曲线下面积”或“AUC”指接受者操作特性(ROC)曲线下的面积,这两个术语均为本领域所熟知。AUC测量可以用于比较完整数据范围内的分类器的精确性。具有较大AUC的分类器具有较大的能力来正确分类两个所关注的组(如肺癌样品与正常或对照样品)之间的未知情况。ROC曲线可以用于对特定特征的性能作图(如本文描述的任何生物标记和/或任何额外的生物医学信息项目),以在两个群体之间进行区分(如患有肺癌的病例与无肺癌的对照)。通常,整个群体(如病例与对照)的特征数据基于单个特征的值递增分类。然后,对于该特征的每个值,计算数据的真阳性率和假阳性率。真阳性率通过计数高于该特征值的病例数,然后除以病例总数而确定。假阳性率通过计数高于该特征值的对照数,然后除以对照总数而确定。尽管这个定义指其中特征在病例中与在对照中相比升高的情况,但是这个定义也适用于其中特征在病例中与在对照中相比降低的情况(在这种情况下,计数低于该特征值的样品)。ROC曲线可以对单个特征以及其他单个输出产生,例如两个或更多个特征的组合可以是数学组合(如加、减、乘等)以提供单个的和值,该单个的和值可以在ROC曲线中绘制。此外,其中组合产生单个输出值的多个特征的任意组合可以在ROC曲线中绘制。这些特征的组合可以包括测试。ROC曲线是测试的真阳性率(灵敏性)对测试的假阳性率(1-特异性)的作图。
如本文所用,“检测”或者“确定”生物标记值包括使用观察和记录对应于生物标记值的信号所需的设备以及产生该信号所需的材料。在一些实施方案中,生物标记值使用任何合适方法检测,包括荧光、化学发光、表面等离子共振、表面声波、质谱、红外线光谱、拉曼光谱、原子力显微术、扫描隧道显微术、电子化学检测方法、核磁共振、量子点等。
“固体支持物”在本文指具有分子可以直接或间接,通过共价键或非共价键附着的表面的任何支持物。“固体支持物”可以具有各种物理形式,可以包括例如膜;芯片(如蛋白芯片);玻片(如载玻片或盖玻片);柱;空心、固体、半固体、有孔或有腔的颗粒,例如珠;凝胶;纤维,包括光学纤维材料;基质;及样品容器。示例性样品容器包括样品孔、管、毛细管、小瓶及能够容纳样品的任何其他容器、沟槽或凹陷。样品容器可以包含于多样品平台上,如微量滴定板、玻片、微流体装置等。支持物可以由天然或合成材料、有机或无机材料组成。其上附着捕获剂的固体支持物的成分通常取决于附着方法(如共价附着)。其他示例性容器包括微滴和微流体控制的或大量的油/水性乳液,在其中可以进行测定和相关操作。合适的固体支持物包括例如塑料、树脂、多糖、硅石或基于硅石的材料、官能化玻璃、改性的硅、碳、金属、无机玻璃、膜、尼龙、天然纤维(例如丝、羊毛和棉)、聚合物等。包含固体支持物的材料可以包含反应基团,例如羧基、氨基或羟基以用于捕获剂的附着。聚合固体支持物可以包括如聚苯乙烯、聚对苯二甲酸乙二醇酯、聚乙酸乙烯酯、聚氯乙烯、聚乙烯吡咯烷酮、聚丙烯腈、聚甲基丙烯酸甲酯、聚四氟乙烯、丁基橡胶、苯乙烯丁二烯橡胶、天然橡胶、聚乙烯、聚丙烯、(聚)四氟乙烯、(聚)偏氟乙烯、聚碳酸酯和聚甲基戊烯。可以使用的合适固体支持物颗粒包括如编码的颗粒,如Luminex-型编码的颗粒、磁性颗粒以及玻璃颗粒。
生物标记的示例性用途
在一些示例性实施方案中,本发明提供了诊断个体的肺癌的方法,所述方法通过检测对应于个体循环如血清或血浆中存在的一个或多个生物标记的一个或多个生物标记值进行,并且通过任何数目的分析方法进行,包括本文所述任何分析方法。这些生物标记例如在肺癌个体中与在无肺癌个体中差异表达。生物标记在个体中的差异表达的检测可以用于例如早期诊断肺癌、区分良性与恶性肺小结(例如在计算机断层(CT)扫描上观察到的小结)、监测肺癌复发或者用于其他临床指征。
本文所述的任何生物标记可以用于肺癌的各种临床指征,包括如下任何方面:检测肺癌(如在高危个体或人群中);表征肺癌(如确定肺癌类型、亚型或阶段),如通过区分非小细胞肺癌(NSCLC)与小细胞肺癌(SCLC)和/或区分腺癌与鳞状细胞癌(或者促进组织病理学);确定肺小结是良性小结或恶性肺肿瘤;确定肺癌预后;监测肺癌进展或缓解;监测肺癌复发;监测转移;治疗选择;监测对治疗剂或其他治疗的应答;对个体的计算机断层扫描(CT)筛查进行分层(stratification)(如鉴定面临较高肺癌风险的那些个体,从而更可能得益于螺旋CT筛查,因此增加CT的阳性预测值);将生物标记测试与诸如吸烟史等的额外的生物医学信息组合,或者与小结大小、形态学等组合(如提供与单独的CT测试或生物标记测试相比具有增加的诊断性能的测定);促进诊断肺小结为恶性或良性;促进在CT上观察到肺癌小结就做出临床决定(例如,如果小结被视为低风险的,例如如果基于生物标记的测试是阴性的,有或无小结大小的归类,则要求重复CT扫描;或者,如果小结被视为中等至高风险的,例如如果基于生物标记的测试是阳性的,有或无小结大小的归类,则考虑进行活组织检查);以及促进决定临床后续处理(如在CT上观察到未钙化小结后是否实施重复CT扫描、细针活组织检查或胸廓切开术)。生物标记测试可以改善单独的CT筛查的阳性预测值(PPV)。除了联合CT筛查之外,本文所述的生物标记也可以与用于与肺癌的任何其他成像方式如胸部X-射线检查联合使用。此外,所述生物标记也可以用于在通过成像方式或其他临床相关性检测肺癌指征之前或者在症状出现之前允许这些应用的某一些。
本文所述的生物标记可以用于诊断肺癌的示例性方式是:未知患有肺癌的个体中一个或多个所述生物标记的差异表达可以表明该个体患有肺癌,从而使得可以在治疗最有效的疾病早期检测肺癌,也许在通过其他方式检测肺癌之前或者在症状出现之前检测肺癌。肺癌期间一个或多个生物标记的过表达可以指示肺癌的进展,如肺肿瘤生长和/或转移(因此表示不良预后);而一个或多个生物标记差异表达程度的降低(即在随后的生物标记测试中,个体中的表达水平趋向或接近“正常”表达水平)可以指示肺癌的缓解,如肺肿瘤缩小(因此提示良好或较好的预后)。相似地,在肺癌治疗期间一个或多个生物标记差异表达的程度增加(即在随后的生物标记测试中,个体中的表达水平进一步远离“正常”表达水平)可以指示肺癌的进展,并因此表示所述治疗是无效的;而在肺癌治疗期间一个或多个生物标记的差异表达降低可以指示肺癌的缓解,并因此表示该治疗是成功的。此外,在个体看起来已经治愈肺癌之后一个或多个生物标记的差异表达增加或降低可指示肺癌的复发。在这种情况下,例如可以在早期对个体重新启动治疗(或者如果个体维持治疗,则修改治疗方案以增加剂量和/或频率),否则直至晚期还未检测到肺癌的复发。此外,个体中一个或多个生物标记的差异表达水平可以预测个体对特定治疗剂的应答。在监测肺癌复发或进展中,生物标记表达水平的改变可以指示需要重复成像(如重复CT扫描),例如来确定肺癌活性或确定需要改变治疗方案。
本文所述的任何生物标记的检测可以在肺癌治疗后使用或者与肺癌治疗联合使用,如评价治疗的成功或者监测治疗后肺癌的缓解、复发和/或进展(包括转移)。肺癌治疗可以包括例如给予个体治疗剂、进行手术(如手术切除至少一部分肺肿瘤)、给予放疗或本领域所用的任何其他类型肺癌治疗方法以及这些治疗的任意组合。例如,任何生物标记可以在治疗后检测至少一次,或者在治疗后检测多次(如定期检测),或者可以在治疗之前和之后检测。个体中任何生物标记随时间的差异表达水平可以指示肺癌的进展、缓解或复发,其实例包括如下方面:生物标记的表达水平在治疗后与治疗前相比增加或降低;生物标记的表达水平在治疗后较晚时间点与治疗后较早时间点相比增加或降低;以及生物标记的表达水平在治疗后的一个时间点与该生物标记的正常水平相比不同。
作为具体的实例,本文所述的任何生物标记的生物标记水平可以在手术前和手术后(例如手术后2-4周)的血清样品中确定。手术后样品与手术前样品相比生物标记表达水平的增加可以指示肺癌的进展(如不成功的手术);而手术后样品与手术前样品相比生物标记表达水平的降低可以指示肺癌的消退(如成功除去肺肿瘤的手术)。生物标记水平的类似分析可以在其他形式治疗之前和之后进行,如在放疗或者给予治疗剂或癌症疫苗之前和之后进行。
除了作为独立运行的诊断测试的生物标记水平测试之外,生物标记水平也可以联合SNP或者指示疾病易感性风险增加的其他遗传病变或变异性的确定进行(见例如Amos et al.,Nature Genetics 40,616-622(2009))。
除了作为独立运行的诊断测试的生物标记水平测试之外,生物标记水平也可以联合CT筛查进行。例如,生物标记可以促进实施CT筛查的医学和经济理由,例如筛查面临肺癌风险的大量无临床症状群体(如吸烟者)。例如,生物标记水平的“CT前”测试可以用于分类CT筛查的高危个体,如基于个体生物标记水平来鉴定面临肺癌最高危险并且应当优先进行CT筛查的那些个体。如果实施CT测试,则可以测量一个或多个生物标记的生物标记水平(如通过血清或血浆样品的适配体测定确定),并且可以联合额外的生物医学信息来评价诊断评分(如通过CT测试确定肿瘤参数),以增强单独的CT或生物标记测试的阳性预测值(PPV)。确定生物标记水平的“CT后”适配体组可以用于确定通过CT(或其他成像方式)观察到的肺小结是恶性或良性的似然性。
本文所述的任何生物标记的检测可以用于CT后测试。例如,生物标记测试可以显著消除或降低单独CT的测试假阳性数目。此外,生物标记检测可以促进患者的治疗。例如,如果肺小结的大小小于5mm,则生物标记测试的结果可以使患者在更早的时间从“观察和等待”进展至活组织检查;如果肺小结为5-9mm,则生物标记测试可以排除对假阳性扫描使用活组织检查或胸廓切开术;以及如果肺小结大于10mm,则生物标记测试可以排除具有良性小结的这些患者亚群的手术。基于生物标记测试在一些患者中排除活组织检查的需求是有益的,因为存在与小结活组织检查相关的显著发病率以及难以根据小结的位置获得小结组织。相似地,在一些患者中排除手术的需要,如其小结实际上是良性的那些患者,会避免与手术相关的不必要风险和花费。
除了联合CT筛查测试生物标记水平之外(如联合在CT扫描上观察到的肺小结的大小或其他特征评价生物标记水平),关于生物标记的信息也可以联合其他类型数据进行评价,特别是指示个体患有肺癌风险的数据(如患者临床史、症状、癌症家族史、诸如个体是否是吸烟者的风险因素和/或其他生物标记的状况等)。这些不同数据可以通过自动化方法评价,如计算机程序/软件,其可以在计算机或其他设备/装置中实施。
任何所述的生物标记也可以用于成像测试中。例如,显像剂可以与任何所述生物标记偶联,这可以用于辅助肺癌诊断、监测疾病进展/缓解或转移、监测疾病复发或者监测对治疗的应答等。
生物标记和生物标记值的检测和确定
本文所述的生物标记的生物标记值可以使用任何已知的分析方法检测。在一实施方案中,生物标记值使用捕获试剂(capture agent)检测。如本文所用,“捕获剂(capture reagent)”或“捕获试剂”指能够特异性结合生物标记的分子。在一些实施方案中,捕获剂可以在溶液中暴露于生物标记,或者可以暴露于生物标记,同时该捕获剂固定在固体支持物上。在其他实施方案中,捕获剂含有与固体支持物上的第二特征反应的特征。在这些实施方案中,捕获剂可以在溶液中暴露于生物标记,然后该捕获剂上的特征可以联合固体支持物上的第二特征来将所述生物标记固定在固体支持物上。捕获剂基于进行的分析类型加以选择。捕获剂包括但不限于适配体、抗体、adnectin、锚蛋白、其他抗体模拟物(mimetic)及其他蛋白支架、自身抗体、嵌合物、小分子、F(ab′)2片段、单链抗体片段、Fv片段、单链Fv片段、核酸、凝集素、配体-结合受体、affybodies、纳米抗体(nanobodies)、印迹聚合物(imprinted polymer)、高亲合性多聚体(avimer)、肽模拟物(peptidomimetic)、激素受体、细胞因子受体及合成受体以及这些物质的修饰物和片段。
在一些实施方案中,生物标记值使用生物标记/捕获剂复合物来检测。
在其他实施方案中,生物标记值得自生物标记/捕获剂复合物,并且例如作为生物标记/捕获剂相互作用随后的反应结果间接检测,但是依赖于生物标记/捕获剂复合物的形成。
在一些实施方案中,生物标记值从生物学样品中的生物学标记直接检测。
在一实施方案中,生物标记使用多重形式检测,这允许在生物学样品中同时检测两个或更多个生物标记。在多重形式的一实施方案中,捕获剂直接或间接、共价或非共价地固定在固体支持物上分散的位置。在另一实施方案中,多重形式使用分离的固体支持物,其中每个固体支持物具有与该固体支持物相关的独特捕获剂,例如量子点。在另一实施方案中,单独的装置用于检测生物学样品中待检测的多个生物标记的每一个。可以配置单独的装置以允许同时处理生物学样品中的每个生物标记。例如,可以使用微量滴定板,由此该板中的每个孔用于独特地分析生物学样品中待检测的多个生物标记之一。
在一个或多个前述实施方案中,可以使用荧光标签(tag)来标记生物标记/捕获复合物的组分以允许检测生物标记值。在一些实施方案中,使用已知技术可以将荧光标记(fluorescent label)与对本文所述的任何生物标记特异性的捕获剂偶联,然后该荧光标记可以用于检测对应的生物标记值。合适的荧光标记包括稀土元素螯合物、荧光素及其衍生物、罗丹明及其衍生物、丹磺酰、别藻蓝蛋白、PBXL-3、Qdot 605、丽丝胺(Lissamine)、藻红蛋白、德克萨斯红及其他这样的化合物。
在一实施方案中,荧光标记是荧光染料分子。在一些实施方案中,荧光染料分子包含至少一个取代的吲哚环(indolium ring)体系,其中吲哚环的3-碳上的取代基含有化学反应性基团或偶联的物质。在一些实施方案中,染料分子包括AlexFluor分子,例如AlexaFluor 488、AlexaFluor 532、AlexaFluor 647、AlexaFluor 680或AlexaFluor 700。在其他实施方案中,染料分子包括第一类型和第二类型的染料分子,如两种不同的AlexaFluor分子。在其他实施方案中,染料分子包括第一类型和第二类型的染料分子,并且两种染料分子具有不同的发射光谱。
荧光可以用与大范围的测定形式相容的许多仪器测量。例如,已经设计了分光荧光计来分析微量滴定板、显微镜载玻片、印刷阵列(printed array)、小杯等。见Principles of Fluorescence Spectroscopy,by J.R.Lakowicz,Springer Science+Business Media,Inc.,2004。见Bioluminescence & Chemiluminescence:Progress & Current Applications;Philip E.Stanley and Larry J.Kricka editors,World Scientific Publishing Company,January 2002。
在一个或多个前述实施方案中,化学发光标签可以任选地用于标记生物标记/捕获复合物的组分以允许检测生物标记值。合适的化学发光材料包括任何草酰氯、Rodamin 6G、Ru(bipy)3 2+、TMAE(四三(二甲胺基)乙烯(tetrakis(dimethylamino)ethylene))、连苯三酚(1,2,3-三羟基苯(1,2,3-trihydroxibenzene))、光泽精、过氧草酸酯(peroxyoxalate)、芳基草酸酯、吖啶酯(Acridinium ester)、二氧杂环丁烷(dioxetane)等。
仍然在其他实施方案中,检测方法包括酶/底物组合,其产生对应于生物标记值的可检测信号。通常,酶催化生色底物的化学改变,这种改变可以使用多种技术测量,包括分光光度法、荧光及化学发光。合适的酶包括例如萤光素酶、萤光素、苹果酸脱氢酶、脲酶、辣根过氧化物酶(HRPO)、碱性磷酸酶、β-半乳糖苷酶、葡糖淀粉酶、溶菌酶、葡萄糖氧化酶、半乳糖氧化酶及葡萄糖-6-磷酸脱氢酶、尿酸氧化酶、黄嘌呤氧化酶、乳过氧化物酶、微过氧化物酶等。
仍然在其他实施方案中,检测方法可以是产生可测量信号的荧光、化学发光、放射性核素或酶/底物组合的组合。多种方式的信号在生物标记测定形式中可以具有独特且有利的特性。
更特别地,本文所述的生物标记的生物标记值可以使用已知的分析方法来检测,包括单重适配体测定、多重适配体测定、单重或多重免疫测定、mRNA表达谱、miRNA表达谱、质谱分析、组织学/细胞学方法等,这在下文中详细地描述。
使用基于适配体的测定确定生物标记值
检测和定量生物学样品及其他样品中生理学上有意义的分子的测定在科学研究和卫生保健领域是重要的工具。一类这样的测定包括使用包含固定在固体支持物上的一个或多个适配体的微阵列。所述适配体各自能够以高特异性方式和非常高的亲和力结合靶分子。见例如题为“核酸配体”的美国专利第5,475,096号,还见例如美国专利第6,242,246号、美国专利第6,458,543号和美国专利第6,503,715号,这些专利的题目均是“核酸配体诊断生物芯片”。一旦使微阵列与样品接触,则适配体结合所述样品中存在的它们各自的靶分子,从而允许确定对应于生物标记的生物标记值。
如本文所用,“适配体”指对靶分子具有特异性结合亲和力的核酸。技术人员应当了解到亲和力相互作用的问题关键程度;然而在本文中,适配体对其靶标的“特异性结合亲和力”指适配体通常以与其结合测试样品中其他组分的亲和力相比更高程度的亲和力结合其靶标。“适配体”是一种类型或物种的核酸分子的一系列拷贝,其具有特定的核苷酸序列。适配体可包含任何合适数目的核苷酸,包括任何数目的化学修饰的核苷酸。“适配体”指多于一个的这种系列的分子。不同的适配体可以具有相同或不同数目的核苷酸。适配体可以是DNA或RNA或化学修饰的核酸,并且可以是单链、双链的或者含有双链区,以及可以包含较高级别的结构。适配体也可以是光适配体(photoaptamer),其中该适配体中包含光反应性或化学反应性官能团以允许其与其对应靶标共价连接。本文公开的任何适配体方法可以包括使用特异性结合相同靶分子的两种或更多种适配体。如下文进一步描述,适配体可以包含标签。如果适配体包含标签,则该适配体的所有拷贝不需要具有相同的标签。此外,如果不同的适配体各自包含标签,则这些不同的适配体可以具有相同的标签或者不同的标签。
适配体可以使用任何已知方法鉴定,包括SELEX方法。一旦鉴定,则可以根据任何已知方法制备或合成适配体,这些已知方法包括化学合成方法和酶促合成方法。
术语“SELEX”和“SELEX方法”在本文可互换使用,通常指(1)与(2)的组合,其中(1)是选择以期望的方式与靶分子相互作用的适配体,例如以高亲和力结合蛋白,(2)是扩增那些选择的核酸。SELEX方法可用于鉴定对特定靶标或生物标记具有高亲和力的适配体。
SELEX通常包括制备核酸的候选混合物;使所述候选混合物与期望的靶分子结合以形成亲和力复合物;分离所述亲和力复合物与未结合的候选核酸;使核酸与所述亲和力复合物分开并分离所述核酸;纯化所述核酸;以及鉴定特异性适配体序列。所述方法可以包括多次循环以进一步精制所选适配体的亲和力。所述方法可以包括在该方法的一个或多个点处的扩增步骤。见例如题为“核酸配体”的美国专利第5,475,096号。SELEX方法可以用于产生与适配体的靶标共价结合的适配体,以及与适配体的靶标非共价结合的适配体。见例如题为“通过指数富集的核酸配体的系统进化:Chemi-SELEX”的美国专利第5,705,337号。
SELEX方法可以用于鉴定含有修饰的核苷酸的高亲和力适配体,所述修饰的核苷酸赋予该适配体改善的特性,例如改善的体内稳定性或改善的递送特性。此类修饰的实例包括核糖和/或磷酸和/或碱基位置的化学取代。通过SELEX方法鉴定的含有修饰的核苷酸的适配体描述于题为“含有修饰的核苷酸的高亲和力核酸配体”的美国专利第5,660,985号,其描述了含有在嘧啶的5′-和2′-位置处经化学修饰的核苷酸衍生物的寡核苷酸。见上文,美国专利第5,580,737号描述了高特异性适配体,其含有由2′-氨基(2′-NH2)、2′-氟(2′-F)和/或2′-O-甲基(2′-OMe)修饰的一个或多个核苷酸。还见题为“SELEX和PHOTOSELEX”的美国专利申请公开20090098549,其描述了具有扩展的物理和化学性质的核酸文库及其在SELEX和photoSELEX中的用途。
SELEX也可用于鉴定具有期望的解离速率(off-rate)特性的适配体。见题为“产生具有改善的解离速率的适配体的方法”的美国专利申请公开20090004667,其描述了产生可以结合靶分子的适配体的改进SELEX方法。描述了产生与各自的靶分子具有较慢解离速率的适配体和光适配体的方法。所述方法包括使候选混合物与靶分子接触;允许形成核酸-靶标复合物;以及进行缓慢解离速率富集过程,其中具有快解离速率的核酸-靶标复合物解离并不再形成,而具有慢解离速率的复合物会保持完整。此外,所述方法包括在产生候选核酸混合物中使用修饰的核苷酸,以产生具有改善的解离速率性能的适配体。
许多这样的测定使用包含光反应性官能团的适配体,这允许适配体与其靶分子共价结合或“光交联”。见例如题为“核酸配体诊断生物芯片”的美国专利第6,544,776号。这些光反应性适配体也称作光适配体。见例如美国专利第5,763,177号、美国专利第6,001,577号和美国专利第6,291,184号,所述专利的题目均是“通过指数富集的核酸配体的系统进化:核酸配体的光选择和溶液SELEX”;还见例如题为“核酸配体的光选择”的美国专利第6,458,539号。在使微阵列与样品接触并使光适配体具有结合其靶分子的机会之后,将该光适配体光激活并洗涤固体支持物以除去任何非特异性结合的分子。可以使用严格洗涤条件,因为结合光适配体的靶分子由于该光适配体上光激活的官能团所产生的共价键而通常未被除去。在这种方式中,测定允许检测对应于测试样品中生物标记的生物标记值。
在这两种测定形式中,适配体在与样品接触之前固定在固体支持物上。然而,在某些情况下,在与样品接触之前固定适配体也许无法提供最佳的测定。例如,预固定适配体可能导致适配体与靶分子在固体支持物表面上的无效混合,这可能导致漫长的反应时间及因此的延长的孵育时间以允许适配体与其靶分子有效结合。此外,当光适配体用于测定并且取决于用作固体支持物的材料时,该固体支持物可能趋于分散或吸收用于实现光适配体与其靶分子之间的共价键形成的光。此外,取决于所用的方法,结合适配体的靶分子的检测可能不准确,因为固体支持物的表面也可能暴露于且受所用的任何标记剂的影响。最后,适配体固定在固体支持物上通常包括在适配体暴露于样品之前的适配体制备步骤(即固定),这个制备步骤可能影响适配体的活性或功能性。
还描述了适配体测定,其允许适配体在溶液中捕获其靶标,然后在检测之前使用设计为除去适配体-靶标混合物中特定组分的分离步骤(见题为“测试样品的多重分析”的美国专利申请公开20090042206)。所述适配体测定方法允许检测和定量测试样品中的非核酸靶标(如蛋白靶标),这通过检测和定量核酸(即适配体)进行。所述方法产生核酸替代物(surrogate)(即适配体)以检测和定量非核酸靶标,由此允许包括扩增在内的许多核酸技术用于包括蛋白靶标在内的更大范围的期望靶标。
可以构建适配体以促进从适配体生物标记复合物(或光适配体生物标记共价复合物)分离测定组分,以及允许分离适配体以进行检测和/或定量。在一实施方案中,这些构建体可以包含适配体序列中可裂解或可释放的元件。在其他实施方案中,可以在适配体中引入额外的官能性,例如标记的或可检测的组分、间隔组分或者特异性结合标签或固定元件。例如,适配体可以包含通过可裂解部分与适配体连接的标签、标记、分隔标记与可裂解部分的间隔组分。在一实施方案中,可裂解元件是光可裂解接头(linker)。光可裂解接头可以连接至生物素部分和间隔区段,可以包含NHS基团以用于胺的衍生化,以及可以用于在适配体中引入生物素基团,从而允许适配体在测定方法中较晚地释放。
用溶液中所有测定组分进行的均质测定在检测信号之前不需要分离样品与试剂。这些方法是快速且易于使用的。这些方法基于分子捕获或与特异性靶标反应的结合试剂产生信号。对于肺癌,分子捕获剂是适配体或抗体等,特异性靶标是表1第2列的肺癌生物标记。
在一实施方案中,一种信号产生方法利用由于荧光团标记的捕获剂与其特异性生物标记靶标的相互作用而导致的各向异性信号改变。当标记的捕获剂与其靶标反应时,增加的分子量导致附着于该复合物的荧光团的旋转运动变得更慢,从而改变各向异性值。通过监测各向异性改变,结合事件可以用于定量测量溶液中的生物标记。其他方法包括荧光偏振测定、分子信标方法、时间分辨荧光猝灭法、化学发光、荧光共振能量转移等。
可以用于检测对应于生物学样品中生物标记的生物标记值的基于溶液的示例性适配体测定包括如下步骤:(a)通过使所述生物学样品与适配体接触来制备混合物,所述适配体包含第一标签并具有对所述生物标记的特异性亲和力,其中当所述样品中存在所述生物标记时形成适配体亲和力复合物;(b)使所述混合物暴露于包含第一捕获元件的第一固体支持物,并且允许所述第一标签与所述第一捕获元件结合;(c)除去未与所述第一固体支持物结合的混合物的任何组分;(d)使第二标签附着于所述适配体亲和力复合物的生物标记组分;(e)从所述第一固体支持物释放所述适配体亲和力复合物;(f)使释放的适配体亲和力复合物暴露于包含第二捕获元件的第二固体支持物,并且允许所述第二标签与所述第二捕获元件结合;(g)通过分离未复合的适配体与所述适配体亲和力复合物从所述混合物除去任何未复合的适配体;(h)从固体支持物洗脱适配体;以及(i)通过检测所述适配体亲和力复合物的适配体组分来检测所述生物标记。
使用免疫测定确定生物标记值
免疫测定方法基于抗体与其对应靶标或分析物的反应,并且根据特定测定形式可以检测样品中的分析物。为了改进基于免疫反应性的测定方法的特异性和灵敏性,通常由于单克隆抗体的特异性表位识别而使用单克隆抗体。多克隆抗体由于其与单克隆抗体相比增加的靶标亲和力而成功地用于各种免疫测定中。免疫测定已经设计为用于大范围生物学样品基质。免疫测定形式已经设计为提供定性、半定量及定量结果。
定量结果通过使用已知浓度的待检测的特定分析物产生的标准曲线来产生。将来自未知样品的应答或信号在标准曲线上作图,并确定该未知样品中对应于靶标的量或值。
已经设计了许多免疫测定形式。ELISA或EIA可以定量检测分析物。这种方法依赖于标记对分析物或抗体的附着,标记组分直接或者间接包括酶。ELISA测试可以设计为直接、间接、竞争性或者夹心检测分析物。其他方法依赖于标记,如放射性同位素(I125)或荧光。其他技术包括例如凝集反应、浊度测定法、比浊法、蛋白印迹、免疫沉淀、免疫细胞化学、免疫组织化学、流式细胞术、Luminex测定等(见ImmunoAssay:A Practical Guide,edited by Brian Law,published by Taylor & Francis,Ltd.,2005edition)。
示例性测定形式包括酶联免疫吸附测定(ELISA)、放射性免疫测定、荧光、化学发光以及荧光共振能量转移(FRET)或时间分辨的-FRET(TR-FRET)免疫测定。检测生物标记的方法的实例包括生物标记免疫沉淀及随后允许辨别大小和肽水平的定量方法,如凝胶电泳、毛细管电泳、平面电色谱等。
检测和/或定量可检测标记或信号产生材料的方法取决于所述标记的性质。由合适的酶催化的反应产物(其中所述可检测标记是酶,见上文)可以是但不限于荧光、发光或放射性的,或者它们可以吸收可见光或紫外光。适合于检测这样的可检测标记的检测仪的实例包括但不限于X光照片、放射性计数器、闪烁计数器、分光光度计、比色计、荧光计、发光计和光密度计。
可以通过允许适当准备、处理和分析反应的任何方式来进行任何检测方法。这可以例如在多孔测定板(如96孔或者386孔平板)中进行,或者使用任何合适的阵列或者微阵列进行。可以人工或自动化制备各种试剂的储液,使用能够检测可检测标记的可商购的分析软件、机器人技术和检测仪器自动化进行所有随后的移液、稀释、混合、分配、洗涤、孵育、样品读取、数据收集和分析。
使用基因表达谱确定生物标记值
测量生物学样品中的mRNA可以用作检测该生物学样品中对应的蛋白水平的替代。因此,本文所述的任何生物标记或生物标记的组还可以通过检测适当的RNA来检测。
mRNA表达水平通过逆转录定量聚合酶链式反应(RT-PCR及随后的qPCR)测量。RT-PCR用于从mRNA产生cDNA。cDNA可用于qPCR测定以随DNA扩增过程的进展而产生荧光。通过与标准曲线比较,qPCR可以产生绝对测量度,如每细胞的mRNA拷贝数。RNA印迹、微阵列、Invader测定以及与毛细管电泳组合的RT-PCR已经用于测量样品中mRNA的表达水平。见Gene Expression Profiling:Methods and Protocols,Richard A.Shimkets,editor,Humana Press,2004。
miRNA分子是小RNA,其不编码但是可以调节基因表达。适合于测量mRNA表达水平的任何方法均可以用于对应的miRNA。最近,许多实验室已经研究了miRNA作为疾病的生物标记的用途。许多疾病涉及广泛的转录调节,并且毫不意外地发现miRNA可以作为生物标记。miRNA浓度与疾病之间的关联通常不如蛋白水平与疾病之间的关联明确,但是miRNA生物标记值可能是重要的。当然,随着疾病期间任何RNA的不同表达,开发体外诊断产品所面临的问题包括需要miRNA在患病细胞中存活及易于提取以进行分析,或者miRNA被释放进入血液或其他基质中,在此它们必须存活足够长的时间以进行测量。蛋白生物标记具有类似的要求,尽管许多潜在的蛋白生物标记以旁分泌方式在疾病期间于病变和功能部位有意地分泌。许多潜在的蛋白生物标记设计为在合成那些蛋白的细胞外起作用。
使用体内分子成像技术检测分子标记
任何所述的生物标记(见表1第2列)也可以用于分子成像测试。例如,显像剂可以与任何所述生物标记偶联,这可以用于辅助肺癌诊断、监测疾病进展/缓解或转移、监测疾病复发或者监测对治疗的应答等。
体内成像技术提供了用于确定个体体内特定疾病状况的非侵入性方法。例如,身体的所有部分或者甚至整个身体均可以作为三维图像观察,从而提供关于身体内形态学和结构的有价值的信息。这样的技术可以与检测本文所述的生物标记组合以提供关于个体的癌症状态,特别是肺癌状态的信息。
体内分子成像技术的应用由于该技术的各种进展而得以扩展。这些进展包括新造影剂或标记的开发,如放射性标记和/或荧光标记,其可以在身体内提供强信号;以及开发更强的新成像技术,其可以从身体外部检测和分析这些信号,并且具有足够的灵敏性和精确度以提供有用的信息。造影剂可以在适当的成像系统中观察,从而提供所述造影剂所处位置的身体部分或多个部分的图像。造影剂可以与捕获剂结合或缔合,例如适配体或抗体,例如和/或结合或缔合肽或蛋白,或寡核苷酸(例如为了检测基因表达),或者复合物,所述复合物含有任何这些物质和一种或多种大分子和/或其他颗粒形式。
造影剂也是可以用于成像的放射性原子的特征。对于闪烁照相研究合适的放射性原子包括锝-99m或碘-123。其他易于检测的部分包括例如磁共振成像(MRI)的自旋标记物,如碘-123、碘-131、铟-111、氟-19、碳-13、氮-15、氧-17、钆、锰或铁。这样的标记为本领域熟知,并且可以由本领域技术人员容易地选择。
标准成像技术包括但不限于磁共振成像、计算机断层扫描、正电子发射断层扫描(PET)、单光子发射计算机断层扫描(SPECT)等。对于诊断性体内成像,可用的检测设备的类型是选择指定造影剂的主要因素,如用于靶标(蛋白、mRNA等)的指定放射性核素和特定生物标记。所选的放射性核素通常具有通过指定类型设备可检测的衰变类型。此外,当选择用于体内诊断的放射性核素时,其半衰期应当足够长以允许在靶组织最大吸收时进行检测,但是也应当足够短,以减小宿主所受到的有害辐射。
示例性成像技术包括但不限于PET和SPECT,这是将放射性核素全身(synthetically)或局部地给予个体的成像技术。随后,随时间测量放射性示踪剂的吸收,并用于获得关于靶向的组织与生物标记的信息。由于所用的特定同位素的高能(γ-射线)发射以及用于检测它们的设备的灵敏性和完善(sophistication),可以从身体外部推导出放射性的二维分布。
PET中常用的正电子发射核素包括例如碳-11、氮-13、氧-15和氟-18。通过电子捕获和/或γ-发射衰变的同位素用于SPECT中,并且包括例如碘-123和锝-99m。用锝-99m标记氨基酸的示例性方法是在螯合前体的存在下还原高锝酸盐离子以形成不稳定的锝-99m-前体配合物,其又与双官能修饰的趋化肽的金属结合基团反应,形成锝-99m-趋化肽偶联物。
抗体常用于这样的体内成像诊断方法。用于体内诊断的抗体的制备和用途为本领域熟知。特异性结合表1第2列的任何生物标记的标记的抗体可以注入疑似患有某种类型癌症(如肺癌)的个体,并根据所用的特定生物标记的可检测性来诊断或评价所述个体的疾病状况。如上文所述,使用的标记根据所用的成像形式选择。标记的定位允许确定癌症的扩散。器官或组织内标记的量也允许确定该器官或组织中癌症的存在与否。
相似地,适配体可以用于这样的体内成像诊断方法。例如,用于鉴定表1第2列所述的特定生物标记的适配体(并且因此特异性结合该特定生物标记)可以适当地进行标记并注入疑似患有肺癌的个体,并根据该特定生物标记的可检测性来诊断或评价所述个体的肺癌状态。如上文所述,使用的标记根据所用的成像形式选择。标记的定位允许确定癌症的扩散。器官或组织内标记的量也允许确定该器官或组织中癌症的存在与否。适配体定向的显像剂与其他显像剂相比可以具有关于组织渗透、组织分布、动力学、消除、效力和选择性方面独特且有利的特性。
这样的技术也可以任选地用标记的寡核苷酸进行,例如通过用反义寡核苷酸成像检测基因表达。这些方法用于原位杂交,例如用荧光分子或放射性核素作为标记。检测基因表达的其他方法包括例如检测报道基因的活性。
另一种常见类型的成像技术是光学成像,其中对象体内的荧光信号通过所述对象体外的光学设备检测。这些信号可以是由于实际的荧光和/或生物发光。光学检测设备灵敏性的改进增加了光学成像在体内诊断测定中的应用。
体内分子生物标记的用途日益增加,包括临床试验,例如在新癌症疗法临床试验中更快速地测量临床效力,和/或避免对诸如多发性硬化的那些疾病的长期安慰剂治疗,其中这样的长期治疗可能被认为是存在伦理问题。
关于其他技术,见N.Blow,Nature Methods,6,465-469,2009。
使用组织学/细胞学方法确定生物标记值
对于肺癌的评价,许多组织样品可用于组织学或细胞学方法。样品选择取决于原发肿瘤位置和转移的部位。例如,支气管内和经支气管活组织检查、细针抽吸、切割针及核心活组织检查可以用于组织学。支气管洗涤(washing)和刷检(brushing)、胸膜抽吸和痰可用于细胞学。虽然细胞学分析仍用于诊断肺癌,但是已知组织学方法提供癌症检测更好的灵敏性。本文鉴定的在肺癌个体中表现出上调的任何生物标记(见表37)可以用于染色组织学样本作为疾病的指征。
在一实施方案中,对于对应的一种或多种生物标记是特异性的一种或多种捕获剂用于肺细胞样品的细胞学评价,并且可以包括如下一个或多个方面:收集细胞样品、固定细胞样品、脱水、透明(clearing)、将细胞样品固定在显微镜载玻片上、使细胞样品透化、分析物检索处理、染色、脱色、洗涤、封闭以及在缓冲溶液中与一种或多种捕获剂反应。在另一实施方案中,细胞样品从细胞块(cell block)中产生。
在另一实施方案中,对于对应生物标记是特异性的一种或多种捕获剂用于肺组织样品的组织学评价中,并且可以包括如下一个或多个方面:收集组织样本、固定组织样品、脱水、透明、将组织样品固定在显微镜载玻片上、使组织样品透化、分析物检索处理、染色、脱色、洗涤、封闭、再水合以及在缓冲溶液中与一种或多种捕获剂反应。在另一实施方案中,固定和脱水用冷冻代替。
在另一实施方案中,对于对应的一种或多种生物标记是特异性的一种或多种适配体与组织学或细胞学样品反应,并且可以作为核酸扩增方法中的核酸靶标。合适的核酸扩增方法包括例如PCR、q-β复制酶、滚环扩增、链置换、解旋酶依赖性扩增、环介导的等温扩增、连接酶链式反应以及限制和环化辅助的滚环扩增。
在一实施方案中,将对于用于组织学或细胞学评价的对应生物标记是特异性的一种或多种捕获剂在缓冲溶液中混合,所述缓冲溶液可以包含任何如下成分:封闭材料、竞争剂、去污剂、稳定剂、载体核酸、聚阴离子材料等。
“细胞学方案”通常包括样品收集、样品固定(fixation)、样品固定(immobilization)和染色。“细胞制备”可以包括样品收集后的一些处理步骤,包括使用一种或多种慢解离速率的适配体来染色制备的细胞。
样品收集可以包括直接将样品置于未处理的转运容器中,将样品置于含有一些类型介质的转运容器中,或者将样品直接置于玻片上(固定)而不进行任何处理或固定。
样品固定可以通过将一部分收集的样本涂在用聚赖氨酸、明胶或硅烷处理的载玻片上而改进。玻片可以通过在玻片上涂有薄且均匀的细胞层而制备。通常采取小心操作以使减少机械扭转和干燥假象。液体样本可以通过细胞块方法处理。或者,液体样本可以与固定溶液在室温下1∶1混合大约10分钟。
细胞块可以从剩余的积液、痰、尿液沉淀、胃肠液、细胞刮取物或细针抽吸物中制备。通过离心或膜过滤浓缩或压实细胞。已经揭示了许多细胞块制备方法。代表性方法包括固定的沉淀、细菌琼脂或膜过滤方法。在固定的沉淀方法中,将细胞沉淀与诸如鲍音液(Bouins)、苦味酸或缓冲的福尔马林的固定剂混合,然后将混合物离心以沉淀固定的细胞。除去上清,尽可能完全地干燥细胞团块(pellet)。收集细胞团块并包在镜头纸中,然后置于组织盒(tissue cassette)中。将组织盒置于含其他固定剂的罐子中,作为组织样品进行处理。琼脂方法与上述方法非常相似,只是取出细胞团块并在纸巾上干燥,然后切成两半。将切面置于载玻片上一滴熔化的琼脂中,然后将该细胞团块用琼脂包被,保证琼脂中无气泡形成。使琼脂变硬,然后除去任何过多的琼脂。将其置于组织盒中,完成组织处理。或者,可以将细胞团块直接悬浮于在65℃的2%液体琼脂中并离心样品。使琼脂细胞团块在4℃下固化1小时。可以从离心管中取出固体琼脂并切成两半。将琼脂包在滤纸中,然后置于组织盒中。从这点开始的处理与上述方法相同。在任何这些方法中可以用膜过滤低代替离心。任何这些方法均可用于产生“细胞块样品”。
细胞块可以使用专门的树脂制备,包括Lowicryl树脂、LR White、LR Gold、Unicryl和MonoStep。这些树脂具有低粘度,并且可以在低温下及用紫外(UV)光聚合。包埋方法依赖于在脱水期间逐渐冷却样品,将样品转移至树脂以及于最终低温下在合适UV波长处聚合细胞块。
细胞块切片可以用苏木精-伊红(HE)染色以进行细胞形态学检查,而其他切片用于特异性标记检查。
无论方法是细胞学方法或组织学方法,可以在进一步处理之前将样品固定以防止样品降解。这种方法称作“固定”,并且描述了可以互换使用的许多材料和方法。基于待检测的靶标和待分析的特定细胞/组织类型,根据经验最佳地选择样品固定方案和试剂。样品固定依赖于试剂,如乙醇、聚乙二醇、甲醇、福尔马林或异丙醇。样品应当尽可能在收集及附着在玻片上后很快固定。然而,选择的固定剂可以在各种分子靶标中引入结构改变,这使得随后更难以检测。固定(fixation)和固定(immobilization)方法及其顺序可以改变细胞的外观,并且这些改变必须是由细胞学技术人员预期及认可的。固定剂可以导致某些类型细胞收缩,并且导致细胞质出现颗粒或网状物。许多固定剂通过使细胞组分交联而起作用。这可以破坏或改变特异性表位,产生新表位,导致分子缔合以及降低膜通透性。福尔马林固定是一种最常用的细胞学/组织学方法。福尔马林在相邻蛋白之间或在蛋白内形成甲基桥。沉淀或凝固也用于固定,乙醇常用于这种类型的固定。交联与沉淀的组合也可以用于固定。牢固的固定方法在保留形态学信息方面是最佳的,而较弱的固定方法对于保留分子靶标方面是最佳的。
代表性的固定剂是50%无水乙醇、2mM聚乙二醇(PEG)、1.85%甲醛。这种制剂的变化包括乙醇(50%-95%)、甲醇(20%-50%)以及仅福尔马林(甲醛)。另一种常用的固定剂是2%PEG 1500、50%乙醇以及3%甲醇。将玻片在室温下置于固定剂中约10-15分钟,然后取出并干燥。一旦玻片被固定,可以用诸如PBS的缓冲溶液对其进行漂洗。
许多染料可以用于差异地突出和反差或“染色”细胞、亚细胞和组织特征或形态学结构。苏木精(hematoylin)用于使细胞核染色为蓝色或黑色。橘黄G-6和天青伊红(Eosin Azure)均使细胞质染色。橘黄G使含有角蛋白和糖原的细胞染成黄色。伊红Y用于使核仁、纤毛、红细胞和表面上皮扁平细胞染色。罗曼诺夫斯基(Romanowsky)染色用于空气干燥的玻片,并且可以用于增强复型及区分细胞外与细胞质内材料。
染色方法可以包括增加细胞对于染色通透性的处理。用去污剂处理细胞可以用于增加通透性。为了增加细胞和组织的通透性,可以将固定的样品用溶剂、皂苷类或者非离子去污剂进一步处理。酶促消化也可以改进组织样品中特异性靶标的可接近性。
染色后,使用渐增的醇浓度进行连续醇漂洗将样品脱水。最终的洗涤使用二甲苯或诸如柑桔萜的二甲苯取代物,其具有接近在载玻片上应用的盖玻片的折射率。这个最后的步骤称作透明。一旦使样品脱水及透明,应用封固剂。所选的封固剂具有接近玻璃的折射率,并且能够使盖玻片与载玻片粘合。其还抑制细胞样品另外的干燥、收缩或褪色。
无论使用的染色或处理,对肺细胞学样本进行的最后评价通过一些类型显微镜检查进行以允许通过肉眼观察形态学并确定标记的存在与否。示例性显微镜检查方法包括明视野显微镜、相收缩显微镜、荧光显微镜和微分干涉相差显微镜方法。
如果在检查后需要对样品进行次级测试,则可以除去盖玻片并对载玻片进行脱色。脱色包括使用用于染色该载玻片的最初未加入染料的原始溶剂系统,并以与原始染色程序相反顺序进行。脱色也可以通过将该载玻片浸泡在酸醇中直至细胞无色。一旦无色,则将载玻片用水充分漂洗并进行第二染色程序。
此外,通过使用特异性分子试剂,如抗体或者核酸探针或适配体,可以将特异性分子区分与细胞形态学分析组合。这改进了诊断细胞学的精确性。显微切割可用于分离细胞的子集以进行另外的评价,特别是用于遗传学评价异常染色体、基因表达或突变。
制备用于组织学评价的组织样品包括固定、脱水、浸润(infiltration)、包埋和切片。用于组织学的固定试剂与用于细胞学的固定试剂非常相似或相同,并且在以诸如个体蛋白的分子为代价的情况中具有相同的保持形态学特征的问题。如果组织样品不进行固定和脱水而是代之以冷冻然后在冷冻时切片可以节省时间。这是更温和的处理程序,并且可以保留更多的个体标记。然而,冷冻对于组织样品的长期保存不可接受,因为由于冰晶体的引入引起亚细胞信息丧失。冷冻组织样品中的冰也妨碍切片过程产生极薄的切片,并且因此可以丧失一些显微镜分辨力和亚细胞结构的图像。除了福尔马林固定之外,四氧化锇也用于固定和染色磷脂(膜)。
组织的脱水是通过用渐增浓度的醇连续洗涤而实现。透明使用的材料可以与醇和包埋材料混溶,并且包括从50∶50醇∶澄清剂开始至100%澄清剂(二甲苯或二甲苯取代物)的逐步处理过程。浸润包括将组织与液体形式的包埋剂(温热的蜡,硝化纤维溶液)一起孵育,首先是50∶50包埋剂∶澄清剂,随后是100%包埋剂。包埋通过将组织置于模具或盒中并充填熔化的包埋剂如蜡、琼脂或明胶而完成。使包埋剂硬化。然后将硬化的组织样品切成薄切片以用于染色和随后的检查。
在染色之前,将组织切片脱蜡并再水合。用二甲苯使切片脱蜡,可以更换一次或多次二甲苯,并通过在递减浓度的醇中连续洗涤而再水合。在脱蜡之前,可以将组织切片于约80℃下在载玻片上热固定约20分钟。
激光捕获显微切割允许从组织切片分离细胞的子集以进行进一步分析。
在细胞学中,为了增强显微特征的观察,可以将组织切片或薄片用各种染色方法染色。许多可商购的染色方法可以用于增强或鉴定特定的特征。
为了进一步增加分子试剂与细胞学/组织学样品的相互作用,已经开发了许多“分析物检索(analyte retrieval)”技术。第一种这样的技术使用高温加热固定的样品。这种方法也称作热诱导的表位检索或HIER。已经使用了许多加热技术,包括蒸汽加热、微波、高压蒸汽、水浴以及加压蒸煮或这些加热方法的组合。分析物检索溶液包括例如水、柠檬酸盐和普通盐水缓冲液。分析物检索的关键是高温的时间,但是较低温度进行较长时间也已经成功使用。分析物检索的另一关键是加热溶液的pH。发现低pH提供最佳的免疫染色,但是也产生经常需要使用第二组织切片作为阴性对照的背景。无论缓冲液组成,使用高pH溶液通常获得最一致的益处(增加免疫染色而不增加背景)。对特异性靶标的分析物检索方法根据经验对使用加热的靶标、时间、pH和缓冲液组成的变量加以优化。使用微波分析物检索方法允许用抗体试剂顺序染色不同的靶标。但是在染色步骤之间获得抗体与酶复合物需要的时间也证实使细胞膜分析物降解。微波加热方法也改进原位杂交方法。
为了开始分析物检索过程,首先将切片脱蜡并水合。然后将玻片置于平皿或罐子中的10mM柠檬酸钠缓冲液pH 6.0中。代表性的程序使用1100W微波,以100%功率对玻片微波处理2分钟,随后在确保玻片保留覆盖于液体中之后使用20%功率对玻片微波处理18分钟。然后使玻片在敞口容器中冷却,随后用蒸馏水漂洗。HIER可以与酶促消化组合使用以改进靶标对免疫化学试剂的反应性。
一种这样的酶促消化方案使用蛋白酶K。20μg/ml浓度的蛋白酶K在50mM Tris碱、1mM EDTA、0.5%Triton X-100、pH 8.0缓冲液中制备。该方法首先包括将切片在更换2次的二甲苯中脱蜡,每次5分钟。然后将样品在更换2次的100%乙醇中水合,每次3分钟,在95%和80%乙醇中水合,每次1分钟,然后在蒸馏水中漂洗。将切片用蛋白酶K工作溶液覆盖,于37℃下在加湿室中孵育10-20分钟(最佳孵育时间可以根据组织类型和固定程度而变化)。将切片在室温下冷却10分钟,然后在PBS吐温(Tween)20中漂洗2次2分钟。如果需要,可以将切片封闭以消除来自内源化合物和酶的潜在干扰。然后将切片用在一抗稀释缓冲液中适当稀释的一抗在室温下孵育1小时或者在4℃下孵育过夜。然后将该切片用PBS吐温20漂洗2次2分钟。如果需要特定的应用,可以进行另外的封闭,随后用PBS吐温20再漂洗3次2分钟,然后最后完成免疫染色方案。
在室温下用1%SDS简单处理也已经证实改进了免疫组织化学染色。分析物检索方法已经应用于玻片固定切片(slide mounted section)以及自由浮动切片(free floating section)。另一处理选择是将玻片置于pH 6.0的含有柠檬酸和0.1诺纳德(Nonident)P40的罐子中,并加热至95℃。然后将该玻片用诸如PBS的缓冲溶液洗涤。
对于组织的免疫学染色,可以通过将切片浸入诸如血清或脱脂奶粉的蛋白溶液中来封闭抗体与组织蛋白的非特异性结合。
封闭反应可包括需要降低内源生物素的水平;消除内源电荷作用;失活内源核酸酶;和/或失活内源酶如过氧化物酶和碱性磷酸酶。内源核酸酶可以通过以下方式失活:用蛋白酶K降解;热处理;使用螯合剂,如EDTA或EGTA;引入载体DNA或RNA;用离液剂处理,如尿素、硫脲、盐酸胍、硫氰酸胍、高氯酸锂等或焦碳酸二乙酯。碱性磷酸酶可以通过用0.1NHCl在室温下处理5分钟或用1mM左旋咪唑处理而失活。过氧化物酶活性可以通过用0.03%过氧化氢处理而消除。内源生物素可以通过将玻片或切片在室温下浸入抗生物素蛋白(链霉抗生物素蛋白,可以取代中性链亲和素(neutravidin))溶液中至少15分钟而封闭。然后将玻片或切片在缓冲液中洗涤至少10分钟。这个步骤可以重复至少3次。然后将玻片或切片浸入生物素溶液中10分钟。这个步骤可以重复至少3次,每次使用新鲜的生物素溶液。重复缓冲液洗涤程序。应当减少封闭方案以防止破坏所关注的细胞或组织结构或者靶标或多个靶标,但是可以组合一种或多种这样的方案以“封闭”玻片或切片,然后与一种或多种慢解离速率适配体反应。见Basic Medical Histology:the Biology of Cells,Tissues and Organs,authored by Richard G.Kessel,Oxford University Press,1998。
使用质谱方法确定生物标记值
许多质谱仪的配制(configuration)可以用于检测生物标记值。一些类型的质谱仪可以获得或可以用各种配制生产。通常,质谱仪具有如下主要部件:样品入口、离子源、质量分析仪、检测仪、真空系统以及设备控制系统和数据系统。样品入口、离子源和质量分析仪的不同通常限定设备的类型及其能力。例如,入口可以是毛细管柱液体层析源,或者可以是直接探针或镜台(stage)如用于基质辅助激光解吸电离中。常用的离子源是例如电喷射,包括纳米喷射(nanospray)和微喷射(microspray);或者基质辅助激光解吸电离。常用的质量分析仪包括四极滤质器(quadrupole mass filter)、离子阱质量分析仪和飞行时间质量分析仪。其他质谱方法为本领域熟知(见Burlingame et al.Anal.Chem.70:647R-716R(1998);Kinter and Sherman,New York(2000))。
蛋白生物标记和生物标记值可以通过任何如下方式检测和测量:电喷射离子化质谱(ESI-MS)、ESI-MS/MS、ESI-MS/(MS)n、基质辅助激光解吸离子化飞行时间质谱(MALDI-TOF-MS)、表面增强激光解吸/离子化飞行时间质谱分析(SELDI-TOF-MS)、硅表面解吸/离子化(DIOS)、二次离子质谱(SIMS)、四极飞行时间(Q-TOF)、称作ultraflex III TOF/TOF的串联式飞行时间(TOF/TOF)技术、大气压化学离子化质谱(APCI-MS)、APCI-MS/MS、APCI-(MS)N、大气压光电离质谱(APPI-MS)、APPI-MS/MS和APPI-(MS)N、四极质谱、傅里叶变换质谱(FTMS)、定量质谱以及离子阱质谱。
样品制备策略用于在对蛋白生物标记进行质谱表征及确定生物标记值之前标记和富集样品。标记方法包括但不限于用于相对和绝对定量的等量异位标签(iTRAQ)和在细胞培养中用氨基酸稳定同位素标记(SILAC)。在质谱分析之前用于选择性富集候选生物标记蛋白样品的捕获剂包括但不限于适配体、抗体、核酸探针、嵌合物、小分子、F(ab′)2片段、单链抗体片段、Fv片段、单链Fv片段、核酸、凝集素、配体-结合受体、affybodies、纳米抗体、锚蛋白、结构域抗体、可变抗体支架(例如双抗体等)印刷的聚合物、高亲合性多聚体、肽模拟物、拟肽、肽核酸、苏糖核酸、激素受体、细胞因子受体及合成的受体以及这些物质的修饰和片段。
前述测定允许检测可用于诊断肺癌的方法中的生物标记值,其中所述方法包括在来自个体的生物学样品中检测至少N个生物标记值,所述至少N个生物标记值每个对应于选自表1第2列提供的生物标记的生物标记,其中如下文所述,利用生物标记值的分类指示所述个体是否患有肺癌。虽然某些所述肺癌生物标记可以单独用于检测和诊断肺癌,但是本文所述的方法用于分组肺癌生物标记的多个子集,其各自用作三个或更多个生物标记的组。因此,本申请的各种实施方案提供了包含N个生物标记的组合,其中N是至少三个生物标记。在其他实施方案中,N选自2-61个生物标记中的任意数。应当理解N可以选自任何上述范围以及相似但更高级范围中的任意数。根据本文所述任何方法,可以单独检测和分类生物标记值,或者可以共同检测和分类生物标记值,例如以多重测定形式。
在另一方面,本发明提供了检测肺癌不存在的方法,所述方法包括在来自个体的生物学样品中检测至少N个生物标记值,所述至少N个生物标记值每个对应于选自表1第2列提供的生物标记的生物标记,其中如下文所述,生物标记值的分类指示所述个体中不存在肺癌。虽然某些所述肺癌生物标记可以单独用于检测和诊断不存在肺癌,但是本文所述的方法用于分组肺癌生物标记的多个子集,其各自用作三个或更多个生物标记的组。因此,本申请的各种实施方案提供了包含N个生物标记的组合,其中N是至少三个生物标记。在其他实施方案中,N选自2-61个生物标记中的任意数。应当理解N可以选自任何上述范围以及相似但更高级范围中的任意数。根据本文所述任何方法,可以单独检测和分类生物标记值,或者可以共同检测和分类生物标记值,例如以多重测定形式。
生物标记分类及疾病评分计算
对于给定诊断测试的生物标记“特征”含有标记的集合,每个标记在所关注群体中具有不同水平。在此方面,不同水平可以指针对两个或更多个组中个体的标记水平的不同平均值(mean),或者两个或更多个组中的不同的方差,或者这两者的组合。对于最简单形式的诊断测试,这些标记可以用于将来自个体的未知样品分配到两组中的一组中,疾病组或非疾病组。将样品分配于两个或更多个组中的一组称为分类,用于实现这种分配的程序称为分类器或分类方法。分类方法也可以称为评分方法。有许多分类方法可以用于从生物标记值的集合构建诊断分类器。通常,分类方法最容易用监督学习技术进行,其中用获得自希望区分的两个(或更多个,对于多个分类状态)不同组内的个体的样品收集数据集合。因为每个样品所属类别(组或群体)事先对于每个样品均是已知的,所以可以训练分类方法以获得期望的分类应答。还可以使用无监督学习技术来产生诊断分类器。
开发诊断分类器的常用方法包括决策树;bagging+boosting+forests;基于规则推论的学习(rule inference based learning);Parzen窗方法(Parzen Windows);线性模型;逻辑;神经网络方法;无监督聚类;K-means;分级上升/下降(hierarchical ascending/descending);半监督学习;原型方法;近邻取样(nearest neighbor);核密度估计(kernel density estimation);支持向量机(support vector machine);隐马尔可夫模型(hidden Markov model);玻尔兹曼学习(Boltzmann Learning);并且分类器可以简单组合或者以减小特定目标函数的方式组合。综述参见例如Pattern Classification,R.O.Duda,et al.,editors,John Wiley & Sons,2nd edition,2001;还参见The Elements of Statistical Learning-Data Mining,Inference,and Prediction,T.Hastie,et al.,editors,Springer Science+Business Media,LLC,2nd edition,2009;它们均通过引用整体并入本文。
为了用监督学习技术产生分类器,获得称为训练数据的样品集合。在诊断测试的情况中,训练数据包括来自未知样品稍后会被分配的不同组(类别)的样品。例如,收集自对照群体的个体和特定疾病群体的个体的样品可以组成训练数据以开发可以分类未知样品(或者,更特别地,样品所来自的个体)为患有该疾病或无该疾病的分类器。从训练数据开发分类器已知为训练该分类器。分类器训练的具体细节取决于监督学习技术的性质。作为示例,训练朴素贝叶斯(Bayesian)分类器的实例在下文进行描述(参见例如Patten Classification,R.O.Duda,et al.,editors,John Wiley & Sons,2nd edition,2001;还参见The Elements of Statistical Learning-Data Mining,Inference,and Prediction,T.Hastie,et al.,editors,Springer Science+Business Media,LLC,2nd edition,2009)。
因为通常在训练集合中存在比样品多得多的潜在生物标记值,所以必须小心避免过拟合。当统计学模型描述随机误差或噪声而非潜在关系时发生过拟合。过拟合可以由各种方式避免,这包括例如限制开发分类器中使用的标记数目,假设标记应答互相独立,限制采用的潜在统计学模型的复杂性,以及保证潜在统计学模型符合数据。
使用生物标记的集合开发诊断测试的示意性实例包括应用朴素贝叶斯分类器,这是一种基于贝叶斯(Bayes)定理的简单或然性分类器,具有生物标记的严格独立处理。每个生物标记由针对每种类别中测量的RFU值或logRFU(相对荧光单位)值的类别依赖性概率密度函数(pdf)描述。一个类别中的标记的集合的共同pdf(joint pdfs)假定为每个生物标记的个体类别依赖性pdf的积。在此情况中训练朴素贝叶斯分类器意味着分配参数(“参数化”)以表征类别依赖性pdf。类别依赖性pdf的任何潜在模型均可以使用,但是模型应该通常符合在训练集合中观察的数据。
具体地,测量疾病类别中生物标记i的值xi的类别依赖性概率写作p(xi|d),并且观察具有值
Figure BPA00001368927800481
的n个标记的整体朴素贝叶斯概率写作
Figure BPA00001368927800482
其中各个xi是以RFU或log RFU表示的测量的生物标记水平。对于未知的分类分配通过以下方法来促进:对于相同测量值,计算与不患病(对照)的概率
Figure BPA00001368927800483
相比的具有测量的
Figure BPA00001368927800484
的患病概率
Figure BPA00001368927800485
这些概率的比率通过应用贝叶斯定理从类别依赖性pdf计算,即
Figure BPA00001368927800486
其中P(d)为对测试合适的群体中疾病的发病率。对这一比率的两边取对数并从以上代入朴素贝叶斯类别依赖性概率,获得
Figure BPA00001368927800487
这种形式已知为log似然比,并简单地表示不患有特定疾病比患有所述疾病的log似然性,并且主要由n个单独生物标记的单独log似然比的总和组成。在其最简单的形式中,未知样品(或者,更特别地,样品所来自的个体)分类为不患有疾病,如果上述比率大于0;而分类为患有疾病,如果所述比率小于0。
在一示例性实施方案中,类别依赖性生物标记pdf p(xi|c)和p(xi|d)假定为在测量的RFU值xi中为正态分布或log正态分布,即
Figure BPA00001368927800491
并且对于p(xi|d),具有μd,i
Figure BPA00001368927800492
的类似表达。模型的参数化要求估计来自训练数据的每个类别依赖性pdf的两个参数,平均值μ和方差δ2。这可以通过各种方式实现,包括例如最大似然估计、最小平方以及本领域技术人员已知的任何其他方法。将p(xi|c)和p(xi|d)的正态分布代入上文所定义的log-似然比,获得以下表达式:
Figure BPA00001368927800493
一旦μ和δ2的集合已对来自训练数据的每个类别的每个pdf定义,并且确定群体中的疾病发病率,则贝叶斯分类器完全确定并且可以用于分类具有测量值的未知样品。
朴素贝叶斯分类器的性能取决于用于构建和训练分类器的生物标记的数目和质量。如以下实施例3所定义,单个生物标记根据其KS-距离(柯尔莫可洛夫-斯米洛夫(Kolmogorov-Smirnov))运行。如果分类器性能度量(metric)定义为灵敏性(真阳性的分数,fTP)和特异性(1减假阳性的分数,1-fFP)的总和,则完美分类器的评分为2,随机分类器平均评分为1。利用KS-距离的定义,最大化cdf函数的差异的值x*可以通过对x求解
Figure BPA00001368927800495
来发现,这获得p(x*|c)=p(x*|d),即当类别依赖性pdf正交(cross)时产生KS距离。将x*的这个值代入KS-距离的表达式,获得以下关于KS的定义 KS = cdf c ( x * ) - cdf d ( x * ) = ∫ - ∞ x * p ( x | c ) dx - ∫ - ∞ x * p ( x | d ) dx = 1 - ∫ x * ∞ p ( x | c ) dx - ∫ - ∞ x * p ( x | d ) dx = 1 - f FP - f FN ,利用具有x*的截断值(cut-off)的检验,KS距离为1减去总误差分数,基本上为单个分析物贝叶斯(Bayesian)分类器。因为我们定义灵敏性+特异性=2-fFP-fFN的分数,组合KS-距离的上述定义,我们可以得到灵敏性+特异性=1+KS。我们选择具有固有地适合构建朴素贝叶斯分类器的统计量的生物标记。
具有良好KS距离(例如>0.3)的后续标记的加入通常会改善分类性能,如果后续加入的标记独立于第一标记。使用灵敏性加特异性作为分类器评分,用贪婪算法的变体会直接产生许多高评分分类器。(贪婪算法是那些应用了解决问题的元启发式(metaheuristic)算法,这些算法使得本地优化选择在每一个阶段都可以找到全方位的最优化。)
此处使用的算法在实施例4中详细描述。简言之,从潜在生物标记表中产生所有单分析物分类器并加入到列表中。接下来,向每个存储的单分析物分类器进行所有可能的第二分析物的加入,在一个新列表上储存预定数目的最佳评分配对,例如一千个。用这个最佳二-标记分类器的新列表开发所有可能的三标记分类器,再次储存其中最佳的一千个。持续这个过程直至评分进入平稳状态或开始随着额外标记的加入而变差。可以评价那些在收敛后仍保持的高评分分类器对于目标用途的期望性能。例如,在一种诊断应用中,具有高灵敏性和中等特异性的分类器可以比中等灵敏性和高特异性是更期望的。在另一诊断应用中,具有高特异性和中等灵敏性的分类器可以是更期望的。期望的性能水平通常基于在假阳性和假阴性数之间必须进行的交换(trade-off)而选择,所述假阳性和假阴性可以针对特定针对应用而各自容忍。这种交换通常取决于假阳性或假阴性误差的医学后果。
现有技术已知各种其他技术,并且可以被采用以使用朴素贝叶斯分类器从生物标记列表产生许多潜在分类器。在一实施方案中,所谓的遗传算法可以使用上述定义的适合度评分用于组合不同的标记。遗传算法特别适于开发潜在分类器的大且多样的群体。在另一实施方案中,所谓的蚁群优化(ant colony optimization)可以用于产生分类器的集合。现有技术已知的其他策略也可以采用,包括例如其他进化策略以及模拟退火和其他随机检索方法。也可以采用元启发式方法如和声搜索(harmony search)。
示例性实施方案使用表1第2列所列的任意数目的肺癌生物标记以各种组合来产生用于检测肺癌的诊断测试(如何鉴定这些生物标记的详细描述见实施例2)。在一实施方案中,诊断肺癌的方法使用朴素贝叶斯分类方法联合表1第2列所列的任意数目的肺癌生物标记。在示例性实施例(实施例3)中,用于从无症状吸烟者群体检测肺癌的最简单测试可以用诸如SCFsR的单个生物标记来构建,SCFsR在肺癌中下调,KS-距离为0.37(1+KS=1.37)。使用来自表41的针对SCFsR的参数μc,i、σc,i、μd,i和σd,i以及上述log-似然性的等式,可以产生具有63%灵敏性和73%特异性的诊断测试(灵敏性+特异性=1.36),见表40。这个测试的ROC曲线示于图2并且AUC为0.75。
加入例如KS-距离为0.5的生物标记HSP90a,显著改进分类器性能至灵敏性为76%及特异性为0.75%(灵敏性+特异性=1.51)及AUC=0.84。注意,由两个生物标记构建的分类器的评分不是KS-距离的简单加和;当组合生物标记时KS-距离不是加合性时,要使用许多较弱标记来实现与强标记相同的性能水平。加入第三标记ERBB1例如增加分类器性能至78%灵敏性和83%特异性及AUC=0.87。加入额外的生物标记例如PTN、BTK、CD30、激肽释放酶7、LRIG3、LDH-H1和PARC产生了一系列肺癌测试,总结在表40中,并在图3中显示为一系列ROC曲线。作为分类器构建中使用的分析物数目的函数的分类器评分示于图4。这个示例性10标记分类器的灵敏性和特异性>87%,AUC为0.91。
表1第2列所列的标记可以许多方式组合以产生用于诊断肺癌的分类器。在一些实施方案中,取决于所选择的特定诊断性能标准,生物标记的组由不同数目的分析物组成。例如,生物标记的某些组合会产生比其他组合更灵敏(或更特异)的测试。
一旦组限定为包括来自表1第2列的生物标记的特定集合,并且从训练数据集合构建分类器,则诊断测试的定义完整。在一实施方案中,用于分类未知样品的程序示于图1A。在另一实施方案中,用于分类未知样品的程序示于图1B。将生物学样品合适地稀释,然后进行一个或多个测定以产生用于分类的相关定量生物标记水平。测量的生物标记水平用作分类方法的输入,该方法输出所述样品的分类和任选的评分,这反映了类别分配的置信度。
表1鉴定了用于诊断肺癌的61种生物标记。当与在生物标记发现的尝试中通常的发现的相比时,这比预期令人惊讶地高,可能归因于所述研究的规模,其涵盖在几百个个体样品中测量的超过800种蛋白,在一些情况下浓度为低毫微微摩尔范围。据推测,发现的大量生物标记反映了在肿瘤生物学和身体对肿瘤存在的应答中涉及的不同生物化学途径;每种途径和过程均涉及许多蛋白。结果显示没有一小组蛋白的单个蛋白对于这种复杂过程独特提供信息;相反,多个蛋白包括在相关过程中,如凋亡或细胞外基质修复。
鉴于在所述研究中鉴定的许多生物标记,可以预期能够衍生大量高性能分类器,它们可以用于各种诊断方法。为测试这个观点,用表1的生物标记评价了几万个分类器。如实施例4所述,表1所述生物标记的许多子集可以组合以产生有用的分类器。作为示例,提供了含有1、2和3个生物标记的分类器用于如下两种用途的每一种的描述:吸烟者的高风险肺癌筛查以及具有可由CT检测到的肺小结的个体的诊断。如实施例4所述,用表1的生物标记构建的所有分类器比用“非标记”构建的分类器明显更好。
还测试了通过随机排除表1的一些标记获得的分类器的性能,随机排除产生了较小的子集,从这些子集来构建分类器。如实施例4部分3所述,从表1中标记的随机子集构建的分类器的表现类似于用表1中标记的完全列表构建的最佳分类器。
还测试了通过从10-标记聚集中排除“最佳”单个标记而获得的10-标记分类器的性能。如实施例4部分3所述,未用表1的“最佳”标记构建的分类器也表现良好。表1所列生物标记的许多子集表现接近最佳,甚至在除去表中所列最好的15个标记之后也如此。这暗示任何特定分类器的性能特征可能不是由于生物标记的一些小核心组所致,并且疾病过程可能影响许多生物化学途径,其改变许多蛋白的表达水平。
实施例4的结果提示一些可能的结论:首先,大量生物标记的鉴定允许它们聚集成巨大数目的分类器,其提供类似的高性能。第二,分类器可以这样构建:特定生物标记可以以反映冗余的方式取代其他生物标记,所述冗余无疑遍及潜在疾病过程的复杂性。也就是说,由表1中鉴定的任何单个生物标记贡献的有关疾病的信息与由其他生物标记贡献的信息重叠,由此表1中特定生物标记或生物标记的小组无需包括在任何分类器中。
示例性实施方案使用从表38和39的数据构建的朴素贝叶斯分类器以分类未知样品。图1A和B中示出了程序。在一实施方案中,将生物学样品任选地稀释并且进行多重适配体测定。将来自所述测定的数据如实施例3所述正态化及校准,将所得生物标记水平用作贝叶斯分类方案的输入。对于每个测量的生物标记单独计算log-似然比,然后求和以产生最终分类评分,其也称为诊断评分。可以报道所得分配及总体分类评分。任选地,也可以报道对每个生物标记水平计算的个体log-似然性风险因子。分类评分计算的细节示于实施例3。
试剂盒
表1第2列的生物标记(以及额外的生物医学信息)的任何组合可以通过使用合适的试剂盒检测,如用于进行本文公开的方法的试剂盒。此外,任何试剂盒可以含有本文所述的一种或多种可检测标记,如荧光部分等。
如本文进一步描述,在一实施方案中,试剂盒包含:(a)一种或多种捕获剂(如至少一种适配体或抗体),以检测生物学样品中一种或多种生物标记,其中所述生物标记包括表1第2列所列的任何生物标记,及任选存在的(b)一种或多种软件或计算机程序产品,以将从其中获得所述生物学样品的个体分类为患有或不患有肺癌,或者确定所述个体患有肺癌的似然性。或者,除了一种或多种计算机程序产品之外,可以提供人工进行上述步骤的一种或多种操作指南。
固体支持物与对应捕获剂及信号产生材料的组合在本文中称作“检测装置”或者“试剂盒”。试剂盒也可以包含使用该装置和试剂、处理样品及分析数据的使用说明书。此外,试剂盒可以与计算机系统或软件一起使用以分析和报道生物学样品的分析结果。
试剂盒也可以含有一种或多种试剂(如增溶缓冲液、去污剂、洗涤剂或者缓冲液),以对生物学样品进行处理。本文所述的任何试剂盒可以包含例如缓冲液、封闭剂、质谱基质材料、抗体捕获剂、阳性对照样品、阴性对照样品、软件和信息如方案、指导和参考数据。
在一方面,本发明提供了分析肺癌状态的试剂盒。试剂盒包含用于选自表1第2列的一个或多个生物标记的PCR引物。试剂盒还可以包含使用及生物标记与肺癌相关性的指导。试剂盒也可以包含DNA阵列,其含有选自表1第2列的一个或多个生物标记的补体、用于扩增或分离样品DNA的试剂和/或酶。试剂盒可以包含用于实时PCR的试剂,例如TaqMan探针和/或引物,以及酶。
例如,试剂盒可以包含:(a)试剂,其包含至少用于定量测试样品中的一种或多种生物标记的捕获剂,其中所述生物标记包括表1第2列所列的生物标记或本文所述的任何其他生物标记或生物标记组;以及任选存在的(b)一种或多种算法或者计算机程序,以进行以下步骤:比较所述测试样品中每个定量的生物标记的量与一个或多个预定截断值,基于所述比较分配定量的每个生物标记评分,组合每个定量的生物标记的分配评分以获得总评分,比较该总评分与预定评分,以及使用所述比较确定个体是否患有肺癌。或者,除了一种或多种算法或计算机程序之外,可以提供人工进行上述步骤的一种或多种操作指南。
计算机方法和软件
一旦选择生物标记或生物标记组,则诊断个体的方法可包括如下步骤:1)收集或以其他方式获得生物学样品;2)进行分析方法以检测和测量所述生物学样品中的生物标记或生物标记组;3)进行用于收集生物标记值的方法所需的任何数据正态化或标准化;4)计算标记评分;5)组合所述标记评分以获得总诊断评分;6)报告所述个体的诊断评分。在这种方法中,诊断评分可以是从所有标记计算的总和确定的单一数值,将该数值与指示疾病存在与否的预设阈值比较。或者,诊断评分可以是一系列带(bar),其各自代表生物标记值,并且可以将应答模式与预设模式比较以确定疾病的存在与否。
本文所述方法的至少一些实施方案可以使用计算机实施。示例性计算机系统100在图6中示出。参考图6,系统100示出包含通过总线108电耦合的硬件元件,包括处理器101、输入设备102、输出设备103、存储设备104、计算机可读取存储介质读取器105a、通讯系统106、处理加速(如DSP或特定用途处理器)107和存储器109。计算机可读取存储介质读取器105a与计算机可读取存储介质105b进一步耦合,该组合全面地代表远程、局域、固定和/或可移动的存储装置加上存储介质、存储器等,以暂时和/或更长久地含有计算机可读取信息,这可以包括存储设备104、存储器109和/或任何其他这样的可存储系统100资源。系统100还包含软件元件(目前位于工作内存191中),包括操作系统192及其他编码193,如程序、数据等。
关于图6,系统100具有广泛的灵活性和可配置性。因此,例如单一计算机结构(single architecture)可以用于完成一个或多个服务器,其可以根据目前期望的方案、方案变化、扩展等进一步配置。然而,本领域技术人员应当了解可以根据更具体的应用要求更好地利用实施方案。例如,一个或多个系统元件可以在系统100部件内作为子元件执行(如在通讯系统106中)。也可以使用定制的硬件和/或特定元件可以在硬件、软件或硬件和软件中执行。此外,虽然可以使用与其他计算机设备如网络输入/输出设备(未示出)连接,但是也应当了解也可以利用有线、无线、调制解调器和/或与其他计算机设备的其他连接或多个连接。
在一方面,所述系统可以包含含有肺癌特征性生物标记的特征的数据库。生物标记数据(或生物标记信息)可以用作计算机的输入以用作计算机执行方法的一部分。所述生物标记数据可以包括本文所述的数据。
在一方面,所述系统还包含一个或多个装置以将输入数据提供给一个或多个处理器。
所述系统还包含用于存储分等级的数据元件的数据集合的存储器。
在另一方面,用于提供输入数据的装置包括检测仪以检测数据元件的特征,如质谱仪或者基因芯片读取器。
所述系统还可以包含数据库管理系统。用户请求或询问可以通过数据库管理系统所了解的适当语言格式化,该数据库管理系统处理所述询问以从训练集合的数据库中提取相关信息。
所述系统可以与网络连接,所述网络连接网络服务器及一个或多个客户端。网络可以是本领域已知的局域网(LAN)或广域网(WAN)。优选地,服务器包括运行计算机程序产品(如软件)所需的硬件,以进入数据库数据来处理用户请求。
所述系统可以包含操作系统(如UNIX或Linux),以执行来自数据库管理系统的命令。在一方面,操作系统可以在全球通讯网络上运行,如在国际互联网上运行,及利用全球通讯网络服务器来连接这样的网络。
所述系统可以包括这样的一个或多个装置,其包含图形显示界面,该界面包括界面元件如按钮、下拉菜单、滚动条、输入文本的信息栏等,这些是本领域已知的图形用户界面的常见元件。用户界面上登录的请求可以传给系统中的应用程序以格式化从而在一个或多个系统数据库中搜寻相关信息。用户登录的请求或询问可以任何合适的数据库语言建立。
图形用户界面可以通过作为操作系统一部分的图形用户界面编码产生,并且可以用于输入数据和/或显示输入的数据。处理的数据的结果可以在界面上显示,在与该系统通讯的打印机上打印,存储在存储装置中,和/或上传至网络或以计算机可读取介质的形式提供。
所述系统可以与输入装置通讯,以将关于数据元件的数据提供给系统(如表达值)。在一方面,输入装置可以包括基因表达谱系统,包括如质谱仪、基因芯片或阵列读取器等。
根据各个实施方案的分析肺癌生物标记信息的方法和设备可以通过任何合适方式执行,例如使用在计算机系统上运行的计算机程序。可以使用常规的计算机系统,其包含处理器和随机存取存储器,如可远程登录的应用服务器、网络服务器、个人电脑或工作站。其他计算机系统部件可以包括存储装置或信息存储系统,如大量存储系统和用户界面,例如常规的监视器、键盘和跟踪装置。计算机系统可以是单机系统,或者是包含服务器和一个或多个数据库的计算机网络的一部分。
肺癌生物标记分析系统可以提供完整数据分析的运算(function)和运行,如数据收集、处理、分析、报告和/或诊断。例如,在一实施方案中,计算机系统可以执行计算机程序,该程序可以接收、储存、搜寻、分析和报告关于肺癌生物标记的信息。计算机程序可以包含进行各种运算或运行的多个模块,如处理原始数据和产生补充数据的处理模块,以及分析原始数据和补充数据以产生肺癌状态和/或诊断的分析模块。诊断肺癌状态可以包括产生或收集任何其他信息,包括额外的生物医学信息、关于个体相对于疾病的状况,鉴定是否需要进一步检测,或者另外评价个体的健康状况。
关于图7,可以看出根据公开的实施方案的原理利用计算机方法的一个实例。在图7中,示出了流程图3000。在模块(block)3004中,可以检索个体的生物标记信息。所述生物标记信息可以从计算机数据库中检索,例如在测试个体的生物学样品之后。生物标记信息可以包含生物标记值,所述生物标记值每个对应于由选自表1第2列提供的生物标记组成的组的至少N个生物标记之一,其中N=2-61。在模块3008中,计算机可以用于将每个生物标记值分类。在模块3012中,基于多个分类可以确定个体患有肺癌的似然性。可以将该指示输出至显示器或其他显示装置,以供人观察。因此,例如该指示可以在计算机的显示器屏幕或其他输出装置上显示。
关于图8,通过流程图3200举例说明了根据另一实施方案的利用计算机的方法。在模块3204中,可以利用计算机检索个体的生物标记信息。生物标记信息包含生物标记值,所述生物标记值对应于选自表1第2列提供的生物标记的组的生物标记。在模块3208中,可以用计算机将生物标记值进行分类。并且,在模块3212中,基于所述分类可以对个体患有肺癌的似然性作出指示。可以将该指示输出至显示器或其他指示装置,以供人观察。因此,例如,该指示可以在计算机的显示器屏幕或其他输出装置上显示。
本文所述的一些实施方案可以执行以包含计算程序产品。计算机程序产品可以包括具有包含于介质中的计算机可读取程序编码的计算机可读取介质,以使得应用程序可以在具有数据库的计算机上执行。
如本文所用,“计算机程序产品”指自然或程序设计语言语句形式的组织化的指令集合,其包含于任何性质的物理介质上(如书写、电子、磁性、光学或者其他性质),并且可以与计算机或其他自动化数据处理系统一起使用。这样的程序设计语言语句当由计算机或数据处理系统执行时,使得所述计算机或数据处理系统根据语句的特定内容起作用。计算机程序产品包括但不限于:包含于计算机可读取介质中的源代码和目标码和/或测试或数据库中的程序。此外,允许计算系统或数据处理设备以预选方式起作用的计算机程序产品可以以多种形式提供,包括但不限于源代码(original source code)、汇编码(assembly code)、目标码、机器语言、前述代码的加密或压缩形式以及任何和所有等价物。
在一方面,本发明提供了一种指示肺癌的似然性的计算机程序产品。所述计算机程序产品包括包含程序代码的计算机可读取介质,所述程序代码可由计算装置或系统的处理器执行,所述程序代码包括:检索归因于来自个体的生物学样品的数据的代码,其中所述数据包括生物标记值,所述生物标记值每个对应于所述生物学样品中选自表1第2列提供的生物标记的组的至少N个生物标记之一,其中N=2-61;以及执行分类方法的代码,所述分类方法指示作为所述生物标记值的函数的所述个体的肺疾病状态。
在另一方面,本发明提供了一种指示肺癌的似然性的计算机程序产品。所述计算机程序产品包括包含程序代码的计算机可读取介质,所述程序代码可由计算装置或系统的处理器执行,所述程序代码包括:检索归因于来自个体的生物学样品的数据的代码,其中所述数据包括生物标记值,所述生物标记值对应于所述生物学样品中选自表1第2列提供的生物标记的组的生物标记;以及执行分类方法的代码,所述分类方法指示作为所述生物标记值的函数的所述个体的肺疾病状态。
虽然已经描述了本发明的方法或设备的各种实施方案,但是应当理解所述实施方案可以通过与计算机耦合的代码执行,如在计算机上或可由计算机登录的代码。例如,软件和数据库可以用于执行许多上述方法。因此,除了由硬件完成的实施方案之外,也应当注意到这些实施方案可以通过使用这样的产品实现,所述产品包含具有在其中包含计算机可读取程序代码的计算机可用介质,其允许行使本文公开的功能。因此,期望所述实施方案也可以被视为由本专利以其程序代码方式等保护。此外,所述实施方案可以体现为存储在实际上任何类型的计算机可读取存储器中的代码,包括但不限于RAM、ROM、磁性介质、光学介质或磁-光学介质。更通常地,所述实施方案可以在软件或硬件或者它们的任何组合中实施,包括但不限于在通用处理器、微代码、PLA或ASIC上运行的软件。
还期望所述实施方案可以作为包含于载波中的计算机信号以及通过传送介质传送的信号(如电信号和光信号)实现。因此,上述各种类型的信息均可以在结构中格式化,如数据结构,并且作为电信号通过传送介质传送,或存储在计算机可读取介质中。
还应当注意,本文所列举的许多结构、材料和条文可以列举为用于行使功能或行使功能的步骤的方式。因此,应当理解这样的语言有权覆盖本说明书所公开的所有的这些结构、材料或条文或它们的等价物,包括通过引用并入本文的内容。
实施例
下述实施例仅用于示例目的而不意图限制所附权利要求限定的本申请的范围。本文描述的所有实施例用本领域技术人员公知的常规标准技术进行。下述实施例描述的常规分子生物学技术可以如标准实验室手册所述进行,如Sambrook et al.,Molecular Cloning:A Laboratory Manual,3rd.ed.,Cold Spring Harbor Laboratory Press,Cold Spring Harbor,N.Y.,(2001)。
实施例1用于肺癌生物标记选择的样品的多重适配体分析
本实施例描述用于分析样品和对照以鉴定表1第2列所列的生物标记的多重适配体测定(见图9)。在本例中,多重分析使用825个适配体,每个均对于于一个特异的靶标是独特的。
在这个方法中,每次添加溶液均更换移液器尖头。
另外,除非另有说明,大多数溶液转移及洗涤添加使用Beckman Biomek FxP的96孔头(head)。除非另有说明,手工移液的方法步骤使用12通道P200 Pipetteman(Rainin Instruments,LLC,Oakland,CA)。称为SB17的定制缓冲液由内部(in-house)制备,其包含40mM HEPES、100mM NaCl、5mM KCl、5mM MgCl2、1mM EDTA,pH7.5。除非另有说明,所有步骤均在室温下进行。
1.适配体储液制备
对于不具有光可裂解生物素接头的适配体,用合适的光可裂解生物素酰化引物在1x SB17,0.05%吐温-20中以8x浓度制备用于10%、1%和0.03%血清的定制适配体储液,其中所得引物浓度是相关适配体浓度的3倍。引物与全部或部分对应适配体杂交。
将3种8x适配体溶液的每一种分别以1∶4稀释进1xSB17,0.05%吐温-20(1500μL 8x储液稀释进4500μL 1xSB17,0.05%吐温-20)以实现2x浓度。将每种稀释的适配体主混合物(master mix)然后分配到4个2mL螺旋盖试管中,每个试管1500μL,并且加热至95℃保持5分钟,随后在37℃下孵育15分钟。孵育后,将对应于特定适配体主混合物的4个2mL试管组合进试剂槽(trough),将55μL 2x适配体混合物(对于所有三种混合物)手工移液进96孔Hybaid平板并且用箔将平板密封。最终结果是3个96孔箔密封的Hybaid平板。如表28所示,各个适配体浓度在0.5-4nM的范围。
2.测定样品制备
将储存在-80℃的100%血清的冷冻等份置于25℃水浴中保持10分钟。将融化样品置于冰上,温和地涡漩(设为4)8秒钟,然后再置于冰上。
在4℃下,用50μL 8通道多通道移液器(spanning pipettor)将16μL样品转移到96孔Hybaid平板中以制备20%样品溶液,每个孔含有64μL合适的样品稀释物(对于血清,0.8x SB17、0.05%吐温-20、2μM Z-block_2、0.6mM MgCl2)。将这个平板保存在冰上直至开始下一个样品稀释步骤。
为开始样品和适配体平衡,将20%样品平板短暂离心并置于BeckmanFX上,在此将其用96孔移液器上下移液而混合。然后通过将10μL的20%样品稀释进90μL 1xSB17,0.05%吐温-20中来制备2%样品。然后,将6μL所得2%样品稀释进194μL 1xSB17,0.05%吐温-20中以制备0.06%样品平板。在Beckman Biomek FxP上进行稀释。每次转移后,通过上下移液将溶液混合。然后,通过将55μL样品加入到55μL合适的2x适配体混合物中,将3个样品稀释平板转移至它们各自的适配体溶液。样品和适配体溶液通过上下移液在机器人(robot)上混合。
3.样品平衡结合
将样品/适配体平板用箔密封,并且置于37℃培养箱中保持3.5小时,之后进行Catch 1步骤。
4.制备Catch 2珠平板
将11mL MyOne(Invitrogen Corp.,Carlsbad,CA)链霉抗生物素蛋白C1珠等份用等体积的20mM NaOH洗涤2次(每次洗涤孵育5分钟),用等体积1x SB17,0.05%吐温-20洗涤3次,并重悬浮于11mL 1x SB17,0.05%吐温-20中。用12-通道(span)多通道移液器将50μL该溶液手工移液进96孔Hybaid平板的每个孔中。然后将平板用箔覆盖,并保存在4℃用于测定。
5.制备Catch 1珠平板
将3个0.45μm Millipore HV平板(Durapore membrane,Cat#MAHVN4550)用100μL 1x SB17,0.05%吐温-20平衡至少10分钟。平衡缓冲液然后通过平板过滤,向每孔中加入133.3μL 7.5%链霉抗生物素蛋白-琼脂糖珠浆液(于1x SB17,0.05%吐温-20中)。为了在将链霉抗生物素蛋白-琼脂糖珠转移进滤板时保持它们悬浮,将珠溶液用200μL,12-通道移液器手工混合15次。在将珠分配于3个滤板中之后,施加真空以除去珠上清。最后,将珠在滤板中用200μL 1x SB17,0.05%吐温-20洗涤,然后重悬浮于200μL 1x SB17,0.05%吐温-20中。将滤板的底部吸干(blot),并将平板储存以用于测定中。
6.装载Cytomat
将Cytomat用所有尖头、平板、槽中的所有试剂(除了NHS-生物素试剂,其在即将加入到平板之前制备)、3个制备的catch 1滤板和1个制备的MyOne平板装载。
7.Catch 1
3.5分钟平衡时间之后,将样品/适配体平板从培养箱中移出,离心约1分钟,除去箔,置于Beckman Biomek FxP平台上。开始Beckman Biomek FxP程序。除非另有说明,Catch 1中的所有后续步骤均由Beckman Biomek FxP机器人完成。在该程序内,向Catch 1滤板施加真空以除去珠上清。将100微升10%、1%及0.03%平衡结合反应的每一种加入到它们各自的Catch 1滤板,每个板用即用(on-deck)轨道摇床(orbital shaker)以800rpm混合10分钟。
经真空过滤除去未结合的溶液。通过分配溶液并立即施加真空以使溶液通过平板过滤,将Catch 1珠用190μL的1x SB17,0.05%吐温-20中的100μM生物素洗涤,然后用190μL 1x SB17,0.05%吐温-20洗涤。
然后,将190μL 1x SB17,0.05%吐温-20加入到Catch 1平板中。用即用吸干装置(blot station)将平板吸干以除去液滴,然后用轨道摇床在800rpm、25℃下孵育10分钟。
机器人经真空过滤除去这个洗涤液,并用即用吸干装置吸干滤板底部以除去液滴。
8.标记(Tagging)
将NHS-PEO4-生物素等份在37℃下融化6分钟,然后用标记缓冲液(pH=7.25的SB 170.05%吐温-20)以1∶100稀释。将NHS-PEO4-生物素试剂在无水DMSO中溶解为100mM的浓度,并冷冻保存于-20℃。在机器人辅助下,将稀释的NHS-PEO4-生物素试剂手工加入即用槽中,手工重新启动机器人程序以将100μL NHS-PEO4-生物素分配到每个Catch 1滤板的每个孔中。将这个溶液用Catch 1珠在轨道摇床上以800rpm振荡孵育5分钟。
9.动力学攻击(Kinetic Challenge)及光裂解
通过向Catch 1平板中加入150μL的1x SB17,0.05%吐温-20中的20mM甘氨酸来中止标记反应,同时仍含有NHS标签。然后将平板在轨道摇床上以800rpm孵育1分钟。经真空过滤除去NHS-标签/甘氨酸溶液。然后,将190μL 20mM甘氨酸(1x SB17,0.05%吐温-20)加入到每个平板,并在轨道摇床上以800rpm孵育1分钟,之后通过真空过滤除去。
将190μL 1x SB17,0.05%吐温-20加入到每个平板,并通过真空过滤除去。
然后,通过加入190μL 1x SB17,0.05%吐温-20,将平板置于轨道摇床上以800rpm保持1分钟随后真空过滤来将Catch 1平板的孔洗涤3次。最后一次洗涤后,将平板置于1mL深孔平板的顶部并从平台上移开。将Catch 1平板在1000rpm下离心1分钟以在洗脱之前从琼脂糖珠上尽可能除去无关的体积。
将平板放回Beckman Biomek FxP上,并向滤板的每孔中加入85μL的1x SB17,0.05%吐温-20中的10mM DxSO4
将滤板从平台上移开,置于Variomag Thermoshaker(Thermo Fisher Scientific,Inc.,Waltham,MA)上,在BlackRay(Ted Pella,Inc.,Redding,CA)光源下,以800rpm振荡同时照射10分钟。
通过首先将10%Catch 1滤板置于1mL深孔平板的顶部并以1000rpm离心1分钟来将光裂解的溶液依次从每个Catch 1平板洗脱进同一个深孔平板。然后,将1%和0.03%catch 1平板依次离心入相同的深孔平板。
10.Catch 2珠捕获
将含有合并的catch 1洗脱物的1mL深孔块(block)置于用于catch 2的Beckman Biomek FxP的平台上。
机器人将所有光裂解洗脱物从1mL深孔平板转移到含有先前制备的catch 2MyOne磁珠的Hybaid平板上(经磁性分离除去MyOne缓冲液后)。
将溶液在Variomag Thermoshaker(Thermo Fisher Scientific,Inc.,Waltham,MA)上在25℃下以1350rpm振荡孵育5分钟。
机器人将平板转移到即用磁性分离器。将平板在磁体上孵育90秒,然后除去并弃去上清。
11.37℃30%甘油洗涤
将catch 2平板移到即用保温摇床上,将75μL 1x SB17,0.05%吐温-20转移到每孔中。将平板在37℃下以1350rpm混合1分钟以重悬浮并加热珠。在37℃下,向catch 2平板的每个孔中转移75μL 60%甘油,并将平板继续在37℃下以1350rpm再混合1分钟。机器人将平板转移到37℃磁性分离器上,在此将其在磁体上孵育2分钟,然后机器人除去并弃去上清。将这些洗涤再重复2次。
将第三30%甘油洗涤液从catch 2珠除去后,将150μL 1x SB17,0.05%吐温-20加入到每孔中,并在37℃下以1350rpm振荡孵育1分钟,然后在37℃磁体上通过磁性分离除去。
将catch 2珠用150μL 1x SB19,0.05%吐温-20以1350rpm振荡孵育1分钟来进行最后洗涤一次,然后进行磁性分离。
12.Catch 2珠洗脱及中和
通过向每孔加入105μL含1M NaCl,0.05%吐温-20的100mM CAPSO来将适配体从catch 2珠洗脱。将珠用这种溶液以1300rpm振荡孵育5分钟。
然后,将catch 2平板置于磁性分离器上保持90秒,然后将90μL洗脱物转移到每孔含有10μL的500mM HCl、500mM HEPES、0.05%吐温-20的新96孔平板中。转移后,通过移液90μL上下5次来机器混合溶液。
13.杂交
Beckman Biomek FxP转移20μL中和的catch 2洗脱物到新鲜的Hybaid平板,向每孔加入5μL含有10x峰值(spike)杂交对照的10x Agilent Block。然后,将25μL 2x Agilent Hybridization缓冲液手工移液入含有中和的样品和封闭缓冲液的平板的每孔中,通过手工缓慢移液25μL上下15次以避免大量泡沫形成而将溶液混合。将平板以1000rpm离心1分钟。
将gasket slide置于Agilent杂交室中,将40μL每种含有杂交和封闭溶液的样品手工移液进每个gasket中。以减少气泡形成的方式使用8-通道可调(variable)多通道移液器。将定制Agilent微阵列玻片(Agilent Technologies,Inc.,Santa Clara,CA)以条形码朝上缓慢下降到gasket slide上(参见Agilent手册的详细描述)。
将杂交室上部置于玻片/背衬(backing)夹心结构上,将夹紧支架(clamping bracket)盖在整个装置上。通过旋紧螺旋来夹紧这些装置。
目视检查每个玻片/背衬玻片夹心结构以保证溶液气泡可以在样品中自由活动。如果气泡不自由活动,则轻拍杂交室以释放靠近垫片(gasket)的气泡。
将组装的杂交室在Agilent杂交炉中在60℃下以20rpm旋转孵育19小时。
14.杂交后洗涤
将约400mL Agilent Wash Buffer 1置于两个单独的玻璃染色皿的每一个中。将一个染色皿置于磁力搅拌板上,将玻片架和搅拌棒置于缓冲液中。
将搅拌棒置于空玻璃染色皿中来制备用于Agilent Wash 2的染色皿。
将第4玻璃染色皿置于一旁以用于最终乙腈洗涤。
分解6个杂交室的每一个。逐个将玻片/背衬夹心结构从其杂交室移开并浸入含有Wash 1的染色皿中。用一对镊子将玻片/背衬夹心结构撬开,同时仍浸没微阵列玻片。将玻片快速转移进磁力搅拌板上的Wash 1染色皿中的玻片架中。
将玻片架缓慢上升和降低5次。磁力搅拌器以低设定开启,将玻片孵育5分钟。
当Wash 1剩余1分钟时,将在培养箱中预热至37℃的Wash Buffer 2加入到第二制备的染色皿中。将玻片架快速转移到Wash Buffer 2中,通过将其在染色皿顶部刮擦来除去玻片架底部的任何过量缓冲液。将玻片架缓慢上升和降低5次。磁力搅拌器以低设定开启,将玻片孵育5分钟。
将玻片架从Wash 2中缓慢取出,将玻片从溶液中取出需要约15秒。
当在Wash 2中剩余1分钟时,将乙腈(CAN)加入到第4染色皿中。将玻片架转移到乙腈染色皿中。将玻片架缓慢上升和降低5次。磁力搅拌器以低设定开启,将玻片孵育5分钟。
将玻片架缓慢从ACN染色皿中取出并置于吸水纸上。玻片底部边缘快速干燥,将玻片置于干净的玻片盒中。
15.微阵列成像
将微阵列玻片置于Agilent扫描仪玻片容器中,并根据厂商指导装载到Agilent微阵列扫描仪中。
将玻片在Cy3通道中以5μm分辨率在100%PMT设定及XRD选项为0.05的条件下成像。所得tiff图像用Agilent特征抽取软件版本10.5处理。
实施例2生物标记鉴定
进行针对3种不同诊断应用的潜在肺癌生物标记的鉴定,即诊断来自CT扫描的可疑小结,筛查无症状吸烟者的肺癌及诊断患有肺癌的个体。血清样品从4个不同位点收集以支持这3种应用,并且包括247例NSCLC病例、420例良性小结对照和352例无症状吸烟者对照。表29总结了位点样品信息。用实施例1所述的多重适配体亲和力测定测量和报道这些1019个样品中每一个的825个分析物的RFU值。因为血清样品获得自相似但不同方案下的4个独立研究和位点,所以在生物标记发现分析之前进行位点差异检查。良性小结、无症状吸烟者及NSCLC三个群体的每一个在位点之间单独比较,这通过对825个分析物中的每一个产生位点内(within-site)、类别依赖性(class-dependent)累积分布函数(cdf)而进行比较。然后对所有位点对之间的每个分析物在共同类别内应用KS-检验以鉴定那些不是由于类别而是由于位点而不同的分析物。在三个类别中的所有位点比较中,观察到统计学显著的位点依赖性差异。来自样品的两个集合的值之间的KS-距离(柯尔莫可洛夫-斯米洛夫统计量)是如下程度的非参数测量,即来自一个集合(集合A)的值的经验分布与来自另一集合(集合B)的值的分布的差异程度。对于阈值T的任何值,来自集合A的某些比例的值小于T,来自集合B的某些比例的值小于T。KS距离测量对于任何T选择来自两个集合的值的比例之间的最大(无符号)差异。
这种位点依赖性作用倾向于掩盖鉴定特异性对照-疾病差异的能力。为了减小这样的作用并鉴定关键疾病依赖性生物标记,采用三种不同策略进行生物标记发现,即(1)跨越位点(across site)的聚集类别依赖性cdf,(2)位点内(within-site)类别依赖性cdf的比较,及(3)混合方法(1)和(2)。这三种方法学的细节及其结果如下。
潜在生物标记的这三个集合可以用于构建分类器,该分类器将样品分配为对照或疾病组。事实上,许多这样的分类器是从这些生物标记集合产生,确定了任何生物标记用于良好评分分类器的频率。在顶级评分分类器中最常出现的那些生物标记对于产生诊断测试最有用的。在本实施例中,贝叶斯分类器用于开发分类空间,但是许多其他监督学习技术可以为此目的而采用。任何单独分类器的评分适合度通过在贝叶斯表面对分类器的灵敏性和特异性求和而校准,假定疾病发病率为0.5。这个评分度量从0到2变化,2是无误差分类器。从生物标记群体测量构建贝叶斯分类器的细节如实施例3所述。
通过在方法(1)中聚集跨越所有位点的类别依赖性样品,那些表现出平均的大位点间(site-to-site)变化的分析物测量由于大位点间差异而未能显示出类别依赖性差异。这样的分析物被自动排除在进一步分析之外。但是,那些确实表现出跨越位点的类别依赖性差异的分析物是相当稳健(robust)的生物标记,它们对于样品收集和样品处理可变性较不敏感。用跨越所有位点的聚集类别依赖性cdf计算所有分析物的KS-距离。使用0.3的KS-距离阈值使得鉴定用于良性小结-NSCLC比较的65个潜在生物标记以及用于吸烟者-NSCLC比较的83个潜在生物标记。
使用超过KS-距离阈值的65个分析物,发现了总共282个10-分析物分类器,用于从具有良性小结的对照组诊断NSCLC的评分为1.7或更好(平均灵敏性>85%,并且平均特异性>85%)。从这个分类器集合,发现在10.0%或更多的高评分分类器中存在总共19个生物标记。表30提供了这些潜在生物标记的列表,图10是鉴定的生物标记的频率图。
为了从无症状吸烟者的组中诊断NSCLC,使用上述鉴定的83个潜在生物标记,发现了评分为1.7或更好的总共1249个分类器,每个由10个分析物组成。总共21个分析物出现于这个10.0%或更多的分类器集合中。表31提供了这些生物标记的列表,图11是鉴定的生物标记的频率图。这完成了使用方法(1)的生物标记鉴定。
方法(2)集中于单独的位点之间对照和病例组(小结和患有肺癌的吸烟者)之间潜在生物标记变化的一致性。对每个位点内的所有分析物分别构建类别依赖性cdf,从这些cdf计算KS-距离以鉴定潜在生物标记。在此,分析物必需具有高于所有位点中的一些阈值的KS-距离以被视为潜在的生物标记。对于良性小结比NSCLC比较,在位点之间,0.3的阈值产生具有病例和对照之间一致差异的11个分析物。对于KS-距离,降低阈值到0.275产生19个分析物。使用这19个分析物构建潜在的10-分析物贝叶斯分类器,有2897个分类器具有1.6或更好的评分。所有19个分析物均以高于10%的频率发生,并且示于表32和图12。
对于无症状吸烟者组比NSCLC组,在所有位点之间,类似分析产生的33个分析物具有大于0.3的KS-距离。从这个潜在生物标记集合构建10-分析物分类器产生19个生物标记,它们在1249个分类器中具有>10.0%的频率,评分为1.7或更高。这些分析物示于表33和图13。
最后,通过组合方法(2)鉴定的生物标记的核心组与方法(1)中鉴定的那些额外的潜在生物标记,从潜在生物标记的这个混合集合产生了分类器集合。对于良性小结诊断,生物标记核心组包括频率>0.5的那6个分析物。这6个分析物用于播种(seed)贝叶斯分类器,向其加入额外的标记直至总共15个蛋白。对于>1.65的分类评分,从这个核心构建总共1316个贝叶斯分类器。使用频率截断值10%,从这个分类器集合鉴定了25个潜在生物标记。这些分析物示于表34,图14是鉴定的生物标记的频率图。无症状吸烟者和NSCLC组的类似分析以方法(2)的7个蛋白的核心开始,从1508个评分>1.7的15蛋白分类器鉴定了26个潜在生物标记。表35显示了这些结果,图15是鉴定的生物标记的频率图。
将图10-15的生物标记组合以产生表36的肺癌生物标记的最终列表。表37包括用于鉴定生物标记的适配体的解离常数,多重适配体测定中标记的定量限度以及标记相对于对照群体在疾病群体中是上调还是下调。
实施例3肺癌的朴素贝叶斯分类
从鉴定为可用于区分NSCLC与良性小结的生物标记列表,选择一组10个生物标记并构建朴素贝叶斯分类器,见表41。将类别依赖性概率密度函数(pdf)p(xi|c)和p(xi|d)建模为正态分布函数,其中xi为生物标记i的测量的RFU值的log,c和d指对照和疾病群体,该函数的特征在于平均值μ和方差σ2。10生物标记的pdf的参数列于表41,拟合为正态pdf的原始数据与模型的实例示于图5。如图5所示,潜在的假设看起来拟合数据非常好。
这样的模型的朴素贝叶斯分类在下述等式中给出,
Figure BPA00001368927800671
其中P(d)为适合测试群体中疾病的发病率,此处n=10。求和中的每一项是单个标记的log似然比,不患有所关注疾病(即在这一情况下是NSCLC)比患有该疾病的样品的总log似然比
Figure BPA00001368927800672
是这些单独项加表示疾病发病率的项的简单加和。为简便起见,我们假设P(d)=0.5,从而
Figure BPA00001368927800673
鉴于
Figure BPA00001368927800674
的10个生物标记每一个的log(RFU)的未知样品测量,分类的计算细节见表42。将包含对照比疾病类别的log似然比的单独成分列表,并且可以从表41的参数和
Figure BPA00001368927800675
的值计算。单个log似然比之和是5.77,或者无疾病比患病的似然性是321∶1,其中似然性=e5.77=321。前两个生物标记值具有与疾病组(log似然性<0)更一致的似然性,但是其余的8个生物标记都一致地发现偏好(favor)对照组,最大倍数为3∶1。将似然性相乘给出上述相同结果;未知样品不患有疾病的似然性为321∶1。事实上,这个样品来自训练集合中的对照群体。
实施例4选择用于分类器的生物标记组的贪婪算法
部分1
本实施例描述了从表1选择生物标记以形成能够在本文所述的任何方法中用作分类器的组。表1的生物标记的子集被选择用于构建具有良好性能的分类器。这个方法还用于确定哪些潜在标记包括为实施例2中的生物标记。
此处所用的分类器性能的测量是灵敏性和特异性之和;1.0的性能是随机(抛硬币(coin toss))分类器的基线预期值,比随机差的分类器的评分在0.0至1.0之间,比随机性能好的分类器的评分在1.0至2.0之间。无误差的完美分类器具有1.0的灵敏性和1.0的特异性,因此性能为2.0(1.0+1.0)。可以将实施例4的方法用于性能的其他常规测量,如ROC曲线下面积、F-测量或灵敏性和特异性之积。特别地,可能想要用不同加权处理特异性和特异性,从而选择具有较高特异性而损失一些灵敏性的那些分类器,或者选择具有较高灵敏性而损失一些特异性的那些分类器。因为本文所述方法仅涉及“性能”的一个测量,因此可以使用导致单个性能测量的任何加权方案。不同应用对于真阳性和真阴性发现会有不同益处,以及与假阳性发现和假阴性发现相关的不同成本。例如,筛查无症状吸烟者以及在CT中发现的良性小结的差异鉴定诊断通常不具有特异性和灵敏性之间相同的最佳平衡(trade-off)。两种测试的不同需求通常需要对阳性和阴性误分类设定不同的加权,反映在性能测量中。改变性能测量通常会改变对于给定数据集合的选自表1第2列的确切标记子集。
对于实施例3所述的区分肺癌样品与对照样品的贝叶斯方法,通过生物标记在疾病和良性训练样品中的分布而将分类器完全参数化,生物标记列表选自表1;即,给定训练数据集合,选择包括的标记子集以一对一的方式确定分类器。
此处采用的贪婪方法用于从表1检索最佳标记子集。对于小数目标记或具有较少标记的分类器,列举每个可能的标记子集并评价用该特定标记集合构建的分类器的性能(见实施例4,部分2)。(这种方法在统计学领域公知为“最佳子集选择”,参见例如Hastie et al,见上文)。但是,对于本文所述分类器,多个标记的组合的数目可能非常大,评价例如来自40个标记列表(表39)的10个标记的所有可能集合(即847,660,528种组合)是不可行的。因为通过每个标记子集检索不切实际,所以单个最佳子集可能不能发现;但是,通过使用这种方法,发现了许多优异的子集,并且在许多情况下,任何这些子集可以代表最佳的子集。
代替评价每个可能的标记集合,可以进行“贪婪”正向逐步方法(″greedy″forward stepwise approach)(参见例如Dabney AR,Storey JD(2007)Optimality Driven Nearest Centroid Classification from Genomic Data.PLoS ONE 2(10):e1002.doi:10.1371/journal.pone.0001002)。使用这个方法,分类器以最佳的单个标记(基于各个标记的KS-距离)开始,并且在每步通过依次尝试标记列表中目前不是分类器中的标记集合的成员的每个成员而成长。将与现有分类器组合评分最佳的一个标记加入到分类器中。重复直至不再实现性能的进一步改善。不幸地,这个方法可能错过有价值的标记组合,一些单独的标记在方法终止前没有全部被选择。
此处使用的贪婪方法是前述正向逐步方法的加工,为扩大检索,而不是在每个步骤中保持仅单个候选分类器(标记子集),保持候选分类器列表。该列表用每个单个标记子集(使用表中每个标记自身)播种。通过从目前在列表中的分类器衍生新的分类器(标记子集)并且将它们加入到列表中而扩大列表。通过加入不是该分类器的部分的来自表1的任何标记(其加入到子集不会复制现有子集)(这些称为“允许标记”)延伸目前在列表上的每个标记子集。每个现有标记子集通过来自列表的每个允许标记延伸。很明显,这种方法最终会产生每个可能的子集,该列表会用完空间。因此,所有产生的分类器仅保持到列表小于某些预定大小时(通常足以保持所有三个标记子集)。一旦列表达到预定大小限制,其变成精英(elitist);即,仅显示一定水平性能的那些分类器保持在列表上,其他分类器跌落到列表末尾并被丢弃。这通过保持列表根据分类器性能分选而实现;插入至少与目前列表上最差分类器一样好的新的分类器,使得强制排除当前末尾的后进者。一种进一步执行细节是列表在每个产生步骤被完全置换;因此,列表上的每个分类器具有相同数目的标记,在每个步骤每个分类器的标记数目增加一个。
因为这个方法使用不同标记组合产生候选分类器列表,所以人们会询问是否可以组合分类器以避免可能由最佳单个分类器或由最佳分类器的少数集合产生的误差。这种“总体”和“专家委员会(committee of experts)”方法是统计学及机器学习领域公知的,并且包括例如″Averaging″、″Voting″、″Stacking″、″Bagging″和″Boosting″(参见例如Hastie et al.见上文)。简单分类器的这些组合提供了通过包括一些不同分类器及因此来自生物标记表的更大的标记集合的信息来降低分类中由于任何特定标记集合中的噪声所导致的方差的方法,这有效地在分类器之间平均。这个方法的有用性的实例是其可以防止单个标记中的异常值(outlier)负面影响单个样品的分类。测量更大数目信号的需求在常规的“一次一个标记”抗体测定中可能是不切实际的,但是对于完全多重适配体测定没有下降趋势(downside)。这些技术获益于更广泛的生物标记表,并且使用有关疾病过程的多种信息来源以提供更稳健的分类。
部分2
表1中选择的生物标记给出的分类器表现好于用“非标记”(即具有不满足包括在表1中的标准的信号的蛋白(如实施例2所述))构建的分类器。
对于含有仅一个、两个和三个标记的分类器,用表1的生物标记获得的所有可能的分类器被列举并且检查性能分布,与从随机选择的非标记信号的类似表构建的分类器进行比较。
在图17和图18中,灵敏性和特异性之和用作性能测量;1.0的性能是随机(抛硬币)分类器的基线预期值。分类器性能的柱状图与来自从40个非标记信号的“非标记”表构建的分类器的类似穷举的性能的柱状图进行比较;所述40个信号随机选自400个未证实对照与疾病群体之间差异信号的适配体(KS-距离<1.4)。
图17显示从表39的生物标记参数构建的所有可能的单标记、二标记和三标记分类器对于可以区分良性小结和NSCLC的生物标记的性能的柱状图,并且将这些分类器与用40个“非标记”适配体RFU信号构建的所有可能的单标记、二标记和三标记分类器进行比较。图17A显示单标记分类器性能的柱状图,图17B显示二标记分类器性能的柱状图,图17C显示三标记分类器性能的柱状图。
在图17中,实线表示使用表39中良性小结和NSCLC的生物标记数据的所有单标记、二标记和三标记分类器的分类器性能的柱状图。虚线是使用良性小结和NSCLC的数据但是使用随机非标记信号集合的所有单标记、二标记和三标记分类器的分类器性能的柱状图。
图18显示从表38的生物标记参数构建的所有可能的单标记、二标记和三标记分类器对于可以区分无症状吸烟者和NSCLC的生物标记的性能的柱状图,并且将它们与用40个“非标记”适配体RFU信号构建的所有可能的单标记、二标记和三标记分类器进行比较。图18A显示单标记分类器性能的柱状图,图18B显示二标记分类器性能的柱状图,图18C显示三标记分类器性能的柱状图。
在图18中,实线表示使用表38中无症状吸烟者和NSCLC的生物标记参数的所有单标记、二标记和三标记分类器的分类器性能的柱状图。虚线是使用无症状吸烟者和NSCLC的数据但是使用随机非标记信号集合的所有单标记、二标记和三标记分类器的分类器性能的柱状图。
从表1所列标记构建的分类器形成了独特的柱状图,对于所有单标记、二标记和三标记比较,与用来自“非标记”的信号构建的分类器分离良好。从表1的生物标记构建的分类器的性能和AUC评分随标记数增加也比从非标记构建的分类器更快,随着每个分类器标记数增加,标记和非标记分类器之间的分离增加。用表38和39中所列生物标记构建的所有分类器比用“非标记”构建的分类器表现更好。
部分3
为测试是否标记的核心子集导致分类器的良好性能,将一半标记随机从表38和39的生物标记列表中放弃。如通过灵敏性加特异性所测量的,用于区分良性小结与恶性小结的分类器的性能略微下降0.07(从1.74到1.67),用于区分患有癌症的吸烟者与不患癌症的吸烟者的分类器的性能也略微降低0.06(从1.76到1.70)。生物标记表的子集的性能特征的影响是所列生物标记的多个子集有效地构建诊断测试,没有特定的核心子集标记决定分类器的性能。
根据这些结果,测试了排除表38和39的最佳标记的分类器。图19比较了用表38和39中的生物标记完全列表构建的分类器的性能和用排除顶级标记的来自表38和39的生物标记集合构建的分类器的性能。
图19证实未用最佳标记构建的分类器表现良好,这暗示分类器的性能不是由一些小的核心组标记所决定,并且与疾病相关的潜在过程中的变化反映在许多蛋白的活性中。表1中的许多生物标记子集表现接近最佳,甚至在除去表1的40个标记的最好的15个之后也如此。
图19A显示对用2-10个标记构建的用于区分良性小结与NSCLC的分类器的作用。甚至在放弃表39的15个顶级标记(由KS-距离排名)之后,良性小结比NSCLC性能也随选自该表的标记数增加,达到1.65以上(灵敏性+特异性)。
图19B显示对用2-10个标记构建的用于区分无症状吸烟者与NSCLC的分类器的作用。甚至在放弃表38的15个顶级标记(由KS-距离排名)之后,无症状吸烟者比NSCLC性能也随选自该表的标记数增加,达到1.7以上(灵敏性+特异性),并且紧密接近选自表38的生物标记完全列表的最佳分类器的性能。
最后,图20示出根据实施例3从表38和39中的参数列表构建的典型分类器的ROC性能。图20A示出来自如实施例3中假设标记的独立性的模型性能,图20B示出使用用于产生表38和39中的参数的测定数据集合的实际ROC曲线。可以看出给定数目的所选标记的性能在定性上是一致的,定量一致性随标记数增加而降低。(这与如下观点一致,即有关疾病过程的任何特定生物标记贡献的信息与表38和39提供的其他生物标记贡献的信息是冗余的)。图20由此证实表38和39联合实施例3所述的方法允许构建和评价用于区分NSCLC与良性小结及区分具有NSCLC的无症状吸烟者与不具有NSCLC的无症状吸烟者的非常多的分类器。
实施例5在Pull-down测定中证实适配体特异性
多重测定中的最终读取基于在测定中连续捕获步骤后回收的适配体的量。多重测定基于这样的前提,即在测定结束时回收的适配体的量与原始复杂混合物(例如血浆)中的蛋白的量成比例。为了证实这个信号确实来自目的分析物而非血浆中非特异性结合的蛋白,我们开发了血浆中的基于凝胶的pull-down测定。这个测定可以用于目视证实在用适配体平衡后期望的蛋白确实从血浆中拉出(pull out),以及证实与其目的蛋白靶标结合的适配体可以作为复合物幸免于测定中的动力学攻击步骤。在本实施例描述的实验中,在这个pull-down测定结束时蛋白的回收需要在平衡后蛋白保持非共价结合适配体几乎2小时。重要的是,在这个实施例中我们还提供了证据以表明在这些步骤中非特异性结合的蛋白解离并且对最终信号无显著贡献。应注意本实施例描述的pull-down程序包括上述多重测定中的所有关键步骤。
A.血浆Pull-down测定
通过将50μL EDTA-血浆在含0.05%吐温-20(SB 18T)和2μM Z-Block的SB18中稀释成100μL来制备血浆样品。将血浆溶液用10皮摩尔(pmole)PBDC-适配体在150μL的终体积中于37℃下平衡2小时。平衡后,将复合物和未结合的适配体通过在RT下于Durapore滤板中振荡孵育5分钟来用133μL 7.5%链霉抗生物素蛋白-琼脂糖珠浆液捕获。将与珠结合的样品如实施例1所述用生物素及用缓冲液在真空下洗涤。洗涤后,将结合的蛋白用生物素稀释剂中的0.5mM NHS-S-S-生物素、0.25mM NHS-Alexa647在RT下振荡5分钟来进行标记。这个染色步骤允许生物素酰化用于将蛋白捕获在链霉抗生物素蛋白珠上,以及高灵敏染色用于在凝胶上检测。如实施例1所述,将样品用甘氨酸及用缓冲液洗涤。用Black Ray光源在RT下振荡10分钟,通过光裂解将适配体从珠上释放。在此时,生物素酰化的蛋白通过在RT下振荡5分钟而捕获在0.5mg MyOne链霉抗生物素蛋白珠上。这个步骤捕获与适配体结合的蛋白以及自从最初平衡可能与适配体解离的蛋白。如实施例1所述洗涤珠。通过用SB17T中的50mM DTT在37℃下振荡孵育25分钟而从MyOne链霉抗生物素蛋白珠洗脱蛋白。然后,将洗脱物转移到用与适配体的3’固定区互补的序列包被的MyOne珠,并在37℃下振荡孵育25分钟。这个步骤捕获所有剩余的适配体。将珠用100μLSB17T洗涤1分钟,进行2次;并用100μL SB19T洗涤1分钟,进行1次。通过用45μL 20mM NaOH振荡孵育2分钟以破坏杂交的链而从这些最终珠上洗脱适配体。将40μL这种洗脱物用10μL含有0.05%吐温-20的80mMHCl中和。将相当于5%的来自珠的第一集合的洗脱物(代表结合适配体的所有血浆蛋白)和20%的来自珠的最后集合的洗脱物(代表在我们的临床测定结束时保持结合的所有血浆蛋白)的等份于还原和变性条件下在NuPAGE4-12%Bis-Tris凝胶(Invitrogen)上进行电泳。将凝胶于Alpha InnotechFluorChem Q扫描仪上在Cy5通道中成像以成像蛋白。
B.分别选择针对LBP(~1x10-7M于血浆中,多肽MW~60kDa)、C9(~1x10-6M于血浆中,多肽MW~60kDa)和IgM(~9x10-6M于血浆中,MW~70kDa和23kDa)的适配体的Pull-down凝胶(见图16)。
对于每个凝胶,泳道1是链霉抗生物素蛋白-琼脂糖珠的洗脱物,泳道2是最终洗脱物,泳道3是MW标记泳道(主要条带从上至下为110、50、30、15和3.5kDa)。从这些凝胶可以看出在最初平衡中有少量血浆蛋白的非特异性结合,但是在进行测定的捕获步骤后仅留下靶标。很明显单个适配体试剂足以捕获其目的分析物,无需预先耗竭或者分级血浆。然后,在这些步骤后剩余的适配体的量与最初样品中的分析物的量成比例。
上述实施方案和实施例仅作为例子示出。没有特定实施方案、实施例或者特定实施方案或实施例的要素被认为是任何权利要求关键的、需要的或必需的要素或特征。另外,本文描述的要素不是实施所附权利要求所需的,除非明确描述为“必需”或“关键的”。可以对所公开的实施方案进行各种改变、修饰、取代和其他变化而不偏离所附权利要求限定的本申请的范围。包括附图和实施例的说明书是示例性而非限制性的,所有这样的修饰和取代包括在本申请范围内。因此,本申请的范围应当由所附的权利要求及其法律等价物限定而非由上述实施例限定。例如,任何方法权利要求中列举的步骤可以任何可行顺序执行而不限于任何实施方案、实施例或权利要求中的顺序。另外,在任何上述方法中,表1的一个或多个生物标记可以作为单个生物标记或作为来自任何组的生物标记特别地排除。
Figure BPA00001368927800751
Figure BPA00001368927800761
Figure BPA00001368927800771
Figure BPA00001368927800791
Figure BPA00001368927800801
Figure BPA00001368927800811
Figure BPA00001368927800821
Figure BPA00001368927800831
Figure BPA00001368927800841
Figure BPA00001368927800851
Figure BPA00001368927800861
表2
100组3良性比癌性小结生物标记
Figure BPA00001368927800881
表2(续)
Figure BPA00001368927800891
表2(续)
Figure BPA00001368927800901
表3
100组4良性比癌性小结生物标记
表3(续)
Figure BPA00001368927800921
表3(续)
Figure BPA00001368927800931
表4
100组5良性比癌性小结生物标记
Figure BPA00001368927800941
表4(续)
表4(续)
Figure BPA00001368927800961
Figure BPA00001368927800971
Figure BPA00001368927800981
Figure BPA00001368927800991
Figure BPA00001368927801001
表6
100组7良性比癌性小结生物标记
Figure BPA00001368927801011
表6(续)
Figure BPA00001368927801021
表6(续)
Figure BPA00001368927801031
表6(续)
Figure BPA00001368927801041
表6(续)
Figure BPA00001368927801051
表7
100组8良性比癌性小结生物标记
Figure BPA00001368927801061
表7(续)
Figure BPA00001368927801071
表7(续)
Figure BPA00001368927801081
表7(续)
Figure BPA00001368927801091
表7(续)
Figure BPA00001368927801101
表8
100组9良性比癌性小结生物标记
表8(续)
Figure BPA00001368927801121
表8(续)
表8(续)
Figure BPA00001368927801141
表9
100组10良性比癌性小结生物标记
Figure BPA00001368927801151
表9(续)
表9(续)
Figure BPA00001368927801171
表9(续)
Figure BPA00001368927801201
Figure BPA00001368927801221
Figure BPA00001368927801231
Figure BPA00001368927801241
Figure BPA00001368927801251
Figure BPA00001368927801271
Figure BPA00001368927801281
Figure BPA00001368927801291
Figure BPA00001368927801301
Figure BPA00001368927801311
Figure BPA00001368927801321
Figure BPA00001368927801331
Figure BPA00001368927801341
Figure BPA00001368927801361
Figure BPA00001368927801391
Figure BPA00001368927801401
Figure BPA00001368927801411
Figure BPA00001368927801421
Figure BPA00001368927801431
Figure BPA00001368927801441
Figure BPA00001368927801451
Figure BPA00001368927801471
Figure BPA00001368927801501
Figure BPA00001368927801511
表15
100组3无症状吸烟者比癌症生物标记
Figure BPA00001368927801531
表15(续)
表15(续)
表16
100组4无症状吸烟者比癌症生物标记
Figure BPA00001368927801561
表16(续)
Figure BPA00001368927801571
表16(续)
Figure BPA00001368927801581
表17
100组5无症状吸烟者比癌症生物标记
Figure BPA00001368927801591
表17(续)
表17(续)
Figure BPA00001368927801611
Figure BPA00001368927801621
Figure BPA00001368927801631
Figure BPA00001368927801641
Figure BPA00001368927801651
表19
100组7无症状吸烟者比癌症生物标记
表19(续)
Figure BPA00001368927801671
表19(续)
Figure BPA00001368927801681
表19(续)
Figure BPA00001368927801691
表19(续)
Figure BPA00001368927801701
表20
100组8无症状吸烟者比癌症生物标记
Figure BPA00001368927801711
表20(续)
Figure BPA00001368927801721
表20(续)
Figure BPA00001368927801731
表20(续)
Figure BPA00001368927801741
表20(续)
Figure BPA00001368927801751
表21
100组9无症状吸烟者比癌症生物标记
Figure BPA00001368927801761
表21(续)
Figure BPA00001368927801771
表21(续)
表21(续)
Figure BPA00001368927801791
表22
100组10无症状吸烟者比癌症生物标记
Figure BPA00001368927801801
表22(续)
Figure BPA00001368927801811
表22(续)
Figure BPA00001368927801821
表22(续)
Figure BPA00001368927801831
Figure BPA00001368927801841
Figure BPA00001368927801861
Figure BPA00001368927801871
Figure BPA00001368927801881
Figure BPA00001368927801901
Figure BPA00001368927801911
Figure BPA00001368927801931
Figure BPA00001368927801941
Figure BPA00001368927801951
Figure BPA00001368927801971
Figure BPA00001368927801981
Figure BPA00001368927801991
Figure BPA00001368927802001
Figure BPA00001368927802011
Figure BPA00001368927802021
Figure BPA00001368927802041
Figure BPA00001368927802051
Figure BPA00001368927802061
Figure BPA00001368927802071
Figure BPA00001368927802081
Figure BPA00001368927802091
Figure BPA00001368927802111
Figure BPA00001368927802121
Figure BPA00001368927802131
Figure BPA00001368927802141
Figure BPA00001368927802151
表28适配体浓度
Figure BPA00001368927802171
表29
Figure BPA00001368927802181
表30聚集数据的良性小结-NSCLC中所鉴定的生物标记
  SCF sR   CNDP1   应激诱导的磷蛋白1
  RGM-C   MEK1   LRIG3
  ERBB1   MDHC   ERK-1
  钙粘着蛋白E   过氧化氢酶   亲环蛋白A
  CK-MB   BMP-1   胱天蛋白酶-3
  METAP1   ART   UFM1
  HSP90a   C9   RAC1
  IGFBP-2   TCPTP   过氧化物氧还蛋白-1
  需钙蛋白酶I   RPS6KA3   PAFAHβ亚基
  KPCI   IMB1   MK01
  MMP-7   UBC9   整合蛋白a1b1
  β-ECGF   泛素+1   IDE
  HSP90b   组织蛋白酶H   CAMK2A
  NAGK   CSK21   BLC
  FGF-17   BTK   BARK1
  巨噬细胞甘露糖受体   凝血酶   eIF-5
  MK13   LYN   UFC1
  NACA   HSP70   RS7
  GAPDH   UBE2N   PRKACA
  CSK   TCTP   AMPM2
  激活蛋白A   RabGDP解离抑制剂β   应激诱导的磷蛋白1
  凝血酶原   MAPKAPK3
表31聚集数据的吸烟者-NSCLC中所鉴定的生物标记
 SCF sR  肾素   胱天蛋白酶-3
 PTN  CSK   AMPM2
 HSP90a  接触蛋白-5   RS7
 激肽释放酶7  UBE2N   OCAD1
 LRIG3  MPIF-1   HSP70
 IGFBP-2  PRKACA   GSK-3α
 PARC  粒酶A   FSTL3
 CD30配体  泛素+1   PAFAHβ亚基
 凝血酶原  NAGK   整合蛋白a1b1
 ERBB1  组织蛋白酶S   ERK-1
 KPCI  TCTP   CSK21
 BTK  UBC9   CATC
 GAPDH,肝  MK13   MK01
 CK-MB  半胱氨酸蛋白酶抑制剂C   pTEN
 LDH-H1  RPS6KA3   b2-微球蛋白
 CNDP1  IL-15Ra   UFM1
 RAC1  需钙蛋白酶I   UFC1
 C9  MAPKAPK3   过氧化物氧还蛋白-1
 FGF-17  IMB1   PKB
 内皮抑制素  BARK1   IDE
 亲环蛋白A  组织蛋白酶H   HSP90b
 C1s  巨噬细胞甘露糖受体   BGH3
 CD30  Dtk   BLC
 BMP-1  NACA   XPNPEP1
 SBDS  RabGDP解离抑制剂β TNFsR-I
 MIP-5  LYN   DUS3
 CCL28  METAP1
 MMP-7  MK12
表32通过位点在良性小结-NSCLC中所鉴定的生物标记
  ERBB1   FGF-17
  LRIG3   CD30配体
  HMG-1   LGMN
  YES   蛋白酶-3
  C9   MEK1
  MK13   BLC
  巨噬细胞甘露糖受体   IL-17B
  ApoA-I   CATC
  CNDP1   钙粘着蛋白-6
  BMP-1
表33通过位点在吸烟者-NSCLC中所鉴定的生物标记
  激肽释放酶7   CSK   天青杀素
  SCF sR   FYN   b2-微球蛋白
  ERBB1   BLC   OCAD1
  C9   TCTP   LGMN
  LRIG3   中期因子   PKB
  AMPM2   FGF-17   XPNPEP1
  HSP90a   MEK1   钙粘着蛋白-6
  sL-选择蛋白   BMP-1   pTEN
  BTK   LYN   LYNB
  CNDP1   整合蛋白a1b1   DUS3
  CDK5-p35   PKBγ   碳酸酐酶XIII
表34混合数据集合的良性小结-NSCLC中所鉴定的生物标记
表35混合数据集合的吸烟者-NSCLC中所鉴定的生物标记
Figure BPA00001368927802211
表36
  肺癌的生物标记   良性小结  吸烟者
  AMPM2   YES  SCFsR
  BMP-1   MK13  LRIG3
  BTK   LRIG3  HSP90a
  C1s   HMG-1  ERBB1
  C9   ERBB1  C9
  钙粘着蛋白E   钙粘着蛋白E  AMPM2
  过氧化氢酶   CK-MB  激肽释放酶7
  组织蛋白酶H   C9  PTN
  CD30配体   SCFsR  PARC
  CK-MB   CNDP1  CD30配体
  CNDP1   RGM-C  凝血酶原
  接触蛋白-5   METAP1  CSK
  CSK   巨噬细胞甘露糖受体  CK-MB
  ERBB1   BMP-1   BTK
  HMG-1   KPCI   C1s
表36(续)
  HSP90a   IGFBP-2   IGFBP-2
  HSP90b   CSK   LDH-H1
  IGFBP-2   NACA   RAC1
  IL-15Ra   IMB1   肾素
  IMB1   组织蛋白酶H   CNDP1
  激肽释放酶7   MMP-7   TCTP
  KPCI   VEGF   IL-15Ra
  LDH-H1   HSP90b   UBE2N
  LRIG3   过氧化氢酶   MIP-5
  巨噬细胞甘露糖受体   凝血酶原   接触蛋白-5
  METAP1   ApoA-I   泛素+1
  MIP-5   b-ECGF   BLC
  MK13   BLC   BMP-1
  MMP-7   钙粘着蛋白-6   CDK5-p35
  NACA   需钙蛋白酶I   亲环蛋白A
  PARC   CATC   内皮抑制素
  凝血酶原   CD30配体   FGF-17
  PTN   FGF-17   FYN
  RAC1   GAPDH   GAPDH
  肾素   HSP90a   KPCI
  RGM-C   IL-17B   MEK1
  SCFsR   LGMN   中期因子
  TCTP   MEK1   sL-选择蛋白
  UBE2N   NAGK
  泛素+1   蛋白酶-3
  VEGF
  YES
  ApoA-I
  b-ECGF
  BLC
  钙粘着蛋白-6
  需钙蛋白酶I
  CATC
  CDK5-p35
  亲环蛋白A
  内皮抑制素
  FYN
  FGF-17
  GAPDH
  IL-17B
  LGMN
  MEK1
  中期因子
  NAGK
表36(续)
 蛋白酶-3
 sL-选择蛋白
表37
表37(续)
Figure BPA00001368927802241
表37(续)
Figure BPA00001368927802251
表38吸烟者对照组的参数
Figure BPA00001368927802261
表39良性小结对照组的参数
Figure BPA00001368927802271
Figure BPA00001368927802281
表41源自朴素贝叶斯分类器的训练组的参数
Figure BPA00001368927802291
表42朴素贝叶斯分类器的计算细节
Figure BPA00001368927802301

Claims (31)

1.一种诊断个体患有或不患有肺癌的方法,所述方法包括:
在来自个体的生物学样品中检测生物标记值,所述生物标记值每个对应于选自表1的至少N个生物标记之一,其中所述个体基于所述生物标记值分类为患有或不患有肺癌,其中N=2-61。
2.一种指示肺癌的似然性的计算机执行方法,所述方法包括:
在计算机上检索个体的生物标记信息,其中所述生物标记信息包括生物标记值,所述生物标记值每个对应于选自表1的至少N个生物标记之一;
用计算机对每个所述生物标记值进行分类;以及
基于多个分类指示所述个体患有肺癌的似然性,其中N=2-61。
3.一种指示肺癌的似然性的计算机程序产品,所述计算机程序产品包括:
包含程序代码的计算机可读取介质,所述程序代码可由计算装置或系统的处理器执行,所述程序代码包括:
检索归因于来自个体的生物学样品的数据的代码,其中所述数据包括生物标记值,所述生物标记值每个对应于选自表1的至少N个生物标记之一,其中所述生物标记在所述生物学样品中检测;以及
执行分类方法的代码,所述分类方法指示作为所述生物标记值的函数的所述个体的肺疾病状态;其中N=2-61。
4.权利要求3的计算机程序产品,其中所述分类方法使用概率密度函数。
5.权利要求4的计算机程序产品,其中所述分类方法使用两种或更多种类别。
6.权利要求2的方法,其中指示所述个体患有肺癌的似然性包括在计算机显示器上显示所述似然性。
7.一种诊断个体患有或不患有肺癌的方法,所述方法包括:
在来自个体的生物学样品中检测生物标记值,所述生物标记值每个对应于选自表1的一组生物标记,其中所述个体分类为患有或不患有肺癌,其中所述生物标记的组的灵敏性+特异性值为1.65或更大。
8.权利要求7的方法,其中所述组的灵敏性+特异性值为1.70或更大。
9.权利要求1-8中任一项的方法,其中N=2-15。
10.权利要求1-8中任一项的方法,其中N=2-10。
11.权利要求1-8中任一项的方法,其中N=3-10。
12.权利要求1-8中任一项的方法,其中N=4-10。
13.权利要求1-8中任一项的方法,其中N=5-10。
14.一种诊断个体的肺癌的方法,所述方法包括:
在来自个体的生物学样品中检测生物标记值,所述生物标记值对应于选自表1的生物标记,其中所述个体基于所述生物标记值分类为患有肺癌。
15.一种指示肺癌的似然性的计算机执行方法,所述方法包括:
在计算机上检索个体的生物标记信息,其中所述生物标记信息包括生物标记值,所述生物标记值对应于选自表1的生物标记;
用计算机对所述生物标记值进行分类;以及
基于所述分类指示所述个体患有肺癌的似然性。
16.权利要求15的方法,其中指示所述个体患有肺癌的似然性包括在计算机显示器上显示所述似然性。
17.一种指示肺癌的似然性的计算机程序产品,所述计算机程序产品包括:
包含程序代码的计算机可读取介质,所述程序代码可由计算装置或系统的处理器执行,所述程序代码包括:
检索归因于来自个体的生物学样品的数据的代码,其中所述数据包括生物标记值,所述生物标记值对应于选自表1的生物标记;以及
执行分类方法的代码,所述分类方法指示作为所述生物标记值的函数的所述个体的肺疾病状态。
18.权利要求1-17中任一项的方法,其中检测所述生物标记值包括进行体外测定。
19.权利要求18的方法,其中所述体外测定包括对应于每个所述生物标记的至少一种捕获剂,并且还包括从由适配体、抗体和核酸探针组成的组中选择所述至少一种捕获剂。
20.权利要求19的方法,其中所述至少一种捕获剂是适配体。
21.权利要求18的方法,其中所述体外测定选自免疫测定、基于适配体的测定、组织学或细胞学测定以及mRNA表达水平测定。
22.权利要求1-21中任一项的方法,其中每个生物标记值基于预定值或值的预定范围评价。
23.权利要求1-22中任一项的方法,其中所述生物学样品是肺组织,其中所述生物标记值源自所述肺组织的组织学或细胞学分析。
24.权利要求1-22中任一项的方法,其中所述生物学样品选自全血、血浆和血清。
25.权利要求1-22中任一项的方法,其中所述生物学样品是血清。
26.权利要求1-25中任一项的方法,其中所述个体是人。
27.权利要求1-26中任一项的方法,其中所述个体是吸烟者。
28.权利要求27的方法,其中所述生物标记选自表1第6列。
29.权利要求1-26中任一项的方法,其中所述个体具有肺小结。
30.权利要求29的方法,其中所述生物标记选自表1第5列。
31.权利要求1-30中任一项的方法,其中所述肺癌是非小细胞肺癌。
CN200980144620.XA 2008-09-09 2009-09-09 肺癌生物标记蛋白的捕获剂在制备试剂盒中的用途 Active CN102209968B (zh)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
US9559308P 2008-09-09 2008-09-09
US61/095,593 2008-09-09
US15283709P 2009-02-16 2009-02-16
US61/152,837 2009-02-16
PCT/US2009/056399 WO2010030697A1 (en) 2008-09-09 2009-09-09 Lung cancer biomarkers and uses thereof

Related Child Applications (1)

Application Number Title Priority Date Filing Date
CN201410477840.7A Division CN104198709A (zh) 2008-09-09 2009-09-09 肺癌生物标记及其用途

Publications (2)

Publication Number Publication Date
CN102209968A true CN102209968A (zh) 2011-10-05
CN102209968B CN102209968B (zh) 2016-05-04

Family

ID=42005456

Family Applications (2)

Application Number Title Priority Date Filing Date
CN201410477840.7A Pending CN104198709A (zh) 2008-09-09 2009-09-09 肺癌生物标记及其用途
CN200980144620.XA Active CN102209968B (zh) 2008-09-09 2009-09-09 肺癌生物标记蛋白的捕获剂在制备试剂盒中的用途

Family Applications Before (1)

Application Number Title Priority Date Filing Date
CN201410477840.7A Pending CN104198709A (zh) 2008-09-09 2009-09-09 肺癌生物标记及其用途

Country Status (14)

Country Link
EP (1) EP2340506B1 (zh)
JP (1) JP5701212B2 (zh)
KR (1) KR101658347B1 (zh)
CN (2) CN104198709A (zh)
AU (2) AU2009291811B2 (zh)
CA (3) CA3011730C (zh)
DK (1) DK2340506T3 (zh)
ES (1) ES2559758T3 (zh)
GB (1) GB2478441B (zh)
HK (2) HK1153834A1 (zh)
HR (1) HRP20160127T1 (zh)
MX (1) MX2011002322A (zh)
SI (1) SI2340506T1 (zh)
WO (1) WO2010030697A1 (zh)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105823665A (zh) * 2016-05-13 2016-08-03 北京九州柏林生物科技有限公司 生物组织样本制备套液
CN106168624A (zh) * 2011-10-24 2016-11-30 私募蛋白质体公司 肺癌生物标记及其用途
US10359425B2 (en) 2008-09-09 2019-07-23 Somalogic, Inc. Lung cancer biomarkers and uses thereof
US11041866B2 (en) 2010-08-13 2021-06-22 Somalogic, Inc. Pancreatic cancer biomarkers and uses thereof

Families Citing this family (23)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP2857522A3 (en) 2009-03-12 2015-10-14 Cancer Prevention And Cure, Ltd. Methods of identification, assessment, prevention and therapy of lung diseases and kits thereof including gender-based disease identification, assessment, prevention and therapy
EP2591357A4 (en) * 2010-07-09 2014-01-01 Somalogic Inc BIOMARKER FOR LUNG CANCER AND USE
RU2612017C2 (ru) * 2011-04-07 2017-03-01 Де Скриппс Рисерч Инститьют Высокопроизводительный скрининг соединений, модулирующих экспрессию клеточных макромолекул
CN110444287B (zh) 2011-04-29 2024-02-06 癌症预防和治疗有限公司 使用分类系统及其试剂盒识别和诊断肺部疾病的方法
US9201044B2 (en) * 2011-12-21 2015-12-01 Integrated Diagnostics, Inc. Compositions, methods and kits for diagnosis of lung cancer
US9304137B2 (en) 2011-12-21 2016-04-05 Integrated Diagnostics, Inc. Compositions, methods and kits for diagnosis of lung cancer
US11913957B2 (en) 2011-12-21 2024-02-27 Biodesix, Inc. Compositions, methods and kits for diagnosis of lung cancer
WO2013121374A2 (en) * 2012-02-17 2013-08-22 Koninklijke Philips N.V. Acute lung injury (ali)/acute respiratory distress syndrome (ards) assessment and monitoring
WO2014074682A1 (en) 2012-11-07 2014-05-15 Somalogic, Inc. Chronic obstructive pulmonary disease (copd) biomarkers and uses thereof
BR112016010322A2 (pt) 2013-11-07 2017-08-08 Medial Res Ltd Método computadorizado de avaliação de risco de câncer de pulmão, meio legível por computador, sistema de avaliação de câncer de pulmão, e método de geração de um classificador para avaliação de risco de câncer de pulmão
KR102078310B1 (ko) * 2015-09-11 2020-02-19 주식회사 압타머사이언스 비소세포성 폐암 진단용 단백질 바이오마커 패널 및 이를 이용한 비소세포성 폐암 진단 방법
FR3050269B1 (fr) * 2016-04-15 2018-05-11 Ecole Superieure De Physique Et De Chimie Industrielles De La Ville De Paris (Espci) Procede de selection et de recuperation de produits et systeme associe
SG11201810914VA (en) 2016-06-21 2019-01-30 Wistar Inst Compositions and methods for diagnosing lung cancers using gene expression profiles
JP6280997B1 (ja) * 2016-10-31 2018-02-14 株式会社Preferred Networks 疾患の罹患判定装置、疾患の罹患判定方法、疾患の特徴抽出装置及び疾患の特徴抽出方法
WO2018187496A2 (en) 2017-04-04 2018-10-11 Lung Cancer Proteomics, Llc Plasma based protein profiling for early stage lung cancer prognosis
KR102633621B1 (ko) 2017-09-01 2024-02-05 벤 바이오사이언시스 코포레이션 진단 및 치료 모니터링용 바이오마커로서의 당펩티드의 식별 및 용도
CN111630602A (zh) * 2017-11-22 2020-09-04 磨石肿瘤生物技术公司 减少新抗原的接合表位呈递
BR112020026129B1 (pt) * 2018-06-22 2023-10-10 Somalogic Operating Co., Inc Métodos para melhorar o desempenho de ensaios proteômicos multiplex
EP3987292A4 (en) * 2019-06-21 2023-10-11 National University of Singapore METHODS OF DETERMINING THE LIKELIHOOD OF LUNG CANCER
CN110579611B (zh) * 2019-09-18 2023-01-31 郑州大学 一种用于肺癌早期筛查和诊断的联合检测血清标志物、试剂盒及检测方法
CN111047609B (zh) * 2020-03-13 2020-07-24 北京深睿博联科技有限责任公司 肺炎病灶分割方法和装置
CN116381073A (zh) * 2020-10-10 2023-07-04 中山大学肿瘤防治中心(中山大学附属肿瘤医院、中山大学肿瘤研究所) 生物标志物在制备肺癌检测试剂中的用途和方法
CN112557514B (zh) * 2020-12-22 2021-09-21 中国海洋大学 手持式海底沉积物样品剖面声学全自动测量装置

Family Cites Families (23)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6596503B1 (en) * 2000-08-18 2003-07-22 East Carolina University Monoclonal antibody DS6, tumor-associated antigen CA6, and methods of use thereof
US20030199685A1 (en) * 2001-03-12 2003-10-23 Monogen, Inc. Cell-based detection and differentiation of disease states
US20030190602A1 (en) * 2001-03-12 2003-10-09 Monogen, Inc. Cell-based detection and differentiation of disease states
JP2005527180A (ja) * 2001-04-18 2005-09-15 プロテイン デザイン ラブス, インコーポレイテッド 肺がんの診断方法、肺がんの修飾因子の組成及びスクリーニングの方法
EP1739185A1 (en) * 2002-12-18 2007-01-03 Ciphergen Biosystems, Inc. Serum biomarkers in lung cancer
CN1225477C (zh) * 2003-03-28 2005-11-02 上海市疾病预防控制中心 肺癌早期血清特异蛋白及其应用
CN1455257A (zh) * 2003-05-23 2003-11-12 北京师范大学 一种利用表面修饰蛋白芯片进行肺癌诊断方法
TW200600785A (en) * 2004-03-23 2006-01-01 Oncotherapy Science Inc Method for diagnosing non-small cell lung cancer
JP2005304497A (ja) * 2004-03-25 2005-11-04 Joji Inasawa 特定の癌関連遺伝子を用いる癌の検出方法及び癌の抑制方法
ES2367311T3 (es) * 2004-04-15 2011-11-02 University Of Florida Research Foundation, Inc. Productos de degradación proteolítica de map-2 como biomarcadores de diagnóstico para las lesiones neurales.
CA2564396A1 (en) * 2004-04-26 2005-11-03 Children's Medical Center Corporation Platelet biomarkers for the detection of disease
MX2007001357A (es) * 2004-08-02 2009-08-07 Childrens Medical Center Biomarcadores de plaquetas para cancer.
CN1873417A (zh) * 2005-06-02 2006-12-06 中国医学科学院肿瘤医院肿瘤研究所 一种用于诊断肺癌的蛋白质芯片
JP5160447B2 (ja) * 2005-12-22 2013-03-13 アボット・ラボラトリーズ 肺がんへの傾向についてのスクリーニングのための方法およびマーカー組合せ
WO2007109571A2 (en) * 2006-03-17 2007-09-27 Prometheus Laboratories, Inc. Methods of predicting and monitoring tyrosine kinase inhibitor therapy
EP2074224A4 (en) * 2006-10-17 2010-07-21 Synergenz Bioscience Ltd METHOD AND COMPOSITIONS FOR ASSESSING LUNG FUNCTION AND LUNG RIDING
WO2008097908A2 (en) * 2007-02-05 2008-08-14 Dana-Farber Cancer Institute, Inc. Methods of diagnosing and prognosing lung cancer
KR100846354B1 (ko) * 2007-03-21 2008-07-15 (주) 프로탄바이오 혈청 당단백질부터 분리한 폐암 진단용 마커
CA2684945A1 (en) * 2007-05-18 2008-11-27 University Of Southern California Germline polymorphisms in the angiogenic pathway predict tumor recurrence in cancer therapy
US7888051B2 (en) * 2007-09-11 2011-02-15 Cancer Prevention And Cure, Ltd. Method of identifying biomarkers in human serum indicative of pathologies of human lung tissues
WO2010003772A1 (en) * 2008-06-16 2010-01-14 Siemens Medical Solutions Diagnostics Gmbh Method for predicting adverse response to erythropoietin in breast cancer treatment
US10359425B2 (en) * 2008-09-09 2019-07-23 Somalogic, Inc. Lung cancer biomarkers and uses thereof
AU2011215789A1 (en) * 2010-02-10 2012-08-30 The Regents Of The University Of California Salivary biomarkers for lung cancer detection

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10359425B2 (en) 2008-09-09 2019-07-23 Somalogic, Inc. Lung cancer biomarkers and uses thereof
US11041866B2 (en) 2010-08-13 2021-06-22 Somalogic, Inc. Pancreatic cancer biomarkers and uses thereof
CN106168624A (zh) * 2011-10-24 2016-11-30 私募蛋白质体公司 肺癌生物标记及其用途
CN106168624B (zh) * 2011-10-24 2018-03-13 私募蛋白质体公司 肺癌生物标记及其用途
CN105823665A (zh) * 2016-05-13 2016-08-03 北京九州柏林生物科技有限公司 生物组织样本制备套液

Also Published As

Publication number Publication date
AU2015249113B2 (en) 2017-09-07
AU2009291811A1 (en) 2010-03-18
EP2340506A4 (en) 2012-02-15
JP2012502281A (ja) 2012-01-26
GB201106053D0 (en) 2011-05-25
CA3152591C (en) 2023-08-29
HK1153834A1 (zh) 2012-04-05
KR20110063753A (ko) 2011-06-14
EP2340506B1 (en) 2015-11-11
CN102209968B (zh) 2016-05-04
MX2011002322A (es) 2011-05-10
AU2015249113A1 (en) 2015-11-12
GB2478441A (en) 2011-09-07
CN104198709A (zh) 2014-12-10
AU2009291811B2 (en) 2015-10-29
EP2340506A1 (en) 2011-07-06
CA2734535C (en) 2018-08-28
CA2734535A1 (en) 2010-03-18
GB2478441B (en) 2013-03-27
HK1204062A1 (zh) 2015-11-06
CA3152591A1 (en) 2010-03-18
JP5701212B2 (ja) 2015-04-15
SI2340506T1 (sl) 2016-02-29
WO2010030697A1 (en) 2010-03-18
HRP20160127T1 (hr) 2016-03-11
ES2559758T3 (es) 2016-02-15
CA3011730A1 (en) 2010-03-18
DK2340506T3 (en) 2016-02-08
CA3011730C (en) 2022-05-17
KR101658347B1 (ko) 2016-09-21

Similar Documents

Publication Publication Date Title
CN102985819B (zh) 肺癌生物标记及其用途
CN102209968B (zh) 肺癌生物标记蛋白的捕获剂在制备试剂盒中的用途
CN106198980B (zh) 胰腺癌生物标记及其用途
CN103429753A (zh) 间皮瘤生物标记及其用途
CN106168624B (zh) 肺癌生物标记及其用途
US20120143805A1 (en) Cancer Biomarkers and Uses Thereof
CN107422126A (zh) 心血管危险事件预测及其用途
WO2011031344A1 (en) Cancer biomarkers and uses thereof
CN108603887A (zh) 非酒精性脂肪肝疾病(nafld)和非酒精性脂肪性肝炎(nash)生物标记及其用途
CN105143887A (zh) 非酒精性脂肪肝疾病(nafld)和非酒精性脂肪性肝炎(nash)生物标记及其用途
CN108026584B (zh) 非小细胞肺癌诊断用蛋白质生物标志物组及利用其的非小细胞肺癌诊断方法
US20220065872A1 (en) Lung Cancer Biomarkers and Uses Thereof

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
CP01 Change in the name or title of a patent holder
CP01 Change in the name or title of a patent holder

Address after: Colorado, USA

Patentee after: Private placement protein body Operation Co.,Ltd.

Address before: Colorado, USA

Patentee before: SOMALOGIC, Inc.