CN118215845A - 增强的对生物分子的检测和定量 - Google Patents

增强的对生物分子的检测和定量 Download PDF

Info

Publication number
CN118215845A
CN118215845A CN202280074458.4A CN202280074458A CN118215845A CN 118215845 A CN118215845 A CN 118215845A CN 202280074458 A CN202280074458 A CN 202280074458A CN 118215845 A CN118215845 A CN 118215845A
Authority
CN
China
Prior art keywords
measurement
biomolecule
endogenous
biological sample
data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202280074458.4A
Other languages
English (en)
Inventor
布鲁斯·威尔考克斯
卡维亚·斯瓦米纳坦
普雷斯顿·B·威廉姆斯
贾瑞德·德亚明
杨觅
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
PROTEC CO Ltd
Original Assignee
PROTEC CO Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by PROTEC CO Ltd filed Critical PROTEC CO Ltd
Publication of CN118215845A publication Critical patent/CN118215845A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N33/00Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
    • G01N33/48Biological material, e.g. blood, urine; Haemocytometers
    • G01N33/50Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing
    • G01N33/68Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing involving proteins, peptides or amino acids
    • G01N33/6803General methods of protein analysis not limited to specific proteins or families of proteins
    • G01N33/6848Methods of protein analysis involving mass spectrometry
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N33/00Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
    • G01N33/48Biological material, e.g. blood, urine; Haemocytometers
    • G01N33/50Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing
    • G01N33/53Immunoassay; Biospecific binding assay; Materials therefor
    • G01N33/574Immunoassay; Biospecific binding assay; Materials therefor for cancer
    • G01N33/57407Specifically defined cancers
    • G01N33/57423Specifically defined cancers of lung
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N33/00Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
    • G01N33/48Biological material, e.g. blood, urine; Haemocytometers
    • G01N33/50Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing
    • G01N33/68Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing involving proteins, peptides or amino acids
    • G01N33/6893Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing involving proteins, peptides or amino acids related to diseases not provided for elsewhere
    • G01N33/6896Neurological disorders, e.g. Alzheimer's disease
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N2458/00Labels used in chemical analysis of biological material
    • G01N2458/15Non-radioactive isotope labels, e.g. for detection by mass spectrometry
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N2570/00Omics, e.g. proteomics, glycomics or lipidomics; Methods of analysis focusing on the entire complement of classes of biological molecules or subsets thereof, i.e. focusing on proteomes, glycomes or lipidomes

Landscapes

  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Molecular Biology (AREA)
  • Biomedical Technology (AREA)
  • Immunology (AREA)
  • Physics & Mathematics (AREA)
  • Hematology (AREA)
  • Chemical & Material Sciences (AREA)
  • Urology & Nephrology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Biochemistry (AREA)
  • General Physics & Mathematics (AREA)
  • Biotechnology (AREA)
  • Microbiology (AREA)
  • Pathology (AREA)
  • Food Science & Technology (AREA)
  • Medicinal Chemistry (AREA)
  • Analytical Chemistry (AREA)
  • Cell Biology (AREA)
  • General Health & Medical Sciences (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Biophysics (AREA)
  • Neurology (AREA)
  • Neurosurgery (AREA)
  • Hospice & Palliative Care (AREA)
  • Oncology (AREA)
  • Other Investigation Or Analysis Of Materials By Electrical Means (AREA)
  • Investigating Or Analysing Biological Materials (AREA)

Abstract

本文描述了用于筛选疾病状态的方法。该方法可以包括获得多个数据集,以及基于所述数据集的组合鉴定所述疾病状态。所述数据集可以包括通过多种方法,诸如通过使用颗粒和参考生物分子获得的生物分子测量结果。

Description

增强的对生物分子的检测和定量
交叉引用
本申请要求2021年9月13日提交的美国临时申请号63/243,645的优先权,其内容以其整体并入本文。
背景技术
需要诸如在疾病或病况的早期阶段准确检测疾病或病况的方法。准确检测疾病或病况可以在对象的有效治疗和改善的预后中使用。
发明内容
在一些方面,本文公开了方法,其包括:使对象的生物样品与颗粒接触,从而将生物样品的内源性生物分子吸附至颗粒;以及将生物样品或吸附的内源性生物分子与生物分子的内标组合。内标可以包括标记。一些方面包括测量内源性生物分子和内标以获得内源性生物分子测量结果和内标测量结果。一些方面包括基于内标测量结果鉴定内源性生物分子的浓度。一些方面包括基于内标测量结果的测量结果确定内源性生物分子测量结果的质量控制方面。在一些方面,生物样品包括生物样品组,测量内源性生物分子包括测量生物样品组的内源生物分子,并且质量控制方面与生物样品组的内源性生物分子有关。在一些方面,质量控制方面包括质量准确度、定量精度、定量准确度、与标准样品的相关性、色谱性能、冠形成质量、消化质量或污染物生物分子测量结果。在一些方面,测量结果通过质谱仪获得。一些方面包括基于内标测量结果或基于质量控制方面执行对质谱仪的实时控制。在一些方面,执行对质谱仪的实时控制包括:调整内电压以提供特异性的变化;调整样品体积;调整技术条件以提高测量质量;暂停或停止数据收集;重新安排测量;或通知用户质量控制问题。一些方面包括基于内标测量结果归一化或调整内源性生物分子测量结果。在一些方面,内源性生物分子测量结果包括生物样品中内源性生物分子的量。一些方面包括相对于生物样品中内源性生物分子的量确定吸附至颗粒的内源性生物分子的量。一些方面包括基于内标测量结果鉴定内源性生物分子测量结果的变异性来源。一些方面包括使用内标测量结果来鉴定或获得另外的内源性生物分子测量结果。一些方面包括基于内源性生物分子测量结果鉴定对象的生物状态。一些方面包括输出或传输包括关于鉴定的生物状态的信息的报告。一些方面包括基于鉴定的生物状态传输或输出对对象的治疗的建议。在一些方面,怀疑对象具有生物状态。在一些方面,生物状态包括疾病状态。在一些方面,疾病状态包括癌症。在一些方面,癌症包括1期或2期癌症。在一些方面,癌症包括肺癌。在一些方面,肺癌包括非小细胞肺癌。在一些方面,生物分子包括蛋白质、脂质、代谢物、糖或核酸。在一些方面,生物分子包括蛋白质。在一些方面,内标包括同位素标记、质量标签、条形码、翻译后修饰或来自与对象的物种不同物种的生物分子。在一些方面,颗粒包括纳米颗粒。在一些方面,颗粒包括金属、聚合物或脂质。在一些方面,颗粒包括物理化学上不同的颗粒组。在一些方面,第一生物样品或第二生物样品包含生物流体。在一些方面,生物流体包括血液、血清或血浆。在一些方面,对象是动物。在一些方面,对象是脊椎动物。在一些方面,对象是哺乳动物。在一些方面,对象是人。
在一些方面,本文公开了分类方法,其包括:获得第一数据集,第一数据集包括来自对象的第一生物样品的吸附至颗粒的生物分子的第一测量结果;获得第二数据集,第二数据集包括第一生物样品或对象的第二生物样品的生物分子的第二测量结果,其中第二测量结果包括基于标记的参考生物分子与第一生物样品的组合或其与第二生物样品的组合的测量结果归一化或调整的个别内源性生物分子的测量结果;应用第一分类器以将对应于生物状态的第一标记分配给第一数据集;应用第二分类器以将对应于生物状态的第二标记分配给第二数据集;以及将第一标记和第二标记组合以获得对应于生物状态的组合标记。在一些方面,本文公开了方法,其包括:获得来自对象的生物样品的吸附至颗粒的内源性生物分子的测量结果;获得标记的参考生物分子与生物样品的组合或其与吸附至颗粒的内源性生物分子的组合的测量结果,其中标记的参考生物分子与内源性生物分子相同,但还包含标记;以及基于标记的参考生物分子的测量结果归一化或调整内源性生物分子的测量结果。一些方面包括将分类器应用于归一化或调整的测量结果以将对应于生物状态的标记分配给归一化或调整的测量结果。在一些方面,本文公开了方法,其包括:使对象的生物样品与颗粒接触,从而将生物样品的内源性生物分子吸附至颗粒;以及将生物样品或吸附的内源性生物分子与标记的参考生物分子组合,其中标记的参考生物分子与内源性生物分子相同,但还包含标记。一些方面包括测量内源性生物分子和标记的参考生物分子。一些方面包括获得第一数据集,第一数据集包括来自对象的第一生物样品的吸附至颗粒的生物分子的第一测量结果。一些方面包括获得第二数据集,第二数据集包括第一样品或对象的第二生物样品的生物分子的第二测量结果。在一些方面,将标记的参考生物分子与第一样品或第二样品组合,与生物分子一起测量,并且用于获得第二测量结果。一些方面包括使用第一分类器以将对应于疾病状态或生物状态存在、不存在或可能性的第一标记分配给第一数据集。一些方面包括使用第二分类器以将对应于疾病状态或生物状态存在、不存在或可能性的第二标记分配给第二数据集。一些方面包括基于第一标记和第二标记的组合将数据集鉴定为指示或不指示疾病状态或生物状态。在一些方面,生物分子包括蛋白质、脂质、代谢物、糖或核酸。在一些方面,生物分子包括蛋白质。在一些方面,第一测量结果或第二测量结果包括至少约500个生物分子的测量结果。在一些方面,第一测量结果或第二测量结果使用质谱法、色谱法、侧流测定、免疫测定或其组合来获得。在一些方面,第一测量结果或第二测量结果使用质谱法获得。在一些方面,第一测量结果或第二测量结果通过测量指示生物分子存在、不存在或量的读出来获得。在一些方面,该方法包括使第一样品与颗粒接触以将生物分子吸附至颗粒,以及测量吸附的生物分子。在一些方面,在获得第一测量结果之前将吸附的生物分子与颗粒分开。在一些方面,颗粒包括纳米颗粒。在一些方面,颗粒包括金属、聚合物或脂质。在一些方面,颗粒包括物理化学上不同的颗粒组。在一些方面,该方法包括:将第一样品或第二样品与参考生物分子组合;测量参考生物分子与生物分子;以及使用参考生物分子获得第二测量结果。在一些方面,参考生物分子是同位素标记的。在一些方面,将参考生物分子以预定量与第一样品或第二样品组合。在一些方面,使用参考生物分子鉴定生物分子的质谱,并且从生物分子的质谱获得第二测量结果。在一些方面,使用参考生物分子归一化或调整生物分子的测量结果,以获得第二测量结果。在一些方面,第二测量结果从第一样品获得。在一些方面,将参考生物分子与第一样品组合,并且在使第一样品与颗粒接触以将生物分子吸附至颗粒并且获得第一测量结果之后获得第二测量结果。在一些方面,将参考生物分子与第一样品组合,并且在使第一样品与颗粒接触以将生物分子吸附至颗粒并且获得第一测量结果之前获得第二测量结果。在一些方面,第二测量结果在第一样品的等分试样或非等分试样(aliquant)中与第一测量结果分别获得。在一些方面,第二测量结果从第二样品获得。一些方面包括使生物分子与亲和试剂接触以富集生物分子。在一些方面,亲和试剂包括抗体。在一些方面,第一标记和第二标记包括疾病状态的可能性。一些方面包括对可能性求平均。在一些方面,将数据集鉴定为指示或不指示疾病状态包括基于第一标记和第二标记生成多数投票分数。一些方面包括将数据集鉴定为指示或不指示疾病状态,其包括生成第一标记和第二标记的加权平均数。一些方面包括将权重分配给第一分类器和第二分类器,从而获得加权平均数。在一些方面,权重基于ROC曲线下的面积、精度-召回率曲线下的面积、准确度、精度、召回率、灵敏度、F1分数、特异性或其组合来分配。在一些方面,第一分类器和第二分类器关于疾病状态彼此独立地出错。在一些方面,第一标记和第二标记的组合将数据集鉴定为指示或不指示疾病状态,其准确度大于单独第一标记或第二标记。一些方面包括输出或传输包括关于鉴定的信息的报告。一些方面包括基于疾病状态传输或输出对对象的治疗的建议。一些方面包括当将数据集鉴定为指示疾病状态时向对象提供针对疾病状态的治疗。一些方面包括当将数据集鉴定为不指示疾病状态时在不提供治疗的情况下观察对象。一些方面包括获得第三数据集,第三数据集包括与第一测量结果和第二测量结果的生物分子类型不同的生物分子的测量结果。一些方面包括使用第三分类器以将对应于疾病状态存在、不存在或可能性的第三标记分配给第三数据集。在一些方面,该方法包括基于第一标记和第二标记的组合将第一数据集、第二数据集和第三数据集鉴定为指示或不指示疾病状态。在一些方面,疾病状态包括癌症。在一些方面,癌症包括1期或2期癌症。在一些方面,癌症包括肺癌。在一些方面,肺癌包括非小细胞肺癌。在一些方面,样品包含生物流体。在一些方面,生物流体包括血液、血清或血浆。在一些方面,对象是动物。在一些方面,对象是脊椎动物。在一些方面,对象是哺乳动物。在一些方面,对象是人。
附图说明
图1是描绘本文公开的方法的实例的流程图。
图2是数据处理的实例的图。
图3A包括根据本文描述的一些方面,描绘接受者操作特征曲线(ROC)的图。
图3B包括根据本文描述的一些方面,描绘接受者操作特征曲线(ROC)的图。
图4显示计算设备的非限制性实例,计算设备可以包括处理器、存储器、存储装置或网络接口。
图5A示出内源性生物分子和生物分子的标记型式的质谱法测量结果的实例。
图5B示出质谱法数据的实例,质谱法数据在不使用参考生物分子的情况下可能无法鉴定某些生物分子。
图5C示出在内源性生物分子吸附至颗粒后,将参考生物分子与内源性生物分子组合时获得的质谱法数据的实例。
图5D示出在内源性生物分子和参考生物分子吸附至颗粒前,将参考生物分子与内源性生物分子组合时获得的质谱法数据的实例。
图6示出在纳米颗粒富集之后使用PiQ内标(IS)法的蛋白质鉴定的非限制性实例。
图7示出在纳米颗粒富集之后使用PiQ IS法的蛋白质鉴定和变异系数(CV)信息的非限制性实例。
图8A示出通过PiQ IS法鉴定凝血因子IX的非限制性实例,其在五种不同的颗粒上鉴定。
图8B示出通过PiQ IS法鉴定组织蛋白酶S的非限制性实例,其在五种不同的颗粒上鉴定。
图8C示出低丰度组织蛋白酶S的信号增强的非限制性实例(如图8B所示),其允许用户获得高度准确且精确的定量信息。
图9A是示出使用同位素标记的重内标鉴定的蛋白质的实例的曲线图,该蛋白质无法通过在没有内标的情况下的发现质谱法实验鉴定出。
图9B是示出使用同位素标记的重内标或通过在没有内标的情况下的发现质谱法实验未鉴定出的蛋白质的实例的曲线图,并且其中使用内标的峰的存在来确认样品中不存在蛋白质。
具体实施方式
a.介绍
本文提供的公开描述了用于改进的对生物样品中生物分子的检测和定量的方法、系统和组合物。尽管取得了在生物分子的测量方面的进步,但样品的错误分类仍然存在,并且需要更先进的方法。组合单独的各组给定类型的生物分子的测量结果可能导致信噪比降低,并且总体提高数据质量。将标记的内标生物分子加标至样品中改进了内源性生物分子的鉴定和测量。在测定生物分子中使用颗粒还改进了生物分子测量,例如,当高丰度生物分子正常地干扰低丰度生物分子的准确测量时低丰度生物分子的测量。使用标记的内标获得的测量结果和使用可以确定水平的颗粒获得的测量结果的组合使用改进了生物样品的分类(例如,关于生物状态)。
目前没有可用的方法来确定:(1)将生物分子吸附至纳米颗粒时,在生物分子的纳米颗粒富集之前样品质量(例如,μg)和质量(quality)的变异性;(2)在纳米颗粒富集后,总样品和个别生物分子的回收率的直接测量结果;(3)在纳米颗粒富集之后检测的生物分子的验证;(4)对改进测量结果内的数据质量的数据驱动的实时决定;(5)基于生物差异(例如,PTM、SNP或定量)的检测收集另外的数据的数据驱动的决定,或5)通过定量数据与定量值和分类器的数据库的比较而对健康状态的评估。本公开通过在用纳米颗粒富集生物分子之前或之后将内部对照掺入样品中解决了这一需要。例如,本公开的方法可以包括:将已知浓度的内标添加至生物样品和对照样品中,以便定量已知的肽/蛋白质;利用内标来确定样品质量;或者利用定量肽/蛋白质浓度的差异以实时或通过连续的数据收集来收集单个样品的另外的生物数据。
本公开包括用于从生物样品发现蛋白质组和多组生物标志物的方法,其可以包括用纳米颗粒询问生物样品(例如,血浆),然后用专门设计成检测并定量可能在生物样品中的各种蛋白质的特定肽的水平的试剂集重新询问同一生物样品。因此,该方法可以包括对同一生物样品的互补蛋白质组取样。这种方法以肺癌样品执行,并且当使用两种类型的蛋白质组取样时相比于仅使用单独一种获得改进的分类。此外,当还包括来自其他分析物(诸如脂质组学)的数据时,与单独的蛋白质组样品之一加上其他分析物相比,组合分类方法得到了改进。该方法可以包括使用专门的试剂来测量吸附至纳米颗粒的一些蛋白质。这样可以改进吸附至纳米颗粒的蛋白质的检测、定量和测量结果的再现性。
本文公开的方法的有用方面可以包括:能够消除用颗粒或纳米颗粒处理后检测到哪些分子的不确定性;改进用纳米颗粒处理的生物分子的定量测量结果(例如,精度或准确度);增加用纳米颗粒处理后测量的独特的生物分子的数目;对纳米颗粒富集生物分子的质量(例如,再现性或回收率)的评估改进;或者能够提供单个样品中另外的生物信息随多种多样的、独特的定量肽/蛋白质测量结果变化的实时检测。
本公开包括用于确定疾病状态存在或不存在的非侵入性方法。鉴定处于早期的对象的疾病状态可以在提供治疗时预防疾病的进一步发展。描述的方法可以非侵入性地使用,并且从而可以用于排除疾病状态的存在,并且使对象免于进行活检。
因此,本文描述的方法包括从对象的一个或多个生物样品生成多个数据集。数据集可以包括不同类型的生物分子的测量结果(例如,不同的组学数据集)或同一类型的生物分子的不同测量结果。例如,一个数据集可以包括使用颗粒或纳米颗粒的蛋白质或另一生物分子类型的测量结果,并且第二数据集可以包括在样品中包含参考生物分子时生成的同一类型的生物分子(例如,蛋白质)的测量结果。参考生物分子可以包括内标生物分子,并且可以是被标记的。然后可以使用一个或多个分类器来使用数据集确定疾病状态存在。
非侵入性获得的样品可以用于通过从一个或多个样品生成多个数据集来进行疾病分类,并且可以通过将多个数据集组合来提高疾病鉴定或预测的准确度。本文描述的方法可以用于改进的蛋白质组数据、代谢组数据或脂质组数据的测量,以及改进的样品分类。样品分类可以以生物医学报告的形式提供。生物医学报告可以提供从其获得样品的对象是否患有癌症或其他疾病的指示。
图1示出数据分类的非限制性实例。该方法可以用于基于测定和分析从对象获得的生物样品来预测对象是否患有疾病或处于发展疾病的风险中。该方法可以包括从对象收集一个或多个生物样品(101)。样品可以用于获得生物分子测量结果。一个生物分子测量结果集可以通过使用颗粒来获得(102),并且另一生物分子测量结果集可以通过使用参考生物分子来获得(103)。102和103可以对同一生物样品依序执行,或者可以用单独的生物样品单独执行。可以在将生物分子吸附至颗粒之前或之后将参考生物分子添加至生物样品中,或者可以将参考生物分子添加至对象的单独的生物样品中。测量结果可以用于生成数据集(104)。数据集中可以包括另外类型的生物分子测量结果。例如,102和103可以用于生成蛋白质组数据,并且另外的数据集可以包括转录组数据、基因组数据、代谢组数据或脂质组数据。该方法可以包括接收测量结果或数据集。然后通过应用一个或多个分类器来分析数据集,以将数据鉴定为指示对象或样品的疾病状态存在、不存在或可能性(105)。可以将数据组合,并且一个分类器可以对数据进行分类,或者可以使用多个分类器来分别地对每个数据集进行分类,之后对分类器的输出进行整合。
该方法可以包括将肽或蛋白质内标集添加至利用纳米颗粒处理的样品中。肽或蛋白质可以是蛋白质或在其他方面与样品同源的蛋白质变体(proteoform)的子集。肽或蛋白质集可以包括外源性蛋白质和肽。下面关于参考生物分子的使用进一步描述了这种肽或蛋白质集的使用。在一些方面,肽或蛋白质内标可以是重标记的(例如,用同位素标记)。在一些方面,肽或蛋白质内标可以是具有至少一个标签(例如,用于条形码化或用于质谱法)的蛋白质或肽。在一些方面,肽或蛋白质内标可以是具有至少一个标签的蛋白质或肽,其中至少一个标签包括翻译后修饰(PTM)、化学修饰、条形码或其组合。在一些方面,肽或蛋白质内标来自非人物种。在一些方面,肽或蛋白质内标可以确立样品中个别肽和蛋白质的浓度。在一些方面,可以将肽或蛋白质内标以预定或已知浓度添加至利用纳米颗粒处理的所有样品或样品子集中,用于计算每种内源性蛋白质的浓度。在一些方面,可以在通过纳米颗粒处理样品之前或之后添加所有内标或内标子集,以用于确定多种质量控制量度:质量准确度;定量精度;定量准确度;与已知标准样品或标准物的相关性(即,皮尔逊相关性(Pearsoncorrelation)、戴明回归(Demming regression)等);色谱性能(即,保留时间、峰宽、FWHM、峰不对称性、峰容量等);冠形成质量;消化质量(即,漏切(missed cleavage)、氧化率等);或蛋白质组样品制备工作流程中经常遇到的已知“污染物”蛋白质的测量和控制。图5A-5D示出使用本文描述的内标的各种测量结果。
在一些方面,该方法包括重新安排个别样品和对照样品以在仪器调整(即,电压等)或仪器维护(即,清洁)之后收集另外的数据。另外的数据收集可以是另外的定量数据、生物数据或技术数据(即,片段化能量的调整)。在一些方面,该方法包括通过各种手段自动将通知消息直接发送给用户,作为接近或超过任何QC性能阈值限制的警告。在一些方面,该方法包括通过使用内标的任一测量定量值对2个或更多个样品进行归一化。在一些方面,该方法包括在通过纳米颗粒进行处理之前向每个样品中添加内标。在一些方面,该方法包括将内标添加至对照样品(技术样品或生物样品)中以提供已知的参考值。可以使用多种技术(即,中值、LOESS等)对随纳米颗粒的处理和/或质谱法的测量结果变化的响应差异进行归一化。
在一些方面,该方法包括确定每种蛋白质的回收率,以便了解每个纳米颗粒上随冠形成或PPI变化的蛋白质损失以及纳米颗粒处理后可用的个别蛋白质浓度,从而实现定量准确度增加。在一些方面,该方法包括确立个别患者样品中蛋白质和蛋白质变体的生物浓度。如果蛋白质被检测到,或者被检测到高于所需阈值,则可以指挥质谱仪收集关于同一肽/蛋白质的预测PTM和基因修饰型式的另外的MS/MS数据。给定蛋白质的所有独特的肽的浓度可以相对于参考浓度(即,对照样品)以相同方向上调或下调。当检测到不一致的肽时,则可以实时控制仪器以收集关于肽的基因修饰型式的数据(在数据库中预先计算)。不一致的肽可能归因于基因修饰(即,SNP)或PTM(例如,糖基化或磷酸化)。收集的另外的数据可以基于预测质量、保留时间、CCS、肯德里克质量亏损(Kendrick Mass Defect)和对所需肽进行测序所需的预测能量(例如,片段化模式和能量)的数据库。片段化的模式和能量可以基于试图检测的预测修饰来确定(即,糖基化蛋白质的EAD/ETD相对于SNP修饰肽的CID)。
在一些方面,该方法包括基于在个别样品中利用内标对具有和不具有基因修饰的独特的肽/蛋白质进行的确认的检测而对个别基因指纹进行的数据驱动的检测。对于每个确认的蛋白质检测,可以控制质谱仪来收集使用内标检测到的个别肽/蛋白质或肽/蛋白质组套(panel)的预测基因修饰肽序列的数据。
在一些方面,该方法包括对个体对于给定疗法的应答进行数据驱动的检测。在一些方面,该方法包括使用内标和纳米颗粒对独特的肽/蛋白质集进行的确认的检测,该独特的肽/蛋白质集与针对已知或确定的健康状态(例如,NSCLC)的特定治疗的应答/无应答相关联。在一些方面,该方法包括通过定量肽和蛋白质测量结果、与已知的肽和蛋白质浓度模式的比较以及评估来确定一种或多种健康状态。健康状态调用可以基于单个样品中多种肽/蛋白质的浓度。
在一些方面,以下的组合允许检测以低丰度存在于生物样品中的生物分子:通过利用纳米颗粒富集生物分子;以及使用内标。在一些方面,可以在使生物样品与纳米颗粒接触(例如,用于通过纳米颗粒富集并吸附生物分子)之前将重标记的内标添加至生物样品中。在一些方面,可以在使生物样品与纳米颗粒接触(例如,用于通过纳米颗粒富集和吸附生物分子)之后将重标记的内标添加至生物样品中。
该方法可以包括添加经同位素标记的生物分子以促进目标生物分子测量,从而提高所测量的纳米颗粒富集的样品的深度。该方法可以包括涉及在处理过程的各种步骤添加的多个QC分子的实时或分析后数据质量评估的质量控制(QC)流水线。该方法可以包括通过纳米颗粒富集进行的样品处理的QC程序。蛋白质对照可以在样品处理之前添加,并且可以包括非人蛋白质、同位素标记的蛋白质或合成的非天然蛋白质(自然界中不存在的蛋白质)。同位素标记的蛋白质可以包括未修饰的蛋白质、翻译后修饰的蛋白质或其他修饰的蛋白质。可以包括处理后对照,诸如合成肽。合成肽可以包括未修饰的蛋白质、翻译后修饰的蛋白质、其他修饰的蛋白质或质量报告因子(mass reporter)修饰的蛋白质。
该方法可以包括定量生物样品中至少第一肽或第一肽和第二肽的量。该方法可以包括使样品与吸附第一肽的颗粒接触。该方法可以包括使样品与已知数量的所述第一肽的标记型式接触。该方法可以包括使样品与吸附所述第二肽的第二颗粒接触。第二颗粒可以与第一颗粒不同。该方法可以包括使样品与已知数量的所述第二肽的标记型式接触。该方法可以包括将吸附至所述第一颗粒或所述第二颗粒的肽与未吸附的肽分开。该方法可以包括从所述第一颗粒或第二颗粒洗脱吸附至所述第一颗粒或第二颗粒的所述肽。该方法可以包括使用质谱仪测量从所述第一颗粒洗脱的所述第一肽的量。该方法可以包括使用质谱仪测量从所述第一颗粒洗脱的所述第一肽的所述标记型式的量。该方法可以包括计算生物样品中第一肽的量。该方法可以包括使用质谱仪测量从所述第二颗粒洗脱的所述第二肽的量。该方法可以包括使用质谱仪测量从所述第二颗粒洗脱的第二肽的标记型式的量。该方法可以包括计算生物样品中第二肽的量。生物样品可以包括体液样品的蛋白水解消化液。
本文描述的一些方法的令人惊讶的方面是工作流程中引入或使用的质量控制(QC)标准物中的每一个在所部署的QC平台内可以是多功能的。例如,在任何处理之前添加至生物样品中的全长同位素重标记的QC蛋白质可以满足至少5+QC量度:(a)它可以确保适当的蛋白质消化;(b)它可以用于评估液相色谱(LC)条件/操作状态(例如,适当的梯度或混合);(c)它可以用于评估LC管道系统(plumbing)(例如,泄漏或堵塞);(d)它可以用于评估MS量度(例如,灵敏度或质量准确度);(e)它可以帮助仪器达到更高的灵敏度;或(f)它可以帮助数据分析平台中的最终数据归一化(例如,在数据采集之后)。本文描述的一些方法的另一令人惊讶的方面是QC流水线对于应用于多种处理方案的灵活性。该方法可以扩展并广泛应用,以用于来自许多不同处理程序的样品质量保证。
在没有本公开的情况下,可能难以实现与本公开类似的结果。为此,可能需要:创建在没有内标(内源或外源)的情况下监测测量结果质量的系统并做出决策;确定通过纳米颗粒富集检测到的每种蛋白质的独特的内标,购买或制造标准物,确定添加至每个样品中的每种内标的浓度;确定哪些蛋白质变体通常是纳米颗粒冠形成的一部分,以便知道要尝试收集关于哪些蛋白质变体(例如,具有特定PTM的蛋白质)的数据;确定哪些蛋白质不是纳米颗粒冠形成的一部分,并且开发针对这些蛋白质的替代测定;或者创建控制质谱仪并且实时或通过连续进样收集每个样品的额外的生物信息的算法、软件或数据库。
在一些方面,本文公开了方法,其包括:使对象的生物样品与颗粒接触,从而将生物样品的内源性生物分子吸附至颗粒;以及将生物样品或吸附的内源性生物分子与生物分子的内标组合。内标可以包括标记。一些方面包括测量内源性生物分子和内标以获得内源性生物分子测量结果和内标测量结果。一些方面包括基于内标测量结果鉴定内源性生物分子的浓度。
b.样品
数据集可以从一个或多个样品生成。样品可以是对象的样品。样品可以是生物样品。生物样品的实例包括血液、血清或血浆。生物样品的其他实例包括尿液、眼泪、精液、乳汁、阴道液、黏液、唾液或汗液。生物样品可以包括组织或细胞匀浆。
生物样品可以从对象获得。例如,可以通过抽血从对象获得血液、血清或血浆样品。获得生物样品的其他方式包括抽吸或擦拭。当使用多个样品时,可以同时(诸如在同一天或在同一小时期间)或在单独的时间(诸如在单独的天)从对象获得样品。
生物样品可以是无细胞的或基本上无细胞的。为了获得无细胞或基本上无细胞的生物样品,生物样品可以经历样品制备方法,诸如离心和沉淀去除。
可以使用或获得非生物流体样品。非生物流体样品可以从对象获得。例如,样品可以包括组织样品。样品可以被医生鉴定为处于高或低癌变风险中。样品可以包括细胞样品。样品可以包括细胞或组织匀浆。样品可以包括离心的细胞或组织匀浆的上清液。
生物样品可以在筛选程序的任何时期的期间或在对象的治疗期间从对象获得。例如,生物样品可以在对象是活检候选者的阶段之前或期间获得,以用于疾病的早期检测。或者可以在治疗方案期间获得生物样品,以评估治疗功效或监测对象。
数据可以从单个样品或多个样品生成。来自多个样品的数据可以从同一对象获得。在一些情况下,从以不同方式收集或被收集在单独的容器中的样品获得不同的数据类型。样品可以被收集在包含一种或多种试剂诸如保存试剂或生物分子分离试剂的容器中。试剂的一些实例包括肝素、乙二胺四乙酸(EDTA)、柠檬酸盐、抗裂解剂或试剂的组合。来自对象的样品可以被收集在包含不同试剂的多个容器中,诸如以用于保存或分离单独类型的生物分子。样品可以被收集在未在容器中包含任何试剂的容器中。样品可以在同一时间(例如,同一小时或同一天)或在不同时间被收集。样品可以被冷冻、冷藏、加热或保持在室温下。
c.数据生成
本文描述的方法可以包括生成、获得或使用数据集。数据集可以包括组学数据。组学数据可以包括关于样品中许多或所有某种类型的生物分子的信息或数据(诸如测量结果)。例如,数据集可以包括蛋白质、转录物、遗传物质、代谢物或脂质的测量结果,并且可以包括关于500个或更多个、750个或更多个、1000个或更多个、2500个或更多个、5000个或更多个、10,000个或更多个、25,000个或更多个某种类型的生物分子的数据。数据可以与给定生物分子存在、不存在或量有关。数据集可以包括测量结果。
本文公开的方法可以包括获得数据,诸如从收集自对象的一个或多个生物样品生成的数据集。数据可以包括生物分子测量结果,诸如蛋白质测量结果、转录物测量结果、遗传物质测量结果或代谢物测量结果。数据集可以包括以下中的任一个:蛋白质组数据、基因组数据、转录组数据或代谢组数据。本节包括生成这些类型的数据集中的每一个的一些方式。还可以生成其他类型的数据集。数据可以被标记或鉴定为指示疾病或不指示疾病。
i.颗粒的使用
例如在生成数据之前,可以使生物样品与颗粒接触。本文描述的数据可以使用颗粒生成。例如,方法可以包括使样品与颗粒接触,使得颗粒吸附生物分子。与通常难以通过直接对样品执行组学测量来准确测量相比,颗粒可以吸引不同的生物分子集。例如,占优势的生物分子可能占样品中某种类型的生物分子(例如,蛋白质、转录物、遗传物质、脂质或代谢物)的很大比例。通过在分析之前将生物分子吸附至颗粒,可以获得不包括占优势的生物分子的生物分子子集。以这种方式去除占优势的生物分子(例如,构成大部分生物样品的生物分子)可以增加生物分子测量结果的准确度和使用这些测量结果的分析的灵敏度。
颗粒可用于以下方法,该方法包括:使生物样品与颗粒接触,从而将生物样品的内源性生物分子吸附至颗粒;以及将生物样品或吸附的内源性生物分子与生物分子的参考生物分子(例如,内标)组合。
可以吸附至颗粒的生物分子的实例包括蛋白质、转录物、遗传物质或代谢物。吸附的生物分子可以在颗粒周围构成生物分子冠。可以在生成数据集中测量或鉴定吸附的代谢物。
颗粒可以由各种材料制成。此类材料可以包括金属、磁性颗粒、聚合物或脂质。颗粒可以由材料的组合制成。颗粒可以包含不同材料的层。不同的材料可以具有不同的特性。颗粒可以包括包含一种材料的核心,并且被另一种材料包覆。核心和包衣可以具有不同的特性。
颗粒可以包括金属。例如,颗粒可包括金、银、铜、镍、钴、钯、铂、铱、锇、铑、钌、铼、钒、铬、锰、铌、钼、钨、钽、铁或镉或其组合。
颗粒可以具有磁性(例如,铁磁性或亚铁磁性)。包含铁氧化物的颗粒可以具有磁性。颗粒可以包括超顺磁性铁氧化物纳米颗粒(SPION)。
颗粒可以包括聚合物。聚合物的实例包括聚乙烯、聚碳酸酯、聚酸酐、多羟基酸、聚富马酸丙酯、聚己内酯、聚酰胺、聚缩醛、聚醚、聚酯、聚(原酸酯)、聚氰基丙烯酸酯、聚乙烯醇、聚氨酯、聚磷腈、聚丙烯酸酯、聚甲基丙烯酸酯、聚氰基丙烯酸酯、聚脲、聚苯乙烯或多胺、聚亚烷基二醇(例如,聚乙二醇(PEG))、聚酯(例如,聚(丙交酯-共-乙交酯)(PLGA)、聚乳酸或聚己内酯)或两种或更多种聚合物的共聚物,诸如聚亚烷基二醇(例如,PEG)和聚酯(例如,PLGA)的共聚物。颗粒可以由聚合物的组合制成。
颗粒可以包括脂质。脂质的实例包括二油酰基磷脂酰甘油(DOPG)、二酰基磷脂酰胆碱、二酰基磷脂酰乙醇胺、神经酰胺、鞘磷脂、脑磷脂、胆固醇、脑苷脂和二酰基甘油、二油酰基磷脂酰胆碱(DOPC)、二肉豆蔻酰基磷脂酰胆碱(DMPC)和二油酰基磷脂酰基丝氨酸(DOPS)、磷脂酰甘油、心磷脂、二酰基磷脂酰丝氨酸、二酰基磷脂酸、N-十二烷酰基磷脂酰乙醇胺、N-琥珀酰基磷脂酰乙醇胺、N-戊二酰基磷脂酰乙醇胺、赖氨酰基磷脂酰甘油、棕榈酰基油酰基磷脂酰甘油(POPG)、卵磷脂、溶血卵磷脂、磷脂酰乙醇胺、溶血磷脂酰乙醇胺、二油酰基磷脂酰乙醇胺(DOPE)、二棕榈酰基磷脂酰乙醇胺(DPPE)、二肉豆蔻酰基磷酸乙醇胺(DMPE)、二硬脂酰基-磷脂酰-乙醇胺(DSPE)、棕榈酰基油酰基-磷脂酰乙醇胺(POPE)、棕榈酰基油酰基磷脂酰胆碱(POPC)、卵磷脂酰胆碱(EPC)、二硬脂酰基磷脂酰胆碱(DSPC)、二油酰基磷脂酰胆碱(DOPC)、二棕榈酰基磷脂酰胆碱(DPPC)、二油酰基磷脂酰甘油(DOPG)、二棕榈酰基磷脂酰甘油(DPPG)、棕榈酰基油酰基磷脂酰甘油(POPG)、16-O-单甲基PE、16-O-二甲基PE、18-1-反式PE、棕榈酰基油酰基-磷脂酰乙醇胺(POPE)、1-硬脂酰基-2-油酰基-磷脂酰乙醇胺(SOPE)、磷脂酰丝氨酸、磷脂酰肌醇、鞘磷脂、脑磷脂、心磷脂、磷脂酸、脑苷脂、磷酸二鲸蜡酯和胆固醇。颗粒可以由脂质的组合制成。
材料的其他实例包括二氧化硅、碳、羧酸盐、聚丙烯酸、碳水化合物、葡聚糖、聚苯乙烯、二甲胺、胺或硅烷。颗粒的一些实例包括羧酸盐SPION、苯酚-甲醛包覆的SPION、二氧化硅包覆的SPION、聚苯乙烯包覆的SPION、羧化聚(苯乙烯-共-甲基丙烯酸)、P(St-co-MAA)包覆的SPION、N-(3-三甲氧基甲硅烷基丙基)二亚乙基三胺包覆的SPION、聚(N-(3-(二甲基氨基)丙基)甲基丙烯酰胺)(PDMAPMA)包覆的SPION、1,2,4,5-苯四甲酸包覆的SPION、聚(乙烯基苯甲基三甲基氯化铵)(PVBTMAC)包覆的SPION、包覆过乙酸的羧酸盐、聚(寡(乙二醇)甲醚甲基丙烯酸酯)(POEGMA)包覆的SPION、聚苯乙烯羧基官能化的颗粒、羧酸颗粒、具有氨基表面的颗粒、二氧化硅氨基官能化的颗粒、具有Jeffamine表面的颗粒或二氧化硅硅烷醇包覆的颗粒。
纳米颗粒的一些实例包括以下:P-033(羧酸盐微颗粒,无表面活性剂)、P-039(聚苯乙烯羧基官能化)、P-047(二氧化硅)、P-053(氨基表面微颗粒,0.4-0.6μm)、P-065(二氧化硅)、P-073(基于葡聚糖的包衣,0.13μm)、S-003(二氧化硅包覆的SPION)、S-006(N-(3-三甲氧基甲硅烷基丙基)二亚乙基三胺包覆的SPION)、S-007(聚(N-(3-(二甲基氨基)丙基)甲基丙烯酰胺)(PDMAPMA)包覆的SPION)或S-010(羧酸盐、聚丙烯酸包覆的SPION)。
可以使用各种大小的颗粒。颗粒可以包括纳米颗粒。纳米颗粒的直径可以是约10nm至约1000nm。例如,纳米颗粒的直径可以是至少10nm、至少100nm、至少200nm、至少300nm、至少400nm、至少500nm、至少600nm、至少700nm、至少800nm、至少900nm、10nm至50nm、50nm至100nm、100nm至150nm、150nm至200nm、200nm至250nm、250nm至300nm、300nm至350nm、350nm至400nm、400nm至450nm、450nm至500nm、500nm至550nm、550nm至600nm、600nm至650nm、650nm至700nm、700nm至750nm、750nm至800nm、800nm至850nm、850nm至900nm、100nm至300nm、150nm至350nm、200nm至400nm、250nm至450nm、300nm至500nm、350nm至550nm、400nm至600nm、450nm至650nm、500nm至700nm、550nm至750nm、600nm至800nm、650nm至850nm、700nm至900nm或10nm至900nm。纳米颗粒的直径可以小于1000nm。一些实例包括约50nm、约130nm、约150nm、400-600nm或100-390nm的直径。
颗粒可以包括微颗粒。微颗粒可以是直径为约1μm至约1000μm的颗粒。例如,微颗粒的直径可以是至少1μm、至少10μm、至少100μm、至少200μm、至少300μm、至少400μm、至少500μm、至少600μm、至少700μm、至少800μm、至少900μm、10μm至50μm、50μm至100μm、100μm至150μm、150μm至200μm、200μm至250μm、250μm至300μm、300μm至350μm、350μm至400μm、400μm至450μm、450μm至500μm、500μm至550μm、550μm至600μm、600μm至650μm、650μm至700μm、700μm至750μm、750μm至800μm、800μm至850μm、850μm至900μm、100μm至300μm、150μm至350μm、200μm至400μm、250μm至450μm、300μm至500μm、350μm至550μm、400μm至600μm、450μm至650μm、500μm至700μm、550μm至750μm、600μm至800μm、650μm至850μm、700μm至900μm或10μm至900μm。微颗粒的直径可以小于1000μm。一些实例包括2.0-2.9μm的直径。
颗粒可以包括物理化学上不同的颗粒集,例如,2个或更多个物理化学上的颗粒集,其中1个颗粒集在物理化学上与另一颗粒集不同。物理化学特性的实例包括电荷(例如,正、负或中性)或疏水性(例如,疏水性或亲水性)。颗粒可以包括2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20个或更多个颗粒集,或者包括任何所述数目的颗粒集的范围的颗粒集。
可以使样品与颗粒和内标生物分子接触。纳米颗粒与内标的组合可以包括内标和样品一次与一个纳米颗粒的组合或其与同一样品中的多个纳米颗粒的组合。
ii.参考生物分子的使用
在一些方面,获得蛋白质组数据可以包括使用参考生物分子,参考生物分子可以被标记。参考生物分子可以包含内标。例如,可以将参考生物分子以预定量添加至生物样品中以充当内标并且帮助鉴定与样品内源的相似生物分子。例如,经同位素标记的参考蛋白可以加标至样品中,使用质谱法与内源性蛋白质一起测量,用于在质谱上鉴定内源性蛋白质,并且还用于帮助确定内源性蛋白质的准确量。内标可以包括以恒定或已知量添加至生物样品中的生物分子。内标可以包括内源性生物分子的非内源性标记型式。
参考生物分子可以用于以下方法,该方法包括:使生物样品与颗粒接触,从而将生物样品的内源性生物分子吸附至颗粒;以及将生物样品或吸附的内源性生物分子与生物分子的参考生物分子(例如,内标)组合。
参考生物分子可以包括同位素标记、质量标签、条形码、翻译后修饰(PTM)或来自与对象的物种不同物种的生物分子。参考生物分子可以包括标记。标记可以是同位素标记。参考生物分子可以包括质量标签。参考生物分子可以包括条形码。参考生物分子可以包括PTM。参考生物分子可以包括来自与对象物种不同物种的生物分子。参考生物分子可以包括多种标记,诸如同位素标记、质量标签、条形码、PTM或来自与对象物种不同物种的生物分子。
在标记的生物分子和内源性生物分子中,个别标记的生物分子可以对应于个别内源性生物分子。例如,生物分子可以包括蛋白质,并且内源性蛋白质可以包括100-1500个不同的蛋白质,并且标记生物分子可以包括相同的100-1500个蛋白质,但每个标记生物分子可以包含标记。
参考生物分子可以包括至少5个、至少10个、至少50个、至少100个、至少250个、至少500个、至少750个、至少1000个、至少1500个、至少2000个、至少2500个、至少5000个、至少7500个、至少10,000个、至少15,000个、至少20,000个或至少25,000个个别或不同的生物分子。在一些情况下,参考生物分子包括少于5个、少于10个、少于50个、少于100个、少于250个、少于500个、少于750个、少于1000个、少于1500个、少于2000个、少于2500个、少于5000个、少于7500个、少于10,000个、少于15,000个、少于20,000个或少于25,000个个别或不同的生物分子。
作为实例,样品包含内源性蛋白质A、内源性蛋白质B和内源性蛋白质C。内源性蛋白质A、内源性蛋白质B和内源性蛋白质C由于丰度低而难以测量。将预定量的蛋白质A、蛋白质B和蛋白质C的经同位素标记的型式加标至样品中后,使用质谱法一起分析内源性蛋白质A、内源性蛋白质B和内源性蛋白质C以及蛋白质A、蛋白质B和蛋白质C的经同位素标记的型式。因为经同位素标记的型式较重,所以它们的质谱发生偏移,并且可以与内源性蛋白质的质谱区分开。经同位素标记的型式在质谱法读出上更容易鉴定,从而有利于在质谱法读出上鉴定内源性蛋白质A、内源性蛋白质B和内源性蛋白质C的质谱。因为将预定量的经同位素标记的蛋白质A、经同位素标记的蛋白质B和经同位素标记的蛋白质C添加至加标至样品中,所以它们的浓度是已知的,并且经同位素标记的蛋白质A、经同位素标记的蛋白质B和经同位素标记的蛋白质C的质谱可以用于从质谱法读出准确地测量内源性蛋白质A、内源性蛋白质B和内源性蛋白质C的量。内源性蛋白质A、内源性蛋白质B和内源性蛋白质C的准确测量结果可以通过相对于已知浓度或量的经同位素标记的蛋白质A、经同位素标记的蛋白质B和经同位素标记的蛋白质C的质谱法读出的强度比较内源性蛋白质A、内源性蛋白质B和内源性蛋白质C的质谱法读出的相对强度来获得。
参考生物分子可以包括参考蛋白、参考转录物、参考核酸、参考代谢物或参考脂质。参考生物分子可以是被标记的。标记可以包括同位素标记或荧光标记。参考生物分子可以是被标记(例如,用标签)的或未被标记但具有已知特性。例如,参考生物分子可以是摩尔比和质量已知的多种多肽,其可以得到参考测量结果(例如,用作质谱法测量结果中的内标)。
可以将参考生物分子添加至生物样品中以便生成本文描述的测量结果。该方法可以包括:将第一样品或第二样品与参考生物分子组合;测量参考生物分子与生物分子;以及使用参考生物分子获得第二测量结果。参考生物分子可以通过质谱法或本文描述的用于测量生物分子的另一方法来检测。在一些方面,在使生物样品与一个或多个颗粒接触之前或之后将参考生物分子添加至生物样品中。
为了进一步帮助鉴定和测量内源性生物分子,可以使用亲和试剂诸如抗体来富集(例如,免疫沉淀)内源性生物分子。富集可以在用参考生物分子加标样品之前执行,并且可以包括:将生物分子黏附至亲和试剂;离心或浓缩黏附至生物分子的亲和试剂;去除或分离过量的样品或不从黏附至生物分子的亲和试剂测量的其他生物分子;以及从亲和试剂洗脱出生物分子。以这种方式使用亲和试剂可以用于富集特定类型的生物分子或途径。例如,具有特定翻译后修饰(PTM)的蛋白质或特定分子途径的蛋白质可以通过使用对该翻译后修饰或分子途径具有特异性的一种或多种亲和试剂来富集。
一种方法可以包括:获得第一数据集,第一数据集包括来自对象的第一生物样品的吸附至颗粒的生物分子的第一测量结果;以及获得第二数据集,第二数据集包括第一生物样品或对象的第二生物样品的生物分子的第二测量结果。第二测量结果可以包括基于标记的参考生物分子与第一生物样品的组合或其与第二生物样品的组合的测量结果归一化或调整的内源性生物分子的测量结果。标记的参考生物分子与内源性生物分子相同,但各自包含标记。一种方法可以包括:应用第一分类器以将对应于生物状态的第一标记分配给第一数据集;应用第二分类器以将对应于生物状态的第二标记分配给第二数据集;以及将第一标记和第二标记组合以获得对应于生物状态的组合标记。
一种方法可以包括:获得来自对象的生物样品的吸附至颗粒(例如,纳米颗粒)的内源性生物分子的测量结果;以及获得标记的参考生物分子与生物样品的组合或其与吸附至颗粒的内源性生物分子的组合的测量结果。标记的参考生物分子可以与内源性生物分子相同,但还包含标记。一种方法可以包括基于标记的参考生物分子的测量结果归一化或调整内源性生物分子的测量结果。一种方法可以包括将分类器应用于归一化或调整的测量结果以将对应于生物状态的标记分配给归一化或调整的测量结果。
一种方法可以包括使对象的生物样品与颗粒接触,从而将生物样品的内源性生物分子吸附至颗粒。一种方法可以包括将生物样品或吸附的内源性生物分子与生物分子的内标(其可以包含标记)组合。一种方法可以包括将生物样品与生物分子的内标(其可以包含标记)组合。一种方法可以包括将吸附的内源性生物分子与包含标记的生物分子的内标组合。一种方法可以包括测量内源性生物分子和内标以获得内源性生物分子测量结果和内标测量结果。
一些方面包括基于内标测量结果的测量结果确定内源性生物分子测量结果的质量控制方面。在一些方面,生物样品包括生物样品组,测量内源性生物分子包括测量生物样品组的内源生物分子,并且质量控制方面与生物样品组的内源性生物分子有关。在一些方面,质量控制方面包括质量准确度、定量精度、定量准确度、与标准样品的相关性、色谱性能、冠形成质量、消化质量或污染物生物分子测量结果。质量控制方面可以包括质量准确度。质量控制方面可以包括定量精度。质量控制方面可以包括定量准确度。质量控制方面可以包括与标准样品的相关性。质量控制方面可以包括色谱性能。质量控制方面可以包括冠形成质量。质量控制方面可以包括消化质量。质量控制方面可以包括污染物生物分子测量结果。
在一些方面,测量结果通过质谱仪获得。一些方面包括基于内标测量结果或基于质量控制方面执行对质谱仪的实时控制。在一些方面,执行对质谱仪的实时控制包括:调整内电压以提供特异性的变化;调整样品体积;调整技术条件以提高测量质量;暂停或停止数据收集;重新安排测量;或通知用户质量控制问题。执行对质谱仪的实时控制可以包括调整内电压。内电压调整可以改变特异性。执行对质谱仪的实时控制可以包括调整样品体积。执行对质谱仪的实时控制可以包括调整技术条件。调整技术条件可以提高测量结果质量。执行对质谱仪的实时控制可以包括暂停数据收集。执行对质谱仪的实时控制可以包括停止数据收集。执行对质谱仪的实时控制可以包括安排测量。执行对质谱仪的实时控制可以包括重新安排测量。执行对质谱仪的实时控制可以包括通知用户质量控制问题。
一些方面包括基于内标测量结果归一化或调整内源性生物分子测量结果。一些方面包括基于内标测量结果来归一化内源性生物分子测量结果。一些方面包括基于内标测量结果来调整内源性生物分子测量结果。在一些方面,内源性生物分子测量结果包括生物样品中内源性生物分子的量。一些方面包括相对于生物样品中内源性生物分子的量确定吸附至颗粒的内源性生物分子的量。一些方面包括基于内标测量结果鉴定内源性生物分子测量结果的变异性来源。一些方面包括使用内标测量结果来鉴定或获得另外的内源性生物分子测量结果。
在一些情况下,参考生物分子可用于恢复假阴性测量结果。例如,诸如肽的内源性生物分子可以存在于与诸如纳米颗粒的颗粒接触的样品中,并且在一些情况下,内源性生物分子通过使用参考生物分子被测量或鉴定。例如,内源性生物分子的质谱可以在鉴定参考生物分子并与参考生物分子的质谱比较时鉴定。然后可以测量内源性生物分子。在一些情况下,在不使用参考生物分子的情况下,无法测量或鉴定内源性生物分子。
在一些情况下,参考生物分子可用于确认真阴性测量结果。可能有助于恢复假阴性。例如,诸如肽的内源性生物分子可以不存在于与诸如纳米颗粒的颗粒接触的样品中,并且在一些情况下,内源性生物分子通过使用参考生物分子被错误地测量或鉴定。例如,质谱上与内源性生物分子无关联的峰可能被鉴定为与内源性生物分子相关联,并且这可以通过与参考生物分子的质谱进行比较来校正。然后,可以从数据集或测量结果中忽略内源性生物分子的假测量结果。在一些情况下,在不使用参考生物分子的情况下,可能会错误或不准确地测量或鉴定内源性生物分子。
在一些情况下,参考生物分子可用于恢复或确认假阳性测量结果或真阳性测量结果。
图5A-图5D示出了内标信号增强的情形。图5A示出了使用重内标生物分子的实例。图5A包括具有相同序列但由于在内标中引入重同位素而具有不同m/z比的肽的两个质谱峰。
图5B示出了仅用纳米颗粒富集得到的质谱法测量结果。某些内源性蛋白质鉴定可能由于丰度低或MS/MS谱质量低而在采集中被遗漏或从搜索结果中被舍弃。
图5C示出了将内标加标至含有纳米颗粒富集的生物分子的样品中的实例。在图5C的实例中,来自用纳米颗粒富集的低丰度蛋白质种类的信号在重标记的内标的帮助下选择性片段化。该方法允许对存在于纳米颗粒富集的样品中,但先前在没有内标的测量结果中遗漏的这些低丰度蛋白质进行高质量(例如,准确且精确)的定量。此过程还允许对LC和MS操作性能以及数据分析程序进行监测和质量控制(QC)。
另一情形示于图5D中,其示出了来自用纳米颗粒富集的低丰度蛋白质种类的信号,该信号在重标记的内标(例如,全长蛋白)的帮助下选择性片段化。全长重标记的蛋白质以及其低丰度非标记的内源性蛋白质可以通过纳米颗粒来富集。蛋白质(内标或IS和内源)可以通过LC-MS/MS进行消化和分析。重标记的内标可以帮助仪器增强内源性蛋白质的信号。这使得能够对存在于一些纳米颗粒富集的样品中,但先前在没有内标的测量结果中遗漏的这些低丰度蛋白质进行高质量(例如准确且精确)的定量。该过程还允许对消化效率、纳米颗粒富集效率、LC和MS操作性能以及数据分析程序进行监测和质量控制(QC)。
参考生物分子可以是或包括肽或蛋白质内标集。肽或蛋白质内标可以包括经同位素标记的蛋白质、经同位素标记的肽、具有另外的标签(例如,质量或条形码)的蛋白质、具有另外的标签(例如,翻译后修饰[PTM]、化学物质或条形码)的肽或来自非人物种的肽或蛋白质。
肽或蛋白质内标可以用于确立个别内源性肽和蛋白质的浓度。内标可以以预定且已知的浓度添加至利用纳米颗粒处理的所有样品或样品子集中,并且可以用于通过多种方法中的任一种来计算每种内源性蛋白质的浓度。
肽或蛋白质内标可以用于确立样品的测量结果质量。在通过纳米颗粒处理样品之前或之后添加至样品中的所有内标或内标子集可以用于确定多种质量控制量度。此类质量控制量度或测量结果质量指标的实例包括:质量准确度;定量精度;定量准确度;与已知标准样品或标准物的相关性(例如,皮尔逊相关性或戴明回归);色谱性能(例如,保留时间、峰宽、FWHM、峰不对称性或峰容量);冠形成质量;消化质量(例如,漏切或氧化率);或污染物(诸如,蛋白质组样品制备工作流程中经常遇到的污染物蛋白质)的测量或控制。肽或蛋白质内标可以类似地用于确立一组样品(例如,一批样品)的测量结果质量。
肽或蛋白质内标可以用于基于如本文所述评估的测量结果质量来实时控制质谱仪,以执行调整,暂停或停止数据收集,重新安排样品或数据收集,或提供自动通知。例如,可以实时使用肽或蛋白质内标来调整内电压以提供灵敏度的变化(例如,检测器增益)。可以实时使用肽或蛋白质内标来调整用于个别对象分析的样品体积。可以实时使用肽或蛋白质内标来调整技术条件,以提供优异的数据质量。一个实例是实时评价MS/MS谱,以确定是否需要另外的或减少的片段化能量来创建高于定义的阈值的MS/MS谱。如果仪器性能低于一个或若干定义的性能阈值,则可以实时使用肽或蛋白质内标来暂停或停止数据收集。可以实时使用肽或蛋白质内标来重新安排个别样品或对照样品以在仪器调整(例如,电压)或仪器维护(例如,清洁)之后收集另外的数据。另外的数据收集可以包括另外的定量数据、生物数据(例如,基于经由质谱仪的数据驱动的控制对预期或意外的生物变化的检测来收集另外的生物相关数据)或技术数据(例如,片段化能量的调整)。可以实时使用肽或蛋白质内标来自动将通知消息直接发送给用户,作为接近或超过质量控制(QC)性能阈值限制的警告。
对质谱仪的实时控制可以包括质谱法测量结果的实时控制。在通过质谱仪测量时,样品中的生物分子可以与内部对照生物分子混合,并且可能已被颗粒吸附或与其接触。使用质谱仪测量的生物分子可以包括样品中吸附至单一类型的颗粒的生物分子,或者可以包括样品中吸附至多种类型的颗粒的生物分子。多种类型的颗粒对生物分子的吸附可以包括使样品与多种类型的颗粒一起接触,或者可以包括使样品的等分试样单独地与每个等分试样的一种或多种颗粒类型接触,然后可以合并等分试样以便测量吸附的生物分子。样品中的生物分子可能已与颗粒和内标生物分子接触。纳米颗粒与内标的组合可以包括内标和样品一次与一个纳米颗粒的组合或其与同一样品中的多个纳米颗粒的组合。一些方面可以包括多次进样/多个样品/多个颗粒,并且可以在每次单独的进样的测量期间实时做出不同的决定。可以重复此类分析并且可以对所有纳米颗粒进行决策过程。在一些方面,将多个颗粒合并在一起,然后执行质谱法分析。
肽或蛋白质内标可以用于通过使用内标的任一测量定量值对2个或更多个样品进行的归一化。可以在通过纳米颗粒处理之前或之后将内标添加至每个样品中。可以将内标添加至对照样品(技术样品或生物样品)中以提供已知的参考值。可以使用多种技术(例如中值或局部回归诸如LOESS)来对随纳米颗粒的处理和/或质谱法的测量结果变化的响应差异进行归一化。
肽或蛋白质内标可以用于确立或确定利用纳米颗粒处理的每种蛋白质的回收率。确定每种蛋白质的回收率可用于提供对纳米颗粒上随冠形成或PPI变化的蛋白质损失和纳米颗粒处理之后可用的个别蛋白质浓度的理解。此信息可以用于驱动对内源性生物分子(诸如,吸附至纳米颗粒的内源性生物分子)进行更准确的定量。
肽或蛋白质内标可以用于确立或确定个别患者样品中的蛋白质和蛋白质变体的生物浓度。在通过纳米颗粒处理样品之前添加的内标可用于提供对内源性蛋白质质或蛋白质变体的样品浓度的测量。
肽或蛋白质内标可以用于通过纳米颗粒和质谱法确立或鉴定处理样品的变异性的来源。在处理样品后添加内标可以提供对与测量结果相关联的技术变异性的测量。在处理样品之前添加内标可以提供对整个样品处理过程的技术变异性的直接测量。
肽或蛋白质内标可以用于基于经由数据驱动的对质谱仪的控制对预期或意外生物变化的检测来收集另外的生物相关的数据(例如,蛋白质变体)。根据实时收集并分析的数据(例如,MS/MS、数据库搜索结果、定量或CCS值),可以控制质谱仪来生成另外的数据。当蛋白质被检测到,或者被检测到高于所需阈值时,可以指挥质谱仪收集关于同一肽/蛋白质的预测PTM或基因修饰型式的另外的MS/MS数据。
检测不一致的肽可能触发另外的数据生成。给定蛋白质的若干独特的肽的浓度可以相对于参考浓度(例如,对照样品浓度)以相同方向上调或下调。当检测到不一致的肽时,则可以实时控制仪器以收集肽的基因修饰型式的数据(例如,在数据库中预先计算)。不一致的肽可能归因于遗传修饰(例如,突变或单核苷酸多态性[SNP])或翻译后修饰(PTM;例如,糖基化或磷酸化)。收集的另外的数据可以基于预测质量、保留时间、CCS、肯德里克质量亏损或对所需肽进行测序所需的预测能量(例如,片段化模式和能量)的数据库。片段化的模式和能量可以基于试图检测的预测修饰来确定(例如,糖基化蛋白质的EAD/ETD相对于SNP修饰肽的CID)。
数据驱动的对个别遗传指纹的检测可以基于在个别样品中利用内标对具有和不具有基因修饰的独特的肽/蛋白质进行的确认的检测。对于确认的蛋白质检测,可以控制质谱仪来收集使用内标检测到的个别肽/蛋白质或肽/蛋白质组套的预测基因修饰肽序列的数据。数据驱动的对个别遗传指纹的检测可以基于已知或确定的表型状态。
可以确定数据驱动的对个体对给定疗法的应答的检测。可以使用内标和纳米颗粒来对独特的肽/蛋白质集确认或执行检测,该独特的肽/蛋白质集与针对已知或确定的健康状态(例如,NSCLC)的特定治疗的应答/无应答相关联。
肽或蛋白质内标可以用于通过定量肽和蛋白质测量结果、与已知的肽和蛋白质浓度模式的比较以及评估来确定一种或多种健康状态。
肽或蛋白质内标可以用于基于单个样品中多种肽/蛋白质的浓度的健康状态调用(例如,基于检测到的某些蛋白质(修饰或未修饰)浓度的CRC)。可以使用签名/分类器的数据库。
iii.蛋白质组数据
数据集可以包括蛋白质组数据或蛋白质数据(诸如,蛋白质测量结果)。蛋白质组数据可以涉及关于蛋白质、肽或蛋白质变体的数据。此数据可以包括只有肽或蛋白质或其组合的测量结果。肽的实例是氨基酸链。蛋白质的实例是肽或肽的组合。例如,蛋白质可以包括结合在一起的一个、两个或更多个肽。蛋白质还可以包含任何翻译后修饰(PTM)。蛋白质组数据可以包括关于各种蛋白质变体的数据。蛋白质变体可以包括由具有多种序列变异、剪接同种型或翻译后修饰的基因组产生的不同形式的蛋白质。蛋白质组数据可以使用无偏、非靶向方法生成,或者可以包括特定的蛋白质集。
蛋白质组数据可以包括关于各种蛋白质、肽存在、不存在或量的信息。例如,蛋白质组数据可以包括蛋白质的量。蛋白质量可以指示为蛋白质的浓度或数量,例如生物样品中蛋白质的浓度。蛋白质量可以相对于另一蛋白质或另一生物分子。蛋白质组数据可以包括关于蛋白质或肽存在的信息。蛋白质组数据可以包括关于蛋白质或肽不存在的信息。蛋白质组数据可以按类型来区分,其中每种类型包括不同类型的蛋白质、肽或蛋白质变体。
蛋白质组数据通常包括关于许多蛋白质或肽的数据。例如,蛋白质组数据可以包括关于1000种或更多种蛋白质或肽存在、不存在或量的信息。在一些情况下,蛋白质组数据可以包括关于5000种、10,000种、20,000种或更多种肽、蛋白质或蛋白质变体存在、不存在或量的信息。蛋白质组数据甚至可以包括多达约100万种蛋白质变体。蛋白质组数据可以包括通过蛋白质、肽或蛋白质变体的前述数目中的任一个定义的蛋白质、肽或蛋白质变体的范围。
蛋白质组数据可以通过多种方法中的任一种生成。生成蛋白质组数据可以包括使用与肽或蛋白质结合并产生可检测信号的检测试剂。在使用与肽或蛋白质结合并产生可检测信号的检测试剂后,可以获得指示蛋白质或肽存在、不存在或量的读出。生成蛋白质组数据可以包括浓缩、过滤或离心样品。
蛋白质组数据可以使用质谱法、色谱法、液相色谱法、高效液相色谱法、固相色谱法、侧流测定、免疫测定、酶联免疫吸附测定、蛋白质印迹、斑点印迹或免疫染色或其组合生成。用于生成蛋白质组数据的方法的一些实例包括使用质谱法、蛋白质芯片或反相蛋白质微阵列。蛋白质组数据也可以使用免疫测定生成,诸如酶联免疫吸附测定、蛋白质印迹、斑点印迹或免疫组织化学。生成蛋白质组数据可以涉及使用免疫测定组套。
获得蛋白质组数据的一种方式包括使用质谱法。质谱法的实例包括使用高分辨率二维电泳来从不同样品中平行分离出蛋白质,之后选择或染色待通过质谱法鉴定的差异表达的蛋白质。另一方法使用稳定的同位素标签来差异地标记来自两种不同的复杂混合物的蛋白质。复杂的混合物内的蛋白质可以被同位素标记,然后消化以产生标记的肽。然后可以将标记的混合物组合,并且可以通过多维液相色谱法分离各肽并且通过串联质谱法进行分析。质谱法可以包括使用液相色谱法-质谱法(LC-MS),其为可以将液相色谱法(例如,HPLC)的物理分离能力与质谱法组合的技术。
除上文方法中任一种之外,生成蛋白质组数据可以包括使样品与颗粒接触,使得颗粒吸附包括蛋白质的生物分子。吸附的蛋白质可以是生物分子冠的一部分。可以在生成蛋白质组数据中测量或鉴定吸附的蛋白质。
iv.转录组数据
数据集可以包括转录组数据或转录物数据(诸如转录物测量结果)。转录组数据可以涉及关于核苷酸转录物(诸如RNA)的数据。RNA的实例包括信使RNA(mRNA)、核糖体RNA(rRNA)、信号识别颗粒(SRP)RNA、转移RNA(tRNA)、小核RNA(snRNA)、小核仁RNA(snoRNA)、长非编码RNA(lncRNA)、微RNA(miRNA)、非编码RNA(cRNA)或piwi相互作用RNA(piRNA)或其组合。RNA可以包括mRNA。RNA可以包括miRNA。转录组数据可以按类型来区分,其中每种类型包括不同类型的RNA或转录物。例如,mRNA数据可以包括在一种类型中,并且一种或多种类型的小非编码RNA(诸如miRNA或piRNA)的数据可以包括在另一类型中。miRNA可以包括5pmiRNA或3p miRNA。
转录组数据可以包括关于各种RNA存在、不存在或量的信息。例如,转录组数据可以包括RNA的量。RNA量可以指示为RNA分子的浓度或数目,例如生物样品中RNA的浓度。RNA量可以相对于另一RNA或另一生物分子。转录组数据可以包括关于RNA存在的信息。转录组数据可以包括关于RNA不存在的信息。
转录组数据通常包括关于许多RNA的数据。例如,转录组数据可以包括关于1000种或更多种RNA存在、不存在或量的信息。在一些情况下,转录组数据可以包括关于5000种、10,000种、20,000种或更多种RNA存在、不存在或量的信息。转录组数据甚至可以包括多达约200,000种转录物。转录组数据可以包括通过RNA或转录物的前述数目中的任一个定义的转录物的范围。
转录组数据可以通过多种方法中的任一种生成。生成转录组数据可以包括使用与RNA结合并产生可检测信号的检测试剂。在使用与RNA结合并产生可检测信号的检测试剂后,可以获得指示RNA存在、不存在或量的读出。生成转录组数据可以包括浓缩、过滤或离心样品。
转录组数据可以包括RNA序列数据。用于生成RNA序列数据的方法的一些实例包括使用测序、微阵列分析、杂交、聚合酶链反应(PCR)或电泳或其组合。微阵列可以用于生成转录组数据。PCR可以用于生成转录组数据。PCR可以包括定量PCR(qPCR)。此类方法可以包括使用与双链核苷酸一起插入或结合靶核苷酸序列的可检测探针(例如,荧光探针)。PCR可以包括逆转录酶定量PCR(RT-qPCR)。生成转录组数据可以涉及使用PCR组套。
RNA序列数据可以通过对对象的RNA进行测序或通过首先将对象的RNA转化为DNA(例如,互补DNA(cDNA))并对DNA进行测序来生成。测序可以包括大规模平行测序。大规模平行测序技术的实例包括焦磷酸测序、通过可逆终止子化学进行测序、由连接酶介导的边连接边测序或磷连接的荧光核苷酸或实时测序。生成转录组数据可以包括制备用于测序的样品或模板。可以使用逆转录酶来将RNA转化为cDNA。一些模板制备方法包括使用源自单RNA或cDNA分子的扩增模板,或者单RNA或cDNA分子模板。扩增方法的实例包括乳液PCR扩增、滚环扩增或固相扩增。
除上文方法中任一种之外,生成转录组数据可以包括使样品与颗粒接触,使得颗粒吸附包括RNA的生物分子。吸附的RNA可以是生物分子冠的一部分。可以在生成转录组数据中测量或鉴定吸附的RNA。
v.基因组数据
数据集可以包括基因组数据或关于遗传物质的数据(诸如遗传物质测量结果)。基因组数据可以包括关于遗传物质诸如核酸或组蛋白的数据。核酸可以包括DNA。基因组数据可以包括关于遗传物质存在、不存在或量的信息。遗传物质的量可以指示为浓度、绝对数,或者可以是相对的。
基因组数据可以包括DNA序列数据。序列数据可以包括基因序列。例如,基因组数据可以包括多达约20,000个基因的序列数据。基因组数据还可以包括非编码DNA区的序列数据。DNA序列数据可以包括关于DNA序列存在、不存在或量的信息。DNA序列数据可以包括关于诸如单核苷酸多态性的突变存在或不存在的信息。DNA序列数据可以包括突变DNA的量的DNA测量结果,例如来自癌细胞的突变DNA的测量结果。
基因组数据可以包括表观遗传数据。表观遗传数据的实例包括DNA甲基化数据、DNA羟甲基化数据或组蛋白修饰数据。表观遗传数据可以包括DNA甲基化或羟甲基化。DNA甲基化或羟甲基化可以在整个DNA中或在DNA内的区域中测量。甲基化的DNA可以包括甲基化的胞嘧啶(例如,5-甲基胞嘧啶)。胞嘧啶常常在CpG位点被甲基化,并且可以指示基因激活。
表观遗传数据可以包括组蛋白修饰数据。组蛋白修饰数据可以包括组蛋白修饰存在、不存在或量。组蛋白修饰的实例包括血清素化(serotonylation)、甲基化、瓜氨酸化、乙酰化或磷酸化。组蛋白修饰的一些具体实例可以包括赖氨酸甲基化、谷氨酰胺血清素化、精氨酸甲基化、精氨酸瓜氨酸化、赖氨酸乙酰化、丝氨酸磷酸化、苏氨酸磷酸化或酪氨酸磷酸化。组蛋白修饰可以指示基因激活。
基因组数据可以按类型来区分,其中每种类型包括不同类型的基因组数据。例如,DNA序列数据可以包括在另一类型中,并且表观遗传数据可以包括在一种类型中,或者不同类型的表观遗传数据可以包括在不同类型中。
基因组数据可以通过多种方法中的任一种生成。生成基因组数据可以包括使用与遗传物质(诸如,DNA或组蛋白)结合并产生可检测信号的检测试剂。在使用与遗传物质结合并产生可检测信号的检测试剂后,可以获得指示遗传物质存在、不存在或量的读出。生成基因组数据可以包括浓缩、过滤或离心样品。
用于生成DNA序列数据的方法的一些实例包括使用测序、微阵列分析(例如,SNP微阵列)、杂交、聚合酶链反应或电泳或其组合。DNA序列数据可以通过对对象的DNA进行测序来生成。测序可以包括大规模平行测序。大规模平行测序技术的实例包括焦磷酸测序、通过可逆终止子化学进行测序、由连接酶介导的边连接边测序或磷连接的荧光核苷酸或实时测序。生成基因组数据可以包括制备用于测序的样品或模板。一些模板制备方法包括使用源自单DNA分子的扩增模板,或者单DNA分子模板。扩增方法的实例包括乳液PCR扩增、滚环扩增或固相扩增。
DNA甲基化可以通过使用质谱法、甲基化特异性PCR、亚硫酸氢盐测序、通过连接介导的PCR测定进行的HpaII微小片段富集、Glal水解和连接衔接子依赖式PCR测定、染色质免疫沉淀(ChIP)测定与DNA微阵列的组合(ChIP-on-chip测定)、限制性标记基因组扫描、甲基化DNA免疫沉淀、亚硫酸氢盐处理的DNA的焦磷酸测序、DNA腺嘌呤甲基转移酶活性的分子断裂光测定(molecular break light assay)、甲基敏感性DNA印迹、甲基CpG结合蛋白、高分辨率解链分析、甲基化敏感性单核苷酸引物延伸测定、另一甲基化测定或其组合。
组蛋白修饰可以通过使用质谱法或免疫测定、酶联免疫吸附测定、蛋白质印迹、斑点印迹或免疫染色或其组合来检测。
除上文方法中任一种之外,生成基因组数据可以包括使样品与颗粒接触,使得颗粒吸附包括遗传物质的生物分子。吸附的遗传物质可以是生物分子冠的一部分。可以在生成基因组数据中测量或鉴定吸附的遗传物质。
vi.代谢组数据
数据集可以包括代谢组数据或代谢物数据(诸如代谢物测量结果)。代谢组数据可以包括关于小分子(例如,小于kDa)代谢物(诸如,代谢中间体、激素或其他信号传导分子或次级代谢物)的信息。代谢组数据可以涉及关于代谢物的数据。代谢物可以包括代谢的底物、中间体或产物。代谢物可以是大小小于1.5kDa的任何分子。代谢物的实例可以包括糖、脂质、氨基酸、脂肪酸、酚类化合物或生物碱。代谢组数据可以按类型来区分,其中每种类型包括不同类型的代谢物。代谢组数据可以包括脂质组数据。
代谢组数据或代谢物数据可以包括脂质组数据或脂质数据。脂质可以是癌症发展中不可或缺的组分。例如,脂质可以是癌症生物学的关键角色,因为它们可以影响或参与供养膜和细胞增殖、脂毒性(其中脂质含量平衡可能有助于防止脂毒性)、允许细胞过程、膜生物物理学、致癌信号传导和转移、防止氧化应激、在微环境中的信号传导或免疫调节。一些脂质类别可能与癌症相关,诸如肝细胞癌中的甘油磷脂、前列腺癌中的甘油磷脂和酰基肉碱、在转移期间的含胆碱的脂质和磷脂的增加或者癌细胞存活和死亡的鞘脂调控。
代谢组数据可以包括关于各种代谢物存在、不存在或量的信息。例如,代谢组数据可以包括代谢物的量。代谢物量可以指示为代谢物的浓度或数量,例如生物样品中代谢物的浓度。代谢物量可以相对于另一代谢物或另一生物分子。代谢组数据可以包括关于代谢物存在的信息。代谢组数据可以包括关于代谢物不存在的信息。
代谢组数据通常包括关于许多代谢物的数据。例如,代谢组数据可以包括关于1000种或更多种代谢物存在、不存在或量的信息。在一些情况下,代谢组数据可以包括关于5000、10,000、20,000、50,000、100,000、500,000、100万、150万、200万或更多种代谢物或通过代谢物的前述数目中的任何两个所定义的代谢物的范围的存在、不存在或量的信息。
代谢组数据可以通过多种方法中的任一种生成。生成代谢组数据可以包括使用与代谢物结合并产生可检测信号的检测试剂。在使用与代谢物结合并产生可检测信号的检测试剂后,可以获得指示代谢物存在、不存在或量的读出。生成代谢组数据可以包括浓缩、过滤或离心样品。
代谢组数据可以使用质谱法、色谱法、液相色谱法、高效液相色谱法、固相色谱法、侧流测定、免疫测定、酶联免疫吸附测定、蛋白质印迹、斑点印迹或免疫染色或其组合生成。用于生成代谢组数据的方法的实例包括使用质谱法。质谱法可以包括分离方法步骤,诸如液相色谱法(例如,HPLC)。质谱法可以包括电离方法,诸如电子电离、大气压化学电离、电喷雾电离或二次电喷雾电离。质谱法可以包括基于表面的质谱法或二次离子质谱法。用于生成代谢组数据的方法的另一实例包括核磁共振(NMR)。用于生成代谢组数据的方法的其他实例包括傅立叶变换离子回旋共振、离子迁移谱、电化学检测(例如,与HPLC联用)或拉曼光谱法和放射性标记(例如,当与薄层色谱组合时)。针对生成代谢组数据描述的一些质谱法可以用于生成蛋白质组数据,或反之亦然。代谢组数据也可以使用免疫测定生成,诸如酶联免疫吸附测定、蛋白质印迹、斑点印迹或免疫组织化学。生成代谢组数据可以涉及使用脂质组套。
除上文方法中任一种之外,生成代谢组数据可以包括使样品与颗粒接触,使得颗粒吸附包括代谢物的生物分子。吸附的代谢物可以是生物分子冠的一部分。可以在生成代谢组数据中测量或鉴定吸附的代谢物。
d.计算机系统
本文所述的方法的某些方面可以使用计算机系统来执行。例如,可以使用计算机系统来执行数据集的分析。同样,可以通过使用计算机系统来获得数据集。指示生物分子(例如蛋白质、转录物、遗传物质或代谢物)的存在、不存在或量的读出可以至少部分地使用计算机系统获得。计算机系统可用于执行使用分类器将与疾病状态的存在、不存在或可能性相对应的标签分配给数据集,或将数据集鉴定为指示或不指示疾病状态的方法。计算机系统可以生成鉴定对象具有疾病状态的可能性的报告。计算机系统可以传输该报告。例如,实验室可以将关于疾病状态鉴定的报告传输给医疗从业者。计算机系统可以接收报告。
执行本文所述的方法的计算机系统可以包括图4中所示的组件中的一些或全部。参考图4,示出了描绘包括计算机系统400(例如,处理或计算系统)的机器的实例的框图,在该计算机系统400内可以执行一组指令以使设备进行或执行本公开的用于静态代码调度的方面和/或方法中的任何一个或多个。图4中的组件是实例,并不限制实现特定方面的任何硬件、软件、嵌入式逻辑组件或者两个或更多个这样的组件的组合的使用或功能的范围。
计算机系统400可以包括经由总线440彼此通信以及与其他组件通信的一个或多个处理器401、存储器403和存储408。总线440还可以链接显示器432、一个或多个输入设备433(其可以例如包括小键盘、键盘、鼠标、触笔等)、一个或多个输出设备434、一个或多个存储设备435,以及各种有形存储介质436。这些元件中的全部可以直接或经由一个或多个接口或适配器接合到总线440。例如,各种有形存储介质436可以经由存储介质接口426与总线440接合。计算机系统400可以具有任何合适的物理形式,包括但不限于一个或多个集成电路(IC)、印刷电路板(PCB)、移动手持设备(诸如移动电话或PDA)、膝上型或笔记本计算机、分布式计算机系统、计算网格或服务器。
计算机系统400包括执行功能的一个或多个处理器401(例如,中央处理单元(CPU)或通用图形处理单元(GPGPU))。处理器401可选地含有高速缓冲存储器单元402,用于指令、数据或计算机地址的临时本地存储。处理器401被配置为辅助计算机可读指令的执行。作为处理器401执行体现在一个或多个有形计算机可读存储介质(诸如存储器403、存储408、存储设备435和/或存储介质436)中的非暂时性处理器可执行指令的结果,计算机系统400可以为图4中描绘的组件提供功能。计算机可读介质可以存储实现特定方面的软件,并且处理器401可以执行该软件。存储器403可以从一个或多个其他计算机可读介质(诸如大容量存储设备435、436)或者通过诸如网络接口420等合适的接口从一个或多个其他源读取软件。软件可以致使处理器401执行本文所述或图示的一个或多个过程或者一个或多个过程的一个或多个步骤。执行这样的过程或步骤可以包括定义存储在存储器403中的数据结构以及按照软件的指示修改数据结构。
存储器403可以包括各种组件(例如,机器可读介质),包括但不限于随机存取存储器组件(例如,RAM 404)(例如,静态RAM(SRAM)、动态RAM(DRAM)、铁电随机存取存储器(FRAM)、相变随机存取存储器(PRAM)等)、只读存储器组件(例如,ROM 405)及其任何组合。ROM 405可以用于单向地向处理器401传送数据和指令,并且RAM 404可以用于与处理器401双向地传送数据和指令。ROM 405和RAM 404可以包括以下所述的任何合适的有形计算机可读介质。在一个实例中,基本输入/输出系统406(BIOS),包括帮助在计算机系统400内的元件之间(诸如在启动期间)传输信息的基本例程,可以被存储在存储器403中。
固定存储408可选地通过存储控制单元407双向地连接到处理器401。固定存储408提供附加数据存储容量并且还可以包括本文所述的任何合适的有形计算机可读介质。存储408可用于存储操作系统409、可执行文件410、数据411、应用412(应用程序)等等。存储408还可以包括光盘驱动器、固态存储器设备(例如,基于闪存的系统)或以上任何的组合。在适当的情况下,存储408中的信息可以作为虚拟存储器并入存储器403中。
在一个实例中,存储设备435可以经由存储设备接口425与计算机系统400可拆卸地接合(例如,经由外部端口连接器(未示出))。具体地,存储设备435和相关联的机器可读介质可以为计算机系统400提供机器可读指令、数据结构、程序模块和/或其他数据的非易失性和/或易失性存储。在一个实例中,软件可以完全或部分地驻留在存储设备435上的机器可读介质内。在另一实例中,软件可以完全或部分地驻留在处理器401内。
总线440连接多种子系统。本文中,在适当的情况下,对总线的引用可以涵盖服务于公共功能的一条或多条数字信号线。总线440可以是使用多种总线架构中的任一种的若干类型的总线结构中的任一种,包括但不限于存储器总线、存储器控制器、外围总线、局域总线及其任何组合。作为实例而非通过限制的方式,这样的架构可以包括工业标准架构(ISA)总线、增强型ISA(EISA)总线、微通道架构(MCA)总线、视频电子标准协会局域总线(VLB)、外围组件互连(PCI)总线、PCI-Express(PCI-X)总线、加速图形端口(AGP)总线、超传输(HTX)总线、串行高级技术附件(SATA)总线或其任何组合。
计算机系统400还可以包括输入设备433。在一个实例中,计算机系统400的用户可以经由输入设备433将命令和/或其他信息输入到计算机系统400中。输入设备433的实例包括但不限于字母数字输入设备(例如,键盘)、定点设备(例如,鼠标或触摸板)、触摸板、触摸屏、多点触摸屏、操纵杆、触笔、游戏手柄、音频输入设备(例如,麦克风、语音响应系统等)、光学扫描仪、视频或静态图像捕获设备(例如,相机)或其任何组合。输入设备可以包括Kinect、Leap Motion等等。输入设备433可以经由多种输入接口423(例如,输入接口423)中的任一种,包括但不限于串行、并行、游戏端口、USB、FIREWIRE、THUNDERBOLT或以上的任何组合,接合至总线440。
当计算机系统400连接到网络430时,计算机系统400可以与连接到网络430的其他设备通信,特别是移动设备和企业系统、分布式计算系统、云存储系统、云计算系统等等。去往和来自计算机系统400的通信可以通过网络接口420发送。例如,网络接口420可以以一个或多个分组(诸如互联网协议(IP)分组)的形式接收来自网络430的传入通信(诸如来自其他设备的请求或响应),并且计算机系统400可以将传入通信存储在存储器403中以用于处理。计算机系统400可以类似地以一个或多个分组的形式将传出通信(诸如对其他设备的请求或响应)存储在存储器403中并从网络接口420传送到网络430。处理器401可以访问存储在存储器403中的这些通信分组以用于处理。
网络接口420的实例包括但不限于网络接口卡、调制解调器或其任何组合。网络430或网段430的实例包括但不限于分布式计算系统、云计算系统、广域网(WAN)(例如,因特网、企业网络)、局域网(LAN)(例如,与办公室、建筑、校园或其他相对较小的地理空间相关联的网络)、电话网络、两个计算设备之间的直接连接、对等网络或其任何组合。诸如网络430等的网络可以采用有线和/或无线通信模式。一般而言,可以使用任何网络拓扑。
信息和数据可以通过显示器432显示。显示器432的实例包括但不限于阴极射线管(CRT)、液晶显示器(LCD)、薄膜晶体管液晶显示器(TFT-LCD)、诸如无源矩阵OLED(PMOLED)或有源矩阵OLED(AMOLED)显示器的有机液晶显示器(OLED)、等离子体显示器或其任何组合。显示器432可以经由总线440接合至处理器401、存储器403和固定存储器408以及其他设备,诸如输入设备433。显示器432经由视频接口422链接至总线440,并且可以经由图形控制器421控制显示器432与总线440之间的数据传输。显示器可以是视频投影仪。显示器可以是头戴式显示器(HMD),诸如VR耳机。合适的VR耳机可以包括HTC Vive、Oculus Rift、SamsungGear VR、Microsoft HoloLens、Razer OSVR、FOVE VR、Zeiss VR One、Avegant Glyph、Freefly VR耳机等等。显示器可以包括诸如本文所公开的那些的设备的组合。
除了显示器432之外,计算机系统400可以包括一个或多个其他外围输出设备434,包括但不限于音频扬声器、打印机、存储设备或其任何组合。这样的外围输出设备可以经由输出接口424连接到总线440。输出接口424的实例包括但不限于串行端口、并行连接、USB端口、FIREWIRE端口、THUNDERBOLT端口或其任何组合。
附加地或作为替代,计算机系统400可以提供作为逻辑硬连线或以其他方式体现在电路中的结果的功能,其可代替软件或与软件一起操作以执行本文所述或图示的一个或多个过程或一个或多个过程的一个或多个步骤。本公开中对软件的引用可以涵盖逻辑,并且对逻辑的引用可以涵盖软件。此外,在适当的情况下,对计算机可读介质的引用可以涵盖存储用于执行的软件的电路(诸如IC)、体现用于执行的逻辑的电路,或两者。本公开涵盖硬件、软件或两者的任何合适的组合。
本领域技术人员将理解,结合本文所公开的方面描述的各种说明性逻辑块、模块、电路和算法步骤可以被实现为电子硬件、计算机软件或两者的组合。为了清楚地说明硬件和软件的这种可互换性,上文已大体上根据其功能描述了各种说明性组件、块、模块、电路和步骤。
结合本文所公开的方面描述的各种说明性逻辑块、模块和电路可以用被设计为执行本文所述的功能的通用处理器、数字信号处理器(DSP)、专用集成电路(ASIC)、现场可编程门阵列(FPGA),或其他可编程逻辑设备、离散门或晶体管逻辑、离散硬件组件或其任何组合来实现或执行。通用处理器可以是微处理器,但在替代方案中,处理器可以是任何常规处理器、控制器、微控制器或状态机。处理器还可以被实现为计算设备的组合,例如DSP和微处理器的组合、多个微处理器、与DSP核结合的一个或多个微处理器,或任何其他这样的配置。
结合本文所公开的方面描述的方法或算法的步骤可以直接体现在硬件中,体现由一个或多个处理器执行的软件模块中,或体现在两者的组合中。软件模块可以驻留在RAM存储器、快闪存储器、ROM存储器、EPROM存储器、EEPROM存储器、寄存器、硬盘、可移动磁盘、CD-ROM或任何其他形式的存储介质中。实例存储介质耦合到处理器,使得处理器可以从存储介质读取信息以及向存储介质写入信息。在替代方案中,存储介质可以集成到处理器。处理器和存储介质可以驻留在ASIC中。ASIC可以驻留在用户终端中。在替代方案中,处理器和存储介质可以作为分立组件驻留在用户终端中。
根据本文的描述,作为非限制性实例,合适的计算设备可以包括服务器计算机、台式计算机、膝上型计算机、笔记本计算机、小型笔记本计算机、上网本计算机、上网平板计算机、机顶盒计算机、媒体流设备、手持计算机、因特网工具、移动智能电话、平板计算机、个人数字助理、视频游戏控制台和车辆。本领域技术人员还将认识到,具有可选计算机网络连接性的选定电视、视频播放器和数字音乐播放器适合在本文所述的系统中使用。合适的平板计算机可以包括那些具有册、平板或可转换配置的平板计算机。
计算设备可以包括被配置为执行可执行指令的操作系统。例如,操作系统是包括程序和数据的软件,其管理设备的硬件并为应用的执行提供服务。本领域技术人员将认识到,作为非限制性实例,合适的服务器操作系统包括FreeBSD、OpenBSD、Linux、/>Mac OS X/>Windows/> 本领域技术人员将认识到,作为非限制性实例,合适的个人计算机操作系统包括/>Mac OS/> 和诸如等的类UNIX操作系统。操作系统可以由云计算提供。本领域技术人员还将认识到,作为非限制性实例,合适的移动智能电话操作系统包括/>OS、/>Research In/>BlackBerryWindows/>OS、/>Windows/>OS、/>和/>
在一些情况下,本文公开的平台、系统、介质或方法包括用程序编码的一个或多个非暂时性计算机可读存储介质,该程序包括可由计算机系统的操作系统执行的指令。计算机系统可以联网。计算机可读存储介质可以是计算设备的有形组件。计算机可读存储介质可以从计算设备移除。作为非限制性实例,计算机可读存储介质可以包括CD-ROM、DVD、快闪存储器设备、固态存储器、磁盘驱动器、磁带驱动器、光盘驱动器、包括云计算系统和服务的分布式计算系统等等中的任何。在一些情况下,程序和指令被永久地、基本上永久地、半永久地或非暂时性地编码在介质上。
e.数据整合与分析
本文公开了包括获得多个测量结果集的方法。多个测量结果集可以包括吸附至颗粒的内源性生物分子的测量结果以及内标生物分子与生物样品的组合或其与吸附至颗粒的内源性生物分子的组合的测量结果。一种方法可以包括获得来自对象的生物样品的吸附至颗粒的内源性生物分子的测量结果。一种方法可以包括获得内标生物分子与生物样品的组合或其与吸附至颗粒的内源性生物分子的组合的测量结果。内标生物分子可以与内源性生物分子相同,但还包含标记。一种方法可以包括基于内标生物分子的测量结果归一化或调整内源性生物分子的测量结果。一种方法可以包括将分类器应用于归一化或调整的测量结果以将对应于生物状态的标记分配给归一化或调整的测量结果。
将不同的数据集组合可以在规模、多样性和丰富性方面带来前所未有的结果。可以使用不同的方法对每个样品进行剖析以得出数据集,并且可以将结果与临床信息组合。可以使用人工智能来发现驱动临床差异的模式和相互作用。将开发深度学习算法,其可以包括计算机视觉、自然语言处理或无监督学习的方面,以发现结果中的模式并鉴定可以帮助区分对象的疾病状态的生物标志物。该方法可以在从处理原始结果到开发稳健的分类器的过程中广泛使用。
可以将单独的数据集整合到分析中,以便实现与单独的数据集提供相比更准确的疾病预测或鉴定。例如,一种方法可以包括使用多于一个分类器来鉴定对象的疾病状态,其中每个分类器用于分析单独的数据集并且每个分类器彼此独立。如果分类器彼此独立地出错,则组合的分析可能比使用对应于仅一个数据集的一个分类器的分析更准确。替代地,可以将单独的数据集组合成一个数据集或通过单个分类器进行分析。
涉及多个分类器的方法可以包括使用第一分类器来生成对应于疾病状态存在、不存在或可能性的第一标记或将其分配给第一数据集。该方法还可以包括使用第二分类器来生成对应于疾病状态存在、不存在或可能性的第二标记或将其分配给第二数据集。该方法还可以包括使用第三分类器来生成对应于疾病状态存在、不存在或可能性的第三标记或将其分配给第三数据集。该方法还可以包括使用第四分类器来生成对应于疾病状态存在、不存在或可能性的第四标记或将其分配给第四数据集。可以使用另外的分类器来生成标记或将其分配给另外的数据集。可以使用来自患病对象和对照对象的样品的数据或组合数据来训练每个分类器。此外,每个分类器可以包括独立的机器学习模型或在相同输入特征上训练的机器学习模型的全体。可以使用计算机视觉、自然语言处理或无监督学习或其组合来训练分类器。可以使用来自多个样品(例如数千个样品)的数据集来训练分类器。
一些分类器可以分析组合的数据集,而其他分类器可以分析一个数据集。例如,另外的分类器可以生成对应于疾病状态存在、不存在或可能性的标记或将其分配给组合的数据集。组合的数据集可以包括两种或更多种类型的数据的任何组合。例如,数据类型可以包括蛋白质组数据、转录组数据、基因组数据或代谢组数据。组合的数据集可以包括生物分子类型的两种或更多种不同类型的测量结果的组合。例如,组合的数据可以包括使用颗粒获得的蛋白质测量结果以及使用内标获得的蛋白质测量结果。
通过每个分类器生成或分配的标记可以用于将数据集鉴定为指示或不指示疾病状态。这可能需要基于通过分类器中的任何一个或多个分配的单个标记,或通过基于第一标记和第二标记生成或获得多数投票分数,将数据集鉴定为指示或不指示疾病状态。
将数据集鉴定为指示或不指示疾病状态可以包括在一些或所有分类器生成的标记上进行多数投票。例如,可以基于较多的分类器是否分配了对应于疾病状态存在的标记,或者较多的分类器是否分配了对应于疾病状态不存在的标记来鉴定对象是否可能具有疾病状态的最终确定。将数据集鉴定为指示或不指示疾病状态可以包括生成或使用一些或所有分类器生成的标记的加权平均数。
将数据集鉴定为指示或不指示疾病状态可以包括获得或生成通过一些或所有分类器生成或分配的标记的加权平均数。加权平均数的权重可以基于以下中的一个或多个:ROC曲线下的面积、精度-召回率曲线下的面积、准确度、精度、召回率、灵敏度、F1分数或特异性或其组合。
涉及多个分类器的方法可以包括将数据集鉴定为指示或不指示疾病状态。这可以基于选择通过个别分类器分配的标记或通过将通过多个分类器分配的标记组合来进行。该方法可以包括基于各自通过单独的分类器分配的第一标记和第二标记的组合将数据集鉴定为指示或不指示疾病状态。可以进一步基于第三标记、第四标记或一个或多个另外的标记将数据集鉴定为指示疾病状态。可以基于第一标记和第三标记,或者基于第一和第四标记将数据集鉴定为指示疾病状态,其中例如标记中的一个或多个不包括在最终确定中。
涉及多个分类器的方法的实例示出于图2中。在该实例中,分类器全体被训练成基于来自蛋白质组结果、代谢组结果、基因组结果和转录组结果的特征进行癌症/健康调用。每个分类器采用来自n个数据集的特征的组合,总计(2n-1)个不同的分类器。此外,每个分类器可以是独立的机器学习模型或在相同输入特征上训练的机器学习模型的全体。最终调用可以通过以下方法中的任一种进行:选取任何一个分类器的输出;在所有分类器或分类器子集上进行多数投票;或者获得所有分类器或分类器子集的输出的加权平均数,其中权重基于ROC曲线下的面积、精度-召回率曲线下的面积、准确度、精度、召回率/灵敏度、F1分数或特异性来分配。
一种方法可以包括整合的模型分类。使用整合的模型分类的方法可以包括组合分别地关于每种分析物或数据类型训练的分类器的预测概率或分类器调用。概率的组合可以经由用根据AUC分配的权重来取得加权平均数。在一些情况下,第一分类器生成第一数据集的预测或标记,第二分类器生成第二数据集的预测或标记,任选地,一个或多个另外的分类器各自生成一个或多个另外的数据集的预测或标记,并且将预测或标记组合。组合的预测或标记可以用于将数据集鉴定为指示或不指示疾病状态。一些方面涉及在本文描述的方法(诸如包括使用整合的模型分类的方法)中使用的组合的分类器。一些方面涉及在本文描述的方法(诸如包括使用整合的模型分类的方法)中使用的分类器集。
一种方法可以包括基于变换的分类。基于变换的分类可以包括从每种分析物或数据类型选取在前的特征,合并特征以及关于合并的特征训练一个分类器。基于变换的分类可以包括以下3种方法中的任一种:
第一种方法:可以通过首先训练“预”分类器并查看在前的特征来选取在前的特征。
第二种方法:另一方式是针对每种分析物或数据类型执行单变量分析并且选取差异显著的特征。
第三种方法:一次去除一个特征并且查看“预”分类器性能(AUC)的下降。造成性能下降最多的那些特征可以是该特定分析物或数据类型的在前的特征。
一些方面涉及使用这些方法之一生成的分类器,其在本文描述的方法中使用。例如,一些方面包括通过以下进行训练的分类器:从第一数据集中鉴定特征子集;从第二数据集中鉴定特征子集;将来自第一数据集和第二数据集中的特征子集合并以生成合并的特征;以及用合并的特征训练分类器,以将包括第一数据集和第二数据集的数据集鉴定为指示或不指示疾病状态。
分类器可以包括从单独的数据集鉴定和合并的特征子集。可以通过获得数据集的特征的单变量数据并且从单变量数据中鉴定在前的特征来鉴定特征。可以针对单独的数据集从分类器的特征中鉴定特征子集。可以通过获得数据集的分类器并且鉴定分类器的在前的特征来鉴定特征。可以通过以下来鉴定特征:获得数据集的分类器;从分类器一次去除一个或多个特征;以及鉴定当从分类器去除时哪些特征使分类器的性能降低最多。人工智能或机器学习方法可用于开发基于本文描述的数据集的分类器,特别是当使用较大的数据集时或当使用若干不同类型的数据集的组合时。
基于变换的分类可以是有用的,因为它可以减少分析中待使用的特征的数目。例如,基于变换的分类可以将分析中待使用的特征的数目从1000个减少至小于100个(例如,10至30个、10至50个或10至75个)或者可能几十个。这可以在例如将数据集鉴定为指示或不指示疾病状态中加速计算机处理,因为相对于使用数目不减少的特征的方法,它可以减少待处理的计算的量。
当分析本文描述的数据(诸如,蛋白质组数据、转录组数据、基因组数据或代谢组数据)时,本文描述的方法可以包括生成或使用分类器,以便以一定的灵敏度或特异性指示对象患有疾病或处于患有疾病的风险中。本文描述的方法可以从数据生成或使用分类器,以便以至少约50%、至少约60%、至少约70%、至少约80%或至少约90%的灵敏度指示对象患有疾病或处于患有疾病的风险中。本文描述的方法可以从数据生成或使用分类器,以便以至少约50%、至少约60%、至少约70%、至少约80%或至少约90%的特异性指示对象患有疾病或处于患有疾病的风险中。本文描述的方法可以从数据生成或使用分类器,以便以不大于约50%、不大于约60%、不大于约70%、不大于约80%、不大于约90%或不大于约95%的灵敏度或特异性指示对象患有疾病或处于患有疾病的风险中。
一些方面包括基于内源性生物分子测量结果鉴定对象的生物状态。一些方面包括输出或传输包括关于鉴定的生物状态的信息的报告。一些方面包括基于鉴定的生物状态传输或输出对对象的治疗的建议。
f.对象和治疗
本文描述的方法可以用于将对象鉴定为是否可能具有疾病状态。对象可以是生物体。对象可以是脊椎动物。对象可以是哺乳动物。对象可以是人。对象可以是雄性或雌性。在一些情况下,对象可以是植物、真菌或其他动物。对象可以是微生物。微生物可以是细菌。微生物可以包括病毒。对象可以具有疾病状态。例如,对象可以患有疾病或病症、疾病或病症的共病,或者可以是健康的。
可以出于鉴定对象的疾病状态的目的,从对象获得样品。对象可以被怀疑为具有疾病状态或不具有疾病状态。该方法可以用于确认或反驳怀疑的疾病状态。
疾病状态的实例是癌症。癌症的实例包括肺癌。肺癌的实例是非小细胞肺癌(NSCLC)。癌症可以处于早期或晚期。疾病状态可以包括疾病或病症,或者可以包括与疾病或病症相关的共病。
在一些情况下,对象被监测。例如,关于对象具有疾病状态的可能性的信息可以用于确定在不向对象提供治疗的情况下监测对象。在其他情况下,对象可以在接受治疗的同时被监测,以查看对象的疾病状态是否改善。
当对象被鉴定为不具有疾病状态时,对象可以避免否则不利的疾病治疗(以及疾病治疗的相关副作用),或者能够避免必须针对疾病状态进行活检或侵入式测试。当对象被鉴定为不具有疾病状态时,对象可以在不接受治疗的情况下被监测。当对象被鉴定为不具有疾病状态时,对象可以在不接受活检的情况下被监测。在一些情况下,被鉴定为不具有疾病状态的对象可以用姑息护理(palliative care)诸如针对疼痛的药物组合物进行治疗。在一些情况下,对象被鉴定为具有与最初怀疑的疾病状态不同的另一疾病,并且被提供针对该另一疾病的治疗。
当对象被鉴定为具有疾病状态时,可以向对象提供针对疾病状态的治疗。例如,如果疾病状态是癌症,则可以向对象提供癌症治疗。治疗的实例包括手术、器官移植、施用药物组合物、放射疗法、化学疗法、免疫疗法、激素疗法、单克隆抗体治疗、干细胞移植、基因疗法或嵌合抗原受体(CAR)-T细胞或转基因T细胞施用。
当对象被鉴定为具有疾病状态时,可以进一步评价对象的疾病状态。例如,被怀疑具有疾病状态的对象可以在本文公开的方法指示其可能具有疾病状态之后进行活检。
一些情况包括建议对对象进行治疗或监测。例如,执业医生可以接收通过本文描述的方法生成的报告。报告可以指示对象具有疾病状态的可能性。然后执业医生可以向对象或向另一执业医生提供或建议治疗或监测。一些情况包括建议针对对象的治疗。一些情况包括建议对对象进行监测。
实施例
实施例1.使用多个数据集的疾病状态分类器的生成或使用
使用液相色谱法-质谱法(LC-MS)在来自患有肺癌(1期NSCLC,n=17;和2期NSCLC,n=7)或未患有肺癌(“0期”,n=59)的人类对象的83个血浆样品中获得蛋白质组测量结果和脂质组测量结果。使用蛋白质组测量结果或脂质组测量结果训练三个单独的分类器。每个单独的分类器用于输出预测的癌症概率。在评估组合的分类数据时,对通过每个分类器输出的预测概率求平均。
第一分类器使用第一蛋白质组数据集训练,第一蛋白质组数据集包括来自每个血浆样品的等分试样的吸附至纳米颗粒的蛋白质的测量结果。第一分类器的特征包括单独吸附至10种单独的可商购获得的纳米颗粒(P-033、P-039、P-047、P-053、P-065、P-073、S-003、S-006、S-007和S-010;Seer,Inc.)的测量结果。使用每个样品获得每种颗粒的单独的测量结果。来自第一分类器的数据被称为“Proteograph”。
第二分类器使用第二蛋白质组数据集训练,第二蛋白质组数据集包括来自每个血浆样品的单独的等分试样的蛋白质的测量结果。将已知量的、可商购获得的、经同位素标记的内参蛋白加标至每个血浆样品中,将其用于鉴定个别内源性蛋白质的质谱,并且用作确定第二蛋白质组数据集中个别内源性蛋白质的量的标准物。使用约500种内参蛋白来获得每个血浆样品中约500种个别内源性蛋白质的测量结果。来自第二分类器的数据在此实施例中被称为“ProteinQuant”。
第三分类器使用脂质组数据集进行训练,脂质组数据集包括来自每个血浆样品的另一等分试样的脂质的测量结果。来自第三分类器的数据在此实施例中被称为“脂质”。
图3A-图3B示出了将多个数据集组合以提高分类器性能的方法,如通过接受者操作特征(ROC)曲线的曲线下面积(AUC)增加所示。在图3A中,左图(顶部:所有特征;底部:前20个特征)示出了在83个生物样品中从Proteograph分类器、脂质分类器以及Proteograph分类器和脂质分类器的组合(“Proteograph+脂质”)生成的ROC。中间图(顶部:所有特征;底部:前20个特征)示出了在83个生物样品中从Proteograph分类器、ProteinQuant分类器以及Proteograph分类器和ProteinQuant分类器的组合(“Proteograph+ProteinQuant”)生成的ROC。右图(顶部:所有特征;底部:前20个特征)示出了在83个生物样品中从Proteograph分类器、ProteinQuant分类器和脂质分类器以及从三种分类器的组合(“Proteograph+脂质+ProteinQuant”)生成的ROC。在图3B中,呈现了数据以便比较,其中Proteograph在左图中,Proteograph和Proteograph+脂质在中间图中,并且Proteograph+脂质和Proteograph+脂质+ProteinQuant在右图中。这些图中的数据指示使用多个数据集来改进数据分类的有用性和有效性,甚至当数据集包括同一类型的生物分子的测量结果时。相对于使用单个数据集或单个分类器,这种使用多个数据集的组合方法降低了数据和分类的信噪比,从而降低了其总体质量。
实施例2.使用颗粒富集和重标记的(同位素)内标(PiQ)的蛋白质鉴定
此实施例说明了使用重标记的内标(此处称为“PiQ”或“PiQuant”)与纳米颗粒富集的组合来鉴定蛋白质。方法可以包括使用PiQ,可以包括在纳米颗粒富集之前或之后将重标记的内标引入至蛋白质混合物中。在此,该方法包括在引入内标之前富集纳米颗粒。PiQ可以用于以下中的任一个:评估样品质量控制(QC);实现低丰度蛋白质分析物的蛋白质鉴定的增强;或生成更高质量的数据(例如,变异系数更低)。可以监测的QC量度的非限制性实例包括LC和MS性能、数据分析性能或多个样品制备量度。
与使用纳米颗粒富集而不使用重标记的内标相比,使用重标记的内标和纳米颗粒富集,鉴定出123种另外的独特的蛋白质。在纳米颗粒富集的样品中观察到多于500种蛋白质,其变异系数(CV)值较低。表1说明了在稀疏谱或完整谱中针对内标(IS)组套鉴定的蛋白质的总数。表2说明了从利用各种类型的纳米颗粒(NP1、NP2、NP3、NP4或NP5,可从Seer,Inc.商购获得)的纳米颗粒富集生成的数据的中值CV。测定包括803种重标记的肽(其等同于566种蛋白质,因为一些蛋白质具有多于一种跟踪每种蛋白质的肽)。
表1.在稀疏谱或完整谱中针对内标(IS)组套鉴定的蛋白质的数目
蛋白质鉴定 IS组套大小
稀疏谱 508 566 90
完整谱 457 566 81
表2.从利用各种纳米颗粒(NP)的纳米颗粒富集生成的数据的中值CV
图6和图7说明了在纳米颗粒富集后使用PiQ内标(IS)法的蛋白质鉴定。与仅纳米颗粒富集相比,使用PiQ与纳米颗粒富集的组合的一些优势示出于表3中。图8A示出了通过使用PiQ内标法鉴定凝血因子IX的非限制性实例,其在五种不同的颗粒上鉴定:NP1、NP2、NP3、NP4和NP5。图8B示出了通过使用PiQ内标法鉴定低丰度组织蛋白酶S的非限制性实例,其在相同的五种不同的颗粒上鉴定。图8C示出了低丰度组织蛋白酶S的信号增强的非限制性实例(如图8B所示),其允许用户得到高度准确且精确的定量信息。
表3.与单独纳米颗粒富集相比使用PiQ内标法挽救的蛋白质鉴定和定量
此实施例中的数据说明了将使用参考生物分子与生物分子测定(包括使用颗粒来测量内源性生物分子)组合的实用性和一些令人惊讶的效果。
实施例3.使用具有内标的颗粒的假阴性数据的恢复以及假阳性数据的确认
从健康对象获得血浆样品。将PiQuant内标与或不与使用纳米颗粒提取的蛋白质冠组合。此处的方法与实施例2中的方法类似,但是数据是从不同的样品集生成的,并且是在不同的LCMS仪器上收集的,进一步证明了技术的普遍性。
图9A示出假阴性的恢复,其显示包含血红蛋白亚基δ(HBD,UniProt ID P02042)的内源性肽存在于生物流体样品中,但未被搜索引擎检测到或过滤出。掺入HBD的内标实现了对肽存在的检测和确认。在不使用内标的情况下无法检测到肽,但是使用PiQuant工作流程鉴定出了标准肽和内源性肽,如图中的鉴定的转换所见。使用此技术恢复假阴性适用于其他蛋白质或肽,并且可以用于涉及其他类型的生物分子、参考生物分子或颗粒的方法中。
图9B示出了真阴性的确认,其显示样品中不存在包含肿瘤坏死因子受体超家族成员11B(TR11B)的内源性肽,如通过上图中没有检测到所确认,在上图中有噪声但没有指示肽的真峰。在图的下半部分中以色谱峰的形式检测到TR11B的内标。使用此技术确认真阴性适用于其他蛋白质或肽,并且可以用于涉及其他类型的生物分子、参考生物分子或颗粒的方法中。
此实施例中的数据进一步说明了将使用参考生物分子与生物分子测定(包括使用颗粒来测量内源性生物分子)组合的实用性和一些令人惊讶的效果。
虽然前述公开已经出于清楚和理解的目的进行详细描述,但是本领域技术人员通过阅读本公开可以清楚地看到,可以在不脱离本公开真实范围的情况下对形式和细节进行各种改变。例如,上文所述的所有技术和装置可以呈各种组合的形式使用。本说明书中提到的所有出版物、专利、专利申请和/或其他文献都出于所有目的通过引用整体并入,其程度如同每个单个的出版物、专利、专利申请和/或其他文献被单个且单独地指示出于所有目的通过引用并入。

Claims (61)

1.一种方法,包括:
使生物样品与颗粒接触,从而使所述生物样品的内源性生物分子吸附至所述颗粒;以及
将所述生物样品或所述吸附的内源性生物分子与包含标记的所述生物分子的内标组合。
2.如权利要求1所述的方法,其还包括测量所述内源性生物分子和所述内标,以获得内源性生物分子测量结果和内标测量结果。
3.如权利要求2所述的方法,其还包括基于所述内标测量结果鉴定所述内源性生物分子的浓度。
4.如权利要求2所述的方法,其还包括基于所述内标测量结果的测量结果确定所述内源性生物分子测量结果的质量控制方面。
5.如权利要求4所述的方法,其中所述生物样品包括生物样品组,测量所述内源性生物分子包括测量所述生物样品组的所述内源性生物分子,并且所述质量控制方面与所述生物样品组的所述内源性生物分子有关。
6.如权利要求4所述的方法,其中所述质量控制方面包括质量准确度、定量精度、定量准确度、与标准样品的相关性、色谱性能、冠形成质量、消化质量或污染物生物分子测量结果。
7.如权利要求2或4-6中任一项所述的方法,其中所述测量结果通过质谱仪获得。
8.如权利要求7所述的方法,其还包括基于所述内标测量结果或基于所述质量控制方面执行对所述质谱仪的实时控制。
9.如权利要求8所述的方法,其中执行对所述质谱仪的实时控制包括:调整内电压以提供特异性的变化;调整样品体积;调整技术条件以提高测量质量;暂停或停止数据收集;重新安排测量;或通知用户质量控制问题。
10.如权利要求2所述的方法,其还包括基于所述内标测量结果归一化或调整所述内源性生物分子测量结果。
11.如权利要求2所述的方法,其中所述内源性生物分子测量结果包括所述生物样品中所述内源性生物分子的量。
12.如权利要求11所述的方法,其还包括相对于所述生物样品中所述内源性生物分子的所述量确定吸附至所述颗粒的所述内源性生物分子的量。
13.如权利要求2所述的方法,其还包括基于所述内标测量结果鉴定所述内源性生物分子测量结果的变异性来源。
14.如权利要求2所述的方法,其还包括使用所述内标测量结果来鉴定或获得另外的内源性生物分子测量结果。
15.如权利要求1所述的方法,其还包括基于所述内源性生物分子测量结果鉴定被取得所述生物样品的对象的生物状态。
16.一种分类方法,包括:
(a)获得第一数据集,所述第一数据集包括来自对象的第一生物样品的吸附至颗粒的生物分子的第一测量结果;
(b)获得第二数据集,所述第二数据集包括所述第一生物样品或所述对象的第二生物样品的所述生物分子的第二测量结果,其中所述第二测量结果包括基于所述生物分子的内标与所述第一生物样品的组合或其与所述第二生物样品的组合的测量结果归一化或调整的内源性生物分子的测量结果,其中所述内标包括所述内源性生物分子的非内源性标记型式,并且其中所述第二测量结果与所述第一测量结果一起获得或单独获得;
(c)应用第一分类器以将对应于生物状态的第一标记分配给所述第一数据集;
(d)应用第二分类器以将对应于所述生物状态的第二标记分配给所述第二数据集;以及
(e)将所述第一标记和所述第二标记组合以获得对应于所述生物状态的组合标记。
17.如权利要求16所述的方法,其中所述第一测量结果或所述第二测量结果包括至少10个生物分子的测量结果。
18.如权利要求16所述的方法,其中所述第一测量结果或所述第二测量结果使用质谱法、色谱法、侧流测定、免疫测定或其组合来获得。
19.如权利要求16所述的方法,其中所述第一测量结果或所述第二测量结果使用质谱法获得。
20.如权利要求16所述的方法,其中所述第一测量结果或所述第二测量结果通过测量指示所述生物分子的量的读出来获得。
21.如权利要求16所述的方法,其中(a)包括使所述第一生物样品与所述颗粒接触以将所述生物分子吸附至所述颗粒,以及测量所述吸附的生物分子。
22.如权利要求16所述的方法,其中在获得所述第一测量结果之前将所述吸附的生物分子与所述颗粒分开。
23.如权利要求16所述的方法,其中(b)包括将所述第一生物样品或所述第二生物样品与所述内标组合,测量所述内标与所述生物分子,以及使用所述内标获得所述第二测量结果。
24.如权利要求16所述的方法,其中将所述内标以预定量与所述第一生物样品或所述第二生物样品组合。
25.如权利要求16所述的方法,其中所述第二测量结果通过使用所述内标的质谱鉴定内源性生物分子的质谱来获得。
26.如权利要求16所述的方法,其中所述第二测量结果从所述第一生物样品获得。
27.如权利要求16所述的方法,其中将所述内标与所述第一生物样品组合,并且在使所述第一生物样品与所述颗粒接触以将生物分子吸附至所述颗粒并且获得所述第一测量结果之后获得所述第二测量结果。
28.如权利要求16所述的方法,其中将所述内标与所述第一生物样品组合,并且在使所述第一生物样品与所述颗粒接触以将生物分子吸附至所述颗粒并且获得所述第一测量结果之前获得所述第二测量结果。
29.如权利要求16所述的方法,其中所述第二测量结果在所述第一生物样品的等分试样或非等分试样中与所述第一测量结果分别获得。
30.如权利要求16所述的方法,其中所述第二测量结果从所述第二生物样品获得。
31.如权利要求16所述的方法,其中所述第一测量结果或所述第二测量结果通过使(a)或(b)的所述生物分子与亲和试剂接触来获得。
32.如权利要求31所述的方法,其中所述亲和试剂包括抗体。
33.如权利要求31所述的方法,其中所述亲和试剂富集所述生物分子。
34.如权利要求16所述的方法,其中所述第一标记和所述第二标记包括所述生物状态的可能性或概率,并且其中所述方法包括对所述可能性或概率求平均。
35.如权利要求16所述的方法,其还包括基于所述组合标记将所述数据集鉴定为指示或不指示所述生物状态。
36.如权利要求16所述的方法,其中将所述第一标记和所述第二标记组合以获得组合标记包括基于所述第一标记和所述第二标记生成多数投票分数。
37.如权利要求16所述的方法,其中将所述第一标记和所述第二标记组合以获得组合标记包括生成所述第一标记和所述第二标记的加权平均数。
38.如权利要求37所述的方法,其还包括将权重分配给所述第一分类器和所述第二分类器,从而获得所述加权平均数,其中所述权重基于ROC曲线下的面积、精度-召回率曲线下的面积、准确度、精度、召回率、灵敏度、F1分数、特异性或其组合来分配。
39.如权利要求16所述的方法,其中所述第一分类器和所述第二分类器关于所述生物状态彼此独立地出错。
40.如权利要求16所述的方法,其中所述组合标记关于将所述对象鉴定为具有所述生物状态或不具有所述生物状态比所述第一标记或所述第二标记更准确。
41.如权利要求16所述的方法,其还包括:获得第三数据集,所述第三数据集包括与所述第一测量结果和所述第二测量结果的所述生物分子类型不同的生物分子的测量结果;以及使用第三分类器以将对应于所述生物状态的第三标记分配给所述第三数据集;并且其中,所述组合标记包括所述第一标记、所述第二标记和所述第三标记的组合。
42.如权利要求16所述的方法,其还包括当所述组合标记指示所述生物状态时向所述对象提供针对所述生物状态的治疗,以及当所述组合标记不指示所述生物状态时在不提供所述治疗的情况下观察所述对象。
43.一种分类方法,包括:
(a)获得第一数据集,所述第一数据集包括来自对象的第一生物样品的吸附至颗粒的生物分子的第一测量结果;
(b)获得第二数据集,所述第二数据集包括所述第一生物样品或所述对象的第二生物样品的所述生物分子的第二测量结果,其中所述第二测量结果包括基于所述生物分子的内标与所述第一生物样品的组合或其与所述第二生物样品的组合的测量结果归一化或调整的内源性生物分子的测量结果,其中所述内标包括所述内源性生物分子的非内源性标记型式,并且其中所述第二测量结果与所述第一测量结果一起获得或单独获得;以及
(c)应用分类器以使用来自所述第一数据集和所述第二数据集的特征的组合评价所述对象的生物状态。
44.如权利要求15、16或43中任一项所述的方法,其还包括输出或传输包括关于所述鉴定的生物状态的信息的报告。
45.如权利要求15、16或43中任一项所述的方法,其还包括基于所述鉴定的生物状态传输或输出对所述对象的治疗的建议。
46.如权利要求15、16或43中任一项所述的方法,其中怀疑所述对象具有所述生物状态。
47.如权利要求15、16或43中任一项所述的方法,其中所述生物状态包括疾病状态。
48.如权利要求47所述的方法,其中所述疾病状态包括癌症。
49.如权利要求48所述的方法,其中所述癌症包括1期或2期癌症。
50.如权利要求48所述的方法,其中所述癌症包括肺癌。
51.如权利要求50所述的方法,其中所述肺癌包括非小细胞肺癌。
52.如权利要求1、16或43中任一项所述的方法,其中所述生物分子包括蛋白质、脂质、代谢物、糖或核酸。
53.如权利要求1、16或43中任一项所述的方法,其中所述生物分子包括蛋白质。
54.如权利要求1、16或43中任一项所述的方法,其中所述内标包括同位素标记、质量标签、条形码、翻译后修饰或来自与所述对象的物种不同物种的生物分子。
55.如权利要求1、16或43中任一项所述的方法,其中所述颗粒包括纳米颗粒。
56.如权利要求1、16或43中任一项所述的方法,其中所述颗粒包括金属、聚合物或脂质。
57.如权利要求1、16或43中任一项所述的方法,其中所述颗粒包括物理化学上不同的颗粒组。
58.如权利要求1、16或43中任一项所述的方法,其中所述第一生物样品或所述第二生物样品包含生物流体。
59.如权利要求58所述的方法,其中所述生物流体包括血液、血清或血浆。
60.如权利要求1、16或43中任一项所述的方法,其中所述对象是哺乳动物。
61.如权利要求1、16或43中任一项所述的方法,其中所述对象是人。
CN202280074458.4A 2021-09-13 2022-09-12 增强的对生物分子的检测和定量 Pending CN118215845A (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US202163243645P 2021-09-13 2021-09-13
US63/243,645 2021-09-13
PCT/US2022/076297 WO2023039579A1 (en) 2021-09-13 2022-09-12 Enhanced detection and quantitation of biomolecules

Publications (1)

Publication Number Publication Date
CN118215845A true CN118215845A (zh) 2024-06-18

Family

ID=85506964

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202280074458.4A Pending CN118215845A (zh) 2021-09-13 2022-09-12 增强的对生物分子的检测和定量

Country Status (5)

Country Link
US (2) US12007397B2 (zh)
CN (1) CN118215845A (zh)
AU (1) AU2022341187A1 (zh)
CA (1) CA3231038A1 (zh)
WO (1) WO2023039579A1 (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN118215845A (zh) 2021-09-13 2024-06-18 普罗科技有限公司 增强的对生物分子的检测和定量

Family Cites Families (102)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7099502B2 (en) 1999-10-12 2006-08-29 Biodiscovery, Inc. System and method for automatically processing microarrays
US7567870B1 (en) 2000-07-31 2009-07-28 Institute For Systems Biology Multiparameter analysis for predictive medicine
JP4290003B2 (ja) 2001-09-14 2009-07-01 エレクトロフォレティクス リミテッド 質量標識体
DE60207979T2 (de) 2002-03-05 2006-09-28 Epigenomics Ag Verfahren und Vorrichtung zur Bestimmung der Gewebespezifität von freier DNA in Körperflüssigkeiten
GB0305796D0 (en) 2002-07-24 2003-04-16 Micromass Ltd Method of mass spectrometry and a mass spectrometer
US9394332B2 (en) 2002-08-29 2016-07-19 Epigenomics Ag Method for bisulfite treatment
US7632686B2 (en) 2002-10-03 2009-12-15 Anderson Forschung Group High sensitivity quantitation of peptides by mass spectrometry
US7425700B2 (en) 2003-05-22 2008-09-16 Stults John T Systems and methods for discovery and analysis of markers
GB0315991D0 (en) * 2003-07-08 2003-08-13 Dakocytomation Denmark As Standard
US20060183128A1 (en) 2003-08-12 2006-08-17 Epigenomics Ag Methods and compositions for differentiating tissues for cell types using epigenetic markers
US7998554B2 (en) 2004-07-06 2011-08-16 Bridgestone Corporation Hydrophobic surfaces with nanoparticles
GB0428191D0 (en) 2004-12-23 2005-01-26 Cambridge Display Tech Ltd Digital signal processing methods and apparatus
TW200642785A (en) 2005-01-14 2006-12-16 Cabot Corp Metal nanoparticle compositions
US9002652B1 (en) 2005-01-27 2015-04-07 Institute For Systems Biology Methods for identifying and using organ-specific proteins in blood
WO2007014322A2 (en) 2005-07-27 2007-02-01 University Of Houston Nanomagnetic detector array for biomolecular recognition
US8668978B2 (en) 2005-12-01 2014-03-11 Northeastern University Multi-biomarker biosensor
US8849576B2 (en) 2006-04-28 2014-09-30 Hakima Amri Phylogenetic analysis of mass spectrometry or gene array data for the diagnosis of physiological conditions
US7899625B2 (en) 2006-07-27 2011-03-01 International Business Machines Corporation Method and system for robust classification strategy for cancer detection from mass spectrometry data
KR100846354B1 (ko) 2007-03-21 2008-07-15 (주) 프로탄바이오 혈청 당단백질부터 분리한 폐암 진단용 마커
US7815803B2 (en) 2007-06-14 2010-10-19 Roche Diagnostics Operations, Inc. Preparation of samples for LC-MS/MS using magnetic particles
EP3115469B1 (en) 2007-11-19 2020-04-29 Celera Corporation Lung cancer markers and uses thereof
EP2124051A1 (en) * 2008-05-23 2009-11-25 ETH Zurich Method for rapid generation of phosphorylation profiles, the detection of in vivo phosphorylation sites of kinases and phosphatases and their use as diagnostic markers in cells, tissues and body fluids
US20120046184A1 (en) 2009-02-26 2012-02-23 University College Dublin, National University Of Ireland, Dublin method for the selective concentration of a specific low abundance biomolecule
US20110171323A1 (en) 2010-01-09 2011-07-14 The Translational Genomics Research Institute Methods and kits to predict prognostic and therapeutic outcome in small cell lung cancer
CA2787201A1 (en) 2010-01-14 2011-07-21 University Of Central Florida Research Foundation, Inc. Methods for biomolecule and biomolecule complex (bmc) detection and analysis and the use of such for research and medical diagnosis
US9149432B2 (en) 2010-03-19 2015-10-06 Massachusetts Institute Of Technology Lipid vesicle compositions and methods of use
WO2011155984A1 (en) 2010-06-11 2011-12-15 Waters Technologies Corporation Techniques for mass spectrometry peak list computation using parallel processing
SG186953A1 (en) 2010-07-09 2013-02-28 Somalogic Inc Lung cancer biomarkers and uses thereof
WO2012031205A2 (en) 2010-09-03 2012-03-08 The Brigham And Women's Hospital, Inc. Lipid-polymer hybrid particles
EP2527459A1 (en) 2011-05-02 2012-11-28 Rheinische Friedrich-Wilhelms-Universität Bonn Blood-based gene detection of non-small cell lung cancer
WO2013025759A1 (en) 2011-08-16 2013-02-21 Battelle Memorial Institute Peptide and protein biomarkers for type 1 diabetes mellitus
JP6082026B2 (ja) 2011-12-21 2017-02-15 インテグレイティド ダイアグノスティクス,インコーポレイティド 肺癌診断用の組成物、方法及びキット
US11913957B2 (en) 2011-12-21 2024-02-27 Biodesix, Inc. Compositions, methods and kits for diagnosis of lung cancer
US10024860B2 (en) 2012-03-28 2018-07-17 Massachusetts Institute Of Technology Cancer-related extracellular matrix signatures and related methods and products
WO2013152989A2 (en) 2012-04-10 2013-10-17 Eth Zurich Biomarker assay and uses thereof for diagnosis, therapy selection, and prognosis of cancer
US9218690B2 (en) 2012-08-29 2015-12-22 Ge Aviation Systems, Llc Method for simulating hyperspectral imagery
US20140106976A1 (en) 2012-10-15 2014-04-17 The Board Of Trustees Of The Leland Stanford Junior University Compressed Sensing for Simultaneous Measurement of Multiple Different Biological Molecule Types in a Sample
EP4012716A1 (en) 2012-11-19 2022-06-15 Apton Biosystems, Inc. Digital analysis of molecular analytes using single molecule detection
US10378053B2 (en) 2017-03-17 2019-08-13 Apton Biosystems, Inc. Sequencing and high resolution imaging
US10829816B2 (en) 2012-11-19 2020-11-10 Apton Biosystems, Inc. Methods of analyte detection
US20160032395A1 (en) 2013-03-14 2016-02-04 Elai Davicioni Cancer biomarkers and classifiers and uses thereof
CN109813914A (zh) 2013-06-07 2019-05-28 皮尔斯生物科技有限公司 通过质谱分析用复用内标物对蛋白质和蛋白质修饰的绝对定量
WO2015116837A1 (en) 2014-01-30 2015-08-06 The Regents Of The University Of California Methylation haplotyping for non-invasive diagnosis (monod)
US20150253341A1 (en) * 2014-02-10 2015-09-10 Merck Sharp & Dohme Corp. Quantification of tau in biological samples by immunoaffinity enrichment and mass spectrometry
WO2015159293A2 (en) 2014-04-14 2015-10-22 Yissum Research Development Company Of The Hebrew University Of Jerusalem Ltd. A method and kit for determining the tissue or cell origin of dna
ES2741400T3 (es) 2014-07-18 2020-02-10 Univ Hong Kong Chinese Análisis de patrones de metilación de tejidos en mezcla de ADN
US9710606B2 (en) 2014-10-21 2017-07-18 uBiome, Inc. Method and system for microbiome-derived diagnostics and therapeutics for neurological health issues
EP3243078A1 (en) * 2015-01-09 2017-11-15 Atonomics A/S A universal assay for determining the quantity of tnf inhibitory drugs and their corresponding anti-drug-antibodies
US9984201B2 (en) 2015-01-18 2018-05-29 Youhealth Biotech, Limited Method and system for determining cancer status
US20160260594A1 (en) * 2015-03-02 2016-09-08 Bayspec, Inc. Sample Inlet and Vacuum System for Portable Mass Spectrometer
WO2016176222A1 (en) * 2015-04-30 2016-11-03 University Of Washington Cgas in systemic lupus erythematosus (sle)
US20180180619A1 (en) 2015-06-25 2018-06-28 Metanomics Health Gmbh Means and Methods for Diagnosing Pancreatic Cancer in a Subject Based on a Biomarker Panel
US10878320B2 (en) 2015-07-22 2020-12-29 Qualcomm Incorporated Transfer learning in neural networks
US20170076195A1 (en) 2015-09-10 2017-03-16 Intel Corporation Distributed neural networks for scalable real-time analytics
US10886007B2 (en) 2015-11-23 2021-01-05 The Board Of Trustees Of The Leland Stanford Junior University Methods and systems for identification of biomolecule sequence coevolution and applications thereof
CN115881230A (zh) 2015-12-17 2023-03-31 伊路敏纳公司 区分复杂生物样品中的甲基化水平
CN110114680A (zh) 2016-05-05 2019-08-09 佰欧迪塞克斯公司 用于诊断肺癌的组合物、方法和试剂盒
WO2017214049A1 (en) 2016-06-05 2017-12-14 Board Of Regents, The University Of Texas System Dual mass spectrometry-cleavable crosslinking reagents for protein-protein interactions cross reference to related applications
JP2019521673A (ja) 2016-06-07 2019-08-08 ザ リージェンツ オブ ザ ユニヴァーシティー オブ カリフォルニア 疾患および状態の分析のためのセルフリーdnaメチル化パターン
US9589374B1 (en) 2016-08-01 2017-03-07 12 Sigma Technologies Computer-aided diagnosis system for medical images using deep convolutional neural networks
GB201615128D0 (en) 2016-09-06 2016-10-19 Univ Manchester Methods
MX2019006982A (es) 2016-12-16 2019-12-02 The Brigham And Women´S Hospital Inc Sistema y metodo para matriz de sensores de corona de proteinas para la deteccion temprana de enfermedades.
US20210072255A1 (en) 2016-12-16 2021-03-11 The Brigham And Women's Hospital, Inc. System and method for protein corona sensor array for early detection of diseases
US20200087731A1 (en) 2016-12-21 2020-03-19 The Regents Of The University Of California Deconvolution and Detection of Rare DNA in Plasma
US11179441B2 (en) 2017-01-06 2021-11-23 The Board Of Trustees Of The Leland Stanford Junior University Ciliary neurotrophic factor receptor ligands and methods of using the same
EP3361256A1 (en) 2017-02-08 2018-08-15 Fundación para la Investigación Médica Aplicada In vitro method for the diagnosis of lung cancer
WO2018148600A1 (en) 2017-02-09 2018-08-16 Board Of Regents, The University Of Texas System Methods for the detection and treatment of lung cancer
BR112019018272A2 (pt) 2017-03-02 2020-07-28 Youhealth Oncotech, Limited marcadores metilação para diagnosticar hepatocelular carcinoma e câncer
US11694769B2 (en) 2017-07-17 2023-07-04 Bioinformatics Solutions Inc. Systems and methods for de novo peptide sequencing from data-independent acquisition using deep learning
US11573239B2 (en) 2017-07-17 2023-02-07 Bioinformatics Solutions Inc. Methods and systems for de novo peptide sequencing using deep learning
MX2020001575A (es) 2017-08-07 2020-11-18 Univ Johns Hopkins Materiales y métodos para evaluar y tratar el cáncer.
WO2019050966A2 (en) 2017-09-05 2019-03-14 Discerndx, Inc. AUTOMATED SAMPLE WORKFLOW PORTALING AND DATA ANALYSIS
WO2019084323A1 (en) 2017-10-25 2019-05-02 Georgia State University Research Foundation, Inc. CHEMICAL RELEASE SYSTEM DELIVERED BY ENRICHMENT
WO2019182885A1 (en) 2018-03-17 2019-09-26 University Of Central Florida Research Foundation, Inc. Detection of interaction between an assay substance and blood or blood components for immune status evaluation disease detection
CN112292697A (zh) 2018-04-13 2021-01-29 弗里诺姆控股股份有限公司 用于生物样品的多分析物测定的机器学习实施方式
WO2019209888A1 (en) 2018-04-23 2019-10-31 Seer, Inc. Systems and methods for complex biomolecule sampling and biomarker discovery
CN112823054A (zh) 2018-07-27 2021-05-18 维拉维斯公司 用于检测生物标志物的方法
CN109470859A (zh) 2018-11-04 2019-03-15 华东医院 一种外泌体蛋白作为鉴别肺结节良恶性标志物及其应用
GB2595583A (en) 2018-11-07 2021-12-01 Seer Inc Compositions, methods and systems for protein corona analysis and uses thereof
SG11202104882WA (en) 2018-11-15 2021-06-29 Ampel Biosolutions Llc Machine learning disease prediction and treatment prioritization
CA3126990A1 (en) 2019-02-14 2020-08-20 Maneesh Jain Methods and systems for determining a pregnancy-related state of a subject
AU2020247907A1 (en) 2019-03-26 2021-10-28 Seer, Inc. Compositions, methods and systems for protein corona analysis from biofluids and uses thereof
WO2020243526A1 (en) 2019-05-31 2020-12-03 410 Ai, Llc Estimating predisposition for disease based on classification of artificial image objects created from omics data
WO2020257235A1 (en) * 2019-06-17 2020-12-24 Sutro Biopharma, Inc. 1-(4-(aminomethyl)benzyl)-2-butyl-2h-pyrazolo[3,4-c]quinolin-4-amine derivatives and related compounds as toll-like receptor (tlr) 7/8 agonists, as well as antibody drug conjugates thereof for use in cancer therapy and diagnosis
EP3994704A4 (en) 2019-07-05 2023-08-02 Molecular You Corporation PROCEDURE AND SYSTEM FOR PERSONALIZED MOLECULAR HEALTH MANAGEMENT AND DIGITAL CONSULTATION AND TREATMENT
US20210031166A1 (en) 2019-07-29 2021-02-04 University Of Utah Solid Phase Microextraction Membranes Impregnated with Gold Nanoparticles: Creation of Novel SERS-Enhancing Substrates
KR20220078560A (ko) 2019-08-05 2022-06-10 시어 인코퍼레이티드 샘플 제조, 데이터 생성, 및 단백질 코로나 분석을 위한 시스템 및 방법
MX2022001817A (es) * 2019-08-13 2022-03-11 Washington University St Louis Metodos para detectar isoformas de la region de union a microtubulos (mtbr) tau y uso de las mismas.
WO2021087407A1 (en) 2019-11-02 2021-05-06 Seer, Inc. Systems for protein corona analysis
AU2021213150A1 (en) 2020-01-30 2022-08-04 Prognomiq Inc Lung biomarkers and methods of use thereof
US11232936B2 (en) * 2020-05-28 2022-01-25 Thermo Finnigan Llc Absolute quantitation of a target analyte using a mass spectrometer
JP2023534985A (ja) * 2020-07-20 2023-08-15 シアー, インコーポレイテッド 粒子およびアッセイ方法
GB202012434D0 (en) * 2020-08-10 2020-09-23 Univ Manchester Multiomic analysis of nanoparticle-coronas
CA3163498A1 (en) 2020-10-02 2022-04-07 Board Of Regents, The University Of Texas System Methods for the detection and treatment of lung cancer
US20220260559A1 (en) * 2020-11-04 2022-08-18 Seer, Inc. Biomarkers for diagnosing alzheimer's disease
EP4297903A1 (en) * 2021-02-26 2024-01-03 Seer, Inc. Apparatus for biomolecule assay
US20220328129A1 (en) 2021-03-31 2022-10-13 PrognomIQ, Inc. Multi-omic assessment
US11994455B2 (en) * 2021-04-01 2024-05-28 Ondavia, Inc. Analyte quantitation using Raman spectroscopy
WO2023039479A1 (en) 2021-09-10 2023-03-16 PrognomIQ, Inc. Direct classification of raw biomolecule measurement data
CN118215845A (zh) 2021-09-13 2024-06-18 普罗科技有限公司 增强的对生物分子的检测和定量
WO2023164697A2 (en) 2022-02-28 2023-08-31 PrognomIQ, Inc. Glycoprotein assessment
WO2023240046A2 (en) 2022-06-07 2023-12-14 PrognomIQ, Inc. Multi-omics assessment

Also Published As

Publication number Publication date
US12007397B2 (en) 2024-06-11
WO2023039579A1 (en) 2023-03-16
US20230145645A1 (en) 2023-05-11
US20230089033A1 (en) 2023-03-23
CA3231038A1 (en) 2023-03-16
AU2022341187A1 (en) 2024-03-21

Similar Documents

Publication Publication Date Title
Kumar et al. RNA cargos in extracellular vesicles derived from blood serum in pancreas associated conditions
KR101857462B1 (ko) 췌장암 바이오마커 및 그것의 용도
KR101870123B1 (ko) 폐암 바이오마커 및 그것의 용도
KR101658347B1 (ko) 폐암 바이오마커 및 그것들의 용도
EP3029153B1 (en) Mesothelioma biomarkers and uses thereof
EP2771692B1 (en) Lung cancer biomarkers and uses thereof
US20220328129A1 (en) Multi-omic assessment
US20190056402A1 (en) Organ specific diagnostic panels and methods for identification of organ specific panel proteins
Leung et al. From bench to bedside: discovery of ovarian cancer biomarkers using high-throughput technologies in the past decade
CN115678994A (zh) 一种生物标志物组合、含其的试剂及其应用
CN118215845A (zh) 增强的对生物分子的检测和定量
US20230223111A1 (en) Multi-omic assessment
CN117396983A (zh) 多组学评估
GB2607436A (en) Multi-omic assessment
KR102087373B1 (ko) 비소세포성 폐암 진단용 단백질 바이오마커 패널 및 이를 이용한 비소세포성 폐암 진단 방법
Damante et al. Thyroid tumors: novel insights from proteomic studies
Din et al. Technology insight: the application of proteomics in gastrointestinal disease
WO2024054946A1 (en) Methods of identifying pancreatic cancer
WO2023133536A2 (en) Peptide centric analyses
EP2607494A1 (en) Biomarkers for lung cancer risk assessment
KR20240035367A (ko) 선행화학요법 내성의 고형암 환자 진단용 바이오마커 및 이를 이용한 선행화학요법 내성 진단을 위한 정보제공방법
WO2023059854A1 (en) Lung cancer prediction and uses thereof

Legal Events

Date Code Title Description
PB01 Publication