CN111315487A - 用于质量控制和疾病检测的标志物分析 - Google Patents
用于质量控制和疾病检测的标志物分析 Download PDFInfo
- Publication number
- CN111315487A CN111315487A CN201880071683.6A CN201880071683A CN111315487A CN 111315487 A CN111315487 A CN 111315487A CN 201880071683 A CN201880071683 A CN 201880071683A CN 111315487 A CN111315487 A CN 111315487A
- Authority
- CN
- China
- Prior art keywords
- sample
- marker
- markers
- biomarker
- population
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- B—PERFORMING OPERATIONS; TRANSPORTING
- B01—PHYSICAL OR CHEMICAL PROCESSES OR APPARATUS IN GENERAL
- B01L—CHEMICAL OR PHYSICAL LABORATORY APPARATUS FOR GENERAL USE
- B01L3/00—Containers or dishes for laboratory use, e.g. laboratory glassware; Droppers
- B01L3/50—Containers for the purpose of retaining a material to be analysed, e.g. test tubes
- B01L3/502—Containers for the purpose of retaining a material to be analysed, e.g. test tubes with fluid transport, e.g. in multi-compartment structures
- B01L3/5023—Containers for the purpose of retaining a material to be analysed, e.g. test tubes with fluid transport, e.g. in multi-compartment structures with a sample being transported to, and subsequently stored in an absorbent for analysis
-
- B—PERFORMING OPERATIONS; TRANSPORTING
- B01—PHYSICAL OR CHEMICAL PROCESSES OR APPARATUS IN GENERAL
- B01L—CHEMICAL OR PHYSICAL LABORATORY APPARATUS FOR GENERAL USE
- B01L2300/00—Additional constructional details
- B01L2300/06—Auxiliary integrated devices, integrated components
- B01L2300/0627—Sensor or part of a sensor is integrated
- B01L2300/0636—Integrated biosensor, microarrays
-
- B—PERFORMING OPERATIONS; TRANSPORTING
- B01—PHYSICAL OR CHEMICAL PROCESSES OR APPARATUS IN GENERAL
- B01L—CHEMICAL OR PHYSICAL LABORATORY APPARATUS FOR GENERAL USE
- B01L2300/00—Additional constructional details
- B01L2300/06—Auxiliary integrated devices, integrated components
- B01L2300/0681—Filter
-
- B—PERFORMING OPERATIONS; TRANSPORTING
- B01—PHYSICAL OR CHEMICAL PROCESSES OR APPARATUS IN GENERAL
- B01L—CHEMICAL OR PHYSICAL LABORATORY APPARATUS FOR GENERAL USE
- B01L2300/00—Additional constructional details
- B01L2300/08—Geometry, shape and general structure
- B01L2300/0809—Geometry, shape and general structure rectangular shaped
- B01L2300/0816—Cards, e.g. flat sample carriers usually with flow in two horizontal directions
-
- B—PERFORMING OPERATIONS; TRANSPORTING
- B01—PHYSICAL OR CHEMICAL PROCESSES OR APPARATUS IN GENERAL
- B01L—CHEMICAL OR PHYSICAL LABORATORY APPARATUS FOR GENERAL USE
- B01L2400/00—Moving or stopping fluids
- B01L2400/04—Moving fluids with specific forces or mechanical means
- B01L2400/0403—Moving fluids with specific forces or mechanical means specific forces
- B01L2400/0406—Moving fluids with specific forces or mechanical means specific forces capillary forces
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01N—INVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
- G01N33/00—Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
- G01N33/48—Biological material, e.g. blood, urine; Haemocytometers
- G01N33/50—Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing
- G01N33/68—Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing involving proteins, peptides or amino acids
- G01N33/6803—General methods of protein analysis not limited to specific proteins or families of proteins
- G01N33/6848—Methods of protein analysis involving mass spectrometry
Abstract
公开了用于对采集并储存在过滤器上的样品进行质量控制监测的系统、方法、过滤器和装置。样品采集装置和过滤器具有标志物,所述标志物充当一种或多种涉及样品的程序如采集、储存、运输和洗脱的质量控制指示物。本文公开内容的实践允许进行样品评价,以增强下游应用,如通过对样品中生物标志物的准确、可重复的测量而持续监测患者的健康状态。可使用参考生物标志物增强健康状态的评估。在一些情况下,本公开使得能够通过测量和分析样品中的生物标志物来检测疾病信号并评估疾病状态。
Description
交叉引用
本申请要求于2017年9月5日提交的序列号为62/554,433的美国临时申请的权益,该临时申请在此明确地通过引用整体并入本文;本申请要求于2017年9月5日提交的序列号为62/554,435的美国临时申请的权益,该临时申请在此明确地通过引用整体并入本文。
发明内容
本文公开了与用于样品分析的标志物有关的系统、组合物、装置和方法。质量控制标志物可用于对采集在固体基底上的液体样品进行质量控制评估。一些组合物包含生物标志物,如提供健康状态信息的参考多肽,如可用于疾病检测和监测的蛋白质突变。
本文公开了采集装置,其包含:a)过滤器;b)设置在所述过滤器上的至少一个参考生物标志物;和c)设置在所述过滤器上的至少一个质量控制(QC)标志物。在一些实施方案中,所述至少一个QC标志物指示至少一种选自下组的条件:样品完整性、样品洗脱效率和过滤器储存条件。有时,所述至少一个生物标志物包含参考多肽,所述参考多肽映射到蛋白质中的多个区域并提供关于该蛋白质的突变状态的信息。
本文公开了组合物,其包含:a)至少一个参考生物标志物;和b)至少一个质量控制(QC)标志物。在一些实施方案中,所述至少一个QC标志物指示至少一种选自下组的条件:样品完整性、样品洗脱效率和储存条件。有时,所述至少一个生物标志物包含参考多肽,所述参考多肽映射到蛋白质中的多个区域并提供关于该蛋白质的突变状态的信息。
本文公开了采集装置,其包含:a)采集背衬,其包含用于接收生物样品的表面;和b)设置在所述采集背衬上的多个质量控制(QC)标志物,所述多个QC标志物指示至少一种选自下组的条件:样品完整性、样品洗脱效率和过滤器储存条件。各个方面结合了一个或多个以下要素。在一些情况下,所述采集背衬包含过滤器。洗脱效率通常包括样品从基底的释放。有时,基于所述至少一种条件从后续分析中筛选出所述样品。在某些情况下,基于所述至少一种条件对从样品获得的数据进行门控(gate),以从后续分析中去除所述数据的至少一个子集。有时,基于所述至少一种条件对从样品获得的数据进行归一化。从样品获得的数据通常基于所述多个QC标志物中的至少一个进行归一化。在某些情况下,基于所述多个QC标志物中的至少一个,对从样品获得的数据针对另一个样品进行归一化。样品完整性通常提供在样品采集期间和之后关于样品变化的信息。在各个方面,样品完整性包括样品稳定性、蛋白水解活性、DNA酶活性和RNA酶活性中的至少一种。在某些实施方案中,指示蛋白水解活性的标志物包含沉积在所述采集背衬上的至少一个已知大小和量的多肽群体。在一些情况下,指示DNA酶活性的标志物包含沉积在所述采集背衬上的至少一个已知大小和量的DNA分子群体。在许多情况下,指示RNA酶活性的标志物包含沉积在所述采集背衬上的至少一个已知大小和量的RNA分子群体。样品洗脱效率有时提供从所述采集背衬上成功洗脱下来的样品比例的信息。在某些情况下,样品洗脱效率包括总体洗脱效率、基于疏水性的洗脱效率和洗脱下来的样品比例中的至少一种。在一些情况下,指示样品洗脱效率的标志物包含疏水性大于样品中阈值百分比的预期分子的分子群体。疏水性大于样品中至少90%的预期分子的分子群体的洗脱通常表明样品中大多数分子的成功洗脱。有时,指示样品洗脱效率的标志物包含亲水性大于样品中至少90%的预期分子的分子群体。在各个方面,指示样品洗脱效率的标志物包含至少一个已知大小和量的分子群体。过滤器储存条件通常包括过滤器储存持续时间、温度暴露、光暴露、UV暴露、辐射暴露和湿度暴露中的至少一种。在某些情况下,指示湿度暴露的标志物在暴露于阈值湿度后产生可观察的信号。在一些情况下,所述可观察的信号是可见光谱的颜色。指示湿度暴露的标志物通常是不可逆的湿度标志物,其包含潮解性分子群体和至少一种染料。在许多情况下,指示温度暴露的标志物在暴露于阈值温度后产生可观察的信号。所述多个标志物任选地包含在暴露于光、UV和辐射中的至少一种之后展现出可观察信号的分子群体。在某些情况下,所述多个QC标志物包含选自洗脱标志物、湿度标志物、pH标志物、温度标志物、时间标志物、蛋白水解标志物、核酸酶标志物、稳定性标志物、辐射标志物、UV标志物和光标志物的至少一种标志物。在许多方面,所述至少一种条件包括样品完整性。所述至少一种条件一般包括样品洗脱效率。有时,所述至少一种条件包括过滤器储存条件。在一些情况下,所述多个QC标志物包含分子传感器群体。该分子传感器群体经常包含多肽、核酸、脂质、代谢物和碳水化合物中的至少一种。在各种情况下,该分子传感器群体具有非生物学结构。该分子传感器群体有时包含有机染料、无机染料、荧光团、量子点、荧光蛋白、热敏蛋白和放射性标记物中的至少一种。通常,在检测到目标分子后,该分子传感器群体经历可观察的变化。该分子传感器群体通常在检测到目标分子后产生可观察的信号。在许多情况下,所述可观察的信号是可见颜色变化、UV信号、发光信号和荧光信号中的至少一种。目标分子的检测通常包括分子传感器群体与目标分子之间的化学反应。在各种情况下,目标分子的检测包括分子传感器群体对目标分子的分子识别。该分子传感器群体任选地包含用于检测目标分子的分子识别组分和用于在检测到目标分子时提供可观察信号的报告组分。通常,所述多个QC标志物中的至少一个可通过质谱法检测。在一些情况下,所述多个QC标志物中的至少一个可通过免疫测定检测。所述多个QC标志物常常包含具有参考多肽群体的参考标志物。有时,该参考群体包含相对于样品中的相应多肽具有质量位移的多肽。在某些实施方案中,该参考群体与样品中相应多肽群体的区别在于在质谱输出上可检测的质量。该参考群体与样品中的相应多肽的区别通常在于与原子和该原子的重同位素之间的质量差异相当的质量。该参考群体经常用重同位素进行标记,该重同位素在质谱分析中以相对于样品多肽群体的可预测偏移进行迁移。在各种情况下,该参考群体与样品中的相应多肽的区别在于与通过翻译后修饰增加的质量相当的质量。该翻译后修饰通常包括肉豆蔻酰化、棕榈酰化、异戊二烯化、糖基磷脂酰肌醇化、脂化、酰化、乙酰化、甲基化、酰胺化、糖基化、羟基化、琥珀酰化、硫酸化、糖化、氨基甲酰化、羰基化、生物素化、氧化、聚乙二醇化、SUMO化、泛素化、类泛素化(neddylation)和磷酸化中的至少一种。在一些情况下,所述用于接收样品的表面包含用于样品沉积的区域。有时,所述样品包含全血、血清、血浆、尿液、唾液、汗液、眼泪、脑脊液、羊水和抽吸物中的至少一种。有时,样品在沉积后干燥并储存在所述采集背衬上。样品通常以干燥的血液斑点的形式储存在所述采集背衬上。在许多情况下,所述多个QC标志物中的至少一个标志物被设置在所述采集背衬上的样品沉积区域之内,使得样品在采集背衬上的沉积将所述至少一个标志物引入该样品中。在各种情况下,所述多个QC标志物中的至少一个标志物被设置在所述采集背衬上的样品沉积区域之外,使得样品在采集背衬上的沉积不将所述至少一个标志物引入该样品中。在某些情况下,所述多个QC标志物包含位于所述采集背衬上的至少一个标志物,以与样品共洗脱。所述多个QC标志物常常包含位于所述采集背衬上的至少一个标志物,而不与样品共洗脱。在某些方面,所述多个QC标志物中的至少一个标志物沉积在所述装置上,使得对至少一种样品的处理将所述至少一个标志物引入一种样品中。在某些情况下,所述多个QC标志物中的至少一个标志物沉积在所述装置上,使得对至少一种样品的处理不将所述至少一个标志物引入所述至少一种样品中。所述表面一般包含用于样品沉积的区域。在许多情况下,所述多个QC标志物中的至少一个标志物在样品沉积之前沉积在所述区域上。所述多个QC标志物中的至少一个标志物通常在样品沉积之前沉积在与所述区域分开的表面上的位置上。有时,所述采集装置进一步包含固体背衬。在许多情况下,所述采集装置进一步包含细胞不可透过的多孔层。在某些方面,所述采集装置进一步包含血浆采集储器。所述采集装置通常包含扩散层(spreading layer)。在一些情况下,所述采集装置包含用于增强对内源性蛋白质或肽的检测的至少一个参考生物标志物群体。所述参考生物标志物可映射到该内源性蛋白质或肽上的突变。所述参考生物标志物可以促进疾病信号和/或健康状态的检测。
本文公开了采集装置,其包含:a)采集背衬,其包含细胞不可透过的多孔层;b)沉积在所述采集背衬上的样品,其中该样品穿过所述多孔层,由此过滤除去任何细胞;以及c)在样品沉积之前设置在过滤器上的多个质量控制(QC)标志物。
本文公开了采集装置,其包含:a)过滤器;和b)设置在所述过滤器上的多个质量控制(QC)标志物,所述多个QC标志物指示至少两种选自下组的条件:温度暴露、湿度暴露、样品pH、洗脱效率和蛋白水解活性。各个方面结合了一个或多个以下要素。有时,所述多个QC标志物指示至少三种选自下组的条件:温度暴露、湿度暴露、样品pH、洗脱效率和蛋白水解活性。在多种情况上,所述多个QC标志物指示至少四种选自下组的条件:温度暴露、湿度暴露、样品pH、洗脱效率和蛋白水解活性。
本文公开了采集装置,其包含:a)过滤器,其包含细胞不可透过的多孔层和固体背衬;和b)设置在所述过滤器上的多个质量控制(QC)标志物,所述多个QC标志物包含指示温度暴露和湿度暴露的标志物。
本文公开了基于设置在采集装置上的多个质量控制(QC)标志物来筛选沉积在采集装置上的样品的方法,该方法包括:a)获得所述采集装置,其包含:i.细胞不可透过的多孔层;ii.沉积在所述采集装置上的样品,其中该样品穿过所述多孔层,由此过滤除去任何细胞;和iii.在样品沉积之前设置在所述采集装置上的多个质量控制(QC)标志物;b)分析所述多个QC标志物;以及c)基于(b)中评估的至少一种条件,对从所述样品获得的数据进行门控,以从后续分析中去除所述数据的至少一个子集。
本文公开了基于多个标志物来筛选沉积在采集装置上的样品的方法,其包括:a)获得所述采集装置,其包含:i.过滤器;和ii.设置在所述过滤器上的多个质量控制(QC)标志物,所述多个QC标志物指示至少两种选自下组的条件:温度暴露、湿度暴露、样品pH、洗脱效率和蛋白水解活性;b)分析所述多个QC标志物以评估所述至少一种条件;以及c)基于(b)中评估的至少一种条件,对从所述样品获得的数据进行门控,以从后续分析中去除所述数据的至少一个子集。
本文公开了基于多个标志物来筛选沉积在采集装置上的样品的方法,其包括:a)获得所述采集装置,其包含:i.过滤器,其包含用于接收样品的表面;和ii.设置在所述过滤器上的多个QC标志物,所述多个QC标志物指示至少一种选自下组的条件:样品完整性、样品洗脱效率和过滤器储存条件;b)分析所述多个QC标志物以评估所述至少一种条件;以及c)基于(b)中评估的至少一种条件,对从所述样品获得的数据进行门控,以从后续分析中去除所述数据的至少一个子集。
本文公开了基于多个质量控制(QC)标志物来筛选沉积在采集装置上的样品的方法,其包括:a)获得所述采集装置,其包含:i.细胞不可透过的多孔层;ii.沉积在所述采集装置上的样品,其中该样品穿过所述多孔层,由此过滤除去任何细胞;和iii.设置在所述采集装置上的多个质量控制(QC)标志物;b)评价所述多个QC标志物;以及c)当在步骤(b)中评价所述多个QC标志物表明所述样品不适合分析时,从后续分析中筛选出该样品。
本文公开了基于多个标志物来筛选沉积在采集装置上的样品的方法,其包括:a)获得所述采集装置,其包含:i.过滤器;和ii.设置在所述过滤器上的多个质量控制(QC)标志物,所述多个QC标志物指示至少两种选自下组的条件:温度暴露、湿度暴露、样品pH、洗脱效率和蛋白水解活性;b)分析所述多个QC标志物以评估所述至少一种条件;以及c)基于步骤(b)中评估的至少一种条件,从后续分析中筛选出所述样品。本文公开了基于多个标志物来筛选沉积在采集装置上的样品的方法,其包括:a)获得所述采集装置,其包含:i.过滤器,其包含用于接收样品的表面;和ii.设置在所述过滤器上的多个QC标志物,所述多个QC标志物指示至少一种选自下组的条件:样品完整性、样品洗脱效率和过滤器储存条件;b)分析所述多个QC标志物以评估所述至少一种条件;以及c)基于步骤(b)中评估的至少一种条件,从后续分析中筛选出所述样品。各个方面结合了一个或多个以下要素。有时,当所述多个标志物指示暴露于使样品不适合分析的条件时,基于样品完整性从后续分析中筛选出所述样品。通常,基于所述至少一种条件对从样品获得的数据进行门控,以从后续分析中去除所述数据的至少一个子集。有时,基于所述至少一种条件对从样品获得的数据进行归一化。通常,基于所述多个QC标志物中的至少一个对从样品获得的数据进行归一化。在某些情况下,基于所述多个QC标志物中的至少一个,对从样品获得的数据针对另一个样品进行归一化。样品完整性通常提供在样品采集期间和之后关于样品变化的信息。在各个方面,样品完整性包括样品稳定性、蛋白水解活性、DNA酶活性和RNA酶活性中的至少一种。在某些实施方案中,指示蛋白水解活性的标志物包含沉积在所述过滤器上的至少一个已知大小和量的多肽群体。在一些情况下,指示DNA酶活性的标志物包含沉积在所述过滤器上的至少一个已知大小和量的DNA分子群体。在许多情况下,指示RNA酶活性的标志物包含沉积在所述过滤器上的至少一个已知大小和量的RNA分子群体。样品洗脱效率有时提供从所述过滤器上成功洗脱下来的样品比例的信息。在某些情况下,样品洗脱效率包括总体洗脱效率、基于疏水性的洗脱效率和洗脱下来的样品比例中的至少一种。在一些情况下,指示样品洗脱效率的标志物包含疏水性大于样品中预期分子阈值百分比的分子群体。疏水性大于样品中预期分子的至少90%的分子群体的洗脱通常表明样品中大多数分子的成功洗脱。有时,指示样品洗脱效率的标志物包含亲水性大于样品中预期分子的至少90%的分子群体。在各个方面,指示样品洗脱效率的标志物包含至少一个已知大小和量的分子群体。过滤器储存条件通常包括过滤器储存持续时间、温度暴露、光暴露、UV暴露、辐射暴露和湿度暴露中的至少一种。在一些情况下,指示湿度暴露的标志物在暴露于阈值湿度后产生可观察的信号。在一些情况下,所述可观察的信号是可见光谱的颜色。指示湿度暴露的标志物通常是不可逆的湿度标志物,其包含潮解性分子群体和至少一种染料。在许多情况下,指示温度暴露的标志物在暴露于阈值温度后产生可观察的信号。所述多个标志物任选地包含在暴露于光、UV和辐射中的至少一种之后展现出可观察信号的分子群体。在某些情况下,所述多个QC标志物包含选自洗脱标志物、湿度标志物、pH标志物、温度标志物、时间标志物、蛋白水解标志物、核酸酶标志物、稳定性标志物、辐射标志物、UV标志物和光标志物的至少一种标志物。在许多方面,所述至少一种条件包括样品完整性。所述至少一种条件通常包括样品洗脱效率。有时,所述至少一种条件包括过滤器储存条件。在一些情况下,所述多个QC标志物包含分子传感器群体。该分子传感器群体经常包含多肽、核酸、脂质、代谢物和碳水化合物中的至少一种。在各种情况下,该分子传感器群体具有非生物学结构。该分子传感器群体有时包含有机染料、无机染料、荧光团、量子点、荧光蛋白、热敏蛋白和放射性标记物中的至少一种。通常,在检测到目标分子后,该分子传感器群体经历可观察的变化。该分子传感器群体通常在检测到目标分子后产生可观察的信号。在许多情况下,所述可观察的信号是可见颜色变化、UV信号、发光信号和荧光信号中的至少一种。目标分子的检测通常包括分子传感器群体与目标分子之间的化学反应。在各种情况下,目标分子的检测包括分子传感器群体对目标分子的分子识别。该分子传感器群体任选地包含用于检测目标分子的分子识别组分和用于在检测到目标分子时提供可观察信号的报告组分。通常,所述多个QC标志物中的至少一个可通过质谱法检测。在一些情况下,所述多个QC标志物中的至少一个可通过免疫测定检测。所述多个QC标志物常常包含具有参考多肽群体的参考标志物。有时,该参考群体包含相对于样品中的相应多肽具有质量位移的多肽。在某些实施方案中,该参考群体与样品中相应多肽群体的区别在于在质谱输出上可检测的质量。该参考群体与样品中的相应多肽的区别通常在于与原子和该原子的重同位素之间的质量差异相当的质量。该参考群体经常用重同位素进行标记,该重同位素在质谱分析中以相对于样品多肽群体的可预测偏移进行迁移。在各种情况下,该参考群体与样品中的相应多肽的区别在于与通过翻译后修饰增加的质量相当的质量。该翻译后修饰通常包括肉豆蔻酰化、棕榈酰化、异戊二烯化、糖基磷脂酰肌醇化、脂化、酰化、乙酰化、甲基化、酰胺化、糖基化、羟基化、琥珀酰化、硫酸化、糖化、氨基甲酰化、羰基化、生物素化、氧化、聚乙二醇化、SUMO化、泛素化、类泛素化和磷酸化中的至少一种。在一些情况下,所述用于接收样品的表面包含用于样品沉积的区域。有时,所述样品包含全血、血清、血浆、尿液、唾液、汗液、眼泪、脑脊液、羊水和抽吸物中的至少一种。有时,样品在沉积后干燥并储存在所述过滤器上。样品通常以干燥的血液斑点的形式储存在所述过滤器上。在许多情况下,所述多个QC标志物中的至少一个标志物被设置在所述过滤器上的样品沉积区域之内,使得样品在过滤器上的沉积将所述至少一个标志物引入该样品中。在各种情况下,所述多个QC标志物中的至少一个标志物被设置在所述过滤器上的样品沉积区域之外,使得样品在过滤器上的沉积不将所述至少一个标志物引入该样品中。在某些情况下,所述多个QC标志物包含至少一个位于所述过滤器上的标志物,以与样品共洗脱。所述多个QC标志物常常包含至少一个位于所述过滤器上的标志物,而不与样品共洗脱。在某些方面,所述多个QC标志物中的至少一个标志物沉积在所述装置上,使得对至少一种样品的处理将所述至少一个标志物引入一种样品中。在某些情况下,所述多个QC标志物中的至少一个标志物沉积在所述装置上,使得对至少一种样品的处理不将所述至少一个标志物引入所述至少一种样品中。所述表面一般包含用于样品沉积的区域。在许多情况下,所述多个QC标志物中的至少一个标志物在样品沉积之前沉积在所述区域上。所述多个QC标志物中的至少一个标志物通常在样品沉积之前沉积在与所述区域分开的表面上的位置上。有时,所述采集装置进一步包含固体背衬。在许多情况下,所述采集装置进一步包含细胞不可透过的多孔层。在某些方面,所述采集装置进一步包含血浆采集储器。所述采集装置通常包含扩散层。在一些情况下,所述采集装置包含用于增强对内源性蛋白质或肽的检测的至少一个参考生物标志物群体。在一些情况下,所述参考生物标志物或参考生物标志物分子群体具有预定的量或质量,以用于增强对相应内源性生物标志物的量或质量的确定。所述参考生物标志物可映射到该内源性蛋白质或肽上的突变。所述参考生物标志物可以促进疾病信号和/或健康状态的检测。
本文公开了用于基于设置在采集装置上的多个质量控制(QC)标志物来筛选沉积在该采集装置上的样品的系统,该系统包含存储器和处理器,其被配置用于:a)分析所述多个QC标志物,所述多个QC标志物指示至少一种选自下组的条件:样品完整性、样品洗脱效率和过滤器储存条件;并且b)基于(a)中的分析对从所述样品获得的数据进行门控,以从后续分析中去除所述数据的至少一个子集。各个方面结合了一个或多个以下要素。有时,当所述多个标志物指示暴露于使样品不适合分析的条件时,基于样品完整性从后续分析中筛选出所述样品。通常,基于所述至少一种条件对从样品获得的数据进行门控,以从后续分析中去除所述数据的至少一个子集。样品完整性通常提供在样品采集期间和之后关于样品变化的信息。在各个方面,样品完整性包括样品稳定性、蛋白水解活性、DNA酶活性和RNA酶活性中的至少一种。在某些实施方案中,指示蛋白水解活性的标志物包含沉积在所述过滤器上的至少一个已知大小和量的多肽群体。在一些情况下,指示DNA酶活性的标志物包含沉积在所述过滤器上的至少一个已知大小和量的DNA分子群体。在许多情况下,指示RNA酶活性的标志物包含沉积在所述过滤器上的至少一个已知大小和量的RNA分子群体。样品洗脱效率有时提供从所述过滤器上成功洗脱下来的样品比例的信息。在某些情况下,样品洗脱效率包括总体洗脱效率、基于疏水性的洗脱效率和洗脱下来的样品比例中的至少一种。在一些情况下,指示样品洗脱效率的标志物包含疏水性大于样品中预期分子阈值百分比的分子群体。疏水性大于样品中预期分子的至少90%的分子群体的洗脱通常表明样品中大多数分子的成功洗脱。有时,指示样品洗脱效率的标志物包含亲水性大于样品中预期分子的至少90%的分子群体。在各个方面,指示样品洗脱效率的标志物包含至少一个已知大小和量的分子群体。过滤器储存条件通常包括过滤器储存持续时间、温度暴露、光暴露、UV暴露、辐射暴露和湿度暴露中的至少一种。在某些情况下,指示湿度暴露的标志物在暴露于阈值湿度后产生可观察的信号。在一些情况下,所述可观察的信号是可见光谱的颜色。指示湿度暴露的标志物通常是不可逆的湿度标志物,其包含潮解性分子群体和至少一种染料。在许多情况下,指示温度暴露的标志物在暴露于阈值温度后产生可观察的信号。所述多个标志物任选地包含在暴露于光、UV和辐射中的至少一种之后展现出可观察信号的分子群体。在某些情况下,所述多个QC标志物包含选自洗脱标志物、湿度标志物、pH标志物、温度标志物、时间标志物、蛋白水解标志物、核酸酶标志物、稳定性标志物、辐射标志物、UV标志物和光标志物的至少一种标志物。在许多方面,所述至少一种条件包括样品完整性。所述至少一种条件一般包括样品洗脱效率。有时,所述至少一种条件包括过滤器储存条件。在一些情况下,所述多个QC标志物包含分子传感器群体。该分子传感器群体经常包含多肽、核酸、脂质、代谢物和碳水化合物中的至少一种。在各种情况下,该分子传感器群体具有非生物学结构。该分子传感器群体有时包含有机染料、无机染料、荧光团、量子点、荧光蛋白、热敏蛋白和放射性标记物中的至少一种。通常,在检测到目标分子后,该分子传感器群体经历可观察的变化。该分子传感器群体通常在检测到目标分子后产生可观察的信号。在许多情况下,所述可观察的信号是可见颜色变化、UV信号、发光信号和荧光信号中的至少一种。目标分子的检测通常包括分子传感器群体与目标分子之间的化学反应。在各种情况下,目标分子的检测包括分子传感器群体对目标分子的分子识别。该分子传感器群体任选地包含用于检测目标分子的分子识别组分和用于在检测到目标分子时提供可观察信号的报告组分。通常,所述多个QC标志物中的至少一个可通过质谱法检测。在一些情况下,所述多个QC标志物中的至少一个可通过免疫测定检测。所述多个QC标志物常常包含具有参考多肽群体的参考标志物。有时,该参考群体包含相对于样品中的相应多肽具有质量位移的多肽。在某些实施方案中,该参考群体与样品中相应多肽群体的区别在于在质谱输出上可检测的质量。该参考群体与样品中的相应多肽的区别通常在于与原子和该原子的重同位素之间的质量差异相当的质量。该参考群体经常用重同位素进行标记,该重同位素在质谱分析中以相对于样品多肽群体的可预测偏移进行迁移。在各种情况下,该参考群体与样品中的相应多肽的区别在于与通过翻译后修饰增加的质量相当的质量。该翻译后修饰通常包括肉豆蔻酰化、棕榈酰化、异戊二烯化、糖基磷脂酰肌醇化、脂化、酰化、乙酰化、甲基化、酰胺化、糖基化、羟基化、琥珀酰化、硫酸化、糖化、氨基甲酰化、羰基化、生物素化、氧化、聚乙二醇化、SUMO化、泛素化、类泛素化和磷酸化中的至少一种。在一些情况下,所述用于接收样品的表面包含用于样品沉积的区域。有时,所述样品包含全血、血清、血浆、尿液、唾液、汗液、眼泪、脑脊液、羊水和抽吸物中的至少一种。有时,样品在沉积后干燥并储存在所述过滤器上。样品通常以干燥的血液斑点的形式储存在所述过滤器上。在许多情况下,所述多个QC标志物中的至少一个标志物被设置在所述过滤器上的样品沉积区域之内,使得样品在过滤器上的沉积将所述至少一个标志物引入该样品中。在各种情况下,所述多个QC标志物中的至少一个标志物被设置在所述过滤器上的样品沉积区域之外,使得样品在过滤器上的沉积不将所述至少一个标志物引入该样品中。在某些情况下,所述多个QC标志物包含至少一个位于所述过滤器上的标志物,以与样品共洗脱。所述多个QC标志物常常包含至少一个位于所述过滤器上的标志物,而不与样品共洗脱。在某些方面,所述多个QC标志物中的至少一个标志物沉积在所述装置上,使得对至少一种样品的处理将所述至少一个标志物引入一种样品中。在某些情况下,所述多个QC标志物中的至少一个标志物沉积在所述装置上,使得对至少一种样品的处理不将所述至少一个标志物引入所述至少一种样品中。所述表面一般包含用于样品沉积的区域。在许多情况下,所述多个QC标志物中的至少一个标志物在样品沉积之前沉积在所述区域上。所述多个QC标志物中的至少一个标志物通常在样品沉积之前沉积在与所述区域分开的表面上的位置上。有时,所述采集装置进一步包含固体背衬。在许多情况下,所述采集装置进一步包含细胞不可透过的多孔层。在某些方面,所述采集装置进一步包含血浆采集储器。所述采集装置通常包含扩散层。在一些情况下,所述采集装置包含用于增强对内源性蛋白质或肽的检测的至少一个参考生物标志物群体。所述参考生物标志物可映射到该内源性蛋白质或肽上的突变。所述参考生物标志物可以促进疾病信号和/或健康状态的检测。
本文公开了用于基于多个标志物来筛选沉积在采集装置上的样品的系统,该系统包含存储器和处理器,其被配置用于:a)分析多个质量控制(QC)标志物,所述多个QC标志物指示至少两种选自下组的条件:温度暴露、湿度暴露、样品pH、洗脱效率和蛋白水解活性;并且b)基于a)中评估的至少两种条件,对从所述样品获得的数据进行门控,以从后续分析中去除所述数据的至少一个子集。
本文公开了用于基于设置在采集装置上的多个质量控制(QC)标志物来筛选沉积在该采集装置上的样品的系统,该系统包含存储器和处理器,其被配置用于:a)分析所述多个QC标志物;并且b)基于a)中的分析对从所述样品获得的数据进行归一化,以从后续分析中去除所述数据的至少一个子集中的偏性。
本文公开了用于基于多个质量控制(QC)标志物来筛选沉积在采集装置上的样品的系统,该系统包含存储器和处理器,其被配置用于:a)评价所述多个QC标志物;并且b)当在步骤b)中评价所述多个QC标志物表明所述样品不适合分析时,从后续分析中筛选出该样品。
本文公开了基于多个标志物来筛选沉积在采集装置上的样品的系统,该系统包含存储器和处理器,其被配置用于:a)评价所述多个QC标志物,所述多个QC标志物指示至少两种选自下组的条件:温度暴露、湿度暴露、样品pH、洗脱效率和蛋白水解活性;并且b)基于步骤a)中评估的至少两种条件,从后续分析中筛选出所述样品。
本文公开了用于样品分析的参考标志物,如映射到蛋白质中的多个区域并提供关于该蛋白质的突变状态的信息的参考多肽。参考多肽例如通过促进鉴定它们所映射的蛋白质中的截短、融合、易位、插入、缺失或点突变事件来增强它们所映射的内源性蛋白质的表征。参考标志物可以与QC标志物组合使用。在一些情况下,标志物既充当参考标志物,又充当QC标志物,例如用于检测内源性蛋白质/多肽的参考多肽,其在样品采集之前沉积在样品采集装置上,以控制样品降解和/或洗脱效率。
所述参考多肽通常增强内源性多肽的定量,使得可以更容易地对映射到蛋白质不同区域的肽的相对丰度进行定量。在这些情况下,可以容易地鉴别出差异性影响蛋白质不同区域的丰度的截短或其他事件。有时,在质谱分析之前,将参考生物分子或生物标志物如参考多肽以已知量添加到样品中,以便于诸如蛋白质/多肽、脂质、碳水化合物、核酸或代谢物等内源性生物标志物的定量。可以在样品采集之前将参考生物分子或生物标志物沉积或添加到采集装置上。通过与具有已知输入量的参考标志物的定量进行比较,可以促进内源性生物分子的定量。例如,可以将包含具有特定定量(例如,1纳克)的生物分子群体的参考标志物与相应的内源性生物分子群体进行比较,以估计或促进对内源性生物分子群体的定量和/或浓度的估计。在一些情况下,参考标志物包含具有一种或多种已知输入量的多个不同生物分子群体。例如,在一些情况下,可以使用输入量逐渐增加的多个生物分子群体的阶梯来建立信号(例如,质谱检测器的信号)与输入量之间的关系(例如,线性、对数关系)。可以对该关系进行图形化或建模,并用其估计内源性生物分子的定量。
在某些情况下,所述参考多肽映射到跨越至少一个突变位点的区域,或提供关于特定位点的突变的信息。设计提供突变信息的多肽有助于表征相对于野生型或其他参考蛋白质具有以下差异的突变或等位基因:点突变、插入、缺失、移码、插入、缺失、截短、融合、易位或其他相对于野生型或参考蛋白质的变异。在许多情况下,所述参考多肽映射到选自下组的区域:与突变相邻的区域、与突变至少部分重叠的区域以及在突变的相对侧的区域。该突变有时是截短、融合或易位。通常,所述参考多肽包含第一突变参考多肽群体,该群体映射到所述蛋白质中具有与疾病有关的点突变的区域。在一些方面,所述参考多肽包含第二野生型参考多肽群体,该群体映射到所述蛋白质中没有点突变的区域,使得野生型和突变蛋白质的相对定量更容易实现。在一些情况下,所述参考多肽包含控制选自样品完整性、样品洗脱效率和样品储存条件的至少一种条件的QC多肽标志物。
在一些实施方案中,所述参考多肽是映射到蛋白质的内源性多肽的质量位移类似物。质量位移的参考多肽和样品中的内源性多肽在质谱输出上作为双峰被轻易地检测到。有时,所述参考多肽与内源性多肽的区别在于质谱输出上可检测的质量。参考多肽通过任意数目的质量位移修饰(如重或轻同位素掺入)进行标记,或者与内源性多肽的区别在于与通过翻译后修饰增加的质量相当的质量。本文考虑的翻译后修饰包括肉豆蔻酰化、棕榈酰化、异戊二烯化、糖基磷脂酰肌醇化、脂化、酰化、乙酰化、甲基化、酰胺化、糖基化、羟基化、琥珀酰化、硫酸化、糖化、氨基甲酰化、羰基化、生物素化、氧化、聚乙二醇化、SUMO化、泛素化、类泛素化和磷酸化中的至少一种。有时,在质谱分析之前,将参考生物分子或生物标志物以已知量添加到样品中,以便于诸如蛋白质/多肽、脂质、碳水化合物、核酸或代谢物等内源性生物标志物的定量。可以在样品采集之前将参考生物分子或生物标志物沉积或添加到采集装置上。在某些情况下,在质谱分析或其他多肽定量测定之前,将参考多肽以已知量添加到样品中,以便于定量。所述参考多肽通常构成参考生物标志物。在各个方面,所述参考多肽包含均质的多肽群体。有时,所述参考多肽包含多个多肽群体。所述参考多肽可包含QC多肽标志物群体。
本文还公开了评估与所述多肽的使用有关的个体的疾病状态的方法。一些方法包括将疾病或突变信息性多肽添加到样品中,以便更容易地评估样品中蛋白质的状态。多肽有助于确定和量化蛋白质群体中的突变。例如,对应于野生型和点突变多肽片段的质量位移多肽促进了突变和野生型蛋白质对样品中蛋白质池的相对贡献的检测和定量。因此,通过测定野生型和突变蛋白质的相对贡献,可以确定在对于引起疾病的突变而言是杂合的个体中,疾病是否可能进展。
类似地,可以测定由基因组易位事件引起的与蛋白质截短或融合有关的突变的相对贡献。这些方法包括通过映射到目标蛋白质各个区域的多肽所促进的对目标蛋白质各个区域的定量。通过对多肽片段在蛋白质不同区域的积累进行定量,能够检测出仅翻译一部分蛋白质的截短事件。蛋白质的一个区段相对于另一个区段的差异积累表明,完整蛋白质的积累少于片段的积累。
类似地,对多种蛋白质进行该分析允许检测出截短和蛋白质融合两者。当观察到来自无关蛋白质的多肽水平彼此共同变化时,可以检测到蛋白质融合,这表明这些区段得到翻译并累积在单个蛋白质中。当导致共变的融合或易位在细胞或细胞群体中是杂合的时,这些区段的共变是部分的,因为来自未融合的等位基因的蛋白质在积累水平上保持独立变化,而来自蛋白质融合部分的区段将在所测得的占这些片段总数的一定比例上共同变化。或者,当细胞群体因融合事件而变为纯合时,会看到不同蛋白质的区段之间有严格的共变,并且根据蛋白质之间的融合点,可能还会看到一种或两种蛋白质的截短的迹象。
靶向突变体的多肽被单独使用,或者在一些情况下用作初始筛选。或者,靶向突变体的多肽及其相关方法通常用作后续筛查策略,以支持指示相关基因组事件的基因组测序结果,或者支持筛查与蛋白质(可获得针对其的靶向突变体的多肽)有关的疾病或病症的标志物或症状。
一些这样的方法包括:a)对于从个体采集的样品分析包含至少一个生物标志物的第一生物标志物小组,以检测至少一个疾病信号;b)当检测到所述至少一个疾病信号时,选择第二个生物标志物小组用于进一步分析;以及c)分析第二生物标志物小组以评估所述个体的疾病状态。各个方面结合了至少一个以下要素。有时,分析第一生物标志物小组包括评价与第一生物标志物小组相对应的质谱数据。分析第一生物标志物小组通常包括针对靶向第一生物标志物小组的抗体小组测定样品。在某些情况下,分析第二生物标志物小组包括评价与第二生物标志物小组相对应的质谱数据。分析第二生物标志物小组有时包括针对靶向第二生物标志物小组的抗体小组测定样品。在某些情况下,分析生物标志物小组包括检测与至少一种疾病相关的至少一个生物标志物的点突变、插入、缺失、移码点突变、截短、融合、易位、量、存在和不存在中的至少一项。在许多情况下,检测截短包括检测截短的生物标志物的未缺失区域和缺失区域之间的共变的减少。通常,检测融合包括检测第一区域和第二区域之间的共变的增加,所述第一区域和第二区域已融合形成融合生物标志物,并且在不存在易位的情况下未观察到其在多肽积累水平上共同变化。检测易位有时包括检测已融合形成易位生物标志物的第一生物标志物的区域和第二生物标志物的区域之间的共变的增加。替代地或组合地,检测易位包括检测蛋白质的第一区域和第二区域的积累水平之间的共变的减少。分析生物标志物小组有时包括评价从样品获得的质谱数据的子集。在许多情况下,该子集占质谱数据的不超过10%。在一些情况下,第一生物标志物小组包含单个生物标志物。第一生物标志物小组一般包含不超过10个生物标志物。在某些情况下,第一生物标志物小组包含至少10个生物标志物。第一生物标志物小组通常包含用于筛选多个疾病信号的存在的生物标志物。有时,将疾病状态与从个体采集的另一个样品的疾病状态进行比较,以评估疾病进展。在某些方面,分析第一生物标志物小组包括使用至少一个参考标志物来增强对至少一个生物标志物的鉴别。分析第一生物标志物小组有时包括使用至少一个参考标志物来增强至少一个生物标志物的定量。在一些实施方案中,所述至少一个参考标志物包含相对于样品中的相应内源性多肽具有质量位移的参考多肽。参考多肽和样品中的内源性相应多肽通常在质谱输出上作为双峰被检测到,特别是当参考多肽相对于目标多肽具有质量位移时,例如通过添加质量位移修饰。有时,参考多肽与样品中相应的内源性多肽的区别在于质谱输出上可检测的质量。例如,参考多肽标志物用重同位素、甲基化、烷基化、乙酰化、磷酸化或以其他方式进行修饰,以影响在质谱分析中的迁移,因此它们在质谱分析中以相对于样品中相应内源性多肽的可预测偏移进行迁移。参考多肽与样品中相应的内源性多肽的区别常常在于与通过翻译后修饰增加的质量相当的质量。在许多情况下,该翻译后修饰包括肉豆蔻酰化、棕榈酰化、异戊二烯化、糖基磷脂酰肌醇化、脂化、酰化、乙酰化、甲基化、酰胺化、糖基化、羟基化、琥珀酰化、硫酸化、糖化、氨基甲酸酯化、羰基化、生物素化、氧化、聚乙二醇化、SUMO化、泛素化、类泛素化和磷酸化。许多样品来源与本文的公开内容一致。例如,样品选自细胞样品、固体样品和液体样品。通常通过活检、抽吸、拭子或涂片或其他采集方法来采集样品。在某些情况下,样品选自组织、痰、粪便、全血、血清、血浆、尿液、唾液、汗液、眼泪、脑脊液、羊水和抽吸物。在一些分析方案中,在许多情况下,在样品采集装置上从个体采集样品,该样品采集装置包含具有用于样品沉积的表面的基底,以及包含设置在该基底上的至少一个参考生物标志物的参考生物标志物小组。在一些情况下,该样品采集装置包含至少一个QC标志物,用于评估选自样品完整性、样品洗脱效率和样品储存条件的至少一种条件。
本文公开了评估个体的疾病状态的方法,其包括:a)获得从个体采集的样品的数据;b)分析该数据的第一子集以检测至少一个疾病信号;c)当检测到所述至少一个疾病信号时,选择该数据的第二子集用于进一步分析;以及d)分析该数据的第二子集以评估疾病状态。各个方面结合了至少一个以下要素。有时,所述数据是蛋白质质谱数据。分析所述数据的第一子集通常包括评价与至少一种疾病相关的至少一个生物标志物。分析所述数据的第一子集有时包括检测与所述至少一种疾病相关的至少一个生物标志物的点突变、插入、缺失、移码点突变、截短、融合、易位、量、存在和不存在中的至少一项。在各种情况下,检测截短包括检测截短的生物标志物的未缺失区域和缺失区域之间的共变的减少。检测融合包括检测第一区域和第二区域之间的共变的增加,所述第一区域和第二区域已融合形成融合生物标志物,并且在不存在融合事件的情况下存在于不同的独立累积的蛋白质上。检测易位通常包括检测已融合形成易位生物标志的第一生物标志物的区域和第二生物标志物的区域之间的共变的增加。在某些情况下,检测易位进一步包括检测内源性或野生型蛋白质内第一位置处的组分与该内源性或野生型蛋白质第二位置处的多肽之间的共变的减少。与完整地分析数据相比,分析该数据的第一子集和第二子集通常具有更短的计算时间。计算时间一般比完整地分析数据至少短两倍。在许多情况下,数据的第一子集包含该数据的不超过10%。对于某些标志物集,数据的第一子集包含不超过10个生物标志物的数据。数据的第一子集有时包含至少10个生物标志物的数据。在许多情况下,数据的第一子集对应于指示至少一个疾病信号的第一生物标志物小组。数据的第二子集通常对应于指示疾病状态的第二生物标志物小组。数据的第一子集通常包含比数据的第二子集更少的生物标志物的数据。在某些情况下,所述至少一个疾病信号包含与至少一种疾病或状况相关的至少一个生物标志物。将疾病或状况状态与从该个体采集的另一个样品的疾病或状况状态进行比较,或者与来自第二个体的样品进行比较,或者与预测的参考物或与大量样品或其他参考物进行比较,以评估疾病进展。分析数据的第一子集通常包括使用至少一个参考标志物来增强对至少一个生物标志物的鉴别。有时,分析数据的第一子集包括使用至少一个参考标志物来增强对至少一个生物标志物的定量。许多参考标志物与本文的公开内容一致。通常,所述至少一个参考标志物包含相对于样品中相应的内源性多肽具有质量位移的参考多肽。在某些情况下,参考多肽和样品中的内源性相应多肽在质谱输出上作为双峰被检测到。在一些情况下,参考多肽与样品中相应的内源性多肽的区别在于在质谱输出上可检测的质量。许多参考多肽用重同位素进行标记,并且在质谱分析中以相对于样品中相应内源性多肽的可预测偏移进行迁移。参考多肽与样品中相应的内源性多肽的区别通常在于与通过翻译后修饰增加的质量相当的质量。在许多方面,该翻译后修饰包括肉豆蔻酰化、棕榈酰化、异戊二烯化、糖基磷脂酰肌醇化、脂化、酰化、乙酰化、甲基化、酰胺化、糖基化、羟基化、琥珀酰化、硫酸化、糖化、氨基甲酰化、羰基化、生物素化、氧化、聚乙二醇化、SUMO化、泛素化、类泛素化和磷酸化中的至少一种。所述样品通常选自细胞样品、固体样品和液体样品。有时,通过活检、抽吸、拭子或涂片来采集样品。在一些情况下,该样品选自组织、痰、粪便、全血、血清、血浆、尿液、唾液、汗液、眼泪、脑脊液、羊水和抽吸物。在一些情况下,使用包含至少一个QC标志物的样品采集装置采集样品,所述至少一个QC标志物用于评估至少一种选自下组的条件:样品完整性、样品洗脱效率和样品储存条件。在一些情况下,该样品采集装置包含至少一个QC标志物和至少一个参考标志物,它们在样品采集之前、样品采集期间、样品采集之后、样品洗脱之前、样品洗脱期间、样品洗脱之后、样品消化之前、样品消化期间或样品消化之后,各自独立地放置在该样品采集装置上或与样品混合。
本文公开了确定疾病状态的方法,其包括:a)获得样品的质谱数据;b)从该质谱数据分析第一生物标志物小组,以检测超过阈值的疾病信号;以及c)从该质谱数据分析第二生物标志物小组,以评估疾病状态。
本文公开了确定疾病状态的方法,其包括:a)获得样品的质谱数据;b)对该质谱数据进行数据质量检查;以及c)分析指示疾病状态并通过数据质量检查的该质谱数据的子集。
本文公开了用于评估个体的疾病状态的系统,其包含存储器和至少一个处理器,其被配置用于:a)获得从个体采集的样品的数据;b)分析该数据的第一子集以检测至少一个疾病信号;c)当检测到所述至少一个疾病信号时,选择该数据的第二子集用于进一步分析;并且d)分析该数据的第二子集以评估疾病状态。各个方面结合了至少一个以下要素。有时,所述数据是蛋白质质谱数据。在许多情况下,分析所述数据的第一子集包括评价与至少一种疾病相关的至少一个生物标志物。分析所述数据的第一子集有时包括检测与所述至少一种疾病相关的至少一个生物标志物的点突变、插入、缺失、移码点突变、截短、融合、易位、量、存在和不存在中的至少一项。在各种情况下,检测截短包括检测截短的生物标志物的未缺失区域和缺失区域之间的共变的减少。检测融合不同地包括检测已融合形成融合生物标志物的第一区域和第二区域之间的共变的增加。检测易位通常包括检测已融合形成易位生物标志的第一生物标志物的区域和第二生物标志物的区域之间的共变的增加。在某些情况下,检测易位进一步包括检测第一生物标志物的各个位置处的组分之间相对于彼此的共变的减少。在各种情况下,与完整地分析数据相比,分析该数据的第一子集和第二子集具有更短的计算时间。计算时间一般比完整地分析数据至少短两倍。在许多情况下,数据的第一子集该数据的不超过10%。在一些方面,数据的第一子集包含不超过10个生物标志物的数据。数据的第一子集有时包含至少10个生物标志物的数据。在许多情况下,数据的第一子集对应于指示至少一个疾病信号的第一生物标志物小组。在各种情况下,数据的第二子集对应于指示疾病状态的第二生物标志物小组。数据的第一子集通常包含比数据的第二子集更少的生物标志物的数据。在某些情况下,所述至少一个疾病信号包含与至少一种疾病相关的至少一个生物标志物。将疾病状态与从该个体采集的另一个样品的疾病状态进行比较,以评估疾病进展。分析数据的第一子集通常包括使用至少一个参考标志物来增强对至少一个生物标志物的鉴别。有时,分析数据的第一子集包括使用至少一个参考标志物来增强对至少一个生物标志物的定量。相对于样品中相应的内源性多肽具有质量位移的参考多肽是合适的参考标志物,但是也考虑了其他参考标志物。在某些情况下,参考多肽和样品中的内源性相应多肽在质谱输出上作为双峰被检测到。在一些这样的情况下,在一些情况下,参考多肽与样品中相应的内源性多肽的区别在于在质谱输出上可检测的质量。许多参考多肽用重同位素进行标记,并且在质谱分析中以相对于样品中相应内源性多肽的可预测偏移进行迁移。通常,参考多肽与样品中相应的内源性多肽的区别在于与通过翻译后修饰增加的质量相当的质量。示例性的翻译后修饰包括肉豆蔻酰基化、棕榈酰化、异戊二烯化、糖基磷脂酰肌醇化、脂化、酰化、乙酰化、甲基化、酰胺化、糖基化、羟基化、琥珀酰化、硫酸化、糖化、氨基甲酸酯化、羰基化、生物素化、氧化、聚乙二醇化、SUMO化、泛素化、类泛素化和磷酸化中的至少一种。多个样品与本文的公开内容一致。所述样品通常选自细胞样品、固体样品和液体样品。有时,通过活检、抽吸、拭子或涂片来采集样品。选自组织、痰、粪便、全血、血清、血浆、尿液、唾液、汗液、眼泪、脑脊液、羊水和抽吸物的样品也与本文的公开内容一致。在一些情况下,使用包括至少一个QC标志物的样品采集装置采集样品,所述至少一个QC标志物用于评估至少一种选自下组的条件:样品完整性、样品洗脱效率和样品储存条件。在一些情况下,该样品采集装置包含至少一个QC标志物和至少一个参考标志物,它们在样品采集之前、样品采集期间、样品采集之后、样品洗脱之前、样品洗脱期间、样品洗脱之后、样品消化之前、样品消化期间或样品消化之后,各自独立地放置在该样品采集装置上或与样品混合。
本文公开了用于评估样品的疾病状态的系统,其包含存储器和至少一个处理器,其被配置用于:a)获得样品的质谱数据;b)从该质谱数据分析第一生物标志物小组,以检测超过阈值的疾病信号;并且c)从该质谱数据分析第二生物标志物小组,以评估疾病状态。
本文公开了用于评估样品的疾病状态的系统,其包含存储器和至少一个处理器,其被配置用于:a)获得样品的质谱数据;b)对该质谱数据进行数据质量检查;并且c)分析指示疾病状态并通过数据质量检查的该质谱数据的子集。
本文公开了疾病检测试剂盒,其包含:a)针对指示至少一个疾病信号的至少一个生物标志物的第一抗体小组;和b)针对指示疾病状态的至少一个生物标志物的第二抗体小组。
本文公开了确定疾病状态的方法,其包括:a)获得样品;b)针对第一抗体小组分析该样品以检测至少一个疾病信号;以及c)当第一抗体小组检测到该疾病信号时,针对第二抗体小组测定该样品,以确定疾病状态。各个方面结合了至少一个以下要素。在一些情况下,在对样品进行另外的检测之前,针对第一抗体小组对样品进行测定提供了初始筛选,以检测所述至少一个疾病信号。在各种情况下,第一抗体小组允许检测与至少一种疾病相关的至少一个生物标志物的点突变、插入、缺失、移码突变、截短、融合、易位、量、存在和不存在中的至少一项。检测截短有时包括检测截短的生物标志物的未缺失区域和缺失区域之间的共变的减少。在某些情况下,检测融合包括检测已融合形成融合生物标志物的第一区域和第二区域之间的共变的增加。在许多方面,检测易位包括检测已融合形成易位生物标志物的第一生物标志物的区域和第二生物标志物的区域之间的共变的增加。检测易位通常进一步包括检测第一生物标志物的组分之间和第二生物标志物的组分之间的共变的减少。有时,所述至少一个疾病信号包含与至少一种疾病相关的至少一个生物标志物。在某些方面,将疾病状态与从该个体采集的另一个样品的疾病状态进行比较,以评估疾病进展。在针对第一抗体小组测定样品之前,常常将所述至少一个参考标志物添加至样品中,以增强对至少一个生物标志物的鉴别。有时,针对第一抗体小组测定样品包括使用所述至少一个参考标志物来增强对至少一个生物标志物的定量。在某些情况下,所述至少一个参考标志物包含相对于样品中相应的内源性多肽具有质量位移的参考多肽。在一些情况下,参考多肽与样品中相应的内源性多肽的区别在于通过免疫测定可检测的质量。参考多肽有时包含通过免疫测定可检测的表位标签。在许多情况下,所述第一和第二抗体小组中的至少一个包含检测表位标签的抗体。在某些实施方案中,参考多肽与样品中相应的内源性多肽的区别在于与通过翻译后修饰增加的质量相当的质量。该翻译后修饰通常包括肉豆蔻酰化、棕榈酰化、异戊二烯化、糖基磷脂酰肌醇化、脂化、酰化、乙酰化、甲基化、酰胺化、糖基化、羟基化、琥珀酰化、硫酸化、糖化、氨基甲酰化、羰基化、生物素化、氧化、聚乙二醇化、SUMO化、泛素化、类泛素化和磷酸化中的至少一种。有时,所述样品选自细胞样品、固体样品和液体样品。在许多情况下,通过活检、抽吸、拭子或涂片来采集样品。该样品通常选自组织、痰、粪便、全血、血清、血浆、尿液、唾液、汗液、眼泪、脑脊液、羊水和抽吸物。在一些情况下,使用包含至少一个QC标志物的样品采集装置采集样品,所述至少一个QC标志物用于评估选自样品完整性、样品洗脱效率和样品储存条件的至少一种条件。在一些情况下,该样品采集装置包含至少一个QC标志物和至少一个参考标志物,它们在样品采集之前、样品采集期间、样品采集之后、样品洗脱之前、样品洗脱期间、样品洗脱之后、样品消化之前、样品消化期间或样品消化之后,各自独立地放置在该样品采集装置上或与样品混合。
本文公开了采集装置,其包含:a)基底,该基底包含用于接收样品的表面;b)第一参考生物标志物小组,其设置在该基底上并且对应于指示疾病信号的至少一个生物标志物;和c)第二参考生物标志物小组,其设置在该基底上并且对应于指示疾病状态的至少一个生物标志物。
本文公开了采集装置,其包含:a)基底,该基底包含用于接收样品的表面;和b)设置在该基底上的参考生物标志物小组,其增强对指示疾病信号的至少一个内源性生物标志物的检测。各个方面结合了至少一个以下要素。有时,参考生物标志物小组增强对指示至少一种疾病的至少一个内源性生物标志物的点突变、插入、缺失、移码突变、截短、融合、易位、量、存在和不存在中的至少一项的检测。在某些情况下,检测截短包括检测截短的生物标志物的未缺失区域和缺失区域之间的共变的减少。检测融合有时包括检测已融合形成融合生物标志物的第一区域和第二区域之间的共变的增加。在某些情况下,检测易位包括检测已融合形成易位生物标志的第一生物标志物的区域和第二生物标志物的区域之间的共变的增加。在各个方面,检测易位进一步包括检测第一生物标志物的组分之间和第二生物标志物的组分之间的共变的减少。参考生物标志物小组通常包含不超过10个生物标志物。在许多情况下,参考生物标志物小组包含至少10个生物标志物。在一些情况下,在检测到指示疾病的至少一个生物标志物之后,测定样品的疾病状态。所述至少一个疾病信号通常包含与至少一种疾病相关的至少一个生物标志物。有时,将疾病状态与从该个体采集的另一个样品的疾病状态进行比较,以评估疾病进展。在各个方面,所述至少一个疾病信号包含与至少一种疾病相关的至少一个生物标志物。有时,将疾病状态与从该个体采集的另一个样品的疾病状态进行比较,以评估疾病进展。通常,参考生物标志物小组包含已知量的至少一个参考标志物,其用于增强至少一个内源性生物标志物的定量。在某些情况下,所述至少一个参考标志物包含相对于样品中相应的内源性多肽具有质量位移的参考多肽。参考多肽和样品中的内源性相应多肽通常在质谱输出上作为双峰被检测到。有时,参考多肽与样品中相应的内源性多肽的区别在于在质谱输出上可检测的质量。在许多情况下,参考多肽用重同位素进行标记,并且在质谱分析中以相对于样品中相应内源性多肽的可预测偏移进行迁移。参考多肽有时与样品中相应的内源性多肽的区别在于通过免疫测定可检测的质量。在某些方面,参考多肽包含通过免疫测定可检测的表位标签。在许多情况下,参考多肽与样品中相应的内源性多肽的区别在于与通过翻译后修饰增加的质量相当的质量。该翻译后修饰一般包括肉豆蔻酰化、棕榈酰化、异戊二烯化、糖基磷脂酰肌醇化、脂化、酰化、乙酰化、甲基化、酰胺化、糖基化、羟基化、琥珀酰化、硫酸化、糖化、氨基甲酰化、羰基化、生物素化、氧化、聚乙二醇化、SUMO化、泛素化、类泛素化和磷酸化中的至少一种。通常,所述样品选自细胞样品、固体样品和液体样品。在许多情况下,通过活检、抽吸、拭子或涂片来采集样品。在一些情况下,该样品选自组织、痰、粪便、全血、血清、血浆、尿液、唾液、汗液、眼泪、脑脊液、羊水和抽吸物。用于接收样品的表面通常包含用于样品沉积的区域。在一些情况下,样品在沉积后干燥并储存在采集装置上。在一些情况下,样品作为干燥的血液斑点储存在采集装置上。一般将来自参考生物标志物小组的至少一个参考标志物设置在基底上的样品沉积区域之内,使得样品在基底上的沉积将所述至少一个参考标志物引入该样品中。有时,将来自参考生物标志物小组的至少一个参考标志物设置在基底上的样品沉积区域之外,使得样品在基底上的沉积不将所述至少一个参考标志物引入该样品中。参考生物标志物小组一般包含位于基底上的至少一个参考标志物,以与样品共洗脱。在一些方面,参考生物标志物小组包含位于基底上的至少一个参考标志物,而不与样品共洗脱。在某些情况下,所述采集装置包含固体背衬。该采集装置通常包含细胞不可透过的多孔层。在一些情况下,该采集装置包含血浆采集储器。有时,该采集装置包含扩散层。在一些情况下,使用包含至少一个QC标志物的样品采集装置采集样品,所述至少一个QC标志物用于评估选自样品完整性、样品洗脱效率和样品储存条件的至少一种条件。在一些情况下,所述样品采集装置包含至少一个QC标志物和至少一个参考标志物,它们在样品采集之前、样品采集期间、样品采集之后、样品洗脱之前、样品洗脱期间、样品洗脱之后、样品消化之前、样品消化期间或样品消化之后,各自独立地放置在该样品采集装置上或与样品混合。
援引并入
本说明书中所提及的所有出版物、专利和专利申请均通过引用并入本文,其程度犹如具体地且单独地指出每个单独的出版物、专利或专利申请均通过引用而并入。
附图说明
通过参考以下对利用本发明原理的说明性实施方案加以阐述的详细描述以及附图,将会对本发明的特征和优点获得一些理解。
本专利或申请文件包含至少一张以彩色绘制的附图。在请求并支付必要的费用后,专利局将会提供具有彩图的该专利或专利申请公布文本的副本。
图1描绘了Noviplex DBS Plasma卡。
图2描绘了48个重复物的质谱输出数据。
图3描绘了卡内(左图)和卡间(右图)变异系数(CV)值。
图4描绘了卡内(左图)和卡间(右图)CV值。
图5描绘了卡间CV值。
图6示出了仪器响应近似于内源性血浆浓度。
图7是描绘与归一化的仪器响应相比较的蛋白质浓度排序的图。
图8示出了使用肽AGLNSNDAFVLK(左图)和肽EVQGFESATFLGYFK(右图)检测的血浆凝溶胶蛋白水平。
图9示出了对于性别的正确类别和随机化类别,平均真阳性率与假阳性率之间的相关性。
图10示出了对于性别的正确类别和随机化类别,真阳性率和假阳性率的种族分类。
图11示出了对于CRC状态的正确类别和随机化类别,平均真阳性率与假阳性率之间的相关性。
图12示出了对于CRC状态的正确类别和随机化类别,平均真阳性率与假阳性率之间的相关性。
图13示出了对于CAD状态的顶部模型和随机化类别,灵敏度与特异性之间的相关性。
图14示出了30分钟(左图)和10分钟(右图)梯度的梯度。
图15示出了30分钟(左)和10分钟方案的数据图像。
图16描绘了生物标志物的来源。
图17描绘了从呼吸中捕获的渗出物生成的原始质谱数据的示例。
图18描绘了多源生物标志物方案的整合。
图19A示出了样品的质谱输出。
图19B示出了覆盖有外源添加的重标记标志物的位置的样品的质谱输出。
图20示出了对于代表性标志物列表,经历自动化鉴别和推定标志物斑点信号定量的标志物斑点。
图21A示出了可以根据本文描述的方法评价的蛋白质和蛋白质突变的示例。
图21B示出了用于样品评价的分析方法的示例。
图22示出了用于执行本文描述的方法的示例性计算系统。
具体实施方式
本文公开了与使用标志物与样品评估或分析有关的系统、组合物、装置和方法。标志物可用来提供样品的质量控制评估和/或用于样品分析,以获得与患者健康相关的关于样品信息。在一些情况下,标志物允许对采集在固体基底如滤纸上的液体样品进行质量控制评估。标志物可用来评估样品中的特定事件或事件组合,如指示患者健康如疾病状态的事件。可以将各种流体如全血采集在过滤器上,并作为干燥的斑点样品进行储存,以供后续分析。然而,从此类样品获得的数据的质量受到暴露于会导致样品变质的条件的严重影响。此外,样品处理和加工中的变化可能会使后续分析,如通过质谱法进行的肽定量产生偏差。
因此,本文公开了充当样品采集、储存、运输、洗脱或与干燥液体样品的处置有关的其他程序的质量控制指示物的标志物。本文的公开内容的实践允许评价样品以增强下游应用,例如通过对样品中生物标志物的准确、可重复的测量对患者健康状态的持续监测。质量控制(QC)标志物允许在后续样品处理和分析之前将样品丢弃,筛选样品数据以滤除不可靠的信息,对数据进行归一化以解决在样品采集和/或后续程序中引入的变异,或基于质量控制指示的其他步骤。QC标志物可以提供储存条件如湿度水平、温度、光暴露、储存持续时间或其他影响样品变质和/或数据质量的条件的信息。在QC标志物指示来自样品的一些而非全部数据遭到破坏的情况下,可以对数据进行门控,以从后续分析中去除受损的数据子集。当在样品采集和/或后续程序过程中引入样品之间或样品成分之内的变异时,可以使用QC标志物通过数据归一化解决此类变异。实例包括对量化的生物标志物进行归一化,以解决使用指示洗脱效率的相应质量控制标志物确定的洗脱差异。
本文还公开了允许通过分析来源于患者的样品中的生物标志物如蛋白质来检测和/或监测患者健康状态的标志物(例如生物标志物)。生物标志物分析通常针对特定的健康状态或状况或一组状况,并且可以包括生物标志物或生物标志物组分的比较,以鉴定突变,如截短、融合、易位、插入、缺失或单残基点突变。有时将分析分为多个步骤,例如第一步是针对第一组生物标志物筛选样品或样品数据以检测疾病信号的存在,第二步是针对第二组生物标志物进一步评价该样品或样品数据。或者,某些分析在单个步骤中进行筛选和分析。参考标志物可用来增强内源性生物标志物的鉴别和/或量化。可以在分析之前或同时将此类参考标志物引入样品中。取决于样品采集方法,参考标志物任选地被设置在采集装置上或与样品采集同时引入样品中。
生物样品
本文公开了使用标志物的系统、方法和装置,所述标志物包括QC标志物和/或参考标志物,如参考生物标志物和多肽。采用标志物的装置包括样品采集装置,如滤纸和其他能够接收液体样品的采集装置。标志物可以在样品沉积之前、样品沉积期间、样品沉积之后、样品洗脱之前、样品洗脱期间、样品洗脱之后、样品洗脱之前、样品处理之前、样品处理期间、样品处理之后或样品分析之前被设置在采集装置上。在一些情况下,标志物在样品沉积之前被设置在采集装置上。样品以液体样品、干燥样品、石蜡包埋的样品或其他合适的形式采集。液体样品在采集后可以干燥,并作为干燥斑点储存。在一些情况下,采集液体血液样品,并且将其作为干燥的血液斑点储存在诸如滤纸的适当采集装置上。
储存在滤纸上的干燥血液斑点(DBS)样品多年来一直是流行的样品采集模式(Déglon,J.;Thomas,A.;Mangin,P.;Staub,C.Direct analysis of dried blood spotscoupled with mass spectrometry:concepts and biomedical applications.AnalBioanal Chem 2012,402,2485–2498;Demirev,P.A.Dried blood spots:analysis andapplications.2013,85,779–789;Meesters,R.J.;Hooff,G.P.State-of-the-art driedblood spot analysis:an overview of recent advances and futuretrends.Bioanalysis 2013,5,2187–2208),并且已经在遗传筛查、传染病检测和药物发现概况分析等中得到应用。使用多反应监测质谱法甚至能相对准确地证明内源性蛋白质的定量(Chambers,A.G.;Percy,A.J.;Yang,J.;Camenzind,A.G.;Borchers,C.H.Multiplexedquantitation of endogenous proteins in dried blood spots by multiple reactionmonitoring-mass spectrometry.Mol.Cell Proteomics 2013,12,781–791)。另外,已经探索了检测丰富的血浆蛋白中的群体广泛的遗传变异(Edwards,R.L.;Griffiths,P.;Bunch,J.;Cooper,H.J.Top-down proteomics and direct surface sampling of neonataldried blood spots:diagnosis of unknown hemoglobin variants.J.Am.Soc.MassSpectrom.2012,23,1921–1930)。因此,DBS采样代表了用于常规分子概况分析的方便、简单且无创的方法。
可以将液体样品施加至采集装置并作为干燥斑点储存。液体样品包括全血、血清、血浆、尿液、唾液、眼泪、脑脊液、羊水、精液、胆汁、滑液、粘液、母乳、脓液、间隙液、呼吸渗出物或其他生物流体。液体样品可以作为干燥斑点如干燥血液斑点储存。有时,干燥的血液或血浆斑点通常通过将一滴毛细血管血液施加至特殊滤纸上而生成。在传统的干燥血液斑点采集的情况下,血液样品本身留在采集装置如滤纸介质上干燥。在一些干燥的斑点卡中,血液或其他液体样品沉积在过滤层上,该过滤层将液体的微粒成分如细胞分离出来。任选地除去该过滤层,留下液体的斑点,如果尚未干燥,则在储存之前将其干燥。这些类型的采集所需的总时间可以相对较短,通常不超过十分钟或二十分钟(包括干燥时间)。这已被证明是用于样品采集、运输和储存的一种稳健且方便的介质(Mei,J.V.;Alexander,J.R.;Adam,B.W.;Hannon,W.H.Use of filter paper for the collection and analysis of humanwhole blood specimens.J.Nutr.2001,131,1631S–6S)。此外,该采样程序比传统静脉抽血所需的程序简单得多,并且可以在非临床环境中进行,甚至可能由提供样品的同一人进行。一旦血液样品干燥,许多生物分析物就会变稳定,并且与液体样品相比,采集介质的纸张或卡片格式使其运输和储存更加容易。尽管将DBS应用于蛋白质组学计划中仍处于早期阶段,但DBS样品采集固有的许多优势为生物标志物发现、疾病检测和筛查以及个性化医学应用开辟了新的可能性,包括大型人群的纵向采样。
历史上,DBS采样已广泛用于新生儿筛查。第一个应用是由Guthrie引入的,其使用基于DBS的试验来检测新生儿的苯丙酮尿症(Guthrie,R.;Susi,a.A SimplePhenylalanine Method for Detecting Phenylketonuria in Large Populations ofNewborn Infants.Pediatrics 1963,32,338–343),并且导致在美国针对多种新生儿病症开展了广泛的全国性筛查计划。DBS采样也已被用于疾病监测(Snijdewind,I.J.M.;vanKampen,J.J.A.;Fraaij,P.L.A.;van der Ende,M.E.;Osterhaus,A.D.M.E.;Gruters,R.A.Current and future applications of dried blood spots in viral diseasemanagement.Antiviral Research 2012,93,309–321)、治疗药物监测(Edelbroek,P.M.;van der Heijden,J.;Stolk,L.M.L.Dried blood spot methods in therapeutic drugmonitoring:methods,assays,and pitfalls.Ther Drug Monit 2009,31,327–336),以及最近,研究大型人群中的生物标志物(McDade,T.W.;Williams,S.;Snodgrass,J.J.What adrop can do:Dried blood spots as a minimally invasive method for integratingbiomarkers into population-based research.Demography 2007,44,899–925)和一般蛋白质组学应用(Chambers,A.G.;Percy,A.J.;Yang,J.;Camenzind,A.G.;Borchers,C.H.Multiplexed quantitation of endogenous proteins in dried blood spots bymultiple reaction monitoring-mass spectrometry.Mol.Cell Proteomics 2013,12,781–791;Chambers,A.G.;Percy,A.J.;Hardie,D.B.;Borchers,C.H.Comparison ofproteins in whole blood and dried blood spot samples by LC/MS/MS.J.Am.Soc.Mass Spectrom.2013,24,1338–1345;Anderson,L.Six decades searchingfor meaning in the proteome.Journal of Proteomics2014,107,24–30;Razavi,M.;Anderson,N.L.;Yip,R.;Pope,M.E.;Pearson,T.W.Multiplexed longitudinalmeasurement of protein biomarkers in DBS using an automated SISCAPAworkflow.Bioanalysis 2016,8,1597–1609)。与用于对蛋白质标志物进行精确定量的靶向质谱方法相结合,干燥血液斑点采样为个性化医疗和健康监测提供了新的机会(Razavi,M.;Anderson,N.L.;Yip,R.;Pope,M.E.;Pearson,T.W.Multiplexed longitudinalmeasurement of protein biomarkers in DBS using an automated SISCAPAworkflow.Bioanalysis 2016,8,1597–1609)。
先前已经证实了液相色谱质谱法(LC-MS)在DBS样品分析中的应用(Martin,N.J.;Bunch,J.;Cooper,H.J.Dried blood spot proteomics:surface extraction ofendogenous proteins coupled with automated sample preparation and massspectrometry analysis.J.Am.Soc.Mass Spectrom.2013,24,1242–1249)。
尽管DBS技术具有优势,但获得可靠和一致的结果仍然面临挑战,这可能会受到影响数据采集和/或分析的各种因素,如储存条件(例如运输条件、样品采集前的储存、样品采集后的储存等)、样品完整性和洗脱效率的影响。例如,诸如光暴露、温度、湿度、采集之前的时间以及过滤器受到的物理损伤等储存条件可能会影响从过滤器采集的样品生成的质谱数据或使其产生偏差(Zakaria,R.;Allen,K.J.;Koplin,J.J.;Roche,P.;Greaves,R.F.Advantages and Challenges of Dried Blood Spot Analysis by MassSpectrometry Across the Total Testing Process.EJIFCC.2016年12月;27(4):288–317)。在多肽样品的情况下,在样品采集过程中或之后,由于暴露于破坏性条件如蛋白水解活性,样品完整性可能会受到损害。此外,样品洗脱效率低下可能会对下游分析产生负面影响,例如通过产生带有偏差的数据或较差的精度。
样品储存条件差、样品降解以及洗脱效率差或不均匀可能会导致获得高质量数据存在各种障碍。然而,质量控制标志物可以用来获取关于预期样品或数据质量的信息。例如,可以通过以下方式来有效利用QC标志物:丢弃不良样品,对样品数据进行门控以去除质量较差的数据,对数据进行归一化以解决样品中多肽群体内的变异,或者进行其他解决由标志物所指示的条件的步骤。
在一些情况下,根据本文公开的系统、方法、装置和组合物分析非液体样品以评估健康状态。非液体样品包括实体组织样品(例如,骨髓活检物)、软组织样品(例如,肌肉活检物)和细胞样品(例如,颊拭子)。任选地使用多种技术来采集样品,例如通过采集液体排泄物或材料,切除实体或软组织样品,穿刺抽吸组织或体液,以及刮擦、擦拭或涂抹细胞或组织。
质量控制标志物
本文描述了使用质量控制(QC)标志物的组合物、方法和装置,该标志物提供一种或多种对样品分析有影响的因素的信息。这类因素包括样品采集、过滤器储存、样品洗脱以及与样品分析相关的其他条件或过程。例如,某些条件对可从样品获得的数据的质量、可靠性或变异性具有不利影响。因此,QC标志物指示至少一类信息,如样品完整性、样品洗脱效率或过滤器储存条件。样品完整性包括样品pH、样品稳定性、蛋白水解活性、DNA酶活性、RNA酶活性以及其他提示对样品的可能损害的条件。样品洗脱效率包括与亲/疏水性(hydropathy)相关的洗脱效率、总体样品洗脱效率、样品成分的洗脱效率以及其他评估成功洗脱的指标。过滤器储存条件包括样品储存持续时间、最高温度暴露、最低温度暴露、平均温度暴露、时间-温度暴露、光暴露、UV暴露、辐射暴露、湿度以及过滤器和/或过滤器上的样品已暴露的其他条件。在一些实施方案中,QC标志物指示样品储存持续时间、最高温度暴露、最低温度暴露、平均温度暴露、时间-温度暴露、样品pH、光暴露、UV暴露、辐射暴露、湿度、样品成分的洗脱效率、与亲/疏水性相关的洗脱效率、总体样品洗脱效率、样品稳定性、蛋白水解活性、DNA酶活性或RNA酶活性。QC标志物的非限制性实例包括洗脱标志物、湿度标志物、pH标志物、温度标志物、时间标志物、蛋白水解标志物、核酸酶标志物、稳定性标志物、辐射标志物、UV标志物和光标志物。
QC标志物通常包含分子传感器群体。分子传感器是与分析物(例如,目标分子)相互作用以产生可检测信号(例如,传感器本身和/或分析物的响应或变化)的分子。在许多情况下,分子传感器包含靶标识别部分和信号部分,信号部分在靶标识别和/或被靶标识别部分结合时产生信号。在一些情况下,信号包括以下一种或多种:颜色或颜色变化,光(可见光谱或不可见光谱)或辐射的发射,以及由靶标识别和/或结合导致的结构或性质变化。信号部分在许多情况下包括荧光团(例如,荧光染料或分子),例如小的有机荧光团、蛋白质荧光团和合成的聚合或寡聚荧光团。小的有机荧光团的非限制性实例包括罗丹明、花青、方酸、萘、芘、噁嗪、吖啶、荧光素、BODIPY、芳基次甲基(arylmethine)、四吡咯、香豆素、蒽、Cy2、Cy3、Cy5、Cy7、德克萨斯红、曙红、尼罗红及其衍生物。蛋白质荧光团的非限制性实例包括绿色荧光蛋白(GFP)、黄色荧光蛋白(YFP)、小的超红色荧光蛋白(smURFP)、FMN结合荧光蛋白(FbFP)、TagBFP、mTagBFP2、Azurite、EBFP2、mKalama1、Sirius、Sapphire、T-Sapphire、ECFP、Cerulean、SCFP3A、mTurquoise、mTurquoise2、mTFP1、mOrange、mKO2、mRaspberry、mCherry、mRuby、mStrawberry、mTangerine、mTomato、mPlum、iRFP、Kaede、KikGR1、PS-CFP2和mEos2。在一些情况下,分子传感器包含量子点,其为半导体纳米晶体。在一些情况下,信号被猝灭,直到靶标识别导致信号部分释放。该释放可能是由于分子传感器结构响应于靶标识别的构象变化而发生的(Hee-Jin Jeong,Shuya Itayama,and Hiroshi Ueda,ASignal-On Fluorosensor Based on Quench-Release Principle for SensitiveDetection of Antibiotic Rapamycin.Biosensors.2015年6月;5(2):131–140)。一些分子传感器包括热敏分子,如响应于热而发生变化如颜色变化的蛋白质。例如,蛋白质色素如叶绿素和其他类胡萝卜素的降解或变性可引起颜色变化。
本文还涉及包含至少一个QC标志物的采集装置。采集装置适合于采集或接收多种样品。合适的样品包括液体样品,如血液。一些采集装置是过滤器。过滤器通常包含至少一层,如微粒不可透过的多孔层。该多孔层对于等于或大于尺寸阈值的微粒可以是不可透过的。多孔层尺寸阈值可以是至少0.1、0.2、0.4、0.6、0.8、1、2、4、6、8、10、20、30、40、50、60、70、80、90或100多微米。替代地或组合地,尺寸阈值不大于0.1、0.2、0.4、0.6、0.8、1、2、4、6、8、10、20、30、40、50、60、70、80、90或100多微米。在装置组装期间、装置组装之后、样品沉积之前、样品沉积期间、样品沉积之后、样品洗脱之前、样品洗脱期间、样品洗脱之后、样品处理(例如,用于质谱分析)之前、样品处理期间或其任意组合,至少一个QC标志物被设置在诸如过滤器的采集装置上。设置在采集装置上的至少一个QC标志物被定位成使得与沉积在该装置上的样品共迁移,与样品一起从过滤器上共洗脱,与样品一起储存在该装置上,或其任意组合。或者,设置在采集装置上的至少一个QC标志物被定位成避免与样品共洗脱。例如,一些质量控制标志物提供关于样品本身的直接信息,该信息可包括pH、蛋白水解活性或核酸酶活性。
一些采集装置具有一个QC标志物。在包含多个QC标志物的采集装置中,过滤器上的多个QC标志物包含至少2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、25、30、40、50、60、70、80、90或100个或更多标志物。有时,过滤器上的多个标志物包含不超过2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、25、30、40、50、60、70、80、90或100个或更多标志物。过滤器上的多个标志物可以包含一定数目范围的标志物,范围的下限为1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、25、30、40、50、60、70、80或100个标志物,而上限为2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、25、30、40、50、60、70、80或100个标志物。
在一些实施方案中,采集装置包含多个QC标志物。所述多个QC标志物可以包括洗脱标志物、湿度标志物、pH标志物、温度标志物、时间标志物、蛋白水解标志物、核酸酶标志物、稳定性标志物、辐射标志物、UV标志物和光标志物中的至少一种。有时,所述多个QC标志物包含至少1、2、3、4、5、6、7、8、9或10个选自洗脱标志物、湿度标志物、pH标志物、温度标志物、时间标志物、蛋白水解标志物、核酸酶标志物、稳定性标志物、辐射标志物、UV标志物和光标志物的标志物。所述多个QC标志物有时包含不超过1、2、3、4、5、6、7、8、9或10个选自洗脱标志物、湿度标志物、pH标志物、温度标志物、时间标志物、蛋白水解标志物、核酸酶标志物、稳定性标志物、辐射标志物、UV标志物和光标志物的标志物。
与QC标志物的使用相符合的过滤器是Noviplex Plasma Prep Card(NovilyticLabs),它包含多个层,包括覆盖层(表面层)、扩散层、分离器(用于过滤细胞)、血浆采集储器、隔离卡和基卡。在这些类型的过滤器中,可以在覆盖层、扩散层、分离器、血浆采集储器和血浆采集储器中的至少一个上设置至少一个QC标志物。考虑到过滤器结构的变化,并且标志物和方法与广泛范围的过滤器结构兼容。
定位为不与样品共洗脱的QC标志物能够与样品分开进行分析或评价。在一些情况下,首先对不共洗脱的标志物进行分析,作为初始筛选步骤,以确定是否应丢弃过滤器和/或样品(例如,由于预测的变质)。例如,指示过滤器已暴露于高于阈值温度如50℃的温度的温度标志物提供了丢弃该过滤器的理由,而无需使用额外的资源来分析该样品,因为高温暴露表明了样品已固定在过滤器上并且将很难洗脱或以其他方式损坏的可能性。当样品被洗脱以供后续处理和分析(例如质谱分析)时,其他标志物提供关于样品洗脱的信息。这些标志物一般位于过滤器上,以便在样品沉积时或沉积后引入样品中(例如,混合或组合)。这些特定标志物通常在样品沉积后沿着样品流体的行进路径而定位在过滤器中。当液体样品沉积在过滤器上以作为干燥斑点储存时,该样品可穿过表面和一个或多个附加层(例如,通过毛细管作用)。因此,一个或多个QC标志物可以定位在表面上和/或沿着一个或多个附加层中的任一层定位,以使样品通过该表面和层的迁移或穿过将使样品与所述一个或多个QC标志物接触。这允许QC标志物部分或完全溶解在液体样品中。例如,一些过滤器包含用于接收样品的表面,用于过滤出细胞的多孔内部过滤层,以及用于储存过滤后的血浆的血浆采集储器。在一些情况下,样品流体在穿过多孔过滤层时被过滤,最终进入血浆采集储器中以供干燥和储存。
当标志物迁移通过诸如过滤器的表面和多孔层(包括任何其他层或过滤器组件)等采集装置时,标志物能够储存在沿着样品路径的任何位置。通常,至少一个标志物位于表面上的相同位置以供接收样品。这允许标志物在样品沉积时通过过滤器的一个或多个层与样品共迁移。替代地或组合地,至少一个标志物位于过滤器的一个或多个内层的表面下方,以使其在样品沉积之后处于样品的行进路径中。在一些情况下,至少一个标志物位于采集储器中的、样品流体被干燥和储存的位置。随后,将样品和标志物一起共洗脱以进行下游分析,如质谱分析。
可以基于标志物要提供的信息将QC标志物定位在采集装置上。例如,用于测量样品从覆盖层(表面)迁移至血浆采集储器的效率的标志物位于覆盖层上,使其在样品沉积在过滤器上之后与样品共迁移至该储器。相对于采集储器中的标志物对洗脱的样品中的标志物进行定量,例如,可以提供该装置的洗脱效率。
例如具有已知质谱迁移偏移(例如,由于同位素标记或化学修饰)的相应标志物可以以已知量定位在储器中。在某些情况下,两种标志物都相对于来自样品的内源性分子具有已知的迁移偏移,以允许与该内源性分子区分开。样品洗脱后,可以使用质谱法对这两种标志物进行定量,以确定代表在样品迁移过程中“丢失”的标志物的量或比例的比率。继而,这提供了样品采集过程中样品或生物标志物损失的估计值。或者,可以将QC标志物以已知量沉积在采集储器中,然后使用质谱法进行定量,并与在洗脱后引入样品中的已知量的相应标志物进行比较,以确定洗脱效率(例如,洗脱期间的样品损失)。如果损失太大,则使用估计的损失来丢弃样品(或样品数据),或者,对样品数据进行门控,来丢弃预期会受到更大影响的数据子集,同时保留可能受影响较小的数据。在某些情况下,如果损失或估计的损失等于或大于5%、10%、20%、30%、40%、50%、60%、70%、80%、90%或95%,则丢弃样品或样品数据。有时,如果损失或估计的损失不超过5%、10%、20%、30%、40%、50%、60%、70%、80%、90%或95%,则不丢弃样品或样品数据。
或者,当至少一个QC标志物指示仅数据的子集受损或被破坏时,任选地对样品数据进行门控,以去除受损的子集,同时保留其余数据以供后续分析。例如,QC标志物可表明温度暴露超过阈值,该阈值被预测或已知会导致某些温度敏感性蛋白质的降解。因此,可以从进一步的分析中筛选出这些温度敏感性蛋白质或与这些蛋白质相对应的数据,而不丢失整个样品或数据集。
在一些情况下,QC标志物可用来生成或提供在本公开全文中描述的内源性生物标志物的定量或浓度。例如,当添加到样品中或沉积在采集装置上时,QC标志物可具有已知的输入量或数量。在使用合适的仪器如质谱仪进行分析之后,可以将QC标志物数据或信号与已知的输入量相关联,并用来确定内源性生物标志物的估计量或浓度。
设置在采集装置上的QC标志物可以包括覆盖物,该覆盖物被去除以激活标志物(例如,允许标志物检测和/或响应于某种条件)。例如,不可逆的湿度标志物可以具有覆盖物,以阻止与水蒸气的任何接触,从而防止在样品沉积到过滤器上之前过早检测湿度。替代地或组合地,将过滤器储存在密封的保护袋中,以限制或防止暴露于环境条件。该保护袋任选地是不透明的,并且被配置成阻止或限制过滤器暴露于光、紫外线、湿气和/或其他污染物。保护袋只能一次性使用或适合重复使用。具有可重复密封机构的保护袋使用拉链、滑扣、收缩密封或其他合适的密封来限制暴露于外部或环境条件。
本文公开了允许鉴别和/或量化样品中成分的QC标志物。这样的标志物包含至少一个具有已知量的分子群体。所述分子通常是多肽、核酸、碳水化合物、脂质或与样品中的内源性生物标志物或生物分子相对应的其他生物分子。标志物通常包含相对于相应样品分子具有已知质谱迁移偏移(例如,由于同位素标记或化学修饰)的分子。已知的迁移偏移允许在标志物分子与样品分子之间进行区分。可以使用实验室技术如质谱法来鉴别标志物和样品分子。例如,质谱中的迁移偏移增强了鉴别样品分子的能力。此外,基于标志物和样品分子的质谱信号的比较,具有已知量的标志物分子可以用作量化相应样品分子的参考。
本文公开了允许从后续分析中筛选或去除样品或样品数据的QC标志物,也称为筛选标志物。这样的标志物可以包括一种或多种本文所述的QC标志物,如温度和湿度标志物,其允许基于指示暴露于预计会损害可从样品获得的数据质量的温度和/或湿度水平的标志物而丢弃过滤器和其中包含的样品。类似地,蛋白水解标志物可指示明显的样品降解,从而排除进一步分析的必要性。这些QC标志物允许基于样品或样品数据的预测质量而不是样品的生物学信息来筛选过滤器。或者,QC标志物可以提供允许筛选以用于下游分析的样品生物学质量的信息。任选地,在进行后续分析以进一步验证与生物标志物相关的状况之前,需要用于筛选的QC标志物来检测样品中生物标志物的存在。因此,可以基于信号的存在或不存在来指导下游分析。例如,如果QC标志物指示存在糖尿病状况,则下游分析可以针对糖尿病的其他生物标志物。通常,QC标志物中的分子群体产生如整个说明书中描述的可视的或可观察的信号。该信号可通过肉眼检测,可通过质谱法检测,可通过免疫测定或其他已知技术检测。通常,该信号包括光信号、发光信号、荧光信号和放射性信号中的至少一种。
本文公开了允许对样品数据进行门控以供进一步分析的QC标志物,也被称为门控标志物。这类QC标志物指示至少一种情况,该情况提示从样品获得的一些(但不是全部)数据可能不可靠或受到不利影响。例如,当已知温度敏感性分子群体由于暴露于高于特定阈值的温度而降解,但是其他分子可能相对不受影响时,则后续分析可以限于与不受影响的分子相对应的数据子集。该门控步骤在数据分析之前、期间或之后进行。这类门控标志物可以包括一种或多种本文描述的QC标志物,如温度标志物和湿度标志物,其允许基于指示暴露于预计会损害可从样品获得的数据质量的温度和/或湿度水平的标志物而丢弃过滤器和其中包含的样品。这些质量控制门控标志物允许基于样品数据的预测质量而不是样品的生物学信息来对数据或数据分析进行门控。或者,门控标志物提供与下游分析有关的样品生物学质量的信息。例如,门控标志物包含检测血浆样品中生物标志物存在与否的分子群体。因此,可以基于信号的存在或不存在将数据的子集从进一步的分析中去除,从而沿特定路径指导下游分析。
本文公开了允许数据归一化的QC标志物,也被称为归一化或参考标志物。对于数据归一化,参考标志物允许数据归一化以确定样品分子的绝对或相对定量。这类标志物包含至少一个具有已知量的分子群体。所述分子通常是多肽、核酸、碳水化合物、脂质或与样品中的内源性生物标志物或生物分子相对应的其他生物分子。包含至少一个具有已知量的分子群体的QC标志物可用来鉴别和/或量化样品的生物标志物或其他成分。样品生物标志物或成分通常是生物分子,如多肽。可以通过对标志物和样品进行定量(例如,通过质谱法),并且将量化的值与标志物的已知量进行比较以求出样品的量,来对样品变异进行归一化。QC标志物可以包含为各种量提供参考阶梯的多个生物分子群体。例如,QC标志物可以包含多肽群体,其中每个群体具有预定的量(例如,1pg、5pg、10g群体的阶梯)。然后可以将已知量与量化值(例如,质谱输出值)进行比较,以近似估计生物标志物的量。在一些情况下,对多肽群体的量化值进行作图或分析,以确定实际量与量化值(例如,通过质谱法确定的)之间的相关性。然后可以使用该关系,基于量化值来计算生物标志物的实际量。
替代地或组合地,QC标志物允许样品之间生物分子的归一化,例如根据洗脱效率的差异来调整样品1和样品2中生物标志物之间的相对量化值。例如,如果洗脱标志物指示样品1的洗脱效率为100%,而样品2的洗脱效率为50%,则可以将样品2生物标志物的量化值向上调整两倍,以解决这一差异,从而更准确地近似估计样品之间的实际生物学比值。因此,可以对单个样品进行归一化,以使量化的生物标志物值达到100%的洗脱效率,以提供归一化的值,该归一化值能够与其他样品的归一化值进行比较。
洗脱标志物
洗脱效率可能对样品数据和/或数据分析具有重大影响。储存在采集装置上的样品通常包含具有一定范围亲/疏水性的成分群体。样品成分之间洗脱效率的差异可使下游分析产生偏差,例如当计算成分的相对量时。
本文公开了指示洗脱效率的QC标志物,有时被称为洗脱标志物。一些QC标志物指示随亲/疏水性(例如,疏水性和/或亲水性)而变化的洗脱效率。这类QC标志物还可以用于生物标志物鉴别和/或量化。本文还公开了包含至少一种洗脱标志物的组合物。本文还公开了包含至少一种洗脱标志物的采集装置。本文还公开了使用至少一种洗脱标志物评估洗脱效率的方法,例如用于丢弃样品或样品数据,对样品数据进行门控,或对样品数据进行归一化的目的。洗脱标志物可以包含具有已知亲/疏水性的分子群体,分别具有低亲/疏水性和高亲/疏水性的两个分子群体(例如,设置涵盖样品成分的预期百分比的低和高疏水性阈值),或对应于一定范围亲/疏水性的多个分子群体。低亲/疏水性可以是等于或小于样品中预期成分的至少10%、20%、30%、40%、50%、60%、70%、80%、90%或95%的疏水性的疏水性。高亲/疏水性可以是等于或大于样品中预期成分的至少10%、20%、30%、40%、50%、60%、70%、80%、90%或95%的疏水性的疏水性。可以使用诸如免疫测定、NMR、光谱法、质谱法和其他实验室技术等方法来分析洗脱标志物,以确定随亲/疏水性而变化的洗脱效率。洗脱并量化一些洗脱标志物,以确定成功洗脱的标志物的量。例如,洗脱标志物可以使用质谱法以及已知量的对照或参考标志物进行定量。然后,洗脱标志物与参考标志物(其没有洗脱损失)之间的质谱输出的比较,允许确定成功洗脱的洗脱标志物的量或比例。例如,洗脱标志物和参考标志物可以具有相同的分子结构(例如,共有相同的多肽序列),但是具有质量迁移偏移(例如,至少一个标志物被重同位素标记),从而能够使用质谱法对其进行区分。或者,可以使用其他结构差异来允许在洗脱标志物与参考标志物之间进行鉴别和/或区分。因此,可以基于洗脱标志物的洗脱效率来估计样品洗脱效率。
本文公开了用于获得关于随亲/疏水性变化的洗脱效率或成功的信息的洗脱标志物。例如,洗脱标志物可用来确定成功洗脱的具有一定疏水性的样品成分的估计比例。该信息可以允许方案优化,如更改洗脱缓冲液或样品储存方案,以提高所需样品成分的洗脱效率。洗脱标志物允许获得随亲/疏水性变化的洗脱效率或成功的信息,例如成功洗脱的具有一定疏水性的分子的比例。该信息可以允许方案优化,如更改洗脱缓冲液或样品储存方案,以提高所需样品成分的洗脱效率。
本文公开了包含至少一种洗脱标志物的组合物。一些组合物包含多种洗脱标志物。组合物可以包含多个QC标志物,包括洗脱标志物。洗脱标志物通常包含至少一个分子群体。分子群体可以包含核酸(例如,RNA、DNA)、多肽、脂质、碳水化合物或其他生物分子。在一些实施方案中,该分子群体包含多肽。洗脱标志物通常设置在诸如过滤器的采集装置上。该过滤器可以具有一个或多个层,如多孔过滤层,其在液体样品通过时去除微粒。有时,采集装置用于采集液体样品以作为干燥斑点储存。液体样品包括全血、血清、血浆、尿液、唾液、眼泪、脑脊液、羊水、精液、胆汁、滑液、粘液、母乳、脓液、间隙液、呼吸渗出物或其他生物流体。在一些实施方案中,液体样品作为干燥的血液斑点储存。
本文公开了包含至少一个具有已知亲/疏水性的分子群体的洗脱标志物。分子群体由共有特定亲/疏水性的均匀分子群体组成。在一些情况下,该标志物包含构成一定范围亲/疏水性的多个分子群体。或者,该标志物包含构成一定范围亲/疏水性的非均质分子群体。通常,该分子群体的亲/疏水性是已知的。存在用于测量亲/疏水性的各种度量,包括例如疏水性或亲水性标度或指数。例如,疏水性标度的非限制性实例包括在J.Janin,Surfaceand Inside Volumes in Globular Proteins,Nature,277(1979)491-492,R.Wolfenden,L.Andersson,P.Cullis and C.Southgate,Affinities of Amino Acid Side Chains forSolvent Water,Biochemistry 20(1981)849-855,J.Kyte and R.Doolite,A SimpleMethod for Displaying the Hydropathic Character of a Protein,J.Mol Biol.157(1982)105-132以及G.Rose,A.Geselowitz,G.Lesser,R.Lee and M.Zehfus,Hydrophobicity of Amino Acid Residues in Globular Proteins,Science 229(1985)834-838中描述的那些。尽管许多疏水性标度用来描述单个氨基酸而不是多肽的疏水性,但是可以根据现有方法将分配给多肽上每个氨基的值相加、平均或以其他方式进行分析,以计算多肽的总体疏水性。例如,可以通过平均多肽链中各个肽的亲/疏水性来计算多肽的亲/疏水性。
本文公开了包含设置在采集装置上的至少一种洗脱标志物的采集装置。设置在诸如过滤器的采集装置上的洗脱标志物被定位成与沉积在该采集装置上的样品共洗脱,或者不与该样品共洗脱。例如,在样品采集之前设置在采集装置上的共洗脱洗脱标志物沿着样品从其在采集装置上的沉积位置(例如,过滤器表面上的位置)向样品储存位置(例如,采集储器)行进时的样品迁移路径定位。这允许洗脱标志物与样品组合或混合(例如,通过溶解在液体样品中),并且如果该洗脱标志物尚未定位在储存位置,则与样品一起迁移至采集装置上的储存位置。可以使洗脱标志物在洗脱步骤过程中与样品共洗脱,并且可以基于洗脱标志物的定量来测量洗脱效率。例如,当洗脱标志物与样品从采集装置上共洗脱时,可以对洗脱标志物中的一个或多个分子群体进行定量,并将其与最初沉积在采集装置上的已知量进行比较,以确定任何洗脱损失。或者,洗脱标志物定位在样品的迁移路径之外,以避免在样品沉积和/或洗脱过程中的共迁移和/或共洗脱。可以独立于样品洗脱来评价为了避免共迁移和/或共洗脱而定位的洗脱标志物的洗脱效率。
本文公开了使用至少一种洗脱标志物来确定洗脱效率的方法。在一些情况下,诸如过滤器的采集装置包含以已知量设置在过滤器上的具有已知亲/疏水性的分子群体。这允许基于例如通过质谱法检测的分子群体的比例来计算与已知亲/疏水性相关的洗脱效率。因此,标志物中分子群体的洗脱效率可用来估计具有相似或等效亲/疏水性的样品分子的洗脱效率。具有不同的已知亲/疏水性并以已知量设置在过滤器上的非均质分子群体或多个分子群体允许对亲/疏水性与洗脱效率之间的关系进行建模。这使得能够估计亲/疏水性落入该模型范围内的样品分子的洗脱效率。因此,对标志物中分子群体的定量允许确定洗脱的疏水性和/或亲水性(例如,具有一定亲/疏水性的分子的洗脱效率),这继而可用于确定样品中相应分子的洗脱效率。
基于亲/疏水性估计洗脱效率的另一种方法需要使用包含以下分子群体的洗脱标志物,该分子群体的疏水性等于或大于预期在样品中的阈值百分比的分子的疏水性。因为随着疏水性的增加,诸如多肽之类的分子可能变得越来越难以洗脱,因此建立较高疏水性阈值的洗脱标志物可用来估算低于该阈值的分子的成功洗脱。例如,成功洗脱包含疏水性大于样品中至少90%的预期多肽的多肽群体的QC标志物,允许推断出大多数样品多肽已被成功洗脱。在一些情况下,QC标志物包含这样的分子群体,其疏水性大于样品中至少50%、55%、60%、65%、70%、75%、80%、85%、90%、95%或99%或更多预期分子的疏水性。使用多种方法中的任何一种,例如,评价来自过去样品的数据,来确定样品的预期亲/疏水性范围。有时,洗脱标志物包含第二分子群体,该群体的亲/疏水性不超过预期在样品中的阈值百分比的分子的亲/疏水性。该阈值百分比可以是10%、20%、30%、40%、50%、60%、70%、80%、90%或95%。在一个实施方案中,该分子群体的亲/疏水性不超过样品中90%的预期分子的亲/疏水性。
确定洗脱效率的替代方法使用至少一种洗脱标志物,其包含已知量的分子群体,用于估计总体洗脱效率。与该目标一致的一种方法使用包含具有一定范围亲/疏水性的多个分子群体的标志物。有时,所述分子是以已知量沉积在诸如过滤器的采集装置上的蛋白质和/或多肽。常常将包含多个分子群体的洗脱标志物设置在过滤器上的某个位置,以使样品的洗脱允许分子群体的共洗脱。分子群体可以通过后续分析进行定量,并与设置在过滤器上已知量进行比较,以计算由于洗脱效率低下(例如,不成功或部分洗脱)而损失的量或比例。例如,通过质谱分析检测到的分子群体的已知量的比例可以用作对共洗脱样品的洗脱效率的估计值。湿度标志物
本文还涉及指示湿度的QC标志物,有时被称为湿度标志物。这类标志物响应于一个或多个湿度水平或湿度暴露量。这些QC标志物还可用于生物标志物的鉴别和/或定量。本文还公开了包含至少一种湿度标志物的组合物。本文还公开了包含至少一种湿度标志物的采集装置。本文还公开了使用至少一种湿度标志物来评估湿度暴露的方法,例如用于丢弃样品或样品数据,对样品数据进行门控,或对样品数据进行归一化的目的。这类标志物、组合物、装置和方法允许评估湿度暴露是否会对样品和/或下游分析具有负面影响。有时,湿度标志物响应于湿度而经历可视的或可观察的变化。例如,湿度标志物可以根据湿度水平改变颜色或显示颜色。呈现颜色的湿度标志物通常包含与空气中的水分子起反应的吸湿性分子群体。在一些情况下,该分子群体基于湿度水平从无水形式变为水合物形式。或者,该分子群体从较低水合物形式变为较高水合物形式。水合物形式的非限制性样品包括一水合物、二水合物、三水合物、四水合物、五水合物、六水合物、七水合物、八水合物、九水合物、十水合物、十一水合物和十二水合物。在某些情况下,当在无水和水合物形式之间变化时,该分子群体经历相应的颜色变化。实例包括氯化钴(II),其在水合时从蓝色变成红色/紫色,以及氯化铜(II),其在形成二水合物时从棕色变成浅蓝色。在一些情况下,选择分子群体,以在等于或高于约10%、15%、20%、25%、30%、35%、40%、45%、50%、55%、60%、65%、70%、75%、80%、85%、90%、95%、99%或100%相对湿度的阈值相对湿度时经历颜色变化。
本文还公开了包含设置在采集装置上的至少一种湿度标志物的采集装置。设置在诸如过滤器的采集装置上的湿度标志物被定位成与沉积在该采集装置上的样品共洗脱,或者不与该样品共洗脱。例如,在样品采集之前设置在采集装置上的共洗脱湿度标志物沿着样品从其在采集装置上的沉积位置(例如,过滤器表面上的位置)向样品储存位置(例如,采集储器)行进时的样品迁移路径定位。这允许湿度标志物与样品组合或混合(例如,通过溶解在液体样品中),并且如果该湿度标志物尚未定位在储存位置,则与样品一起迁移至采集装置上的储存位置。可以使湿度标志物在洗脱步骤过程中与样品共洗脱,并且可以分析湿度标志物以评价湿度水平。例如,当湿度标志物与样品从采集装置上共洗脱时,可以对湿度标志物中的一个或多个分子群体进行分析,以确定由于暴露于一定湿度水平而导致的任何可视的或可观察的变化。例如,可以使用质谱法来鉴别和/或量化吸湿性分子群体的水合形式和非水合形式,以评估湿度暴露的程度。或者,湿度标志物定位在样品的迁移路径之外,以避免在样品沉积和/或洗脱过程中的共迁移和/或共洗脱。可以独立于样品洗脱来评价为了避免共迁移和/或共洗脱而定位的湿度标志物的湿度暴露。
本文还公开了包含至少一种湿度标志物的组合物。一些组合物包含多个QC标志物,包括至少一种湿度标志物。组合物通常包含可逆湿度标志物,这意味着该标志物的可视的或可观察的性质可以根据湿度来回变化。例如,基于颜色的可逆湿度标志物可以在不同颜色之间交替变化,因为湿度水平的变化导致分子群体在无水和水合物形式之间切换。任选地,某些湿度标志物是不可逆的,这意味着一旦达到某个湿度阈值水平,该标志物就经历当湿度降至阈值水平以下时也不会逆转的变化。例如,这些不可逆的湿度标志物允许检测运输过程中的暂时湿度暴露。一些不可逆的湿度标志物包含潮解性分子群体,其中利用这些分子液化的趋势来产生可视的或可观察的信号,以供检测湿度暴露。在一些情况下,不可逆的湿度标志物包含盐群体,例如沉积在多孔材料上的与水溶性染料混合的氯化钙。在一些情况下,该多孔材料是过滤卡的多孔表面和/或层。或者,该标志物本身包含多孔材料。通常,该盐/染料混合物沉积在多孔材料上。有时,该盐/染料混合物被包含在多孔材料内。在任何一种情形下,盐在暴露于预定水平的湿度时都会液化并释放出染料,该染料然后通过毛细管作用在多孔材料中扩散,以形成永久的染料痕迹。不同的盐和盐组合可用于检测特定的湿度阈值水平。可用于制备不可逆湿度标志物的潮解性分子的实例包括氯化锌、硝酸钙、硝酸铵、氯化钙和其他化合物。与这些化合物一起使用的合适的染料包括各种水溶性染料,如罗丹明、甲基紫、亚甲基蓝、藏花猩红、苯胺黑和其他此类染料。在一些情况下,该湿度标志物在等于或高于约10%、15%、20%、25%、30%、35%、40%、45%、50%、55%、60%、65%、70%、75%、80%、85%、90%、95%、99%或100%的阈值相对湿度时产生可视的或可观察的信号。湿度标志物的实例是当暴露于预定湿度水平时或与暴露程度和/或持续时间成比例地产生永久信号的不可逆标志物。
pH标志物
本文还涉及指示pH的标志物,有时被称为pH标志物。这类QC标志物也可以用于生物标志物的鉴别和/或定量。另外,本文公开了包含至少一种pH标志物的组合物。本文还公开了包含至少一种pH标志物的采集装置。本文还公开了使用至少一种pH标志物来评估样品pH的方法,例如用于丢弃样品或样品数据,对样品数据进行门控,或对样品数据进行归一化的目的。pH标志物允许确定样品沉积期间、样品沉积之后、样品通过采集装置迁移期间、样品迁移之后、样品储存期间,样品干燥之前或另一个样品采集、储存或处理步骤期间的样品pH。通常,pH标志物响应于暴露于样品而产生可视的或可观察的信号。在许多情况下,pH标志物包含pH指示剂条或不同pH检测范围的多个pH指示剂条。有时,pH标志物包含至少一个分子群体,如pH敏感性分子群体。pH标志物的实例是当暴露于预定pH时或与暴露程度和/或持续时间成比例地产生永久信号的不可逆标志物。
本文公开了包含设置在采集装置上的至少一种pH标志物的采集装置。一些pH标志物包含至少一个分子群体,该分子群体响应于pH水平而经历可视的或可观察的变化。设置在诸如过滤器的采集装置上的pH标志物被定位成与沉积在该采集装置上的样品共洗脱,或者不与该样品共洗脱。例如,在样品采集之前设置在采集装置上的共洗脱pH标志物沿着样品从其在采集装置上的沉积位置(例如,过滤器表面上的位置)向样品储存位置(例如,采集储器)行进时的样品迁移路径定位。这允许pH标志物与样品组合或混合(例如,通过溶解在液体样品中),并且如果该pH标志物尚未定位在储存位置,则与样品一起迁移至采集装置上的储存位置。可以使pH标志物在洗脱步骤过程中与样品共洗脱,并且可以分析pH标志物以评价pH水平。例如,当pH标志物与样品从采集装置上共洗脱时,可以对pH标志物中的一个或多个分子群体进行分析,以确定由于暴露于一定pH水平而导致的任何可视的或可观察的变化。例如,可以使用质谱法来鉴别和/或量化pH敏感性分子群体,以评估pH水平。或者,pH标志物定位在样品的迁移路径之外,以避免在样品沉积和/或洗脱过程中的共迁移和/或共洗脱。可以独立于样品洗脱(例如非样品pH)来评价为了避免共迁移和/或共洗脱而定位的pH标志物的pH暴露。
温度标志物
本文还涉及指示温度的QC标志物,有时被称为温度标志物。这类QC标志物也可以用于生物标志物的鉴别和/或定量。另外,本文公开了包含至少一种温度标志物的组合物。本文还公开了包含至少一种温度标志物的采集装置。本文还公开了使用至少一种温度标志物来评估温度暴露的方法,例如用于丢弃样品或样品数据,对样品数据进行门控,或对样品数据进行归一化的目的。温度标志物允许确定样品采集之前、样品采集之后、样品储存之前、样品储存期间、样品干燥之前、样品干燥期间、样品干燥之后、另一个样品采集、储存或处理步骤期间或其任意组合的温度暴露。通常,温度标志物响应于诸如超过阈值的温度的温度暴露而产生可视的或可观察的信号。或者,温度标志物响应于随时间的温度暴露而产生可视的或可观察的信号(例如,时间-温度指示剂)。在许多情况下,温度标志物包含温度指示剂条或不同温度检测范围的多个温度指示剂条。
温度标志物通常响应于温度暴露而产生可视的或可观察的信号。温度标志物的实例是当暴露于预定温度水平时或与暴露严重程度和/或持续时间成比例地产生永久信号的不可逆标志物。不可逆温度标志物可以包含设置在吸收性基底上的温度敏感性分子群体。在暴露于预定阈值温度时,该温度敏感性分子群体液化并被吸收性基底吸收,从而导致不可逆的颜色变化。在一些情况下,该温度标志物在等于或高于约0℃、5℃、8℃、10℃、12℃、14℃、16℃、18℃、20℃、22℃、24℃、26℃、28℃、30℃、32℃、34℃、36℃、38℃、40℃、42℃、44℃、46℃、48℃、50℃、55℃、60℃、65℃、70℃、75℃、80℃、85℃、90℃、95℃或100℃或更高的阈值温度时产生可观察的信号。在一些情况下,该温度标志物包含时间温度指示剂,该时间温度指示剂响应于随时间的温度暴露而经历不可逆的颜色变化。时间温度指示剂显示随时间变化的累积温度暴露。时间温度指示剂相对于阈值温度标志物(例如,一旦达到阈值温度就产生信号)的一个优点是关于暴露于次最佳温度的量的更好的分辨率。例如,在一些情况下,阈值温度标志物无法区分暴露于高温数分钟的过滤器和暴露于高温数天的过滤器。因此,包含时间温度指示剂的温度标志物允许更高的温度暴露分辨率,这允许基于诸如过滤器储存和/或暴露等条件筛选过滤器中有更多细微差别。通常情况下,校准温度标志物的时间温度暴露响应,以使颜色变化指示随时间变化的不可接受的温度暴露水平。一些温度标志物包含至少一种时间温度指示剂,其产生逐渐变化或响应于持续暴露于高于阈值的温度而出现的可视的或可观察的信号。时间温度指示剂的一个实例是响应于暴露于阈值或阈值以上的温度而产生从一端开始并向另一端演变的颜色或颜色变化的条带。阈值温度可以是0℃、5℃、8℃、10℃、12℃、14℃、16℃、18℃、20℃、22℃、24℃、26℃、28℃、30℃、32℃、34℃、36℃、38℃、40℃、42℃、44℃、46℃、48℃、50℃、55℃、60℃、65℃、70℃、75℃、80℃、85℃、90℃、95℃或100℃或更高。
温度标志物包含至少一个温度敏感性分子群体,该分子群体响应于一定水平和/或持续时间的温度或热暴露而经历化学反应,彼此反应或与其他分子反应,或以其他方式经历物理变化。例如,可以使用质谱法来鉴别和/或量化温度敏感性肽或多肽的群体,以评估温度暴露的程度。与此功能一致的温度标志物包含响应于热而经历热降解或分解的肽或多肽群体。可以通过质谱法分析该群体,以确定可以与温度或热暴露程度相关的降解水平。在一些情况下,通过将温度标志物暴露于已知温度达已知持续时间来确定与降解水平相对应的温度或热暴露程度,然后进行分析以与评估的降解水平相关联。
本文公开了包含设置在采集装置上的至少一种温度标志物的采集装置。设置在诸如过滤器的采集装置上的温度标志物被定位成与沉积在该采集装置上的样品共洗脱,或者不与该样品共洗脱。例如,在样品采集之前设置在采集装置上的共洗脱温度标志物沿着样品从其在采集装置上的沉积位置(例如,过滤器表面上的位置)向样品储存位置(例如,采集储器)行进时的样品迁移路径定位。这允许温度标志物与样品组合或混合(例如,通过溶解在液体样品中),并且如果该温度标志物尚未定位在储存位置,则与样品一起迁移至采集装置上的储存位置。可以使温度标志物在洗脱步骤过程中与样品共洗脱,并且可以分析温度标志物以评价温度暴露。例如,当温度标志物与样品从采集装置上共洗脱时,可以对温度标志物中的一个或多个分子群体进行分析,以确定由于暴露于一定温度而导致的任何可视的或可观察的变化。或者,温度标志物定位在样品的迁移路径之外,以避免在样品沉积和/或洗脱过程中的共迁移和/或共洗脱。可以独立于样品洗脱来评价为了避免共迁移和/或共洗脱而定位的温度标志物的温度暴露。
时间标志物
本文还涉及指示过滤器储存持续时间的QC标志物,被称为时间标志物。这类QC标志物也可以用于生物标志物的鉴别和/或定量。另外,本文公开了包含至少一种时间标志物的组合物。本文还公开了包含至少一种时间标志物的采集装置。本文还公开了用于使用至少一种时间标志物来评估采集装置、样品和/或QC标志物的年限或过期的方法,例如用于丢弃样品或样品数据,对样品数据进行门控,或对样品数据进行归一化的目的。时间标志物允许评估采集装置储存的持续时间(例如,过滤器年限)、一个或多个QC标志物的年限、在采集装置上的样品储存的持续时间或其组合。一些时间标志物包含过滤器的制造日期和/或失效日期的时间戳或其他指示符(例如,过滤器上指示相关日期的打印字符或符号)。在一些情况下,时间标志物包含设置在过滤器上的一个或多个其他标志物的制造日期和/或失效日期的时间戳或其他指示。因此,通过允许确定其他标志物是否已过期或不再认为可靠,时间标志物可以用作其他质量控制标志物的质量控制标志物。替代地或组合地,时间标志物包含分子群体,该分子群体产生可视的或可观察的信号,或者随时间的推移经历可检测的变化,该变化适合于确定时间的流逝。例如,时间标志物可以包含响应于时间的流逝的分子群体,例如具有已知衰变速率和/或半衰期的放射性分子或包含放射性成分的分子。放射性衰变允许诸如通过同位素比值质谱法计算时间的流逝。该信息可以允许基于相对于衰变产物检测到的放射性物质的量来计算在过滤器的制造与放射性物质的测量日期之间经过的时间长度。
本文公开了包含设置在采集装置上的至少一种时间标志物的采集装置。设置在诸如过滤器的采集装置上的时间标志物被定位成与沉积在该采集装置上的样品共洗脱,或者不与该样品共洗脱。例如,在样品采集之前设置在采集装置上的共洗脱时间标志物沿着样品从其在采集装置上的沉积位置(例如,过滤器表面上的位置)向样品储存位置(例如,采集储器)行进时的样品迁移路径定位。这允许时间标志物与样品组合或混合(例如,通过溶解在液体样品中),并且如果该时间标志物尚未定位在储存位置,则与样品一起迁移至采集装置上的储存位置。可以使时间标志物在洗脱步骤过程中与样品共洗脱,并且可以分析时间标志物以评价(例如,采集装置、样品和/或QC标志物的)时间的流逝或储存持续时间。例如,当时间标志物与样品从采集装置上共洗脱时,可以对时间标志物中的一个或多个分子群体进行分析,以确定由于时间的流逝而导致的任何可视的或可观察的变化(例如,通过放射性定年法,诸如通过质谱法)。或者,时间标志物定位在样品的迁移路径之外,以避免在样品沉积和/或洗脱过程中的共迁移和/或共洗脱。可以独立于样品洗脱来评价为了避免共迁移和/或共洗脱而定位的时间标志物的时间流逝。蛋白水解标志物
本文还涉及指示蛋白水解活性的QC标志物,被称为蛋白水解标志物。这类QC标志物也可以用于生物标志物的鉴别和/或定量。另外,本文公开了包含至少一种蛋白水解标志物的组合物。本文还公开了包含至少一种蛋白水解标志物的采集装置。本文还公开了使用至少一次蛋白水解来评估蛋白水解活性的方法,例如用于丢弃样品或样品数据,对样品数据进行门控,或对样品数据进行归一化的目的。一些蛋白水解标志物包含作为一种或多种蛋白水解酶的底物的分子群体。蛋白水解标志物包含合成多肽、非合成多肽或其他蛋白水解底物。蛋白水解底物的实例包括酪蛋白、弹性蛋白、血红蛋白和其他多肽。该分子群体在大小和/或长度上是均质的或非均质的。当蛋白水解标志物暴露于蛋白水解酶如样品中的酶时,蛋白水解活性会降解或分解蛋白水解标志物的分子群体。可以测量该降解,以量化沉积在过滤器上以便与样品共洗脱的已知大小和/或量的分子群体的降解和减少。降解量可通过下游分析如质谱法检测。在一些情况下,该分子群体是针对所检查的特定样品分子而定制的,以提供对蛋白水解活性的出色估计。例如,该分子群体被重同位素标记,但在其他方面等同于正在研究的样品分子。因此,该分子群体的蛋白水解允许对相应样品分子的蛋白水解进行更精确的估计。
本文公开了包含在样品采集之前、期间或之后设置在采集装置上的至少一种蛋白水解标志物的采集装置。设置在诸如过滤器的采集装置上的蛋白水解标志物通常被定位成与沉积在该采集装置上的样品共洗脱。例如,在样品采集之前设置在采集装置上的共洗脱蛋白水解标志物沿着样品从其在采集装置上的沉积位置(例如,过滤器表面上的位置)向样品储存位置(例如,采集储器)行进时的样品迁移路径定位。这允许蛋白水解标志物与样品组合或混合(例如,通过溶解在液体样品中),并且如果该蛋白水解标志物尚未定位在储存位置,则与样品一起迁移至采集装置上的储存位置。可以使蛋白水解标志物在洗脱步骤过程中与样品共洗脱,并且可以分析蛋白水解标志物以评价蛋白水解活性。例如,当蛋白水解标志物与样品从采集装置上共洗脱时,可以对蛋白水解标志物中的一个或多个分子群体进行分析,以确定由蛋白水解活性导致的任何变化。
蛋白水解标志物可包括指示翻译后修饰稳定性的标志物,也被称为PTM标志物。一些PTM标志物提供在样品采集期间和/或之后的翻译后修饰变化或对翻译后修饰的影响的信息,以便允许评估PTM稳定性。通常,该标志物沉积在采集装置上的某位置,使得具有翻译后修饰的多肽群体与样品一起储存在采集装置上并与样品共洗脱。在这些情形下,该多肽群体在样品沉积时被引入样品中,随后暴露于与样品相同的影响翻译后修饰的活性。该标志物通常以已知量设置在过滤器上,因此能够在后续分析如质谱分析中检测和量化该多肽群体的量及其相应的翻译后修饰。该群体通常具有质量位移,例如使用重同位素标记,以区分其质量迁移与样品中的内源性分子。不同的翻译后修饰的非限制性实例包括肉豆蔻酰化、棕榈酰化、异戊二烯化、糖基磷脂酰肌醇化、脂化、酰化、乙酰化、甲基化、酰胺化、糖基化、羟基化、琥珀酰化、硫酸化、糖化、氨基甲酰化、羰基化、生物素化、氧化、聚乙二醇化、SUMO化、泛素化、类泛素化和磷酸化。
当针对翻译后修饰进行分析时,关于这些修饰在样品采集期间和之后的稳定性的信息有助于增强下游分析。符合这些目标的采集装置可以包含至少一种PTM标志物。例如,PTM标志物可以包含具有翻译后修饰的多肽群体。可以将失去翻译后修饰(PTM)的多肽的比例与仍然保留PTM的比例进行比较,以确定在样品采集期间和之后估计的PTM损失。例如,包含多肽的PTM标志物的质谱定量允许丢弃数据(例如,在样品采集后大部分或所有PTM丢失的情况下),进行门控以去除不良数据(例如,如果仅某些PTM丢失),或对数据进行归一化(例如,对PTM定量进行归一化,以说明因样品采集、洗脱、处理或其他步骤或条件而丢失的PTM的比例)。
核酸酶标志物
也涉及指示核酸酶活性的QC标志物,有时被称为核酸酶标志物。这类QC标志物也可以用于生物标志物的鉴别和/或定量。另外,本文提供了包含至少一种核酸酶标志物的组合物。本文还公开了包含至少一种核酸酶标志物的采集装置。本文还公开了使用至少一种核酸酶标志物来评估核酸酶活性的方法,例如用于丢弃样品或样品数据,对样品数据进行门控,或对样品数据进行归一化的目的。通常,该标志物包含充当核酸酶活性的底物的分子群体,例如核酸。核酸群体一般以已知的量设置在过滤器上,并被定位成使得样品在过滤器上的沉积将该核酸群体引入样品中。因此,该核酸群体暴露于与样品相同的核酸酶活性。这允许基于核酸群体的降解量来估计在样品沉积与后续分析之间样品的核酸酶活性。通常,所述核酸包括脱氧核糖核酸(DNA)、核糖核酸(RNA),如转移RNA(tRNA)、核糖体RNA(rRNA)、snoRNA、微RNA、siRNA、snRNA、exRNA、piRNA、scaRNA、长ncRNA,或其任意组合。在一些情况下,核酸酶标志物中使用的核酸群体是针对分析定制的。任选地,当正在研究rRNA时,将标志物定制为包含rRNA分子群体,以更准确地估计样品在过滤器中储存期间,样品中rRNA的降解。作为另一个例子,将标志物定制为包含与染色质相关的RNA群体,以估计样品中与染色质相关的RNA的降解。定制标志物的其他实例包括包含超螺旋DNA群体或松弛DNA群体(例如带切口的质粒DNA)的标志物。
本文公开了包含在样品采集之前、期间或之后设置在采集装置上的至少一种核酸酶标志物的采集装置。设置在诸如过滤器的采集装置上的核酸酶标志物通常被定位成与沉积在该采集装置上的样品共洗脱。例如,在样品采集之前设置在采集装置上的共洗脱核酸酶标志物沿着样品从其在采集装置上的沉积位置(例如,过滤器表面上的位置)向样品储存位置(例如,采集储器)行进时的样品迁移路径定位。这允许核酸酶标志物与样品组合或混合(例如,通过溶解在液体样品中),并且如果该核酸酶标志物尚未定位在储存位置,则与样品一起迁移至采集装置上的储存位置。可以使核酸酶标志物在洗脱步骤过程中与样品共洗脱,并且可以分析核酸酶标志物以评价核酸酶活性。例如,当核酸酶标志物与样品从采集装置上共洗脱时,可以对核酸酶标志物中的一个或多个分子群体进行分析,以确定由核酸酶活性导致的任何变化。具有已知量和大小的分子群体(例如,均质的DNA分子群体)的降解可导致预期群体的量和/或大小较低。可以使用诸如质谱分析的技术来评价这些分子,以确定未降解和降解的标志物分子的绝对和/或相对量。
稳定性标志物
本文还涉及指示样品稳定性的QC标志物,被称为稳定性标志物。这类标志物可用来近似估计相应样品的稳定性。任选地,稳定性标志物包括蛋白水解标志物和核酸酶标志物。稳定性标志物通常包含至少一个与样品中的分子相对应的分子群体。可以评价稳定性标志物的降解,以近似或估计相应样品的降解。稳定性标志物通常包含至少一个与样品中存在的分子近似的分子群体。例如,多肽样品的稳定性标志物可以包含多肽,任选地该样品的至少一个子集的相同或相似多肽。这类QC标志物也可以用于生物标志物的鉴别和/或定量。另外,本文提供了包含至少一种核酸酶标志物的组合物。本文还公开了包含至少一种核酸酶标志物的采集装置。本文还公开了使用至少一种核酸酶标志物来评估核酸酶活性的方法,例如用于丢弃样品或样品数据,对样品数据进行门控,或对样品数据进行归一化的目的。
本文公开了包含在样品采集之前、期间或之后设置在采集装置上的至少一个稳定性标志物的采集装置。设置在诸如过滤器的采集装置上的稳定性标志物通常被定位成与沉积在该采集装置上的样品共洗脱。例如,在样品采集之前设置在采集装置上的共洗脱稳定性标志物沿着样品从其在采集装置上的沉积位置(例如,过滤器表面上的位置)向样品储存位置(例如,采集储器)行进时的样品迁移路径定位。这允许稳定性标志物与样品组合或混合(例如,通过溶解在液体样品中),并且如果该稳定性标志物尚未定位在储存位置,则与样品一起迁移至采集装置上的储存位置。可以使稳定性标志物在洗脱步骤过程中与样品共洗脱,并且可以分析稳定性标志物以评价该标志物中分子的稳定性。例如,当稳定性标志物与样品从采集装置上共洗脱时,可以对稳定性标志物中的一个或多个分子群体进行分析,以确定在样品采集期间和/或之后的任何降解或分解。具有已知量和大小的分子群体(例如,均质的DNA分子群体)的降解可导致预期群体的量和/或大小较低。可以使用诸如质谱分析的技术来评价这些分子,以确定未降解和降解的标志物分子的绝对和/或相对量。然后可以使用所述结果来估计相应样品的降解。
辐射、UV和光标志物
还涉及指示辐射暴露的QC标志物。这些标志物可以被称为辐射(例如,γ辐射)、光或UV标志物,这取决于它们被设计为测量的辐射暴露的类型。这类QC标志物还可以用于生物标志物的鉴别和/或定量。另外,本文公开了包含至少一种指示辐射暴露的QC标志物的组合物。本文还公开了包含至少一种指示辐射暴露的QC标志物的采集装置。本文还公开了使用至少一种QC标志物来评估辐射暴露的方法,例如用于丢弃样品或样品数据,对样品数据进行门控,或对样品数据进行归一化的目的。由于辐射暴露(例如,光、UV、γ辐射暴露)可能会对可以从样品获得的数据质量具有重大影响,因此了解样品在何时暴露至关重要。与该功能一致的采集装置包含至少一种指示光和/或UV暴露的辐射标志物。优选地,该辐射标志物响应于暴露而经历不可逆变化或提供不可逆的可观察信号,尽管一些标志物提供暂时的变化或信号。该变化或信号或者告知暴露的存在/不存在,或者提供与暴露程度相关的信号。
指示光线和/或UV暴露的QC标志物是可逆或不可逆的标志物。不可逆的QC标志物响应于暴露而经历不可逆的变化或提供不可逆的可观察信号,而可逆的标志物表现出暂时的变化或信号。不可逆标志物的实例包括UV不可逆指示条,它响应于某些UV光谱的检测而显示颜色变化。该变化或信号或者告知暴露的存在/不存在,或者提供与暴露程度相关的信号。指示辐射暴露的QC标志物可以包括辐射剂量计条或标志,它们响应于检测到电离辐射而显示颜色变化。辐射剂量计有时具有胶片和支架,其中胶片乳剂对辐射敏感,并响应于辐射暴露而变暗。
本文公开了包含在样品采集之前、期间或之后设置在采集装置上的至少一种辐射/光/UV QC标志物的采集装置。设置在诸如过滤器的采集装置上的标志物通常被定位成与沉积在该采集装置上的样品共洗脱。例如,在样品采集之前设置在采集装置上的共洗脱标志物沿着样品从其在采集装置上的沉积位置(例如,过滤器表面上的位置)向样品储存位置(例如,采集储器)行进时的样品迁移路径定位。这允许标志物与样品组合或混合(例如,通过溶解在液体样品中),并且如果该标志物尚未定位在储存位置,则与样品一起迁移至采集装置上的储存位置。可以使该标志物在洗脱步骤过程中与样品共洗脱,并且可以分析该标志物以评价对辐射、光、UV或其任何组合的暴露。例如,当标志物与样品从采集装置上共洗脱时,可以分析该标志物中的一个或多个分子群体,以确定由暴露引起的任何变化。
生物标志物
如本文所考虑的生物标志物包括广泛的提示患者健康的数据。干燥血液或干燥血浆是生物标志物信息的示例性来源,但是广泛的生物标志物和生物标志物来源与本文的公开内容相容。在多个实施方案中,本文考虑的生物标志物包括患者年龄、性别、葡萄糖水平、血压、量化的警觉性水平、心理适应性检查表现、记忆表现、睡眠模式、体重测量、卡路里摄取、食物摄取成分、维生素或药物摄入量、处方药使用模式、药物滥用史、运动模式或运动输出量化(例如,依据距离、消耗的卡路里估计值或消耗或施加的能量的其他量度)以及生物分子测量值中的至少一种。
可以从任何数目的患者组织中的样品测量用作生物标志物的生物分子,该样品例如是流体,如患者的血液、血清、尿液、唾液、脑脊液、呼吸道渗出物(即,抽吸物)或任何数目的其他组织或流体中的至少一种。在一些情况下,生物分子在例如患者尿液、收集的颗粒或呼吸中或唾液或血液中的液滴中测量。优选的实施方案包括测量来自患者血液的多种生物标志物,如蛋白质生物标志物。
来源于患者样品如患者流体的生物标志物,例如作为患者血液中的循环生物标志物,通过与本文公开内容一致的多种方法进行定量。当针对特定生物标志物以用于测量时,使用质谱方法或抗体来检测并在一些情况下量化样品中至少一个生物标志物的水平。替代地或组合地,通过质谱方法相对或绝对地量化生物标志物,如血液样品中的循环生物标志物或从呼吸抽吸物获得的生物标志物。
本文中的方法任选地采用“半靶向的”质谱方法进行生物标志物测量。如本文所公开的,采集样品。在质谱分析之前,将内标(例如重标记的生物分子)添加至样品中。在许多情况下,内标不在处理和/或质谱分析之前立即添加到样品中,而是作为包含内标分子群体的标志物(例如参考生物标志物或生物分子,例如多肽)设置在过滤器上。在许多情况下,内标标志物(有时称为参考标志物)用于如整个说明书中描述的质量控制。例如,在一些情况下,指示洗脱效率的标志物既充当用于鉴别和/或量化感兴趣的生物标志物的参考标志物,又充当总体洗脱效率的标志物。这些标准品可与感兴趣的特定蛋白质或多肽共迁移或相邻。当对它们进行标记时,它们在质谱输出中容易且独立地检测到。当它们相对于它们针对以供测量的蛋白质或多肽稍微改变质量时,它们容易识别未标记的靶标,同时在充分位移的位置迁移,以便允许鉴别内源性蛋白质或多肽而不模糊它的信号。在一些情况下,此类标志物用于鉴别样品中特别感兴趣的蛋白质或多肽,如由FDA认可的在人血液中循环并在至少一种健康状态或健康状况中特别相关的蛋白质。此外,重标记的生物分子提供了量化相关未标记的靶标的绝对丰度的手段,从而提供对靶标水平的精确测量。因此,本文中的方法允许在质谱分析的样品中靶向分析感兴趣的特定蛋白质。使用标记的标志物以促进样品中的生物标志物定量和鉴别允许在大量样品中进行高通量、自动化生物标志物测量,这有利于数据库生成。因此,这类标记的标志物的实例包括指示各种条件,例如洗脱效率或蛋白水解活性的质量控制标志物。这类标志物的其他实例包括指示患者样品的健康状态如突变状态的参考生物标志物。
这些方法不排除同时分析样品输出中的非靶向质谱信号。也就是说,所述标记物鉴别感兴趣的峰或信号,但它们不妨碍观察或量化样品中的其他未标记的峰或信号。因此,在一些实施方案中,可对感兴趣的一组蛋白质进行靶向测定,其中可获得其标记的质量位移标志物,同时收集与质谱数据输出中每个检测到的信号或斑点有关的非靶向数据。
在一些实例中,使用无标记物、有标记物或任何其他质量位移技术来鉴别或量化样品中的分子标志物。例如,无标记物技术包括但不限于稳定同位素标准(SIS)肽响应。有标记物技术包括但不限于肽或蛋白质的化学或酶标记。在一些实例中,样品中的分子标志物包括与特定疾病相关的所有蛋白质。在一些实例中,基于数种性能特征(即峰丰度、CV、精确度等)选择这些蛋白质。
如本文所公开的,对生物标志物进行准确地、可重复地测量以供分析,如与参考水平的比较。参考水平包括从多个个体或样品的平均水平确定的参考生物标志物水平,其至少一种、直至大数目的健康状况状态是已知的。在一些情况下,参考水平包括至少部分地基于参考标志物的量确定的生物标志物水平。替代地或组合地,从在不同时间取自相同个体的样品确定生物标志物的参考水平,使得随着时间的推移观察个体的生物标志物概况的时间变化,并且使得与健康状态或状况相关的至少一个、直至大数目的生物标志物的变化指示该健康状态或状况的变化或即将发生的变化。
测量浓度与斑点信号强度之间的相关性。在一个实例中,图20中描绘的所有多肽标志物(并且代表总体上分析的更多数目的多肽标志物)显示,在浓度(fmol/uL,范围为0至500,如图片的最底部文件的x轴所示)与斑点信号强度之间观察到清晰、强烈的线性相关性。结果(例如,图20中所示的结果)用来验证标志物多肽易于鉴别,并且它们的斑点信号强度随浓度线性变化,从而证实了鉴别过程的功效以及它们作为标志物帮助量化可比信号强度的内源性斑点的效用。与本说明书一致,可以在其他实例中使用替代相关性来证实作为斑点标志物的功效和效用。
许多生物标志物样品采集方法与本文的公开内容一致。在一些示例性情况下,通过将血液沉积到固体基质上从患者血液中采集样品,例如通过将血液点样到纸或其他固体背衬上来完成,使得血液斑点干燥并保留其生物标志物含量。样品可以运输,例如通过直接邮寄或运送,或者可以储存或在没有冷藏的情况下储存。或者,通过常规抽血、唾液采集、尿样采集或通过呼出气采集获得样品。如上所述,在一些情况下,通过收集额外的健康数据如饮食信息、睡眠信息、运动数据、葡萄糖水平测定、血压分析、警觉性或其他心理敏锐度检查结果以及其他行为信息中的至少一种来增强样品。
并非基于组织的标志物,如年龄、精神警觉性、睡眠模式、运动或活动的测量等,和/或在采集点容易测量的生物标志物,如葡萄糖水平、血压测量值,使用本领域已知的任何数目的方法来采集。在多个实施方案中,使用包含多个标志物的过滤器来采集样品。所述多个标志物可以包括指示至少一种并非基于组织的标志物的标志物。在一些情况下,所述多个标志物包括用于测量生物标志物如葡萄糖水平的标志物。
标记的参考标志物
本文中的一些质谱或其他方法涉及标记的生物标志物参考分子或标准品,也被称为质量标志物、参考标志物、标记的生物标志物,或在本文中以其他方式提及。在一些情况下,参考标志物包括某些质量控制标志物,例如指示洗脱效率的标志物。此类标准品或标记的生物分子促进内源性生物标志物鉴别,例如在自动化的高通量数据采集中。许多参考分子与本文的公开内容一致。
在许多情况下,参考标志物包括任选地同位素标记的分子群体,例如使用H2、H3、重氮、重碳、重氧、S35、P33、P32和同位素硒中的至少一种进行标记。替代地或组合地,对参考生物标志物分子进行化学修饰,例如使用以下至少一种:氧化、乙酰化、去乙酰化、甲基化和磷酸化或以其他方式修饰,以产生轻微但可测量的总质量变化。替代地或组合地,参考生物标志物分子是生物标志物集内的人类蛋白质的非人同源物。
参考标志物共有的特征包括相对于内源性生物标志物的可重复的偏移共迁移,使得参考标志物在感兴趣的生物标志物附近但不完全相同地迁移。因此,参考标志物的检测指示内源性标志物应存在相对于标记的生物标志物的可预测的偏移。
一些参考标志物参考物共有的第二个特征是,它们在质谱数据输出中易于鉴别。通常,生物标志物在质谱输出中得以鉴别,因为它们的质量,因此它们的位置,在质谱输出中是精确已知的。通过计算它们的预期位置并在具有预期浓度或信号的该位置处寻找斑点,可以在质谱输出中鉴别标记的标志物。
任选地使用以下方法中的任何一种或多种进一步促进标志物多肽的基于质量的鉴别。首先,鉴别的标志物或标志物集在没有样品的情况下自身运行,以便经实验确定标志物在给定质谱分析中运行的确切位置。然后将标志物与样品一起运行,并比较结果以鉴别标志物位置。例如,这通过将仅涉及标志物多肽的一次运行的结果与包含标志物多肽和样品生物标志物的第二次运行的结果进行重叠来完成。
其次,向样品的各个等份提供不同浓度的标志物多肽。分析每个标志物稀释浓度变体的质谱数据。预期(并观察到)样品斑点显示出斑点位置和强度的高重复性。相反,标志物多肽在斑点位置方面显示出高重复性,但显示出斑点强度的可预测变化,这与添加的标志物浓度相关。
第三,标志物多肽通过它们在质谱输出上的位置来鉴别,并且通过在预测的偏移位置处检测相应的内源性蛋白质或多肽来确认它们的身份,使得它们不是通过独立的信号,而是通过作为在质谱输出中具有预测偏移的“双峰”而存在来指示其内源性标志物的存在。该方法依赖于存在于样品中的内源性蛋白质或多肽,但是通常的情况是,该方法对于大多数标志物是有价值的。
这些方法不是相互排斥的。例如,可以生成仅包括标志物的质谱输出,并且叠加针对多个样品质谱分析的结果,这些质谱分析具有不同的标志物浓度以便鉴别预期位置处的标志物,并且展现斑点信号强度相对于其他运行的预期变化。独立地或与任一种方法组合地,人们搜索质谱数据以鉴别相对于推定标志物斑点有预期偏移的内源性斑点,从而进行最终标志物斑点判定。
或者,通过重同位素放射性标记来完成鉴别。这类参考标志物被标记为与质谱可视化一致,但是通过辐射测量方法可独立地检测,以便促进它们不依赖于样品中内源性生物标志物的检测信号的检测。
重同位素标记是特别有用的,因为它提供可预测的大小偏移以促进内源性斑点鉴别。然而,其他参考分子标记方法与本文的公开内容一致。
最常见的是,鉴别产生感兴趣的生物标志物的蛋白质,并由此生成参考标志物。这类蛋白质生物标志物参考分子例如用氢、碳、氮、氧、硫或在一些情况下用磷酸盐或甚至硒的可检测同位素来合成。由合成形式的感兴趣的生物标志物生成的参考标志物是有益的,因为除了质量偏移之外,预计它们在质谱分析中表现得与内源性蛋白质相当。
或者,在一些情况下使用非蛋白质生物标志物。非蛋白质生物标志物具有通常更易于合成的优点。另外,人们不需要感兴趣的生物标志物的身份来开发非蛋白质生物标志物。相反,以相对于感兴趣的生物标志物的可预测偏移可重复地迁移的任何标记的非蛋白质参考标志物与本文的公开内容一致。
除了它们在标记或促进内源性多肽的鉴别中的作用之外,标记的参考标志物还可用于质谱输出上鉴别的多肽斑点的相对定量。将标记的参考标志物以已知浓度引入样品中,并且它们在质谱输出中的信号指示这些浓度。通过将质谱信号强度与已知浓度的参考多肽进行比较,可以容易且准确地量化对应于质谱输出中的内源性蛋白质的斑点。
在一些情况下,以单一浓度添加两种、多于两种、最多10%、20%、30%、40%、50%、75%、90%、最多所有标记的参考标志物,从而促进评估质谱输出中多肽大小和位置的信号变化。替代地或组合地,以不同浓度引入标志物蛋白质或多肽,使得可以将内源性质谱斑点与不同强度的多个标志物斑点进行比较,从而更准确地将内源性斑点信号与已知浓度或量的参考信号相关联。在一些情况下,以第一浓度引入各组标志物蛋白质,而以其他浓度引入其他各组,从而实现上述两种益处。也就是说,共同浓度或量的标志物有助于鉴别标志物和内源性质谱斑点之间的信号变化,而不同浓度或量的标志物允许人们将内源性质谱斑点与宽范围的量或浓度中的已知量或浓度的斑点相匹配,从而为样品中内源性质谱斑点和最终内源性标志物蛋白质或多肽的定量提供准确的参考。
样品和数据采集
可使用适当的采集装置采集流体样品。在一些情况下,使用过滤器或过滤装置采集流体样品。用于血浆采集的过滤器的一个实例是使用Noviplex Plasma Prep卡(Novilytic Labs)。在一些情况下,将血浆点样在16张单独的Noviplex卡上。样品可以从沉积在采集装置上(例如单个Noviplex卡上)的单指刺血获得。也可以使用替代的样品采集方法和样品采集装置。在一个实例中,将血浆点样在Noviplex Plasma Prep Duo卡上。也可以采用替代的采集装置。有时,对群组进行测试以评估变异性,并且其可包含具有不同种族和性别的个体的混合体。在一个实例中,该群组可包含64名高加索人(32名男性,32名女性)和35名非洲裔美国人(30名男性,5名女性)。样品采集后,样品采集装置可以在适当的运送条件下运输以供分析。在一个实例中,DPS卡在仅采用干燥剂的标准环境运送条件下运输到Applied Proteomics,Inc.,以供LC-MS分析。在其他实例中也可以使用替代的运送条件。与本说明书一致,可以采用替代的样品采集方法。
根据一些采集方案,将包含感兴趣的生物标志物的样品施加至采集装置以供分析。在一些实例中,该样品是流体,如全血、血清、尿液、唾液、汗液、泪液、脑脊液或其他任何生物流体。或者,样品是患者组织,如口腔细胞(颊拭子)、皮肤细胞、来自器官的活检物或其他任何类型的含有生物标志物的细胞。通常随后在分析之前处理样品以获得特定的级分。在一个实例中,将全血样品施加至采集装置,如图1A所示的Noviplex DBS Plasma卡。可以利用分离技术从全血中分离血浆以供分析。例如,分离技术可包括通过包含分离器的分离层吸取全血以分离血浆,并将血浆引导至血浆采集储器。然后,血浆接触盒卡上的隔离屏。在一些实例中,可以干燥该样品以供储存和随后的分析。
在一些情况下,将含有感兴趣的生物标志物的样品施加至采集装置以供分析。在一些实例中,该样品是流体,如全血、血清、尿液、唾液、汗液、泪液、脑脊液或其他任何生物流体。或者,样品是患者组织,如口腔细胞(颊拭子)、皮肤细胞、来自器官的活检物或其他任何类型的含有生物标志物的细胞。通常随后在分析之前处理样品以获得特定的级分。在一个实例中,将全血样品施加至采集装置,如图1所示的NoviplexDBS Plasma卡,并且可以利用分离技术从全血中分离血浆以供分析。例如,分离技术可包括通过包含分离器的分离层吸取全血以分离血浆,并将血浆引导至血浆采集储器。然后,血浆接触盒卡上的隔离屏。在一些实例中,可以干燥该样品以供储存和随后的分析。
可以将样品置于单个孔中以供消化。作为一个示例,将采集装置上的样品斑点置于单个孔中以供消化。在一些情况下,从患者获得的生物标志物含有生物分子。在一些实例中,生物分子任选地包括生物聚合物。生物聚合物的实例包括但不限于蛋白质、脂质、多糖或核酸。在一些实例中,在分析之前使用消化试剂在合适的温度下将生物分子消化合适的时间段,该消化试剂可包括具有或不具有溶剂的酶或化学试剂。在一些实例中,酶促消化包括但不限于使用ArgC、AspN、胰凝乳蛋白酶、GluC、LysC、LysN、胰蛋白酶、蛇毒二酯酶、果胶酶、木瓜蛋白酶、碱性蛋白酶、中性蛋白酶、蜗牛酶、纤维素酶、淀粉酶、几丁质酶或其组合。在一个实例中,使用溶剂TFE中的胰蛋白酶消化蛋白质延长的持续时间,如至少1、2、3、4、5、6、7、8、9、10、12或24小时。在一些实例中,非酶促消化包括使用酸或碱。合适的酸包括盐酸、甲酸、乙酸或其组合。合适的碱包括氢氧化物碱。其他非酶促消化包括使用化学试剂,例如溴化氰、2-硝基-5-硫氰基苯甲酸酯、羟胺或其组合。非酶促消化的其他实例可包括电化学消化。在一些实例中可以采用酶促和非酶促消化方法的组合。在猝灭消化后,在一些实例中,将消化的样品转移至板并干燥。在一些采集装置中,将样品施加至三维吸收结构上,而不是点样在二维平面上。在一个实例中,血液采集装置是Neoteryx Mitra血液采集装置。在一些实例中,可以在分析之前将血液干燥并在室温下储存。其他实例可包括使用与本说明书一致的替代样品制备方案。
使用多种方法制备血浆样品以供分析。在一个实例中,采用LC-MS分析。例如,可以将来自采集装置的含有血浆的采集层转移至板上并离心(洗脱)。在一个实例中,将Noviplex卡转移至2mL 96孔板中的单个孔中,随后以特定的时间和速度(例如在500g下2分钟)离心,以洗脱样品(以及任何共洗脱质量控制标志物和/或参考标志物)。也可以采用替代的血浆纯化方法。然后处理含有血浆的板以供分析。处理可包括变性、还原、烷基化和/或消化。例如,将板转移至Tecan EVO150液体处理器,以供在100mM碳酸氢铵(Sigma)中用50%2,2,2-三氟乙醇(TFE,Arcos)变性。也可以采用不同浓度的替代变性试剂和/或溶剂。例如,可以用200mM DL-二硫苏糖醇(Sigma)或用其他任何合适的还原剂还原样品。例如,可以用200mM碘乙酰胺(Arcos)对样品进行烷基化,并且例如用200mM DL-二硫苏糖醇终止烷基化。其他合适的烷基化试剂可以与或不与另外的终止试剂一起使用。样品可在合适的消化条件下消化,例如用胰蛋白酶(Promega)在37℃下消化16hr,并用5uL纯甲酸猝灭。其他消化方法,例如其他酶促消化方法,也用于替代温度下的替代时间量。将消化的样品转移至采样板中,并根据需要去除溶剂以供分析。例如,将样品转移至330-uL 96孔板(Costar)中进行冻干。然后在合适的条件下重建样品以供分析。在一个实例中,对于技术和重复采样集,用溶剂(例如水和乙腈与甲酸的混合物)重建样品,涡旋一段时间,并以一定速度离心一段时间。例如,可以将样品溶解在50uL的含有0.1%甲酸的97/3水/乙腈中,以500rpm涡旋15分钟,并以500g离心2分钟以供分析。该同样的步骤也可用于群组样品集,具有可选的修改。在使用修改的条件的一个实例中,使用76uL含有0.1%甲酸的97/3水/乙腈来解释如卡制造商所述在本实例中使用的Noviplex Duo卡采集的额外血浆。与本说明书一致,其他样品重建条件可以在其他实例中使用。
来自每个样品的LC-MS数据在具有合适的电离源的合适的仪器上收集,例如与超高效液相色谱(UHPLC)仪器(Agilent 1290)耦合的四极杆飞行时间(Q-TOF)质谱仪(Agilent 6550),其具有电喷雾电离(ESI)源。基于样品条件和压力优化LC流速。
输出处理和特征确定
使用诸如OpenMS(Sturm,M.;Bertsch,A.;C.;Hildebrandt,A.;Hussong,R.;Lange,E.;Pfeifer,N.;Schulz-Trieglaff,O.;Zerck,A.;Reinert,K.;Kohlbacher,O.OpenMS-an open-source software framework for mass spectrometry.BMCBioinformatics 2008,9,163)的特征检测算法从采集装置(例如,DPS卡)注射的MS1数据中提取分子特征。在一个实例中,沿着m/z、LC时间和丰度轴在三维空间中进行特征检测,以找到并关联来自LC-MS数据中的肽分子特征的同位素峰。
通过采用液相色谱梯度一段时间,利用质谱分析来生成每个样品多个特征。例如,特征的数目范围为约10个至超过80,000个特征,包括至少、精确或不多于10至50、50至100、100至1000、1000至2000、2000至3000、3000至5000、5000至10,000、10,000至20,000、20,000至30,000、30,000至40,000、40,000至50,000、50,000至60,000、60,000至70,000、70,000至80,000、80,000至90,000、90,000至100,000个或多于100,000个特征。与本说明书一致,用于特征鉴别的分析仪器电离源包括但不限于电喷雾电离(ESI)、快速原子轰击(FAB)或基质辅助激光解吸/电离(MALDI)。与本说明书一致,用于特征鉴别的质量分析仪包括但不限于线性离子阱、3D离子阱、三重四极杆离子阱、FT-回旋加速器、单或双飞行时间(TOF)或其组合。在一些实例中,分析仪器是与一个或多个质量分析仪组合的电离源。在一些实例中,分析仪器包括但不限于ESI-QqQ(电喷雾电离-三重四极杆)、ESI-qTOF(电喷雾电离-四极杆飞行时间)或MALDI-QqTOF(MALDI-双四极杆-TOF)。
在特征检测过程完成时,最终输出由分子特征的列表组成,每个分子特征包括但不限于分组的同位素峰、单同位素m/z值、LC时间和该特征的单同位素峰的三维积分丰度。在一个实例中,本文分析的MS1数据导致每次注射约40,000个特征。对于一些定量分析,三维单同位素峰积分面积用来表示每个分子特征的定量丰度值。与本文的公开内容一致,可以提取替代分子特征,并检测替代特征。
在多个变异性实验(例如,3个变异性实验)中的每一个完成时,提取的分子特征任选地基于它们的m/z和LC时间值在实验注射中相关联。在交叉样品特征关联之前采用简单的LC对齐算法来解释样品之间的LC变异性。接下来,施加特征过滤以仅保留以注射总数的最小百分比,例如至少25%出现的特征。然后对于技术和重复的采样实验在采集装置(例如,DPS卡)之内和之间,对于群组变异性实验跨越各个卡,分别针对每个特征,根据这些过滤的特征计算分子特征丰度CV。对于卡间丰度CV确定,首先在卡内对特征值进行平均,以获得每卡特征估计值,然后使用每卡丰度估计值来计算卡间CV值。
例如,使用2014版的Human UniProt DB、整个人类基因组的6帧翻译(NCBI,3.045亿个独特肽序列)和所有已知的人类蛋白质序列变体(UniProt,由12511个开放阅读框ORF生成的65,935个独特肽序列)分析串联质谱数据。在一些实例中,将前体离子和碎片离子的质量匹配容差分别设定为100ppm和150ppm(Haas,W.;Haas,W.;Faherty,B.K.;Gerber,S.A.;Elias,J.E.;Beausoleil,S.A.;Bakalarski,C.E.;Li,X.;Villen,J.;Gygi,S.P.Optimization and Use of Peptide Mass Measurement Accuracy in ShotgunProteomics.Mol.Cell Proteomics 2006,5,1326–1337)。使用非前体依赖性搜索再次搜索剩余的未测序的高质量MS2谱以用于新PTM发现(Weng,R.R.;Chu,L.J.;Shu,H.-W.;Wu,T.H.;Chen,M.C.;Chang,Y.;Tsai,Y.S.;Wilson,M.C.;Tsay,Y.-G.;Goodlett,D.R.;Ng,W.V.Large precursor tolerance database search—A simple approach forestimation of the amount of spectra with precursor mass shifts in proteomicdata.Journal of Proteomics 2013,91,375–384;Chick,J.M.;Kolippakkam,D.;Nusinow,D.P.;Zhai,B.;Rad,R.;Huttlin,E.L.;Gygi,S.P.A mass-tolerant database searchidentifies a large proportion of unassigned spectra in shotgun proteomics asmodified peptides.Nat Biotechnol 2015,33,743–749)。
通过多种方法,如以下方法,完成特征确定和量化。在一个实例中,每个前体依赖性数据库搜索以常见的翻译后修饰(无修饰、脲基甲基)开始,随后进行一轮搜索,由此添加实验室诱导的修饰(氨甲酰化、乙酰化、氧化、脱酰胺、羧甲基化),然后添加生物修饰(磷酸化、泛素化、甲基化、二甲基化)。允许每次搜索具有最多预设数目的同时修饰,例如,3个修饰。与本说明书一致,其他实例可以搜索替代数据库以进行替代的翻译后修饰。
蛋白质重构涉及使用多种报道的方法将所有重要的肽序列同源性地映射到人类UniProt DB(Nesvizhskii,A.I.;Keller,A.;Kolker,E.;Aebersold,R.A statisticalmodel for identifying proteins by tandem mass spectrometry.2003,75,4646–4658;Kearney,P.;Butler,H.;Eng,K.;Hugo,P.Protein Identification and PeptideExpression Resolver:Harmonizing Protein Identification with ProteinExpression Data.J.Proteome Res.2008,7,234–244;Kearney,P.;Butler,H.;Eng,K.;Hugo,P.Protein Identification and Peptide Expression Resolver:HarmonizingProtein Identification with Protein Expression Data.J.Proteome Res.2008,7,234–244;Mujezinovic,N.;Schneider,G.;Wildpaner,M.;Mechtler,K.;Eisenhaber,F.Reducing the haystack to find the needle:improved protein identificationafter fastelimination of non-interpretable peptide MS/MS spectra and noisereduction.BMC Genomics 2010,11,S13)。
从本文公开的至少一种来源获得生物标志物数据。本公开此处的焦点是从诸如血液、血浆、唾液、汗液、泪液和尿液等流体获得的生物标志物。特别注意血液和从血液样品中提取的血浆,如在干燥血液样品之前。然而,考虑了替代生物标志物来源,并且其与本文的公开内容一致。
生物标志物来源包括,但在一些情况下不限于蛋白质组学和非蛋白质组学来源。生物标志物来源的实例包括年龄、精神警觉性、睡眠模式、运动或活动的测量,或者在采集点容易测量的生物标志物,如葡萄糖水平、血压测量值、心率、认知健康、警觉性、体重,使用本领域已知的任何数目的方法进行采集。一些生物标志物来源例如在图16中示出。示例性的生物标志物来源包括血液或血浆样品中的循环生物标志物或从呼吸抽吸物获得的生物标志物,通过质谱方法或使用抗体或其他免疫学或非免疫学方法相对或绝对地对其进行定量。从这类来源获得的原始数据的实例在图2、15和17中给出。
在一些实例中,生物标志物数据源包括物理数据、个人数据和分子数据。在一些实例中,物理数据源包括但不限于血压、体重、心率和/或葡萄糖水平。在一些实例中,个人数据源包括认知健康。在一些实例中,分子数据源包括但不限于特定蛋白质生物标志物。在一些实例中,分子数据包括从血浆样品获得的质谱数据,该血浆样品作为干燥血液斑点获得和/或从呼吸样品中捕获的渗出物获得。图17中给出了从呼吸中捕获的渗出物生成的原始质谱数据的一个实例。在一些实例中,将来自多个来源的生物标志物和其他生物标志物数据集成为多源生物标志物方案的一部分,并在图18中描绘。
另外,一些生物标志物提供了从中取得样品的环境的信息,这类生物标志物包括天气、一天中的时间、一年中的时间、季节、温度、花粉计数或变应原负荷、流感或其他接触传染病爆发状态的其他测量值。
在一些情况下,基于生物标志物的数据包含大量潜在相关的生物标志物。特别地,本文公开的数据库在一些情况下包含从单个样品(如作为血液斑点沉积在固体表面上的易于获得的样品,如图1所示)获得的至少10、至少50、至少100、至少1,000、至少5,000、至少10,000、至少20,000个或更多。单独地或与其他易于获得的生物标志物来源或其他标志物数据组合地从血液斑点中收集生物标志物数据,极大地促进了数据库生成。在远离卫生设施或实验室的一些情况下采集样品,并且在没有昂贵的冷藏的情况下储存和传输。尽管如此,如在包括本文附图和实施例的说明书中所指示的,获得了大量的生物标志物数据,从而有利于数据库的生成。
在一些情况下,在特定时间的个体或从个体采集的样品与该个体在该时间的健康状况或健康状态相关联。因此,从样品获得的生物标志物或其他标志物与健康状况或健康状态如病症的存在、不存在或相对严重程度相关联。
通常随着时间的推移采集并分析数据。可以一起监测随着时间的推移而变化并且被连接的生物标志物组,例如,与葡萄糖调节如葡萄糖水平、精神敏锐度和患者体重有关的生物标志物。在一些实例中,这些生物标志物的差异可指示疾病状态或疾病进展。类似地,在一些情况下,数据与治疗方案或干预的施用一起采集,使得在治疗如药物治疗、化学疗法、放射疗法、抗体治疗、外科手术、行为改变,运动方案、饮食改变或其他健康干预之前和之后采集数据。数据分析可以指示治疗方案是否成功、是否影响生物标志物概况如降低生物标志物水平或减缓生物标志物水平的健康衰退相关变化,或以其他方式继续与患者相关。在一些实例中,详细描述患者生物标志物的报告可以告知医疗专业人员。
在一些情况下,选择与健康状况或健康状态的差异一致地变化的生物标志物水平,以作为个体指示物或作为指示健康状况或健康状态的小组成员进行验证。通常,鉴别与健康状况或状态相关的单独标志物,但是当多个生物标志物,特别是不严格共变的生物标志物独立地预测健康状态时,总体预测值得到改善。
在一些情况下,进一步鉴别生物标志物的蛋白质来源,从而进行蛋白质特异性分析。例如,分析蛋白质身份,以便揭示生物标志物水平与健康状况或状态之间的相关性的生物学机制。
当蛋白质或其他生物标志物已知时,在一些情况下通过在质谱分析之前将标记的生物标志物引入样品中来促进它们在质谱分析的数据集内的检测。标记的标志物是这样的标志物,如重同位素标记的生物标志物,其可独立于生物标志物质谱标记方法检测,并且在质谱分析中以可重复的、可预测的相对于样品中的内源性或天然存在的生物标志物的偏移进行迁移。通过鉴别质谱输出中的经标记的标志物,并且根据内源性生物标志物相对于其经标记的对应物的已知偏移,可以容易地鉴别质谱输出上的生物标志物斑点的预期位置和大小。这种标记有助于准确、自动地判定(calling)质谱样品中的大量生物标志物,如样品中的100、200、300、400、500、600、700、800、900、1,000个或多于1,000个生物标志物。
通常检查映射至已知蛋白质的生物标志物,检查使用基于免疫学的方法对其进行测量是否产生与质谱数据相比提供类似信息的结果。在这类情况下,生物标志物在一些情况下被开发为独立小组的成分,以用于检测或评估特定的健康状况或健康状态,如癌症健康状态(例如,结直肠癌健康状态)、冠状动脉健康状态、阿尔茨海默症或其他健康状况。在一些情况下,这类独立小组作为在医疗或实验室设施中使用的试剂盒进行实施,或者通过在集中式设施中提供用于分析的样品来实施。
然而,在一些情况下,生物标志物不依赖于关于其衍生自的蛋白质的任何信息而保留预测效用。也就是说,被鉴别为其水平与健康状况或健康状态的存在或严重程度相关地变化的质谱信号的生物标志物在一些情况下可以保留作为它们自己的标志物的效用。即使没有关于相关性的生物学机制的信息(如通过鉴别与标志物相关的蛋白质并通过检查蛋白质的生物学功能可获得的),生物标志物本身,如它在质谱结果中所显示的,具有作为生物标志物单独或组合地指示健康状态或状况或严重程度水平的效用。此类生物标志物通常依赖于质谱检测,并且可能不会在所有情况下均有助于开发为基于免疫学的独立测定。然而,它们仍然可用作独立标志物或用作包含基于质谱法检测小组中至少一些生物标志物的检测方法的成分。
在一些情况下,即使当生物标志物身份未知时,也可以生成标记的生物标志物,该标记的生物标志物以相对于未鉴别的相关生物标志物的预测偏移进行迁移。因此,即使在没有生物标志物的身份的情况下,标记的偏移生物标志物方法也可用来促进这种类型的标志物的高通量采集。
使用本文公开内容的持续监测通过多种方法如以下方法来实施。如图16所示,通过测量来自广泛多样的潜在来源的生物标志物,为个体实施持续的健康监测方案。在一些实例中,生物标志物数据源包括物理数据、个人数据和分子数据。在一些实例中,物理数据源包括但不限于血压、体重、心率和/或葡萄糖水平。在一些实例中,个人数据源包括认知健康。在一些实例中,分子数据源包括但不限于特定蛋白质标志物。在一些实例中,分子数据包括从血浆样品获得的质谱数据,该血浆样品作为干燥血液斑点获得和/或从呼吸样品中捕获的渗出物获得。图17中给出了从呼吸中捕获的渗出物生成的原始质谱数据的一个实例。在一些实例中,将来自多个来源的生物标志物和其他标志物数据集成为多源标志物方案的一部分,并在图18中描绘。
可随着时间的推移采集并分析数据。可以一起监测随着时间的推移而变化并且被连接的标志物组,例如,与葡萄糖调节如葡萄糖水平、精神敏锐度和患者体重有关的标志物。在一些实例中,这些标志物的差异可指示疾病状态或疾病进展。例如,发现葡萄糖水平在方案的过程中发生变化。观察到葡萄糖水平相继受到较少的调节,但不会达到其本身指示糖尿病的水平。发现与葡萄糖调节相关并且与糖尿病有关的生物标志物在监测过程中监测的水平上发生变化。观察到精神敏锐度以与血糖水平相关的方式受到影响。还观察到这些变化的幅度大致随着患者体重的增加而扩大。在该实例中,这些标志物中的每一个均显示出一定的变化,但是这些标志物中没有一个单独地生成足够强的信号,足以导致指示向糖尿病进展的统计学上显著的信号。尽管如此,通过涉及来自多样性来源的标志物(包括来自患者干燥血液样品的生物标志物)的多方面分析生成的聚合信号强烈地指示趋向于糖尿病发作的模式。
用于评估健康或疾病状态的分析方法
本文公开了使用生物标志物评估个体健康如疾病状态或其他状况的系统、方法、装置和组合物。生物标志物通常用来筛选构成进一步测试的基础的疾病信号。疾病信号的检测可能不是确定性的,而需要后续分析来评估、确认、拒绝或监视疾病状态。一些方法包括第一筛选步骤和随后的第二步骤,通过第一筛选步骤,使用至少一种指示疾病的生物标志物检测疾病信号,第二步骤使用至少一种其他生物标志物评估疾病状态。这类方法允许缩减可能的疾病清单,然后再将资源花费在进一步的分析上。在一些情况下,分析包括使用至少一种生物标志物筛选疾病信号和/或评估疾病状态。该分析通常需要分析从样品获得的质谱数据。
本文公开了包含标志物或生物标志物的组合物,所述标志物或生物标志物例如是映射到与疾病有关的至少一种蛋白质的区域的参考多肽。这类组合物通过多种方法如质谱法或免疫测定增强了对突变的检测和/或定量。例如,参考多肽可用来改善对内源性多肽的检测和/或定量。参考多肽适合用于检测突变的存在与否以及任选地检测非均质样品(例如具有野生型和突变蛋白质的组织样品)中突变比例的方法。参考多肽常常映射到突变附近、突变内部、突变的相对侧或其任何组合的区域。
本文公开了用于实施使用生物标志物来评估疾病信号或状态的方法的系统。示例包括计算机系统,其包含存储器和至少一个处理器,其被配置用于执行本文所述的分析步骤。
本文还公开了用于使用生物标志物,如包含用于鉴别和/或量化内源性生物标志物的参考生物标志物的采集装置,来评估疾病信号或状态的装置。采集装置通常包含具有用于接收样品的表面的基底和包含至少一个参考生物标志物的参考生物标志物小组。此外,本文公开了包含用于鉴别和/或量化内源性生物标志物的参考生物标志物的组合物。
用于检测疾病信号的生物标志物通常是分子标志物,其包括多肽或蛋白质标志物、核酸标志物、脂质、碳水化合物、代谢物或其他生物分子。在一些实施方案中,生物标志物包含多肽群体。蛋白质或多肽生物标志物包含野生型多肽、突变多肽或两者。
本文还公开了用于随时间监测疾病的系统、方法、装置和组合物。除了检测疾病信号或状态的存在之外,本文还公开了用于监测疾病进展的方法。通过确定与疾病相关的生物标志物随时间推移占个体中总非疾病生物标志物(例如,突变生物标志物与野生型生物标志物)的比例是增加、减少还是保持不变,可以监测疾病进展。
本文公开了包含用于疾病检测和/或监测的参考标志物的采集装置。参考标志物通常设置在诸如过滤器的采集装置上。该过滤器可以具有一个或多个层,如多孔过滤层,其在液体样品通过时去除微粒。有时,采集装置用于采集液体样品以作为干燥斑点储存。液体样品包括全血、血清、血浆、尿液、唾液、眼泪、脑脊液、羊水、精液、胆汁、滑液、粘液、母乳、脓液、间隙液、呼吸渗出物或其他生物流体。在一些实施方案中,液体样品通过点样到诸如过滤器的固体表面上来储存,以便于采集、储存和运输。
本文还公开了疾病检测试剂盒和疾病检测组合物,其包含针对指示疾病的至少一个生物标志物的至少一个抗体小组。抗体提供了质谱法以外的检测生物标志物的替代方法。然而,本文所述的用于质谱法和抗体检测的数据分析以相似的原理进行。在基于抗体的生物标志物检测中使用的参考生物标志物可以用表位标记。针对表位标签的抗体可以帮助鉴别参考生物标志物。此外,表位标签还可以在某些测定如SDS-PAGE中引起质量迁移偏移,这可以帮助鉴别内源性生物标志物(例如,当针对内源性生物标志物的抗体产生“污损”或不清楚的信号时)。在一些情况下,疾病检测试剂盒包含针对指示至少一个疾病信号的至少一个生物标志物的第一抗体小组和针对指示疾病状态的至少一个生物标志物的第二抗体小组。抗体小组包含针对至少一个生物标志物的至少一种抗体。有时,抗体小组包含至少1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、25、30、35、40、45、50、60、70、80、90或100种或更多种抗体,和/或不超过1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、25、30、35、40、45、50、60、70、80、90或100种或更多种抗体。
生物标志物突变的检测
本文公开了用于分析至少一个生物标志物以检测其突变状态的系统、方法、装置和组合物,该生物标志物可以指示疾病,如癌症。包含参考多肽的组合物适合用于检测突变状态。参考多肽可以构成至少一个参考生物标志物,其对应于与疾病有关的至少一个内源性生物标志物。鉴别生物标志物的突变状态允许检测疾病信号和/或评估与所鉴别的突变状态相关的疾病状态。生物标志物的突变状态的实例包括野生型、点突变、倒位、插入、缺失、重复、移码突变、截短、融合和易位。可以通过比较生物标志物和/或生物标志物组分的性质,如共变,来确定突变状态。此外,可以通过评价给定生物标志物的野生型和突变型变体的比例来监测疾病状态。在一些情况下,参考标志物与QC标志物结合使用。
本文提供用于检测生物标志物突变状态如点突变的系统、方法、装置和组合物。使用至少一个参与点突变的生物标志物可以检测到点突变。如本文所用的,点突变是指多肽或蛋白质中的非同义氨基酸突变。涉及点突变的生物标志物可以是包含点突变的生物标志物。在一些情况下,点突变基因或由该基因编码的蛋白质可通过包含该点突变的蛋白质的多肽/肽片段的质谱信号来检测。当点突变导致多肽序列中的一个氨基酸变为另一个氨基酸时,所导致的该多肽的质谱输出由于质量位移而发生变化。因此,在质谱分析下,预期野生型和相应的点突变多肽具有不同的质量迁移曲线。在这些情况下,点突变体的存在可通过质谱法来检测,其任选地在相对于点突变多肽具有质量位移的参考多肽的帮助下得到增强。此外,样品中的野生型和点突变内源性多肽可以基于为每个多肽群体生成的质谱信号进行定量。
可以使用作为野生型和/或突变型内源性多肽的类似物的参考多肽来增强定量,例如当在分析前将参考多肽以已知量引入样品中时。此外,可以评价野生型和突变型内源性多肽的比例,以提供疾病状态或进展的指示。例如,突变型内源性多肽与野生型内源性多肽之比随时间推移(例如,来自从个体顺序采集的样品)的增加指示该突变体的相对蛋白量的增加。
本文提供了用于检测生物标志物突变状态如截短的系统、方法、装置和组合物。使用至少一个参与截短突变的生物标志物可检测截短。参与截短突变的生物标志物可以是被截短或以其他方式缺失了一部分的生物标志物。在一些情况下,截短的基因或由该基因编码的蛋白质可通过分析该蛋白质的多肽/肽片段的质谱信号的共变来检测。在仅具有野生型蛋白质而没有截短的样品中,由于特定蛋白质的各个区域一起出现在同一蛋白质上,因此它们有望共同变化(例如,各个区域的量应当相等)。然而,截短突变后,该蛋白质的缺失/截短区域预计将不再与该蛋白质的其余区域共同变化。在同时具有野生型和截短蛋白质的非均质样品中,尽管可能仍会观察到某些共变,但总体共变预计将低于在纯野生型样品中预期的约1:1共变关系。因此,样品中与预期共变的偏离指示杂合截短的存在。或者,当在二倍体个体或组织的两个等位基因上均发生截短事件时,与预期共变的偏离可能会更加明显或完全。可以通过与参考生物标志物进行比较来测量与预期共变的偏离。例如,参考生物标志物可包含质量位移的多肽,后者对应于与截短相关的野生型生物标志物的N-端和C-端区域。
可以将一个或多个截短生物标志物的N-端和C-端区域的质谱输出与参考生物标志物的相应区域的输出进行比较。质谱定量的参考生物标志物N-端和C-端区域的比例代表了野生型生物标志物中预期的基线或参考比例。可以使用质量位移的参考生物标志物来增强相应生物标志物的质谱分析。例如,衍生自内源性生物标志物的肽片段的质荷比可以与来自参考生物标志物的质量位移的肽片段一起被鉴别为双峰,从而增强生物标志物的检测。可以通过将内源性生物标志物与参考生物标志物进行比较,与参考样品(具有野生型内源性生物标志物)进行比较,或者通过确定多个样品随时间的共变,来检测与预期共变的偏离。例如,随着时间的推移从个体采集的样品中与预期共变的偏离逐渐增加,可以指示该样品中具有截短突变的蛋白质和/或细胞的比例逐渐增加。
本文提供了用于检测生物标志物突变状态如融合的系统、方法、装置和组合物。使用至少一个参与融合突变的生物标志物可检测融合。一个或多个生物标志物可以参与融合突变,如形成融合的两个生物标志物。在一些情况下,融合基因或由该融合基因编码的蛋白质可通过分析该融合蛋白的多肽/肽片段的质谱信号的共变来检测。在仅具有野生型蛋白质而没有截短的样品中,由于给定蛋白质的各个区域一起出现在同一蛋白质上,因此它们有望共同变化(例如,各个区域的量应当相等)。同样,第一蛋白质的区域预计不会与第二蛋白质的区域共同变化,因为它们不是同一蛋白质的一部分。然而,在第一和第二蛋白质融合在一起的融合突变后,第一和第二蛋白质的区域现在预计将共同变化,而如果融合还与一种或两种融合成分的截短相关,则两个融合蛋白质的N-端和C-端多肽片段的共变可能会减少。在同时具有野生型和截短蛋白质的非均质样品中,与纯野生型样品中预期的共变的基线水平相比,总体共变预计将会增加。因此,样品中与预期共变的偏离指示融合的存在。可以通过与参考生物标志物进行比较来测量与预期共变的偏离。例如,参考生物标志物可包含质量位移的多肽,后者对应于形成融合生物标志物的野生型第一和第二蛋白质的N-端和C-端区域。
可以将由构成融合的不同蛋白质衍生的融合生物标志物的N-端和C-端区域的质谱输出与参考生物标志物的相应区域的输出进行比较。可以将质谱定量的融合生物标志物N-端和C-端区域的比例与参考生物标志物的相应区域的比例进行比较。所述比例的显著偏离指示可能的融合突变。因此,可以使用质量位移的参考生物标志物来增强相应生物标志物的质谱分析。例如,衍生自内源性生物标志物的肽片段的质荷比可以与来自参考生物标志物的质量位移的肽片段一起被鉴别为双峰,从而增强生物标志物的检测。可以通过将内源性生物标志物与参考生物标志物进行比较,与参考样品(具有野生型内源性生物标志物)进行比较,或者通过确定多个样品随时间的共变,来检测与预期共变的偏离。例如,随着时间的推移从个体采集的样品中与预期共变的偏离逐渐增加,可以指示该样品中具有融合突变的蛋白质和/或细胞的比例逐渐增加。
本文提供了用于检测生物标志物突变状态如易位的系统、方法、装置和组合物。使用至少一个参与易位突变的生物标志物可检测易位。一个或多个生物标志物可以参与易位突变,如形成易位的两个生物标志物。在一些情况下,通过分析易位产物的多肽/肽片段的质谱信号的共变可检测易位。在仅具有不参与易位的野生型蛋白质的样品中,由于给定蛋白质的各个区域一起出现在同一蛋白质上,因此它们有望共同变化(例如,各个区域的量应当相等)。同样,第一蛋白质的区域预计不会与第二蛋白质的区域共同变化,因为它们不是同一蛋白质的一部分。然而,在第一和第二蛋白质“交换”区域,从而产生一对截短的融合片段蛋白质的易位突变后,第一和第二蛋白质的某些区域现在预计将在融合在一起后共同变化。而且,对于每种给定的蛋白质,预计易位的区域将不再与非易位的区域共同变化。在同时具有野生型和易位蛋白质的非均质样品中,与纯野生型样品中预期的共变的基线水平相比,总体共变预计将会发生偏离。因此,样品中与预期共变的偏离指示易位的存在。可以通过与参考生物标志物进行比较来测量与预期共变的偏离。例如,参考生物标志物可包含质量位移的多肽,后者对应于形成易位的野生型第一和第二蛋白质的N-端和C-端区域。
可以将由构成第一易位蛋白质的不同蛋白质衍生的易位生物标志物的N-端和C-端区域的质谱输出与参考生物标志物的相应区域的输出进行比较。可以将质谱定量的易位生物标志物N-端和C-端区域的比例与参考生物标志物的相应区域的比例进行比较。所述比例的显著偏离指示可能的易位突变。因此,可以使用质量位移的参考生物标志物来增强相应生物标志物的质谱分析。例如,衍生自内源性生物标志物的肽片段的质荷比可以与来自参考生物标志物的质量位移的肽片段一起被鉴别为双峰,从而增强生物标志物的检测。可以通过将内源性生物标志物与参考生物标志物进行比较,与参考样品(具有野生型内源性生物标志物)进行比较,或者通过确定多个样品随时间的共变,来检测与预期共变的偏离(参见图21A和图21B)。例如,随着时间的推移从个体采集的样品中与预期共变的偏差逐渐增加,可以指示该样品中具有易位突变的蛋白质和/或细胞的比例逐渐增加。
多步骤数据分析
本文公开了用于进行多步骤数据分析以供检测和/或监测疾病的系统和方法。可以通过将分析范围限制为与指示疾病信号或状态的至少一个生物标志物的生物标志物小组相对应的数据子集来改善质谱数据分析。将分析范围限制为与特定疾病信号相关的生物标志物提供了一种有针对性的分析,例如与完整地分析质谱数据集的全面或详尽分析相比,它需要较少的计算资源(例如,计算时间)。替代地或组合地,数据分析包括评价至少一个QC标志物,这允许拒绝或丢弃样品或其完整数据集,对样品数据进行门控以除去未通过质量控制检查的数据子集(例如,丢弃样品中超过热暴露阈值的温度敏感性肽/蛋白质的数据),对样品数据进行归一化以考虑质量控制测量值(例如,基于相应洗脱标志物的洗脱效率校正肽的量/丰度),或其组合。数据分析通常包括使用第一生物标志物小组来分析数据的第一子集以检测至少一个疾病信号,选择与至少一个疾病信号相关的第二生物标志物小组,然后使用第二生物标志物小组来分析数据的第二子集。在一些情况下,第一生物标志物小组能够检测疾病信号,然后使用第二生物标志物小组对其进行进一步评价。例如,分析样品数据可以包括检测与乳腺癌和卵巢癌相关的BRCA1/BRCA2突变。在初步筛选中发现突变后,可以评价与BRCA相关乳腺癌和卵巢癌有关的其他途径相关的生物标志物,以评估疾病状态。这类生物标志物可以包括CHK2、FANCD和ATM。适合于检测疾病信号和/或评估疾病状态如癌症的生物标志物的一些非限制性实例包括针对肝癌的AFP、针对慢性髓样白血病的BCR-ABL、针对卵巢癌的CA-125、针对结直肠癌的CEA、针对非小细胞肺癌的EGFR、针对乳腺癌的HER-2/neu、针对前列腺癌的PSA。癌症生物标志物的其他实例包括K-RAS、p53、EGFR、ERBB2/HER2、p16、CDKN2B、p14ARF、MYOD1、CDH13、CDH1和RB1。还使用非癌症生物标志物,如引起囊性纤维化的CFTR突变。可以使用映射到野生型生物标志物和/或相应突变生物标志物的参考生物标志物来增强疾病状态的检测。
有时,通过首先筛选质谱数据集将分析范围限制到具体疾病信号,并且通过后续分析进一步评价已鉴别疾病的状态,这样的目标分析所需要的计算时间比完整质谱数据集的完整且非目标分析所需要的计算时间至少短10%、20%、30%、40%、50%、60%、70%、80%、90%、95%、99%或更多。在某些情况下,该计算时间比完整质谱数据集的完整且非目标分析至少短2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、25、30、35、40、45、50、55、60、65、70、75、80、85、90、95、100、200、300、400或500倍或更多倍。
两步数据分析方法通常包括对数据的第一子集的第一分析以筛选疾病信号,以及对数据的第二子集的第二分析以评估疾病状态。数据的第一子集通常对应于包含指示至少一个疾病信号的至少一个生物标志物的生物标志物小组。通常将数据的第一子集作为目标初始分析或筛选步骤的一部分进行评价。从数据的第一子集的分析中鉴别的疾病信号然后形成针对所鉴别的疾病信号的附加分析的基础。将这样的初始筛选步骤并入数据分析中允许有效的疾病检测和/或监测,而不需要像对完整数据集的较大部分的分析一样多的资源(例如,计算时间)。在一些情况下,该分析方法进一步包括采用至少一个在两步数据分析之前的QC标志物的初始质量控制步骤。
数据的第一子集提供单个生物标志物如生物标志物突变状态的信息,或针对多个生物标志物。另外,数据的第一子集提供指示单个疾病信号或多个疾病信号的至少一个生物标志物的信息。例如,数据的第一子集包含不超过1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、25、30、35、40、45、50、55、60、65、70、75、80、85、90、95、100、200、300、400、500或1000个或更多个生物标志物的数据。有时,数据的第一子集包含至少1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、25、30、35、40、45、50、55、60、65、70、75、80、85、90、95、100、200、300、400、500或1000个或更多个生物标志物的数据。在一些情况下,数据的第一子集提供生物标志物数据的信息,该生物标志物数据适合于检测至少1、2、3、4、5、6、7、8、9、10、15、20、25、30、35、40、45、50、60、70、80、90或100种或更多种疾病的疾病信号,和/或检测不超过1、2、3、4、5、6、7、8、9、10、15、20、25、30、35、40、45、50、60、70、80、90或100种或更多种疾病的疾病信号。
有时,多步骤分析包括分析数据的第一子集以检测单个疾病信号,然后分析数据的第二子集以评价已针对其检测到信号的疾病的状态。这允许使用样品总数据集的一小部分分别检测并评价疾病信号和状态。在某些情况下,数据的第一子集占该数据的不超过1%、5%、10%、20%、30%、40%、50%、60%、70%、80%、90%或更多和/或该数据的至少1%、5%、10%、20%、30%、40%、50%、60%、70%、80%、90%或更多。
如本文所用的,疾病信号是指疾病存在的指示。疾病信号的实例包括具有指示诸如癌症等疾病的突变状态的生物标志物的阳性鉴别。仅基于一个或多个生物标志物检测疾病并不一定表示阳性诊断。例如,体细胞突变相对频繁地发生,但是在癌症发生之前,侵害性细胞通常会停滞和/或经历凋亡。因此,对疾病信号的检测可以支持对疾病的推断,但是其本身并不总是结论性的。在许多情况下,对疾病信号的检测伴随着评价其他生物标志物以评估疾病状态的后续步骤。如本文所用的,疾病状态是指除了疾病信号之外的关于疾病的信息,并且可以包括各种疾病指标,如疾病的存在、诊断、疾病亚型、激活突变、疾病进展和其他类型的信息。因此,评估疾病状态的后续步骤可以确认该疾病的存在,拒绝该疾病的存在,或者没有定论。有时,对疾病状态的评估确认疾病的存在,并且还提供另外的信息,如疾病进展。
多步骤分析有时包括多个步骤,其中每个步骤的结果决定该分析的后续步骤。例如,多步骤分析可以包括第一步检测癌症信号的存在(例如,各种癌症中存在的生物标志物突变),第二步评估与检测到的癌症信号相关的途径以鉴别具体癌症或癌症亚型(例如,与多种癌症有关的信号传导途径),以及第三步评价疾病进展(例如,参与血管生成和转移的生物标志物、癌症生物标志物的相对丰度等)。在一些情况下,多步骤分析包括使用至少一个QC标志物的分析前质量控制评估,以确定是否丢弃样品/样品数据(或终止任何进一步的样品处理和/或分析),对样品数据进行门控以丢弃未通过QC检查的数据子集,基于QC评估对样品数据的至少一个子集进行归一化,或其组合。
机器学习
一些实施方案涉及作为数据库分析的组件的机器学习,因此一些计算机系统被配置为包含具有机器学习能力的模块。机器学习模块包含以下列出的模态(modalities)中的至少一个,以便构成机器学习功能。
构成机器学习的模态不同地展示数据过滤能力,以便能够进行自动质谱数据斑点检测和判定。在一些情况下,通过在质谱分析输出中存在标志物多肽,如重同位素标记的多肽或其他标志物来促进这种模态,使得内源性肽易于鉴别并在一些情况下进行定量。在蛋白水解消化之前或在蛋白水解消化之后,任选地将标志物添加至样品中。在一些实施方案中,标志物存在于固体背衬上,在通过质谱法分析之前在其上沉积血液斑点或其他样品以供储存或转移。
构成机器学习的模态不同地展示数据门控能力,以便过滤出或“门控”数据斑点,以从下游分析中去除该数据的至少一部分。在一些情况下,例如,当QC标志物指示质量控制事件或失败时,基于对QC标志物的评估或检测过滤出或门控该数据的子集。数据门控的实例包括基于对温度标志物的评价,检测暴露于指示温度敏感性蛋白质降解的阈值以上的温度,然后从进一步的分析中门控出或去除与温度敏感性蛋白质相对应的数据子集。在一些情况下,对温度标志物的评价是基于指示温度暴露水平的用户输入。在其他情况下,数据门控通过以下方式进行:分析多个标志物的洗脱效率,这些标志物包含已知量和疏水性的多肽群体,基于疏水性确定多肽之间的相对洗脱效率,以及门控出或去除与样品中的多肽相对应的数据子集,所述多肽与低于预设阈值的不佳洗脱效率相关。替代地或组合地,基于具有相应疏水性的标志物多肽的相对洗脱效率,将通过质谱法对多肽的定量在样品中的蛋白质群体之间进行归一化。该过程允许对多肽进行更准确的定量,从而解决基于疏水性的洗脱效率差异。数据门控的其他实例包括基于对一组生物标志物的评价来检测疾病信号,然后门控或选择与对应于该疾病的另一组生物标志物相对应的数据子集,以供进一步分析。
构成机器学习的模态不同地展示数据处理或数据加工能力,以便以有助于下游分析的形式呈现所判定的数据斑点。数据处理的实例包括但不一定限于对数转换、分配比例比,或将数据映射到精心设计的特征,以便以有助于下游分析的形式呈现数据。
如本文所公开的机器学习数据分析组件定期加工质谱数据集内的广泛特征,如1至10,000个特征,或2至300,000个特征,或这些范围中的任一个范围内或高于这些范围中的任一个范围的多个特征。在一些情况下,数据分析涉及至少1k、2k、3k、4k、5k、6k、7k、8k、9k、10k、20k、30k、40k、50k、60k、70k、80k、90k、100k、120k、140k、160k、180k、200k、220k、2240k、260k、280k、300k或多于300k个特征。
使用与本文公开内容一致的任何数目的方法来选择特征。在一些情况下,特征选择包括弹性网络、信息增益、随机森林输入或与本文的公开内容一致并且本领域技术人员熟悉的其他特征选择方法。
再次使用与本文公开内容一致的任何数目的方法将所选择的特征组装成分类器。在一些情况下,分类器生成包括逻辑回归、SVM、随机森林、KNN或与本文的公开内容一致并且本领域技术人员熟悉的其他分类器方法。
机器学习方法不同地包括选自ADTree、BFTree、ConjunctiveRule、DecisionStump、Filtered Classifier、J48、J48Graft、JRip、LADTree、NNge、OneR、OrdinalClassClassifier、PART、Ridor、SimpleCart、随机森林和SVM的至少一种方法的实施。
在被配置用于本文公开的分析的计算机上应用机器学习或提供机器学习模块,允许检测用于无症状疾病检测或早期检测的相关小组,作为持续监测程序的一部分,以便在症状发展之前或在干预更容易完成或更有可能带来成功结果时鉴别疾病或病症。监测通常但不一定与遗传评估相结合地或在遗传评估的支持下进行,该遗传评估指示其发病或进展特征受到监测的病症的遗传易感性。类似地,在一些情况下,利用机器学习来促进对治疗方案的治疗功效的监测或评估,使得治疗方案可以随着时间的推移进行修改、继续或解决,如持续的蛋白质组学介导的监测所示。在一些情况下,使用机器学习模型来分析样品数据,以检测疾病信号和/或确定疾病状态。该分析可利用参考生物标志物来进行或增强检测和/或确定步骤。
干燥血液斑点分析
被配置为接收如本文所公开的质谱数据的方法、数据库和计算机通常涉及加工在空间上、时间上或空间和时间上较大的质谱数据集。也就是说,生成的数据集在一些情况下包含每个采集的样品的大量质谱数据点,由大量采集的样品生成,并且在一些情况下由来源于单个个体的多个样品生成。
在一些情况下,通过将样品如干燥的血液样品(或其他容易获得的样品,如尿液、汗液、唾液或其他流体或组织)沉积到固体框架如固体背衬或固体三维框架上来促进数据采集。将样品如血液样品沉积在固体背衬或框架上,在那里主动或被动地进行干燥,从而有助于储存或从采集点运输到可以进行加工的位置。样品采集可以采用如本公开中通篇描述的具有至少一个QC标志物和/或参考生物标志物的采集装置。
如本文所公开的,许多方法可用于从干燥的样品如干燥血液斑点样品中回收蛋白质组学或其他生物标志物信息。在一些情况下,将样品溶解,例如溶解在TFE中,并进行蛋白水解以生成将要通过质谱分析可视化的片段。通过酶促或非酶促处理完成蛋白水解。示例性的蛋白酶包括胰蛋白酶,但还包括单独或组合使用的酶,如蛋白酶K、肠肽酶、弗林蛋白酶、liprotamase、菠萝蛋白酶、沙雷菌肽酶、嗜热菌蛋白酶、胶原酶、纤溶酶或任何数目的丝氨酸蛋白酶、半胱氨酸蛋白酶或其他特异性或非特异性酶促肽酶。非酶促蛋白酶处理,如高温、pH处理、溴化氰和其他处理,也与一些实施方案一致。
当对特定的质谱片段感兴趣或用于分析时,如对于指示健康状况状态的生物标志物小组,通常有益的是包括重标记的或其他标志物作为如本文所述的标准标志物。指示健康状态(例如,突变状态)的参考生物标志物可以根据这些方法来标记并使用。同样,某些QC标志物可以是标记的标志物,例如,与感兴趣的生物标志物相对应的洗脱标志物,其可以提供关于该生物标志物的洗脱效率的信息。如所讨论的,这类标记的标志物在已知位置处并且以相对于感兴趣的样品片段的已知偏移在质谱输出上迁移。包含这些标志物通常导致质谱输出中的“偏移双峰”。通过检测这些双峰,可以个人地或通过自动化数据分析工作流程容易地在全范围的质谱输出数据中以及除此之外鉴别对健康状况状态有意义的特定斑点。当标志物具有已知的质量和量时,并且任选地当加载到样品中的量在标志物之间变化时,所述标志物也可以用作质量标准品,从而有利于标志物相关片段和质谱输出中的剩余片段的定量。
在采集之前(例如,在DBS采集前沉积到采集装置如滤纸上)、在采集时、在重新溶解和或洗脱期间或之后、在消化之前或在消化之后,将标准标志物引入样品中。也就是说,在一些情况下,“预加载”诸如固体背衬或三维体积的样品采集结构,以便在样品采集之前存在一个或多个标准标志物(例如,QC标志物和/或指示健康状态的参考生物标志物)。标准标志物的非限制性实例包括如本说明书通篇描述的沉积在过滤器上的标志物(例如,质量控制标志物)。或者,在样品采集之后、在样品在该结构上干燥之后、在样品采集期间或之后、在样品重新溶解期间或之后、或在样品的蛋白水解处理期间或之后,将标准标志物添加至采集结构。在优选的实施方案中,在样品采集之前将精确地或大约1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、45、50、55、60、65、70、75、80、85、90、95、100、110、120、130、140、150、160、170、180、190、200、225、250、275、300个或多于300个标准标志物添加至采集结构,使得样品的标准处理产生在输出中包括标准标志物的质谱输出,而无需对样品进行任何另外的处理。因此,本文公开的一些方法包括提供在样品采集之前已经将样品标志物引入到表面上的采集装置,并且一些装置或计算机系统被配置为接收其中包括标准标志物的质谱数据,并且任选地鉴别质谱标志物及其相应的内源性质量片段。
某些定义
除非另有定义,否则本文使用的所有技术术语均具有与本发明所属领域的普通技术人员通常理解的相同的含义。除非上下文另有明确规定,否则如本说明书和所附权利要求书中所使用的,单数形式“一个”、“一种”和“该”包括复数指示物。除非另有说明,否则本文对“或”的任何提及旨在涵盖“和/或”。
如本文所用的,“约”某一数字是指包括该数字并且跨越该数字加上或减去该数字的10%的范围。“约”某一范围是指扩展至低于该范围下限10%至高于上限10%的范围。
如本文所用的,“多数”是指大于一半的量或百分比,例如大于50%、大于55%、大于60%、大于65%、大于70%、大于75%、大于80%、大于85%、大于90%、大于95%或大于99%。
如本文所用的,“肽片段”和“多肽”是指具有至少一个肽键,如至少两个、三个、四个或五个肽键,直至并包括全长蛋白质的分子。在一些情况下,根据蛋白质的质谱分析,多肽可映射至蛋白质或由片段化产生。例如,单个氨基酸无法一致地或可靠地映射到蛋白质,但是在许多情况下,多肽,尤其是具有4、5、6、7、8、9、10个或超过10个残基的多肽,在包含蛋白质降解的质谱分析中,可以可靠地映射到起源蛋白质。在一些情况下,肽片段包含可映射至蛋白质的多种同种型的氨基酸序列。在一些情况下,多个多肽构成全长蛋白质的全部或部分(例如,在由一个以上的多肽亚单位构成的蛋白质的情况下)。例如,多肽群体可以是可映射至蛋白质的单个多肽序列的均质群体,或者多肽群体可以是可映射至蛋白质的不同多肽亚单位的两个或更多个多肽序列的非均质群体。或者,多肽可以是全长蛋白质。或者,多肽不必是与内源性蛋白质或蛋白质亚单位相对应的完整或全长氨基酸序列。在一些情况下,多肽是通过对蛋白质或蛋白质亚单位进行酶消化、电离或其他片段化方法而产生的肽片段。
如本文所用的,“生物分子”是指存在于生物体中的分子和离子,包括诸如蛋白质和多肽的大分子、碳水化合物、脂质、核酸和诸如代谢物(主要和/或次要代谢物)的较小分子。在整个说明书中的许多情况下,当提及蛋白质或多肽的分析时,还考虑到可以对其他有益于质谱分析的生物分子,如本文列出的生物分子进行这样的分析。
如本文所用的,“生物标志物”是指指示某些疾病、状况或环境暴露的生物体的生物分子。
如本文所用的,“参考生物标志物”是指内源性生物标志物或内源性生物标志物组分的标记或未标记的类似物或衍生物。参考生物标志物可用来提供用于针对内源性生物标志物或生物标志物组分评估、评价或检测健康状态的基准。例如,参考生物标志物可以包含已知输入量的与内源性生物标志物相对应的质量偏移突变的或非质量偏移多肽,其中该突变指示疾病或病症的风险或状态。可以使用诸如质谱法等技术来检测或分析参考生物标志物,并将其与内源性生物标志物进行比较,以鉴别内源性生物标志物(例如,它们的m/z比应相差预测的偏移),量化内源性生物标志物(例如,基于参考生物标志物的已知输入量和信号),确定内源性生物标志物的状态(例如,对于截短/未截短的内源性生物标志物,相对m/z比可能不同)。在一些情况下,参考生物标志物以已知浓度添加,使其测得的浓度易于用来归一化或确定其对应的样品生物标志物的浓度。
如本文所用的,“质量控制标志物”是指用于评估至少一种与样品相关的条件或过程,例如样品采集、干燥、储存、洗脱、处理的材料或分子群体,其也可以适用于储存样品的过滤器。这类条件通常指示样品完整性、样品洗脱效率和过滤器储存条件中的至少一种。标志物可包括来自样品的生物标志物的生物分子类似物,例如重同位素标记形式的生物标志物。标志物的其他实例包括温度和湿度指示剂。质量控制标志物还可以包括筛选或门控标志物,以及归一化标志物,其用于提供可用于样品数据门控和/或归一化的信息。在一些情况下,质量控制标志物被称为标志物,其周围语言的语境使这些标志物明显起到质量控制功能。有时,质量控制标志物还具有另外的功能,如充当用于增强对样品中生物标志物的鉴别和/或定量的参考标志物。
附图的讨论
在图1中,可以看到示例性的Noviplex DBS plasma卡,其具有覆盖层、扩散层、分离器、血浆采集储器、隔离屏和基卡。将全血施加至覆盖层上的斑点处,在那里到达扩散层和分离器,该分离器允许血浆通过,以到达血浆采集储器。
在图2中,可以看到由经历三次质谱运行的16个样品得到的48个质谱输出图。呈现了来自技术重复物变异性研究的48次注射的MS1数据图像。16个DBS卡显示在列中,其技术重复物显示在行中。对于每个单独的MS1图像,水平轴为m/z,并且垂直轴为LC时间。为了显示数据质量和再现性的高级视图,示出了来自重复采样实验的MS1数据的视觉表示。在此,呈网格状的每个图像在LC时间相对于m/z轴的图上显示来自单次注入的数据,其中色标表示信号丰度(从黑色-无信号到红色-高信号)。图像的一致性显示了该试验的可重复性。
在图3的左图中,可以看到卡内变异系数(CV),其中CV位于Y轴上,而每个DBS卡位于X轴上。CV范围为3.3%至6.2%。在图3的右图中,可以看到卡间CV,其中密度位于Y轴上,而卡间CV位于X轴上。发现中值CV为9.0%。对64,667个特征计算CV。
在图4的左图中,可以看到卡内变异系数(CV),其中CV位于Y轴上,而每个DBS卡位于X轴上。CV范围为5.1%至6.3%。在图3的右图中,可以看到卡间CV,其中密度位于Y轴上,而卡间CV位于X轴上。发现中值CV为16.2%。对65,795个特征计算CV。
在图5中,可以看到卡间变异系数(CV),其中密度位于Y轴上,而卡间CV位于X轴上。中值CV为25.6%,并且对55,939个特征计算CV。
在图6中,可以看到示出仪器响应近似于内源性血浆浓度的图。该图的X轴为内源性浓度的测量值,而Y轴为归一化的仪器响应。每种蛋白质用蛋白质名称标出,并且斑点的尺寸被调整为以下中值CV,其中最小尺寸的中值CV为0.075,中等尺寸的中值CV为0.100,最大尺寸的中值CV为0.125。虚线显示完美的相关性,而阴影区域显示出与完美相关性相比的适度变化。
在图7中,可以看到归一化的仪器响应相对于蛋白质浓度排序的图。蛋白质按照在X轴上排序的蛋白质浓度从较高浓度到较低浓度排序。归一化的仪器响应在Y轴上。
在图8中,可以看到使用两种肽测量的内源性血浆凝溶胶蛋白水平。每幅图的X轴为凝溶胶蛋白蛋白质沉积μg数,而Y轴为归一化的仪器响应。左图使用具有序列AGALNSNDAFVLK的肽,而右图使用具有序列EVQGFESATFLGYFK的肽。
在图9中,可以看到起源样品的性别预测的结果。在图上示出两条曲线,其中X轴为假阳性率,而Y轴为平均真阳性率。在顶部曲线中示出正确类别,其中AUC为0.96,而在底部曲线中示出随机化类别,其中AUC为大约0.52。
在图10中,可以看到起源样品的种族预测的结果。在图上示出两条曲线,其中X轴为假阳性率,而Y轴为平均真阳性率。在顶部曲线中示出正确类别,其中AUC为0.98,而在底部曲线中示出随机化类别,其中AUC为大约0.54。
在图11中,可以看到起源样品的结直肠癌(CRC)状态的预测结果。在图上示出两条曲线,其中X轴为假阳性率,而Y轴为平均真阳性率。在顶部曲线中示出正确类别,其中AUC为0.76,而在底部曲线中示出随机化类别,其中AUC为大约0.5。
在图12中,可以看到起源样品的结直肠癌(CRC)状态的预测结果。在图上示出两条曲线,其中X轴为假阳性率,而Y轴为平均真阳性率。在顶部曲线中示出正确类别,其中AUC为0.76,而在底部曲线中示出随机化类别,其中AUC为大约0.49。
在图13中,可以看到起源样品的冠状动脉疾病(CAD)状态的预测结果。在图上示出两条曲线,其中X轴为特异性,而Y轴为灵敏度。每条曲线在曲线上方和下方具有误差曲线。在顶部曲线中示出正确类别,其中AUC为0.71,而在底部曲线中示出随机化类别,其中AUC为0.52。可以看出曲线及其误差条不重叠且不同。
在图14中,可以看到LC梯度(左图)和优化的梯度(右图)的两幅图。每幅图具有在Y轴上描绘的有机百分比和在X轴上描绘的色谱时间。该图的线性部分用正方形突出显示。
在图15中,可以看到30分钟梯度(左图)和10分钟梯度(右图)的质谱分析。左图示出每个样品大约30,000个特征,其中z=2-4。右图示出每个样品多于10,000个特征,其中z=2-4。
在图16中,可以看到生物标志物数据的各种来源,这些数据包括物理数据,如血压、体重、血糖;个人数据,如认知健康和心率;以及从血浆和呼吸中采集的分子数据。
在图17中,可以看到用于采集呼吸物的示例性管以及通过质谱法从呼吸样品分析的VOC。该图表明可以从呼吸中采集有意义的生物标志物数据。
在图18中,可以看到来自30-50个个体的数据的示例性数据采集方案,其中每周采集数据,持续12-16周。采集的数据包括通过DPS和呼吸浓缩物的分子概况分析;活动分析,如卡路里、血压、心率和体重;以及通过情绪和健康的个人数据概况分析。在每天绘制的血糖的示例性图中汇编并分析这些数据。
在图19A中,可以看到显示多于10,000个斑点的质谱分析的输出数据。在图19B中,可以看到如图19A中的质谱分析的输出数据,其中添加的重标记的标志物的位置叠加在图中被描绘为红色点。这两张图组合展示了参考标志物如何帮助鉴别质谱输出中的内源性斑点。
在图20中,可以看到16个标志物的代表性列表的结果。每幅图在X轴上示出标志物浓度,而在Y轴上示出斑点信号强度。被确定为准确的斑点判定被描绘为具有黑色轮廓的实心圆圈。被确定为错误判定的斑点判定被描绘为没有轮廓的浅灰色。
在图21A和图21B中,可以看到描绘出使用本文所述方法确定突变状态的说明性实例的图解。图21A示出了野生型AML1和TEL蛋白质产物以及由在多种恶性肿瘤中观察到的易位突变产生的相应融合蛋白的图示。蛋白质产物被标记为具有N-端和C-端结构域,其中野生型AML1蛋白2105具有灰色阴影,而野生型TEL蛋白2106没有阴影。融合蛋白被标记为AML1N-端结构域和TEL C-端结构域2107或TEL N-端和AML1C-端结构域2108的组合。图21B示出了说明性过程,通过该过程,可以针对患者随时间检测相应N-端和C-端结构域的共变。获得第一对照样品2101和相应的第一患者样品2102,并根据本文所述的方法(例如,基于抗体或质谱法的检测和分析)进行评价。该样品中还掺加已知量的参考生物标志物,所述参考生物标志物是重同位素标记的2109,并且对应于AML1/TEL野生型和易位融合蛋白。使用标记的参考生物标志物分析内源性AML1和TEL蛋白,以确定N-端和C-端结构域之间的共变,以说明差异(例如,仪器差异、不同标志物的检测灵敏度差异、移液误差等)。在一些情况下,将内源性蛋白质信号相对于参考生物标志物的信号进行归一化。可以分别基于检测到的AML1结构域之间共变的减少和/或TEL结构域之间共变的减少以及AML1和TEL N-和C-端结构域之间共变的增加,使用该第一样品集来检测疾病信号(AML1/TEL易位)。例如,对照样品可以显示AML1N-端和C-端结构域之间的1:1共变以及TEL N-端和C-端结构域之间的1:1共变。相比之下,具有突变的患者样品2102可以显示AML1N-端结构域与C-端结构域的比例为5:4,而TEL N-端结构域与C-端结构域的比例为1:1。与对照样品相比,患者样品中AML1结构域与1:1比例的偏差提示易位事件。在一些情况下,由于实验差异,例如不同肽的质谱检测的差异和/或样品中健康组织和转化组织的存在,与预期1:1比例的微小偏差可能是不是结论性的。合适的对照样品也可能无法获得。因此,参考生物标志物2109可用来通过提供已知量的例如参考AML1N-端-TEL C-端融合蛋白而增强分析。因此,可以将针对AML1肽的内源信号相对于标记的AML1参考肽进行归一化,以解决这类差异并产生结论性的结果,而在不存在此类参考肽的情况下这可能不是结论性的。另外,在一些情况下,使用多个样品随时间监视患者,所述多个样品可以通过检测指示突变的共变的增加或减少来测量例如疾病的进展或状态。在这种情况下,可以根据如图22B所示的上述方法,分析第二对照样品2103和相对于第一样品在较晚时间采集的第二患者样品2104。第一患者样品2102的AML1N-端与C-端结构域之比为5:4(例如,基于来自相应结构域的肽的质谱检测),而第二患者样品2104的AML1N-端与C-端结构域之比为4:3。该比值的增加可以表明样品中具有突变的细胞的比例相应增加,从而提示疾病状态恶化。
数字处理设备
在一些实施方案中,本文所描述的平台、系统、介质和方法包括数字处理设备或其使用。在进一步的实施方案中,数字处理设备包括执行设备功能的一个或多个硬件中央处理单元(CPU)或通用图形处理单元(GPGPU)。在更进一步的实施方案中,数字处理设备进一步包含被配置为执行可执行指令的操作系统。在一些实施方案中,数字处理设备任选地连接计算机网络。在进一步的实施方案中,数字处理设备任选地连接到因特网,使其可访问万维网。在更进一步的实施方案中,数字处理设备任选地连接到云计算基础设施。在其他实施方案中,数字处理设备任选地连接到内联网。在其他实施方案中,数字处理设备任选地连接到数据存储设备。
根据本文的描述,作为非限制性实例,合适的数字处理设备包括服务器计算机、台式计算机、膝上型计算机、笔记本计算机、小型笔记本型计算机、上网本计算机、记事本计算机、机顶计算机、媒体流设备、手持式计算机、互联网设备、移动智能电话、平板计算机、个人数字助理、视频游戏控制台和媒介物。本领域技术人员将会认识到,许多智能电话适用于本文所述的系统。本领域技术人员还将认识到,具有可选计算机网络连接的所选电视、视频播放器和数字音乐播放器适用于本文所述的系统。合适的平板计算机包括具有本领域技术人员已知的小册子、平板和可转换配置的平板计算机。
在一些实施方案中,所述数字处理设备包括被配置用于执行可执行指令的操作系统。该操作系统是例如包含程序和数据的软件,该软件管理设备的硬件并为应用程序的执行提供服务。本领域技术人员将认识到,作为非限制性实例,合适的服务器操作系统包括FreeBSD、OpenBSD、Linux、Mac OS XWindows和本领域技术人员将认识到,作为非限制性实例,合适的个人计算机操作系统包括MacOS和类似UNIX的操作系统,如在一些实施方案中,操作系统由云计算提供。本领域技术人员还将认识到,作为非限制性实例,合适的移动智能电话操作系统包括OS、Research InBlackBerry WindowsOS、WindowsOS、和本领域技术人员还将认识到,举非限制性示例而言,合适的媒体流设备操作系统包括AppleGoogleGoogleAmazon和本领域技术人员还将认识到,举非限制性示例而言,合适的视频游戏控制台操作系统包括XboxMicrosoft Xbox One、和
在一些实施方案中,所述设备包括存储和/或存储器设备。该存储和/或存储器设备是用于临时或永久地存储数据或程序的一个或多个物理设备。在一些实施方案中,该设备是易失性存储器且需要电力来维护存储的信息。在一些实施方案中,该设备是非易失性存储器,并且在数字处理设备未通电时保留存储的信息。在进一步的实施方案中,非易失性存储器包含闪速存储器。在一些实施方案中,非易失性存储器包含动态随机存取存储器(DRAM)。在一些实施方案中,非易失性存储器包含铁电随机存取存储器(FRAM)。在一些实施方案中,非易失性存储器包含相变随机存取存储器(PRAM)。在其他实施方案中,该设备是存储设备,作为非限制性实例,包括CD-ROM、DVD、闪速存储器设备、磁盘驱动器、磁带驱动器、光盘驱动器和基于云计算的存储。在进一步的实施方案中,存储和/或存储器设备是诸如本文公开的那些设备的组合。
在一些实施方案中,所述数字处理设备包括用于向用户发送视觉信息的显示器。在一些实施方案中,该显示器是阴极射线管(CRT)。在一些实施方案中,该显示器是液晶显示器(LCD)。在进一步的实施方案中,该显示器是薄膜晶体管液晶显示器(TFT-LCD)。在一些实施方案中,该显示器是有机发光二极管(OLED)显示器。在多个其他实施方案中,OLED显示器是无源矩阵OLED(PMOLED)或有源矩阵OLED(AMOLED)显示器。在一些实施方案中,该显示器是等离子体显示器。在其他实施方案中,该显示器是视频投影仪。在更进一步的实施方案中,该显示器是诸如本文公开的那些设备的组合。
在一些实施方案中,所述数字处理设备包括用于从用户接收信息的输入设备。在一些实施方案中,该输入设备是键盘。在一些实施方案中,该输入设备是指向设备,作为非限制性实例,包括鼠标、轨迹球、跟踪板、操纵杆、游戏控制器或触笔。在一些实施方案中,该输入设备是触摸屏或多点触摸屏。在其他实施方案中,该输入设备是用于捕获语音或其他声音输入的麦克风。在其他实施方案中,该输入设备是用来捕捉运动或视觉输入的摄像机或其他传感器。在进一步的实施方案中,该输入设备是Kinect、Leap Motion等。在更进一步的实施方案中,该输入设备是诸如本文公开的那些设备的组合。
参见图22,在特定实施方案中,用于执行本文所述的分析的示例性数字处理设备2201,包括评价QC标志物和/或指示健康状态的生物标志物。在该实施方案中,数字处理设备2201包括至少一个中央处理单元(CPU,本文中也称为“处理器”和“计算机处理器”)2205,中央处理单元1405是单核或多核处理器,或者多个处理器。数字处理设备2201还包括存储器或存储器位置2210(例如,随机存取存储器、只读存储器、闪速存储器)、电子存储单元2215(例如,硬盘)、用于与一个或多个其他系统通信的通信接口2220(例如,网络适配器)和外围设备2225,如高速缓冲存储器、其他存储器、数据存储和/或电子显示适配器。该数字处理设备可以通过电子显示器2235向用户显示输出。存储器2210、存储单元2215、接口2220和外围设备2225通过诸如主板的通信总线(实线)与CPU 2205通信。存储单元2215通常是用于存储数据的数据存储单元(或数据存储库)。通常,数字处理设备2201在通信接口2220的帮助下可操作地耦合至计算机网络(“网络”)2230。网络2230通常是因特网、互联网和/或外联网,或者与因特网通信的内联网和/或外联网。网络2230在一些情况下是电信和/或数据网络。网络2230一般包括能够实现分布式计算如云计算的一个或多个计算机服务器。在一些情况下,网络2230在设备2201的帮助下实现对等网络,这使耦合至设备2201的设备能够作为客户端或服务器发挥作用。
继续参见图2,CPU 2205能够执行一系列机器可读指令,包括可以在程序或软件中体现的用于QC标志物和/或生物标志物分析的方法。所述指令通常存储在诸如存储器2210的存储器位置中。所述指令通常被导向CPU 2205,其随后可对CPU 2205进行编程或以其他方式进行配置,以实现本公开的方法。由CPU 2205执行的操作的实例包括获取、解码、执行和写回。CPU 2205通常是电路如集成电路的一部分。设备2201中的一个或多个其他组件任选地被包括在该电路中。在一些情况下,该电路是专用集成电路(ASIC)或现场可编程门阵列(FPGA)。
继续参见图2,存储单元2215能够存储文件,如驱动程序、文库和保存的程序。存储单元2215通常存储用户数据,例如,用户偏好和用户程序。数字处理设备2201有时包括位于外部的,如位于通过内联网或因特网通信的远程服务器上的一个或多个附加数据存储单元。
继续参见图2,数字处理设备2201通常能够通过网络2230与一个或多个远程计算机系统通信。例如,设备2201可与用户的远程计算机系统进行通信。远程计算机系统的实例包括个人计算机(例如,便携式PC)、平板或平板PC(例如,iPad、Galaxy Tab)、电话、智能电话(例如,iPhone、支持Android的设备、)或个人数字助理。
如本文所述的方法通过存储在数字处理设备2201的电子存储位置上(例如,存储器2210或电子存储单元2215上)的机器(例如,计算机处理器)可执行代码来实现。该机器可执行代码或机器可读代码通常以软件的形式提供。在使用期间,该代码通常由处理器2205来执行。在一些情况下,该代码从存储单元2215中检索到,并存储在存储器2210上,以备由处理器2205访问。有时,不包括电子存储单元2215,而是将机器可执行指令存储在存储器2210上。
非暂时性计算机可读存储介质
在一些实施方案中,本文公开的平台、系统、介质和方法包括用程序编码的一个或多个非暂时性计算机可读存储介质,该程序包括可由任选地联网的数字处理设备的操作系统执行的指令。在进一步的实施方案中,计算机可读存储介质是数字处理设备的有形组件。在更进一步的实施方案中,计算机可读存储介质任选地可从数字处理设备移除。在一些实施方案中,作为非限制性实例,计算机可读存储介质包括CD-ROM、DVD、闪速存储器设备、固态存储器、磁盘驱动器、磁带驱动器、光盘驱动器、云计算系统和服务器等。在一些情况下,所述程序和指令在介质上永久地、基本上永久地、半永久地或非暂时地编码。
计算机程序
在一些实施方案中,本文公开的平台、系统、介质和方法包括至少一个计算机程序或其使用。计算机程序包括可在数字处理设备的CPU中执行的一系列指令,该指令被编写以执行指定的任务。计算机可读指令可以作为执行特定任务或实现特定抽象数据类型的程序模块,如函数、对象、应用程序编程接口(API)、数据结构等来实现。鉴于本文提供的公开内容,本领域技术人员将认识到,计算机程序可用各种语言的各种版本来编写。
计算机可读指令的功能性可以根据需要在各种环境中组合或分布。在一些实施方案中,计算机程序包含一系列指令。在一些实施方案中,计算机程序包含多个系列的指令。在一些实施方案中,从一个位置提供计算机程序。在其他实施方案中,从多个位置提供计算机程序。在各个实施方案中,计算机程序包括一个或多个软件模块。在多个实施方案中,计算机程序部分或全部包括一个或多个web应用程序、一个或多个移动应用程序、一个或多个独立应用程序、一个或多个web浏览器插件、扩展项、加载项或附加项或其组合。
Web应用程序
在一些实施方案中,计算机程序包括web应用程序。鉴于本文提供的公开内容,本领域技术人员将认识到,在多个实施方案中,web应用程序利用一个或多个软件框架和一个或多个数据库系统。在一些实施方案中,基于诸如.NET或Ruby on Rails(RoR)的软件框架创建web应用程序。在一些实施方案中,web应用程序利用一个或多个数据库系统,作为非限制性实例,该数据库系统包括关系数据库系统、非关系数据库系统、面向对象的数据库系统、关联数据库系统和XML数据库系统。在进一步的实施方案中,作为非限制性实例,合适的关系数据库系统包括SQL服务器、mySQLTM和本领域技术人员还将认识到,在多个实施方案中,web应用程序以一种或多种语言的一个或多个版本编写。Web应用程序可以用一种或多种标记语言、表示定义语言、客户端脚本语言、服务器端编码语言、数据库查询语言或其组合来编写。在一些实施方案中,web应用程序在某种程度上以诸如超文本标记语言(HTML)、可扩展超文本标记语言(XHTML)或可扩展标记语言(XML)的标记语言编写。在一些实施方案中,web应用程序在某种程度上以诸如级联样式表(CSS)的表示定义语言编写。在一些实施方案中,web应用程序在某种程度上以诸如异步Javascript和XML(AJAX)、Actionscript、Javascript或的客户端脚本语言编写。在一些实施方案中,web应用程序在某种程度上以诸如Active Server Pages(ASP)、Perl、JavaTM、JavaServer Pages(JSP)、超文本预处理器(PHP)、PythonTM、Ruby、Tcl、Smalltalk、或Groovy的服务器端编码语言编写。在一些实施方案中,web应用程序在某种程度上以诸如结构化查询语言(SQL)的数据库查询语言编写。在一些实施方案中,web应用程序集成了诸如Lotus的企业服务器产品。在一些实施方案中,web应用程序包括媒体播放器元件。在各种进一步的实施方案中,媒体播放器元件利用许多合适的多媒体技术中的一种或多种,作为非限制性实例,该多媒体技术包括HTML 5、JavaTM和
移动应用程序
在一些实施方案中,计算机程序包括提供给移动数字处理设备的移动应用程序。在一些实施方案中,移动应用程序在其制造时被提供给移动数字处理设备。在其他实施方案中,经由本文所述的计算机网络将移动应用程序提供给移动数字处理设备。
鉴于本文提供的公开内容,使用本领域已知的硬件、语言和开发环境,通过本领域技术人员已知的技术创建移动应用程序。本领域技术人员将认识到,移动应用程序是用数种语言编写的。作为非限制性实例,合适的编程语言包括C、C++、C#、Objective-C、JavaTM、Javascript、Pascal、Object Pascal、PythonTM、Ruby、VB.NET、WML和具有或不具有CSS的XHTML/HTML,或其组合。
合适的移动应用程序开发环境可从若干来源获得。作为非限制性实例,商业上可用的开发环境包括AirplaySDK、alcheMo、Celsius、Bedrock、FlashLite、.NET Compact Framework、Rhomobile和WorkLight移动平台。其他开发环境可免费获得,作为非限制性实例,该其他开发环境包括Lazarus、MobiFlex、MoSync和Phonegap。此外,移动设备制造商分发软件开发者工具包,作为非限制性实例,该软件开发者工具包包括iPhone和iPad(iOS)SDK、AndroidTMSDK、SDK、BREW SDK、OS SDK、Symbian SDK、webOS SDK和Mobile SDK。
本领域技术人员将认识到,若干商业论坛可用于分发移动应用程序,作为非限制性实例,包括App Store、Play、Chrome WebStore、AppWorld、用于Palm设备的App Store、用于webOS的App Catalog、用于Mobile的Marketplace、用于设备的Ovi Store、Apps和DSi Shop。
独立应用程序
在一些实施方案中,计算机程序包括独立应用程序,该独立应用程序是作为独立计算机进程运行的程序,而不是现有进程的附加项,例如,不是插件。本领域技术人员将认识到经常编译独立应用程序。编译器是将用编程语言编写的源代码转换为二进制目标代码如汇编语言或机器代码的计算机程序。作为非限制性实例,合适的编译编程语言包括C、C++、Objective-C、COBOL、Delphi、Eiffel、JavaTM、Lisp、PythonTM、Visual Basic和VB.NET或其组合。通常至少部分地执行编译以创建可执行程序。在一些实施方案中,计算机程序包括一个或多个可执行的编译的应用程序。
Web浏览器插件
在一些实施方案中,所述计算机程序包括web浏览器插件(例如,扩展项等)。在计算中,插件是将特定功能添加至更大的软件应用程序中的一个或多个软件组件。软件应用程序的制造商支持插件,以使第三方开发人员能够创建扩展应用程序的能力,以支持轻松添加新特征,并减小应用程序的大小。当支持时,插件能够自定义软件应用程序的功能。例如,插件通常在web浏览器中使用,以播放视频、生成交互性、扫描病毒以及显示特定文件类型。本领域技术人员熟悉多个web浏览器插件,包括Player、和在一些实施方案中,工具栏包含一个或多个web浏览器扩展项、加载项或附加件。在一些实施方案中,工具栏包含一个或多个浏览器条、工具带或桌面带。
鉴于本文提供的公开内容,本领域技术人员将认识到,可获得多种插件框架,其能够以各种编程语言开发插件,作为非限制性实例,这些编程语言包括但不限于C++、Delphi、JavaTM、PHP、PythonTM和VB.NET或其组合。
Web浏览器(也称为因特网浏览器)是被设计用于与连接网络的数字处理设备一起用于在万维网上检索、呈现和遍历信息资源的软件应用程序。作为非限制性实例,合适的web浏览器包括InternetChrome、Opera和KDE Konqueror。在一些实施方案中,该web浏览器是移动web浏览器。移动web浏览器(也称为微浏览器、迷你浏览器和无线浏览器)被设计用于移动数字处理设备,作为非限制性实例,包括手持式计算机、平板计算机、上网本计算机、小型笔记本计算机、智能电话、音乐播放器、个人数字助理(PDA)和手持式视频游戏系统。作为非限制性实例,合适的移动web浏览器包括:浏览器、RIM浏览器、Blazer、浏览器、适用于移动设备的InternetMobile、Basic Web、浏览器、OperaMobile和PSPTM浏览器。
软件模块
在一些实施方案中,本文公开的平台、系统、介质和方法包括软件、服务器和/或数据库模块,或其使用。鉴于本文提供的公开内容,使用本领域已知的机器、软件和语言,通过本领域技术人员已知的技术创建软件模块。本文公开的软件模块以多种方式实现。在多个实施方案中,软件模块包含文件、代码段、编程对象、编程结构或其组合。在进一步的多个实施方案中,软件模块包含多个文件、多个代码段、多个编程对象、多个编程结构或其组合。在多个实施方案中,作为非限制性实例,所述一个或多个软件模块包含web应用程序、移动应用程序和独立应用程序。在一些实施方案中,软件模块在一个计算机程序或应用程序中。在其他实施方案中,软件模块在超过一个计算机程序或应用程序中。在一些实施方案中,软件模块被托管在一台机器上。在其他实施方案中,软件模块被托管在超过一台机器上。在进一步的实施方案中,软件模块被托管在云计算平台上。在一些实施方案中,软件模块被托管在一个位置处的一个或多个机器上。在其他实施方案中,软件模块被托管在超过一个位置处的一个或多个机器上。
数据库
在一些实施方案中,本文公开的平台、系统、介质和方法包括一个或多个数据库或其使用。鉴于本文提供的公开内容,本领域技术人员将认识到,许多数据库适用于存储和检索生物标志物信息。在多个实施方案中,作为非限制性实例,合适的数据库包括关系数据库、非关系数据库、面向对象的数据库、对象数据库、实体关系模型数据库、关联数据库和XML数据库。进一步的非限制性实例包括SQL、PostgreSQL、MySQL、Oracle、DB2和Sybase。在一些实施方案中,数据库是基于因特网的。在进一步的实施方案中,数据库是基于web的。在更进一步的实施方案中,数据库是基于云计算的。在其他实施方案中,数据库基于一个或多个本地计算机存储设备。
编号的实施方案
以下实施方案列举了本文公开的特征的组合的非限制性排列。也考虑到特征组合的其他排列。特别是,这些编号实施方案中的每一个均被设想为依赖于或关联于每个先前或后续编号的实施方案,而与它们所列出的顺序无关。1.一种采集装置,其包含:a)采集背衬,其包含用于接收生物样品的表面;和b)设置在所述采集背衬上的多个质量控制(QC)标志物,所述多个QC标志物指示至少一种选自下组的条件:样品完整性、样品洗脱效率和过滤器储存条件。2.实施方案1的采集装置,其中所述采集背衬包含过滤器。3.实施方案1-2中任一项的采集装置,其中基于所述至少一种条件从后续分析中筛选出所述样品。4.实施方案1-3中任一项的采集装置,其中洗脱效率包括样品从基底的释放。5.实施方案1-4中任一项的采集装置,其中过滤器储存条件包括运输期间的储存条件。6.实施方案1-5中任一项的采集装置,其中基于所述至少一种条件对从所述样品获得的数据进行门控,以从后续分析中去除所述数据的至少一个子集。7.实施方案1-6中任一项的采集装置,其中基于所述至少一种条件对从所述样品获得的数据进行归一化。8.实施方案1-7中任一项的采集装置,其中基于所述多个QC标志物中的至少一个,对从所述生物样品获得的数据进行归一化。9.实施方案1-7中任一项的采集装置,其中基于所述多个QC标志物中的至少一个,对从所述样品获得的数据针对另一个样品进行归一化。10.实施方案1-9中任一项的采集装置,其中样品完整性提供在样品采集期间和之后关于样品变化的信息。11.实施方案1-10中任一项的采集装置,其中样品完整性包括样品稳定性、蛋白水解活性、DNA酶活性和RNA酶活性中的至少一种。12.实施方案1-11中任一项的采集装置,其中指示蛋白水解活性的标志物包含沉积在所述采集背衬上的至少一个已知大小和量的多肽群体。13.实施方案12的采集装置,其中所述至少一个多肽群体包含蛋白质。14.实施方案1-11中任一项的采集装置,其中指示DNA酶活性的标志物包含沉积在所述采集背衬上的至少一个已知大小和量的DNA分子群体。15.实施方案1-11中任一项的采集装置,其中指示RNA酶活性的标志物包含沉积在所述采集背衬上的至少一个已知大小和量的RNA分子群体。16.实施方案1-1中任一项的采集装置,其中样品洗脱效率提供从所述采集背衬上成功洗脱下来的样品比例的信息。17.实施方案1-16中任一项的采集装置,其中样品洗脱效率包括总体洗脱效率、基于疏水性的洗脱效率和洗脱下来的样品比例中的至少一种。18.实施方案1-16中任一项的采集装置,其中指示样品洗脱效率的标志物包含疏水性大于样品中阈值百分比的预期分子的分子群体。19.实施方案1-18中任一项的采集装置,其中疏水性大于样品中至少90%的预期分子的分子群体的洗脱表明样品中大多数分子的成功洗脱。20.实施方案1-17中任一项的采集装置,其中指示样品洗脱效率的标志物包含亲水性大于样品中至少90%的预期分子的分子群体。21.实施方案1-17中任一项的采集装置,其中指示样品洗脱效率的标志物包含至少一个已知大小和量的分子群体。22.实施方案1-21中任一项的采集装置,其中过滤器储存条件包括过滤器储存持续时间、温度暴露、光暴露、UV暴露、辐射暴露和湿度暴露中的至少一种。23.实施方案1-22中任一项的采集装置,其中指示湿度暴露的标志物在暴露于阈值湿度后产生可观察的信号。24.实施方案23的采集装置,其中所述可观察的信号是可见光谱的颜色。25.实施方案23的采集装置,其中指示湿度暴露的标志物是不可逆的湿度标志物,其包含潮解性分子群体和至少一种染料。26.实施方案1-22中任一项的采集装置,其中指示温度暴露的标志物在暴露于阈值温度后产生可观察的信号。27.实施方案1-22中任一项的采集装置,其中所述多个标志物包含在暴露于光、UV和辐射中的至少一种之后展现出可观察信号的分子群体。28.实施方案1-22中任一项的采集装置,其中所述多个QC标志物包含选自洗脱标志物、湿度标志物、pH标志物、温度标志物、时间标志物、蛋白水解标志物、核酸酶标志物、稳定性标志物、辐射标志物、UV标志物和光标志物中的至少一种标志物。29.实施方案1-28中任一项的采集装置,其中所述至少一种条件包括样品完整性。30.实施方案1-29中任一项的采集装置,其中所述至少一种条件包括样品洗脱效率。31.实施方案1-29中任一项的采集装置,其中所述至少一种条件包括过滤器储存条件。32.实施方案1-31中任一项的采集装置,其中所述多个QC标志物包括分子传感器群体。33.实施方案32所述的采集装置,其中所述分子传感器群体包含多肽、核酸、脂质、代谢物和碳水化合物中的至少一种。34.实施方案32-33中任一项的采集装置,其中所述分子传感器群体具有非生物学结构。35.实施方案32-34中任一项的采集装置,其中所述分子传感器群体包含有机染料、无机染料、荧光团、量子点、荧光蛋白、热敏蛋白和放射性标记物中的至少一种。36.实施方案32-35中任一项的采集装置,其中在检测到目标分子后,所述分子传感器群体经历可观察的变化。37.实施方案32-36中任一项的采集装置,其中所述分子传感器群体在检测到目标分子后产生可观察的信号。38.实施方案37的采集装置,其中所述可观察的信号是可见颜色变化、UV信号、发光信号和荧光信号中的至少一种。39.实施方案37-38中任一项的采集装置,其中所述目标分子的检测包括所述分子传感器群体与所述目标分子之间的化学反应。40.实施方案37-39中任一项的采集装置,其中所述目标分子的检测包括所述分子传感器群体对所述目标分子的分子识别。41.实施方案32的采集装置,其中所述分子传感器群体包含用于检测目标分子的分子识别组分和用于在检测到目标分子时提供可观察信号的报告组分。42.实施方案1-41中任一项的采集装置,其中所述多个QC标志物中的至少一个可通过质谱法检测。43.实施方案1-41中任一项的采集装置,其中所述多个QC标志物中的至少一个可通过免疫测定检测。44.实施方案1-43中任一项的采集装置,其中所述多个QC标志物包含具有参考多肽群体的参考标志物。45.实施方案44的采集装置,其中所述参考群体包含相对于样品中的相应多肽具有质量位移的多肽。46.实施方案44的采集装置,其中所述参考群体与所述样品中相应多肽群体的区别在于在质谱输出上可检测的质量。47.实施方案44的采集装置,其中所述参考群体与样品中的相应多肽的区别在于与原子和该原子的重同位素之间的质量差异相当的质量。48.实施方案44的采集装置,其中所述参考群体用重同位素进行标记,所述重同位素在质谱分析中以相对于样品多肽群体的可预测偏移进行迁移。49.实施方案44的采集装置,其中所述参考群体与所述样品中的相应多肽的区别在于与通过翻译后修饰增加的质量相当的质量。50.实施方案49的采集装置,其中所述翻译后修饰包括肉豆蔻酰化、棕榈酰化、异戊二烯化、糖基磷脂酰肌醇化、脂化、酰化、乙酰化、甲基化、酰胺化、糖基化、羟基化、琥珀酰化、硫酸化、糖基化、氨基甲酸酯化、羰基化、生物素化、氧化、聚乙二醇化、SUMO化、泛素化、类泛素化和磷酸化中的至少一种。51.实施方案1-50中任一项的采集装置,其中所述用于接收样品的表面包含用于样品沉积的区域。52.实施方案1-51中任一项的采集装置,其中所述样品包含全血、血清、血浆、尿液、唾液、汗液、眼泪、脑脊液、羊水和抽吸物中的至少一种。53.实施方案1-52中任一项的采集装置,其中样品在沉积后干燥并储存在所述采集背衬上。54.实施方案1-54中任一项的采集装置,其中所述样品以干燥的血液斑点的形式储存在所述采集背衬上。55.实施方案1-54中任一项的采集装置,其中所述多个QC标志物中的至少一个标志物被设置在所述采集背衬上的样品沉积区域之内,使得所述样品在所述采集背衬上的沉积将所述至少一个标志物引入该样品中。56.实施方案1-55中任一项的采集装置,其中所述多个QC标志物中的至少一个标志物被设置在所述采集背衬上的样品沉积区域之外,使得样品在采集背衬上的沉积不将所述至少一个标志物引入该样品中。57.实施方案1-56中任一项的采集装置,其中所述多个QC标志物包含位于所述采集背衬上的至少一个标志物,以与样品共洗脱。58.实施方案1-57中任一项的采集装置,其中所述多个QC标志物包含位于所述采集背衬上的至少一个标志物,而不与样品共洗脱。59.实施方案1-58中任一项的采集装置,其中所述多个QC标志物中的至少一个标志物沉积在所述采集背衬上,使得对至少一种样品的处理将所述至少一个标志物引入一种样品中。60.实施方案1-59中任一项的采集装置,其中所述多个QC标志物中的至少一个标志物沉积在所述装置上,使得对至少一种样品的处理不将所述至少一个标志物引入所述至少一种样品中。61.实施方案1-60中任一项的采集装置,其中所述表面包含用于样品沉积的区域。62.实施方案61的采集装置,其中所述多个QC标志物中的至少一个标志物在样品沉积之前沉积在所述区域上。63.实施方案61的采集装置,其中所述多个QC标志物中的至少一个标志物在样品沉积之前沉积在与所述区域分开的表面上的位置上。64.实施方案1-63中任一项的采集装置,其进一步包含固体背衬。65.实施方案1-64中任一项的采集装置,其进一步包含细胞不可透过的多孔层。66.实施方案1-65中任一项的采集装置,其进一步包含血浆采集储器。67.实施方案1-66中任一项的采集装置,还包括扩散层。68.实施方案1-67中任一项的采集装置,其进一步包含无孔材料。69.实施方案68的采集装置,其中所述无孔材料包括塑料。70.实施方案68的采集装置,其中所述无孔材料包括玻璃。71.实施方案68的采集装置,其中所述无孔材料包括金属。72.一种采集装置,其包含:a)采集背衬,其包含细胞不可透过的多孔层;b)沉积在所述采集背衬上的样品,其中该样品穿过所述多孔层,由此过滤除去任何细胞;以及c)在样品沉积之前设置在所述采集背衬上的多个质量控制(QC)标志物。73.一种采集装置,其包含:a)基底;以及b)设置在所述基底上的多个质量控制(QC)标志物,所述多个QC标志物指示至少两种选自下组的条件:温度暴露、湿度暴露、样品pH、洗脱效率和蛋白水解活性。74.实施方案73的采集装置,其中所述多个QC标志物指示至少三种选自下组的条件:温度暴露、湿度暴露、样品pH、洗脱效率和蛋白水解活性。75.实施方案73的采集装置,其中所述多个QC标志物指示至少四种选自下组的条件:温度暴露、湿度暴露、样品pH、洗脱效率和蛋白水解活性。76.一种采集装置,其包含:a)基底,其包含细胞不可透过的多孔层和固体背衬;和b)设置在所述基底上的多个质量控制(QC)标志物,所述多个QC标志物包含指示温度暴露和湿度暴露的标志物。77.一种采集装置,其包含:a)采集背衬,其包含用于接收样品的表面;b)设置在所述采集背衬上的多个质量控制(QC)标志物,所述多个QC标志物指示至少一种选自下组的条件:样品完整性、样品洗脱效率和过滤器储存条件;以及c)设置在所述采集装置上的参考生物标志物小组,所述多个参考生物标志物指示疾病信号。78.一种采集装置,其包含:a)采集背衬,其包含用于接收样品的表面;和b)设置在所述采集背衬上的多个标志物,所述多个标志物指示疾病信号和至少一种选自下组的条件:样品完整性、样品洗脱效率和过滤器储存条件。79.实施方案78的采集装置,其中所述多个标志物包含指示样品完整性、样品洗脱效率或过滤器储存条件的质量控制(QC)标志物。80.实施方案78-79中任一项的采集装置,其中所述多个标志物包含指示疾病信号的参考生物标志物小组。81.实施方案78-80中任一项的采集装置,其中所述多个标志物包含指示疾病信号和至少一种选自下组的条件的参考质量控制(QC)生物标志物:样品完整性、样品洗脱效率和过滤器的存放条件。82.一种基于设置在采集装置上的多个质量控制(QC)标志物来筛选沉积在采集装置上的样品的方法,该方法包括:a)获得采集装置,其包含:i.细胞不可透过的多孔层;ii.沉积在所述采集装置上的样品,其中该样品穿过所述多孔层,由此过滤除去任何细胞;和iii.在样品沉积之前设置在所述采集装置上的多个质量控制(QC)标志物;b)分析所述多个QC标志物;以及c)基于(b)中评估的至少一种条件,对从所述样品获得的数据进行门控,以从后续分析中去除所述数据的至少一个子集。83.一种基于设置在采集装置上的多个质量控制(QC)标志物来筛选沉积在采集装置上的样品的方法,该方法包括:a)获得过滤器,其包含:i.细胞不可透过的多孔层;ii.沉积在所述过滤器上的样品,其中该样品穿过所述多孔层,由此过滤除去任何细胞;和iii.在样品沉积之前设置在所述过滤器上的多个质量控制(QC)标志物;b)分析所述多个QC标志物;以及c)基于在(b)中评估的至少一种条件,对从所述样品获得的数据进行归一化,以解决所述数据的至少一个子集中的偏差。84.一种基于多个标志物来筛选沉积在采集装置上的样品的方法,其包括:a)获得采集装置,其包含:i.过滤器ii.设置在所述过滤器上的多个质量控制(QC)标志物,所述多个QC标志物指示至少两种选自下组的条件:温度暴露、湿度暴露、样品pH、洗脱效率和蛋白水解活性;b)分析所述多个QC标志物以评估所述至少一种条件;以及c)基于(b)中评估的至少一种条件,对从样品获得的数据进行门控,以从后续分析中去除所述数据的至少一个子集。85.一种基于多个标志物来筛选沉积在采集装置上的样品的方法,其包括:a)获得采集装置,其包含:i.过滤器,其包含用于接收样品的表面;和ii.设置在所述过滤器上的多个QC标志物,所述多个QC标志物指示至少一种选自下组的条件:样品完整性、样品洗脱效率和过滤器储存条件;b)分析所述多个QC标志物以评估所述至少一种条件;以及c)基于(b)中评估的至少一种条件,对从所述样品获得的数据进行门控,以从后续分析中去除所述数据的至少一个子集。86.一种基于多个质量控制(QC)标志物来筛选沉积在采集装置上的样品的方法,其包括:a)获得采集装置,其包含:i.细胞不可透过的多孔层;ii.沉积在所述采集装置上的样品,其中该样品穿过所述多孔层,由此过滤除去任何细胞;和iii.设置在所述采集装置上的多个质量控制(QC)标志物;b)评估所述多个QC标志物;以及c)当在步骤(b)中评价所述多个QC标志物表明样品不适合分析时,从后续分析中筛选出该样品。87.一种基于多个标志物来筛选沉积在采集装置上的样品的方法,其包括:a)获得采集装置,其包含:i.过滤器;和ii.设置在所述过滤器上的多个质量控制(QC)标志物,所述多个QC标志物指示至少两种选自下组的条件:温度暴露、湿度暴露、样品pH、洗脱效率和蛋白水解活性;b)分析所述多个QC标志物以评估所述至少一种条件;以及c)基于步骤(b)中评估的至少一种条件,从后续分析中筛选出所述样品。88.一种基于多个标志物来筛选沉积在采集装置上的样品的方法,其包括:a)获得采集装置,其包含:i.采集背衬,其包含用于接收样品的表面;和ii.设置在所述采集背衬上的多个QC标志物,所述多个QC标志物指示至少一种选自下组的条件:样品完整性、样品洗脱效率和过滤器储存条件;b)分析所述多个QC标志物以评估所述至少一种条件;以及c)基于步骤(b)中评估的至少一种条件,从后续分析中筛选出所述样品。89.实施方案88的方法,其中所述采集背衬包含过滤器。90.实施方案88-89中任一项的方法,其中当所述多个标志物指示暴露于使样品不适合分析的条件时,基于样品完整性从后续分析中筛选出所述样品。91.实施方案88-90中任一项的方法,其中洗脱效率包括样品从底物的释放。92.实施方案88-91中任一项的方法,其中过滤器储存条件包括运输期间的储存条件。93.实施方案88-92中任一项的方法,其中基于所述至少一个条件对从所述样品获得的数据进行门控,以从后续分析中去除所述数据的至少一个子集。94.实施方案88-93中任一项的方法,其中基于所述至少一种条件对从所述样品获得的数据进行归一化。95.实施方案88-94中任一项的方法,其中基于所述多个QC标志物中的至少一个,对从所述样品获得的数据进行归一化。96.实施方案88-95中任一项的方法,其中基于所述多个QC标志物中的至少一个,对从所述样品获得的数据针对另一个样品进行归一化。97.实施方案88-96中任一项的方法,其中样品完整性提供在样品采集期间和之后关于样品变化的信息。98.实施方案97的方法,其中样品完整性包括样品稳定性、蛋白水解活性、DNA酶活性和RNA酶活性中的至少一种。99.实施方案98的方法,其中指示蛋白水解活性的标志物包含沉积在所述采集背衬上的已知大小和量的多肽群体。100.实施方案98的方法,其中指示DNA酶活性的标志物包含沉积在所述采集背衬上的已知大小和量的DNA分子群体。101.实施方案98的方法,其中指示RNA酶活性的标志物包括沉积在所述采集背衬上的已知大小和量的RNA分子群体。102.实施方案88-101中任一项的方法,其中样品洗脱效率提供从所述采集背衬上成功洗脱下来的样品比例的信息。103.实施方案88-102中任一项的方法,其中样品洗脱效率包括总体洗脱效率、基于疏水性的洗脱效率和洗脱下来的样品比例中的至少一种。104.实施方案88-103中任一项的方法,其中指示样品洗脱效率的标志物包含疏水性大于样品中至少90%的预期分子的分子群体。105.实施方案104的方法,其中疏水性大于样品中至少90%的预期分子的分子群体的洗脱表明样品中大多数分子的成功洗脱。106.实施方案88-105中任一项的方法,其中指示样品洗脱效率的标志物包含亲水性大于样品中至少90%的预期分子的分子群体。107.实施方案88-106中任一项的方法,其中指示样品洗脱效率的标志物包含已知大小和量的分子群体。108.实施方案88-107中任一项的方法,其中过滤器储存条件包括过滤器储存持续时间、温度暴露、光暴露、UV暴露、辐射暴露和湿度暴露中的至少一种。109.实施方案108的方法,其中指示湿度暴露的标志物在暴露于超过湿度阈值的湿度后产生可观察的信号。110.实施例109的方法,其中所述可观察的信号是可见光谱的颜色。111.实施方案109-110中任一项的方法,其中指示湿度暴露的标志物是不可逆的湿度标志物,其包含潮解性分子群体和至少一种染料。112.实施方案108-111中任一项的方法,其中指示温度暴露的标志物包含在暴露于阈值温度后产生可观察信号的温度敏感标志物。113.实施方案108-111中任一项的方法,其中所述多个标志物包含在暴露于光、UV和辐射中的至少一种之后展现出可观察信号的分子群体。114.实施方案88-113中任一项的方法,其中所述多个QC标志物包含至少一种选自下组的标志物:洗脱标志物、湿度标志物、pH标志物、温度标志物、时间标志物、蛋白水解标志物、核酸酶标志物、稳定性标志物、辐射标志物、UV标志物和光标志物。115.实施方案88-114中任一项的方法,其中所述至少一种条件包括样品完整性。116.实施方案88-115中任一项的方法,其中所述至少一种条件包括样品洗脱效率。117.实施例88-116中任一实施例的方法,其中所述至少一种条件包括过滤器储存条件。118.实施方案88-117中任一项的方法,其中所述多个QC标志物包含分子传感器群体。119.实施方案118的方法,其中所述分子传感器群体包含多肽、核酸、脂质、代谢物和碳水化合物中的至少一种。120.实施方案118的方法,其中所述分子传感器群体具有非生物学结构。121.实施方案118的方法,其中所述分子传感器群体包含有机染料、无机染料、荧光团、量子点、荧光蛋白、热敏蛋白和放射性标记物中的至少一种。122.实施方案118-121中任一项的方法,其中在检测到目标分子之后,所述分子传感器群体经历可观察的变化。123.实施方案118-122中任一项的方法,其中所述分子传感器群体在检测到目标分子后产生可观察的信号。124.实施方案123的方法,其中所述可观察的信号是可见颜色变化、UV信号、发光信号和荧光信号中的至少一种。125.实施方案123-124中任一项的方法,其中目标分子的检测包括分子传感器群体与目标分子之间的化学反应。126.实施方案123-125中任一项的方法,其中目标分子的检测包括分子传感器群体对目标分子的分子识别。127.实施方案118-127中任一项的方法,其中所述分子传感器群体包含用于检测目标分子的分子识别组分和用于在检测到目标分子时提供可观察信号的报告组分。128.实施方案88-127中任一项的方法,其中所述多个QC标志物中的至少一个可通过质谱法检测。129.实施方案88-128中任一项的方法,其中所述多个QC标志物中的至少一个可通过免疫测定检测。130.实施方案88-129中任一项的方法,其中所述多个QC标志物包含具有参考多肽群体的参考标志物。131.实施方案130的方法,其中所述参考群体包含相对于样品中的相应多肽具有质量位移的多肽。132.实施方案130-131中任一项的方法,其中所述参考群体与所述样品中相应多肽群体的区别在于在质谱输出上可检测的质量。133.实施方案130-132中任一项的方法,其中所述参考群体与所述样品中的相应多肽的区别在于与原子和该原子的重同位素之间的质量差异相当的质量。134.实施方案130-133中任一项的方法,其中所述参考群体用重同位素进行标记,该重同位素在质谱分析中以相对于样品多肽群体的可预测偏移进行迁移。135.实施方案130-134中任一项的方法,其中所述参考群体与样品中的相应多肽的区别在于与通过翻译后修饰增加的质量相当的质量。136.实施方案135的方法,其中所述翻译后修饰包括肉豆蔻酰化、棕榈酰化、异戊二烯化、糖基磷脂酰肌醇化、脂化、酰化、乙酰化、甲基化、酰胺化、糖基化、羟化、琥珀酰化、硫酸化、糖化、羧化、羰基化、生物素化、氧化、聚乙二醇化、SUMO化、泛素化、类泛素化和磷酸化中的至少一种。137.实施方案88-136中任一项的方法,其中所述用于接收样品的表面包含用于样品沉积的区域。138.实施方案88-137中任一项的方法,其中所述样品包含全血、血清、血浆、尿液、唾液、汗液、眼泪、脑脊液、羊水和抽吸物中的至少一种。139.实施方案88-138中任一项的方法,其中所述样品在沉积后干燥并储存在所述采集背衬上。140.实施方案88-139中任一项的方法,其中所述样品以干燥的血液斑点的嘎啊储存在所述采集背衬上。141.实施方案88-140中任一项的方法,其中所述多个QC标志物中的至少一个标志物被设置在所述采集背衬上的样品沉积区域之内,使得样品在采集背衬上的沉积将所述至少一个标志物引入该样品中。142.实施方案88-141中任一项的方法,其中所述多个QC标志物中的至少一个标志物被设置在所述采集背衬上的样品沉积区域之外,使得样品在采集背衬上的沉积不将所述至少一个标志物引入该样品中。143.实施方案88-142中任一项的方法,所述多个QC标志物包含位于所述采集背衬上的至少一个标志物,以与样品共洗脱。144.实施方案88-143中任一项的方法,其中所述多个QC标志物位于所述采集背衬上的至少一个标志物,而不与样品共洗脱。145.实施方案88-144中任一项的方法,其中所述多个QC标志物中的至少一个标志物沉积在所述装置上,使得对至少一种样品的处理将所述至少一个标志物引入一种样品中。146.实施方案88-145中任一项的方法,其中所述多个QC标志物中的至少一个标志物沉积在所述装置上,使得对至少一种样品的处理不将所述至少一个标志物引入所述至少一种样品中。147.实施方案88-146中任一项的方法,其中所述表面包含用于样品沉积的区域。148.实施方案88-147中任一项的方法,其中所述多个QC标志物中的至少一个标志物在样品沉积之前沉积在所述区域上。149.实施方案88-147中任一项的方法,其中所述多个QC标志物中的至少一个标志物在样品沉积之前沉积在与所述区域分开的表面上的位置上。150.实施方案88-149中任一项的方法,其中所述采集装置进一步包含固体背衬。151.实施方案88-150中任一项的方法,其中所述采集装置进一步包含细胞不可透过的多孔层。152.实施方案88-151中任一项的方法,其中所述采集装置进一步包含血浆采集储器。153.实施方案88-152中任一项的方法,其进一步包括分析生物标志物小组以评估疾病状态。154.实施方案88-153中任一项的方法,其中所述采集装置进一步包含第一生物标志物小组,所述第一生物标志物小组包含用于检测至少一个疾病信号的至少一个生物标志物。155.实施方案88-154中任一项的方法,其中所述采集装置进一步包含当检测到所述至少一个疾病信号时分析的第二生物标志物小组。156.实施方案88-155中任一项的方法,其进一步包括分析第二生物标志物小组以评估个体的疾病状态。157.一种用于基于设置在采集装置上的多个质量控制(QC)标志物来筛选沉积在该采集装置上的样品的系统,该系统包含存储器和处理器,其被配置用于:a)分析所述多个QC标志物;并且b)基于(a)中的分析对从所述样品获得的数据进行门控,以从后续分析中去除所述数据的至少一个子集。158.一种用于基于设置在采集装置上的多个质量控制(QC)标志物来筛选沉积在该采集装置上的样品的系统,该系统包含存储器和处理器,其被配置用于:a)分析所述多个QC标志物;并且b)基于(a)中的分析对从所述样品获得的数据进行归一化,以从后续分析中去除所述数据的至少一个子集中的偏差。159.一种用于基于多个标志物来筛选沉积在采集装置上的样品的系统,该系统包含存储器和处理器,其被配置用于:a)分析多个质量控制(QC)标志物,所述多个QC标志物指示至少两种选自下组的条件:温度暴露、湿度暴露、样品pH、洗脱效率和蛋白水解活性;并且b)基于(a)中评估的至少两种条件,对从所述样品获得的数据进行门控,以从后续分析中去除所述数据的至少一个子集。160.一种用于基于多个质量控制(QC)标志物来筛选沉积在该采集装置上的样品的系统,该系统包含存储器和处理器,其被配置用于:a)评价所述多个QC标志物;并且b)当在步骤(b)中评价所述多个QC标志物表明所述样品不适合分析时,从后续分析中筛选出该样品。161.一种基于多个标志物来筛选沉积在采集装置上的样品的系统,该系统包含存储器和处理器,其被配置用于:a)评价所述多个QC标志物,所述多个QC标志物指示至少两种选自下组的条件:温度暴露、湿度暴露、样品pH、洗脱效率和蛋白水解活性;并且b)基于步骤(a)中评估的至少两种条件,从后续分析中筛选出所述样品。162.一种组合物,其包含映射到蛋白质中的多个区域的参考多肽。163.实施方案162的组合物,其中所述参考多肽增强内源性多肽的鉴别。164.实施方案162-163中任一项的组合物,其中所述参考多肽增强内源性多肽的定量。165.实施方案162-164中任一项的组合物,其中所述参考多肽映射到所述蛋白质中的至少一个突变。166.实施方案165的组合物,其中所述至少一个突变是点突变、插入点突变、缺失点突变、移码点突变、插入突变、缺失突变、移码突变、截短、融合和易位中的至少一种。167.实施方案162-166中任一项的组合物,其中所述参考多肽映射到选自下组的区域:与所述至少一个突变相邻的区域,与所述突变至少部分重叠的区域,以及在所述至少一个突变的相对侧上的区域。168.实施方案165-167中任一项的组合物,其中所述至少一个突变是截短、融合或易位。169.实施方案162-168中任一项的组合物,其中所述参考多肽包含第一突变参考多肽群体,该群体映射到所述蛋白质中具有与疾病有关的点突变的区域。170.实施方案169的组合物,其中所述参考多肽包含第二野生型参考多肽群体,该群体映射到所述蛋白质中没有点突变的区域。171.实施方案162-170中任一项的组合物,其中所述参考多肽是映射到所述蛋白质的内源性多肽的质量位移类似物。172.实施方案171的组合物,其中所述参考多肽和所述样品中的内源性多肽在质谱输出上作为双峰被检测到。173.实施方案171-172中任一项的组合物,其中所述参考多肽与所述内源性多肽的区别在于在质谱输出上可检测的质量。174.实施方案171-173中任一项的组合物,其中所述参考多肽用重同位素进行标记,并且在质谱分析中以相对于样品中内源性多肽的可预测偏移进行迁移。175.实施方案171-174中任一项的组合物,其中所述参考多肽与所述内源性多肽的区别在于与通过翻译后修饰添加的质量相当的质量。176.实施方案175的组合物,其中所述翻译后修饰包括肉豆蔻酰基化、棕榈酰化、异戊烯基化、糖基磷脂酰肌醇化、脂化、酰化、乙酰化、甲基化、酰胺化、糖基化、羟基化、琥珀酰化、硫酸化、糖化、氨基甲酰化、羰基化、生物素化、氧化、聚乙二醇化、SUMO化、泛素化、类泛素化和磷酸化中的至少一种。177.实施方案162-176中任一项的组合物,其中所述参考多肽在质谱分析之前以已知量添加至样品中。178.实施方案162-177中任一项的组合物,其中所述参考多肽构成参考生物标志物。179.实施方案162-178中任一项的组合物,其中所述参考多肽包含均质的多肽群体。180.实施方案162-179中任一项的组合物,其中所述参考多肽包含多个多肽群体。181.一种评估个体的疾病状态的方法,其包括:a)针对从所述个体采集的样品,分析包含至少一个生物标志物的第一生物标志物小组,以检测至少一个疾病信号;b)当检测到所述至少一个疾病信号时,选择第二生物标志物小组进行进一步分析;以及c)分析第二生物标志物小组,以评估所述个体的疾病状态。182.实施方案181的方法,其中分析所述第一生物标志物小组包括评价对应于所述第一生物标志物小组的质谱数据。183.实施方案181的方法,其中分析所述第一生物标志物小组包括针对靶向所述第一生物标志物小组的抗体小组测定所述样品。184.实施方案181-183中任一项的方法,其中分析所述第二生物标志物小组包括评价与所述第二生物标志物小组相对应的质谱数据。185.实施方案181-184中任一项的方法,其中分析所述第二生物标志物小组包括针对靶向所述第二生物标志物小组的抗体小组测定所述样品。186.实施方案181-185中任一项的方法,其中分析生物标志物小组包括检测以下至少一项:与所述至少一种疾病相关的至少一个生物标志物的点突变、插入、缺失、移码点突变、截短、融合、易位、量、存在和不存在。187.实施方案186的方法,其中检测截短包括检测截短的生物标志物的未缺失区域和缺失区域之间的共变的减少。188.实施方案186-187中任一项的方法,其中检测融合包括检测已融合形成融合生物标志物的第一区域和第二区域之间的共变的增加。189.实施方案186-188中任一项的方法,其中检测易位包括检测已融合形成易位生物标志的第一生物标志物的区域和第二生物标志物的区域之间的共变的增加。190.实施方案189的方法,其中检测易位进一步包括检测第一生物标志物的组分之间和第二生物标志物的组分之间的共变的减少。191.实施方案181-190中任一项的方法,其中分析生物标志物小组包括评价从所述样品获得的质谱数据的子集。192.实施方案191的方法,其中所述子集占所述质谱数据的不超过10%。193.实施方案181-192中任一项的方法,其中所述第一生物标志物小组包含单个生物标志物。194.实施方案181-193中任一项的方法,其中所述第一生物标志物小组包含不超过10个生物标志物。195.实施方案181-194中任一项的方法,其中所述第一生物标志物小组包含至少10个生物标志物。196.实施方案181-195中任一项的方法,其中所述第一生物标志物小组包含用于筛选多个疾病信号的存在的生物标志物。197.实施方案181-196中任一项的方法,其中将疾病状态与从个体采集的另一个样品的疾病状态进行比较,以评估疾病进展。198.实施方案181-197中任一项的方法,其中分析第一生物标志物小组包括使用至少一个参考标志物来增强对至少一个生物标志物的鉴别。199.实施方案198的方法,其中分析第一生物标志物小组包括使用至少一个参考标志物来增强至少一个生物标志物的定量。200.实施方案198-199中任一项的方法,其中所述至少一个参考标志物包含相对于样品中的相应内源性多肽具有质量位移的参考多肽。201.实施方案200的方法,其中所述参考多肽和所述样品中的内源性相应多肽在质谱输出上作为双峰被检测到。202.实施方案200-201中任一项的方法,其中所述参考多肽与所述样品中的相应内源性多肽的区别在于质谱输出上可检测的质量。203.实施方案200-202中任一项的方法,其中所述参考多肽用重同位素进行标记,并且在质谱分析中以相对于所述样品中的相应内源性多肽的可预测偏移进行迁移。204.实施方案200-203中任一项的方法,其中所述参考多肽与样所述品中相应的内源性多肽的区别在于与通过翻译后修饰添加的质量相当的质量。205.实施方案204的方法,其中所述翻译后修饰包括肉豆蔻酰化、棕榈酰化、异戊二烯化、糖基磷脂酰肌醇化、脂化、酰化、乙酰化、甲基化、酰胺化、糖基化、羟基化、琥珀酰化、硫酸化、糖基化、氨基甲酸酯化、羰基化、生物素化、氧化、聚乙二醇化、SUMO化、泛素化、类泛素化和磷酸化。206.实施方案181-205中任一项的方法,其中所述样品选自细胞样品、固体样品和液体样品。207.实施方案181-206中任一项的方法,其中通过活检、抽吸、拭子或涂片来采集样品。208.实施方案181-207中任一项的方法,其中所述样品选自组织、痰、粪便、全血、血清、血浆、尿液、唾液、汗液、眼泪、脑脊液、羊水和抽吸物。209.实施方案181-209中任一项的方法,其中在样品采集装置上从个体采集样品,该样品采集装置包含具有用于样品沉积的表面的基底,以及包含设置在该基底上的至少一个参考生物标志物的参考生物标志物小组。210.一种评估个体的疾病状态的方法,其包括:a)获得从个体采集的样品的数据;b)分析该数据的第一子集以检测至少一个疾病信号;c)当检测到所述至少一个疾病信号时,选择该数据的第二子集用于进一步分析;d)分析该数据的第二子集以评估疾病状态。211.实施方案210的方法,其中所述数据是蛋白质质谱数据。212.实施方案210-211中任一项的方法,其中分析所述数据的第一子集包括评价与至少一种疾病相关的至少一个生物标志物。213.实施方案210-212中任一项的方法,其中分析数据的第一子集包括检测与所述至少一种疾病相关的至少一个生物标志物的点突变、插入、缺失、移码点突变、截短、融合、易位、量、存在和不存在。214.实施方案213的方法,其中检测截短包括检测截短的生物标志物的未缺失区域和缺失区域之间的共变的减少。215.实施方案213-214中任一项的方法,其中检测融合包括检测已融合形成融合生物标志物的第一区域和第二区域之间的共变的增加。216.实施方案213-215中任一项的方法,其中检测易位包括检测已融合形成易位生物标志的第一生物标志物的区域和第二生物标志物的区域之间的共变的增加。217.实施方案216的方法,其中检测易位进一步包括检测第一生物标志物的组分之间和第二生物标志物的组分之间的共变的减少。218.实施方案210-217中任一项的方法,其中与完整地分析数据相比,分析所述数据的第一子集和第二子集具有更短的计算时间。219.实施方案211-218中任一项的方法,其中计算时间比完整地分析数据至少短两倍。220.实施方案210-219中任一项的方法,其中所述数据的第一子集包含所述数据的不超过10%。221.实施方案210-220中任一项的方法,其中所述数据的第一子集包含不超过10个生物标志物的数据。222.实施方案210-221中任一项的方法,其中所述数据的第一子集包括至少10个生物标志物的数据。223.实施方案210-222中任一项的方法,其中所述数据的第一子集对应于指示至少一个疾病信号的第一生物标志物小组。224.实施方案210-223中任一项的方法,其中所述数据的第二子集对应于指示疾病状态的第二生物标志物小组。225.实施方案210-224中任一项的方法,其中所述数据的第一子集包含比所述数据的第二子集更少的生物标志物的数据。226.实施方案210-225中任一项的方法,其中所述至少一个疾病信号包含与至少一种疾病相关的至少一个生物标志物。227.实施方案210-226中任一项的方法,其中将疾病状态与从所述个体采集的另一个样品的疾病状态进行比较以评估疾病进展。228.实施方案210-227中任一项的方法,其中分析所述数据的第一子集包括使用至少一个参考标志物来增强对至少一个生物标志物的鉴别。229.实施方案228的方法,其中分析所述数据的第一子集包括使用至少一个参考标志物来增强对至少一个生物标志物的定量。230.实施方案228-229中任一项的方法,其中所述至少一个参考标志物包含相对于所述样品中相应的内源性多肽具有质量位移的参考多肽。231.实施方案230的方法,其中所述参考多肽和所述样品中的内源性相应多肽在质谱输出上作为双峰被检测到。232.实施方案230-231中任一项的方法,其中所述参考多肽与所述样品中相应的内源性多肽的区别在于在质谱输出上可检测的质量。233.实施方案230-232中任一项的方法,其中所述参考多肽用重同位素进行标记,并且在质谱分析中以相对于所述样品中相应内源性多肽的可预测偏移进行迁移。234.实施方案230-233中任一项的方法,其中所述参考多肽与所述样品中相应的内源性多肽的区别在于与通过翻译后修饰增加的质量相当的质量。235.实施方案234的方法,其中所述翻译后修饰包括肉豆蔻酰化、棕榈酰化、异戊二烯化、糖基磷脂酰肌醇化、脂化、酰化、乙酰化、甲基化、酰胺化、糖基化、羟基化、琥珀酰化、硫酸化、糖基化、氨基甲酸酯化、羰基化、生物素化、氧化、聚乙二醇化、SUMO化、泛素化、类泛素化和磷酸化中的至少一种。236.实施方案210-235中任一项的方法,其中所述样品选自细胞样品、固体样品和液体样品。237.实施方案210-236中任一项的方法,其中通过活检、抽吸、拭子或涂片来采集样品。238.实施方案210-237中任一项的方法,其中所述样品选自组织、痰、粪便、全血、血清、血浆、尿液、唾液、汗液、眼泪、脑脊液、羊水和抽吸物。239.一种确定疾病状态的方法,其包括:a)获得样品的质谱数据;b)从该质谱数据分析第一生物标志物小组,以检测超过阈值的疾病信号;以及c)从该质谱数据分析第二生物标志物小组,以评估疾病状态。240.一种确定疾病状态的方法,其包括:a)获得样品的质谱数据;b)对该质谱数据进行数据质量检查;以及c)分析指示疾病状态并通过数据质量检查的该质谱数据的子集。241.一种用于评估个体的疾病状态的系统,其包含存储器和至少一个处理器,其被配置用于:a)获得从个体采集的样品的数据;b)分析该数据的第一子集以检测至少一个疾病信号;c)当检测到所述至少一个疾病信号时,选择该数据的第二子集用于进一步分析;并且d)分析该数据的第二子集以评估疾病状态。242.一种用于评估样品的疾病状态的系统,其包含存储器和至少一个处理器,其被配置用于:a)获得样品的质谱数据;b)从该质谱数据分析第一生物标志物小组,以检测超过阈值的疾病信号;并且c)从该质谱数据分析第二生物标志物小组,以评估疾病状态。243.一种用于评估样品的疾病状态的系统,其包含存储器和至少一个处理器,其被配置用于:a)获得样品的质谱数据;b)对该质谱数据进行数据质量检查;并且c)分析指示疾病状态并通过数据质量检查的该质谱数据的子集。244.一种疾病检测试剂盒,其包含:a)针对指示至少一个疾病信号的至少一个生物标志物的第一抗体小组;和b)针对指示疾病状态的至少一个生物标志物的第二抗体小组。245.一种确定疾病状态的方法,其包括:a)获得样品;b)针对第一抗体小组分析该样品以检测至少一个疾病信号;以及c)当第一抗体小组检测到该疾病信号时,用第二抗体小组测定该样品,以确定疾病状态。246.实施方案245的方法,其中在对样品进行另外的检测之前,针对第一抗体小组对样品进行测定提供了初始筛选,以检测所述至少一个疾病信号。247.实施方案245-246中任一项的方法,其中所述第一抗体小组允许检测与至少一种疾病相关的至少一个生物标志物的点突变、插入、缺失、移码突变、截短、融合、易位、量、存在和不存在中的至少一项。248.实施方案246-248中任一项的方法,其中检测截短包括检测截短的生物标志物的未缺失区域和缺失区域之间的共变的减少。249.实施方案246-248中任一项的方法,其中检测融合包括检测已融合形成融合生物标志物的第一区域和第二区域之间的共变的增加。250.实施方案246-249中任一项的方法,其中检测易位包括检测已融合形成易位生物标志的第一生物标志物的区域和第二生物标志物的区域之间的共变的增加。251.实施方案250的方法,其中检测易位进一步包括检测第一生物标志物的组分之间和第二生物标志物的组分之间的共变的减少。252.实施方案245-251中任一项的方法,其中所述至少一个疾病信号包含与至少一种疾病相关的至少一个生物标志物。253.实施方案245-252中任一项的方法,其中将疾病状态与从所述个体采集的另一个样品的疾病状态进行比较,以评估疾病进展。254.实施方案245-253中任一项的方法,其中在针对第一抗体小组测定样品之前,将所述至少一个参考标志物添加至样品中,以增强对至少一个生物标志物的鉴别。255.实施方案254的方法,其中针对第一抗体小组测定样品包括使用所述至少一个参考标志物来增强对至少一个生物标志物的定量。256.实施方案254-255中任一项的方法,其中所述至少一个参考标志物包含相对于样品中相应的内源性多肽具有质量位移的参考多肽。257.实施方案256的方法,其中所述参考多肽与所述样品中相应的内源性多肽的区别在于通过免疫测定可检测的质量。258.实施方案256-257中任一项的方法,其中所述参考多肽包含通过免疫测定可检测的表位标签。259.实施方案258的方法,其中所述第一和第二抗体小组中的至少一个包含检测表位标签的抗体。260.实施方案256-259中任一项的方法,其中所述参考多肽与所述样品中相应的内源性多肽的区别在于与通过翻译后修饰增加的质量相当的质量。261.实施方案260的方法,其中所述翻译后修饰包括肉豆蔻酰化、棕榈酰化、异戊二烯化、糖基磷脂酰肌醇化、脂化、酰化、乙酰化、甲基化、酰胺化、糖基化、羟基化、琥珀酰化、硫酸化、糖化、氨基甲酰化、羰基化、生物素化、氧化、聚乙二醇化、SUMO化、泛素化、类泛素化和磷酸化中的至少一种。262.实施方案245-261中任一项的方法,其中所述样品选自细胞样品、固体样品和液体样品。263.实施方案245-261中任一项的方法,其中通过活检、抽吸、拭子或涂片来采集样品。264.实施方案245-263中任一项的方法,其中所述样品选自组织、痰、粪便、全血、血清、血浆、尿液、唾液、汗液、眼泪、脑脊液、羊水和抽吸物。265.一种采集装置,其包含:a)基底,该基底包含用于接收样品的表面;b)第一参考生物标志物小组,其设置在该基底上并且对应于指示疾病信号的至少一个生物标志物;和c)第二参考生物标志物小组,其设置在该基底上并对应于指示疾病状态的至少一个生物标志物。266.一种采集装置,其包含:a)基底,该基底包含用于接收样品的表面;和b)设置在该基底上的参考生物标志物小组,其增强对指示疾病信号的至少一个内源性生物标志物的检测。267.实施方案266的采集装置,其中所述参考生物标志物小组增强对指示至少一种疾病的至少一个内源性生物标志物的点突变、插入、缺失、移码突变、截短、融合、易位、量、存在和不存在中的至少一项的检测。268.实施方案267的采集装置,其中检测截短包括检测截短的生物标志物的未缺失区域和缺失区域之间的共变的减少。269.实施方案267-268中任一项的采集装置,其中检测融合包括检测已融合形成融合生物标志物的第一区域和第二区域之间的共变的增加。270.实施方案267-269中任一项的采集装置,其中检测易位包括检测已融合形成易位生物标志的第一生物标志物的区域和第二生物标志物的区域之间的共变的增加。271.实施方案270的采集装置,其中检测易位进一步包括检测第一生物标志物的组分之间和第二生物标志物的组分之间的共变的减少。272.实施方案266-271中任一项的采集装置,其中所述参考生物标志物小组包含不超过10个生物标志物。273.实施方案266-272中任一项的采集装置,其中所述参考生物标志物小组包含至少10个生物标志物。274.实施方案266-273中任一项的采集装置,其中在检测到指示疾病的至少一个生物标志物之后,测定样品的疾病状态。275.实施方案266-274中任一项的采集装置,其中所述至少一个疾病信号包含与至少一种疾病相关的至少一个生物标志物。276.实施方案266-275中任一项的采集装置,其中将疾病状态与从所述个体采集的另一个样品的疾病状态进行比较,以评估疾病进展。277.实施方案266-276中任一项的采集装置,其中所述至少一个疾病信号包含与至少一种疾病相关的至少一个生物标志物。278.实施方案266-277中任一项的采集装置,其中将疾病状态与从所述个体采集的另一个样品的疾病状态进行比较,以评估疾病进展。279.实施方案266-278中任一项的采集装置,其中所述参考生物标志物小组包含已知量的至少一个参考标志物,其用于增强至少一个内源性生物标志物的定量。280.实施方案279的采集装置,其中所述至少一个参考标志物包含相对于样品中相应的内源性多肽具有质量位移的参考多肽。281.实施方案280的采集装置,其中所述参考多肽和所述样品中的内源性相应多肽在质谱输出上作为双峰被检测到。282.实施方案280-281中任一项的采集装置,其中所述参考多肽与所述样品中相应的内源性多肽的区别在于在质谱输出上可检测的质量。283.实施方案280-282中任一项的采集装置,其中所述参考多肽用重同位素进行标记,并且在质谱分析中以相对于所述样品中相应内源性多肽的可预测偏移进行迁移。284.实施方案280-283中任一项的采集装置,其中所述参考多肽与所述样品中相应的内源性多肽的区别在于通过免疫测定可检测的质量。285.实施方案280-284中任一项的采集装置,其中所述参考多肽包含通过免疫测定可检测的表位标签。286.实施方案280-285中任一项的采集装置,其中所述参考多肽与所述样品中相应的内源性多肽的区别在于与通过翻译后修饰增加的质量相当的质量。287.实施方案286的采集装置,其中所述翻译后修饰包括肉豆蔻酰化、棕榈酰化、异戊二烯化、糖基磷脂酰肌醇化、脂化、酰化、乙酰化、甲基化、酰胺化、糖基化、羟基化、琥珀酰化、硫酸化、糖化、氨基甲酰化、羰基化、生物素化、氧化、聚乙二醇化、SUMO化、泛素化、类泛素化和磷酸化中的至少一种。288.实施方案266-287中任一项的采集装置,其中所述样品选自细胞样品、固体样品和液体样品。289.实施方案266-288中任一项的采集装置,其中通过活检、抽吸、拭子或涂片来采集样品。290.实施方案266-289中任一项的采集装置,其中所述样品选自组织、痰、粪便、全血、血清、血浆、尿液、唾液、汗液、眼泪、脑脊液、羊水和抽吸物。291.实施方案266-290中任一项的采集装置,其中用于接收样品的表面包含用于样品沉积的区域。292.实施方案266-291中任一项的采集装置,其中所述样品在沉积后干燥并储存在所述采集装置上。293.实施方案266-292中任一项的采集装置,其中所述样品作为干燥的血液斑点储存在所述采集装置上。294.实施方案266-293中任一项的采集装置,其中来自参考生物标志物小组的至少一个参考标志物被设置在所述基底上的样品沉积区域内,使得样品在该基底上的沉积将所述至少一个参考标志物引入该样品中。295.实施方案266-294中任一项的采集装置,其中来自参考生物标志物小组的至少一个参考标志物被设置在所述基底上的样品沉积区域之外,使得样品在该基底上的沉积不将所述至少一个参考标志物引入该样品中。296.实施方案266-295中任一项的采集装置,其中所述参考生物标志物小组包含位于所述基底上的至少一个参考标志物,以与样品共洗脱。297.实施方案266-296中任一项的采集装置,其中所述参考生物标志物小组包含位于所述基底上的至少一个参考标志物,而不与样品共洗脱。298.实施方案266-298中任一项的采集装置,其进一步包含固体背衬。299.实施方案266-299中任一项的采集装置,其进一步包含细胞不可透过的多孔层。300.实施方案266-299中任一项的采集装置,其进一步包含血浆采集储器。301.实施方案266-300中任一项的采集装置,其进一步包含扩散层。302.实施方案266-301中任一项的采集装置,其进一步包含指示至少一种选自下组的条件的多个质量控制(QC)标志物:样品完整性、样品洗脱效率和过滤器储存条件。303.实施方案266-301中任一项的采集装置,其进一步包含指示至少一种选自下组的条件的多个质量控制(QC)标志物:温度暴露、湿度暴露、样品pH、洗脱效率和蛋白水解活动。
根据以下提供的实施例以及本公开的全文,能获得对本文公开内容的进一步理解。实施例是说明性的,而不一定限制本文的所有实施方案。
实施例
实施例1-具有包含指示过滤器储存条件的质量控制标志物的多个标志物的过滤器。准备用于采集全血样品的过滤卡,其具有指示过滤器储存条件的若干标志物。在这种情况下,过滤卡共有类似于如图1所示的Noviplex DBS Plasma卡的整体结构。该过滤卡具有用于接收样品的区域和带有不打算与样品共洗脱的标志物的区域。第一标志物包含氯化铜(II)分子群体。第二标志物包含温度敏感性材料,该材料响应于暴露于高于阈值的温度而改变颜色。第三标志物是指示过滤器上其他标志物的失效日期的时间戳。所有这三种标志物都定位在过滤器上远离接收样品区域的位置,以使样品在过滤器上的沉积及其随后用于质谱分析的洗脱不会导致标志物和样品混合或共洗脱。将过滤器密封在保护袋中,并运送到远方的医疗诊所,在这里医务人员正在努力控制当地的禽流感爆发。由于缺乏附近的医学研究设施,因此将从当地社区成员获得的血液样品作为干燥的血液斑点储存在上述过滤卡上,以便运送进行进一步的分析。在样品采集过程中,医疗技术人员在佩戴手套的情况下打开保护袋上的密封并取出过滤卡。技术人员刺破受试者的手指,并在划出的用于接收样品的区域处,使所得的全血小滴抵靠过滤卡表面接触。通过包含分离器的分离层抽吸全血以分离血浆,并将血浆引导至血浆采集储器。血浆接触基卡上的隔离屏,并干燥以备以后分析。
样品干燥完成后,将过滤卡放回保护袋中,然后重新密封。保护袋与其他许多样品一起存放在手提箱中,然后送到目的地测试机构。然而,保护袋密封不当,在运输过程中会打开。由于行程包括穿过热带地区的列车路线,因此在行程的这一段中,过滤卡会暴露在高湿度下。随着无水氯化铜(II)群体吸收吸收空气中的水分而变成蓝绿色的二水合物形式,第一标志物逐渐从浅棕色变为蓝绿色。另外,当温度超过37摄氏度时,热带高温导致第二标志物变色。最后,装有过滤卡的保护袋到达目的地测试机构。当取出过滤卡进行分析时,研究人员注意到湿度标志物和温度标志物的颜色都已改变,表明该过滤卡已暴露于湿度和超过37摄氏度的高温。此外,研究人员注意到,由于第三标志物表明其他标志物距失效日期仍有数月,因此这些标志物可能是准确的。由于样品数量众多,并且急需获得可以帮助现场医务人员的数据,因此将该过滤卡与其他任何暴露于预测较差样品质量的储存条件的过滤卡一起放在测试队列的最后。
数周后,将过滤卡上的干燥血液斑点样品洗脱下来,并放入单个孔中进行TFE/胰蛋白酶(酶促)消化24小时。将消化猝灭,转移至MTP板中并干燥。然后将样品重建并进行质谱分析。
实施例2-具有包含指示洗脱效率的质量控制标志物的多个标志物的过滤器。准备用于采集全血样品的过滤卡,其具有指示洗脱效率的若干标志物。在这种情况下,过滤卡共有类似于如图1所示的Noviplex DBSPlasma卡的整体结构。该过滤卡具有用于接收样品的区域和带有不打算与样品共洗脱的标志物的区域。第一标志物包含重同位素标记的分子群体,这些分子相对于样品中已针对进行分析的相应生物标志物具有已知的迁移偏移。第一标志物具有双重目的,即允许通过由质谱法检测到的迁移“双峰”来容易地鉴别生物标志物,以及基于量化的标志物分子和设置在过滤器上的已知量的标志物分子对生物标志物进行定量的能力。第二标志物包含在质谱分析下具有已知量和疏水性的重同位素标记的多肽群体。这两种标志物都定位在过滤器上的血浆采集储器中,该血浆采集储器接收过滤后的血浆以供干燥和储存。将过滤器密封在保护袋中,并运送到远方的医疗诊所,在这里医务人员正在努力控制当地的禽流感爆发。由于缺乏附近的医学研究设施,因此将从当地社区成员获得的血液样品作为干燥的血液斑点储存在上述过滤卡上,以便运送进行进一步的分析。在样品采集过程中,医疗技术人员在佩戴手套的情况下打开保护袋上的密封并取出过滤卡。技术人员刺破受试者的手指,并在划出的用于接收样品的区域处,使所得的全血小滴抵靠过滤卡表面接触。通过包含分离器的分离层抽吸全血以分离血浆,并将血浆引导至储存标志物的血浆采集储器。血浆与标志物混合,并作为干燥的血液斑点储存,以备以后分析。
样品干燥完成后,将过滤卡放回保护袋中,然后重新密封。保护袋与其他许多样品一起存放在手提箱中,然后送到目的地测试机构。装有过滤卡的保护袋到达目的地测试机构后,将过滤卡上的干燥血液斑点样品(连同标志物)洗脱下来,并放入单个孔中进行TFE/胰蛋白酶(酶促)消化24小时。将消化猝灭,转移至MTP板中并干燥。然后将样品重建并进行质谱分析。通过质谱分析检测第一和第二标志物。该软件鉴别与感兴趣的生物标志物相对应的“双峰”及其来自第一标志物的相应的重同位素标记的分子,因此允许轻易地鉴别生物标志物。另外,该软件将第一标志物中分子群体的质谱信号与设置在过滤器上的已知量进行关联。这种相关性允许该软件从样品估计生物标志物的量。第二标志物也通过质谱法进行分析。将具有不同疏水性的各种分子群体的质谱定量与这些分子群体的已知量进行关联,以基于疏水性确定相对洗脱效率。然后基于洗脱效率与疏水性之间计算出的关系,根据疏水性,使用该关系对来自样品的生物标志物的定量进行归一化。
实施例3-用于筛选数据以供下游分析的质量控制标志物。准备用于采集全血样品的过滤卡,其具有指示过滤器储存条件的若干质量控制标志物和用于评估样品的疟疾的筛选标志物。该筛选标志物包含固定在过滤器上的分子群体,该分子群体在识别疟疾生物标志物时产生信号。在这种情况下,过滤卡的整体结构类似于Noviplex DBS Plasma卡,如图2所示。1。过滤卡具有用于接收样品的区域和带有不打算与样品共洗脱的标志物的区域。筛选标志物位于过滤器上,使得该标志物在样品沉积时与样品接触。将过滤器密封在保护袋中,并运送到远方的医疗诊所,在这里医务人员正在努力诊断并治疗疟疾患者。由于缺乏附近的医学研究设施,因此将从当地社区成员获得的血液样品作为干燥的血液斑点储存在上述过滤卡上,以便运送进行进一步的分析。在样品采集过程中,医疗技术人员在佩戴手套的情况下打开保护袋上的密封并取出过滤卡。技术人员刺破受试者的手指,并在划出的用于接收样品的区域处,使所得的全血小滴抵靠过滤卡表面接触。当血液与筛选标志物接触时,筛选标志物的分子群体检测到疟疾生物标志物次黄嘌呤磷酸核糖基转移酶(pfHPRT)的存在。该分子群体具有识别pfHPRT的靶标识别部分,pfHPRT是一种疟疾蛋白质,其血浆水平与疟疾的严重程度相关。该分子群体在与样品中的pfHPRT结合后释放出荧光团。当全血通过包含分离器的分离层抽吸以分离血浆时,释放的荧光团与样品共迁移,并且血浆与释放的荧光团一起被引导至血浆采集储器。血浆接触基卡上的隔离屏,并干燥以备以后分析。
样品干燥完成后,将过滤卡放回保护袋中,然后重新密封。保护袋与其他许多样品一起存放在手提箱中,然后送到目的地测试机构。到达该机构后,将过滤卡从保护袋中取出。使用荧光显微术评价血浆采集储器中是否存在荧光团(它们是具有已知激发和发射光谱的荧光分子)。检测到高于基线强度的荧光团发射信号表明存在pfHPRT疟疾标志物,从而支持对疟疾的阳性诊断。接下来,基于该阳性筛选,将血浆样品洗脱下来,并通过质谱法进行分析,以检测并量化疟疾进展和对治疗的反应(如果受试者正在接受治疗)的各种标志物。该分析包括对pfHPRT相对于参考标志物的量进行定量,以确定pfHPRT的相对丰度,这与疟疾的严重程度相关。
实施例4-对缺乏任何质量控制标志物的过滤器上储存的干燥血液斑点的分析。准备用于采集全血样品的过滤卡。在这种情况下,过滤卡共有类似于如图1所示的NoviplexDBS Plasma卡的整体结构。过滤卡具有用于接收样品的区域。将过滤器密封在保护袋中,并运送到远方的医疗诊所,在这里医务人员正在努力控制当地的禽流感爆发。由于缺乏附近的医学研究设施,因此将从当地社区成员获得的血液样品作为干燥的血液斑点储存在上述过滤卡上,以便运送进行进一步的分析。在样品采集过程中,医疗技术人员在佩戴手套的情况下打开保护袋上的密封并取出过滤卡。技术人员刺破受试者的手指,并在划出的用于接收样品的区域处,使所得的全血小滴抵靠过滤卡表面接触。通过包含分离器的分离层抽吸全血以分离血浆,并将血浆引导至储存标志物的血浆采集储器。血浆接触基卡上的隔离屏,并干燥以备以后分析。
样品干燥完成后,将过滤卡放回保护袋中,然后重新密封。保护袋与其他许多样品一起存放在手提箱中,然后送到目的地测试机构。然而,保护袋密封不当,在运输过程中会打开。由于行程包括穿过热带地区的列车路线,因此在行程的这一段中,过滤卡会暴露在高湿度下。另外,当温度超过37摄氏度时,热带高温导致第二标志物变色。最后,装有过滤卡的保护袋到达目的地测试机构。当取出过滤卡进行分析时,研究人员没有意识到过滤卡已经暴露于湿度和超过37摄氏度的高温。由于样品数量众多,并且急需获得可以帮助现场医务人员的数据,因此将该过滤卡放在测试队列的前面。将过滤卡上的干燥血液斑点样品洗脱下来,并放入单个孔中进行TFE/胰蛋白酶(酶促)消化24小时。将消化猝灭,转移至MTP板中并干燥。然后将样品重建并进行质谱分析。遗憾的是,由于运输过程中暴露于高温和高湿度,大多数目标生物标志物已经降解。研究人员决定将从样品获得的所有数据视为不可靠的。由于研究人员没有在过程中较早地评估样品质量的有效手段,因此在分析这种有缺陷的样品上浪费了大量时间。
实施例5.血液斑点生物标志物采集和提取。如图1所示,将全血样品施加至Noviplex DBS Plasma卡。通过包含分离器的分离层抽吸全血以分离血浆,并将血浆引导至血浆采集储器。血浆接触盒卡上的隔离屏,并进行干燥以供后续分析。
将斑点置于单个孔中以进行TFE/胰蛋白酶(酶促)消化24小时。将消化猝灭,转移至MTP板并干燥。然后重建样品并对其进行质谱分析。
实施例6.替代的血液采集。将全血样品施加至Neoteryx Mitra血液采集装置,并如实施例1所述进行处理。将血液施加至三维吸收结构上,而不是点样在二维平面上。如上所述,使样品干燥并且不需要冷藏。
实施例7.质谱分析的可重复性。对血液斑点样品进行质谱分析,以评估所测样品的数据多样性和可重复性。
将来自单个血浆池的单组干燥血浆样品点样到16个干燥血浆样品卡上,并使每个卡经历3次质谱运行以生成48个数据集。结果在图2中示出。
图2的视觉检查表明在48个数据集之间和之中的质谱输出的显著程度的可重复性。
评估生物标志物生成的多次测量的可重复性。结果显示在图2-6和表1中。
表1.
表1呈现了用来评估给定样品的技术变异性、共同来源的重复采样之间的变异性以及跨群组成员的变异性的实验结果。
在给定样品的技术重复物中,使用16个DPS卡,并且每个卡分析三个技术重复物。所分析的每个重复物检测到64,667个特征。卡内中值变异系数经计算为3.3%至6.2%,而卡间变异系数的中值被确定为9.0%。这些结果以图形方式呈现在图3中。这些数据对应于在图2中描绘为原始数据的质谱结果。
作为生物标志物生成的可重复性的额外测量,对从单个采集事件中连续获取的样品进行分析。
在给定样品的采样重复中,使用12个DPS卡,并且每个卡分析四个技术重复物。所分析的每个重复物检测到65,795个特征。卡内中值变异系数经计算为5.1%至6.3%,而卡间变异系数的中值被确定为16.2%。这些结果以图形方式呈现在图4中。
这些结果表明,用于测量生物标志物的工作流程是高度可重复的。
还在群组内的个体中评估可重复性。在群组内的个体中,使用99个DPS卡,并且每个卡分析一个斑点。所分析的每个重复物检测到55,939个特征。卡间变异系数的中值被确定为25.0%。这些结果以图形方式呈现在图5中。
这些结果表明,即使在整个具有单独的健康状态或健康状况的单独群组中,在测定中测量的大多数生物标志物基本上没有变化。因此,可以得出以下结论,观察到在样品中变化的生物标志物的子集可能针对在群组之间变化的与健康状态或健康状况相关的生物标志物进行富集,因此提供关于其他群组或个体中的健康状态或健康状况的信息。
实施例8.从干燥血浆样品获得的质谱结果的定量能力。获得来自干燥血浆样品的质谱结果,并评估对应于FDA认可的标志物蛋白质的片段信号的蛋白质水平。由于健康个体血浆中这些蛋白质的蛋白质水平得到很好地测量和公布,因此这些标志物用作对照,从其评估质谱数据的定量准确性。
结果呈现在图6中。在x轴上描绘内源性浓度,而在y轴上看到归一化的质谱仪器响应。虚线对角线近似于内源性浓度与归一化的响应之间的完美相关性。可以看出,在至少5个数量级的范围内,FDA蛋白质的检测水平与其FDA预测水平一致。测量很少相差甚至一个数量级(参见,例如,转甲状腺素蛋白)。大多数蛋白质沿着虚线轴或在灰色阴影区域内或靠近灰色阴影区域下落,该区域仅代表相对于对角线的适度变化。
这些结果表明,对于从干燥血浆斑点提取的样品,仪器响应近似于内源性血浆浓度。
对本文公开的方法的定量能力的类似验证在图7中呈现。图7证明,已经使用与本文公开内容一致的方法,通过干燥血液斑点的质谱分析鉴别了已知的和鉴定的蛋白质。蛋白质按蛋白质浓度排序,并且沿x轴从较高浓度到较低浓度排列。y轴表示相同蛋白质的归一化的仪器响应。
观察到仪器响应将蛋白质按照其排序正确地排列在5-6个数量级上。左上方描绘了丰富的常见血液蛋白质,而右下方则可见相当罕见的蛋白质,如转录因子。
这些结果进一步表明,对于从干燥血浆斑点提取的样品,仪器响应近似于内源性血浆浓度。
通过将已知量的外源性蛋白质添加至样品,并分析由质谱分析结果指示的蛋白质水平,进一步评估仪器响应的定量能力。
将凝溶胶蛋白蛋白质以已知浓度掺加至血浆样品中,并评估仪器响应。
结果在图8中示出。x轴表示沉积的凝溶胶蛋白蛋白质水平。y轴表示归一化的仪器响应。垂直虚线表示在该点处以与内源性水平相当的水平添加沉积的凝溶胶蛋白。左图和右图描绘了在每幅图的顶部示出的两个肽片段的结果,这两个肽片段映射到凝溶胶蛋白蛋白质。
如图8中所示,归一化的仪器响应精确且准确地反映了由添加外源性凝溶胶蛋白引起的凝溶胶蛋白浓度的增加。
实施例9.质谱分析鉴别通过基因组分析无法观察到的新的蛋白质变体。如本文所公开的那样分析干燥的血浆样品,并评估结果以鉴别所得片段的身份。鉴别了10,306个独特的光谱ID,对应于9,900个独特的特征ID,映射到2,242至2,290个蛋白质(具有95%置信区间)。在该肽片段数据集内,鉴别了308个序列变体,并鉴别了23个未注释的ORF。鉴别并精确测量了蛋白质的2,542个已知生物翻译后修饰,从而促进它们作为生物标志物的用途。类似地,通过该分析鉴别了406个通过先前的质谱搜索未检测到的新的翻译后修饰,从而促进它们作为生物标志物的用途。通过基于核酸的测序在很大程度上无法获得翻译后修饰。因此,通过证明这些生物标志物得到可靠的检测,可以将其用作评估健康状态或健康状况的生物标志物,但仅在评估蛋白质生物标志物时,并且仅当评估显示出与本文公开的方法一致的准确性和可重复性时。
实施例10.质谱分析根据其健康状态或健康类别准确地对个体进行分类。进行了可行性研究,以证明从质谱输出获得的生物标志物测量对于样品分组和预测分类的效用。通过ProMedDx使用IRB批准的方案采集约1,000个样品。从500名男性与500名女性参与者、500名年龄低于50岁与500名年龄超过50岁、500名高加索人与500名非洲裔美国人中采集样品。数据架构表明,每个独特的3参数类别中大约有125个样品。分析MS DPS蛋白质组学数据以检测可用来形成用于样品分类的信息小组的性别、年龄和种族相关信号。
结果显示在图9-10中。在图9中,可以看到预测样品来源的性别的分类结果。使用16个MS特征对32个年龄匹配的男性和女性对进行了分类,这些特征使用PLSDA模型进行了十轮10倍交叉验证。在x轴上描绘了假阳性率,而沿y轴描绘了真阳性率。基于MS特征的分析将样品正确地分类为其来源的性别,其AUC为0.96。在随机化类别的对照组中,基于MS特征的分析对样品进行了分类,其AUC约为0.52,与随机分配到类别中一致。作为参考,AUC为1.0代表100%准确的分类,而对于随机分类成二元类别,观察到AUC为0.5,如例如通过抛硬币所预期的。因此,如图9所示,基于MS特征的分析以非常高的准确度对样品进行了分类,在这种情况下仅基于对MS-DPS导出的片段水平数据的分析。
在图10中,可以看到预测样品来源的种族的分类结果。使用28个MS特征对30名年龄匹配的高加索人和非洲裔美国人对进行了分类,这些特征使用Glmnet模型进行了十轮10倍交叉验证。在x轴上描绘了假阳性率,而沿y轴描绘了真阳性率。基于MS特征的分析将样品正确地分类为其来源的性别,其AUC为0.98。在随机化类别的对照组中,基于MS特征的分析对样品进行了分类,其AUC约为0.54,与随机分配到类别中一致。因此,如图10所示,基于MS特征的分析以非常高的准确度对样品进行了分类,在这种情况下仅基于对MS-DPS导出的片段水平数据的分析。
实施例11-MS-DPS分析根据健康状态对样品进行分类。使用来自结直肠癌状态不同的群组的样品来鉴别指示结直肠健康的标志物。在第一组中,仅使用MS特征分析54个CRC和54个对照样品。采用PLS-DA模型,其依赖于6个特征。
结果在图11中示出。基于MS特征的分析将样品正确地分类为其来源的CRC状态,其AUC为0.76。在随机化类别的对照组中,基于MS特征的分析对样品进行了分类,其AUC约为0.5,与随机分配到类别中一致。
在第二组中,在包含MS特征和年龄作为生物标志物的分析中分析了89个CRC和207个对照样品。使数据集经受PLS-DA模型,并使用10个特征来形成小组。
结果在图12中示出。基于MS特征的分析将样品正确地分类为其来源的CRC状态,其AUC为0.76。在随机化类别的对照组中,基于MS特征的分析对样品进行了分类,其AUC约为0.49,与随机分配到类别中一致。
在另一个分析中,使用MS-DPS方法来开发指示冠状动脉疾病(CAD)的信号。从落入具有0或严重(大于100)CAD风险评分的两组之一的个体分析样品。使用关于性别/年龄/位点匹配对的信息对91个样品进行了评分。
结果在图13中示出。基于MS特征的分析将样品正确地分类为其来源的CAD状态,其AUC为0.71。在随机化类别的对照组中,基于MS特征的分析对样品进行了分类,其AUC约为0.52,与随机分配到类别中一致。
该实施例证明,除了患者特征如性别或种族之外,还可以根据指示患者健康的特征如CRC或CAD状态对样品进行分类。
实施例12-持续患者监测方案的实施。使4名患者经受30天的监测方案,该监测方案包括每日通过干燥血液斑点获取血液样品。处理样品并分析指示健康状态的趋势。没有报告任何参与者的健康状态变化,并且在研究期间没有观察到参与者的生物标志物水平的模式。
该实施例说明,通过有规律的定期样品采集对患者健康进行纵向监测是可行的健康评估和监测方法。样品由参与者定期提供,而没有“样品疲劳”或与参与有关的其他问题。与包括本文先前实施例的公开内容一致,重复精确地测量样品。重要的是,患者健康与MSDPS患者信号精确相关,因为没有预测到健康事件并且没有观察到不良健康状况。
实施例13-来自多样性数据源的生物标志物获取个体健康监测。针对个体实施持续健康监测方案。如图16再次所示,监测来自广泛多样性来源的生物标志物。采集的数据包括物理数据、个人数据和分子数据,并且包括血糖水平、血压、认知健康数据、心率和热量摄入,以及分子数据,如从作为干燥血液斑点获得的血浆样品获得的以及从呼吸样品中捕获的渗出物获得的质谱数据。图17中给出了从呼吸中捕获的渗出物生成的原始质谱数据的一个实例。来自多个来源的生物标志物和其他标志物数据被集成为多源标志物方案的一部分,并且在图18中示出。
随着时间的推移采集并分析数据。据观察,发现与葡萄糖调节和葡萄糖水平有关的标志物在方案的过程中变化。观察到葡萄糖水平相继受到较少的调节,但不会达到其本身指示糖尿病的水平。发现与葡萄糖调节相关并且与糖尿病有关的生物标志物在监测过程中监测的水平上发生变化。观察到精神敏锐度以与血糖水平相关的方式受到影响。还观察到这些变化的幅度大致随着患者体重的增加而扩大。
这些标志物中的每一个均显示出一定的变化,但是这些标志物中没有一个单独地生成足够强的信号以导致指示向糖尿病进展的统计学上显著的信号。尽管如此,通过涉及来自多样性来源的标志物(包括来自患者干燥血液样品的生物标志物)的多方面分析生成的聚合信号强烈地指示趋向于糖尿病发作的模式。
因此,持续监测表明患者展现出糖尿病的早期迹象,并且响应的严重程度可随着患者体重的增加而扩大。
启动体重控制方案,并继续监测。观察到随着热量摄入测量值减少、运动增加和体重降低,指示糖尿病症状进展的总体标志物信号降低。然而,标志物的子集表明糖尿病进展的风险即使在热量减少和运动的情况下仍然存在。
拥有详述结果的报告的医疗专业人员得出以下结论。患者易患糖尿病。因为监测方案远在有害症状出现之前就检测到健康状态,所以没有发生糖尿病相关的损害。可以通过运动、体重控制和受管制的饮食来检查疾病的进展。然而,仍然存在发生糖尿病症状的可能性。
实施例14-免疫生物标志物小组评估。开发了一组提供结直肠癌信息的蛋白质生物标志物。该组包括蛋白质AACT、CATD、CEA、CO3、CO9、MIF、PSGL和SEPR。测定来自个体的血液样品中的蛋白质,并且通过包含针对小组成分的抗体的免疫测定试剂盒评估其水平。该测定以高度可重复性确定小组蛋白质水平,使得以高度的灵敏度和高度的特异性进行结直肠癌评估。
实施例15-标志物辅助的质谱生物标志物小组开发。从许多疾病状态不同的个体获得样品。对样品进行质谱分析,并鉴别出与疾病状态相关地发生信号变化的生物标志物。由于输出上的高密度多肽斑点,生物标志物鉴别变得复杂,这需要复杂的数据分析来准确地判定质谱数据中的标志物。
提取始终与疾病状态共变的特定多肽并对其进行多肽测序,从而允许鉴别标志物的起源蛋白质。
针对始终与疾病状态共变的每种特定多肽开发重同位素标志物蛋白质。
从10倍数目的个体获得后续样品。用已知浓度的经鉴别的生物标志物的重标记多肽补充样品。重标记的生物标志物标记物的存在简化了质谱数据输出中的内源性生物标志物鉴别,使得在基本上更准确的高通量分析管线中分析更多样品。在样品斑点鉴别之后,通过将参考斑点信号强度与感兴趣的内源性斑点的信号强度进行比较,使用生物标志物标记物参考斑点来促进内源性样品斑点定量。
大多数生物标志物被证实为提供更大群体中的健康状态的信息。选择经验证的生物标志物作为基于血液的免疫测定的靶标,以作为用于现场样品采集和评估的试剂盒提供。
实施例16-通过标志物辅助质谱分析的高通量多小组评估。开发生物标志物小组以鉴别循环血液中的多种病症的生物标志物特征,包括单独地能够检测广泛的早期癌症和其他无症状病前状况的风险的小组。这些小组组合起来涉及超过200种蛋白质生物标志物。
从个体获取第一血液样品。测定该样品以评估其生物标志物小组概况。使用基于免疫测定的方法评估这些小组。准确地进行测量,但是抗体的数目使得大量的测定难以实施,从而导致需要更大量的样品,并且花费更多的时间来实施这些测定。
从个体获取第二样品。对该样品进行质谱分析,以便在单次测定中测定生物标志物水平。生成样品的总多肽质谱概况。鉴别并精确量化一些生物标志物。然而,总多肽质谱概况上的多肽信号的密度使得一些标志物的准确鉴别和定量变得复杂,并且由于数据生成中的挑战,一些小组无法得到准确评估。
针对超过200种蛋白质生物标志物中的每一种,开发了重同位素标记的标志物蛋白质。开发每种标志物蛋白质,以便在质谱分析中以相对于给定样品中未标记的内源性对应物的可预测的偏移进行迁移,并且易于在质谱输出中检测。
从个体获取第三样品。针对超过200种蛋白质生物标志物中的每一种,将重同位素标记的标志物蛋白质以已知浓度添加至样品中。对样品进行质谱分析并对输出进行分析。
使用标志物蛋白质质谱片段作为指导,容易地鉴别对应于样品中内源性生物标志物的质谱信号。在样品斑点鉴别之后,通过将参考斑点信号强度与感兴趣的内源性斑点的信号强度进行比较,使用生物标志物标记物参考斑点来促进内源性样品斑点定量。
与上述第一样品和第二样品的分析相比,观察到第三样品得到更准确、更快速的分析,并且具有显著少于第一样品的试剂使用量或台式操作。还观察到第三样品在与第二样品相当的实验室工作时间内得到分析,但是与对应于一种或另一种生物标志物的质谱信号判定有关的下游分析在生物标志物标记的第三样品中显著更快、更容易且更准确,并且内源性斑点定量明显更加准确。
实施例17-通过标志物辅助质谱分析的大规模高通量多小组评估。在对样品中的蛋白质进行质谱分析之前,将如上所述的超过1,000个标记的生物标志物参考标准品以已知浓度引入血液样品中。这些生物标志物参考标准品是重同位素标记的,以便在质谱分析中以相对于内源性蛋白质的预测偏移进行迁移,并且易于检测,而不依赖于它们的质谱标记,并且具有高度置信度。
在质谱分析中容易检测到所述超过1,000个标记的生物标志物。对于每个标记的生物标志物,容易确定对应于标记的生物标志物的内源性未标记的生物标志物预计在何处迁移。
对于一些生物标志物,针对相对于标记的生物标志物有预测的偏移的不同斑点来检测质谱信号。通过与质谱可视化上的参考斑点信号强度进行比较来对信号进行定量,并将其指定为代表内源性生物标志物水平。
对于一些生物标志物,在相对于标记的生物标志物的预测偏移处检测质谱信号,但该信号是与质谱输出上的相邻斑点没有明显分离的斑点的一部分。因为相邻的标记的标准品可用作参考,所以可以根据标记的多肽与未标记的多肽之间的预测偏移准确地确定内源性生物标志物预计所处的位置。通过与标记的标准品的斑点大小进行比较,还可以容易地确定对应于内源性生物标志物的斑点的预期大小。对预期对应于内源性蛋白质的斑点的部分进行定量,并将其指定为代表内源性生物标志物水平。
对于一些生物标志物,检测对应于标记的生物标志物的质谱信号,但是在相对于标记的生物标志物的预测偏移处没有检测到信号。结论是,在进行质谱分析的样品中不存在内源性生物标志物。
对于一些生物标志物,检测对应于标记的生物标志物的质谱信号。在相对于标记的生物标志物的预测偏移处没有检测到斑点,但是在非常接近预测的偏移位置处检测到多个斑点。在没有标记的生物标志物标准品的情况下,可以容易地将这些斑点中的任一个指定为代表内源性生物标志物。然而,使用标记的生物标志物作为参考,观察到没有局部斑点对应于针对内源性生物标志物预测的偏移位置。在没有标记的生物标志物的情况下,很难将这些斑点中的任一个判定为是或不是对应于感兴趣的生物标志物的斑点。鉴于通过使用标记的生物标志物偏移获得的增加的准确性,得出以下结论:在进行质谱分析的样品中不存在内源性生物标志物。
观察到当样品分析包含标记的标志物多肽作为指导时,明显更准确地测定所述超过1,000个内源性生物标志物。
实施例18-对于数据库生成通过质谱分析的大规模高通量多小组评估由于数据采集中的挑战而变得复杂。将超过1,000个生物标志物鉴定为与生物标志物数据库的生成相关。从来自超过1000个个体的干燥血液斑点中采集血液样品,每个个体具有多种独立状况的已知疾病状态。样品采集在五年的过程中每月重复一次。
对样品进行质谱分析,以对每个样品中的生物标志物水平进行定量。发现生物标志物以不大于90%置信度的水平得到鉴别和定量。具有挑战性的因素包括相互遇到的或以其他方式存在于质谱输出的密集区域中的生物标志物斑点信号,以及缺乏用作标准品的已知浓度的参考信号。结果,信号缺失的准确定量和辅助判定变得困难。通过手动检查促进分析,但是缺少自动化数据采集管线使工作流程变得复杂,并且既妨碍通量又妨碍整体数据库准确性。
实施例19-对于数据库生成通过标志物辅助质谱分析的大规模高通量多小组评估。将超过1,000个生物标志物鉴别为与生物标志物数据库的生成相关。从来自超过1000个个体的干燥血液斑点中采集血液样品,每个个体具有多种独立状况的已知疾病状态。样品采集在五年的过程中每月重复一次。
在质谱分析之前,以已知浓度添加所述超过1,000个生物标志物中的每一个的重标记的标志物蛋白质,使得重标记的蛋白质将产生以相对于其内源性未标记对应物的可预测的偏移进行迁移的多肽,并且使得标记的多肽易于在样品中鉴别。
对样品进行质谱分析,以对每个样品中的生物标志物水平进行定量。发现生物标志物以大于99%置信度的水平得到鉴别和定量。内源性多肽斑点易于通过它们相对于相应的经标记标志物标准品的预测偏移得到鉴别,使得“融合的”斑点易于分辨,并且使得斑点预测位置易于在斑点密集区域中得到鉴别,从而促进更准确的缺乏判定以及存在判定和测量。通过将内源性斑点与已知原始浓度的参考斑点进行比较,可以容易地以高度的准确性对内源性斑点进行定量。
测量过程易于自动化,而不需要手动评估,这极大地促进了高通量数据生成。数据采集中偏移计算的准确性进一步提高了数据库的整体准确性。
实施例20-在单一方法中组合无标记物蛋白质组学和MRM技术。使用合并的血浆样品作为基质,以供在标准血浆工作流程中和通过点样到DPS卡上来评价稳定同位素标准品(SIS)肽响应。用基于TFE的胰蛋白酶消化方案将所有样品一式三份进行消化。消化后将每个样品冻干,并用一组包含与结直肠癌相关的392种蛋白质的641个SIS肽重建。在开发用于CRC风险升高的患者的生物标志物检测的MRM测定期间,通过若干性能特征(即峰丰度、CV、精确度等)选择这些肽。利用MS1和MS2谱采集模式,采用优化的32分钟梯度,在Agilent6550qTOF仪器上分析每个样品。
最初将这里使用的641个SIS肽(包含392种蛋白质)选择为结直肠癌小组的一部分,尽管个别蛋白质也与其他适应症(例如肿瘤、炎症)相关。使用这些肽证明HRMS/SIS方法在两种样品形式(血浆、DBS/DPS)上对于一系列蛋白质的能力。
在Agilent 6550qTOF上单独处理包含纯血浆和DPS血浆消化物的稀释系列的总共24-10μL注射液。从纯血浆和DPS血浆实验中,提取来自HRMS数据的分子特征,并在注射液之间进行关联。从该数据评价了SIS肽在稀释系列中的定量响应。641个SIS肽中的大约500个随稀释水平显示出定量变化。在线性、再现性和定量下限方面评价每个肽的动态表现。对于样品中的未标记的特征,使用特征数来估计数据中的总信息含量。使用所选分子特征的MS2数据采集作为进一步的确认。对于纯血浆和DPS血浆实验,在样品中平均发现了大约30,000个分子特征(z=2-4),突出显示了通过HRMS仪器可获得的数据的丰富性。还提出了对分子特征再现性、动态范围以及纯血浆与DPS血浆实验之间的比较进行定量的进一步分析。
通过LCMS来处理用SIS肽小组以158fmol/uL重建的DPS血浆消化物的另外10-10μL注射液。如上所述提取数据。观察到分子特征的中值CV为15.3%,而检测到的SIS肽的中值CV为5.1%。
样品的质谱输出呈现在图19A中。该图像描绘了质谱分析的益处和挑战。检测到多于10,000个斑点。
在图19B中,可以看到相同的输出,但覆盖有外源添加的重标记的标志物的位置。标志物的存在允许人们鉴别质谱输出中对应于特别感兴趣的内源性蛋白质的相关斑点。
在图19A和图19B中示出的该实施例证明了量化100-1000的已知蛋白质并同时测量>30,000个分子特征的能力。
实施例21-质谱样品数据中SIS标志物信号的定量。将实施例20的641个SIS肽(包含392种蛋白质和1552种转换的641个多肽)以不同浓度引入血浆和干燥血浆提取的生物标志物样品的等份中,并进行质谱分析。
将SIS标志物以范围最高为500fmol/uL的8个浓度水平引入样品等份中。对每次运行一式三份进行测量。每个实验(血浆和干燥的血浆斑点)在QTOF和QQQ上以相同梯度运行,以促进交叉采集方法比较。对QTOF数据进行如下所示的进一步分析。
对标志物斑点进行自动化鉴别,并对推定的标志物斑点信号进行定量。标志物的代表性列表的结果呈现在图20中。对于每幅多肽图,在x轴上描绘标志物浓度,而在y轴上描绘斑点信号强度(作为仪器响应输出上的面积)。可能准确的斑点判定被描绘为具有黑色轮廓的实心圆圈。错误判定为标志物斑点的假定内源性样品斑点被描绘为缺少轮廓的浅灰色斑点。
可以看出,对于图20中描绘的所有多肽标志物(并且代表总体上分析的更多数目的多肽标志物),在浓度(fmol/uL,范围从0到500,如图片的最底部文件的x轴所示)与斑点信号强度之间观察到清晰、强烈的线性相关性。这些结果表明,标志物多肽易于鉴别,并且它们的斑点信号强度随浓度而线性变化,从而证实了鉴别过程的功效和它们作为标志物帮助可比信号强度的内源性斑点定量的效用。
偶尔出现的斑点错误判定,如在第二行第二幅图的肽6中所见,由于多种原因而提供信息。首先,与肽6一样,即使是明显的错误判定也不会破坏标志物浓度与斑点信号之间的整体线性关系。其次,通过它们对浓度与斑点信号响应之间的总体相关性的影响,可以容易地鉴别出明显的、甚至适度的错误判定(例如,肽6和肽3)。因此,浓度与斑点强度之间的相关性充当斑点判定的质量控制检查。通过标记可能已经发生斑点错误判定的标志物,它们提供了提高最终质谱结果的总体准确性的其他工具。
总体上观察结果,可以看出对于标准血浆和干燥的血浆斑点样品,使用了641个SIS标志物多肽。对于标准血浆样品,这些标志物中的634个(99%)至少显示一次可观察到的峰;627个(98%)展现出至少2个观察到的峰;622个(97%)展现出至少3个可观察到的峰;605个(94%)在50-500fmol/uL浓度范围内展现出至少3个连续峰,其中513个(80%)显示出大于0.8的r-方值,而490个(76%)显示出至少为0.9的r-方值。
干燥血浆样品的可比较数目如下。这些标志物中的625个(98%)至少显示一次可观察到的峰;613个(96%)展现出至少2个观察到的峰;597个(93%)展现出至少3个可观察到的峰;579个(90%)在50-500fmol/uL浓度范围内展现出至少3个连续峰,其中515个(80%)显示出大于0.8的r-方值,而498个(78%)显示出至少为0.9的r-方值。
这些结果表明,标志物多肽在天然样品质谱输出中得到准确、可重复地鉴别和定量。这些结果与在标志物多肽的内源性等同物的定量中以及在整体样品的定量中使用SIS肽一致。
实施例22-SIS标志物开发和细节。以上讨论的多肽标志物如下进行组装。该方法与用于广泛的病症、状况或其他分类的标志物的开发广泛相关。
对已发表的数据(文献和公共数据库)进行搜索,从中选择431种CRC相关蛋白质以用于开发MRM测定。在优化液相色谱(LC)和质谱(MS)条件之后,对于来自代表431种蛋白质的1006个蛋白质型肽的8806个转换,评估了该测定的特异性、线性、精确度和动态范围。对可行性数据的审查导致进一步的优化,最终的方法测量对641个肽具有特异性的1552个表现最佳的转换(每个肽最少2个转换),代表最初选择的431种CRC蛋白中的392种。随后使用这种最终的MRM方法来评价通过免疫耗竭和胰蛋白酶消化进行预分析处理的1045个个体患者血浆样品。
使用单一多重MRM测定,我们在采用1045个患者样品的研究中评价了392个候选CRC蛋白标志物。在Agilent 1290UHPLC-6550QTOF系统上使用在C18柱上进行的反相分离进行LC梯度优化。在两台Agilent 1290UHLPC-6490QQQ仪器上进行碰撞能量(CE)优化。针对8806个转换中的每一个测试6个CE步骤。基于峰值AUC丰度和3个技术重复物的最低CV选择最佳CE。使用稳定同位素标准(SIS)肽混合物的半对数连续稀释,对所有8806个转换评估基于特异性、线性、精确度和动态范围的分析性能。使用掺加有相同SIS混合物的血浆来评价基质干扰并确认转换特异性。针对每个实验条件采集三个技术重复物,以评估测定精确度。基于分析性能自动地对每个肽的转换进行排序,并为每种蛋白质选择每个肽的前两个转换。在数据审查之后,最终的MRM方法由来自代表392种蛋白质的641个肽的1552个转换组成。在32分钟LC梯度上,对于每个42秒的LCMS采集窗口,转换并发性被限制为最高90次转换。使用最终的MRM测定对1045个个体患者血浆样品中的392种CRC蛋白进行定量。由该研究生成的数据在分类器分析中使用。基于血浆的CRC肽特征的鉴别可用于鉴别CRC风险升高的个体,从而鼓励这些患者接受推荐的结肠镜检查。
该实施例证明了如何开发SIS标志物多肽组,并且与上述结果一致,表明了它们如何用于通过质谱法分析的患者样品中的内源性生物标志物的自动化、准确定量。
实施例23-癌症生物标志物的质谱分析以检测疾病信号。从接受健康筛查和监测的患者采集血液样品。对样品进行质谱分析,以生成蛋白质鉴别和量化数据。因为患者具有癌症家族史,所以对与指示癌症疾病信号的一组生物标志物相对应的质谱数据的子集进行分析,以检测疾病信号的存在。该小组中包括AML1-TEL融合的生物标志物,AML1-TEL融合是由染色体易位引起的,并且经常在各种髓样和淋巴样白血病中观察到。AML1和TEL基因编码转录因子,并且其融合在25%的儿童急性淋巴母细胞白血病(cALL)中观察到(Zelent,A.;Greaves,M.;Enver,Tariq.Role of the TEL-AML1fusion gene in the molecularpathogenesis of childhood acute lymphoblastic leukaemia.Oncogene 2004,23,4275-4283)。在正常情况下,AML1和TEL的蛋白质表达水平偏离线性共变关系,这至少是因为它们由位于不同染色体上的不同基因编码。同时,野生型AML1(或TEL)的不同区域或多肽序列(例如,N-端和C-端区域)表现出彼此呈线性共变关系,因为它们被一起翻译成所得的AML1多肽。因此,AML1的N-端和C-端彼此共同变化,但不与TEL的N-端和C-端共同变化。
然而,在AML1-TEL融合的情况下,包含寡聚指向结构域(PD)和中央阻抑结构域(阻抑)的TEL的N-端区域在其N-端与基本上完整的AML1融合。另外,TEL丢失了位于其C-端区域的ETS DNA结合域(参见上文,Zelent等人)。结果,预期融合后,TEL的PD和阻抑结构域与AML1而不是与ETS DNA结合域共同变化。
因此,针对AML1-TEL融合的生物标志物包含多肽和/或肽片段(例如,诸如可通过质谱法检测的那些),这些片段对应于由于融合而其共变已改变的AML1和TEL区域。在这种情况下,该生物标志物包括来自C-端ETS DNA结合域以及TEL的N-端PD和阻抑结构域的多肽。该生物标志物还包括来自AML1的多肽。对应于该生物标志物的质谱数据子集的分析揭示,来自ETS DNA结合域的多肽与预期的与TEL的PD和阻抑结构域的线性关系相比共变减少,而来自AML1的多肽表现出与TEL的PD和阻抑结构域的共变增加,但与ETS DNA结合域的共变则没有增加。在这种情况下,通过与具有野生型AML1和TEL的对照样品进行比较来评价共变的增加或减少。在此,对第一生物标志物小组的以上分析基于共变的变化指示与AML1-TEL融合相关的癌症的疾病信号的存在。
实施例24-癌症生物标志物的质谱分析,以检测疾病信号并进行疾病状态的进一步评估。从接受健康筛查和监测的患者采集血液样品。对样品进行质谱分析,以生成蛋白质鉴别和量化数据。因为患者具有癌症家族史,所以对与指示癌症疾病信号的第一组生物标志物相对应的质谱数据的第一子集进行分析,以检测疾病信号的存在。该小组中包括AML1-TEL融合的生物标志物,AML1-TEL融合是由染色体易位引起的,并且经常在各种髓样和淋巴样白血病中观察到。AML1和TEL基因编码转录因子,并且其融合在25%的儿童急性淋巴母细胞白血病(cALL)中观察到(Zelent,A.;Greaves,M.;Enver,Tariq.Role of the TEL-AML1fusion gene in the molecular pathogenesis of childhood acutelymphoblastic leukaemia.Oncogene 2004,23,4275-4283)。在正常情况下,AML1和TEL的蛋白质表达水平偏离线性共变关系,这至少是因为它们由位于不同染色体上的不同基因编码。同时,野生型AML1(或TEL)的不同区域或多肽序列(例如,N-端和C-端区域)表现出彼此呈线性共变关系,因为它们被一起翻译成所得的AML1多肽。因此,AML1的N-端和C-端彼此共同变化,但不与TEL的N-端和C-端共同变化。
然而,在AML1-TEL融合的情况下,包含寡聚指向结构域(PD)和中央阻抑结构域(阻抑)的TEL的N-端区域在其N-端与基本上完整的AML1融合。另外,TEL丢失了位于其C-端区域的ETS DNA结合域(参见上文,Zelent等人)。结果,预期融合后,TEL的PD和阻抑结构域与AML1而不是与ETS DNA结合域共同变化。
因此,针对AML1-TEL融合的生物标志物包含多肽和/或肽片段(例如,诸如可通过质谱法检测的那些),这些片段对应于由于融合而其共变已改变的AML1和TEL区域。在这种情况下,该生物标志物包括来自C-端ETS DNA结合域以及TEL的N-端PD和阻抑结构域的多肽。该生物标志物还包括来自AML1的多肽。对应于该生物标志物的质谱数据子集的分析揭示,来自ETS DNA结合域的多肽与预期的与TEL的PD和阻抑结构域的线性关系相比共变减少,而来自AML1的多肽表现出与TEL的PD和阻抑结构域的共变增加,但与ETS DNA结合域的共变则没有增加。在这种情况下,通过与具有野生型AML1和TEL的对照样品进行比较来评价共变的增加或减少。对第一生物标志物小组的以上分析基于共变的变化指示与AML1-TEL融合相关的癌症的疾病信号的存在。
在检测到癌症信号之后,选择质谱数据的第二子集以进一步评价与AML1-TEL融合相关的潜在癌症。由于AML1-TEL融合存在于25%的儿童急性淋巴母细胞白血病(cALL)中,因此质谱数据的该第二子集包括关于指示cALL状态的第二组生物标志物的数据。第二组生物标志物包括参与PI3K/AKT/mTOR、JAK/STAT、ABL酪氨酸激酶和SRC酪氨酸激酶家族或NOTCH1途径的分子,这些分子与cALL期间B细胞和T细胞的活化、增殖和存活有关(Villar,E.L.;Wu,D.;Cho,W.C.;Madero,L.;Wang,X.Proteomics-based discovery of biomarkersfor paediatric acute lymphoblastic leukemia:challenges and opportunities.JCell Mol Med,2014,18(7):1239-1246)。接下来,分析与指示cALL状态的生物标志物相对应的质谱数据的第二子集,以确认、拒绝、监测和/或评估疾病状态。在这种情况下,因为信号传导途径通常需要磷酸化和翻译后修饰事件,所以分析的质谱数据包括磷酸化蛋白质组学和翻译后修饰蛋白质组学数据。
实施例25-多个样品中癌症生物标志物的质谱分析,以监测疾病状态或进展。从患有儿童急性淋巴母细胞白血病(cALL)的癌症患者采集血液样品,作为对疾病状态的持续监测的一部分。使用具有在样品采集之前沉积在装置上的温度QC标志物的采集装置采集样品。在样品采集之后,并且在样品洗脱和质谱处理与分析之前,对温度QC标志物进行评价,以确定该样品是否超过阈值热暴露。在这种情况下,温度QC标志物所包含的指示剂未发生指示样品已超过阈值热暴露的颜色变化。因此,对样品进行质谱分析,以生成蛋白质鉴别和量化数据。因为患者当前接受针对cALL的治疗,所以对与指示cALL的一组生物标志物相对应的质谱数据的子集进行分析,以监测疾病状态。先前的测试已经揭示了AML1-TEL融合的存在,AML1-TEL融合是由染色体易位引起的,并且经常在各种髓样和淋巴样白血病中观察到。AML1和TEL基因编码转录因子,并且其融合在25%的儿童急性淋巴母细胞白血病(cALL)中观察到(参见,同上,Zelent等人)。在正常情况下,AML1和TEL的蛋白质表达水平偏离线性共变关系,这至少是因为它们由位于不同染色体上的不同基因编码。同时,野生型AML1(或TEL)的不同区域或多肽序列(例如,N-端和C-端区域)表现出彼此呈线性共变关系,因为它们被一起翻译成所得的AML1多肽。因此,AML1的N-端和C-端彼此共同变化,但不与TEL的N-端和C-端共同变化。
然而,在AML1-TEL融合的情况下,包含寡聚指向结构域(PD)和中央阻抑结构域(阻抑)的TEL的N-端区域在其N-端与基本上完整的AML1融合。另外,TEL丢失了位于其C-端区域的ETS DNA结合域(参见上文,Zelent等人)。结果,预期融合后,TEL的PD和阻抑结构域与AML1而不是与ETS DNA结合域共同变化。
因此,所述生物标志物小组包含针对AML1-TEL融合的生物标志物。具体地,该AML1-TEL融合生物标志物包含多肽和/或肽片段(例如,诸如可通过质谱法检测的那些),这些片段对应于由于融合而其共变已改变的AML1和TEL区域。在这种情况下,该生物标志物包括来自C-端ETS DNA结合域以及TEL的N-端PD和阻抑结构域的多肽。该生物标志物还包括来自AML1的多肽。在从患者采集的早期样品中已经检测到AML1-TEL融合,其中针对AML1-TEL融合生物标志物的质谱数据表明,来自ETS DNA结合域的多肽与预期的与TEL的PD和阻抑结构域的线性关系相比共变减少,而来自AML1的多肽表现出与TEL的PD和阻抑结构域的共变增加,但与ETS DNA结合域的共变则没有增加。在这种情况下,将来自先前样品的数据与当前样品进行比较,以检测共变随时间的增加或减少,以用于监测疾病进展的目的。例如,因为样品是除了具有AML1-TEL融合突变的细胞外还包含具有野生型AML1和TEL的细胞的非均质血液样品,所以共变的变化将反映野生型和突变细胞的相对比例随时间的变化。在这里,当前样品与先前样品之间的质谱量化生物标志物的比较表明,AML1与TEL的PD和阻抑结构域之间的共变减少,而TEL的ETS DNA结合域与PD和阻抑结构域之间的共变增加。这些共变的变化支持以下推断:相对于野生型AML1和TEL,AML1-TEL融合的比例逐渐降低。因此,该疾病监测的结果提示患者正在进行的治疗可能具有积极作用。
另外,疾病监测任选地包括评价与cALL相关的其他生物标志物,如PI3K/AKT/mTOR、JAK/STAT、ABL酪氨酸激酶和SRC酪氨酸激酶家族或NOTCH1途径的组分,这些组分与cALL期间B细胞和T细胞的活化、增殖和存活有关(参见,同上,Villar等人)。在这种情况下,因为信号传导途径通常需要磷酸化和翻译后修饰事件,所以分析的质谱数据包括磷酸化蛋白质组学和翻译后修饰蛋白质组学数据。
实施例26-癌症生物标志物的质谱分析,以使用参考标志物检测疾病信号。从接受健康筛查和监测的患者采集血液样品。对样品进行质谱分析,以生成蛋白质鉴别和量化数据。因为患者具有癌症家族史,所以对与指示癌症疾病信号的一组生物标志物相对应的质谱数据的子集进行分析,以检测疾病信号的存在。该小组中包括AML1-TEL融合的生物标志物,AML1-TEL融合是由染色体易位引起的,并且经常在各种髓样和淋巴样白血病中观察到。AML1和TEL基因编码转录因子,并且其融合在25%的儿童急性淋巴母细胞白血病(cALL)中观察到(Zelent,A.;Greaves,M.;Enver,Tariq.Role of the TEL-AML1fusion gene inthe molecular pathogenesis of childhood acute lymphoblasticleukaemia.Oncogene 2004,23,4275-4283)。在正常情况下,AML1和TEL的蛋白质表达水平偏离线性共变关系,这至少是因为它们由位于不同染色体上的不同基因编码。同时,野生型AML1(或TEL)的不同区域或多肽序列(例如,N-端和C-端区域)表现出彼此呈线性共变关系,因为它们被一起翻译成所得的AML1多肽。因此,AML1的N-端和C-端彼此共同变化,但不与TEL的N-端和C-端共同变化。
然而,在AML1-TEL融合的情况下,包含寡聚指向结构域(PD)和中央阻抑结构域(阻抑)的TEL的N-端区域在其N-端与基本上完整的AML1融合。另外,TEL丢失了位于其C-端区域的ETS DNA结合域(参见上文,Zelent等人)。结果,预期融合后,TEL的PD和阻抑结构域与AML1而不是与ETS DNA结合域共同变化。
因此,针对AML1-TEL融合的生物标志物包含多肽和/或肽片段(例如,诸如可通过质谱法检测的那些),这些片段对应于由于融合而其共变已改变的AML1和TEL区域。在这种情况下,该生物标志物包括来自C-端ETS DNA结合域以及TEL的N-端PD和阻抑结构域的多肽。该生物标志物还包括来自AML1的多肽。
为了在这种情况下评价共变,可在参考生物标志物的帮助下对生物标志物进行定量。例如,因为样品是除了具有AML1-TEL融合突变的细胞外还包含具有野生型AML1和TEL的细胞的非均质血液样品,所以共变的变化将反映野生型和突变细胞的相对比例的变化。这样的变化可以是逐渐的、增量的变化,而不是1:1线性关系与完全不存在共变之间的完全转换。而且,生物标志物或生物标志物组分之间的线性共变关系可能无法准确地反映在质谱输出中。例如,对蛋白质生物标志物的等量的结构域A和B的分析可产生不相等的质谱定量。因此,作为内源性生物标志物或内源性生物标志物组分的类似物的参考生物标志物提供了关于预期相对量的基准。
在这种情况下,在质谱分析之前,将至少一个生物标志物(其为相应的内源性AML1和TEL蛋白生物标志物或生物标志物组分的质量迁移的类似物)引入样品中,以帮助鉴别和/或量化内源性生物标志物。
对应于该生物标志物的质谱数据子集的分析揭示,来自ETS DNA结合域的多肽与预期的与TEL的PD和阻抑结构域的线性关系相比共变减少,而来自AML1的多肽表现出与TEL的PD和阻抑结构域的共变增加,但与ETS DNA结合域的共变则没有增加。在这种情况下,通过与具有野生型AML1和TEL的对照样品进行比较来评价共变的增加或减少。在此,对第一生物标志物小组的以上分析基于共变的变化指示与AML1-TEL融合相关的癌症的疾病信号的存在。
实施例27-使用提供样品质量控制评估的参考标志物对癌症生物标志物的质谱分析,以检测疾病信号。从接受健康筛查和监测的患者采集血液样品。使用具有在样品采集之前沉积在装置上的温度QC标志物的采集装置采集样品。在样品采集之后,并且在样品洗脱和质谱处理与分析之前,对温度QC标志物进行评价,以确定该样品是否超过阈值热暴露。在这种情况下,温度QC标志物所包含的指示剂未发生指示样品已超过阈值热暴露的颜色变化。因此,对样品进行质谱分析,以生成蛋白质鉴别和量化数据。因为患者具有癌症家族史,所以对与指示癌症疾病信号的一组生物标志物相对应的质谱数据的子集进行分析,以检测疾病信号的存在。该小组中包括AML1-TEL融合的生物标志物,AML1-TEL融合是由染色体易位引起的,并且经常在各种髓样和淋巴样白血病中观察到。AML1和TEL基因编码转录因子,并且其融合在25%的儿童急性淋巴母细胞白血病(cALL)中观察到(Zelent,A.;Greaves,M.;Enver,Tariq.Role of the TEL-AML1fusion gene in the molecular pathogenesisof childhood acute lymphoblastic leukaemia.Oncogene 2004,23,4275-4283)。在正常情况下,AML1和TEL的蛋白质表达水平偏离线性共变关系,这至少是因为它们由位于不同染色体上的不同基因编码。同时,野生型AML1(或TEL)的不同区域或多肽序列(例如,N-端和C-端区域)表现出彼此呈线性共变关系,因为它们被一起翻译成所得的AML1多肽。因此,AML1的N-端和C-端彼此共同变化,但不与TEL的N-端和C-端共同变化。
然而,在AML1-TEL融合的情况下,包含寡聚指向结构域(PD)和中央阻抑结构域(阻抑)的TEL的N-端区域在其N-端与基本上完整的AML1融合。另外,TEL丢失了位于其C-端区域的ETS DNA结合域(参见上文,Zelent等人)。结果,预期融合后,TEL的PD和阻抑结构域与AML1而不是与ETS DNA结合域共同变化。
因此,针对AML1-TEL融合的生物标志物包含多肽和/或肽片段(例如,诸如可通过质谱法检测的那些),这些片段对应于由于融合而其共变已改变的AML1和TEL区域。在这种情况下,该生物标志物包括来自C-端ETS DNA结合域以及TEL的N-端PD和阻抑结构域的多肽。该生物标志物还包括来自AML1的多肽。
为了在这种情况下评价共变,可在参考生物标志物的帮助下对生物标志物进行定量。例如,因为样品是除了具有AML1-TEL融合突变的细胞外还包含具有野生型AML1和TEL的细胞的非均质血液样品,所以共变的变化将反映野生型和突变细胞的相对比例的变化。这样的变化可以是逐渐的、增量的变化,而不是1:1线性关系与完全不存在共变之间的完全转换。而且,生物标志物或生物标志物组分之间的线性共变关系可能无法准确地反映在质谱输出中。例如,对蛋白质生物标志物的等量的结构域A和B的分析可产生不相等的质谱定量。因此,作为内源性生物标志物或内源性生物标志物组分的类似物的参考生物标志物提供了关于预期相对量的基准。对于检测共变关系和共变的变化,这种方法具有优异的灵敏度。
在这种情况下,在质谱分析之前,将至少一个生物标志物(其为相应的内源性AML1和TEL蛋白生物标志物或生物标志物组分的质量迁移的类似物)引入样品中,以帮助鉴别和/或量化内源性生物标志物。在这种情况下,在样品采集之前将参考生物标志物引入采集装置上,以同时充当参考生物标志物(用于比较以确定共变或其变化)和QC标志物(控制相应内源性生物标志物的降解和洗脱效率)。例如,如果内源性生物标志物的洗脱低于正常水平或相对于彼此发生了变化(这可能会使共变分析产生偏差),那么对于将经历相同洗脱程序的参考生物标志物,会预期相同的效果。同样,暴露于破坏或降解某些内源性生物标志物的储存条件预期会对参考生物标志物具有相应的影响。
对应于生物标志物和相应参考生物标志物的质谱数据子集的分析揭示,来自ETSDNA结合域的多肽与预期的与TEL的PD和阻抑结构域的线性关系相比共变减少,而来自AML1的多肽表现出与TEL的PD和阻抑结构域的共变增加,但与ETS DNA结合域的共变则没有增加。在这种情况下,通过与具有野生型AML1和TEL的对照样品进行比较来评价共变的增加或减少。在此,对第一生物标志物小组的以上分析基于共变的变化指示与AML1-TEL融合相关的癌症的疾病信号的存在。
实施例28-包含用于生物标志物质谱分析的参考标志物的采集装置,以评估疾病状态。准备用于采集全血样品的过滤卡,其具有一组参考标志物。在这种情况下,过滤卡共有类似于如图1所示的Noviplex DBSPlasma卡的整体结构。该过滤卡具有用于接收样品的区域。该小组包含具有参考多肽的参考标志物,该参考多肽是相对于样品中的内源性生物标志物具有质量位移的内源性多肽的类似物。所述参考多肽用重同位素进行标记,以在质谱分析过程中产生相对于相应内源性多肽产生的质量迁移位移。在这种情况下,该参考标志物包含野生型和突变型内源性多肽两者的质量位移的多肽类似物。第二参考标志物包含参考多肽,所述参考多肽是指示癌症的突变内源性多肽的质量位移类似物。
将这两种参考标志物放置在过滤器上,以使样品在过滤器上的沉积及其随后用于质谱分析的洗脱导致标志物和样品混合并共洗脱。全血样品沉积在过滤器的表面上。毛细管作用使血液被抽吸通过包括分离器的分离层以分离血浆,并且将血浆引导至血浆采集储器。在血液/血浆通过过滤器迁移的过程中,两种标志物与血液/血浆混合,并共迁移到血浆采集储器中,在那里它们被干燥以供储存。随后,血浆和参考标志物一起共洗脱、处理并通过质谱法进行分析。
内源性标志物更容易被鉴别,因为它们生成呈成对的峰或双峰的质谱输出,与参考标志物相比具有已知的质量位移。在这种情况下,参考突变生物标志物帮助检测突变内源性生物标志物。该结果表明,内源性生物标志物中的至少一些多肽具有指示疾病(例如疾病信号)的突变。因此,将结果告知患者,并给出进行进一步测试以评估疾病状态的建议。
实施例29-对生物标志物小组的免疫测定分析,以检测疾病信号。从接受健康筛查和监测的患者采集血液样品。针对包含指示癌症的生物标志物的第一抗体小组测定样品。该小组中包括针对与至少一个癌症信号相关的点突变的生物标志物的抗体。在阳性检测到点突变生物标志物后,针对第二抗体小组测定样品,该第二抗体小组包含针对与癌症相关的其他生物标志物的抗体。因此,通过使用初始抗体小组来筛选特定疾病,并进一步使用针对所鉴别的疾病的第二抗体小组进一步评估该疾病,用来评估疾病状态的抗体和试剂的总数得以减少和/或最小化。
实施例30-在不使用生物标志物筛选疾病信号的情况下,分析样品以评估疾病状态。从患者采集样品并进行质谱分析。在不使用检测疾病信号的一组生物标志物缩小后续分析范围的情况下评价整个数据集。该过程针对疾病生物标志物的全面列表筛选数据集,与针对疾病信号进行筛选,然后使用针对性生物标志物小组进一步评价所检测到的疾病相比,这需要明显更长的计算时间。
实施例31-在不使用参考标志物来增强内源性生物标志物的鉴别和量化的情况下,分析样品以评估疾病状态。从患者采集样品,并在不使用任何参考标志物的情况下进行质谱分析。然后基于具有与疾病相关的已知突变的生物标志物,对质谱数据进行评价,以鉴别疾病信号。然而,由于缺乏会增强生物标志物鉴别的参考标志物类似物(例如,内源性生物标志物的质量位移类似物),因此无法准确地鉴别内源性生物标志物。因此,不能使用该生物标志物评估疾病状态。
实施例32-在不使用包含参考标志物的采集装置来增强内源性生物标志物鉴别的情况下,分析样品以评估疾病状态。从患者采集样品,并在不使用任何参考标志物的情况下进行质谱分析。然后基于具有与疾病相关的已知突变的生物标志物,对质谱数据进行评价,以鉴别疾病信号。然而,由于缺乏会增强生物标志物鉴别的参考标志物类似物(例如,内源性生物标志物的质量位移类似物),因此无法准确地鉴别内源性生物标志物。因此,不能使用该生物标志物评估疾病状态。
实施例33-在不使用第一抗体小组来筛选下游分析的情况下,对样品进行狭窄靶向免疫测定以评估疾病状态。从具有乳腺癌家族史的患者采集样品,并对其应用全抗体小组以针对若干形式的乳腺癌评估疾病状态。在这种情况下,检测呈阴性,但该患者实际上患有未被检测出的该试验未评价的结直肠癌。
虽然本文已经示出并描述了本发明的优选实施方案,但对于本领域技术人员明显的是,这些实施方案仅以示例的方式提供。本领域技术人员在不脱离本发明的情况下现将想到许多变化、改变和替代。应当理解,在实施本发明的过程中可以采用本文所述的本发明实施方案的各种替代方案。旨在以所附权利要求书限定本发明的范围,并由此涵盖这些权利要求范围内的方法和结构及其等同物。
Claims (30)
1.一种采集装置,其包含:
a)采集背衬,其包含用于接收生物样品的表面;和
b)设置在所述采集背衬上的多个质量控制(QC)标志物,所述多个QC标志物指示至少一种选自下组的条件:样品完整性、样品洗脱效率和过滤器储存条件。
2.根据权利要求1所述的采集装置,其中基于所述至少一种条件从后续分析中筛选出所述生物样品。
3.根据权利要求1所述的采集装置,其中基于所述至少一种条件对从所述生物样品获得的数据进行门控,以从后续分析中去除所述数据的至少一个子集。
4.根据权利要求1所述的采集装置,其中基于所述多个QC标志物中的至少一个,对从所述生物样品获得的数据进行归一化。
5.根据权利要求1所述的采集装置,其中样品完整性包括样品稳定性、蛋白水解活性、DNA酶活性和RNA酶活性中的至少一种。
6.根据权利要求5所述的采集装置,其中所述多个QC标志物包含沉积在所述采集背衬上的已知大小和量的分子群体,其中所述分子群体指示样品稳定性,蛋白水解活性或其组合。
7.根据权利要求1所述的采集装置,其中所述多个QC标志物包含指示样品洗脱效率的分子群体,其中所述分子群体的疏水性大于所述生物样品中预期分子的阈值百分比。
8.根据权利要求7所述的采集装置,其中指示样品洗脱效率的所述分子群体的洗脱指示所述生物样品中大多数预期分子的成功共洗脱。
9.根据权利要求1所述的采集装置,其中过滤器储存条件包括过滤器储存持续时间、温度暴露、光暴露、UV暴露、辐射暴露和湿度暴露中的至少一种。
10.根据权利要求9所述的采集装置,其中所述多个QC标志物包含在暴露于过滤器储存持续时间、温度暴露、光暴露、UV暴露、辐射暴露和湿度暴露中的至少一种之后展现出可观察信号的分子群体。
11.根据权利要求1所述的采集装置,其中所述多个QC标志物包含指示样品洗脱效率的标志物群体和指示过滤器储存条件的标志物群体。
12.根据权利要求1-11中任一项所述的采集装置,其中所述多个QC标志物包含选自洗脱标志物、湿度标志物、pH标志物、温度标志物、时间标志物、蛋白水解标志物、核酸酶标志物、稳定性标志物、辐射标志物、UV标志物和光标志物的至少一种标志物群体。
13.根据权利要求1-11中任一项所述的采集装置,其中所述多个QC标志物包含分子传感器群体。
14.根据权利要求13所述的采集装置,其中所述分子传感器群体具有非生物学结构。
15.根据权利要求13所述的采集装置,其中所述分子传感器群体包含有机染料、无机染料、荧光团、量子点、荧光蛋白、热敏蛋白和放射性标记物中的至少一种。
16.根据权利要求13所述的采集装置,其中所述分子传感器群体在检测到目标分子后产生可观察的信号,其中所述可观察的信号是可见颜色变化、UV信号、发光信号和荧光信号中的至少一种。
17.根据权利要求1-11中任一项所述的采集装置,其中所述采集装置包含具有参考分子群体的参考标志物,其中内源性分子选自多肽、脂质、碳水化合物、核酸和代谢物,使得所述参考标志物的定量与样品生物标志物的定量之间的比较有助于在分析之前确定所述样品中的样品生物标志物的量。
18.根据权利要求17所述的采集装置,其中所述参考群体包含相对于所述生物样品中的相应内源性多肽具有质量位移的参考多肽。
19.根据权利要求17所述的采集装置,其中所述参考分子用重同位素进行标记,所述重同位素在质谱分析中以相对于所述生物样品的内源性分子群体的可预测偏移进行迁移。
20.根据权利要求17所述的采集装置,其中所述参考分子是映射到所述蛋白质中的至少一个突变的多肽,其中所述至少一个突变选自点突变、插入、缺失、移码点突变、插入、缺失、移码突变、截短、融合和易位。
21.根据权利要求17所述的采集装置,其中所述参考分子包含第一突变参考多肽群体,所述第一突变参考多肽群体映射到所述蛋白质中具有与所述疾病有关的点突变的区域。
22.根据权利要求21所述的采集装置,其中所述参考分子包含第二野生型参考多肽群体,所述第二野生型参考多肽群体映射到所述蛋白质中没有点突变的区域。
23.根据权利要求1-11中任一项所述的采集装置,其中来自所述多个QC标志物的至少一个标志物群体被设置在所述采集背衬上用于样品沉积的区域之内,使得所述样品在所述采集背衬上的沉积将所述至少一个标志物群体引入所述群体中。
24.根据权利要求1-11中任一项所述的采集装置,其中来自所述多个QC标志物的至少一个标志物群体被设置在所述采集背衬上用于样品沉积的区域之外,使得所述样品在所述采集背衬上的沉积不将所述至少一个标志物群体引入所述群体中。
25.一种评估个体的疾病状态的方法,其包括:
a)针对从所述个体采集的样品,分析包含至少一个生物标志物的第一生物标志物小组,以检测至少一个疾病信号;
b)当检测到所述至少一个疾病信号时,选择第二生物标志物小组进行进一步分析;以及
c)分析所述第二生物标志物小组,以评估所述个体的疾病状态。
26.根据权利要求25所述的方法,其中分析生物标志物小组包括检测以下至少一项:与所述至少一种疾病相关的至少一个生物标志物的点突变、插入、缺失、移码点突变、截短、融合、易位、量、存在和不存在。
27.根据权利要求26所述的方法,其中检测截短包括检测截短的生物标志物的未缺失区域和缺失区域之间的共变的减少。
28.根据权利要求26所述的方法,其中检测融合包括检测已融合形成融合生物标志物的第一区域和第二区域之间的共变的增加。
29.根据权利要求26所述的方法,其中检测易位包括检测已融合形成易位生物标志物的第一生物标志物的区域和第二生物标志物的区域之间的共变的增加。
30.根据权利要求25-29中任一项所述的方法,其中在a)中分析所述第一生物标志物小组或在b)中分析所述第二生物标志物小组中的至少一项包括将所述生物样品中的内源性生物标志物与参考生物标志物进行比较,所述参考生物标志物映射到指示所述至少一个疾病信号或疾病状态的突变。
Applications Claiming Priority (5)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US201762554435P | 2017-09-05 | 2017-09-05 | |
US201762554433P | 2017-09-05 | 2017-09-05 | |
US62/554,433 | 2017-09-05 | ||
US62/554,435 | 2017-09-05 | ||
PCT/US2018/049583 WO2019050971A1 (en) | 2017-09-05 | 2018-09-05 | MARKER ANALYSIS FOR QUALITY CONTROL AND DISEASE DETECTION |
Publications (1)
Publication Number | Publication Date |
---|---|
CN111315487A true CN111315487A (zh) | 2020-06-19 |
Family
ID=63686109
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201880071683.6A Pending CN111315487A (zh) | 2017-09-05 | 2018-09-05 | 用于质量控制和疾病检测的标志物分析 |
Country Status (4)
Country | Link |
---|---|
US (1) | US20200188907A1 (zh) |
EP (1) | EP3678779A1 (zh) |
CN (1) | CN111315487A (zh) |
WO (1) | WO2019050971A1 (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112986588A (zh) * | 2021-04-21 | 2021-06-18 | 天津云检医疗器械有限公司 | 脂质标志物在制备结直肠癌检测试剂盒中的用途 |
CN116521969A (zh) * | 2023-02-28 | 2023-08-01 | 华为云计算技术有限公司 | 一种数据检索方法、服务端、系统及相关设备 |
Families Citing this family (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US11592448B2 (en) * | 2017-06-14 | 2023-02-28 | Discerndx, Inc. | Tandem identification engine |
CN111426778B (zh) * | 2020-04-30 | 2022-07-15 | 上海海关动植物与食品检验检疫技术中心 | 高分辨质谱技术结合模式识别的橄榄油等级快速鉴定方法 |
WO2023091455A1 (en) * | 2021-11-17 | 2023-05-25 | General Prognostics Inc. | Quality control of user-generated biological sample cards |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1934444A (zh) * | 2004-03-05 | 2007-03-21 | 艾格麦迪卡瑞士股份有限公司 | 用于确定生理液体中的分析物浓度的分析物测试系统 |
CN101675169A (zh) * | 2006-06-14 | 2010-03-17 | 阿耳特弥斯保健公司 | 使用样品拆分和dna标签进行稀有细胞分析 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2015179952A1 (en) * | 2014-05-26 | 2015-12-03 | Mcmaster University | A metabolite panel for improved screening and diagnostic testing of cystic fibrosis |
-
2018
- 2018-09-05 EP EP18779128.0A patent/EP3678779A1/en not_active Withdrawn
- 2018-09-05 US US16/644,098 patent/US20200188907A1/en not_active Abandoned
- 2018-09-05 WO PCT/US2018/049583 patent/WO2019050971A1/en unknown
- 2018-09-05 CN CN201880071683.6A patent/CN111315487A/zh active Pending
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1934444A (zh) * | 2004-03-05 | 2007-03-21 | 艾格麦迪卡瑞士股份有限公司 | 用于确定生理液体中的分析物浓度的分析物测试系统 |
CN101675169A (zh) * | 2006-06-14 | 2010-03-17 | 阿耳特弥斯保健公司 | 使用样品拆分和dna标签进行稀有细胞分析 |
Non-Patent Citations (3)
Title |
---|
B.W. ADAM等: ""The preparation and storage of dried-blood spot quality control materials for lysosomal storage disease screening tests"", 《CLINICAL BIOCHEMISTRY》 * |
REBECCA L. EDWARDS等: ""Top-Down Proteomics and Direct Surface Sampling of Neonatal Dried Blood Spots: Diagnosis of Unknown Hemoglobin Variants"", 《J. AM. SOC. MASS SPECTROM》 * |
ROSITA ZAKARIA等: ""Advantages and challenges of dried blood spot analysis by mass spectrometry across the total testing process"", 《THE JOURNAL OF INTERNATIONAL FEDERATION OF CLINICAL CHEMISTRY AND LABORATORY MEDICINE》 * |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112986588A (zh) * | 2021-04-21 | 2021-06-18 | 天津云检医疗器械有限公司 | 脂质标志物在制备结直肠癌检测试剂盒中的用途 |
CN116521969A (zh) * | 2023-02-28 | 2023-08-01 | 华为云计算技术有限公司 | 一种数据检索方法、服务端、系统及相关设备 |
CN116521969B (zh) * | 2023-02-28 | 2023-12-29 | 华为云计算技术有限公司 | 一种数据检索方法、服务端、系统及相关设备 |
Also Published As
Publication number | Publication date |
---|---|
WO2019050971A1 (en) | 2019-03-14 |
EP3678779A1 (en) | 2020-07-15 |
US20200188907A1 (en) | 2020-06-18 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US20190113520A1 (en) | Biomarker Database Generation and Use | |
CN111315487A (zh) | 用于质量控制和疾病检测的标志物分析 | |
Mischak et al. | Technical aspects and inter-laboratory variability in native peptide profiling: The CE–MS experience | |
KLUPCZY—SKA et al. | Metabolomics in medical sciences ń trends, challenges and perspectives | |
Bocato et al. | An overview of the current progress, challenges, and prospects of human biomonitoring and exposome studies | |
US20190130994A1 (en) | Mass Spectrometric Data Analysis Workflow | |
Poon | Opportunities and limitations of SELDI-TOF-MS in biomedical research: practical advices | |
CN111316106A (zh) | 自动化样品工作流程门控和数据分析 | |
ES2702123T3 (es) | Biomarcadores relacionados con la función renal y métodos para utilizarlos | |
US10060932B2 (en) | Biomarkers of autism spectrum disorder | |
Bowler et al. | New strategies and challenges in lung proteomics and metabolomics. An official American Thoracic Society workshop report | |
Jorge et al. | Statistical Model to Analyze Quantitative Proteomics Data Obtained by 18O/16O Labeling and Linear Ion Trap Mass Spectrometry: Application to the Study of Vascular Endothelial Growth Factor-induced Angiogenesis in Endothelial Cells* S | |
Ueda et al. | A comprehensive peptidome profiling technology for the identification of early detection biomarkers for lung adenocarcinoma | |
Qin et al. | SRM targeted proteomics in search for biomarkers of HCV‐induced progression of fibrosis to cirrhosis in HALT‐C patients | |
US20200386759A1 (en) | Robust panels of colorectal cancer biomarkers | |
Bringans et al. | Comprehensive mass spectrometry based biomarker discovery and validation platform as applied to diabetic kidney disease | |
Couchman et al. | LC-MS candidate reference methods for the harmonisation of parathyroid hormone (PTH) measurement: a review of recent developments and future considerations | |
Rindlisbacher et al. | Exhaled breath condensate as a potential biomarker tool for idiopathic pulmonary fibrosis—a pilot study | |
Duangkumpha et al. | Discovery and qualification of serum protein biomarker candidates for cholangiocarcinoma diagnosis | |
Moore et al. | Prospective on imaging mass spectrometry in clinical diagnostics | |
Jain et al. | Hemoglobin normalization outperforms other methods for standardizing dried blood spot metabolomics: A comparative study | |
Han et al. | Quantitative proteomic approaches in biomarker discovery of inflammatory bowel disease | |
WO2012122094A2 (en) | Biomarkers of cardiac ischemia | |
US20230178176A1 (en) | Direct classification of raw biomolecule measurement data | |
Watson et al. | Quantitative mass spectrometry analysis of cerebrospinal fluid biomarker proteins reveals stage-specific changes in Alzheimer’s disease |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
WD01 | Invention patent application deemed withdrawn after publication |
Application publication date: 20200619 |
|
WD01 | Invention patent application deemed withdrawn after publication |