CN115004023A

CN115004023A - 一种用于分析体液蛋白质组的方法

Info

Publication number: CN115004023A
Application number: CN202180009343.2A
Authority: CN
Inventors: 成晓亮; 周岳; 张伟; 郑可嘉
Original assignee: Nanjing Pinsheng Medical Technology Co ltd; Jiangsu Pinsheng Medical Technology Group Co ltd
Current assignee: Nanjing Pinsheng Medical Technology Co ltd; Jiangsu Pinsheng Medical Technology Group Co ltd
Priority date: 2021-11-09
Filing date: 2021-11-09
Publication date: 2022-09-02
Also published as: US20230258654A1; US12099066B2; WO2023082057A1

Abstract

一种用于分析体液蛋白质组的方法，该方法包括：采用亲和技术去除初始样品A中的高丰度蛋白，获得低丰度蛋白富集的待测样品I；采用化学沉淀法去除初始样品B中的高丰度蛋白，获得低丰度蛋白富集的待测样品II，其中初始样品A和初始样品B来自同一受试者的同一份体液样品；对待测样品I进行蛋白质组学分析，获得蛋白质组数据集I；对待测样品II进行蛋白质组学分析，获得蛋白质组数据集II；基于所述蛋白质组数据集I和所述蛋白质组数据集II，确定体液中最终定量的蛋白质组数据集。

Description

一种用于分析体液蛋白质组的方法

技术领域

本发明属于生化检测领域，特别涉及一种分析体液蛋白质组的方法。

背景技术

体液中的血浆和血清因其丰富且易于获取，通常用于临床诊断和预后分析。血浆蛋白质可以用作个体健康状况的指标和临床检测的生物标志物，越来越多的研究集中在血浆蛋白质上。血浆蛋白质组学可以高通量地对临床队列中的多种蛋白质进行鉴定和定量分析，是血浆蛋白质研究的强有力的工具。

临床研究中往往需要对成百上千数量的样品进行定量蛋白质组分析，同时为了开发更多的血浆生物标志物，还需要提高蛋白质组的覆盖度。但现有技术中的各种技术难点(例如无法有效率的去除会造成干扰的高丰度蛋白)，往往限制了样品分析通量。目前文献报道的血浆蛋白质组覆盖度为500-1000个蛋白，限制了血浆蛋白标志物的开发。因此，需要开放新的方法和系统，提高蛋白质组分析的通量和效率。

发明内容

在一些实施例中，用于分析体液蛋白质组的方法包括：

采用亲和技术去除初始样品A中的高丰度蛋白，获得低丰度蛋白富集的待测样品I；

采用化学沉淀法去除初始样品B中的高丰度蛋白，获得低丰度蛋白富集的待测样品II，其中所述初始样品A和所述初始样品B来自同一受试者的同一份体液样品；

对所述待测样品I采用经优化的数据非依赖性采集技术进行蛋白质组学分析，获得蛋白质组数据集I；

对所述待测样品II采用经优化的数据非依赖性采集技术进行蛋白质组学分析，获得蛋白质组数据集II；

基于所述蛋白质组数据集I和所述蛋白质组数据集II，确定所述体液样品最终定量的蛋白质组数据集。

附图说明

本说明书将以示例性实施例的方式进一步说明，这些示例性实施例结合附图进行详细描述。这些实施例并非限制性的，其中：

图1示出了根据本发明的一些实施例的用于分析体液蛋白质组的方法的流程图。

图2A-图2F示出了根据本发明的一些实施例的采用数据非依赖性采集(dataindependent acquisition，DIA)技术进行血浆蛋白质组分析的结果，其中，图2A和图2B分别为15cm、25cm和50cm色谱柱和90min的梯度条件下DIA鉴定的多肽数量和蛋白数量；图2C和图2D分别为25cm色谱柱和90min、120min和150min的梯度鉴定的多肽数量和蛋白数量；图2E和图2F分别为50cm色谱柱和90min、120min和150min的梯度鉴定的多肽数量和蛋白数量。

图3A-图3D示出了根据本发明的一些实施例的采用DIA技术进行血浆蛋白质组分析的结果，其中，图3A和图3B分别是40个、50个和60个隔离窗口下鉴定的多肽数量和蛋白数量；图3C和图3D分别是40个、50个和60个隔离窗口下鉴定的蛋白强度的变异系数(CV)分布和多肽强度的CV分布。

图4A和图4B示出了根据本发明的一些实施例的采用优化的DIA技术进行蛋白质组分析得到的多肽数量统计图(图4A)和蛋白数量统计图(图4B)；其中，undepleted代表采用未去除高丰度蛋白的原始血浆样品的酶切肽段；样品①代表采用肽段集合I；样品②代表采用肽段集合II。

图5A和图5B示出了根据本发明的一些实施例的采用优化的DIA技术进行蛋白质组分析得到的蛋白的韦恩图(图5A)和蛋白分子量的分布图(图5B)；其中，undepleted代表采用未去除高丰度蛋白的原始血浆样品的酶切肽段；样品①代表采用肽段集合I；样品②代表采用肽段集合II。

图6示出了根据本发明的一些实施例的采用优化的DIA技术进行蛋白质组分析得到的蛋白强度的变异系数分布图；其中，“样品①所有”代表采用肽段集合I-优化的DIA鉴定到的所有蛋白质的蛋白强度的变异系数分布；“样品②所有”代表采用肽段集合II-优化的DIA鉴定到的所有蛋白质的蛋白强度的变异系数分布；“样品①间”代表肽段集合I-优化的DIA与肽段集合II-优化的DIA共同鉴定到的蛋白质在肽段集合I-优化的DIA中的蛋白强度的变异系数分布；“样品②间”代表采用肽段集合I-优化的DIA与肽段集合II-优化的DIA共同鉴定到的蛋白质在采用肽段集合II-优化的DIA中的蛋白强度的变异系数分布；“样品②独有”代表采用肽段集合II-优化的DIA鉴定到的独有蛋白质的蛋白强度的变异系数分布；“样品①所有+样品②独有”代表采用肽段集合I-优化的DIA鉴定到的所有蛋白质加上采用肽段集合II-优化的DIA鉴定到的独有蛋白质的蛋白强度的变异系数分布。

图7A-图7C示出了根据本发明的一些实施例的用于分析体液蛋白质组的方法最终定量的蛋白质组数据集的覆盖度；其中，图7A示出了最终定量的蛋白质组数据集覆盖的FDA批准的生物标志物；图7B示出了最终定量的蛋白质组数据集覆盖的脑组织特异性蛋白质；图7C示出了最终定量的蛋白质组数据集覆盖的肝脏特异性蛋白质。

具体实施方式

血清、血浆、脑脊液等典型体液是基于质谱平台的蛋白质组学研究领域中的常用样本。这类样本含有种类丰富的蛋白质，其中高丰度蛋白(high-abundantproteins，HAP)比例达到97％～99％，包括白蛋白、IgG、IgA、纤维蛋白原、转铁蛋白、触珠蛋白、抗胰蛋白酶等。而低丰度蛋白(low-abundant proteins，LAP)才往往是疾病的特异性生物标记或者药物作用的靶蛋白分子。因此去除掉干扰检测的高丰度蛋白，尽可能富集更多低丰度蛋白，成为质谱鉴定数量多少的关键因素之一。

针对这一问题，目前常用的去除高丰度蛋白的方法有亲和技术、沉淀法、超滤离心法、金磁微粒法、等电捕获法、液相色谱法等。亲和技术是通过固定化的配基与靶蛋白质特异性亲和而达到将靶蛋白质从样品中分离或去除的目的。化学沉淀法是利用加入沉淀剂使蛋白质发生沉淀而去除样品中HAP，沉淀剂可以是有机溶剂，也可以是铵盐等物质。液相色谱法更多是用于蛋白质分离，常用的离子交换色谱法和尺寸排阻色谱法利用蛋白质分子尺寸大小和所带的电荷不同进行蛋白质去除。

数据非依赖性采集(data independent acquisition，DIA)技术是近年来发展起来的一种新的质谱技术，属于非标记蛋白质组学方法。采用数据非依赖性扫描模式：将质谱整个全扫描范围分为若干个窗口，然后对每个窗口中的所有离子进行检测、碎裂，从而无遗漏、无差异地获得样本中所有离子的信息。DIA技术可以降低样本检测的缺失值，同时提高定量准确性和重复性，实现大样本队列中高稳定、高精准的蛋白质组定量分析。DIA技术的上述优点，使它越来越多地应用于血浆蛋白质组学中。

本发明的目的之一是提供一种用于分析体液蛋白质组的方法。

在一些实施例中，如图1所示，用于分析体液蛋白质组的方法包括：

对所述待测样品I进行蛋白质组学分析，获得蛋白质组数据集I；对所述待测样品II进行蛋白质组学分析，获得蛋白质组数据集II；

在一些实施例中，对所述待测样品I进行蛋白质组学分析包括：使用DIA技术对所述待测样品I进行定量蛋白质组学分析。在一些实施例中，对所述待测样品II进行蛋白质组学分析包括：使用DIA技术对所述待测样品II进行定量蛋白质组学分析。

在一些实施例中，所述待测样品I经还原、烷基化、酶切和脱盐后，获得用于使用DIA技术进行蛋白质组学分析的肽段集合I。在一些实施例中，所述待测样品II经脱盐、还原、烷基化和酶切后，获得用于使用DIA技术进行蛋白质组学分析的肽段集合II。

在一些实施例中，所述DIA技术是经优化的DIA技术；所述经优化的DIA技术采用50cm的色谱柱长度和90min的色谱柱梯度。在一些实施例中，所述经优化的DIA技术采用50cm的色谱柱长度和150min的色谱柱梯度。在一些实施例中，所述经优化的DIA技术采用50cm的色谱柱长度和120min的色谱柱梯度。在一些实施例中，所述经优化的DIA技术中MS1分辨率设为60K，MS2分辨率设为30K，母离子扫描范围设为m/z 350-1200并分割为50个窗口。

在一些实施例中，所述采用亲和技术去除初始样品A中的高丰度蛋白包括：利用所述高丰度蛋白的抗体作为亲和配体去除所述高丰度蛋白。在一些实施例中，所述高丰度蛋白包括白蛋白、IgA、IgD、IgE、IgG、IgM、α1-酸性糖蛋白、α1-抗胰蛋白酶、α2-巨球蛋白、载脂蛋白A1、纤维蛋白原、触珠蛋白、转铁蛋白、补体C3、载脂蛋白A-II、α-2-HS-糖蛋白、载脂蛋白C-III、α-1-抗胰凝乳蛋白酶、维生素D结合蛋白、铜蓝蛋白、补体C4-A、补体C1q、血凝素、激肽原-1、突触结合蛋白5、富含组氨酸的糖蛋白、玻连蛋白、补体因子H、血浆蛋白酶C1抑制剂、C4b结合蛋白和纤连蛋白中的一种或多种。

在一些实施例中，所述高丰度蛋白的抗体被固定化至固相载体上。在一些实施例中，所述固相载体包括纤维素、聚丙稀酰胺、聚苯乙烯、聚乙烯、聚丙烯、交联葡聚糖、玻璃、硅橡胶、琼脂糖凝胶和凝胶树脂中的一种或多种。在一些实施例中，所述固相载体为凝胶树脂。在一些实施例中，通过固定化有多种高丰度蛋白的抗体的固相载体，一次能去除多种高丰度蛋白。在一些实施例中，通过固定化有31种高丰度蛋白的抗体的固相载体，一次能去除31种高丰度蛋白，不仅提高了效率还降低了成本。

在一些实施例中，所述采用亲和技术去除初始样品A中的高丰度蛋白在多腔体容器中进行。在一些实施例中，采用化学沉淀法去除初始样品B中的高丰度蛋白在多腔体容器中进行。在一些实施例中，所述多腔体容器为多孔板，例如96孔、48孔或24孔板。基于多孔板的去除高丰度蛋白的方法，一次可以处理多个样品，例如2×96个样品，从而提高了分析蛋白质组的通量。

在一些实施例中，所述体液包括血浆、血清、尿液、组织液、胸膜腔内液体、腹腔内的液体、脑脊液、精液和阴道液体中的一种或多种。

在一些实施例中，所述采用化学沉淀法去除初始样品B中的高丰度蛋白包括：利用有机溶剂作为沉淀剂使所述高丰度蛋白沉淀。在一些实施例中，所述有机溶剂包括甲醇、乙醇、异丙醇、乙腈、氯仿、三氯乙酸、三氟乙酸中的一种或多种。

在一些实施例中，所述采用化学沉淀法去除初始样品B中的高丰度蛋白还包括：在利用所述沉淀剂使所述高丰度蛋白沉淀之前，使用变性剂使所述高丰度蛋白质变性。在一些实施例中，所述变性剂包括盐酸胍、尿素中的一种或多种。

在一些实施例中，基于所述蛋白质组数据集I和所述蛋白质组数据集II，确定所述体液样品最终定量的蛋白质组数据集包括从所述蛋白质组数据集II中去除所述蛋白质组数据集II与所述蛋白质组数据集I重叠的数据，获得蛋白质组数据集III；以及将所述蛋白质组数据集I与所述蛋白质组数据集III作为所述体液样品中最终定量的蛋白质组数据集。在一些实施例中，从所述蛋白质组数据集II中去除所述蛋白质组数据集II与所述蛋白质组数据集I重叠的数据包括：通过韦恩图对所述蛋白质组数据集I与所述蛋白质组数据集II进行比较，从所述蛋白质组数据集II中去除所述蛋白质组数据集II与所述蛋白质组数据集I重叠的数据，获得蛋白质组数据集III。在一些实施例中，所述蛋白质组数据集II与所述蛋白质组数据集I重叠的数据是所述蛋白质组数据集II与所述蛋白质组数据集I蛋白质重叠的数据。

在一些实施例中，本发明所涉及的方法只被用于非诊断类的应用。

在一些实施例中，所述受试者包括人和非人哺乳动物中的至少之一。

在一些实施例中提供的用于分析体液蛋白质组的方法，具有很好的重现性并且具有较高的血浆蛋白质组的覆盖度，其定量到了一千七百种以上的蛋白。

实施例

血浆收集

收集健康受试者血样，柠檬酸盐/血液混合物(1：9，v/v)在10℃下离心(3000rpm)10min，储存在-80℃备用。

基于抗体亲和去除高丰度蛋白

(1)制备凝胶树脂

将150mg干燥Pierce^TM NHS-Activated凝胶树脂(购自美国赛默飞公司)置于空离心柱中，向离心柱中加入抗体含量为1mg/mL的如下蛋白的抗体的溶液各2mL：白蛋白、IgA、IgD、IgE、IgG、IgM、α1-酸性糖蛋白、α1-抗胰蛋白酶、α2-巨球蛋白、载脂蛋白A1、纤维蛋白原、触珠蛋白、转铁蛋白、补体C3、载脂蛋白A-II、α-2-HS-糖蛋白、载脂蛋白C-III、α-1-抗胰凝乳蛋白酶、维生素D结合蛋白、铜蓝蛋白、补体C4-A、补体C1q、血凝素、激肽原-1、突触结合蛋白5、富含组氨酸的糖蛋白、玻连蛋白、补体因子H、血浆蛋白酶C1抑制剂、C4b结合蛋白和纤连蛋白；颠倒混合反应2小时；将离心柱放入收集管中以1000g离心1min；加入pH 7.2的2mL 0.1M磷酸钠和0.15M NaCl的混合液至离心柱中；1000g离心1min，重复一次；加入pH7.4的终止缓冲液1mL 1M Tris，室温颠倒混合15-20min；1000g离心1min；加入pH 7.2的2mL0.1M磷酸钠、0.15M NaCl的混合液至离心柱中；1000g离心1min；加入pH 7.2的500μL 0.1M磷酸钠、0.15M NaCl、0.05wt％叠氮化钠的混合液保存凝胶树脂。

(2)去除血浆高丰度蛋白

混匀制备好的凝胶树脂，分别取40μL加入至0.45μm的96孔板的各孔中；每孔加入6μL稀释6倍的血浆样本；震荡孵育30min；4000g离心2min，收集各孔的洗脱液。

(3)制备用于DIA的肽段集合I

向各孔的洗脱液中加入70μl含有1wt％SDC、100mM Tris-HCl，pH 8.5的蛋白裂解液；加入2μl 0.5M三(2-羧乙基)膦(TCEP)和8μL 0.5M三氯乙酸(TCA)溶液，70℃反应10min；冷却至室温；然后加入1μg Lys C/Trypsin混合酶试剂，37℃反应2小时，获得酶切溶液。向各孔的酶切溶液中加入100μL异丙醇(IPA)的1％三氟乙酸(TFA)溶液，用于SCX脱盐。96孔SCX固相萃取板的各孔中加入200μl酶切溶液，1000g，离心2min；加入400μL IPA的1％TFA溶液进行淋洗，1000g离心2min，弃去淋洗液；加入400μL 0.2％TFA，1000g离心2min进行淋洗，弃去淋洗液；加入200μL 1％氨与80％乙腈(ACN)的混合液，1000g离心2min，收集各孔的洗脱液。洗脱液在冷冻浓缩仪中浓缩抽干，加入20μL 0.1％甲酸(FA)溶液重溶，得到用于DIA的肽段集合I。

化学沉淀法去除高丰度蛋白

(1)去除血浆高丰度蛋白

分别取50μL血浆与50μL裂解液(8M尿素，100mM Tris，pH8.0)加入到96孔板的各孔中，室温孵育5min；加入100μl 20％TCA溶液，4℃，1500RPM震荡放置60min沉淀蛋白；4000g离心，取各孔中150μl上清液。

(2)制备用于DIA的肽段集合II

将上清液加入96孔HLB固相萃取板各孔中，1000g，离心2min，弃上清液；向各孔中加入400μl 0.2％TFA溶液，1000g离心2min，弃上清液；向各孔中加入400μL 0.2％TFA与80％ACN溶液的混合液，1000g离心2min收集洗脱液。洗脱液在冷冻浓缩仪中浓缩抽干，加入100μL 50mM NH₄CO₃复溶；加入2μl 0.5M TCEP，8μl 0.5M TCA，70℃，反应10min；加入1μgLys C/Trypsin混合酶试剂，37℃反应2小时。酶切液在冷冻浓缩仪中浓缩抽干，加入20μL0.1％FA溶液重溶，得到用于DIA的肽段集合II。

DIA技术

DIA是在一级质谱高分辨全扫描后，将特定质荷比(m/z)范围的多肽母离子全部无区别地进行MS/MS碎裂。在DIA数据采集中，高分辨MS2谱图用于肽段的鉴定，高分辨的MS1和MS2都可以用来进行多肽/蛋白定量。一般需要考虑以下仪器参数：(i)DIA隔离窗口的数量以及每个隔离窗口的大小。DIA在给定母离子隔离窗口内将所有的母离子进行共隔离和共碎裂，因此，隔离窗口的大小直接影响DIA分析的选择性、动态范围和灵敏度。使用宽的隔离窗口可以提高二级谱图的累计时间，提高分析的灵敏度，用于非常低丰度样品的分析；使用窄的隔离窗口可减少共碎裂的母离子数量，降低干扰，用于复杂程度较高的样品；(ii)DIA循环时间和色谱峰宽。循环时间在DIA中，对应于为MS1和MS2扫描时间之和。通过平均的色谱峰宽之和进行精确的定量分析需要平均7-10个采集的数据点拟合提取离子流色谱图，计算出最佳的DIA循环时间。例如在平均峰宽为30s，循环时间可以设置为3-4s。在DIA数据分析中，需要建立DIA定量的谱图库，谱图库中包含了蛋白质及其肽段的信息，例如保留时间、母离子m/z、碎片离子m/z、碎片离子相对丰度等信息。依据谱图库中的肽段信息对DIA数据进行峰抽提，以碎片离子峰面积的加和表征多肽的强度。

为了获得蛋白质组深度和通量之间的良好平衡以及蛋白质定性性能和定量性能之间的平衡，对DIA技术的参数进行优化。采用未去除高丰度蛋白的原始血浆样品的酶切肽段(undepleted)作为用于DIA技术优化过程中的样品。

在DIA技术的纳升色谱中，色谱柱长度和梯度长度会影响峰容量，从而影响单针DIA的蛋白质组深度。如图2A、图2B所示，图2A和图2B分别为15cm、25cm和50cm色谱柱和90min的梯度条件下DIA鉴定的多肽数量和蛋白数量，其中，多肽和蛋白的鉴定数量在色谱柱长度为50cm时最多，此时具有最小的峰宽和最大的峰容量。如图2C、图2D所示，图2C和图2D分别为25cm色谱柱和90min、120min和150min的梯度鉴定的多肽数量和蛋白数量，使用150min梯度与使用120min或90min梯度时鉴定到的多肽和蛋白数量相当，为了使检测通量更大，选用90min梯度进行血浆蛋白质组分析。如图2E、图2F所示，图2E和图2F分别为50cm色谱柱和90min、120min和150min的梯度鉴定的多肽数量和蛋白数量。据此，50cm色谱柱和90min梯度对于血浆蛋白质组学是最佳组合，在蛋白质组深度和通量之间呈现出良好的平衡。

在DIA技术的质谱中，较窄的DIA隔离窗口可提高灵敏度，但是延长了循环时间(cycle time)会导致更少的峰点和较差的定量重现性；相反，较宽的隔离窗口缩短了循环时间会导致更多的峰点数，获得更好的重现性，但是会降低灵敏度，因此合适的DIA隔离窗口数量使得定性性能和定量性能达到平衡。将MS1分辨率固定设为60K、MS2分辨率设为30K，将母离子扫描范围设为m/z 350-1200。鉴于优化的纳升色谱的平均峰宽为0.21min(色谱柱为50cm与梯度为90min的组合)，将一个DIA循环时间的DIA窗口数量设置为40、50或60。如图3A-D所示，使用40个DIA隔离窗口且循环时间最短的DIA方法给出的多肽和蛋白鉴定数量最少，但定量重现性最佳；使用具有最长循环时间的60个DIA隔离窗口的方法给出的多肽和蛋白鉴定数量最多，但定量重现性最差。因此，使用50个DIA隔离窗口的方法在蛋白鉴定数量和定量重现性上达到平衡。

肽段集合I和肽段集合II采用优化的DIA技术进行质谱分析，分别得到蛋白质组数据集I和蛋白质组数据集II。

DIA色谱：4μL重溶的肽段上样到纳升色谱柱上，内径为75μm，长度50cm，填料为1.9μm Reprosil-Pur C18。Ultimate 3000RSLC nano流动相A是0.1％甲酸/H₂O，流动相B是80％ACN/0.1％甲酸。梯度为0-4min，3-6％B；4-83min，6-30％B；83-87min，30％-90％；87-90min，90％-90％；总梯度90min。调整6-30％B段的时间，设置总梯度为120min或者150min。

DIA质谱采集通过Orbitrap系列质谱完成。每个质谱循环时间内包含一个完整的全扫描MS(R 60,000@m/z 200、AGC为2e5、最大离子注入时间为20ms以及质量范围350-1,200)和50个DIA扫描(R 30,000@m/z 200、AGC为5E5、最大离子注入时间为55ms、归一化能量NCE为32以及质量范围200-2,000)，循环时间为3.4s。

深度覆盖血浆谱图库的建立：用50μL 10mM NH₃·H₂O分别溶解200μg肽段集合I和肽段集合II，然后分别使用Ultimate 3000HPLC，以100μL/min的流速上样到XbridgeBEH300 C18柱上并进行色谱分离。缓冲液A为10mM NH₃·H₂O；缓冲液B为90％ACN的10mMNH₃·H₂O。梯度为0-4min，2-2％B；4-50min，2-30％B；50-58min，30％-90％B；58-60min，90％-90％B；60-65min，2％-2％B。以1min的间隔手动收集4-58min的馏分。在真空冷冻浓缩仪中冻干，溶解于10μL 0.1％FA中以进行LC-MS/MS分析。将5μL多肽上样到实验室自制色谱柱上，内径为75μm，长度30cm，填料为3μm Reprosil-Pur C18。流动相A是0.1％甲酸/H₂O，流动相B是80％ACN/0.1％甲酸。梯度为0-4min，3-6％B；4-83min，6-30％B；83-87min，30％-90％；87-90min，90％-90％；总梯度90min。使用Orbitrap Fusion Lumos Tribrid MS的数据依赖扫描模式DDA采集质谱数据，其参数如下：喷雾电压2kV；S-lens RF为30；毛细管温度为300℃；全扫描分辨率为60 000@m/z 200和自动增益控制AGC为4e5，最大离子注入时间为30ms；质量范围350-1500；扫描分辨率为15000@m/z 200；二级扫描的最长离子注入时间为30ms和AGC为5e4；二级扫描的起始m/z 110；HCD碎裂归一化碰撞能量NCE为30；MIPS为“肽”；选择电荷数为2-7的母离子进行二级质谱采集；动态排除时间为40s；DDA循环时间为3s。使用MaxQuant软件包(V.1.5.6.0)进行DDA数据库检索，蛋白质和多肽的FDR设置为1％。对于多肽鉴定，需要最小长度的6个氨基酸和最大质量为10 000Da；Andromeda搜索引擎进行检索；数据库为Swiss-Prot人类数据库(V.201502；20,534个蛋白质序列)和262种常见污染蛋白序列；酶特异性设置为精氨酸和赖氨酸的C末端酶切，最多2个漏切位点；Carbamidomethylation(C)设置为固定修饰，oxidation(M)设定为可变修饰；启用了“matchbetween run(MBR)”和“second peptide”功能。将MaxQuant的DDA结果导入到Biognosys公司Spectronaut V13，对于每个母离子，选择最少3个和最多6个碎片离子；m/z设置为350-1800。

分别分析肽段集合I和肽段集合II构建的深度覆盖血浆谱图，其中包含了蛋白质及其多肽的信息，例如保留时间、母离子质核比、碎片离子质核比、碎片离子相对丰度等。

表1.肽段集合I和肽段集合II的血浆蛋白质组谱图库

样品	母离子数量	多肽	蛋白质
				肽段集合I	77,840	52,986	5,106
肽段集合II	19,436	15,708	1,325

肽段集合I和肽段集合II的DIA数据用Biognosys公司Spectronaut V13进行目标峰的抽提，分别使用肽段集合I和肽段集合II构建的深度覆盖的血浆蛋白质组谱图库，设置Carbamidomethylation为固定修饰，蛋氨酸Oxidation为可变修饰，采用Trypsin进行酶切并允许最多2个漏切位点，控制多肽和蛋白质水平的FDR为1％。取强度最高的3个多肽的平均值以计算蛋白强度。

数据分析

1)鉴定结果比较

比较采用肽段集合I-优化的DIA的结果(蛋白质组数据集I)、肽段集合II-优化的DIA的结果(蛋白质组数据集II)以及undepleted-优化的DIA的结果(三次重复)鉴定到的多肽和蛋白数量。

鉴定结果如图4A和图4B所示，蛋白质组数据集I鉴定到了最多的多肽数量和蛋白数量，每个重复平均鉴定到14,000条多肽和1,400个蛋白。蛋白质组数据集II鉴定到700条多肽和770个蛋白。Undepleted-优化的DIA的结果鉴定到7700条多肽和740个蛋白。

如图5A所示，蛋白质组数据集I和蛋白质组数据集II基本上包含了undepleted-优化的DIA的结果中的所有蛋白质，表明亲和技术去除法和化学沉淀法去除法有很强的互补性，因此考虑方法的简便性以及分析的通量，在后续的分析中舍弃undepleted-优化的DIA的结果。如图5B所示，化学沉淀法(蛋白质组数据集II)覆盖了很多1-20kD之间的低分子量的蛋白质，进一步显示出亲和技术去除法和化学沉淀去除法的互补性。

2)高丰度蛋白去除定量重现性和蛋白质组覆盖度分析

去除高丰度蛋白的重现性是评价本申请的用于分析体液蛋白质组的方法用于血浆蛋白质组深度覆盖可行性的重要因素。进行5次技术重复，考察本申请的用于分析体液蛋白质组的方法的重现性。

如图6所示，进行5次技术重复，蛋白质组数据集I中定量到了1,510个蛋白，定量蛋白强度RSD的中位数为13％，显示出亲和技术去除法具有很好的重现性。蛋白质组数据集II中定量到了802个蛋白，定量蛋白强度的RSD的中位数为20％，显示出化学沉淀去除法也具有较好的定量重现性。蛋白质组数据集I中独有地定量到了992个蛋白，这些蛋白只能归于亲和技术去除法；蛋白质组数据集II中独有地定量到了284个蛋白，这些蛋白只能归于化学沉淀去除法。

接着比较蛋白质组数据集I和蛋白质组数据集II中共同定量到的518个蛋白的重现性，其在亲和技术去除法中的重现性较在化学沉淀去除法中好，因此将这518个蛋白归在蛋白质组数据集I中定量。

因此，将蛋白质组数据集I中定量到的所有蛋白质的数据集与蛋白质组数据集II中独有地定量到的蛋白质的数据集的合集作为本申请的用于分析体液蛋白质组的方法获得的最终定量的蛋白质组数据集。该数据集一共含有1,794个蛋白，其蛋白强度的RSD中位数为14％，显示出本申请的用于分析体液蛋白质组的方法具有很好的重现性。

3)对最终定量的蛋白质组数据集进行覆盖度分析。

定量到的1794个蛋白实现了血浆蛋白质组的深度覆盖。这1794个蛋白横跨8个数量级的动态范围，包含了很多临床意义的蛋白：覆盖了FDA已经批准的222个生物标志物中的114个(FDA批准的生物标志物下载于http://mrmassaydb.proteincentre.com/)(图7A，表2)；16个蛋白为Human Tissue Proteome Atlas中的脑组织特异性蛋白(https://www.proteinatlas.org/humanproteome/tissue)(图7B，表3)；124个蛋白为Human TissueProteome Atlas中的肝组织特异性蛋白(https://www.proteinatlas.org/humanproteome/tissue)(图7C，表4)。

表2体液中最终定量蛋白质组数据集覆盖FDA已经批准的生物标志物

表3体液中最终定量蛋白质组数据集覆盖Human Tissue Proteome Atlas中的脑组织特异性蛋白

表4体液中最终定量蛋白质组数据集覆盖Human Tissue Proteome Atlas中的肝组织特异性蛋白

上文已对基本概念做了描述，显然，对于本领域技术人员来说，上述详细披露仅仅作为示例，而并不构成对本说明书的限定。虽然此处并没有明确说明，本领域技术人员可能会对本说明书进行各种修改、改进和修正。该类修改、改进和修正在本说明书中被建议，所以该类修改、改进、修正仍属于本说明书示范实施例的精神和范围。

针对本说明书引用的每个专利、专利申请、专利申请公开物和其他材料，如文章、书籍、说明书、出版物、文档等，特此将其全部内容并入本说明书作为参考。与本说明书内容不一致或产生冲突的申请历史文件除外，对本说明书权利要求最广范围有限制的文件(当前或之后附加于本说明书中的)也除外。需要说明的是，如果本说明书附属材料中的描述、定义、和/或术语的使用与本说明书所述内容有不一致或冲突的地方，以本说明书的描述、定义和/或术语的使用为准。

最后，应当理解的是，本说明书中所述实施例仅用以说明本说明书实施例的原则。其他的变形也可能属于本说明书的范围。因此，作为示例而非限制，本说明书实施例的替代配置可视为与本说明书的教导一致。相应地，本说明书的实施例不仅限于本说明书明确介绍和描述的实施例。

Claims

1.一种用于分析体液蛋白质组的方法，包括：

对所述待测样品I进行蛋白质组学分析，获得蛋白质组数据集I；

对所述待测样品II进行蛋白质组学分析，获得蛋白质组数据集II；

2.根据权利要求1所述的方法，其中，对所述待测样品I进行蛋白质组学分析包括：使用数据非依赖性采集技术对所述待测样品I进行定量蛋白质组学分析。

3.根据权利要求1所述的方法，其中，对所述待测样品II进行蛋白质组学分析包括：使用数据非依赖性采集技术对所述待测样品II进行定量蛋白质组学分析。

4.根据权利要求1所述的方法，其中，所述体液包括血浆、血清、尿液、组织液、胸膜腔内液体、腹腔内的液体、脑脊液、精液和阴道液体中的一种或多种。

5.根据权利要求1所述的方法，其中，所述采用亲和技术去除初始样品A中的高丰度蛋白包括：利用所述高丰度蛋白的抗体作为亲和配体去除所述高丰度蛋白。

6.根据权利要求1-5中任一项所述的方法，其中，所述高丰度蛋白包括白蛋白、IgA、IgD、IgE、IgG、IgM、α1-酸性糖蛋白、α1-抗胰蛋白酶、α2-巨球蛋白、载脂蛋白A1、纤维蛋白原、触珠蛋白、转铁蛋白、补体C3、载脂蛋白A-II、α-2-HS-糖蛋白、载脂蛋白C-III、α-1-抗胰凝乳蛋白酶、维生素D结合蛋白、铜蓝蛋白、补体C4-A、补体C1q、血凝素、激肽原-1、突触结合蛋白5、富含组氨酸的糖蛋白、玻连蛋白、补体因子H、血浆蛋白酶C1抑制剂、C4b结合蛋白、纤连蛋白中的一种或多种。

7.根据权利要求5所述的方法，其中，所述高丰度蛋白的抗体被固定化至固相载体上。

8.根据权利要求7所述的方法，其中，所述固相载体包括纤维素、聚丙稀酰胺、聚苯乙烯、聚乙烯、聚丙烯、交联葡聚糖、玻璃、硅橡胶、琼脂糖凝胶和凝胶树脂中的一种或多种。

9.根据权利要求1-5中任一项所述的方法，其中，所述采用亲和技术去除初始样品A中的高丰度蛋白和/或所述采用化学沉淀法去除初始样品B中的高丰度蛋白在多腔体容器中进行。

10.根据权利要求1所述的方法，其中，所述采用化学沉淀法去除初始样品B中的高丰度蛋白包括：利用有机溶剂作为沉淀剂使所述高丰度蛋白沉淀。

11.根据权利要求10所述的方法，其中，所述有机溶剂包括甲醇、乙醇、异丙醇、乙腈、氯仿、三氯乙酸、三氟乙酸中的一种或多种。

12.根据权利要求10所述的方法，其中，所述采用化学沉淀法去除初始样品B中的高丰度蛋白还包括：在利用所述沉淀剂使所述高丰度蛋白沉淀之前，使用变性剂使所述高丰度蛋白质变性。

13.根据权利要求12所述的方法，其中，所述变性剂包括盐酸胍、尿素中的一种或多种。

14.根据权利要求2所述的方法，其中，所述待测样品I经还原、烷基化、酶切和脱盐后，获得用于使用数据非依赖性采集技术进行蛋白质组学分析的肽段集合I。

15.根据权利要求2所述的方法，其中，所述待测样品II经脱盐、还原、烷基化和酶切后，获得用于使用数据非依赖性采集技术进行蛋白质组学分析的肽段集合II。

16.根据权利要求2所述的方法，其中，所述数据非依赖性采集技术是经优化的数据非依赖性采集技术；所述经优化的数据非依赖性采集技术采用50cm的色谱柱长度和90min的色谱柱梯度。

17.根据权利要求16所述的方法，其中，所述经优化的数据非依赖性采集技术中MS1分辨率设为60K，MS2分辨率设为30K，母离子扫描范围设为m/z350-1200并分割为50个窗口。

18.根据权利要求1所述的方法，其中，基于所述蛋白质组数据集I和所述蛋白质组数据集II，确定所述体液样品最终定量的蛋白质组数据集包括从所述蛋白质组数据集II中去除所述蛋白质组数据集II与所述蛋白质组数据集I重叠的数据，获得蛋白质组数据集III；以及将所述蛋白质组数据集I与所述蛋白质组数据集III作为所述体液样品中最终定量的蛋白质组数据集。

19.根据权利要求18所述的方法，其中，从所述蛋白质组数据集II中去除所述蛋白质组数据集II与所述蛋白质组数据集I重叠的数据包括：通过韦恩图对所述蛋白质组数据集I与所述蛋白质组数据集II进行比较，从所述蛋白质组数据集II中去除所述蛋白质组数据集II与所述蛋白质组数据集I重叠的数据，获得蛋白质组数据集III。

20.根据权利要求18所述的方法，其中，所述蛋白质组数据集II与所述蛋白质组数据集I重叠的数据是所述蛋白质组数据集II与所述蛋白质组数据集I蛋白质重叠的数据。

21.根据权利要求1所述的方法，其中，所述受试者包括人和非人哺乳动物中的至少之一。