WO2024082581A1

WO2024082581A1 - 一种m蛋白检测的方法

Info

Publication number: WO2024082581A1
Application number: PCT/CN2023/087606
Authority: WO
Inventors: 周宏伟; 曾念宜; 黄均达; 方臻成; 陈慕璇
Original assignee: 南方医科大学珠江医院
Priority date: 2022-10-21
Filing date: 2023-04-11
Publication date: 2024-04-25
Also published as: CN115684606B; CN115684606A

Abstract

本发明涉及生物医学领域，特别是涉及一种M蛋白检测的方法，所述方法包括：1)提供待测样本中免疫球蛋白轻链单电荷离子的m/z分布数据，所述轻链包括λ轻链和κ轻链；2)结果判定：若轻链m/z范围内具有基底窄、峰高且尖锐的质谱峰，则判定待测样本中含有M蛋白，或，若κ轻链：λ轻链的峰面积比值小于1.8或大于3.5，且峰形为非高斯分布，则判定待测样本中含有M蛋白。

Description

一种M蛋白检测的方法

技术领域

本发明涉及生物医学领域，特别是涉及一种M蛋白检测的方法。

背景技术

单克隆性丙种球蛋白病(MG)是一种以浆细胞克隆性扩增为特征的疾病，被分类为低肿瘤负荷疾病、癌前病变和恶性肿瘤等阶段。低肿瘤负荷疾病没有大量的浆细胞克隆增殖，但分泌的单克隆蛋白会直接引起病变，如免疫球蛋白轻链淀粉样变性；癌前病变包括意义未明的单克隆丙种球蛋白病(MGUS)和冒烟型多发性骨髓瘤(SMM)，它们不表现出可归因于浆细胞克隆或单克隆蛋白的相关器官以及组织的损害等症状。多发性骨髓瘤(MM)是MG中最常见的恶性肿瘤疾病之一，是一种好发于中老年人的恶性血液肿瘤，其特征是单克隆浆细胞恶性增殖并分泌大量单克隆蛋白(M蛋白)。M蛋白是一种与MG患者的克隆性浆细胞负荷直接相关的血清生物标志，可以作为作识别疾病的诊断标志物和跟踪疾病进展和对治疗的反应的定量标志物。M蛋白的识别、分型和定量有助于疾病的初步诊断、风险分层和监测对治疗的反应等。

正常人的免疫球蛋白(Immunoglobulin，Ig)由两条相同的轻链及两条相同的重链组成。两条相同的轻链即为κ或λ，不存在Ig同时结合κ和λ两种轻链。骨髓瘤患者体内的单克隆免疫球蛋白轻链会抑制另一种轻链的生成，从而使κ/λ比值失去平衡，比值的升高或降低分别提示患κ或λ型多发性骨髓瘤的可能。若患者血清中出现大量M蛋白，血清Ig成分发生变化，如不同Ig同种型的相对含量、轻链κ/λ比值等。κ/λ比值的失衡是区分M M浆细胞单克隆性增生与其他疾病的重要指标。大多数新诊断的多发性骨髓瘤患者，其M蛋白浓度很高，但在治疗后不久，M蛋白浓度发生显著变化，通常在几个月内下降几个数量级，提示恶性克隆浆细胞逐渐被消除。目前血清蛋白质电泳(PEL)、免疫固定电泳(IFE)和血清游离轻链比浊法(sFLC)可用于检测、监测和量化M蛋白。但血清蛋白电泳主要筛查是否有M蛋白；免疫固定电泳主要对M蛋白分型，PEL的检测灵敏度不高，IFE是低通量电泳技术，且都无法检测低水平的M蛋白，在有效治疗后监测多发性骨髓瘤疾病活动时很快就无法检测到，显然这些方法不能用于早期发现疾病复发，导致漏诊率高。此外，对实验结果的解读需要有经验的实验室工作人员，因此存在不同人员解读的差异，导致电泳结果评判标准在不同实验室不同工作人员解读中存在不一致现象，因此在筛查方法标准化方面很难做到统一。高通量的比浊法是目前认为分析敏感最高的一种间接证明M蛋白存在的测量方法，但并非所有多发性骨髓瘤患者诊断时sFLC比率异常。而且，血清游离轻链比浊法(sFLC)存在抗原过量、非线性反应和抗体试剂成本高等问题，导致sFLC仍无法在大量临床实验室开展。随着多发性骨髓瘤患者对新化疗和免疫疗法的治疗反应的显著改善，大多数多发性骨髓瘤患者现在可以实现持久缓解，常规用于M蛋白诊断的传统电泳方法将面临着新的挑战。因此，能够检测低水平M蛋白的高灵敏度方法对于提供评估微小残留疾病(MRD)很重要。质谱法是一种在研方法，使用高分辨率分子量检测来准确鉴定血清中的M蛋白，并对其进行分类。在美国梅奥医学中心，MALDI-TOF质谱法已取代免疫固定电泳来鉴定M蛋白。但目前在研的质谱法需要使用抗体进行捕获，导致检测成本较高。

发明内容

鉴于以上所述现有技术的缺点，本发明的目的在于提供一种M蛋白检测的方法，用于解决现有技术中的问题。

为实现上述目的及其他相关目的，本发明提供一种M蛋白检测的方法，所述方法包括如下步骤：

1)提供待测样本中免疫球蛋白轻链和重链单电荷离子的m/z分布数据，所述轻链包括λ轻链和κ轻链；

2)结果判定：若轻链m/z范围内具有基底窄、峰高且尖锐的质谱峰，则判定待测样本中含有M蛋白；或，若κ轻链：λ轻链的峰面积比小于1.8或大于3.5，且峰形为非高斯分布，则判定待测样本中含有M蛋白；所述轻链m/z范围内具有基底窄、峰高且尖锐的质谱峰，或κ轻链：λ轻链的峰面积比值小于1.8或大于3.5，且峰形为非高斯分布的轻链峰为M蛋白轻链峰。

本发明还提供一种M蛋白检测的装置，所述装置包括：

信息获取模块：用于获取待测样本中免疫球蛋白轻链和重链单电荷离子的m/z分布数据，所述轻链包括λ轻链和κ轻链；

峰形识别模块：用于分析κ轻链：λ轻链的峰面积以及峰形是否为非高斯分布；

结果判定模块：用于按照以下情况输出结果：

若κ轻链：λ轻链的峰面积比值小于1.8，且单电荷离子的m/z在22400～23100Da内含有非高斯分布的峰形，则判定待测样本中含有λ轻链型M蛋白；

若κ轻链：λ轻链的峰面积比值大于3.5，且单电荷离子的m/z在23100～24600Da内含有非高斯分布的峰形，则判定待测样本中含有κ轻链型M蛋白；

若κ轻链：λ轻链的峰面积比值≥1.8或≤3.5，且峰形为高斯分布，则判定待测样本中不含有M蛋白。

如上所述，本发明的M蛋白检测的方法，具有以下有益效果：

基于MALDI-TOF MS对κ/λ轻链比率作了系统性的评估，可以检测到轻链比值。基于M蛋白的独特分子量和高丰度的特性，当患者的轻链区出现κ或λ型M蛋白峰和(或)κ/λ比值异常，表明存在M蛋白。相比于SPE或IFE，MALDI-TOF MS能在患者治疗过程中以非常灵敏和特异的方式对低水平M蛋白进行跟踪，能为诊断疾病和监测患者对治疗的反应提供更加精准的检测。同时，与目前在研的质谱法相比，本专利无需富集血清中的免疫球蛋白，没有使用抗体进行捕获，仅通过成本极低的还原剂二硫苏糖醇(DTT)还原血清中的M蛋白，即可将轻链与重链分开，因此，从耗材的角度来看，与现有方法相比，本专利方法能为M蛋白的检测提供了更经济的解决方案；而且该方法操作简单、可自动化、分析灵敏度高，不仅能快速客观判定M蛋白，大大避免了人工目测分析的主观误差。本发明能够分析临床上遇到的各种类型的M蛋白，可以改进多发性骨髓瘤的筛查、诊断和监测方式。

附图说明

图1显示为验证峰形识别工具的结果。

图2显示为本发明的检测流程和原理示意图。

图3显示为来自60名健康人作为正常对照的质谱叠加图。

图4显示为正常对照(左)和多发性骨髓瘤患者(右)还原前与还原后的血清指纹图谱比较。

图5显示为标准球蛋白(左)和多发性骨髓瘤患者(右)血清的指纹图谱比较(还原后)。

图6显示60名健康体检者κ轻链：λ轻链的峰面积比值分布图。

图7显示为峰形识别工具以垂直切线的方式高亮M蛋白所在的区域。

图8显示为MALDI-TOF MS与IFE分析敏感度比较。

图9显示为MALDI-TOF MS与SPE方法线性比较。

图10显示为MALDI-TOF MS对M蛋白轻链分析的流程，图中右侧三个质谱图上横坐标数量级均为10⁴，纵坐标数量级均为10^-3。

图11显示为本发明M蛋白定性、定量和分型装置的示意图。

图12显示为本发明服务终端的示意图。

具体实施方式

本发明基于MALDI-TOF MS对还原后的球蛋白(Ig)进行检测，所设计的方法学原理(即通过计算两种轻链区质谱峰峰面积比，建立正常样本与M蛋白阳性样本及其分型的阈值)能量化κ/λ轻链比值。通过该方法能实现对M蛋白的识别。

本发明提供一种M蛋白检测的方法，所述方法包括如下步骤：

1)提供待测样本中免疫球蛋白轻链单电荷离子的m/z分布数据，所述轻链包括λ轻链和κ轻链；

2)结果判定：

若轻链m/z范围内具有基底窄、峰高且尖锐的质谱峰，则判定待测样本中含有M蛋白；或，若κ轻链：λ轻链的峰面积比值小于1.8或大于3.5，且峰形为非高斯分布，则判定待测样本中含有M蛋白；所述轻链m/z范围内具有基底窄、峰高且尖锐的质谱峰，或κ轻链：λ轻链的峰面积比值小于1.8或大于3.5，且峰形为非高斯分布的轻链峰为M蛋白轻链峰；

若比值≥1.8或≤3.5，且峰形为高斯分布，则判定为待测样本中不含有M蛋白。

在本发明的某些实施方式中，所述待测样本为血清或尿液样本。

待测样本中免疫球蛋白轻链和重链单电荷离子的m/z分布数据采用下列步骤获得：

I)样本还原：将待测样本用还原剂还原，得到还原样本；

II)检测：将还原样本和基质液混合后点样，利用MALDI-TOF MS分析测量待测样本中免疫球蛋白轻链单电荷离子的m/z分布数据。

在本发明的某些实施方式中，所述待测样本稀释后再用还原剂还原。所述待测样本的稀释倍数为5～20倍，例如为5～15倍。所述待测样本可以用水、PBS、生理盐水中的一种或多种进行稀释。

在本发明的某些实施方式中，步骤I)中所述还原剂选自二硫苏糖醇(DTT)、三(2-羧乙基)膦(TCEP)、三(3-羟丙基)膦(TPP或THPP)、β-巯基乙醇中的任一种或多种。

在本发明的某些实施方式中，待测样本和还原剂混合后，所述还原剂的终浓度为0.02～0.08mol/L。优选的，所述还原剂的终浓度为0.02～0.06mol/L。更优选的，所述还原剂的终浓度为0.04mol/L。

在一种实施方式中，步骤I)中所述还原剂为二硫苏糖醇的甲酸溶液。

在本发明的某些实施方式中，用还原剂还原的步骤为：将待测样本和还原剂混合后，20～30℃下孵育10～30分钟。优选的，24～27℃下孵育15～25分钟。更优选的，25℃下孵育20分钟。

在本发明的某些实施方式中，步骤II)中所述基质液选自芥子酸基质液、2，5一二羟基苯甲酸基质液或α一氰基一4一羟基肉桂酸基质液。所述芥子酸基质液的溶剂为乙腈+含三氟乙酸的水溶液。乙腈和含三氟乙酸的水溶液的体积比为1∶1。

在本发明的某些实施方式中，还原样本和基质液混合后，所述基质液的终浓度为1～5mg/mL。

在本发明的某些实施方式中，步骤II)中分析测量时质谱条件为：源电压20kV，检测器电压0.48kV，激光能量4.8μJ，激光频率3000Hz，聚焦质量20kDa，扫描速度1mm/s，采集质量范围5kDa～200kDa。

在本发明的某些实施方式中，步骤2)中所述轻链m/z范围指轻链单电荷m/z为22400～24600Da。所述轻链m/z范围或其他m/z范围可以根据不同仪器的偏差范围在本发明公开的m/z范围例如22400～24600Da基础上进行相应调整。

在本发明的某些实施方式中，步骤2)中可以将检测获得的待测样本的指纹图谱与健康人的指纹图谱叠加比较，观察在待测样本指纹图谱上轻链m/z范围内是否具有与健康人的峰形相比基底更窄、峰更高且更尖锐的质谱峰，若有，则判定为待测样本中含有M蛋白；若无，则判定为待测样本中不含有M蛋白。具体的，只要不满足与健康人的峰形相比基底更窄、峰更高且更尖锐中的任一个或多个条件，均判定待测样本中不含有M蛋白。

健康人的图谱在轻链m/z范围呈高斯分布。M蛋白的质谱峰基底窄，峰高且尖锐，类似教堂尖顶样，且不呈高斯分布。

在本发明的某些实施方式中，若κ轻链：λ轻链的峰面积比小于1.8或大于3.5，且峰形为非高斯分布，则判定待测样本中含有M蛋白。若κ轻链：λ轻链的峰面积比等于1.8，且峰形为高斯分布，则判定待测样本中不含有M蛋白。不含有M蛋白的情况下，κ轻链和λ轻链区会一般会分别出现两个呈高斯分布的峰。含有M蛋白的情况下，由于κ轻链和λ轻链中的一种会大量生成，导致另一种轻链受抑制，因此在轻链区仅会出现一个强度较强的主峰，判断峰形时，仅判断该主峰是否为高斯分布即可。

在本发明中，κ轻链：λ轻链的峰面积比值是利用质谱自带的工作站对峰面积进行积分计算得到的。峰形是否为高斯分布是利用峰形识别工具判断的。所述峰形识别工具为采用若干个已检测的质谱样本作为训练样本集利用随机森林(Random Forest，RF)算法得到的工具，随机森林算法使用MATLAB的TreeBagger函数完成，随机森林算法是通过集成学习的思想将多棵决策树集成的一种算法，它的基本单元是决策树，它的本质属于机器学习的一大分支——集成学习方法，随机森林算法是现有技术中非常成熟的一种技术。随机森林是常用的有监督机器学习分类算法。机器学习算法可视为一个复杂函数。在一个n分类任务中，该函数的功能是，当输入某个样本的特征值时，该函数输出n个和为1的值，这n个值可视为输入样本在每一类上的打分，一般情况下，将得分最高的类别视为函数对输入样本的判断。所谓的有监督学习，是指我们把大量样本以及它们的分类信息(亦称为样本的标签)输入到分类器中，然后算法通过样本的标签，对分类器的函数(或决策过程)进行自调整，调整的最终目的是使函数输出的分数，尽可能和样本的标签一致。这个迭代过程亦称为训练(training)。在训练结束后，把未参与训练的样本输入到分类器中，记录分类器对样本的判断情况，并用不同的指标对分类器的性能进行评估，这个过程称为测试(test)。随机森林由多个决策树组成，每个决策树是一个子分类器，随机森林用这些决策树对样本进行投票，并计算出样本在每个类别中的得分。对每个决策树，随机森林会随机选取训练数据的一个子集以及用于描述样本的特征的一个子集来训练每个决策树。每个决策树的结构为二叉树，每个节点代表一个特征，根据特征的取值，决定流程该往二叉树的哪一个方向走。二叉树最后一层节点，代表该决策树对样本类别的判断。在训练过程中，每个决策树根据样本的标签选择最优的特征并生成二叉树。具体的，使用随机森林分类器对轻链区的情况进行识别。在这部分分析中，轻链区一共有3种情况：第一种，m/z值在[22400，23100]区间的λ峰异常，而[23100，24600]的κ峰正常；第二种，m/z值在[22400，23100]区间的λ峰正常，而[23100，24600]的κ峰异常；第三种，m/z值在[22400，23100]区间的λ峰和[23100，24600]的κ峰均正常。在这里假设出现异常的峰都是对应区间的最大值。因此，识别问题可简化为一个3分类的问题，即先在峰图的对应区间找到最大值的点，然后根据这两个最大值点的峰图特征，对样本进行分类。

峰形识别工具的开发的过程如下：

1)采用若干个已检测的质谱样本作为训练样本集，对训练样本集中的各质谱样本的峰图进行人工标注类别，分为三类：阴性样本(标记为normal)，λ峰异常(标记为lambda)，κ峰异常(标记为kappa)样本。

2)对训练样本集中的各质谱样本峰图进行特征提取；

在一些具体实施方式中，质谱样本特征提取的特征值包括σ_L，C_L，σ_R，C_R，σ_L/σ_R，C_L/C_R。

具体的，确定每个样本单电荷离子的m/z在[23100，24600]区间强度最大的峰与[22400，23100]区间强度最大的峰，并进行高斯分布拟合。

设A(x_m，y_m)为峰顶点m的坐标，x_m代表该峰顶点的质荷比，y_m代表该峰顶点的丰度，取横坐标在[x_m-x_m*0.001，x_m+x_m*0.001]的点进行拟合。这些点的坐标记为(x₁，y₁)，(x₂，y₂)，...(x_n， y_n)，拟合的方程表达式为：

其中x为荷质比，y为丰度

σ描述的是正态分布的峰宽，C描述的是峰在纵轴方向的变形程度。拟合的目标是找到一个σ，使得的值最小。把上述求和取最小值的σ以及其对应的C值作为该区间最大值所在的峰特征表示。令σ_R和X_R表示m/z区间[23100，24600]的特征，σ_L和X_L表示m/z区间[22400，23100]的特征。

以用特征值(σ_L，C_L，σ_R，C_R，σ_L/σ_R，C_L/C_R)来表示每个样本的质谱数据，即每个样本可以用这6个特征值进行表示。

3)将训练样本集中的各质谱样本的6个特征值及每个样本对应的标注类别，采用随机森林算法获得随机森林模型。

利用每个质谱样本对应的6个特征值，采用前述步骤获得的随机森林模型计算出S_normal、S_λ、S_κ，S_normal代表轻链区峰形呈高斯分布的预测值、S_λ代表λ轻链区存在非高斯分布峰的预测值、S_κ代表kappa轻链区存在非高斯分布峰的预测值，且S_normal+S_λ+S_κ＝1，取S_normal、S_λ、S_κ中的最大数值作为最终结论。例如S_normal为最大数值，则代表轻链区峰形呈高斯分布。

在一个具体的实施方式中，收集1929个已检测的质谱样本作为训练样本集，该1929个质谱数据中，通过对每个峰图进行人工标注，将该1929个峰图标注为以下三类：阴性样本(标记为normal)共924个样本，λ峰异常(标记为lambda)共433个样本，κ峰异常(标记为kappa)共有572个样本。随后，对每个峰进行特征提取，获得随机森林模型作为峰形识别工具。

在此基础上，进一步采用上述1929个样本进行十折交叉验证。结果见图1，每一行表示所有样本，第一行说明的433例lambda型M蛋白样品有0.9885比例的样本分类为lambda型M蛋白，即428例预测正确，仅5例错分类成阴性或kappa型；同理，第二行代表924例阴性样品中有0.9957比例的样本分为阴性(正确)，仅4例错误；第三行代表572例kappa型M蛋白样品中有0.9895比例的样本分为kappa型M蛋白，仅7例分类为阴性(错误)；10折交叉验证表明，采用随机森林算法建立的模型的准确率理想。

步骤2)中具体判定方法如下：

若κ/λ＜1.8，λ轻链区含有异常的M蛋白轻链峰，，则判定为λ轻链型M蛋白阳性；

若κ/λ＞3.5，κ轻链区含有异常的M蛋白轻链峰，，则判定为κ轻链型M蛋白阳性；

公式中，κ代表M蛋白κ轻链的峰面积，λ代表M蛋白λ轻链的峰面积。κ轻链区指的是单电荷离子的m/z为23100～24600Da的区域；λ轻链区指的是单电荷离子的m/z为22400～23100Da的区域。异常的M蛋白峰是指非高斯分布的M蛋白峰。

本发明还提供一种M蛋白检测的装置，所述装置包括：

信息获取模块101：用于获取待测样本中免疫球蛋白轻链单电荷离子的m/z分布数据，所述轻链包括λ轻链和κ轻链；

峰形识别模块102：用于分析κ轻链：λ轻链的峰面积以及峰形是否为非高斯分布；

结果判定模块103：用于按照以下情况输出结果：

所述峰形识别模块102包括：

1)训练数据集生成子模块：用于获取已检测并进行人工标注的质谱样本数据集，对数据集中阴性样本、λ峰异常、κ峰异常样本进行相应赋值，以获得训练数据集；

2)特征提取子模块：用于对训练数据集中的各质谱样本峰图进行特征提取；特征提取的特征值包括σ_L，C_L，σ_R，C_R，σ_L/σ_R，C_L/C_R；

3)模型生成子模块：用于将特征提取子模块提取的各质谱样本的特征值及每个样本对应的赋值，采用随机森林算法获得能够分析κ轻链：λ轻链的峰面积以及峰形是否为非高斯分布的随机森林模型。

所述装置的信息获取模块中的信息来源与M蛋白检测的方法中的描述一致，所述结果判定模块的规则、方法等也与M蛋白检测的方法中的描述一致，在此不再赘述。

需要说明的是，应理解以上系统的各个模块的划分仅仅是一种逻辑功能的划分，实际实现时可以全部或部分集成到一个物理实体上，也可以物理上分开。这些模块可以全部以软件通过处理元件调用的形式实现；也可以全部以硬件的形式实现；还可以部分模块通过处理元件调用软件的形式实现，部分模块通过硬件的形式实现。例如，信息获取模块可以为单独设立的处理元件，也可以集成在某一个芯片中实现，此外，也可以以程序代码的形式存储于存储器中，由某一个处理元件调用并执行以上蛋白质注释模块的功能。其它模块的实现与之类似。此外这些模块全部或部分可以集成在一起，也可以独立实现。这里所述的处理元件可以是一种集成电路，具有信号的处理能力。在实现过程中，上述方法的各步骤或以上各个模块可以通过处理器元件中的硬件的集成逻辑电路或者软件形式的指令完成。

例如，以上这些模块可以是被配置成实施以上方法的一个或多个集成电路，例如：一个或多个特定集成电路(Application Specific Integrated Circuit，简称ASIC)，或，一个或多个微处理器(digital singnal processor，简称DSP)，或，一个或者多个现场可编程门阵列(Field Programmable Gate Array，简称FPGA)等。再如，当以上某个模块通过处理元件调度程序代码的形式实现时，该处理元件可以是通用处理器，例如中央处理器(Central Processing Unit，简称CPU)或其它可以调用程序代码的处理器。再如，这些模块可以集成在一起，以片上系统(system-on-a-chip，简称SOC)的形式实现。

本发明还提供一种计算机可读存储介质，其上存储有计算机程序，该程序被处理器执行时实现前述方法的步骤。

所述计算机可读存储介质，存储有计算机程序，用于运行以实现所述M蛋白检测方法。所述计算机可读存储介质可包括，但不限于，软盘、光盘、CD-ROM(只读光盘存储器)、磁光盘、ROM(只读存储器)、RAM(随机存取存储器)、EPROM(可擦除可编程只读存储器)、EEPROM(电可擦除可编程只读存储器)、磁卡或光卡、闪存、或适于存储机器可执行指令的其他类型的介质/机器可读介质。所述计算机可读存储介质可以是未接入计算机设备的产品，也可以是已接入计算机设备使用的部件。

在具体实现上，所述计算机程序为执行特定任务或实现特定抽象数据类型的例程、程序、对象、组件、数据结构等等。

本发明还提供一种计算机处理设备，包括处理器及所述的计算机可读存储介质，所述处理器执行所述计算机可读存储介质上的计算机程序，实现前述方法的步骤。

本发明还提供一种服务终端，包括：

通信器201，用于与外部通信；

存储器202，存储有计算机程序；

处理器203，用于运行所述计算机程序以实现所述的M蛋白检测方法。

所述服务终端可以通过其通信器201与具备网络通信能力的用户终端通信，从而提供M蛋白检测服务。

在图10实施例中的存储器202，可能包括但不限于高速随机存取存储器、非易失性存储器。例如一个或多个磁盘存储设备、闪存设备或其他非易失性固态存储设备；在图12实施例中的处理器203，可能包括但不限于中央处理器(Central Processing Unit，简称CPU)、网络处理器(Network Processor，简称NP)等；还可以是数字信号处理器(Digital Signal Processing，简称DSP)、专用集成电路(Application Specific Integrated Circuit，简称ASIC)、现场可编程门阵列(Field-Programmable Gate Array，简称FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。

在图10实施例中的通信器201，可以是有线或无线制式的网络通信电路模块。

以下通过特定的具体实例说明本发明的实施方式，本领域技术人员可由本说明书所揭露的内容轻易地了解本发明的其他优点与功效。本发明还可以通过另外不同的具体实施方式加以实施或应用，本说明书中的各项细节也可以基于不同观点与应用，在没有背离本发明的精神下进行各种修饰或改变。

在进一步描述本发明具体实施方式之前，应理解，本发明的保护范围不局限于下述特定的具体实施方案；还应当理解，本发明实施例中使用的术语是为了描述特定的具体实施方案，而不是为了限制本发明的保护范围；在本发明说明书和权利要求书中，除非文中另外明确指出，单数形式“一个”、“一”和“这个”包括复数形式。

当实施例给出数值范围时，应理解，除非本发明另有说明，每个数值范围的两个端点以及两个端点之间任何一个数值均可选用。除非另外定义，本发明中使用的所有技术和科学术语与本技术领域技术人员通常理解的意义相同。除实施例中使用的具体方法、设备、材料外，根据本技术领域的技术人员对现有技术的掌握及本发明的记载，还可以使用与本发明实施例中所述的方法、设备、材料相似或等同的现有技术的任何方法、设备和材料来实现本发明。

实施例1

1、样品

经血清蛋白电泳(SPEP)、血清免疫固定电泳(IFE)、总蛋白、不同球蛋白同种型检测(使用的方法和仪器见下)方法检测，确诊为多发性骨髓瘤的患者的血清样本被纳入MALDI-TOF MS分析；

(1)SPEP和IFE

所有测定均根据现有的临床免疫学实验室的方案进行：SPEP在美国海伦娜的毛细管电泳V8系统上进行，而IFE在美国海伦娜的SPIFE TOUCH系统上进行。

SPEP包括以下步骤：首先打开V8仪器进行自检，自检结束后，将血清样本加载到仪器中，仪器会自动对所有已加载的样本自动进行检测，然后血清中蛋白会在低于等电点(PI)的pH区域带正电向负极移动。根据不同种类的血清蛋白分子的等电点不同，将其聚焦在pH 梯度内加以分离；实验结束后，检测结果将被传输到Platinum4v软件中。

IFE包括以下步骤：第一步高解析凝胶电泳，用生理盐水将样本按1∶3稀释(50μL血清+100μL生理盐水)，1∶5稀释(50μL血清+100μL生理盐水)，电泳槽左侧放好样本盘，吸入20μL按照1∶3稀释的标本放入SP位，其余5个位置加20ml按照1∶5稀释的标本，血清中蛋白根据电泳和电渗作用下，因携带电荷不同而分离；第二步免疫沉淀，加入相应抗血清40μL，可溶性抗原会和抗体形成抗原抗体复合物变成不溶的沉淀物。通过洗涤去除未反应的蛋白，并对抗原抗体复合物进行染色，即可在蛋白图上出现免疫固定沉淀带。

(2)总蛋白、不同球蛋白同种型的测定

使用来自迈瑞的全自动生化分析仪系统(BS2000)通过双缩脲法测定总蛋白浓度；使用来自西门子(SIEMENS)的全自动蛋白分析生化分析仪系统(BNProSpec)通过散射免疫法测定IgG、IgA、IgM的浓度。

2、试剂

(1)二硫苏糖醇(DTT)、三氟乙酸、乙腈购自Sigma-Aldrich；

(2)芥子酸(SA)购自Sigma-Aldrich；

(3)IgG、IgA和IgM免疫球蛋白标准品购自Sigma-Aldrich，各免疫球蛋白标准品是从多发性骨髓瘤患者纯化的；

(4)质量校准品：含有细胞色素C(Mass＝12362Da[M+H]+)、肌红蛋白(Mass＝16952Da[M+H]+)、醛缩酶(Mass＝39212Da[M+H]+)和牛血清白蛋白(Mass＝66430Da[M+H]+)的混合物，购自融智生物科技(青岛)有限公司；

3、MALDI-TOF MS检测：

检测流程和原理如图2所示，具体步骤如下：

(1)样品还原：将20μL血清加入到180μL PBS中(稀释10倍)，以1000rpm振荡30s。稀释后的血清样品用0.4M二硫苏糖醇(DTT，溶于0.1％甲酸)进行还原，血清：DTT体积比例为9∶1，然后以1000rpm振荡，在室温下孵育20分钟，将Igs解离成分离的LC和HC；

(2)MALDI-TOF MS检测：配制溶于体积比例为5∶5的乙腈/水溶液(含0.1％三氟乙酸)的10mg/mL的芥子酸基质液，并按照体积比例为4∶1分别加入芥子酸基质液和还原后的血清样品，混匀后直接点在可重复使用的96孔靶板(QuanTOF)上。样品干燥后，使用线性QuanTOF质谱仪(QuanTOF I型，融智生物科技(青岛)有限公司)进行质量分析，分析测量时质谱条件为：源电压20kV，检测器电压0.48kV，激光能量4.8μJ，激光频率3000Hz，聚焦质量20kDa，扫描速度1mm/s，采集质量范围5kDa～200kDa。LC组分被电离成单电荷离子，并测量LC单电荷离子的m/z分布。

4.结果判定方法

(1)使用QuanTOF自带的视图器软件目测检查血清指纹图谱。将来自不同患者样品的指纹图谱，与正常对照的指纹图谱进行比较，用于单克隆免疫球蛋白的视觉检测。定义为阳性结果的标准是在预期的轻链m/z范围内识别出类似教堂尖顶样的尖锐的质谱峰，这些峰与正常样本中呈现的高斯分布的多克隆背景可区分，即待测样本指纹图谱上轻链m/z范围内具有与健康人的峰形相比基底更窄、峰更高且更尖锐的质谱峰即判定为阳性结果。+1电荷状态的质谱峰是检查是否存在M蛋白的支持性证据。

(2)峰面积计算和峰形识别工具：

为了进一步量化结果，本专利基于飞行时间质谱技术和峰形识别工具，用于M蛋白的识别。飞行时间质谱技术自带的工作站通过m/z数据识别轻链类型，并对免疫球蛋白λ轻链、κ轻链的峰面积进行积分，分别自动计算λ轻链、κ轻链的峰面积比值；峰形识别工具可以通过是否存在呈高斯分布的峰来识别λ或κ轻链区是否含有异常的M蛋白峰，从而区分正常和异常样本，异常的M蛋白峰是指非高斯分布的M蛋白峰。

若κ/λ＝[1.8，3.5]，轻链区无异常的M蛋白峰，，则样本鉴定为正常；

若κ/λ＜1.8，λ轻链区含有异常的M蛋白峰，则判定为λ轻链型M蛋白阳性；

若κ/λ＞3.5，κ轻链区含有异常的M蛋白峰，则判定为κ轻链型M蛋白阳性。

公式中，κ代表M蛋白κ轻链的峰面积，λ代表M蛋白λ轻链的峰面积；κ轻链区指的是单电荷离子的m/z为23100～24600Da的区域；λ轻链区指的是单电荷离子的m/z为22400～23100Da的区域。

5.结果

(1)图3显示为来自60名健康人作为正常对照的质谱叠加图，总轻链TLC离子的区域(m/z 22,400Da～24,600Da)。60名健康人质谱测定结果较一致，呈高斯分布，存在大量多克隆的κ型轻链与λ型轻链，二者峰高比约为2∶1。

(2)图4显示为正常对照和多发性骨髓瘤(IgGλ型)患者还原前与还原后的血清指纹图谱比较，(A)通过叠加方式，可以清晰地看到健康人的血清标本还原前(蓝色)与还原后(绿色)的质谱图；(B)IgGλ型多发性骨髓瘤患者还原前、后的血清指纹图谱。由于大量的λ型轻链生成，κ型轻链受抑制，M蛋白的质谱图呈非高斯分布。比较健康人和MM患者的血清还原后的血清指纹图谱，可以清晰地看到健康人与IgGλ型M蛋白的结果相差较大。

(3)图5显示为标准球蛋白和不同类型的多发性骨髓瘤患者血清的血清指纹图谱比较 (还原后)，左图为将不同类型的标准球蛋白(IgG、IgA、IgM)还原后分别进行检测，生成质谱图并叠加起来用于分析。多克隆LC单电荷离子分别用同种型和电荷标记。不同Ig同种型的质谱图分别以不同的颜色标记。图中的扩大质谱图集中在LC单电荷离子的区域。右图为含有IgGλ、IgAκ、IgMκM蛋白的患者血清指纹图谱和健康人的血清指纹图谱比较(还原后)。图中扩大质谱图的LC单电荷离子区域(m/z：22400～24600)可见，不同Ig同种型的多发性骨髓瘤患者的LC质谱峰基底较窄，高而尖锐，与健康人(黑色)呈现的高斯分布的峰形可明显区分；在扩大的LC单电荷离子区域(m/z：22400～24600)的质谱叠加图可见，在健康人多克隆背景中，多发性骨髓瘤患者的不同Ig同种型的LC单电荷离子区域存在独特相对较高的强度峰。根据标准球蛋白及健康人的结果，本发明定义LC(κ、λ)单电荷离子的m/z范围，分别为κ-TLC(23100～24600Da，[M+H]+)、λ-TLC(22400～23100Da，[M+H]+)。

(4)峰面积计算

为了进一步将具有定性特征的M蛋白窄峰量化，提供识别M蛋白的依据，本发明对M蛋白的轻链进行计算。图6为计算的60名健康人的M蛋白λ轻链、κ轻链的峰面积，通过质谱工作站分别计算轻链κ/λ比值。如图所示，60名健康人的κ/λ集中在1.8-3.5之间。

(5)峰形识别

峰形识别工具根据峰形是否为高斯分布识别轻链m/z范围是否存在M蛋白轻链峰，如果峰形为非高斯分布，则如图7所示，利用MATLAB软件以垂直切线的方式高亮单克隆蛋白成分所在的区域，并利用质谱工作站计算该高亮区域(即M蛋白)占TLC的比例。

实施例1分析敏感度

由于IFE被认为是检测M蛋白最敏感的方法，本实施例将MALDI-TOF MS与IFE进行比较。具体操作如下：将不同的M蛋白阳性的多发性骨髓瘤患者的血清来与正常人的血清混合，按照0倍、1∶2、1∶10、1∶20、1∶100和1∶200比例连续稀释。将所有稀释的样品分成两等份，并通过IFE和MALDI-TOF MS进行分析，分析方法与实施例1相同。由图8可见，MALDI-TOF MS检测稀释1∶100的M蛋白血清样本时仍能检测κ型M蛋白(图8中A)；在IFE的检测中，血清1∶100稀释时已经检测不到M蛋白(图8中B)；不同稀释度的IFE和MALDI测定的不同M蛋白的分析灵敏度进行比较(图8中C)，

实施例2线性

SPE和MALDI线性比较：

具体操作如下：7份已知M蛋白浓度的患者血清样本(4个IgG、2个IgA和1个IgM；范围0.5-8g/dL)，用正常人的血清按照如下0倍，1∶3，1∶15、1∶75和1∶375比例进行稀释，并通过SPEP和MALDI进行量化(每位患者5个样本；总共35个样本，方法同实施例1)。对于MALDI-TOF MS，使用工作站计算峰面积，利用峰型识别工具对M蛋白峰进行门控和量化。由图9可知，SPEP和MALDI-TOF MS测量的M蛋白浓度与预期浓度非常一致(R²＞0.98)。

实施例3方法一致性比较

4.1MALDI-TOF MS与SPEP、IFE对M蛋白定性的一致性研究

为了进一步证明本发明的方法在检测M蛋白的实用价值，从珠江医院生化免疫实验室收集124例多发性骨髓瘤患者治疗前后的血清样本(SPE、IFE检测后的剩余血清样本)，将MALDI-TOF MS质谱检测的性能与常规检测方法即血清蛋白电泳(SPEP)、免疫固定(IFE)的性能进行盲法一致性研究。如表1所示，SPE阳性107例，IFE阳性115例，这些样本中有94％的样本(n＝117)被MALDI检测为阳性。在SPEP和IFE均为阴性的样本(n＝9)样本中，MALDI-TOF MS发现了2例阳性病例，检测流程图如图10。

表1

(SPE：血清蛋白电泳；IFE：免疫固定电泳)

本发明基于MALDI-TOF MS(QuanTOF，融智生物科技(青岛)有限公司)对M蛋白进行快速鉴定。与其他同类型的线性MALDI-TOF MS相比，QuanTOF质谱仪(融智生物科技(青岛)有限公司)提供更宽的质量范围、更高的灵敏度和更好的重现性。QuanTOF识别和监测患者血清M蛋白灵敏度高，准确度高。本发明全新的基于飞行时间质谱的自动化系统相较传统方法，主要是通过还原免疫球蛋白，使Ig的重链(HC)和轻链(LC)间的二硫键断裂而分开来实现的，可直接分析M蛋白轻链的具体变化，灵敏度更高，特异性更强。此外该方法定性和分型时只需一项检测，样本前处理流程简单快捷，试剂耗材消耗量少，检测通量高，相比现有的电泳方法大大缩短了样本前处理的时间。检测结果不易受实验室条件影响，更容易实现标准统一。本发明有效的解决了现有方法对M蛋白筛查时存在的准确率低、检测通量低、特异性及灵敏度差等问题。该方法有望应用于M蛋白大规模临床筛查中，提高MM的筛查、诊断和监测能力。

以上的实施例是为了说明本发明公开的实施方案，并不能理解为对本发明的限制。此外，本文所列出的各种修改以及发明中方法的变化，在不脱离本发明的范围和精神的前提下对本领域内的技术人员来说是显而易见的。虽然已结合本发明的多种具体优选实施例对本发明进行了具体的描述，但应当理解，本发明不应仅限于这些具体实施例。事实上，各种如上所述的对本领域内的技术人员来说显而易见的修改来获取发明都应包括在本发明的范围内。

Claims

一种M蛋白检测的方法，其特征在于，所述方法包括如下步骤：

1)提供待测样本中免疫球蛋白轻链单电荷离子的m/z分布数据，所述轻链包括λ轻链和κ轻链；

2)结果判定：

若轻链m/z范围内具有基底窄、峰高且尖锐的质谱峰，则判定待测样本中含有M蛋白；

或，

若κ轻链：λ轻链的峰面积比值小于1.8或大于3.5，且峰形为非高斯分布，则判定待测样本中含有M蛋白；

所述轻链m/z范围内具有基底窄、峰高且尖锐的质谱峰，或κ轻链∶λ轻链的峰面积比值小于1.8或大于3.5，且峰形为非高斯分布的轻链峰为M蛋白轻链峰；

若κ轻链∶λ轻链的峰面积比值≥1.8或≤3.5，且峰形为高斯分布，则判定为待测样本中不含有M蛋白。
根据权利要求1所述的方法，其特征在于，所述待测样本为血清样本或尿液样本，和/或，步骤2)中所述轻链m/z范围指轻链单电荷m/z为22400～24600Da。
根据权利要求1所述的方法，其特征在于，待测样本中免疫球蛋白轻链单电荷离子的m/z分布数据采用下列步骤获得：

I)样本还原：将待测样本用还原剂还原，得到还原样本；

II)检测：将还原样本和基质液混合后点样，利用MALDI-TOF MS分析测量待测样本中免疫球蛋白轻链和重链单电荷离子的m/z分布数据。
根据权利要求3所述的方法，其特征在于，所述待测样本稀释后再用还原剂还原；优选的，所述待测样本用水、PBS或生理盐水中的一种或多种进行稀释；

和/或，

步骤I)中所述还原剂选自二硫苏糖醇、三(2-羧乙基)膦、三(3-羟丙基)膦、β-巯基乙醇中的任一种或多种；优选的，所述还原剂的终浓度为0.02～0.08mol/L；

和/或，步骤I)中用还原剂还原的步骤为：将待测样本和还原剂混合后，20～30℃下孵育10～30分钟；

和/或，步骤II)中所述基质液选自芥子酸基质液、2，5-二羟基苯甲酸基质液或α-氰基-4-羟基肉桂酸基质液；优选的，所述基质液的终浓度为1～5mg/mL。
根据权利要求1所述的方法，其特征在于，步骤2)中将检测获得的待测样本的指纹图谱与健康人的指纹图谱叠加比较，观察在待测样本指纹图谱上轻链m/z范围内是否具有与健康人的峰形相比基底更窄、峰更高且更尖锐的质谱峰，若有，则判定为待测样本中含有M蛋白；若无，则判定为待测样本中不含有M蛋白。
根据权利要求1所述的方法，其特征在于，步骤2)中具体判定方法如下：

若κ/λ＜1.8，单电荷离子的m/z在22400～23100Da内含有非高斯分布的M蛋白轻链峰，则判定为λ轻链型M蛋白阳性；

若κ/λ＞3.5，单电荷离子的m/z在23100～24600Da内含有非高斯分布的M蛋白轻链峰，则判定为κ轻链型M蛋白阳性；

公式中，κ代表M蛋白κ轻链的峰面积，λ代表M蛋白λ轻链的峰面积。
根据权利要求1所述的方法，其特征在于，步骤2)中利用质谱工作站计算得到κ轻链和λ轻链的峰面积比值，和/或，利用峰形识别工具判断峰形是否为高斯分布。
一种M蛋白检测的装置，其特征在于，所述装置包括：

信息获取模块：用于获取待测样本中免疫球蛋白轻链和重链单电荷离子的m/z分布数据，所述轻链包括λ轻链和κ轻链；

峰形识别模块：用于分析κ轻链：λ轻链的峰面积以及峰形是否为非高斯分布；

结果判定模块：用于按照以下情况输出结果：

若κ轻链：λ轻链的峰面积比值小于1.8，且单电荷离子的m/z在22400～23100Da内含有非高斯分布的峰形，则判定待测样本中含有λ轻链型M蛋白；

若κ轻链：λ轻链的峰面积比值大于3.5，且单电荷离子的m/z在23100～24600Da内含有非高斯分布的峰形，则判定待测样本中含有κ轻链型M蛋白；

若κ轻链：λ轻链的峰面积比值≥1.8或≤3.5，且峰形为高斯分布，则判定待测样本中不含有M蛋白。
根据权利要求8所述的装置，其特征在于，所述峰形识别模块包括：

1)训练数据集生成子模块：用于获取已检测并进行人工标注的质谱样本数据集，对数据集中阴性样本、λ峰异常、κ峰异常样本进行相应赋值，以获得训练数据集；

2)特征提取子模块：用于对训练数据集中的各质谱样本峰图进行特征提取；特征提取的特征值包括σ_L，C_L，σ_R，C_R，σ_L/σ_R，C_L/C_R；

3)模型生成子模块：用于将特征提取子模块提取的各质谱样本的特征值及每个样本对应的赋值，采用随机森林算法获得能够分析κ轻链：λ轻链的峰面积以及峰形是否为非高斯分布的随机森林模型。
一种计算机可读存储介质，其上存储有计算机程序，其特征在于，该程序被处理器执行时实现权利要求1-7任一所述方法的步骤。
一种计算机处理设备，包括处理器及权利要求10所述的计算机可读存储介质，其特征在于，所述处理器执行所述计算机可读存储介质上的计算机程序，实现权利要求1-7任一所述方法的步骤。
一种服务终端，包括：

通信器，用于与外部通信；

存储器，存储有计算机程序；

处理器，用于运行所述计算机程序以实现权利要求1-7任一所述的方法。