CN104515797A

CN104515797A - 乳腺癌早期诊断的唾液蛋白指纹图谱模型及其构建方法

Info

Publication number: CN104515797A
Application number: CN201410232893.2A
Authority: CN
Inventors: 吴正治; 孙珂焕; 曹美群
Original assignee: Shenzhen Second Peoples Hospital
Current assignee: Shenzhen Second Peoples Hospital
Priority date: 2014-05-29
Filing date: 2014-05-29
Publication date: 2015-04-15

Abstract

本发明公开了一种乳腺癌早期诊断的唾液蛋白指纹图谱模型的构建方法，该乳腺癌早期诊断的唾液蛋白指纹图谱模型的构建方法包括以下步骤：收集乳腺癌和健康对照者的唾液，离心处理后，与NP20蛋白质芯片结合；采用PBSⅡ型蛋白质芯片阅读仪读取芯片，得到初步筛选结果后，对初步筛选出来的质荷比峰进行成组数据均数比较秩和检验；数据分析：用Biomaker Pattem Software采用决策树算法计算出多个变量变化对两样本的分类价值；该乳腺癌早期诊断的唾液蛋白指纹图谱模型包括：质荷比(m/z)分别为4849.31，5224.96，3439.02和3559.89的人唾液蛋白质。本发明将检测人唾液中相应的蛋白质的m/z与模型进行分析，就可以初步用于乳腺癌的诊断，预测准确率为78.02％，构建方法合理可行，操作简便，可批量处理。

Description

乳腺癌早期诊断的唾液蛋白指纹图谱模型及其构建方法

技术领域

本发明属于乳腺癌检测技术领域，尤其涉及一种乳腺癌早期诊断的唾液蛋白指纹图谱模型及其构建方法。

背景技术

乳腺癌是女性中最常见的恶性肿瘤。近年来，乳腺癌发病率在中国，尤其是发达地区，呈现快速增长的趋势，已跃居女性恶性肿瘤发病率之首。然而，目前临床上对于乳腺癌的早期诊断缺乏有效的手段。唾液由于其无创伤的体液收集方法在疾病诊断中具有特别的优势，早在1901年Michaels就率先用检查唾液成分作为诊断疾病的辅助工具，现唾液作为疾病诊断标本方面的价值已受到前所未有的重视。唾液是人体不可缺少的一种重要体液，血液成分如多种激素、氨基酸、电解质、免疫球蛋白、肌酐等均可通过毛细血管壁的进入唾液,作为人体体液的一部分，其成分含量的变化，受体内各种病理生理变化的影响。现代医学研究显示唾液是一种复杂的混合液，除99％是水分外，主要还含有一系列具有重要生物学功能的蛋白质和多肽。近年来国外唾液蛋白质组学研究已经引起广泛关注，2008年，美国南加州大学的丹尼(Denny)等研究显示人的唾液中有1166种蛋白质，其中大部分蛋白质能同时在血浆和泪液中找到，这些唾液蛋白具有多种生物学功能，在保护口腔和人体正常功能中具有重要作用。唾液作为一种成分复杂、具有多种生物学功能的重要体液，唾液中独特、丰富的蛋白质成分毫无疑问是潜在的肿瘤及疾病的理想的生物标记。长期以来，由于原有的技术限制了口腔唾液蛋白的通量分析和精确测定，使大多数唾液蛋白的生物功能处于未知状态，唾液在人体疾病中的诊断和预后判断中的潜在作用并未显现。随着高通量、高精度的蛋白质组学的应用，使得从唾液蛋白中寻找生物标记用于疾病的早期诊断预防、生物蛋白靶向治疗、预后监测判断等均已成为可能。表面增强激光解吸电离(Surface enhanced laser desorption/ionization，SELDI)蛋白质芯片技术是近几年迅速发展起来的一种蛋白质组学研究的新技术。SELDI克服了目前多种蛋白质检测技术的不足和局限，具有微量化、高通量、高灵敏度和高特异性的特点，而且可以对各种样本直接进行分析，特别是对双向凝胶电泳等方法难以检测的疏水蛋白和低丰度蛋白质具有良好分辨检测效果，能够检测分子量0—500kDa范围内的所有已知和未知的各类蛋白质。因此，SELDI一TOF一MS技术结合生物信息学方法有可能筛选出在乳腺癌和健康人唾液之间差异表达的新的候选肿瘤标志物，并可建立具有较高诊断效力且适用于早期诊断的分类检测模型。

发明内容

本发明实施例的目的在于提供一种乳腺癌早期诊断的唾液蛋白指纹图谱模型及其构建方法，旨在解决现有缺少乳腺癌诊断能力和早期诊断的分类检测模型的问题。

本发明实施例是这样实现的，一种乳腺癌早期诊断的唾液蛋白指纹图谱模型的构建方法，该乳腺癌早期诊断的唾液蛋白指纹图谱模型的构建方法包括以下步骤：

步骤一，收集乳腺癌和健康对照者的唾液，离心处理后，与NP20蛋白质芯片结合；

步骤二，采用PBSⅡ型蛋白质芯片阅读仪检测芯片，在每次采集数据使用ALL-In-One标准蛋白质芯片校正质谱仪，使分子量检测误差小于0.1％，蛋白质芯片阅读仪设置激光强度为220，灵敏度为9，收集数据的质荷比范围为2000M/Z～20000M/Z，优化范围为2000M/Z～15000M/Z，信号收集位置从20-80，收集总点数为140次，采用Proteinchip Software3.2.1分析软件自动采集数据，计算机以1x10⁹Hz的速度从所获得的原始数据快速精确的绘制出蛋白指纹图谱，纵坐标为峰强度，横坐标为蛋白质质荷比；

步骤三，数据分析：所有原始数据先用Proteinchip Software3.2.1做校正，使总离子强度及分子量达到均一，对位于2000Da～20000Da的质荷比峰值用Biomarker Wizard3.1软件过滤噪音，设置初始的噪音过滤值为5，二次信噪比为2，允许同一蛋白质峰在不同样本中的偏差小于0.3％，以10％为最小阈值进行聚类，得到所有样本的质谱数据在2000Da～20000Da的蛋白质峰，得到初步筛选结果后，由Biomarker Wizard3.1软件对初步筛选出来的蛋白质谱峰M/Z峰强度做用秩和检验，由Biomarker Wizard3.1软件自动完成，各组数据用士s表示，应用P值评价每一个蛋白质峰的相对重要性，P值越小说明这个蛋白质峰对区分两类样本越重要，将Biomarker Wizard3.1软件处理后的差异蛋白质峰导入Biomaker Pattern Software5.0.2软件中，采用决策树分类算法对两组间相同质荷比的差异蛋白质峰做分类分析，建立决策树模型，进一步优化试验参数确定最佳的分类模型，即诊断模型，诊断模型的评价，评价诊断模型采用的指标有灵敏度、特异度、Youden指数。

进一步，在步骤二中，首先使用ALL-In-One标准蛋白质芯片校正质谱仪，使分子量检测误差小于0.1％，设定激光强度为220，灵敏度为9，收集数据的质荷比范围为2000Da～20000Da，优化范围为2000～15000，平均每点收集20次，所有原始数据先用Protein chiP Software3.2.1做校正，使总离子强度及分子量达到均一，对位于2000～20000的质荷比峰值，用Biomarker Wizard软件过滤噪音，设置初始的噪音过滤值为5，二次信噪比为2，允许同一蛋白质峰在不同样本中的偏差小于0.3％，以10％为最小阈值，在总样本中出现的比率要>10％进行聚类。

进一步，在步骤三中，对两组间相同M/Z的差异表达蛋白峰值做分类分析，经过进一步优化实验参数，确定最佳的分类模型，从而得到筛选乳腺癌早期诊断的唾液蛋白指纹图谱模型。

进一步，该乳腺癌早期诊断的唾液蛋白指纹图谱模型的构建方法步骤为：

步骤一，唾液标本的采集、处理和保存

所有样本均在早晨空腹下采集，采集时间为6：00AM～8：00AM，收集前一晚睡前不再进食及服用任何药物，采集前2h开始禁食水用清水漱口，后静坐于椅上，前5min内的唾液自然吞下后开始收集，口腔唾液积聚，吐入置于冰浴预冷的50mL离心管内，每个唾液样本采集2mL～5mL，每个样本采集完立即放入冰盒内；

所有采集的样品立即放入4℃冰箱静置1h后，以10000r/min在4℃下离心10min，冰浴上分装在1mlEP管中，每管50ul于-80℃冰箱保存，实验时由-80℃冰箱取出样本，冰上解冻，所有检测唾液样本均1次冻融，4℃下离心5min，备用；

步骤二，具体实验步骤：

(1)取出NP20芯片，在芯片背后标记时间，芯片种类，操作者的姓名资料，记下芯片号；

(2)取处理好的唾液上清，每条芯片的每个点直接上样4ul，自然晾干后重复上样一次；

(3)待干后，将芯片装入生物芯片处理器，在组装生物芯片处理器时，注意不要触碰加样孔，同时要将芯片上带有A的一头放在外端，注意密封；

(4)每孔加入10ul的HPLC水，置振荡器400转/分～600转/分，冰浴上震荡10分钟，甩去孔中液体，重复操作一次，立刻甩出，拍干，拆开芯片处理器，取出芯片，自然干燥；

(5)待芯片自然干燥后，在每个加样孔上加半饱和SPA溶液0.5ul，待干后重复点加一次，自然干燥，上机检测；

步骤三，数据采集和生物信息学统计分析

(1)仪器校正及数据的采集

采用PBSⅡ型蛋白质芯片阅读仪检测芯片，在每次采集数据使用ALL-In-One标准蛋白质芯片校正质谱仪，使分子量检测误差小于0.1％，蛋白质芯片阅读仪设置激光强度为220，灵敏度为9，收集数据的质荷比范围为2000M/Z～20000M/Z，优化范围为2000M/Z～15000M/Z，信号收集位置从20～80，收集总点数为140次，采用ProteinchipSoftware3.2.1分析软件自动采集数据，计算机以1x10⁹Hz的速度从所获得的原始数据快速精确的绘制出蛋白指纹图谱，纵坐标为峰强度，横坐标为蛋白质质荷比；

(2)生物信息学统计分析方法为：

第一步，指纹图谱标准化及蛋白质的初步筛选

所有原始数据先用Proteinchip Software3.2.1做校正，使总离子强度及分子量达到均一，对位于2000Da～20000Da的质荷比峰值用Biomarker Wizard3.1软件过滤噪音，设置初始的噪音过滤值为5，二次信噪比为2，允许同一蛋白质峰在不同样本中的偏差小于0.3％，以10％为最小阈值进行聚类，得到所有样本的质谱数据在2000Da～20000Da的蛋白质峰；

第二步，显著差异蛋白峰的选择及诊断模型的建立

得到初步筛选结果后，由Biomarker Wizard3.1软件对初步筛选出来的蛋白质谱峰M/Z峰强度做用秩和检验，由Biomarker Wizard3.1软件自动完成，各组数据用士s表示，应用P值评价每一个蛋白质峰的相对重要性，P值越小说明这个蛋白质峰对区分两类样本越重要；

将Biomarker Wizard3.1软件处理后的差异蛋白质峰导入Biomaker PatternSoftware5.0.2软件中，采用决策树分类算法对两组间相同质荷比的差异蛋白质峰做分类分析，建立决策树模型，进一步优化试验参数确定最佳的分类模型，即诊断模型；

第三步，诊断模型的评价指标

评价诊断试验的常用指标有灵敏度、特异度、Youden指数，

灵敏度：实际患病且被诊断为阳性的概率就是灵敏度，只与病例组有关，反映了诊断试验检出病例的能力；

特异度：实际未患病且被诊断为阴性的概率就是特异度；也称真阴性率，即Spe＝TN/(FP+TN)，只与对照组有关，反映了诊断试验排除非病例的能力；

阳性预测值：试验阳性的病例中真阳性的比例就是阳性预测值，即+PV＝TP/(TP+FP)；

阴性预测值：试验阴性的病例中真阴性的比例就是阴性预测值即-PV＝TN/(TN+FN)；

Youdenz指数：真阳性率与假阳性率之差就是Youden指数，即灵敏度与特异度之和减去1，J＝Sen+Spe-1，Youden指数的取值范围在(-1,+1)之间，值越接近+1，诊断准确性越好；

ROC曲线：受试者工作特征或相对工作特征曲线简称ROC曲线，ROC曲线的构建是以假阳性率即(1-特异度)为横轴，真阳性率即灵敏度为纵轴，横轴与纵轴长度相等，形成正方形，可揭示灵敏度和特异度的相互关系，是反映灵敏度和特异度连续变量的综合指标，可反映诊断试验的准确性大小，ROC曲线下面积越大，诊断价值就越高。

本发明实施例的另一目的在于提供一种乳腺癌早期诊断的唾液蛋白指纹图谱模型，该乳腺癌早期诊断的唾液蛋白指纹图谱模型包括：质荷比(m/z)分别为4849.31，5224.96，3439.02和3559.89的人唾液蛋白质。

本发明提供的乳腺癌早期诊断的唾液蛋白指纹图谱模型及其构建方法，提供建立主要由人唾液蛋白中质荷比(m/z)分别为4849.31，5224.96，3439.02和3559.89的四个唾液蛋白构成的蛋白指纹图谱模型，将检测人唾液中相应的蛋白质的m/z与模型进行分析，就可以初步用于乳腺癌的诊断，预测准确率为78.02％。本发明的构建方法合理可行，操作简便，可批量处理，较好的解决了现有缺少乳腺癌诊断能力和早期诊断的分类检测模型的问题。

附图说明

图1是本发明实施例提供的乳腺癌早期诊断的唾液蛋白指纹图谱模型的构建方法流程图；

图2是本发明实施例提供的乳腺癌患者和正常人的唾液蛋白质代表性图谱示意图；

图3是本发明实施例提供的区分乳腺癌和健康对照者的决策树模型；

图4是本发明实施例提供的M/Z为蛋白质峰4849.31和5224.96的质谱图及模拟胶图；

图5是本发明实施例提供的ROC曲线图。

具体实施方式

为了使本发明的目的、技术方案及优点更加清楚明白，以下结合实施例，对本发明进行进一步详细说明。应当理解，此处所描述的具体实施例仅仅用以解释本发明，并不用于限定本发明。

下面结合附图及具体实施例对本发明的应用原理作进一步描述。

本发明实施例的一种乳腺癌早期诊断的唾液蛋白指纹图谱模型，由蛋白质芯片飞行时间质谱仪系统检测的血清蛋白质图谱经过软件统计分析得到乳腺癌患者多个唾液特异蛋白质，并构建诊断模型，由质荷比(m/z)分别为4849.31，5224.96，3439.02和3559.89的人唾液蛋白质组成。

如图1所示，本发明实施例的乳腺癌早期诊断的唾液蛋白指纹图谱模型的构建方法包括以下步骤：

S101：收集乳腺癌和健康对照者的唾液，离心处理后，与NP20蛋白质芯片结合；

S102：采用PBSⅡ型蛋白质芯片阅读仪读取芯片，得到初步筛选结果后，对初步筛选出来的质荷比峰进行成组数据均数比较秩和检验；

S103：数据分析：用Biomaker Pattem Software采用决策树算法计算出多个变量变化对两样本的分类价值。

在步骤S102中，首先使用ALL-In-One标准蛋白质芯片校正质谱仪，使分子量检测误差<0.1％，设定激光强度为220，灵敏度为9，收集数据的质荷比范围为2000Da～20000Da，优化范围为2000～15000，平均每点收集20次。所有原始数据先用Protein chiP Software3.2.1做校正，使总离子强度及分子量达到均一。对位于2000～20000的质荷比峰值，用Biomarker Wizard软件过滤噪音，设置初始的噪音过滤值为5，二次信噪比为2，允许同一蛋白质峰在不同样本中的偏差<0.3％，以10％为最小阈值(在总样本中出现的比率要>10％)进行聚类；

在步骤S103中，对两组间相同M/Z的差异表达蛋白峰值做分类分析，经过进一步优化实验参数，确定最佳的分类模型，从而得到本发明筛选乳腺癌早期诊断的唾液蛋白指纹图谱模型。

以下结合本发明的具体实施例对本发明做进一步的说明：

步骤一，唾液标本的采集、处理和保存

所有样本均在早晨空腹下采集，采集时间为6：00AM～8：00AM，收集前一晚睡前不再进食及服用任何药物，采集前2h开始禁食水用清水漱口，后静坐于椅上，前5min内的唾液自然吞下后开始收集，口腔唾液积聚至一定量后，吐入置于冰浴预冷的50mL离心管内，每个唾液样本采集约2-5mL，每个样本采集完立即放入冰盒内；

步骤二，具体实验步骤

(1)小心的取出NP20芯片，在芯片背后标记时间，芯片种类，操作者的姓名等资料，记下芯片号；

(6)取处理好的唾液上清，每条芯片的每个点直接上样4ul,自然晾干后重复上样一次；

(7)待干后，将芯片装入生物芯片处理器(Bio-processor)，在组装生物芯片处理器时，注意不要触碰加样孔，同时要将芯片上带有”A”的一头放在外端，注意密封；

(8)每孔加入10ul的HPLC水，置振荡器400-600转/分，冰浴上震荡10分钟，甩去孔中液体(注意不要甩的太干)，重复操作一次，立刻甩出，拍干，拆开芯片处理器，取出芯片，自然干燥；

(9)待芯片自然干燥后，在每个加样孔上加半饱和SPA溶液0.5ul，待干后重复点加一次，自然干燥，上机检测；

步骤三，数据采集和生物信息学统计分析

(1)仪器校正及数据的采集

采用PBSⅡ型蛋白质芯片阅读仪检测芯片，在每次采集数据使用ALL-In-One标准蛋白质芯片校正质谱仪，使分子量检测误差<0.1％，蛋白质芯片阅读仪设置激光强度为220，灵敏度为9，收集数据的质荷比范围为2000M/Z～20000M/Z，优化范围为2000M/Z～15000M/Z，信号收集位置从20～80，收集总点数为140次，采用ProteinchipSoftware3.2.1分析软件自动采集数据，计算机以1x10⁹Hz的速度从所获得的原始数据快速精确的绘制出蛋白指纹图谱，纵坐标为峰强度(蛋白质相对含量)，横坐标为蛋白质质荷比(M/Z)；

(2)生物信息学统计分析

a.指纹图谱标准化及蛋白质的初步筛选

所有原始数据先用Proteinchip Software3.2.1做校正，使总离子强度及分子量达到均一，对位于2000Da～20000Da的质荷比峰值用Biomarker Wizard3.1软件过滤噪音，设置初始的噪音过滤值为5，二次信噪比为2，允许同一蛋白质峰在不同样本中的偏差<0.3％，以10％为最小阈值进行聚类，得到所有样本的质谱数据在2000Da～20000Da的蛋白质峰；

b.显著差异蛋白峰的选择及诊断模型的建立

将Biomarker Wizard3.1软件处理后的差异蛋白质峰导入Biomaker PatternSoftware5.0.2软件中，采用决策树分类算法对两组间相同质荷比的差异蛋白质峰做分类分析，建立决策树模型，进一步优化试验参数等确定最佳的分类模型，即诊断模型；

c.诊断模型的评价指标

评价诊断试验的常用指标有灵敏度、特异度、Youden指数等，见诊断2×2四格表(表1)；

表1诊断试验资料的2×2四格表

(1)灵敏度：实际患病且被诊断为阳性的概率就是灵敏度(sensitivity,Sen)，也称真阳性率，即Sen＝TP/(TP+FN)，该指标只与病例组有关，反映了诊断试验检出病例的能力；

(2)特异度：实际未患病且被诊断为阴性的概率就是特异度(specificity,Spe)；也称真阴性率，即Spe＝TN/(FP+TN)，该指标只与对照组有关，反映了诊断试验排除非病例的能力；

(3)阳性预测值：试验阳性的病例中真阳性的比例就是阳性预测值(positive predictive value,+PV)，即+PV＝TP/(TP+FP)；

(4)阴性预测值：试验阴性的病例中真阴性的比例就是阴性预测值(negative predictive value,-PV)，即-PV＝TN/(TN+FN)；

(5)Youdenz指数：真阳性率与假阳性率之差就是Youden指数(Youden’index,J)，即灵敏度与特异度之和减去1，J＝Sen+Spe-1，Youden指数的取值范围在(-1,+1)之间，其值越接近+1，诊断准确性越好；

(6)ROC曲线：受试者工作特征(Receiver Operating Characteristic)或相对工作特征(Relative Operating Character)曲线简称ROC曲线，ROC曲线的构建是以假阳性率即(1-特异度)为横轴，真阳性率即灵敏度为纵轴，横轴与纵轴长度相等，形成正方形，此构图法可揭示灵敏度和特异度的相互关系，是反映灵敏度和特异度连续变量的综合指标，可反映诊断试验的准确性大小，ROC曲线下面积越大，其诊断价值就越高。

结合结果和分析对本发明的使用效果做说明：

(1)通过SELDI-TOF-MS质谱仪对乳腺癌患者和正常人的唾液蛋白质表达模式进行分析，获得其表达图谱(图2)，

(2)差异蛋白质峰的初步筛选和评价

对47例乳腺癌患者和44例健康人对照者血清蛋白质指纹图谱数据经聚类后共得到稳定表达的蛋白质峰311个，其中32个蛋白质峰在两组之间表达量有显著性差异(P<0.01)，有14个蛋白质峰在乳腺癌组表达量增加，18个蛋白质峰在乳腺癌组表达下降。选取其中有有显著差异的11个蛋白质峰见表2。

表2乳腺癌患者与健康人不同蛋白质峰达量的比较(x士s)

(3)乳腺癌唾液诊断模型的建立

经BiomarkerPattern软件分析后，从上述差异蛋白质峰中选了M/Z为4849.31，5224.96，3439.02和3559.89Da的4个蛋白质峰用于构建分类决策树模型，具体决策树分类模型见图3。该模型中M/Z为4849.31，5224.96，3439.02和3559.89Da的蛋白质在乳腺癌组中表达下降，M/Z为4849.31和5224.96Da蛋白质峰表达质谱图及模拟胶图对比见图4。此模型分出5个终结点，训练组47例乳腺癌有44例被准确诊断，44例健康人全被正确诊断。灵敏度为91.4％(43/47)，特异性为100％(44/44)。交叉验证总准确率为78.02％(71/91)；灵敏度78.7％(37/47)；特异度为77.2％(34/44)。进一步计算该模型的ROC曲线下面积为0.963，见图5，提示该模型可能具有较好的诊断价值。

实施例，鉴别乳腺癌和健康人

临床收集乳腺癌患者和健康人的唾液标本，按照上述步骤处理唾液标本和质谱检测唾液蛋白指纹图谱，采用BiomarkerPattern软件经本发明所申请的乳腺癌唾液蛋白决策树诊断模型判别分析，对比分析受检者唾液蛋白质中M/Z为4849.31，5224.96，3439.02和3559.89Da的4个蛋白质峰，四个蛋白峰表达差异均达到模型标准者，软件将判别诊断为乳腺癌，反之则为正常人。

以上所述仅为本发明的较佳实施例而已，并不用以限制本发明，凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等，均应包含在本发明的保护范围之内。

Claims

1.一种乳腺癌早期诊断的唾液蛋白指纹图谱模型的构建方法，其特征在于，该乳腺癌早期诊断的唾液蛋白指纹图谱模型的构建方法包括以下步骤：

2.如权利要求1所述的乳腺癌早期诊断的唾液蛋白指纹图谱模型的构建方法，其特征在于，在步骤二中，首先使用ALL-In-One标准蛋白质芯片校正质谱仪，使分子量检测误差小于0.1％，设定激光强度为220，灵敏度为9，收集数据的质荷比范围为2000Da～20000Da，优化范围为2000M/Z～15000M/Z，平均每点收集20次，所有原始数据先用Protein chiP Software3.2.1做校正，使总离子强度及分子量达到均一，对位于2000Da～20000Da的质荷比峰值，用Biomarker Wizard软件过滤噪音，设置初始的噪音过滤值为5，二次信噪比为2，允许同一蛋白质峰在不同样本中的偏差小于0.3％，以10％为最小阈值，在总样本中出现的比率要大于10％进行聚类。

3.如权利要求1所述的乳腺癌早期诊断的唾液蛋白指纹图谱模型的构建方法，其特征在于，在步骤三中，对两组间相同M/Z的差异表达蛋白峰值做分类分析，经过进一步优化实验参数，确定最佳的分类模型，从而得到筛选乳腺癌早期诊断的唾液蛋白指纹图谱模型。

4.如权利要求1所述的乳腺癌早期诊断的唾液蛋白指纹图谱模型的构建方法，其特征在于，该乳腺癌早期诊断的唾液蛋白指纹图谱模型的构建方法步骤为：

步骤一，唾液标本的采集、处理和保存

步骤二，具体实验步骤：

步骤三，数据采集和生物信息学统计分析

(1)仪器校正及数据的采集

(2)生物信息学统计分析方法为：

第一步，指纹图谱标准化及蛋白质的初步筛选

第二步，显著差异蛋白峰的选择及诊断模型的建立

得到初步筛选结果后，由BiomarkerWizard3.1软件对初步筛选出来的蛋白质谱峰M/Z峰强度做用秩和检验，由BiomarkerWizard3.1软件自动完成，各组数据用士s表示，应用P值评价每一个蛋白质峰的相对重要性，P值越小说明这个蛋白质峰对区分两类样本越重要；

将Biomarker Wizard3.1软件处理后的差异蛋白质峰导入Biomaker Pattern Software5.0.2软件中，采用决策树分类算法对两组间相同质荷比的差异蛋白质峰做分类分析，建立决策树模型，进一步优化试验参数确定最佳的分类模型，即诊断模型；

第三步，诊断模型的评价指标

评价诊断试验的常用指标有灵敏度、特异度、Youden指数，

5.一种乳腺癌早期诊断的唾液蛋白指纹图谱模型，其特征在于，该乳腺癌早期诊断的唾液蛋白指纹图谱模型包括：质荷比(m/z)分别为4849.31，5224.96，3439.02和3559.89的人唾液蛋白质。