CN104515797A - 乳腺癌早期诊断的唾液蛋白指纹图谱模型及其构建方法 - Google Patents

乳腺癌早期诊断的唾液蛋白指纹图谱模型及其构建方法 Download PDF

Info

Publication number
CN104515797A
CN104515797A CN201410232893.2A CN201410232893A CN104515797A CN 104515797 A CN104515797 A CN 104515797A CN 201410232893 A CN201410232893 A CN 201410232893A CN 104515797 A CN104515797 A CN 104515797A
Authority
CN
China
Prior art keywords
protein
chip
peak
mass
sialoprotein
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201410232893.2A
Other languages
English (en)
Inventor
吴正治
孙珂焕
曹美群
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shenzhen Second Peoples Hospital
Original Assignee
Shenzhen Second Peoples Hospital
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shenzhen Second Peoples Hospital filed Critical Shenzhen Second Peoples Hospital
Priority to CN201410232893.2A priority Critical patent/CN104515797A/zh
Publication of CN104515797A publication Critical patent/CN104515797A/zh
Pending legal-status Critical Current

Links

Landscapes

  • Other Investigation Or Analysis Of Materials By Electrical Means (AREA)
  • Investigating Or Analysing Biological Materials (AREA)

Abstract

本发明公开了一种乳腺癌早期诊断的唾液蛋白指纹图谱模型的构建方法,该乳腺癌早期诊断的唾液蛋白指纹图谱模型的构建方法包括以下步骤:收集乳腺癌和健康对照者的唾液,离心处理后,与NP20蛋白质芯片结合;采用PBSⅡ型蛋白质芯片阅读仪读取芯片,得到初步筛选结果后,对初步筛选出来的质荷比峰进行成组数据均数比较秩和检验;数据分析:用Biomaker Pattem Software采用决策树算法计算出多个变量变化对两样本的分类价值;该乳腺癌早期诊断的唾液蛋白指纹图谱模型包括:质荷比(m/z)分别为4849.31,5224.96,3439.02和3559.89的人唾液蛋白质。本发明将检测人唾液中相应的蛋白质的m/z与模型进行分析,就可以初步用于乳腺癌的诊断,预测准确率为78.02%,构建方法合理可行,操作简便,可批量处理。

Description

乳腺癌早期诊断的唾液蛋白指纹图谱模型及其构建方法
技术领域
本发明属于乳腺癌检测技术领域,尤其涉及一种乳腺癌早期诊断的唾液蛋白指纹图谱模型及其构建方法。
背景技术
乳腺癌是女性中最常见的恶性肿瘤。近年来,乳腺癌发病率在中国,尤其是发达地区,呈现快速增长的趋势,已跃居女性恶性肿瘤发病率之首。然而,目前临床上对于乳腺癌的早期诊断缺乏有效的手段。唾液由于其无创伤的体液收集方法在疾病诊断中具有特别的优势,早在1901年Michaels就率先用检查唾液成分作为诊断疾病的辅助工具,现唾液作为疾病诊断标本方面的价值已受到前所未有的重视。唾液是人体不可缺少的一种重要体液,血液成分如多种激素、氨基酸、电解质、免疫球蛋白、肌酐等均可通过毛细血管壁的进入唾液,作为人体体液的一部分,其成分含量的变化,受体内各种病理生理变化的影响。现代医学研究显示唾液是一种复杂的混合液,除99%是水分外,主要还含有一系列具有重要生物学功能的蛋白质和多肽。近年来国外唾液蛋白质组学研究已经引起广泛关注,2008年,美国南加州大学的丹尼(Denny)等研究显示人的唾液中有1166种蛋白质,其中大部分蛋白质能同时在血浆和泪液中找到,这些唾液蛋白具有多种生物学功能,在保护口腔和人体正常功能中具有重要作用。唾液作为一种成分复杂、具有多种生物学功能的重要体液,唾液中独特、丰富的蛋白质成分毫无疑问是潜在的肿瘤及疾病的理想的生物标记。长期以来,由于原有的技术限制了口腔唾液蛋白的通量分析和精确测定,使大多数唾液蛋白的生物功能处于未知状态,唾液在人体疾病中的诊断和预后判断中的潜在作用并未显现。随着高通量、高精度的蛋白质组学的应用,使得从唾液蛋白中寻找生物标记用于疾病的早期诊断预防、生物蛋白靶向治疗、预后监测判断等均已成为可能。表面增强激光解吸电离(Surface enhanced laser desorption/ionization,SELDI)蛋白质芯片技术是近几年迅速发展起来的一种蛋白质组学研究的新技术。SELDI克服了目前多种蛋白质检测技术的不足和局限,具有微量化、高通量、高灵敏度和高特异性的特点,而且可以对各种样本直接进行分析,特别是对双向凝胶电泳等方法难以检测的疏水蛋白和低丰度蛋白质具有良好分辨检测效果,能够检测分子量0—500kDa范围内的所有已知和未知的各类蛋白质。因此,SELDI一TOF一MS技术结合生物信息学方法有可能筛选出在乳腺癌和健康人唾液之间差异表达的新的候选肿瘤标志物,并可建立具有较高诊断效力且适用于早期诊断的分类检测模型。
发明内容
本发明实施例的目的在于提供一种乳腺癌早期诊断的唾液蛋白指纹图谱模型及其构建方法,旨在解决现有缺少乳腺癌诊断能力和早期诊断的分类检测模型的问题。
本发明实施例是这样实现的,一种乳腺癌早期诊断的唾液蛋白指纹图谱模型的构建方法,该乳腺癌早期诊断的唾液蛋白指纹图谱模型的构建方法包括以下步骤:
步骤一,收集乳腺癌和健康对照者的唾液,离心处理后,与NP20蛋白质芯片结合;
步骤二,采用PBSⅡ型蛋白质芯片阅读仪检测芯片,在每次采集数据使用ALL-In-One标准蛋白质芯片校正质谱仪,使分子量检测误差小于0.1%,蛋白质芯片阅读仪设置激光强度为220,灵敏度为9,收集数据的质荷比范围为2000M/Z~20000M/Z,优化范围为2000M/Z~15000M/Z,信号收集位置从20-80,收集总点数为140次,采用Proteinchip Software3.2.1分析软件自动采集数据,计算机以1x109Hz的速度从所获得的原始数据快速精确的绘制出蛋白指纹图谱,纵坐标为峰强度,横坐标为蛋白质质荷比;
步骤三,数据分析:所有原始数据先用Proteinchip Software3.2.1做校正,使总离子强度及分子量达到均一,对位于2000Da~20000Da的质荷比峰值用Biomarker Wizard3.1软件过滤噪音,设置初始的噪音过滤值为5,二次信噪比为2,允许同一蛋白质峰在不同样本中的偏差小于0.3%,以10%为最小阈值进行聚类,得到所有样本的质谱数据在2000Da~20000Da的蛋白质峰,得到初步筛选结果后,由Biomarker Wizard3.1软件对初步筛选出来的蛋白质谱峰M/Z峰强度做用秩和检验,由Biomarker Wizard3.1软件自动完成,各组数据用士s表示,应用P值评价每一个蛋白质峰的相对重要性,P值越小说明这个蛋白质峰对区分两类样本越重要,将Biomarker Wizard3.1软件处理后的差异蛋白质峰导入Biomaker Pattern Software5.0.2软件中,采用决策树分类算法对两组间相同质荷比的差异蛋白质峰做分类分析,建立决策树模型,进一步优化试验参数确定最佳的分类模型,即诊断模型,诊断模型的评价,评价诊断模型采用的指标有灵敏度、特异度、Youden指数。
进一步,在步骤二中,首先使用ALL-In-One标准蛋白质芯片校正质谱仪,使分子量检测误差小于0.1%,设定激光强度为220,灵敏度为9,收集数据的质荷比范围为2000Da~20000Da,优化范围为2000~15000,平均每点收集20次,所有原始数据先用Protein chiP Software3.2.1做校正,使总离子强度及分子量达到均一,对位于2000~20000的质荷比峰值,用Biomarker Wizard软件过滤噪音,设置初始的噪音过滤值为5,二次信噪比为2,允许同一蛋白质峰在不同样本中的偏差小于0.3%,以10%为最小阈值,在总样本中出现的比率要>10%进行聚类。
进一步,在步骤三中,对两组间相同M/Z的差异表达蛋白峰值做分类分析,经过进一步优化实验参数,确定最佳的分类模型,从而得到筛选乳腺癌早期诊断的唾液蛋白指纹图谱模型。
进一步,该乳腺癌早期诊断的唾液蛋白指纹图谱模型的构建方法步骤为:
步骤一,唾液标本的采集、处理和保存
所有样本均在早晨空腹下采集,采集时间为6:00AM~8:00AM,收集前一晚睡前不再进食及服用任何药物,采集前2h开始禁食水用清水漱口,后静坐于椅上,前5min内的唾液自然吞下后开始收集,口腔唾液积聚,吐入置于冰浴预冷的50mL离心管内,每个唾液样本采集2mL~5mL,每个样本采集完立即放入冰盒内;
所有采集的样品立即放入4℃冰箱静置1h后,以10000r/min在4℃下离心10min,冰浴上分装在1mlEP管中,每管50ul于-80℃冰箱保存,实验时由-80℃冰箱取出样本,冰上解冻,所有检测唾液样本均1次冻融,4℃下离心5min,备用;
步骤二,具体实验步骤:
(1)取出NP20芯片,在芯片背后标记时间,芯片种类,操作者的姓名资料,记下芯片号;
(2)取处理好的唾液上清,每条芯片的每个点直接上样4ul,自然晾干后重复上样一次;
(3)待干后,将芯片装入生物芯片处理器,在组装生物芯片处理器时,注意不要触碰加样孔,同时要将芯片上带有A的一头放在外端,注意密封;
(4)每孔加入10ul的HPLC水,置振荡器400转/分~600转/分,冰浴上震荡10分钟,甩去孔中液体,重复操作一次,立刻甩出,拍干,拆开芯片处理器,取出芯片,自然干燥;
(5)待芯片自然干燥后,在每个加样孔上加半饱和SPA溶液0.5ul,待干后重复点加一次,自然干燥,上机检测;
步骤三,数据采集和生物信息学统计分析
(1)仪器校正及数据的采集
采用PBSⅡ型蛋白质芯片阅读仪检测芯片,在每次采集数据使用ALL-In-One标准蛋白质芯片校正质谱仪,使分子量检测误差小于0.1%,蛋白质芯片阅读仪设置激光强度为220,灵敏度为9,收集数据的质荷比范围为2000M/Z~20000M/Z,优化范围为2000M/Z~15000M/Z,信号收集位置从20~80,收集总点数为140次,采用ProteinchipSoftware3.2.1分析软件自动采集数据,计算机以1x109Hz的速度从所获得的原始数据快速精确的绘制出蛋白指纹图谱,纵坐标为峰强度,横坐标为蛋白质质荷比;
(2)生物信息学统计分析方法为:
第一步,指纹图谱标准化及蛋白质的初步筛选
所有原始数据先用Proteinchip Software3.2.1做校正,使总离子强度及分子量达到均一,对位于2000Da~20000Da的质荷比峰值用Biomarker Wizard3.1软件过滤噪音,设置初始的噪音过滤值为5,二次信噪比为2,允许同一蛋白质峰在不同样本中的偏差小于0.3%,以10%为最小阈值进行聚类,得到所有样本的质谱数据在2000Da~20000Da的蛋白质峰;
第二步,显著差异蛋白峰的选择及诊断模型的建立
得到初步筛选结果后,由Biomarker Wizard3.1软件对初步筛选出来的蛋白质谱峰M/Z峰强度做用秩和检验,由Biomarker Wizard3.1软件自动完成,各组数据用士s表示,应用P值评价每一个蛋白质峰的相对重要性,P值越小说明这个蛋白质峰对区分两类样本越重要;
将Biomarker Wizard3.1软件处理后的差异蛋白质峰导入Biomaker PatternSoftware5.0.2软件中,采用决策树分类算法对两组间相同质荷比的差异蛋白质峰做分类分析,建立决策树模型,进一步优化试验参数确定最佳的分类模型,即诊断模型;
第三步,诊断模型的评价指标
评价诊断试验的常用指标有灵敏度、特异度、Youden指数,
灵敏度:实际患病且被诊断为阳性的概率就是灵敏度,只与病例组有关,反映了诊断试验检出病例的能力;
特异度:实际未患病且被诊断为阴性的概率就是特异度;也称真阴性率,即Spe=TN/(FP+TN),只与对照组有关,反映了诊断试验排除非病例的能力;
阳性预测值:试验阳性的病例中真阳性的比例就是阳性预测值,即+PV=TP/(TP+FP);
阴性预测值:试验阴性的病例中真阴性的比例就是阴性预测值即-PV=TN/(TN+FN);
Youdenz指数:真阳性率与假阳性率之差就是Youden指数,即灵敏度与特异度之和减去1,J=Sen+Spe-1,Youden指数的取值范围在(-1,+1)之间,值越接近+1,诊断准确性越好;
ROC曲线:受试者工作特征或相对工作特征曲线简称ROC曲线,ROC曲线的构建是以假阳性率即(1-特异度)为横轴,真阳性率即灵敏度为纵轴,横轴与纵轴长度相等,形成正方形,可揭示灵敏度和特异度的相互关系,是反映灵敏度和特异度连续变量的综合指标,可反映诊断试验的准确性大小,ROC曲线下面积越大,诊断价值就越高。
本发明实施例的另一目的在于提供一种乳腺癌早期诊断的唾液蛋白指纹图谱模型,该乳腺癌早期诊断的唾液蛋白指纹图谱模型包括:质荷比(m/z)分别为4849.31,5224.96,3439.02和3559.89的人唾液蛋白质。
本发明提供的乳腺癌早期诊断的唾液蛋白指纹图谱模型及其构建方法,提供建立主要由人唾液蛋白中质荷比(m/z)分别为4849.31,5224.96,3439.02和3559.89的四个唾液蛋白构成的蛋白指纹图谱模型,将检测人唾液中相应的蛋白质的m/z与模型进行分析,就可以初步用于乳腺癌的诊断,预测准确率为78.02%。本发明的构建方法合理可行,操作简便,可批量处理,较好的解决了现有缺少乳腺癌诊断能力和早期诊断的分类检测模型的问题。
附图说明
图1是本发明实施例提供的乳腺癌早期诊断的唾液蛋白指纹图谱模型的构建方法流程图;
图2是本发明实施例提供的乳腺癌患者和正常人的唾液蛋白质代表性图谱示意图;
图3是本发明实施例提供的区分乳腺癌和健康对照者的决策树模型;
图4是本发明实施例提供的M/Z为蛋白质峰4849.31和5224.96的质谱图及模拟胶图;
图5是本发明实施例提供的ROC曲线图。
具体实施方式
为了使本发明的目的、技术方案及优点更加清楚明白,以下结合实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
下面结合附图及具体实施例对本发明的应用原理作进一步描述。
本发明实施例的一种乳腺癌早期诊断的唾液蛋白指纹图谱模型,由蛋白质芯片飞行时间质谱仪系统检测的血清蛋白质图谱经过软件统计分析得到乳腺癌患者多个唾液特异蛋白质,并构建诊断模型,由质荷比(m/z)分别为4849.31,5224.96,3439.02和3559.89的人唾液蛋白质组成。
如图1所示,本发明实施例的乳腺癌早期诊断的唾液蛋白指纹图谱模型的构建方法包括以下步骤:
S101:收集乳腺癌和健康对照者的唾液,离心处理后,与NP20蛋白质芯片结合;
S102:采用PBSⅡ型蛋白质芯片阅读仪读取芯片,得到初步筛选结果后,对初步筛选出来的质荷比峰进行成组数据均数比较秩和检验;
S103:数据分析:用Biomaker Pattem Software采用决策树算法计算出多个变量变化对两样本的分类价值。
在步骤S102中,首先使用ALL-In-One标准蛋白质芯片校正质谱仪,使分子量检测误差<0.1%,设定激光强度为220,灵敏度为9,收集数据的质荷比范围为2000Da~20000Da,优化范围为2000~15000,平均每点收集20次。所有原始数据先用Protein chiP Software3.2.1做校正,使总离子强度及分子量达到均一。对位于2000~20000的质荷比峰值,用Biomarker Wizard软件过滤噪音,设置初始的噪音过滤值为5,二次信噪比为2,允许同一蛋白质峰在不同样本中的偏差<0.3%,以10%为最小阈值(在总样本中出现的比率要>10%)进行聚类;
在步骤S103中,对两组间相同M/Z的差异表达蛋白峰值做分类分析,经过进一步优化实验参数,确定最佳的分类模型,从而得到本发明筛选乳腺癌早期诊断的唾液蛋白指纹图谱模型。
以下结合本发明的具体实施例对本发明做进一步的说明:
步骤一,唾液标本的采集、处理和保存
所有样本均在早晨空腹下采集,采集时间为6:00AM~8:00AM,收集前一晚睡前不再进食及服用任何药物,采集前2h开始禁食水用清水漱口,后静坐于椅上,前5min内的唾液自然吞下后开始收集,口腔唾液积聚至一定量后,吐入置于冰浴预冷的50mL离心管内,每个唾液样本采集约2-5mL,每个样本采集完立即放入冰盒内;
所有采集的样品立即放入4℃冰箱静置1h后,以10000r/min在4℃下离心10min,冰浴上分装在1mlEP管中,每管50ul于-80℃冰箱保存,实验时由-80℃冰箱取出样本,冰上解冻,所有检测唾液样本均1次冻融,4℃下离心5min,备用;
步骤二,具体实验步骤
(1)小心的取出NP20芯片,在芯片背后标记时间,芯片种类,操作者的姓名等资料,记下芯片号;
(6)取处理好的唾液上清,每条芯片的每个点直接上样4ul,自然晾干后重复上样一次;
(7)待干后,将芯片装入生物芯片处理器(Bio-processor),在组装生物芯片处理器时,注意不要触碰加样孔,同时要将芯片上带有”A”的一头放在外端,注意密封;
(8)每孔加入10ul的HPLC水,置振荡器400-600转/分,冰浴上震荡10分钟,甩去孔中液体(注意不要甩的太干),重复操作一次,立刻甩出,拍干,拆开芯片处理器,取出芯片,自然干燥;
(9)待芯片自然干燥后,在每个加样孔上加半饱和SPA溶液0.5ul,待干后重复点加一次,自然干燥,上机检测;
步骤三,数据采集和生物信息学统计分析
(1)仪器校正及数据的采集
采用PBSⅡ型蛋白质芯片阅读仪检测芯片,在每次采集数据使用ALL-In-One标准蛋白质芯片校正质谱仪,使分子量检测误差<0.1%,蛋白质芯片阅读仪设置激光强度为220,灵敏度为9,收集数据的质荷比范围为2000M/Z~20000M/Z,优化范围为2000M/Z~15000M/Z,信号收集位置从20~80,收集总点数为140次,采用ProteinchipSoftware3.2.1分析软件自动采集数据,计算机以1x109Hz的速度从所获得的原始数据快速精确的绘制出蛋白指纹图谱,纵坐标为峰强度(蛋白质相对含量),横坐标为蛋白质质荷比(M/Z);
(2)生物信息学统计分析
a.指纹图谱标准化及蛋白质的初步筛选
所有原始数据先用Proteinchip Software3.2.1做校正,使总离子强度及分子量达到均一,对位于2000Da~20000Da的质荷比峰值用Biomarker Wizard3.1软件过滤噪音,设置初始的噪音过滤值为5,二次信噪比为2,允许同一蛋白质峰在不同样本中的偏差<0.3%,以10%为最小阈值进行聚类,得到所有样本的质谱数据在2000Da~20000Da的蛋白质峰;
b.显著差异蛋白峰的选择及诊断模型的建立
得到初步筛选结果后,由Biomarker Wizard3.1软件对初步筛选出来的蛋白质谱峰M/Z峰强度做用秩和检验,由Biomarker Wizard3.1软件自动完成,各组数据用士s表示,应用P值评价每一个蛋白质峰的相对重要性,P值越小说明这个蛋白质峰对区分两类样本越重要;
将Biomarker Wizard3.1软件处理后的差异蛋白质峰导入Biomaker PatternSoftware5.0.2软件中,采用决策树分类算法对两组间相同质荷比的差异蛋白质峰做分类分析,建立决策树模型,进一步优化试验参数等确定最佳的分类模型,即诊断模型;
c.诊断模型的评价指标
评价诊断试验的常用指标有灵敏度、特异度、Youden指数等,见诊断2×2四格表(表1);
表1诊断试验资料的2×2四格表
(1)灵敏度:实际患病且被诊断为阳性的概率就是灵敏度(sensitivity,Sen),也称真阳性率,即Sen=TP/(TP+FN),该指标只与病例组有关,反映了诊断试验检出病例的能力;
(2)特异度:实际未患病且被诊断为阴性的概率就是特异度(specificity,Spe);也称真阴性率,即Spe=TN/(FP+TN),该指标只与对照组有关,反映了诊断试验排除非病例的能力;
(3)阳性预测值:试验阳性的病例中真阳性的比例就是阳性预测值(positive predictive value,+PV),即+PV=TP/(TP+FP);
(4)阴性预测值:试验阴性的病例中真阴性的比例就是阴性预测值(negative predictive value,-PV),即-PV=TN/(TN+FN);
(5)Youdenz指数:真阳性率与假阳性率之差就是Youden指数(Youden’index,J),即灵敏度与特异度之和减去1,J=Sen+Spe-1,Youden指数的取值范围在(-1,+1)之间,其值越接近+1,诊断准确性越好;
(6)ROC曲线:受试者工作特征(Receiver Operating Characteristic)或相对工作特征(Relative Operating Character)曲线简称ROC曲线,ROC曲线的构建是以假阳性率即(1-特异度)为横轴,真阳性率即灵敏度为纵轴,横轴与纵轴长度相等,形成正方形,此构图法可揭示灵敏度和特异度的相互关系,是反映灵敏度和特异度连续变量的综合指标,可反映诊断试验的准确性大小,ROC曲线下面积越大,其诊断价值就越高。
结合结果和分析对本发明的使用效果做说明:
(1)通过SELDI-TOF-MS质谱仪对乳腺癌患者和正常人的唾液蛋白质表达模式进行分析,获得其表达图谱(图2),
(2)差异蛋白质峰的初步筛选和评价
对47例乳腺癌患者和44例健康人对照者血清蛋白质指纹图谱数据经聚类后共得到稳定表达的蛋白质峰311个,其中32个蛋白质峰在两组之间表达量有显著性差异(P<0.01),有14个蛋白质峰在乳腺癌组表达量增加,18个蛋白质峰在乳腺癌组表达下降。选取其中有有显著差异的11个蛋白质峰见表2。
表2乳腺癌患者与健康人不同蛋白质峰达量的比较(x士s)
(3)乳腺癌唾液诊断模型的建立
经BiomarkerPattern软件分析后,从上述差异蛋白质峰中选了M/Z为4849.31,5224.96,3439.02和3559.89Da的4个蛋白质峰用于构建分类决策树模型,具体决策树分类模型见图3。该模型中M/Z为4849.31,5224.96,3439.02和3559.89Da的蛋白质在乳腺癌组中表达下降,M/Z为4849.31和5224.96Da蛋白质峰表达质谱图及模拟胶图对比见图4。此模型分出5个终结点,训练组47例乳腺癌有44例被准确诊断,44例健康人全被正确诊断。灵敏度为91.4%(43/47),特异性为100%(44/44)。交叉验证总准确率为78.02%(71/91);灵敏度78.7%(37/47);特异度为77.2%(34/44)。进一步计算该模型的ROC曲线下面积为0.963,见图5,提示该模型可能具有较好的诊断价值。
实施例,鉴别乳腺癌和健康人
临床收集乳腺癌患者和健康人的唾液标本,按照上述步骤处理唾液标本和质谱检测唾液蛋白指纹图谱,采用BiomarkerPattern软件经本发明所申请的乳腺癌唾液蛋白决策树诊断模型判别分析,对比分析受检者唾液蛋白质中M/Z为4849.31,5224.96,3439.02和3559.89Da的4个蛋白质峰,四个蛋白峰表达差异均达到模型标准者,软件将判别诊断为乳腺癌,反之则为正常人。
以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等,均应包含在本发明的保护范围之内。

Claims (5)

1.一种乳腺癌早期诊断的唾液蛋白指纹图谱模型的构建方法,其特征在于,该乳腺癌早期诊断的唾液蛋白指纹图谱模型的构建方法包括以下步骤:
步骤一,收集乳腺癌和健康对照者的唾液,离心处理后,与NP20蛋白质芯片结合;
步骤二,采用PBSⅡ型蛋白质芯片阅读仪检测芯片,在每次采集数据使用ALL-In-One标准蛋白质芯片校正质谱仪,使分子量检测误差小于0.1%,蛋白质芯片阅读仪设置激光强度为220,灵敏度为9,收集数据的质荷比范围为2000M/Z~20000M/Z,优化范围为2000M/Z~15000M/Z,信号收集位置从20-80,收集总点数为140次,采用Proteinchip Software3.2.1分析软件自动采集数据,计算机以1x109Hz的速度从所获得的原始数据快速精确的绘制出蛋白指纹图谱,纵坐标为峰强度,横坐标为蛋白质质荷比;
步骤三,数据分析:所有原始数据先用Proteinchip Software3.2.1做校正,使总离子强度及分子量达到均一,对位于2000Da~20000Da的质荷比峰值用Biomarker Wizard3.1软件过滤噪音,设置初始的噪音过滤值为5,二次信噪比为2,允许同一蛋白质峰在不同样本中的偏差小于0.3%,以10%为最小阈值进行聚类,得到所有样本的质谱数据在2000Da~20000Da的蛋白质峰,得到初步筛选结果后,由Biomarker Wizard3.1软件对初步筛选出来的蛋白质谱峰M/Z峰强度做用秩和检验,由Biomarker Wizard3.1软件自动完成,各组数据用士s表示,应用P值评价每一个蛋白质峰的相对重要性,P值越小说明这个蛋白质峰对区分两类样本越重要,将Biomarker Wizard3.1软件处理后的差异蛋白质峰导入Biomaker Pattern Software5.0.2软件中,采用决策树分类算法对两组间相同质荷比的差异蛋白质峰做分类分析,建立决策树模型,进一步优化试验参数确定最佳的分类模型,即诊断模型,诊断模型的评价,评价诊断模型采用的指标有灵敏度、特异度、Youden指数。
2.如权利要求1所述的乳腺癌早期诊断的唾液蛋白指纹图谱模型的构建方法,其特征在于,在步骤二中,首先使用ALL-In-One标准蛋白质芯片校正质谱仪,使分子量检测误差小于0.1%,设定激光强度为220,灵敏度为9,收集数据的质荷比范围为2000Da~20000Da,优化范围为2000M/Z~15000M/Z,平均每点收集20次,所有原始数据先用Protein chiP Software3.2.1做校正,使总离子强度及分子量达到均一,对位于2000Da~20000Da的质荷比峰值,用Biomarker Wizard软件过滤噪音,设置初始的噪音过滤值为5,二次信噪比为2,允许同一蛋白质峰在不同样本中的偏差小于0.3%,以10%为最小阈值,在总样本中出现的比率要大于10%进行聚类。
3.如权利要求1所述的乳腺癌早期诊断的唾液蛋白指纹图谱模型的构建方法,其特征在于,在步骤三中,对两组间相同M/Z的差异表达蛋白峰值做分类分析,经过进一步优化实验参数,确定最佳的分类模型,从而得到筛选乳腺癌早期诊断的唾液蛋白指纹图谱模型。
4.如权利要求1所述的乳腺癌早期诊断的唾液蛋白指纹图谱模型的构建方法,其特征在于,该乳腺癌早期诊断的唾液蛋白指纹图谱模型的构建方法步骤为:
步骤一,唾液标本的采集、处理和保存
所有样本均在早晨空腹下采集,采集时间为6:00AM~8:00AM,收集前一晚睡前不再进食及服用任何药物,采集前2h开始禁食水用清水漱口,后静坐于椅上,前5min内的唾液自然吞下后开始收集,口腔唾液积聚,吐入置于冰浴预冷的50mL离心管内,每个唾液样本采集2mL~5mL,每个样本采集完立即放入冰盒内;
所有采集的样品立即放入4℃冰箱静置1h后,以10000r/min在4℃下离心10min,冰浴上分装在1mlEP管中,每管50ul于-80℃冰箱保存,实验时由-80℃冰箱取出样本,冰上解冻,所有检测唾液样本均1次冻融,4℃下离心5min,备用;
步骤二,具体实验步骤:
(1)取出NP20芯片,在芯片背后标记时间,芯片种类,操作者的姓名资料,记下芯片号;
(2)取处理好的唾液上清,每条芯片的每个点直接上样4ul,自然晾干后重复上样一次;
(3)待干后,将芯片装入生物芯片处理器,在组装生物芯片处理器时,注意不要触碰加样孔,同时要将芯片上带有A的一头放在外端,注意密封;
(4)每孔加入10ul的HPLC水,置振荡器400转/分~600转/分,冰浴上震荡10分钟,甩去孔中液体,重复操作一次,立刻甩出,拍干,拆开芯片处理器,取出芯片,自然干燥;
(5)待芯片自然干燥后,在每个加样孔上加半饱和SPA溶液0.5ul,待干后重复点加一次,自然干燥,上机检测;
步骤三,数据采集和生物信息学统计分析
(1)仪器校正及数据的采集
采用PBSⅡ型蛋白质芯片阅读仪检测芯片,在每次采集数据使用ALL-In-One标准蛋白质芯片校正质谱仪,使分子量检测误差小于0.1%,蛋白质芯片阅读仪设置激光强度为220,灵敏度为9,收集数据的质荷比范围为2000M/Z~20000M/Z,优化范围为2000M/Z~15000M/Z,信号收集位置从20~80,收集总点数为140次,采用ProteinchipSoftware3.2.1分析软件自动采集数据,计算机以1x109Hz的速度从所获得的原始数据快速精确的绘制出蛋白指纹图谱,纵坐标为峰强度,横坐标为蛋白质质荷比;
(2)生物信息学统计分析方法为:
第一步,指纹图谱标准化及蛋白质的初步筛选
所有原始数据先用Proteinchip Software3.2.1做校正,使总离子强度及分子量达到均一,对位于2000Da~20000Da的质荷比峰值用Biomarker Wizard3.1软件过滤噪音,设置初始的噪音过滤值为5,二次信噪比为2,允许同一蛋白质峰在不同样本中的偏差小于0.3%,以10%为最小阈值进行聚类,得到所有样本的质谱数据在2000Da~20000Da的蛋白质峰;
第二步,显著差异蛋白峰的选择及诊断模型的建立
得到初步筛选结果后,由BiomarkerWizard3.1软件对初步筛选出来的蛋白质谱峰M/Z峰强度做用秩和检验,由BiomarkerWizard3.1软件自动完成,各组数据用士s表示,应用P值评价每一个蛋白质峰的相对重要性,P值越小说明这个蛋白质峰对区分两类样本越重要;
将Biomarker Wizard3.1软件处理后的差异蛋白质峰导入Biomaker Pattern Software5.0.2软件中,采用决策树分类算法对两组间相同质荷比的差异蛋白质峰做分类分析,建立决策树模型,进一步优化试验参数确定最佳的分类模型,即诊断模型;
第三步,诊断模型的评价指标
评价诊断试验的常用指标有灵敏度、特异度、Youden指数,
灵敏度:实际患病且被诊断为阳性的概率就是灵敏度,只与病例组有关,反映了诊断试验检出病例的能力;
特异度:实际未患病且被诊断为阴性的概率就是特异度;也称真阴性率,即Spe=TN/(FP+TN),只与对照组有关,反映了诊断试验排除非病例的能力;
阳性预测值:试验阳性的病例中真阳性的比例就是阳性预测值,即+PV=TP/(TP+FP);
阴性预测值:试验阴性的病例中真阴性的比例就是阴性预测值即-PV=TN/(TN+FN);
Youdenz指数:真阳性率与假阳性率之差就是Youden指数,即灵敏度与特异度之和减去1,J=Sen+Spe-1,Youden指数的取值范围在(-1,+1)之间,值越接近+1,诊断准确性越好;
ROC曲线:受试者工作特征或相对工作特征曲线简称ROC曲线,ROC曲线的构建是以假阳性率即(1-特异度)为横轴,真阳性率即灵敏度为纵轴,横轴与纵轴长度相等,形成正方形,可揭示灵敏度和特异度的相互关系,是反映灵敏度和特异度连续变量的综合指标,可反映诊断试验的准确性大小,ROC曲线下面积越大,诊断价值就越高。
5.一种乳腺癌早期诊断的唾液蛋白指纹图谱模型,其特征在于,该乳腺癌早期诊断的唾液蛋白指纹图谱模型包括:质荷比(m/z)分别为4849.31,5224.96,3439.02和3559.89的人唾液蛋白质。
CN201410232893.2A 2014-05-29 2014-05-29 乳腺癌早期诊断的唾液蛋白指纹图谱模型及其构建方法 Pending CN104515797A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201410232893.2A CN104515797A (zh) 2014-05-29 2014-05-29 乳腺癌早期诊断的唾液蛋白指纹图谱模型及其构建方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201410232893.2A CN104515797A (zh) 2014-05-29 2014-05-29 乳腺癌早期诊断的唾液蛋白指纹图谱模型及其构建方法

Publications (1)

Publication Number Publication Date
CN104515797A true CN104515797A (zh) 2015-04-15

Family

ID=52791416

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201410232893.2A Pending CN104515797A (zh) 2014-05-29 2014-05-29 乳腺癌早期诊断的唾液蛋白指纹图谱模型及其构建方法

Country Status (1)

Country Link
CN (1) CN104515797A (zh)

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105628784A (zh) * 2016-03-23 2016-06-01 深圳市老年医学研究所 大肠癌唾液蛋白指纹图谱分子诊断模型建立方法
CN105699663A (zh) * 2016-04-06 2016-06-22 深圳市老年医学研究所 2型糖尿病唾液蛋白指纹图谱分子诊断模型建立方法
CN105699473A (zh) * 2016-03-23 2016-06-22 深圳市老年医学研究所 胃癌唾液蛋白指纹图谱分子诊断模型建立方法
CN105784829A (zh) * 2016-04-06 2016-07-20 深圳市老年医学研究所 2型糖尿病肾虚证唾液蛋白指纹图谱分子诊断模型建立方法
CN105842327A (zh) * 2016-03-23 2016-08-10 深圳市老年医学研究所 胃癌脾虚证唾液蛋白指纹图谱分子诊断模型建立方法
CN110210520A (zh) * 2019-05-10 2019-09-06 南京理工大学 基于单类别的乳腺癌数据分类方法
CN113436725A (zh) * 2021-06-24 2021-09-24 平安国际智慧城市科技股份有限公司 数据处理方法、系统、计算机设备及计算机可读存储介质
CN113702349A (zh) * 2021-07-12 2021-11-26 四川大学 一种基于拉曼光谱的涎腺肿瘤的诊断模型构建方法

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20110020836A1 (en) * 2009-05-21 2011-01-27 Rongxiu Li Process for differential polypeptides detection and uses thereof
CN102128876A (zh) * 2010-12-22 2011-07-20 浙江大学 筛选胰腺癌的血清蛋白质谱模型及其构建方法
US20110256560A1 (en) * 2008-10-20 2011-10-20 University Health Network Methods and compositions for the detection of ovarian cancer

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20110256560A1 (en) * 2008-10-20 2011-10-20 University Health Network Methods and compositions for the detection of ovarian cancer
US20110020836A1 (en) * 2009-05-21 2011-01-27 Rongxiu Li Process for differential polypeptides detection and uses thereof
CN102128876A (zh) * 2010-12-22 2011-07-20 浙江大学 筛选胰腺癌的血清蛋白质谱模型及其构建方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
曹美群 等: "唾液蛋白指纹图谱在乳腺癌中医辨证分型中的应用初探", 《深圳中西医结合杂志》 *
曹美群 等: "唾液蛋白指纹图谱在乳腺癌诊断中的应用", 《实用医学杂志》 *

Cited By (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105628784A (zh) * 2016-03-23 2016-06-01 深圳市老年医学研究所 大肠癌唾液蛋白指纹图谱分子诊断模型建立方法
CN105699473A (zh) * 2016-03-23 2016-06-22 深圳市老年医学研究所 胃癌唾液蛋白指纹图谱分子诊断模型建立方法
CN105842327A (zh) * 2016-03-23 2016-08-10 深圳市老年医学研究所 胃癌脾虚证唾液蛋白指纹图谱分子诊断模型建立方法
CN105842327B (zh) * 2016-03-23 2018-11-06 深圳市老年医学研究所 胃癌脾虚证唾液蛋白指纹图谱分子诊断模型建立方法
CN105699473B (zh) * 2016-03-23 2018-11-06 深圳市老年医学研究所 胃癌唾液蛋白指纹图谱分子诊断模型建立方法
CN105699663A (zh) * 2016-04-06 2016-06-22 深圳市老年医学研究所 2型糖尿病唾液蛋白指纹图谱分子诊断模型建立方法
CN105784829A (zh) * 2016-04-06 2016-07-20 深圳市老年医学研究所 2型糖尿病肾虚证唾液蛋白指纹图谱分子诊断模型建立方法
CN110210520A (zh) * 2019-05-10 2019-09-06 南京理工大学 基于单类别的乳腺癌数据分类方法
CN113436725A (zh) * 2021-06-24 2021-09-24 平安国际智慧城市科技股份有限公司 数据处理方法、系统、计算机设备及计算机可读存储介质
CN113702349A (zh) * 2021-07-12 2021-11-26 四川大学 一种基于拉曼光谱的涎腺肿瘤的诊断模型构建方法

Similar Documents

Publication Publication Date Title
CN104515797A (zh) 乳腺癌早期诊断的唾液蛋白指纹图谱模型及其构建方法
US20240087754A1 (en) Plasma based protein profiling for early stage lung cancer diagnosis
Bhattacharyya et al. Diagnosis of pancreatic cancer using serum proteomic profiling
CN105793710B (zh) 用于肺癌诊断的组合物、方法和试剂盒
CN104007169A (zh) 一种胃癌的唾液蛋白诊断模型及其建立方法
CN101210929A (zh) 检测子宫内膜异位症血浆标志蛋白质的方法
CN116559453A (zh) 一种用于肺癌检测的生物标志物
CN104007166A (zh) 一种慢性胃炎诊断的唾液蛋白诊断模型及其构建方法
Liu et al. Potential biomarkers for esophageal carcinoma detected by matrix-assisted laser desorption/ionization time-of-flight mass spectrometry
CN109580948A (zh) 基于二氢胸腺嘧啶代谢物的组合在结直肠癌诊断及预后预测中的应用
CN104007165A (zh) 筛选甲状腺癌的唾液蛋白质组决策树诊断模型及构建方法
Li et al. Postoperative recurrence analysis of breast cancer patients based on clinical serum markers using discriminant methods
CN101923080A (zh) 一种肺腺癌血清标志物蛋白质
CN114822854B (zh) 胃黏膜病变进展及胃癌相关尿蛋白标志物及其应用
CN111751551B (zh) 蛋白分子作为诊断肝硬化的生物标志物及其预后方法
CN116047074A (zh) 一种用于诊断和/或预测肺癌的标志物、诊断模型及其构建方法
Joseph et al. Plasma osteopontin velocity differentiates lung cancers from controls in a CT screening population
CN101354390A (zh) 鼻咽癌早期血清特异蛋白及其应用
CN111748624B (zh) 用于预测肝癌是否复发的生物标志物
CN108334747A (zh) 获取肿瘤尿蛋白标志物的方法及得到的肿瘤相关离群尿蛋白库
CN111413498A (zh) 一种肝细胞肝癌的自身抗体7-AAb检测panel及其应用
CN101074943A (zh) 一种检测尿液蛋白质指纹图谱的方法
CN101363837A (zh) 一种胰腺癌化疗药疗效评价方法
CN110993092A (zh) 一种基于n-糖指纹图谱和大数据算法鉴别肝硬化及肝癌的方法
CN109473174A (zh) 一种肝脏炎症指数的计算方法、系统、终端及可读介质

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20150415

WD01 Invention patent application deemed withdrawn after publication