发明内容
针对现有技术中存在的上述不足,本发明提供了一种应用iTRAQ技术研究三阴性乳腺癌外泌体差异表达蛋白的方法。
为了解决上述技术问题,本发明采用了如下技术方案:
应用iTRAQ技术研究三阴性乳腺癌外泌体差异表达蛋白的方法,包括以下步骤:
(1)外泌体及外泌体蛋白质的提取处理;
(2)对步骤(1)所得外泌体蛋白样品进行酶解和除盐得到多肽;
(3)对步骤(2)所得多肽进行iTRAQ标记、混合;
(4)对步骤(3)标记的多肽肽段混合物进行HPLC分离及LC-MS分析;
(5)对上述所得到质谱鉴定结果进行生物信息学分析、定量分析获取三阴性乳腺癌外泌体差异表达蛋白。
作为本发明的一种优选方案,外泌体及外泌体蛋白的提取处理分为实验组和对照组,实验组A为三阴性乳腺癌患者血液样品、对照组B为HER2阳性的乳腺癌患者血液样品、对照组C为正常人的血液样品。
作为本发明的一种优选方案,步骤(1)中外泌体的提取采用美国101Bio的试剂盒
Exosome Isolation Kit从血浆中提取外泌体,外泌体蛋白的提取和处理包括蛋白裂解液裂解,DTT还原和IAM烷基化处理。
作为本发明的一种优选方案,步骤(2)中的蛋白质酶解及除盐方法为利用胰蛋白酶对外泌体中蛋白质进行酶解,利用C18柱对酶解后的肽段进行脱盐,真空冷冻干燥脱盐后的肽段得到多肽肽段。
作为本发明的一种优选方案,步骤(3)中多肽标记方法为采用iTRAQ-8标试剂盒(SCIEX)对多肽进行标记。
作为本发明的一种优选方案,步骤(4)具体包括:
a)HPLC分离多肽肽段混合物;
色谱仪:Ultimate 3000HPLC系统;
色谱柱:Durashell C18柱;
流动相:流动相A为2%乙腈/0.1%甲酸/98%H2O,缓冲液B为98%乙腈/0.1%甲酸/2%H2O;
流速:1ml/min;
样品采集:每分钟收集一个样品,共收集42个样品组分,合并样品组分为12个组分,并用Strata-X柱进行脱盐,真空干燥脱盐后的样品即得到多肽样品;
b)步骤a)真空干燥后的多肽样品溶解后进行质谱鉴定;
质谱仪:TripleTOF 5600plus+Eksigent nanoLC系统;
多肽样品溶液配制和捕获柱上样:将步骤a)真空干燥后的多肽样品溶解于2%乙腈/0.1%甲酸/98%H2O中得到多肽溶液,将配制的多肽溶液添加到C18捕获柱;
分析色谱柱:C18分析柱;
流动相:流动相A为2%乙腈/0.1%甲酸/98%H2O,缓冲液B为98%乙腈/0.1%甲酸/2%H2O;
洗脱梯度:将肽加载到C18捕获柱(5μm,100μm×20mm)上,并以300nL/min洗脱到C18分析柱(3μm,75μm×150mm)上,历时90分钟,具体洗脱方法为:0分钟,3%B;0-0.1分钟,3-7%B;0.1-66分钟,7-23%B;66-72分钟,23-50%B;72-75分钟,50-80%B;75-80分钟,80-80%B;80-80.1分钟,80-5%B;80.1-90分钟,5-5%B;
流速:300nL/min;
信息依赖性采集:以250ms的离子累积时间进行一级质谱图的扫描,以50ms的离子累积时间采集30个前体离子的二级质谱图,在350-1500m/z的范围内采集MS1光谱,并且在100-1500m/z的范围内采集MS2光谱,将前体离子动态排除时间设置为15s。
作为本发明的一种优选方案,步骤(5)中生物信息学分析和定量分析方法为:对MS/MS质谱数据经过系列优化处理后与数据库进行相似性比较打分从而进行蛋白鉴定,使用与AB Sciex 5600plus配套的搜索引擎——ProteinpilotTM V4.5进行检索鉴定,同时对proteinpilot的鉴定结果,做进一步过滤,对于鉴定到的蛋白,unused score≥1.3,可信度水平在95%以上,每个蛋白至少包含一个unique肽段的蛋白为可信蛋白,不符合该条件的蛋白不采纳;对于鉴定的肽段和蛋白质定量,以conf≥95过滤,可信度在95%以上作为可信肽段用于蛋白质定量,不符合该条件的肽段不采纳。
作为本发明的一种优选方案,定量鉴定获取的HER2阳性乳腺癌血液蛋白和正常血液蛋白的差异表达蛋白数为29,三阴性乳腺癌外泌体蛋白和HER2阳性乳腺癌血液蛋白的差异表达蛋白数为28,三阴性乳腺癌外泌体蛋白和正常血液蛋白的差异表达蛋白数分别为26,其中显著性差异蛋白质数目按照up_regulate≥1.5或down_regulate≤0.67,P_value≤0.05进行相应的筛选。
与现有技术相比,本发明具有如下优点:
1、本发明提供的iTRAQ技术结合MS/MS技术能快速有效对三阴性乳腺癌的外泌体蛋白进行研究,为研究三阴性乳腺癌的疾病机制以及发现三阴性乳腺癌相关的生物标志物提供参考。
2、该方法是一种高通量鉴定蛋白质方法,具有鉴定准确度高,通量大,无需人工序列解析等优点。
具体实施方式
下面结合附图和具体实施方式对本发明作进一步详细地描述。
在本发明实施例中,本发明提供了一种应用iTRAQ技术研究三阴性乳腺癌外泌体差异表达蛋白的方法。
本发明实施例中若无特别说明,所用试剂及耗材均为市售商品。
1材料与方法
1.1样品制备(模型建立)
3组血液样品,其中,实验组A为三阴性乳腺癌患者血液样品,对照组B为HER2阳性的乳腺癌患者血液样品,对照组C为正常人血液样品,其中实验组A三个样品,对照组B三个样品,对照组C两个样品,共8个样品,分别提取实验组A、对照组B、对照组C血液样品中的外泌体及外泌体蛋白,共8个样品,整个实验设计成一个8标iTRAQ。
1.2主要仪器及试剂
101Bio的试剂盒
Exosome Isolation Kit(for serum or plasma)(货号P101);蛋白裂解液:7M Urea/2M Thiourea/4%SDS/40mM Tris-HCl,pH8.5/1mM PMSF/2mM EDTA;胰蛋白酶;iTRAQ-8标试剂盒(SCIEX);液相色谱Ultimate 3000HPLC系统(ThermoDINOEX,USA);质谱Eksigent nanoLC系统(SCIEX,USA)+TripleTOF 5600plus质谱仪;搜索引擎AB Sciex 5600plus配套的ProteinpilotTM V4.5。
1.3外泌体的提取
应用美国101Bio的试剂盒
Exosome Isolation Kit(for serum orplasma)从实验组A、对照组B、对照组C的血浆中提取外泌体。具体步骤可直接参考试剂盒说明书。提取外泌体后,经电镜和粒径分析,获得的外泌体主要为30-150nm的小囊泡,证明提取的外泌体合格。
1.4外泌体蛋白质的提取和处理
分别取适量上述外泌体样品进行蛋白质提取和处理。向外泌体样品中加入蛋白裂解液(7M Urea/2M Thiourea/4%SDS/40mM Tris-HCl,pH 8.5/1mM PMSF/2mM EDTA),混匀后冰上孵育5min。加入终浓度为l0mM的DTT,冰浴超声15min。然后13000g,4℃离心20min。取上清液转入新的离心管中,向离心管中加入4倍体积的冷丙酮,在-20℃静置过夜。离心收集蛋白沉淀,空气中晾干。加入8M urea/100mM TEAB(pH 8.0)溶液重新溶解蛋白,加入DTT至终浓度10mM,56℃水浴30min进行还原反应。随后,加入IAM至终浓度55mM,暗处室温放置30min进行烷基化反应。Bradford法测定蛋白浓度。
1.5蛋白质的酶解及除盐
每个提取处理的蛋白质取等量进行胰蛋白酶消化。取100μg提取处理的外泌体蛋白质,用100mM TEAB溶液稀释5倍后,按1:50的质量比例(胰酶:蛋白)加入胰蛋白酶,37℃酶解过夜。酶解后的肽段用C18柱脱盐,真空冷冻干燥脱盐后的肽段得到多肽肽段。
1.6多肽进行iTRAQ标记、混合
用0.5M TEAB溶解上述多肽,根据iTRAQ-8标试剂盒(SCIEX)说明书进行标记,样本标记后混合,得到iTRAQ标记的多肽混合物。实验标记信息如表1:
表1实验标记信息表
1.7标记的多肽混合物进行HPLC分离及LC-MS分析
a)HPLC分离多肽肽段混合物;
色谱仪:Ultimate 3000HPLC系统(Thermo DINOEX,USA);
色谱柱:Durashell C18柱(5μm,
4.6×250mm);
流动相:流动相A(2%乙腈/0.1%甲酸/98%H2O),缓冲液B(98%乙腈/0.1%甲酸/2%H2O);
流速:1ml/min;
样品采集:每分钟收集一个样品,共收集42个样品组分,合并样品组分为12个组分,并用Strata-X柱进行脱盐,真空干燥脱盐后的样品即得到多肽样品;
b)步骤a)真空干燥后的多肽样品溶解后进行质谱鉴定;
质谱仪:TripleTOF 5600plus+Eksigent nanoLC系统(SCIEX,USA);
多肽样品溶液配制和捕获柱上样:将步骤a)真空干燥后的多肽样品溶解于2%乙腈/0.1%甲酸/98%H2O中得到多肽溶液,将配制的多肽溶液添加到C18捕获柱;
分析色谱柱:C18分析柱;
流动相:流动相A为2%乙腈/0.1%甲酸/98%H2O,缓冲液B为98%乙腈/0.1%甲酸/2%H2O;
洗脱梯度:将肽加载到C18捕获柱(5μm,100μm×20mm)上,并以300nL/min洗脱到C18分析柱(3μm,75μm×150mm)上,历时90分钟,具体洗脱方法如下:
时间 |
A% |
B% |
0min |
97% |
3% |
0.1min |
93% |
7% |
66min |
77% |
23% |
72min |
50% |
50% |
75min |
20% |
80% |
80min |
20% |
80% |
80.1min |
95% |
5% |
90min |
95% |
5% |
流速:300nL/min;
信息依赖性采集:以250ms的离子累积时间进行一级质谱图的扫描,以50ms的离子累积时间采集30个前体离子的二级质谱图,在350-1500m/z的范围内采集MS1光谱,并且在100-1500m/z的范围内采集MS2光谱,将前体离子动态排除时间设置为15s。
1.8蛋白质鉴定与数据分析
对MS/MS质谱数据经过系列优化处理后与数据库进行相似性比较打分从而进行蛋白鉴定,使用与AB Sciex 5600plus配套的搜索引擎——ProteinpilotTM V4.5进行检索鉴定,同时对proteinpilot的鉴定结果,做进一步过滤,对于鉴定到的蛋白,unused score≥1.3(即可信度水平在95%以上),每个蛋白至少包含一个unique肽段的蛋白为可信蛋白,不符合该条件的蛋白不采纳;对于鉴定的肽段和蛋白质定量,以conf≥95过滤,即可信度在95%以上作为可信肽段用于蛋白质定量,不符合该条件的肽段不采纳。
1.8.1Proteinpilot搜索参数设置
Proteinpilot搜索参数详见表2:
表2 Proteinpilot搜索参数
1.8.2鉴定结果统计
本次实验中,质谱产生的总的二级谱图数为165946、解析鉴定的二级谱图数为18960,鉴定肽段数为1488,鉴定蛋白数为159,具体情况请参见表3。
表3蛋白质鉴定信息统计总表
注:*表示可信度至少为95%,**表示至少含有2个unique肽段的鉴定蛋白质数目
1.8.3重复性分析
重复性分析指的是通过分析生物重复样品数据的再现性,以判断实验操作的重复性和仪器的稳定性,重复性分析主要从同一样品不同生物重复的CV值分析角度出发。CV(Coefficient of Variation)变异系数可以反映数据的离散程度,是数据标准方差和平均值的比值,用百分数表示,具体表达式为CV=(标准偏差SD/平均值MEAN)×100%。图1表示不同样品的CV值分布,从图1中可以看出,当CV的阈值设置在20%时,三组样品(TNBC、HER2、NC)的CV累计百分比分别为29.86%、29.17%、41.96%。
图2通过CV盒形图更加直观的显示出不同实验组CV值的对比,不同颜色的盒形图代表了不同实验组的CV分布,盒子的上下两边为上下四分位数线,盒子中间的黑色横线是数据中位数(数据中占据中间位置的数)。通过盒子的上下四分位数可以判断出,相对来说,组间样品的CV数据集中度相差不大。图2自左向右各个盒子的CV中位数分别为31.49%、25.52%,32.84%。
1.8.4Unique肽段数分布
Unique肽段为仅在一个蛋白质中存在的肽段。由这类型肽段的存在,可以唯一地确定相应蛋白质的存在。图3为本次实验鉴定到的所有蛋白所包含的unique肽段数的双坐标分布图,横坐标为蛋白质包含的unique肽段数,左侧纵坐标为与横坐标对应的蛋白数目;右侧纵坐标为与横坐标对应的累计蛋白比例,比如,若横坐标为2,左侧纵坐标为26,表示包含2个unique肽段的蛋白质数目为26,右侧纵坐标为48,则表示至多包含2个unique肽段的蛋白数占总数的48%,也即至少包含3个unique肽段的蛋白数占总数的52%。本项目中至少包含2个unique肽段的蛋白数为109,占总蛋白数的68.55%。
1.8.5肽段长度分布
每种质谱仪都有自身的测量范围,因此可鉴定到的肽段也有一定的长度限制。肽段过长或过短都无法在质谱仪中被检测到。如果鉴定结果中肽段普遍过低或普遍过高,则可能是蛋白酶选用不恰当。图4是本次鉴定到肽段的长度分布,其中,横坐标为肽段长度,纵坐标为对应长度包含肽段的数目。从该图可以看出鉴定到肽段的长度主要集中在7和20之间,其中长度为11的肽段最多,其平均鉴定的多肽长度为15.02,在肽段长度合理范围内。
1.8.6蛋白覆盖度分布
对于一个鉴定到的蛋白质,如果包含支持该蛋白的肽段数目越多,说明该蛋白的可信度越高。因此,蛋白质的鉴定覆盖度也能间接反映鉴定结果的整体准确性。图5蛋白质鉴定(95%可信度肽段)覆盖度分布饼图中不同颜色的饼代表了具有不同鉴定覆盖度范围的蛋白质百分比。从图5中可以看到,本项目鉴定覆盖度在[0,10%]范围内的蛋白质百分比为37.74%,覆盖度大于等于20%的蛋白占总蛋白的45.28%,平均蛋白质的鉴定覆盖度为22.96%。
1.8.7蛋白质定量
iTRAQ标记方法能够实现对多个样品同时进行相对定量,且定量具有较高的准确性。本发明使用Proteinpilot软件实现蛋白iTRAQ定量。针对含有生物重复或者技术重复的实验设计,首先利用重复样品间两两比较的比值的均值经过中位数归一化后作为待比较样品的差异倍数,其次利用重复样品间两两比较单样本Student’s t检验的p-value中的最小值作为待比较样品间的显著性差异检验P值。最后根据差异倍数和P_value来筛选出差异蛋白。当差异倍数达到1.5倍及以上(即up_regulate≥1.5和down_regulate≤0.67),且经过显著性统计检验其P_value值≤0.05时,视为显著差异蛋白。
1.8.8定量信息统计
在差异倍数≥1.5或者≤0.67倍,P_value≤0.05的条件下,两两样品间蛋白显著差异数分别为29(HER2:NC),28(TNBC:HER2),26(TNBC:NC),具体情况如下表4。
表4两两样品间蛋白显著差异数量
图6为HER2/NC、TNBC/HER2、TNBC/NC差异蛋白质集合韦恩图,从图中可以看出,三者所共有的差异蛋白质数目为10,占差异蛋白质并集(45)的22.22%。
1.8.9蛋白质丰度比(FC)分布
在相对定量时,如果同一个蛋白质的量在两个样品间没有显著的变化,那么其蛋白质丰度比接近于1。当蛋白的丰度比即差异倍数达到1.5倍以上(含1.5倍),且经统计检验其P_value值≤0.05时,视该蛋白为不同样品间的差异蛋白。对每个蛋白质差异倍数以2为底取对数后作出分布如图7。理论上对数化的比值分布近似服从正态分布。结果显示,蛋白比值分布能够很好地服从正态分布。
本发明提供的方法通过比较三阴性乳腺癌患者血液中外泌体蛋白、HER2阳性的乳腺癌患者血液中外泌体蛋白、正常人血液中外泌体蛋白,筛选出了三阴性乳腺癌的外泌体差异性表达蛋白,有助于从蛋白质组学角度挖掘三阴性乳腺癌的疾病机制,可为三阴性乳腺癌相关的生物标志物提供标靶。
最后说明的是,以上实施例仅用以说明本发明的技术方案而非限制,尽管参照较佳实施例对本发明进行了详细说明,本领域的普通技术人员应当理解,可以对本发明的技术方案进行修改或者等同替换,而不脱离本发明技术方案的宗旨和范围,其均应涵盖在本发明的权利要求范围当中。