CN102809600A - 用于一级相同质量二级b,y碎片离子对定量方法的数据分析方法 - Google Patents
用于一级相同质量二级b,y碎片离子对定量方法的数据分析方法 Download PDFInfo
- Publication number
- CN102809600A CN102809600A CN2012102499049A CN201210249904A CN102809600A CN 102809600 A CN102809600 A CN 102809600A CN 2012102499049 A CN2012102499049 A CN 2012102499049A CN 201210249904 A CN201210249904 A CN 201210249904A CN 102809600 A CN102809600 A CN 102809600A
- Authority
- CN
- China
- Prior art keywords
- quantitative
- fragmention
- section
- ratio
- mass spectra
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Landscapes
- Other Investigation Or Analysis Of Materials By Electrical Means (AREA)
Abstract
本发明涉及蛋白质组学技术领域,具体为一种用于一级相同质量二级b,y碎片离子对定量方法的数据分析方法,该方法采用Matlab语言编写,在Matlab界面下运行,其基于SEQUEST搜索引擎得到的蛋白定性结果,通过提取串级质谱中b,y碎片离子对的峰强度信息,做比值后得到肽段和蛋白的定量信息。该方法还加入了一个“谱图拆分”的优化模块,减少了b,y碎片离子对共碎裂谱图对肽段正确定性的影响。本发明还构造z统计量计算定量蛋白的显著性,为确定实际样品中上下调变化蛋白提供参考依据。本发明为一级相同质量二级b,y碎片离子对的定量蛋白质组学新方法的发展和应用,提供了一个通用的、开放的、准确的定量分析手段。
Description
技术领域
本发明属于蛋白质组学技术领域,具体涉及一个用于一级相同质量二级b,y碎片离子对定量方法的数据分析方法。
背景技术
定量蛋白质组学方法正在不断的完善和创新中,近来,一级相同质量二级b,y碎片离子对定量的蛋白质组学方法越来越受到关注和重视,但是目前缺乏有效的、自动化的大规模数据分析方法,仅有的一个相关分析软件Isobaric Q,主要是基于MASCOT搜索引擎产生的数据结果,而且不能用于所有的一级相同质量,二级b,y碎片离子对定量的蛋白质组学方法。另外,一级相同质量二级b,y碎片离子对定量的蛋白质组学方法在提供准确定量结果的同时,在定性方面,由于二级b,y碎片离子对共存的现象,可能会降低目标肽段的搜库分数,导致肽段定性信息的丢失,甚至错误匹配,进而影响后续定量的准确性。目前的数据库搜索引擎中,比如SEQUEST和MASCOT,还没有有效的模块进行该类串级质谱图的寻找、处理和优化。不过,在一级相同质量二级b,y碎片离子对定量的蛋白质组学方法中,由于目标肽段的串级质谱图存在具有固定质量差异的b,y碎片离子对,而不会像常规的串级质谱图,很难区分目标碎片峰、杂质峰和噪音峰,因此,该类定量方法可以利用目标定量肽段的具有固定质量差异的特征进行串级谱图优化。
发明内容
本发明的目的在于提供一个通用的、自动化的、开放的并适合于所有的一级相同质量二级b,y碎片离子对定量的蛋白质组学方法的数据分析方法。
本发明提出的一级相同质量二级b,y碎片离子对定量方法的数据分析方法,其包括以下步骤:
A、目标定量肽段的筛选:根据一级相同质量二级b,y碎片离子对定量蛋白质组学方法的不同,通过在Matlab界面中,设置不同的参数将目标定量肽段筛选出来。
B、目标定量肽段的理论b, y碎片离子计算:根据肽段在质谱仪中的碎裂规则,+2电荷的肽段只计算+1电荷的b,y碎片离子,+3、+4和+5电荷的肽段计算+1和+2电荷的b,y碎片离子。
C、目标定量肽段的理论b,y碎片离子同实际检测b,y碎片离子的匹配:根据所用质谱仪器的质量精确度,可以在Matlab界面中设定不同的b,y碎片离子质量误差,将质谱数据产生的肽段.DTA文件同上一步计算的目标定量肽段的理论b,y离子进行匹配。
D、目标定量肽段定量比值的计算:匹配合格的b,y离子做比值后,得到每对b,y离子对的定量比值,然后利用箱线图方法去除b,y离子对定量比值的异常值,然后计算b,y离子对的平均值作为所对应目标定量肽段的定量比值。
E、目标定量肽段所对应蛋白定量比值的计算:根据SEQUEST搜库结果,将肽段归属到相应的蛋白上,并且将多条肽段的定量比值进行平均得到所归属蛋白的定量比值。
本发明中,所述一级相同质量二级b,y碎片离子对定量蛋白质组学方法为体内终端氨基酸标记定量蛋白质组学方法。
本发明中,步骤(A)前还包括一步骤,具体如下:利用b,y碎片离子对存在固定质量差异的特征,将b,y碎片离子对共碎裂谱图进行拆分,得到相同背景离子,轻标或重标b,y碎片离子的串级谱图。“谱图拆分”减少了b,y碎片离子对共碎裂谱图对肽段正确定性的影响。
本发明中,步骤E后还包括一步骤考察定量蛋白的显著性,为确定实际样品中的上下调变化蛋白提供参考依据,显著性通过构造z统计量来计算得到,具体如下:
首先,每一个蛋白的定量比值除以整个数据集蛋白的平均定量比值得到该蛋白的归一化定量比值(r),其次,每一个蛋白的显著性通过构造z统计量来计算得到。具体来说,每一个定量蛋白的显著性可以被定义为 ,在这个公式中,如果,,z =,如果,z = 。(其中r代表归一化的蛋白质定量比值,代表所有定量比值的15.87百分位数,代表所有定量比值的50百分位数,代表所有定量比值的84.13百分位数。
分析实际样品时,为了得到发生上下调变化的蛋白,必须通过考察定量蛋白的显著性以及归一化比值来进行评判,推荐的定量蛋白的显著性应小于等于0.05。
本发明方法中,步骤A中所述在Matlab界面中,可以设置不同的参数,包括:蛋白酶切所用的酶、是否使用漏切肽段、目标肽段N端产生的质量增加值、目标肽段C端产生的质量增加值、肽段固定修饰产生的质量增加值、轻重标记肽段的质量增加绝对值。
本发明方法中,步骤D中所述的取b,y离子对的平均值作为所对应目标定量肽段的定量比值,选取n对以上b,y离子对的平均值作为所对应目标定量肽段的定量比值(n≥4,n为正整数),从而保证肽段定量的准确度。
本发明提出的用于一级相同质量二级b,y碎片离子对定量方法的数据分析方法,采用Matlab语言进行编写,在Matlab界面下进行运行。该数据分析方法首次基于SEQUEST搜索引擎得到的蛋白定性结果,通过提取串级质谱中b,y碎片离子对的峰强度信息,做比值后得到肽段和蛋白的定量信息。同时,为了避免串级质谱图中b,y碎片离子对共碎裂谱图对目标肽段正确定性的影响, 增加了“谱图拆分”的优化模块, 显著降低了b,y碎片离子对共碎裂谱图对正确定性的影响,大大提高了定性和定量数据的信息量。该发明为一级相同质量二级b, y碎片离子对定量蛋白质组学新方法的进一步发展和应用,提供了一个通用的、开放的、快速的、准确的和高效的定量分析手段。
附图说明
图1为筛选体内终端氨基酸标记定量蛋白质组学方法中的目标定量肽段时,Matlab界面的不同参数设置示意图。
图2为体内终端氨基酸标记定量蛋白质组学方法通过一级相同质量二级b,y碎片离子对定量方法的数据分析方法产生的定量信息示意图。
图3为一级相同质量二级b,y碎片离子对定量方法的数据分析方法中优化模块“谱图拆分”的原理示意图。
图4为三次1:1混合的体内终端氨基酸标记的HeLa细胞提取物的优化前和“谱图拆分”优化后的定量肽段和蛋白的数目、平均值、标准偏差和优化后定量肽段和蛋白增加的百分比。
图5为本发明中用于一级相同质量二级b,y碎片离子对定量方法的数据分析方法的流程示意图。
具体实施方式
下面的实施例是对本发明提出的一级相同质量二级b,y碎片离子对定量方法的数据分析方法的进一步说明。
如图5所示,为本发明中用于一级相同质量二级b,y碎片离子对定量方法的数据分析方法的流程示意图。
实施例1 一级相同质量二级b,y碎片离子对定量方法的数据分析方法(以体内终端氨基酸标记定量蛋白质组学方法产生的数据为例)
1) 目标定量肽段的筛选:体内终端氨基酸标记定量蛋白质组学方法中的目标定量肽段为赖氨酸开头精氨酸结尾的肽段,因此在Matlab界面中,设置不同的参数,如图1所示,将目标定量肽段筛选出来。
2) 目标定量肽段的理论b, y碎片离子计算:根据肽段在质谱仪中的碎裂规则,+2电荷的肽段只计算+1电荷的b,y碎片离子,+3、+4和+5电荷的肽段计算+1和+2电荷的b,y碎片离子。
3) 目标定量肽段的理论b,y碎片离子同实际检测b,y碎片离子的匹配:根据所用质谱仪器LTQ-Orbitrap的质量精确度,在Matlab界面中,设定串级质谱中b,y碎片离子的质量误差为1Da,如图1所示,接着将质谱数据产生的肽段.DTA文件同上一步计算的目标定量肽段的理论b,y离子进行匹配。
4) 目标定量肽段定量比值的计算:匹配合格的b,y离子做比值后,得到每对b,y离子对的定量比值,然后利用箱线图方法去除b,y离子对定量比值的异常值,再取大于等于6对b,y离子对的平均值作为所对应目标定量肽段的定量比值,从而保证肽段定量的准确度。
5) 目标定量肽段所对应蛋白定量比值的计算:根据SEQUEST搜库结果,将肽段归属到相应的蛋白上,并且将多条肽段的定量比值进行平均得到所归属蛋白的定量比值,如图2中部分定量蛋白的定量信息所示。
6) 目标定量肽段的优化:利用b,y碎片离子对存在固定质量差异的特征,将b,y碎片离子对共碎裂谱图进行拆分,如图3所示,得到相同背景离子,轻标或重标b,y碎片离子的串级谱图,然后再次通过SEQUEST搜索,得到目标肽段及其蛋白的定性和定量信息,三次1:1混合的体内终端氨基酸标记的HeLa细胞提取物的优化前及优化后的实验结果如图4所示,结果表明该优化模块在保证定量准确度的前提下,大大提高了定性肽段和定性蛋白的数目,提供了更多的定性和定量信息。
7) 定量蛋白的显著性计算:首先,每一个蛋白的定量比值除以整个数据集蛋白的平均定量比值得到该蛋白的归一化定量比值(r),如图2所示,其次,根据构造的z统计量公式,显著性可以被定义为 ,在这个公式中,如果,,z =,如果,z = ,其中r代表归一化的蛋白质定量比值,代表所有定量比值的15.87百分位数,代表所有定量比值的50百分位数,代表所有定量比值的84.13百分位数,计算出每一个定量蛋白的显著性,也如图2所示。
上述实施例仅用以说明而非限制本发明的技术方案。任何不脱离本发明精神和范围的技术方案均应涵盖在本发明的专利申请范围当中。
Claims (6)
1.一种用于一级相同质量二级b,y碎片离子对定量方法的数据分析方法,其特征在于具体步骤如下:
A、目标定量肽段的筛选:根据一级相同质量二级b,y碎片离子对定量蛋白质组学方法的不同,通过在Matlab界面中,设置不同的参数将目标定量肽段筛选出来;
B、目标定量肽段的理论b, y碎片离子计算:根据肽段在质谱仪中的碎裂规则,+2电荷的肽段只计算+1电荷的b,y碎片离子,+3、+4和+5电荷的肽段计算+1和+2电荷的b,y碎片离子;
C、目标定量肽段的理论b,y碎片离子同实际检测b,y碎片离子的匹配:根据所用质谱仪器的质量精确度,在Matlab界面中设定不同的b,y碎片离子质量误差,将质谱数据产生的肽段.DTA文件同上一步计算的目标定量肽段的理论b,y离子进行匹配;
D、目标定量肽段定量比值的计算:匹配合格的b,y离子做比值后,得到每对b,y离子对的定量比值,然后利用箱线图方法去除b,y离子对定量比值的异常值,再计算b,y离子对的平均值作为所对应目标定量肽段的定量比值;
E、目标定量肽段所对应蛋白定量比值的计算:根据SEQUEST搜库结果,将肽段归属到相应的蛋白上,并且将多条肽段的定量比值进行平均得到所归属蛋白的定量比值。
2.根据权利要求1所述的数据分析方法,其特征在于步骤(A)前还包括一步骤,具体如下:利用b,y碎片离子对存在固定质量差异的特征,将b,y碎片离子对共碎裂谱图进行拆分,得到相同背景离子,轻标或重标b,y碎片离子的串级谱图。
4.根据权利要求1或2或3所述的数据分析方法,其特征在于:步骤(A)中所述定量蛋白质组学方法为体内终端氨基酸标记定量蛋白质组学方法。
5.根据权利要求1或2或3所述的数据分析方法,其特征在于:步骤(A)所述Matlab界面中设置的参数包括蛋白酶切所用的酶、是否使用漏切肽段、目标肽段N端产生的质量增加值、目标肽段C端产生的质量增加值、肽段固定修饰产生的质量增加值、轻重标记肽段的质量增加绝对值。
6.根据权利要求1或2或3所述的数据分析方法,其特征在于:步骤(D)中计算肽段的定量比值时,用来进行定量的b,y离子对的对数大于等于4对。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN2012102499049A CN102809600A (zh) | 2012-07-19 | 2012-07-19 | 用于一级相同质量二级b,y碎片离子对定量方法的数据分析方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN2012102499049A CN102809600A (zh) | 2012-07-19 | 2012-07-19 | 用于一级相同质量二级b,y碎片离子对定量方法的数据分析方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN102809600A true CN102809600A (zh) | 2012-12-05 |
Family
ID=47233360
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN2012102499049A Pending CN102809600A (zh) | 2012-07-19 | 2012-07-19 | 用于一级相同质量二级b,y碎片离子对定量方法的数据分析方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN102809600A (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103115991A (zh) * | 2013-02-26 | 2013-05-22 | 湖南中烟工业有限责任公司 | 一种针对混合物质质谱图的谱库筛选方法 |
CN109839409A (zh) * | 2017-11-24 | 2019-06-04 | 江苏省农业科学院 | 一种采用电子鼻分辨辐照鸭肉制品袋内气味的方法 |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102243218A (zh) * | 2011-05-13 | 2011-11-16 | 复旦大学 | 体内终端氨基酸标记的定量蛋白质组学方法 |
-
2012
- 2012-07-19 CN CN2012102499049A patent/CN102809600A/zh active Pending
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102243218A (zh) * | 2011-05-13 | 2011-11-16 | 复旦大学 | 体内终端氨基酸标记的定量蛋白质组学方法 |
Non-Patent Citations (4)
Title |
---|
SHU-JUN YANG,ET AL: "A novel quantitative proteomics workflow by isobaric terminal labeling", 《JOURNAO OF PROTEOMICS》 * |
STEPHANE HOUEL,ET AL: "Quantifying the Impact of Chimera MS/MS Spectra on Peptide identification in Large-Scale Proteomics Studies", 《JOURNAL OF PROTEOME RESEARCH》 * |
白进发等: "合成多肽的电喷雾质谱研究", 《分析化学研究简报》 * |
聂爱英等: "In Vivo Termini Amino Acid Labeling for Quantitative Proteomics", 《ANALYTICAL CHEMISTRY》 * |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103115991A (zh) * | 2013-02-26 | 2013-05-22 | 湖南中烟工业有限责任公司 | 一种针对混合物质质谱图的谱库筛选方法 |
CN103115991B (zh) * | 2013-02-26 | 2014-11-26 | 湖南中烟工业有限责任公司 | 一种针对混合物质质谱图的谱库筛选方法 |
CN109839409A (zh) * | 2017-11-24 | 2019-06-04 | 江苏省农业科学院 | 一种采用电子鼻分辨辐照鸭肉制品袋内气味的方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Wichmann et al. | MaxQuant. Live enables global targeting of more than 25,000 peptides | |
Li et al. | A software suite for the generation and comparison of peptide arrays from sets of data collected by liquid chromatography-mass spectrometry* S | |
Vowinckel et al. | The beauty of being (label)-free: sample preparation methods for SWATH-MS and next-generation targeted proteomics | |
Audain et al. | In-depth analysis of protein inference algorithms using multiple search engines and well-defined metrics | |
Unwin et al. | A sensitive mass spectrometric method for hypothesis-driven detection of peptide post-translational modifications: multiple reaction monitoring-initiated detection and sequencing (MIDAS) | |
Yuan et al. | pParse: A method for accurate determination of monoisotopic peaks in high‐resolution mass spectra | |
CN107328842B (zh) | 基于质谱谱图的无标蛋白质定量方法 | |
US10309968B2 (en) | Methods and systems for assembly of protein sequences | |
CN103884806B (zh) | 结合二级质谱和机器学习算法的蛋白质组无标记定量方法 | |
US20100233815A1 (en) | Methods for the Development of a Biomolecule Assay | |
CN103698447B (zh) | 一种利用高能碰撞诱导电离碎裂技术鉴定蛋白的方法 | |
JP5855264B2 (ja) | N−型糖ペプチドの高スループット同定および定量のためのバイオインフォマティックスプラットフォーム | |
Ma | Challenges in computational analysis of mass spectrometry data for proteomics | |
CN104182658A (zh) | 一种串联质谱谱图鉴定方法 | |
Chen et al. | Mass spectrometry-based protein quantification | |
CN102809600A (zh) | 用于一级相同质量二级b,y碎片离子对定量方法的数据分析方法 | |
KR101311412B1 (ko) | 당 동정을 위한 새로운 생물정보처리 분석 방법 | |
Alves et al. | Robust accurate identification of peptides (RAId): deciphering MS2 data using a structured library search with de novo based statistics | |
Saito et al. | AYUMS: an algorithm for completely automatic quantitation based on LC-MS/MS proteome data and its application to the analysis of signal transduction | |
Sun et al. | BPDA2d—a 2D global optimization-based Bayesian peptide detection algorithm for liquid chromatograph–mass spectrometry | |
Yuan et al. | Features‐based deisotoping method for tandem mass spectra | |
Matthiesen et al. | Analysis of mass spectrometry data in proteomics | |
Gabdrakhmanov et al. | Proteomics of cellular response to stress: taking control of false positive results | |
CN110310706A (zh) | 一种蛋白质无标绝对定量方法 | |
Solovyeva et al. | viqc: Visual and intuitive quality control for mass spectrometry-based proteome analysis |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C02 | Deemed withdrawal of patent application after publication (patent law 2001) | ||
WD01 | Invention patent application deemed withdrawn after publication |
Application publication date: 20121205 |