CN109738532A - 一种自动解析稳定同位素标记糖链定量质谱数据的方法 - Google Patents
一种自动解析稳定同位素标记糖链定量质谱数据的方法 Download PDFInfo
- Publication number
- CN109738532A CN109738532A CN201811650390.1A CN201811650390A CN109738532A CN 109738532 A CN109738532 A CN 109738532A CN 201811650390 A CN201811650390 A CN 201811650390A CN 109738532 A CN109738532 A CN 109738532A
- Authority
- CN
- China
- Prior art keywords
- peak
- sugar chain
- quantitative
- isotope
- isotopic
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Landscapes
- Other Investigation Or Analysis Of Materials By Electrical Means (AREA)
Abstract
本发明属蛋白质分析技术领域,具体为一种自动解析稳定同位素标记糖链定量质谱数据的方法。本发明利用工具gQuant对MALDI‑MS产出的同位素标记的糖链质量校正从而进行准确相对定量;该工具充分考虑了同位素标记相对定量数据的特点,对同位素交叠进行了准确的校正,并且特别地利用糖链的理论同位素分布模式和质谱碎裂特性设了基于最高理论同位素强度峰定量的算法,对高分子量和低丰度的糖链组分具有更高的定量准确性和鲁棒性。
Description
技术领域
本发明属蛋白质分析技术领域,具体涉及一种对基质辅助激光解析质谱(MALDI-MS)产出的同位素标记的糖链质量校正从而进行准确相对定量的方法。
背景技术
基化作为一种重要的蛋白翻译后修饰,广泛参与生命体内的许多生物生理过程,包括精卵结合(细胞识别和相互作用),信号转导,蛋白折叠和蛋白半衰等。目前基于质谱的同位素标记定量技术是糖链定量手段中应用最广泛的技术之一。由于糖链结构的微观不均一性和糖苷键键能低导致的糖链质谱响应弱,面对海量的糖链定量质谱数据,手工分析不仅繁琐耗时,还容易产生定量误差,容易遗漏低丰度和低离子化效率糖组分的定量结果。当糖链上的同位素标记标签的质量差小的时候,容易因同位素交叠而影响定量的准确度。此外,随着糖链的分子量增加,糖链的理论同位素峰分布也出现相应改变,其最高理论同位素峰的位置也发生改变,传统利用单同位素峰强度进行定量的方法容易产生误差。
因此,本发明提出一种准确高通量自动解析稳定同位素标记糖链定量质谱数据的方法,该方法通过优化的定量基准峰选择算法和有效的同位素干扰校正,在定量分析大分子量和低丰度糖链、低同位素差异体系具有更高的定量准确性。
发明内容
本发明的目的在于克服现有定量分析工具的不足,提供一种高准确性、高通量自动解析稳定同位素标记糖链定量质谱数据的方法。
本发明的提供的自动解析稳定同位素标记糖链定量质谱数据的方法,基于糖链的理论同位素分布模式和质谱碎裂特性,通过最高理论同位素强度峰定量,对同位素交叠进行准确的校正,具体步骤如下:
(1)对公开数据库中的糖链信息,计算出对应的每种糖型对应的元素组成,计算出不同元素天然同位素的二项分布,并进行线性加和,生成理论同位素峰分布;
(2)根据步骤(1)的结果,挑选用于定量的同位素峰;
(3)对于标记质量差较小的同位素标记定量时,对同位素峰进行准确的校正和交叠部分扣除;
(4)通过校正以后的峰强度的比,输出定量结果。
本发明步骤(1)中,所述计算采用gQuant软件,计算数据库中糖链的理论同位素分布,所述数据库可以是理论糖链数据库1、实验获得糖链数据库2或者使用者指定的糖库;
由于质谱主要通过实验检测到的分子的质荷比和分子的理论质荷比匹配来确定这个分子具体是什么。分子理论质荷比都在数据库中,数据库有不同的分类,比如人的库,老鼠的库,细菌的库等等。这个软件中使用的数据库可以是软件中已经内置的一些公用数据库,也可以是使用者自行建立的数据库。
本发明步骤(2)中,所述挑选用于定量的同位素峰,是挑选强度最高的同位素峰进行定量;糖链同位素峰挑选原则为:分子量在2250以下的选择第一同位素峰作为定量基准峰,2250-3850的分子量中第二同位素峰作为定量基准峰,以此类推。
本发明步骤(3)中,所述对同位素峰进行准确校正,以单电荷的分子为例,采用如下算法:设H,L分别为轻、重标记选定的质谱谱峰报道值,Htrue, Ltrue为轻重标记的真实质谱峰强度,i表示最高强度同位素峰相比单同位素峰的位置,m(m/z)表示搜库出来的糖链对应在谱图上的真实质荷比,m表示相对分子质量,z表示质谱检测时的带电荷数,由于以单电荷为例,所以z就是1),因此,m/z=m;其中Ltrue、Htrue(轻、重同位素标签标记过后的分子的真实强度,及扣除同位素交叠后的强度),其前面的系数可以由gQuant软件直接导出;于是校正算式为:
△m表示所用的同位素标记试剂的轻重同位素质量数差异,特别地,△m≤6;l和 h分别表示数据库对应糖链的同位素峰分布的计算值;下标i,i+△m,i-△m分别表示选定用于积分的峰序数,选定用于积分的峰序数增加△m,选定用于积分的峰序数减去△m。
重同位素标签标记的分子扣除同位素交叠后的分子量为Htrue, 轻同位素标签标记的分子扣除同位素交叠后的分子量为 Ltrue,公式中包含了交叠部分的扣除。
本发明(4)中,所述通过校正以后的峰强度的比,输出定量结果,是将该糖链不同缀合物(如钠峰、加钾峰等)、不同价态的定量比值叠加,得到最终的定量比值,公式如下:
式中,第一项表示所有的缀合物的加和,将加纳峰加钾峰等等都加上,第二项表示所有的价态,将带一个电荷的、两个电荷的等等都加上。该公式表示,将检测到的、不同存在形式的这种分子的定量结果都考虑进来。
本发明中的算法通过python语言编写算法程序。
本发明方法基于糖链的理论同位素分布模式和质谱碎裂特性,通过最高理论同位素强度峰定量,对同位素交叠进行了准确的校正,对糖链特别是高分子量的糖链具有更高的定量准确性和鲁棒性。本发明为糖组学定量研究提供强有力的分析工具,并且在疾病研究和临床诊断分析中展示良好的应用前景。
本发明方法的优越性,在于准确性高,且计算方便。
附图说明
图1人糖链同位素峰分布相对强度理论分布(糖链组成来自Glyco DB1)。
图2 同位素峰交叠校准图示。
图3 ASF同一糖链在不同浓度相对定量质谱结果谱图。其中,(A) 1:1混合的样品MALDI-MS结果局部放大图;(B) 1:5 混合样品质谱结果。
具体实施方式
在去唾液酸胎球蛋白(ASF)一分为二,其中一份加入100 mM碳酸氢铵和PNGase F酶;另外一份加入用氧18水溶解的100 mM碳酸氢铵和PNGase F酶,37℃孵育16h后,分别进行10K超滤、PGC除盐、冻干,获得ASF的糖链。将获得的糖链按1:1和1:5两种比例混合后进行MALDI质谱检测,后用gquant进行数据分析。当糖链的m/z大于2250时,gGuant显示出优势,如图3中展示的糖链,gQuant分别报道两者定量比为1.084和4.816与理论值接近,而手工挑选但同位素峰计算的定量结果分别为1.4649和10.607。第二个比值的严重偏差产生于图示虚线红色峰积分面积受到谱图自身背景基线噪音的严重干扰,使得定量结果,而选用最高同位素峰能够在最大程度上减少低丰度组分的定量误差。
一般来说,每一个元素都有很多同位素,比如碳有C12,C13,氯有Cl 35,Cl 37。平时我们使用的相对分子质量是通过元素的平均质量的加和算的。然而在高精度的质谱中,对于氯元素,我们会看到 35和37两个峰,而不会看到35.5这个峰。质量最小的那个峰就叫单同位素峰/第一同位素峰(35),后面是第二同位素峰(37)。对于一个化合物,例如甲醛HCHO, 单同位素峰/第一同位素峰的带一个电荷的时候质荷比(m/z)是 1+12+1+16=30, 第二同位素峰是1+13+1+16=31,第三同位素峰是2+12+2+16=32,第四同位素峰是2+13+2+16=33,第五同位素峰是2+13+1+18=34。。。。依次类推。当化合物有几百个元素组成的时候,这个化合物的相对分子质量就不是一个具体的值,会看到几十个甚至几百个峰。对于一个分子式固定的分子,同位素峰之间的相对强度可以根据元素在自然界的丰度进行理论计算。分子量比较小的时候,第一同位素峰的相对强度最高,但是随着分子量的增加,第二同位素峰的相对强度会逐渐增加,甚至超过第一同位素峰,这就是图1的内容。
以往的算法,都采用第一个同位素峰作为定量的依据,当被分析物的分子量很大的时候,第一同位素峰强度很低,很容易被干扰。而本发明针对的糖分子,分子量就很大。因此在选取定量依据的时候,选取强度最高的同位素峰,尽量减少干扰。
此外,在质谱做定量的时候,往往是给要定量的分子反应上一个质量标签,再将它们混合检测,看相对强度,比如上述实施例,在要比较的两个糖链上分别标记16O和18O原子,在质谱检测的时候,会有2 Da的差,但是当分子有几十个同位素峰的时候,将带有两种质量标签的分子混合的时候,O16标记的分子的同位素峰一定会和O18标记的分子有交叠,影响真实的比例(图2),因此扣除同位素峰的影响就尤为重要。
参考文献
[1]Ranzinger R, Frank M d L C. Glycome-DB.org: a portal for queryingacross the digital world of carbohydrate sequences.[J]. Glycobiology, 2009,19(12):1563-1567.
[2]Liu M, Zhang Y, Chen Y, et al. Efficient and accurate glycopeptideidentification pipeline for high-throughput site-specific N-glycosylationanalysis.[J]. Journal of Proteome Research, 2014, 13(6):3121-3129.。
Claims (5)
1.一种自动解析稳定同位素标记糖链定量质谱数据的方法,其特征在于,基于糖链的理论同位素分布模式和质谱碎裂特性,通过最高理论同位素强度峰定量,对同位素交叠进行准确的校正,具体步骤如下:
(1)对公开数据库中的糖链信息,计算出对应的每种糖型对应的元素组成,计算出不同元素天然同位素的二项分布,并进行线性加和,生成理论同位素峰分布;
(2)根据步骤(1)的结果,挑选用于定量的同位素峰;
(3)对于标记质量差较小的同位素标记定量时,对同位素峰进行准确的校正和交叠部分扣除;
(4)通过校正以后的峰强度的比,输出定量结果。
2.根据权利要求1所述的方法,其特征在于,步骤(1)中所述采用gQuant软件计算数据库中糖链的理论同位素分布,所述数据库是理论糖链数据库、实验获得糖链数据库或者使用者指定的糖库。
3.根据权利要求2所述的方法,其特征在于,步骤(2)中所述挑选用于定量的同位素峰,是挑选强度最高的同位素峰进行定量;糖链同位素峰挑选原则为:分子量在2250以下的选择第一同位素峰作为定量基准峰,2250-3850的分子量中第二同位素峰作为定量基准峰,以此类推。
4.根据权利要求3所述的方法,其特征在于,步骤(3)中所述对同位素峰进行准确校正,对于单电荷的分子,采用如下算法:设H,L分别为轻、重标记选定的质谱谱峰报道值,Htrue,Ltrue为轻重标记的真实质谱峰强度,i表示最高强度同位素峰相比单同位素峰的位置,m表示搜库出来的糖链对应在谱图上的真实质荷比,Ltrue、Htrue前面的系数由gQuant软件直接导出;于是校正算式为:
式中,△m表示所用的同位素标记试剂的轻重同位素质量数差异,l和 h分别表示数据库对应糖链的同位素峰分布的计算值;下标i,i+△m,i-△m分别表示选定用于积分的峰序数,选定用于积分的峰序数增加△m,选定用于积分的峰序数减去△m。
5.根据权利要求4所述的方法,其特征在于,步骤(4)中所述通过校正以后的峰强度的比,输出定量结果,是将该糖链不同缀合物、不同价态的定量比值叠加,得到最终的定量比值,公式如下:
式中,第一项表示所有的缀合物的加和,将加纳峰加钾峰等等都加上,第二项表示所有的价态,将带一个电荷的、两个电荷的等等都加上。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811650390.1A CN109738532B (zh) | 2018-12-31 | 2018-12-31 | 一种自动解析稳定同位素标记糖链定量质谱数据的方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811650390.1A CN109738532B (zh) | 2018-12-31 | 2018-12-31 | 一种自动解析稳定同位素标记糖链定量质谱数据的方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN109738532A true CN109738532A (zh) | 2019-05-10 |
CN109738532B CN109738532B (zh) | 2022-07-22 |
Family
ID=66362953
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201811650390.1A Active CN109738532B (zh) | 2018-12-31 | 2018-12-31 | 一种自动解析稳定同位素标记糖链定量质谱数据的方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN109738532B (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110320297A (zh) * | 2019-07-04 | 2019-10-11 | 湘潭大学 | 一种自动校正质谱同位素分布曲线的方法 |
CN114894949A (zh) * | 2022-04-12 | 2022-08-12 | 北京清谱科技有限公司 | 一种脂质精细结构分析流程和控制处理系统 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101055558A (zh) * | 2006-04-14 | 2007-10-17 | 中国科学院计算技术研究所 | 基于质谱数据同位素模式的质谱有效峰选取方法 |
US20090026360A1 (en) * | 2005-05-13 | 2009-01-29 | Shimadzu Corporation | Mass analysis data analyzing apparatus and program thereof |
US20100114498A1 (en) * | 2007-02-08 | 2010-05-06 | Kun Soo Park | Method for determining isotopic clusters and monoisotopic masses of polypeptides on mass spectra of complex polypeptide mixtures and computer-readable medium thereof |
CN102445544A (zh) * | 2010-10-15 | 2012-05-09 | 中国科学院计算技术研究所 | 一种提高单同位素峰判断准确率的方法和系统 |
CN106018535A (zh) * | 2016-05-11 | 2016-10-12 | 中国科学院计算技术研究所 | 一种完整糖肽鉴定的方法与系统 |
-
2018
- 2018-12-31 CN CN201811650390.1A patent/CN109738532B/zh active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20090026360A1 (en) * | 2005-05-13 | 2009-01-29 | Shimadzu Corporation | Mass analysis data analyzing apparatus and program thereof |
CN101055558A (zh) * | 2006-04-14 | 2007-10-17 | 中国科学院计算技术研究所 | 基于质谱数据同位素模式的质谱有效峰选取方法 |
US20100114498A1 (en) * | 2007-02-08 | 2010-05-06 | Kun Soo Park | Method for determining isotopic clusters and monoisotopic masses of polypeptides on mass spectra of complex polypeptide mixtures and computer-readable medium thereof |
CN102445544A (zh) * | 2010-10-15 | 2012-05-09 | 中国科学院计算技术研究所 | 一种提高单同位素峰判断准确率的方法和系统 |
CN106018535A (zh) * | 2016-05-11 | 2016-10-12 | 中国科学院计算技术研究所 | 一种完整糖肽鉴定的方法与系统 |
Non-Patent Citations (3)
Title |
---|
CLEMENS GRÜNWALD-GRUBER等: "Determination of true ratios of different N-glycan structures in electrospray ionization mass spectrometry", 《ANAL BIOANAL CHEM》 * |
S. HUNTER WALKER等: "Individuality Normalization when Labeling with Isotopic Glycan Hydrazide Tags (INLIGHT): A Novel Glycan-Relative Quantification Strategy", 《J. AM. SOC. MASS SPECTROM.》 * |
张海燕等: "天然同位素信息在多级质谱裂解规律解析中的应用――以磺胺类化合物为例", 《质谱学报》 * |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110320297A (zh) * | 2019-07-04 | 2019-10-11 | 湘潭大学 | 一种自动校正质谱同位素分布曲线的方法 |
CN114894949A (zh) * | 2022-04-12 | 2022-08-12 | 北京清谱科技有限公司 | 一种脂质精细结构分析流程和控制处理系统 |
Also Published As
Publication number | Publication date |
---|---|
CN109738532B (zh) | 2022-07-22 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN103563043B (zh) | 用于样品定量化学分析的具有对仪器响应的校准的特别是医学领域的系统及其对应方法 | |
CN104614479A (zh) | 一种食品中维生素的检测方法 | |
Spanel et al. | Advances in on-line absolute trace gas analysis by SIFT-MS | |
CN106169411B (zh) | 新型串并联质谱装置系统及其参数调节方法和使用方法 | |
Brenna | High-precision gas isotope ratio mass spectrometry: recent advances in instrumentation and biomedical applications | |
CN109738532A (zh) | 一种自动解析稳定同位素标记糖链定量质谱数据的方法 | |
CN109073658B (zh) | 用于测定体液样品中的靶分析物的浓度的方法 | |
CN109061020A (zh) | 一种基于气相/液相色谱质谱平台的数据分析系统 | |
CN106062548A (zh) | 质谱分析方法及质谱分析装置 | |
Stricker et al. | Adduct annotation in liquid chromatography/high-resolution mass spectrometry to enhance compound identification | |
Scrimgeour et al. | Stable isotope analysis and applications | |
CN107860845A (zh) | 自动解析gc‑ms重叠峰准确识别化合物的方法 | |
CN109507315A (zh) | 复杂样本gc-ms自动解析实现化合物准确鉴别与差异性组分筛查的方法 | |
CN109187614A (zh) | 基于核磁共振和质谱的代谢组学数据融合方法及其应用 | |
Vogt et al. | Determination of the isotope enrichment of one or a mixture of two stable labelled tracers of the same compound using the complete isotopomer distribution of an ion fragment; theory and application to in vivo human tracer studies | |
CN110320302A (zh) | 快速测定甲氨蝶呤血药浓度的方法 | |
CN105424827A (zh) | 一种代谢组学数据随机误差的筛选和校正方法 | |
WO2020199866A1 (zh) | 生物代谢组学数据处理方法、分析方法及装置和应用 | |
CN104965020A (zh) | 多级质谱生物大分子结构鉴定方法 | |
CN105866313A (zh) | 快速测定含氮样品中氮同位素比值的方法 | |
Guerrasio et al. | Measurement uncertainty of isotopologue fractions in fluxomics determined via mass spectrometry | |
CN104122339A (zh) | D、13c或15n标记有机化合物的同位素丰度检测方法 | |
CN111220734B (zh) | 一种利用敏感代谢物评价潜伏缺素期作物营养状态的方法 | |
EP1891569B1 (en) | System and method for absolute quantitation of proteins using lc/ms | |
AU2020100892A4 (en) | A Measuring Method For Ne Isotope |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |