CN103698447B - 一种利用高能碰撞诱导电离碎裂技术鉴定蛋白的方法 - Google Patents

一种利用高能碰撞诱导电离碎裂技术鉴定蛋白的方法 Download PDF

Info

Publication number
CN103698447B
CN103698447B CN201210367352.1A CN201210367352A CN103698447B CN 103698447 B CN103698447 B CN 103698447B CN 201210367352 A CN201210367352 A CN 201210367352A CN 103698447 B CN103698447 B CN 103698447B
Authority
CN
China
Prior art keywords
ion
mass
peptide section
spectrum
isotopic peak
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201210367352.1A
Other languages
English (en)
Other versions
CN103698447A (zh
Inventor
徐平
李宁
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Institute of Radiation Medicine of CAMMS
Original Assignee
Institute of Radiation Medicine of CAMMS
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Institute of Radiation Medicine of CAMMS filed Critical Institute of Radiation Medicine of CAMMS
Priority to CN201210367352.1A priority Critical patent/CN103698447B/zh
Publication of CN103698447A publication Critical patent/CN103698447A/zh
Application granted granted Critical
Publication of CN103698447B publication Critical patent/CN103698447B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Other Investigation Or Analysis Of Materials By Electrical Means (AREA)

Abstract

本发明公开了一种利用高能碰撞碎裂技术(high?collision?induced?dissociation)鉴定蛋白的方法。本发明提供了一种利用高能碰撞碎裂技术鉴定未知目的蛋白的方法,包括主要步骤如下:用搜索引擎对获得的二级HCD质谱图进行候选肽段搜索并生成理论谱;再匹配所述实验谱与所述理论谱,输出鉴定结果;所述生成理论谱为同时进行生成理论b离子单一同位素峰质荷比、生成理论y离子单一同位素峰质荷比和对y离子增加第一同位素峰离子的质荷比。本发明的方法简单有效,可在不更改数据库搜索引擎数据结构和匹配打分算法下显著提升肽段鉴定灵敏度。

Description

一种利用高能碰撞诱导电离碎裂技术鉴定蛋白的方法
技术领域
本发明涉及生物信息学领域,尤其涉及一种利用高能碰撞诱导电离碎裂技术鉴定蛋白的方法。
背景技术
随着质谱技术的发展,高能碰撞碎裂技术(HCD,high-energycollisioninduceddissociation)被广泛用于蛋白质组表达谱和修饰谱的定性和定量鉴定中(Olsen,Maceketal.2007;Nagaraj,D'Souzaetal.2010;Savitski,Mathiesonetal.2010;deGraaf,Altelaaretal.2011;Frese,Altelaaretal.2011)。新一代的高精度质谱仪LTQ-OrbiTrapVelos的HCD二级图谱产出灵敏度与CID(collisioninduceddissociation)接近或相当,均高于电子转移碎裂(ETD,electrontransferdissociation)图谱,但HCD图谱质量更佳,具有更高的鉴定成功率(Frese,Altelaaretal.2011),这是因为HCD质谱数据具有以下特点:
(1)二级质量分辨率可达15000,质量精度可达ppm级别(Olsen,Maceketal.2007),可有效减少子离子错误匹配,从而显著提高肽段打分和图谱鉴定率。例如,Frese等人使用Hela细胞样品,系统比较了不同上样量条件下CID、HCD和ETD等三种裂解模式CID、HCD和ETD的MASCOT鉴定结果,发现HCD质谱数据具有最高的图谱匹配打分(ionscore)以及最高的图谱鉴定成功率(>50%)(Frese,Altelaaretal.2011)。Shen等人将高质量精度的二级离子信息用于肽段鉴定质控的特征参数,比常规的搜索引擎多过滤出20%-40%的肽段鉴定结果(Shen,etal.2011)。
(2)肽段碎裂充分,二级谱的离子连续性好。针对HCD图谱进行从头测序(denovo)效果较好。ShenY等人详细比较了相同方法下CID、HCD和电子转移碎裂(ETD)图谱得到的连续碎片离子长度,发现7个氨基酸以上的肽段鉴定结果中,HCD图谱具有最高的肽段鉴定数(Shen,Tolicetal.2011)。中科院计算所发展了专门针对HCD的质谱数据从头测序软件pNOVO,利用了二级碎裂离子高质量精度、低质量区域离子丰富、存在内部碎片(internal)和亚氨(immonium)离子等特点对HCD图谱从头测序,与常规搜索引擎鉴定结果重叠率达到80%以上,并可寻找脱酰胺基修饰和氨基酸突变(Chi,Sunetal.2010)。
(3)低质量区域碎片离子丰富,可提高iTRAQ报告离子碎裂峰强从而提高定量精度(McAlister,Phanstieletal.2010)。
(4)可产生internal离子和immonium离子,某些immonium离子是修饰鉴定的重要特征离子(Olsen,Maceketal.2007;Nagaraj,D'Souzaetal.2010)。
尽管HCD图谱质量更好,但现有的HCD数据搜索引擎和质量控制方法仍沿用CID数据的分析策略,未能充分利用HCD数据特点,相对于硬件的发展,HCD的数据分析算法和工具面临发展相对滞后的状态。
国际上专门针对HCD数据的分析方法非常有限,仅有的集中在HCD数据的预处理、鉴定结果质控和从头测序上。如Savitski等人设计了H-score,通过对HCD图谱进行去同位素峰(de-isotope)(Nielsen,Savitskietal.2005)和解卷积(de-convolution)(Zhang,Ficarroetal.2009),以及对MASCOT鉴定结果重打分来提高了肽段鉴定灵敏度(Savitski,Mathiesonetal.2010)。另一方面,使用蛋白质序列数据库搜索策略进行图谱鉴定时(其基本原理是产生肽段的理论碎裂图谱,并与实际图谱进行匹配,通过匹配相似性的好坏来鉴定序列),现有的数据库搜索引擎如MASCOT、SEQUEST和X!Tandem等仍产生较为简单的序列理论图谱,未充分利用HCD图谱特征,例如对碎片离子的相对峰强进行简单的模拟(Li,Arnoldetal.2010),不考虑高精度二级碎片离子的同位素峰信息及其它离子类型等,造成了HCD图谱鉴定灵敏度的损失。
综上所述,现有HCD数据解析面临以下问题:
(1)常规搜索引擎如MASCOT、SEQUEST和X!Tandem等并未针对HCD设计相应的理论图谱和匹配打分,对HCD的处理仍沿用与CID相同的理论谱和打分方法;
(2)肽段鉴定质控方法未充分利用HCD数据特征。如H-score并未将高质量精度、internal和immonium离子类型考虑在内,并且仅针对富含修饰的样品数据。MASCOTPercolator中也仅考虑了b、y离子匹配(Brosch,Yuetal.2009)。
(3)现有针对HCD图谱的从头测序算法考虑修饰类型有限,目前尚未见针对HCD数据的修饰类型预筛方法。
(4)在图谱库搜索方面,目前尚未出现针对HCD数据优化的图谱库构建方法和图谱库搜索引擎(Lam2011)。
随着HCD技术的不断进步,其在表达谱、修饰谱构建及蛋白质定量研究领域会发挥越来越重要的作用。了解和充分利用HCD数据特征,发展相应的鉴定、质控和定量算法,开发HCD质谱数据的深度解析平台是当务之急。
发明内容
本发明旨在利用HCD图谱二级碎裂离子具有丰富的同位素峰信息以及高质量精度特点,通过在理论谱中增加同位素峰信息来提高肽段鉴定的准确度、灵敏度和成功率。
本发明的目的是建立一种利用高能碰撞碎裂产生丰富的高精度二级同位素峰的高效鉴定未知目的蛋白的方法,尤其是提供一种利用高能碰撞碎裂鉴定待测蛋白的方法。
本发明提供的方法,包括如下步骤:
1)将待测蛋白酶解得到肽段;
2)将所述肽段经液相色谱质谱串联检测,得到二级HCD质谱图,记作实验谱;所述液相色谱-质谱串联中的二级质谱产生模式采用高能碰撞碎裂;检测采用高分辨质量检测器,由此产生二级HCD质谱图;
3)将所述二级HCD质谱图转换成数据库搜索引擎可读格式;
4)用搜索引擎先对经过3)处理的二级HCD质谱图进行候选肽段搜索并生成理论谱;再匹配所述实验谱与所述理论谱,输出鉴定结果;
所述生成理论谱为同时进行生成理论b离子单一同位素峰质荷比、生成理论y离子单一同位素峰质荷比和对y离子增加第一同位素峰离子的质荷比;
将所述生成理论y离子的单一同位素峰质荷比记作m/zyi述对y离子增加其第一同位素峰离子的质荷比记作m/zyi’,且m/zyi'=m/zyi+1.003355/z,yi代表候选肽段从C端开始数第i个肽键位置断裂后形成的y离子;yi'表示代表候选肽段从C端开始数第i个肽键位置断裂后形成的y离子的第一同位素峰,其中i=1,2,3,...L-1;L为候选肽段的长度;
5)将所述鉴定结果进行质量控制和错误发现率(falsediscoveryrate,FDR)计算,得到待测蛋白中肽段的序列和数目,实现鉴定待测蛋白之目的。
上述方法中,步骤1)中,所述酶为蛋白质组学研究中常用的蛋白酶,包括但不限于胰蛋白酶(trypsin);也可以为赖氨酸蛋白酶C(Lys-C)或者精氨酸蛋白酶C(Arg-C)等。这些酶都可以特异性切割蛋白质,而且都在强碱性氨基酸K或者R后面断裂,生成带有碱性氨基酸的肽段。
步骤4)中,所述候选肽段搜索为根据实验谱的母离子质量(酶解后肽段的质量),在目的蛋白质序列数据库中搜索出实验谱对应的候选肽段。
步骤3)中,所述转换采用的软件为质谱仪原始格式常用转换软件,包括但不局限于msconvert;所述数据库搜索引擎可读格式为二级质谱图格式,二级质谱图格式包括但不局限于mzXML、mgf、dta等;
步骤4)中,所述搜索引擎为常用蛋白质序列数据库搜索引擎,包括但不局限于X!Tandem、MASCOT、SEQUEST等;所述匹配实验谱与理论谱采用的公式包括但不局限于HyperScore公式(X!Tandem自带的);
步骤5)中,所述质量控制采用的软件为TPP;所述质量控制采用的算法为TPP软件中的PeptideProphet算法。
上述方法中,所述待测蛋白来源于酵母细胞;所述目的蛋白质序列数据库为酵母SGD数据库。
上述的方法在定性或定量鉴定蛋白质组表达谱或修饰谱中的应用也是本发明保护的范围。
本发明的实验证明,使用同位素峰添加后的理论谱进行肽段鉴定可显著提高肽段鉴定灵敏度。本发明通过一组实测数据分析,分别比较了仅考虑b离子、仅考虑y离子和b、y离子同时考虑三种类型,以及与不考虑同位素峰、仅考虑第一同位素峰、考虑第一和第二同位素峰、以及考虑第一、第二和第三同位素峰四种情况共12种组合,比较了高可信的肽段鉴定数,以最高的肽段鉴定数对应的离子类型和同位素峰个数作为最优组合。通过比较发现,仅考虑y离子和仅考虑第一同位素峰的组合获得最多的肽段鉴定数。本发明方法的优势在于简单有效,可在不更改现有数据库搜索引擎的数据结构和打分算法前提下实现鉴定灵敏度的提升和鉴定成功率的提高,鉴定更多的蛋白质。
附图说明
图1为X!Tandem在不同离子类型和同位素峰个数条件组合下生成理论谱后高可信肽段鉴定数比较
具体实施方式
下述实施例中所使用的实验方法如无特殊说明,均为常规方法。
下述实施例中所用的材料、试剂等,如无特殊说明,均可从商业途径得到。
实施例1、利用HCD串联二级质谱图数据分析鉴定肽段序列
1、酶解获得肽段
酿酒酵母菌株ATCC201388(BY4741,MATahis3delta1leu2delta0met15delta0ura3delta)购自美国典型菌种培养物保藏中心(AmericanTypeCultureCollection)。
菌株培养:使用YPD培养基培养酵母ATCC201388、30℃恒温摇床培养至OD600为1.5,5000rpm离心5分钟收集菌体,将上清液倒出,0.1%的叠氮钠磷酸盐缓冲液漂洗沉淀,离心去上清后收集菌体,置于-80℃冰箱冷冻保存。
菌体裂解:将尿素裂解液(8M尿素,50mM的碳酸氢铵,50mM的碘乙酰胺)加入到酵母菌体沉淀,再加入等菌体体积的玻璃珠,置于涡旋混合仪上最大转速涡旋裂解5min、13000rpm离心2min,收集上清液,即得到酵母蛋白样品。
蛋白酶解:将酵母蛋白样品用聚丙烯酰胺凝胶电泳富集,电泳时,待蛋白样品进入胶内0.5cm时停止电泳,考马斯亮蓝染色,脱色。将富集了样品的胶条切下,切成1mm3的胶粒,对胶粒进行脱色,干燥。加入酶解液(10ng/μL胰蛋白酶,50mM碳酸氢铵,5%乙腈),37度恒温培养箱过夜消化。
样品提取:消化后,加入酸溶液(5%甲酸,5%乙腈)终止酶解反应,离心取出上清液,加入乙腈进一步提取肽段样品,合并上清液并真空干燥,获得肽段干粉样品,置于-20度冰箱冷冻保存。
2、LC-MS检测获得HCD串联二级质谱图
液相采用Waters超高压高效液相色谱仪(nanoAcquityUltraPerformanceLC,Waters),分析柱为C18填料(3μm,)自制毛细管分析柱(75um*150mm).流动相A:2%乙腈,0.1%甲酸水溶液,流动相B:0.1%甲酸的乙腈溶液。洗脱条件:5-32min,流动相比例由5%B线性升至45%B,32-50min,流动相比例由45%线性升至50%。最后用80%流动相B冲洗10min。流动相流速为300nL/min,进样体积为3μL.
质谱仪为LTQ-OrbitrapVelos(美国,ThermoFisher)。使用纳喷离子源(Nanosprayionsource),喷雾电压2kV,毛细管温度为250度,质谱分析采用数据依赖的二级质谱扫描模式(DataDependentMS/MSScan)。一级质谱全扫描在Orbitrap中进行,分辨率为30000,质荷比范围为m/z300-1600。二级质谱检测在Orbitrap中进行,分辨率为7500。采用串联质谱扫描的动态排除功能(dynamicexclusion),排除时间为30s。依次选取一级质谱中离子丰度最强的前10个离子进行高能碰撞碎裂(HCD)分析。HCD碰撞室的碰撞气为高纯氦气(99.999%),最大累计时间为100ms,动态排除列表大小设置为150。归一化碰撞能量为40%。用于打二级碎裂的离子排除+1价离子和价态不确定的离子。
将上述肽段干粉样品按照上述条件进行LC-MS检测,得到肽段HCD质谱图组成的原始Raw文件,即为二级HCD质谱图,记作实验谱。
3、格式转换
从原始Raw文件中提取二级谱图(16,479张),用质谱文件格式转换工具msconvert(Kessner,Chambersetal.2008)转换成数据库搜索引擎可读格式mzXML文件。
转换不引入去同位素峰(de-isotope)过程,即保留HCD二级图谱中的同位素峰信息。
4、搜索、生成理论谱并进行匹配打分
对上述格式为mzXML文件的二级HCD质谱图使用X!Tandem搜索引擎在酵母SGD数据库(http://downloads.yeastgenome.org/sequence/S288C_reference/orf_protein/)进行候选多肽搜索;并将mzXML文件中每一张二级HCD质谱图中的每一个长度为L的候选肽段生成理论b离子的单一同位素峰质荷比m/zbi、生成理论y离子单一同位素峰质荷比m/zyi和对y离子增加第一同位素峰离子的质荷比m/zyi’;得到理论谱;
候选肽段搜索为根据实验谱的母离子质量(酶解后肽段的质量),在目的蛋白质序列数据库中搜索出实验谱对应的候选肽段;
上述搜索参数设为母离子质量误差=20ppm,子离子质量误差=0.1Da,全酶切搜库,固定修饰为半胱氨酸烷基化,可变修饰为甲硫氨酸氧化修饰,正反库混合搜索,反库由正库理论酶切肽段序列直接反转构成。
上述bi代表候选肽段从N端开始数第i个肽键位置断裂后形成的b离子,一共有L-1个b离子,其中i=1,2,3,...L-1;z为子离子电荷,m为子离子质量,bi放在m/z的下标,表示该bi离子的质荷比;
yi代表候选肽段从C端开始数第i个肽键位置断裂后形成的y离子,其中i=1,2,3,...L-1;
yi'表示代表候选肽段从C端开始数第i个肽键位置断裂后形成的y离子的第一同位素峰,其中i=1,2,3,...L-1;
其中m/zyi'满足:m/zyi'=m/zyi+1.003355/z,其中i=1,2,3,...L-1;
再将实验图谱和生成的理论图谱的相似度进行匹配打分,公式采用HyperScore(FenyoandBeavis2003),输出鉴定结果。其中每张图谱挑选HyperScore最高的肽段作为该图谱的鉴定结果,HyperScore的计算由X!Tandem内嵌函数自动实现。
HyperScore的具体计算公式为:
HyperScore = ( Σ j = 0 n I j P j ) N b ! N y !
其中Ij为实验二级谱子离子峰强;Pj表示理论谱中是否存在该子离子,存在为1,不存在为0;n表示实验谱中子离子总数;Nb表示匹配上的b离子个数,Ny表示匹配上的y离子个数。
5、肽段鉴定质量控制和错误发现率(falsediscoveryrate,FDR)的计算
对上述鉴定结果进行质量控制和FDR计算,质量控制采用TPP(Deutsch,Mendozaetal.2010)软件包(v4.4)中PeptideProphet算法(Keller,Nesvizhskiietal.2002)计算肽段鉴定的正确概率,取肽段鉴定错误发现率FDR<1%对应阈值为卡值,在FDR<1%条件下获得肽序列高可信鉴定结果。其中肽段鉴定的FDR计算采取了正反数据库搜索策略(EliasandGygi2007)。
结果得到3928个高可信肽段鉴定结果(FDR<1%),图谱鉴定率为23.84%。
对照:将上述3得到转换格式后的16,479张肽段的HCD二级质谱图采用常规的X!Tandem搜索引擎生成候选肽段的理论谱(对照),并进行图谱匹配。方法与上述4基本相同,不同的是,仅生成理论b离子m/zbi和理论y离子m/zyi,不再对y离子m/zyi增加其第一同位素峰m/zyi’。
结果得到3679个高可信肽段鉴定结果(FDR<1%),图谱鉴定率为22.33%。
从上述结果可以看出,使用一组HCD酵母数据集进行评估发现,肽段鉴定数较原版X!Tandem鉴定肽段数提高了7%左右,图谱鉴定成功率提高了近2%左右,说明了本理论谱生成算法的有效性。
实施例2、利用HCD串联二级质谱图数据分析鉴定肽段序列的优化
将实施例1的2得到16,479张肽段的HCD二级质谱图按照实施例1的步骤3和步骤4的基本方法进行如下8组处理:
C1是添加第一同位素峰,“onlyy”是仅添加y离子的同位素峰。“onlyy”+C1即为最佳条件,即仅添加y离子的第一同位素峰。C0表示不添加同位素峰。
A、“b&y”+C0处理组(为实例1中对照组)
B、“b&y”+C1处理组
B.1)格式转换:与实施例1步骤3方法相同;
B.2)搜索、生成理论谱并进行匹配打分:与实施例1步骤4基本相同,不同之处在于在理论谱中除生成候选肽段的b、y离子单一同位素峰质荷比和添加y离子的第一同位素峰质荷比外,同时添加b离子的第一同位素峰质荷比m/zbi’,满足:
m/zbi'=m/zbi+1.003355/z,其中i=1,2,3,...L-1;
B.3)质量控制和FDR值的计算:与实施例1步骤5方法相同。
C、“b&y”+C2处理组
C.1)格式转换:与实施例1步骤3方法相同;
C.2)搜索、生成理论谱并进行匹配打分:与实施例1步骤4基本相同,不同之处在于在理论谱中除生成候选肽段的b、y离子单一同位素峰质荷比和添加y离子的第一同位素峰质荷比外,同时添加b离子的第一、第二同位素峰质荷比m/zbi’和m/zbi”,以及y离子的第二同位素峰质荷比m/zyi”,分别满足:
m/zbi'=m/zbi+1.003355/z,
m/zbi”=m/zbi+2*1.003355/z,
m/zyi”=m/zyi+2*1.003355/z,其中i=1,2,3,...L-1;
C.3)质量控制和FDR值的计算:与实施例1步骤5方法相同。
D、“b&y”+C3处理组
D.1)格式转换:与实施例1步骤3方法相同.
D.2)搜索、生成理论谱并进行匹配打分:与实施例1步骤4基本相同,不同之处在于在理论谱中除生成候选肽段的b、y离子单一同位素峰质荷比和添加y离子的第一同位素峰质荷比外,同时添加b离子的第一、第二、第三同位素峰质荷比m/zbi’、m/zbi”和m/zbi”’,以及y离子的第二、第三同位素峰质荷比m/zyi”和m/zyi”’,分别满足:
m/zbi’=m/zbi+1.003355/z,
m/zbi”=m/zbi+2*1.003355/z,
m/zbi”’=m/zbi+3*1.003355/z,
m/zyi”=m/zyi+2*1.003355/z,
m/zyi”’=m/zyi+3*1.003355/z,其中i=1,2,3,...L-1;
D.3)质量控制和FDR值的计算:与实施例1的步骤5方法相同。
E、“onlyy”+C0处理组:同实例1)中对照组
F、“onlyy”+C1处理组:同实例1)中实验组
G、“onlyy”+C2处理组
G.1)格式转换:与实施例1步骤3方法相同.
G.2)搜索、生成理论谱并进行匹配打分:与实施例1步骤4基本相同,不同之处在于在理论谱中除生成候选肽段的b、y离子单一同位素峰质荷比和添加y离子的第一同位素峰质荷比外,同时添加y离子的第二同位素峰质荷比m/zbi”,满足:
m/zyi”=m/zyi+2*1.003355/z,其中i=1,2,3,...L-1;
G.3)质量控制和FDR值的计算:与实施例1步骤5方法相同。
H、“onlyy”+C3处理组
H.1)格式转换:与实施例1步骤3方法相同.
H.2)搜索、生成理论谱并进行匹配打分:与实施例1步骤4基本相同,不同之处在于在理论谱中除生成候选肽段的b、y离子单一同位素峰质荷比和添加y离子的第一同位素峰质荷比外,同时添加y离子的第二、第三同位素峰质荷比m/zyi”和m/zyi”’,分别满足:
m/zyi”=m/zyi+2*1.003355/z,
m/zyi”’=m/zyi+3*1.003355/z,其中i=1,2,3,...L-1;
H.3)质量控制和FDR值的计算:与实施例1步骤5方法相同。
上述8组的结果如图1所示,其中C0表示在理论二级图谱中不考虑添加碎片离子的非单一同位素峰,仅保留理论b、y离子单一同位素峰的m/z信息。C1表示仅考虑碎片离子第一同位素峰,C2表示考虑第一和第二同位素峰,C3表示考虑第一、第二和第三同位素峰。“b&y”表示对理论谱中的b离子和y离子同时进行C1,C2和C3处理,“onlyy”表示仅对y离子进行上述处理;由图1可以看到,“onlyy”和C1条件组合(实施例1)获得最多的高可信肽段鉴定,即仅针对y离子添加第一同位素峰在相同卡值标准条件下(FDR<1%)比C0组多出约7%的肽段鉴定结果,图谱解析率提高约2%。

Claims (5)

1.一种利用高能碰撞碎裂鉴定待测蛋白的方法,包括如下步骤:
1)将待测蛋白酶解得到肽段;
2)将所述肽段经液相色谱质谱串联检测,得到二级HCD质谱图,记作实验谱;所述液相色谱质谱串联中的二级质谱产生模式采用高能碰撞碎裂;
3)将所述二级HCD质谱图转换成数据库搜索引擎可读格式;
4)用搜索引擎先对经过3)处理的二级HCD质谱图进行候选肽段搜索并生成理论谱;再匹配所述实验谱与所述理论谱,输出鉴定结果;
所述生成理论谱为同时进行生成理论b离子单一同位素峰质荷比、生成理论y离子单一同位素峰质荷比和对y离子仅增加第一同位素峰离子的质荷比;
将所述生成理论y离子的单一同位素峰质荷比记作m/zyi,所述对y离子增加其第一同位素峰离子的质荷比记作m/zyi',且m/zyi'=m/zyi+1.003355/z,yi代表候选肽段从C端开始数第i个肽键位置断裂后形成的y离子;yi'代表候选肽段从C端开始数第i个肽键位置断裂后形成的y离子的第一同位素峰,其中i=1,2,3,...L-1;L为候选肽段的长度;
5)将所述鉴定结果进行质量控制和错误发现率计算,得到待测蛋白中肽段的序列和数目,实现鉴定待测蛋白。
2.根据权利要求1所述的方法,其特征在于:
步骤1)中,所述酶是蛋白酶,所述蛋白酶具体为胰蛋白酶、赖氨酸蛋白酶C或精氨酸蛋白酶C;
步骤4)中,所述候选肽段搜索为根据所述实验谱的母离子质量,在目的蛋白质序列数据库中搜索出实验谱对应的候选肽段。
3.根据权利要求1或2所述的方法,其特征在于:
步骤3)中,所述转换采用的软件为质谱仪原始格式转换软件,所述质谱仪原始格式转换软件具体为msconvert;所述数据库搜索引擎可读格式为二级质谱图格式,二级质谱图格式具体为mzXML、mgf或dta;
步骤4)中,所述搜索引擎为蛋白质序列数据库搜索引擎,所述蛋白质序列数据库搜索引擎具体为X!Tandem、MASCOT或SEQUEST;所述匹配实验谱与理论谱匹配采用的公式为HyperScore公式;
步骤5)中,所述质量控制采用的软件为TPP;所述质量控制采用的算法为TPP软件中的PeptideProphet算法。
4.根据权利要求1或2所述的方法,其特征在于:
所述待测蛋白来源于酵母细胞;所述目的蛋白质序列数据库为酵母SGD数据库。
5.权利要求1-4中任一所述的方法在定性或定量鉴定蛋白质组表达谱或修饰谱中的应用。
CN201210367352.1A 2012-09-28 2012-09-28 一种利用高能碰撞诱导电离碎裂技术鉴定蛋白的方法 Active CN103698447B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201210367352.1A CN103698447B (zh) 2012-09-28 2012-09-28 一种利用高能碰撞诱导电离碎裂技术鉴定蛋白的方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201210367352.1A CN103698447B (zh) 2012-09-28 2012-09-28 一种利用高能碰撞诱导电离碎裂技术鉴定蛋白的方法

Publications (2)

Publication Number Publication Date
CN103698447A CN103698447A (zh) 2014-04-02
CN103698447B true CN103698447B (zh) 2015-12-16

Family

ID=50360046

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201210367352.1A Active CN103698447B (zh) 2012-09-28 2012-09-28 一种利用高能碰撞诱导电离碎裂技术鉴定蛋白的方法

Country Status (1)

Country Link
CN (1) CN103698447B (zh)

Families Citing this family (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105606739A (zh) * 2016-02-25 2016-05-25 山东省食品药品检验研究院 一种无对照品下鉴定中成药中非法添加二氧丙嗪的Q-Orbitrap高分辨质谱法
CN107525842B (zh) * 2016-06-22 2020-08-11 中国科学院大连化学物理研究所 一种用于研究蛋白质结构或蛋白质相互作用的分析方法
CN107563148B (zh) * 2017-08-16 2020-06-05 中国科学院计算技术研究所 一种基于离子索引的整体蛋白质鉴定方法与系统
CN107727727B (zh) * 2017-11-13 2020-11-20 复旦大学 一种蛋白质鉴定方法及系统
CN109900814B (zh) * 2017-12-08 2021-06-08 中国科学院大连化学物理研究所 基于糖苷键质谱可碎裂型化学交联剂的分析方法及应用
US11295833B2 (en) * 2018-03-29 2022-04-05 Dh Technologies Development Pte. Ltd. Analysis method for glycoproteins
CN108663437B (zh) * 2018-06-19 2020-11-27 苏州芷宁信息科技有限公司 一种快速筛查标的物的方法
CN108896646A (zh) * 2018-07-04 2018-11-27 上海海洋大学 亲缘关系相近的海鲜的快速分类和鉴定方法
CN109486681A (zh) * 2018-10-26 2019-03-19 深圳市太空科技南方研究院 细菌裂解液和耐辐射奇球菌提取物的制备方法及其应用
CN111883214B (zh) * 2019-07-05 2023-06-16 深圳数字生命研究院 构建诱饵库、构建目标-诱饵库、代谢组fdr鉴定的方法及装置
CN114639445B (zh) * 2022-02-18 2023-09-19 五邑大学 一种基于贝叶斯评价和序列搜库的多肽组学鉴定方法
CN116486907B (zh) * 2023-01-10 2024-04-30 湖南工商大学 一种基于a星算法的蛋白质序列标签测序方法

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6188064B1 (en) * 1998-01-29 2001-02-13 Bruker Daltonik Gmbh Mass spectrometry method for accurate mass determination of unknown ions
CN102495127A (zh) * 2011-11-11 2012-06-13 暨南大学 一种基于概率统计模型的蛋白质二级质谱鉴定方法

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7462818B2 (en) * 2005-11-04 2008-12-09 Agilent Technologies, Inc. Determination of chemical empirical formulas of unknown compounds using accurate ion mass measurement of all isotopes

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6188064B1 (en) * 1998-01-29 2001-02-13 Bruker Daltonik Gmbh Mass spectrometry method for accurate mass determination of unknown ions
CN102495127A (zh) * 2011-11-11 2012-06-13 暨南大学 一种基于概率统计模型的蛋白质二级质谱鉴定方法

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
A novel scoring schema for peptide identification by searching protein sequence databases using tandem mass spectrometry data;Zhuo Zhang et al;《BMC Bioinformatics》;20061231;第7卷;第2-6页Methods部分、Hypothetic spectrum generation部分,以及图4 *
Improving CID, HCD, and ETD FT MSMS degradome-peptidome identifications using high accuracy mass information;Yufeng Shen et al;《J Proteome Res.》;20120203;第11卷(第2期);第3-4页Methods部分 *
The Advantages and Versatility of a High-Energy Collision-Induced Dissociation-Based Strategy for the Sequence and Structural Determination of Proteins;K. F. Medzihradszky et al;《Methods: A Companion to Methods in Enzymology》;19941231;第6卷;284-303 *

Also Published As

Publication number Publication date
CN103698447A (zh) 2014-04-02

Similar Documents

Publication Publication Date Title
CN103698447B (zh) 一种利用高能碰撞诱导电离碎裂技术鉴定蛋白的方法
Erickson et al. A strategy to combine sample multiplexing with targeted proteomics assays for high-throughput protein signature characterization
Strittmatter et al. Proteome analyses using accurate mass and elution time peptide tags with capillary LC time-of-flight mass spectrometry
Levin et al. Quantification of proteins using data‐independent analysis (MSE) in simple andcomplex samples: a systematic evaluation
Yang et al. Mass spectrometric analysis of asparagine deamidation and aspartate isomerization in polypeptides
Vowinckel et al. The beauty of being (label)-free: sample preparation methods for SWATH-MS and next-generation targeted proteomics
Riley et al. The negative mode proteome with activated ion negative electron transfer dissociation (AI-NETD)
US7783429B2 (en) Peptide sequencing from peptide fragmentation mass spectra
Tsai et al. Precursor ion independent algorithm for top-down shotgun proteomics
Chen et al. Exploration of the normal human bronchoalveolar lavage fluid proteome
Richards et al. Neutron-encoded signatures enable product ion annotation from tandem mass spectra
An et al. N-linked glycopeptide identification based on open mass spectral library search
Guo et al. Optimization of protein-level tandem mass tag (TMT) labeling conditions in complex samples with top-down proteomics
Li et al. A rapid and easy protein N‐terminal profiling strategy using (N‐Succinimidyloxycarbonylmethyl) tris (2, 4, 6‐trimethoxyphenyl) phosphonium bromide (TMPP) labeling and StageTip
Donoghue et al. Nonionic detergent phase extraction for the proteomic analysis of heart membrane proteins using label‐free LC‐MS
Colzani et al. Relative protein quantification by isobaric SILAC with immonium ion splitting (ISIS)
Yuan et al. Features‐based deisotoping method for tandem mass spectra
Tay et al. MS2‐deisotoper: a tool for deisotoping high‐resolution MS/MS spectra in normal and heavy isotope‐labelled samples
Helsens et al. Mass spectrometry-driven proteomics: an introduction
Yokosuka et al. ‘Information‐Based‐Acquisition’(IBA) technique with an ion‐trap/time‐of‐flight mass spectrometer for high‐throughput and reliable protein profiling
US11600359B2 (en) Methods and systems for analysis of mass spectrometry data
Mao et al. Lys‐Sequencer: An algorithm for de novo sequencing of peptides by paired single residue transposed Lys‐C and Lys‐N digestion coupled with high‐resolution mass spectrometry
Smith Advanced mass spectrometric methods for the rapid and quantitative characterization of proteomes
Addona et al. De novo peptide sequencing via manual interpretation of MS/MS spectra
CN102809600A (zh) 用于一级相同质量二级b,y碎片离子对定量方法的数据分析方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant