CN104076115B - 基于峰强度识别能力的蛋白质二级质谱鉴定方法 - Google Patents

基于峰强度识别能力的蛋白质二级质谱鉴定方法 Download PDF

Info

Publication number
CN104076115B
CN104076115B CN201410299214.3A CN201410299214A CN104076115B CN 104076115 B CN104076115 B CN 104076115B CN 201410299214 A CN201410299214 A CN 201410299214A CN 104076115 B CN104076115 B CN 104076115B
Authority
CN
China
Prior art keywords
peak
recognition capability
peptide section
intensity
ion
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201410299214.3A
Other languages
English (en)
Other versions
CN104076115A (zh
Inventor
陈晓舟
肖传乐
郑凯
李华梅
李慧敏
Original Assignee
Yunnan Minzu University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Yunnan Minzu University filed Critical Yunnan Minzu University
Priority to CN201410299214.3A priority Critical patent/CN104076115B/zh
Publication of CN104076115A publication Critical patent/CN104076115A/zh
Application granted granted Critical
Publication of CN104076115B publication Critical patent/CN104076115B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Abstract

本发明公开了一种基于峰强度识别能力的蛋白质二级质谱鉴定方法,该方法首先虚拟酶解蛋白质数据库序列,并根据肽段的质量数对酶解后的肽段建立肽段数据库和肽段数据库索引,接着根据待分析实验图谱中母离子去电荷后的质量数在建立的肽段数据库中找出符合要求的候选肽段,再对待分析实验图谱进行去同位素峰和选取有效峰,产生符合要求的候选肽段的理论图谱,统计不同离子的峰强度信息,并计算出不同离子类型在不同区间内峰强度识别能力,对每个候选肽段基于峰强度识别能力进行打分,选择最高得分的肽段作为此实验图谱鉴定结果,最后对鉴定结果进行质量控制。该方法鉴定有效质谱的数量和蛋白质肽段数量均高于目前现有算法,且可动态选峰,运行速度快。

Description

基于峰强度识别能力的蛋白质二级质谱鉴定方法
技术领域
本发明涉及蛋白质二级质谱鉴定领域,特别是涉及一种基于峰强度识别能力的蛋白质二级质谱鉴定方法。
背景技术
多维色谱与质谱技术联用构成的生物质谱技术大规模应用于蛋白质组学,尤其基质辅助激光解吸(matrix-assistedlaserdesorptionionization,MALDI)和电喷雾(ElectrosprayIonization,ESI)两种软电离技术的出现,使生物质谱能较少的引入杂质并保持肽段分子的完整性,为蛋白质的质量信息和结构信息的研究开启了新的一页。质谱数据处理技术对蛋白质组的研究具有重要的作用,其主要任务是从带有复杂噪声或者部分信息缺失的数据中推断样品的蛋白质组成。数据库搜索是质谱数据处理的主要方法,其基本过程如图1所示,即将实验图谱和数据库中产生的理论图谱进行比对、打分,选择分值最高的匹配作为搜索结果的候选肽段。
蛋白质二级质谱鉴定涉及诸多方面的内容,其主要包括母离子价态的确定、有效质谱峰的选取、匹配打分模型构建以及整体鉴定结果的假阳性率控制。目前随机数据库方法是针对整体鉴定结果假阳性率控制的主要方法。基本思想是:先给定的蛋白质数据库和实验数据集构建一个随机数据库,然后同时或者分别搜索真实蛋白质数据库和新构建的随机数据库,进而通过随机数据库肽段匹配来模拟正常数据库中的随机匹配,最终估计正常数据库中随机匹配的特征分布,确定不同过滤标准。目前求取整体数据集假阳性率(FalsePositiveRate,FPR)的方法多样。其中Kall’s在Proteome上公开的计算假阳性率的方法被广泛采用,计算公式如下:
FPR = N R N N
蛋白质二级质谱鉴定算法的核心问题是如何构建一个合理、高效的打分模型。目前针对数据库搜索的打分模型主要可分为两类:解释型模型和概率统计模型。具有代表且被广泛使用的算法分别是:SEQUEST和Mascot。此外,X!Tandem(超几何模型),OMSSA(泊松分布模型)和ProVerB(二项分布模型)也是基于概率统计模型的算法。目前蛋白质二级质谱鉴定算法打分模型中,打分内容大致可分为以下三方面:(1)峰的匹配与不匹配,(2)峰的连续匹配,(3)峰强度的匹配;其中(1)、(2)在算法设计中已被广泛考虑,但是(3)很少被引入至算法中。近期公开发表的蛋白质二级质谱鉴定算法ProVerB很好的将(1)、(2)、(3)引入算法构建中,鉴定结果明显优于Mascot和Sequest,为蛋白质结构信息和功能域的研究提供了极为有力的工具,但是综合目前蛋白质鉴定算法,其打分模型却均未涉及强度识别能力这个重要的特征信息。
因此,融入强度识别能力这个特征信息,继而研究一种能明显提高蛋白质有效质谱数量和蛋白质肽段数量的二级质谱鉴定方法具有很高的理论和实用价值。
发明内容
基于此,有必要提供一种能明显提高蛋白质有效质谱数量和蛋白质肽段数量的基于峰强度识别能力的蛋白质二级质谱鉴定方法。
一种基于峰强度识别能力的蛋白质二级质谱鉴定方法,包括如下步骤:
(1)虚拟酶解蛋白质数据库序列,并根据肽段的质量数对酶解后的肽段建立肽段数据库和肽段数据库索引;
(2)根据待分析实验图谱中母离子去电荷后的质量数在步骤(1)所述的肽段数据库中找出符合要求的候选肽段;
(3)对待分析实验图谱进行去同位素峰和选取有效峰;
(4)产生符合要求的候选肽段的理论图谱;
(5)统计不同离子的峰强度信息,并计算出不同离子类型在不同区间内峰强度识别能力;
(6)对每个候选肽段基于峰强度识别能力进行打分,选择最高得分的肽段作为此实验图谱鉴定结果,对鉴定结果进行质量控制。
在其中一些实施例中,步骤(3)所述的去同位素峰过程具体包括如下步骤:
1.1)进行初始化,三个比较峰的m/z值及其强度,全部设为0,设三个峰m/z值分别是:m/z_1=0,m/z_2=0,m/z_3=0,其峰强对应是m/z_1_in=0,m/z_2_in=0,m/z_3_in=0,并设置保留峰的容器,已知测量质量误差m;
1.2)读取一个峰的信息,把目前的峰放入第三个峰的位置,即m/z_3,m/z_3_in,把第三个峰与第一个峰和第二个峰比较,判断是否是前两个峰的同位素峰,
1.2.1)如果以下三个条件的任意一个条件成立,则认为是同位素峰,
a.|m/z_3-m/z_2-1|<=m并且m/z_2_in>m/z_3_in;
b.|m/z_3-m/z_1-1|<=m并且m/z_1_in>m/z_3_in;
c.|m/z_2-m/z_1|<=m并且m/z_2_in>m/z_3_in,此为相同峰信息,记录误差,执行三个峰向前平移一位,空出第三个峰的位置,即:
m/z_1=m/z_2,m/z_1_in=m/z_2_in;
m/z_2=m/z_3,m/z_2_in=m/z_3_in;
1.2.2)如果步骤1.2.1)中的三个条件均不成立,则认为目前进入第三位置的峰不是同位素峰,将其作为保留峰存入保留峰容器中,并把三个峰向前平移一位,空出第三个峰的位置,即:m/z_1=m/z_2,m/z_1_in=m/z_2_in;
1.3)逐个读取下一个峰的信息,重复步骤1.2)直到处理完一张二级质谱图所用峰信息,其保留峰容器中的峰即为去同位素峰之后的非同位素峰。
在其中一些实施例中,步骤(4)具体包括如下步骤:
1)产生候选肽段可能产生的理论碎片b、y离子;
2)如果步骤1)产生b、y离子中包含S、T、E和D四种氨基酸中的一种则产生对应的丢水碎片离子b-H2O和y-H2O;
3)如果步骤1)产生b、y离子中包含R、K、Q和N四种氨基酸中的一种则产生对应的丢氨碎片离子b-NH3和y-NH3
4)待分析二级质谱母离子价态是1价,则考虑产生一价碎片离子;
5)若待分析二级质谱母离子价态大于等于2,并且对应的碎片离子中包含R,K和H三种氨基酸其中一种时,则考虑二价碎片离子峰;
根据步骤1)~5)产生所有理论碎片离子的方法规则,得到候选肽段的理论图谱。
在其中一些实施例中,步骤(5)具体包括如下步骤:
1)将峰强度归一化,并将归一化后峰强度所在区域根据不同离子类型划分为12个区间,仅考虑b、b-H2O、b-NH3、y、y-H2O、y-NH3六种离子类型;
2)统计每一实验质谱峰不同离子类型在不同的强度区间内正确匹配与错误匹配上候选肽段的数量,并定义该离子类型在该区间上的强度识别能力。计算公式如下:
T ij = N ( r ij ) N ( e ij )
其中,j代表第j个区间(j∈[1,12],j∈Z+);i代表第i种离子类型(i∈{b,b-H2O,b-NH3,y,y-H2O,y-NH3});Tij代表离子类型i在区间j中的强度识别能力;N(rij)代表离子类型i在区间j中正确匹配峰的数目;N(eij)代表离子类型i在区间j中错误匹配峰的数目。
在其中一些实施例中,步骤(6)所述的打分过程包括:基于强度识别能力匹配打分,基于强度识别能力连续匹配打分以及基于强度识别能力b,y离子匹配打分,具体如下:
1)基于强度识别能力离子匹配打分:
S 0 = k 0 0.1811 n 0 &Sigma; l I l
其中,k0是实验图谱与理论图谱匹配峰的数目;n0是理论图谱峰数目;是匹配峰离子强度识别能力之和;0.1811为随机匹配概率值,等于随机肽段实验图谱匹配峰数目除以理论图谱峰数目;
2)基于强度识别能力连续匹配打分:
S 1 = k 1 0.0828 n 1 &Sigma; l ( I m + I p )
其中,多个离子的连续匹配将转化成多个两个离子的连续匹配;k1是实验图谱连续匹配峰数目;n1是理论图谱连续匹配峰数目,是第m和p个峰构成了一个连续匹配,两个连续匹配峰强度识别能力之和;0.0828为随机匹配概率值,随机肽段实验图谱连续匹配峰数目除以理论连续峰数目;
3)基于强度识别能力b,y离子匹配打分:
S 2 = k 2 ( &Sigma; l Ib l + &Sigma; l Iy l ) 0.0604 n 2
其中,k2是b,y离子实验图谱与理论图谱匹配峰数目;n2是理论图谱b,y峰数目;是匹配b,y离子峰对应的强度识别能力之和;0.0604是随机匹配概率值,等于随机肽段b、y离子匹配峰数目除以其理论b、y离子峰数目
4)基于强度识别能力总分函数:
Sp=0.01*(S0+S1+S2)。
在其中一些实施例中,步骤(6)所述的鉴定结果采用FDR<<0.01进行质量控制,得出最终鉴定结果。
在其中一些实施例中,所述质量控制具体包括如下步骤:
1)统计待分析图谱所有二级图谱中的鉴定结果肽段得分最小值和最大值;
2)统计在最小值和最大值之间,其中大于每个分值的鉴定结果中真实库和随机库肽段的个数,并计算每个分值为阀值时的FDR的值;
3)按得分值从小到大寻找每个分值,直到找到FDR<=0.01时,此分值为待分析图谱的整体阀值;
4)根据步骤3)找到整体阀值,以此阀值过滤待分析图谱的鉴定结果,也就是说小于此阀值结果被过滤掉,其结果作为最终的待分析图谱最终鉴定结果。
在其中一些实施例中,步骤(2)所述的候选肽段的筛选方法如下步骤:
1)加载database.index文件信息到内存数组index,读取待分析二级质谱的母离子的m/z值和电荷信息,并计算其母离子去电荷后的质量数;
2)根据容许的质量误差查找index数组记录并读取相应肽段信息,查找index数组找到其在文件database.ind中的开始位置和行数,由此位置开始顺序读取相应的行数加入内存中,即加载了此区间内的所有肽段信息;
3)对内存加载肽段进行逐步的精细筛选,作为此待分析二级质谱的候选肽段。
在其中一些实施例中,步骤(3)所述的选取有效峰的方法如下步骤:
1)寻找实验图谱m/z的最大值与最小值,分别记为maxm/z与minm/z,以及最高峰强度对应的m/z值;
2)将实验图谱划分为k个窗口其中k=max(round([(maxm/z-m/z)/50,(m/z-minm/z)/50]+0.5));
3)以最高峰强度对应的m/z为基准,并向左右延伸,每次分别开启50Da的窗口(即以100Da为1个窗口),直到窗口数等于k结束;
4)对每一窗口的峰进行归一化,即用每个峰除以该窗口的最高峰,选择该窗口中最强的前6个峰作为有效峰。
本发明涉及的基于峰强度识别能力的蛋白质二级质谱鉴定方法具有如下的优点及效果:
(1)本发明主要对生物质谱产生的二级质谱数据进行解释和鉴定,其鉴定有效质谱的数量和蛋白质肽段数量均高于目前的常用的国外商业软件的算法。现被广泛使用的技术中,Mascot鉴定的有效质谱的数量和蛋白质肽段数量最多,本鉴定方法结果要优于Mascot。
(2)本发明方法的打分模型主要是基于候选肽段强度识别能力信息进行统计的模型,但加入了一些别的统计元素的全新打分模型。其方法在考虑匹配、连续匹配以及b,y离子匹配的基础上融入了强度识别能力的特征信息。
(3)该发明鉴定有效质谱峰的效果要远远高于目前的商业软件Mascot和Sequest,而且本鉴定算法鉴定效率较之前算法大大提高了。
附图说明
图1为二级质谱鉴定的基本流程图;
图2为基于候选肽段区分度的蛋白质二级质谱鉴定方法流程图;
图3为蛋白质虚拟酶解示意图;
图4为原始4个峰的去同位素执行过程中三个峰和保留峰的状态改变过程。
具体实施方式
以下将结合实施例及附图对本发明作进一步详细的说明。
一种基于强度识别能力的蛋白质二级质谱鉴定方法,包括以下步骤,参见图2:
(1)虚拟酶解蛋白质数据库序列,并根据肽段的质量数对酶解后的肽段建立肽段数据库和肽段数据库索引;
(2)根据待分析实验图谱中母离子去电荷后的质量数在步骤(1)所述的肽段数据库中找出符合要求的候选肽段;
(3)对待分析实验图谱进行去同位素峰和选取有效峰;
(4)产生符合要求的候选肽段的理论图谱;
(5)统计不同离子的峰强度信息,并计算出不同离子类型在不同区间内峰强度识别能力;
(6)对每个候选肽段基于峰强度识别能力进行打分,选择最高得分的肽段
作为此实验图谱鉴定结果,对鉴定结果进行质量控制。
步骤(1)所述的虚拟酶解蛋白质数据库序列并对酶解后肽段建立肽段数据库和肽段数据库索引,具体包括如下步骤:
1)读取质谱分析样本(即待分析二级质谱的样本)的物种蛋白质序列库文件中的一条蛋白质序列。
2)按照表1根据用户设定蛋白酶和容许的漏切位点个数对此蛋白质序列进行虚拟理论酶切。目前大部分使用Trypsin进行蛋白质酶解实验,从表1可知Trypsin是对蛋白质C-Term敏感的,也就是说蛋白质序列C端可能会被切掉一个氨基酸;其酶切位点KR,也就是说其酶在序列的K和R上发生酶切作用;其限制酶切位点是P,也就是说序列K和R上发生酶切时,如果其后面一个氨基酸是P则不能发生酶切作用。
表1蛋白酶酶切位点表
蛋白质酶 敏感端 酶切位点 限制酶切位点
Trypsin C-Term KR P
Arg-C C-Term R P
Asp-N N-Term D
Asp-N_ambic N-Term DE
Chymotrypsin C-Term FLWY P
CNBr C-Term M
上述步骤2)详细过程是:
A.根据表1找到蛋白质序列中包含符合上面规则的理论酶切位点;
B.在复合符合规则的酶切位点产生断裂,产生没有漏切位点的肽段;
C.产生存在漏切位点的断裂肽段;
其一个蛋白质虚拟酶解(以Trypsin酶解为例)示意图如图3所示。
3)根据每个氨基酸的分子量计算每个虚拟酶切后肽段的质量数;由于计算肽段质量数计算频率高,在计算质量数之前首先对每个氨基酸的质量建立索引。如表2所示,对20个氨基酸的索引和翻译后修饰的索引方法如下:
A.启用一个与ASCII码相同大小的数组(大小为250);
B.一个数组的下标与氨基酸单字母简写的ASCII码数值一致,其数组中保存其氨基酸的分子量。除了20种氨基酸的位置放置没有修饰的氨基酸(除了20种氨基酸,还有碳氢氧氮的),其它位置(大概有230)个可以处理翻译后修饰,该方法可以同时处理230种修饰。
表2氨基酸索引表
数组 氨基酸简写 数组值 化学组成
AA(1) 14.00307 N
AA(2) 15.99491 O
AA(3) 1.007825 H
AA(4) 12 C
AA(65) A 71.037114 H(5)C(3)NO
AA(66) B 115.02694 H(5)C(4)NO(3)
AA(67) C 103.0092 H(5)C(3)NOS
AA(68) D 115.026943 H(5)C(4)NO(3)
AA(69) E 129.04259 H(7)C(5)NO(3)
AA(70) F 147.06841 H(9)C(9)NO
AA(71) G 57.02146 H(3)C(2)NO
AA(72) H 137.05891 H(7)C(6)N(3)O
AA(73) I 113.08406 H(11)C(6)NO
AA(75) K 128.09496 H(12)C(6)N(2)O
AA(76) L 113.084064 H(11)C(6)NO
AA(77) M 131.040485 H(9)C(5)NOS
AA(78) N 114.042927 H(6)C(4)N(2)O(2)
AA(80) P 97.052764 H(7)C(5)NO
AA(81) Q 128.058578 H(8)C(5)N(2)O(2)
AA(82) R 156.101111 H(12)C(6)N(4)O
AA(83) S 87.032028 H(5)C(3)NO(2)
AA(84) T 101.047679 H(7)C(4)NO(2)
AA(86) V 99.068414 H(9)C(5)NO
AA(87) W 186.079313 H(10)C(11)N(2)O
AA(89) Y 163.063329 H(9)C(9)NO(2)
之后,把肽段字母转换成ASCII码的数值,根据氨基酸索引表的数值计算肽段的质量,例如:假设有一个肽段为ACD,那么肽段ACD的ASCII码数值是65,67,68;
那么其肽段的质量数为数组AA下标为65,67,68的值之和并加上水的分子量,因为肽段有C端(H)和N端(OH),所以该肽段的质量数为:
2*AA(3)+AA(2)+AA(65)+AA(67)+AA(68)=2*1.007825+15.99491+71.037114+103.0092+115.026943=307.0838
根据氨基酸索引表计算每条虚拟酶解后的肽段的质量数。
4)把计算过质量数的肽段放入肽段数据库中,即以每1da为单位对所有酶解后肽段分别存入相应的文件中。把肽段的质量数取整,例如307.0838取整后为307,之后将肽段的信息存入质量数取整的文件中末尾追加,即在文件名为307的文件末尾追加一行存入肽段的信息。按照上面方法把每条肽段放入肽段数据库。
5)读取下一条蛋白质序列,重复步骤2),3),4),直到所有的蛋白序列被酶解和存入肽段数据库。
6)合并每1da为单位文件的肽段信息并对其建立索引文件:按文件名的数字从小到大读出文件中的肽段信息,每读一个文件,按照文件中肽段的质量数从小到大进行排序,之后从小到大顺序存入database.ind文件中,并删除每个读取肽段信息文件。例如文件名为1000文件存入质量数为1000da-1001da所有肽段的信息,读取其文件的肽段信息,并排序,之后排序后肽段信息存入database.ind文件中,并删除1000文件。将信息database.ind每行存入一个肽段,其文件格式如表3所示,与此同时,按照1da对酶解所有肽段建立查找索引database.index,其查找索引记录下信息:第一列保存其质量数,例如1000,表示质量数位为1000da-1001da肽段,第二列是这些肽段在database.ind文件开始位置,第三列是酶解肽段在1000da-1001da的个数,即1000da-1001da肽段在database.ind文件中的行数。根据database.index可以知道1000da-1001da在文件database.ind中的位置,其结果如表4所示。
表3database.ind索引表
表4database.index索引表
肽段质量数索引编号 文件开始位置 肽段数量
1005 0 2
1064 56 2
1089 224 2
1106 282 2
1117 340 4
步骤(2)所述的根据待分析实验图谱母离子去电荷后的质量查找肽段数据库,找出符合要求的候选肽段,具体包括如下步骤:
根据待分析二级质谱母子荷质比(m/z)值查找符合要求的候选肽段的方法:
1)加载database.index文件信息到内存数组index,读取待分析二级质谱的母离子的m/z值和电荷信息,并计算其母离子去电荷后的质量数,例如有一个m/z=2100.2,charge=2的母离子信息,其去电荷后的质量数为m/z*2-2=4198.2。
2)根据容许的质量误差查找index数组记录并读取相应肽段信息,假设质量误差为0.1,4198.2-0.1=4198.1和4198.2+0.1=4198.3,4198.1和4198.3取整都为4198da,查找index数组找到其在文件database.ind中的开始位置和行数,由此位置开始顺序读取相应的行数加入内存中,即加载了4198~4199Da内的所有肽段信息。
3)对内存加载肽段进行逐步的精细筛选,即筛选出质量数范围在4198.1~4198.3Da之间的的肽段,作为此待分析二级质谱的候选肽段。
步骤(3)所述的对待分析实验图谱进行去同位素峰和选取有效峰,具体包括如下步骤:
1)去同位素峰:
理论上同位素峰之间质荷比m/z相差1且同位素峰之间的峰强受自然界同位素丰度控制,例如自然界C12丰度高于C13的丰度,其质谱峰的高度也高于C13。自然界中稳定同位素中,低分子量的基本上丰度都占其丰度的最高位。在质谱中,一个同位素峰群中,第一峰基本上应该是最高峰。实际质谱仪的测量中,由于质谱仪都存在测量误差。根据质谱仪类型不同,其测量的精确度也不同,例如LTQ质谱仪的测量误差是0.5Da。由于一张质谱的系统误差一样,也就是说同位素峰要么总是向右或向左偏离理论值,因此认为两个峰m/z1和m/z2符合|m/z1-m/z2-1|<0.25da既为同位素峰。去同位素峰理论上应该构建同位素峰群,选取峰群中最强的峰,为了提高速度,本发明实现方法是同时把三个峰反复比较取最高峰(CID1+0.25da),不断重复选取。
具体操作方法如下:
1.1)进行初始化,三个比较峰的m/z值及其强度,全部设为0(假设三个峰m/z值分别是:m/z_1=0,m/z_2=0,m/z_3=0,其峰强对应是m/z_1_in=0,m/z_2_in=0,m/z_3_in=0,并设置保留峰的容器(用于存储非同位素峰));
1.2)读取一个峰的信息,假设m/z_curr=245,in_curr=80,测量质量误差m=0.25,
1.2.1)把目前的峰放入第三个峰的位置,即m/z_3=m/z_curr,m/z_3_in=in_curr;
1.2.2)把第三个峰与第一个峰和第二个峰比较,判断是否是前两个峰的同位素峰。即
如果以下三个条件的任意一个条件成立,则认为是同位素峰,
①|m/z_3-m/z_2-1|<=m并且m/z_2_in>m/z_3_in;
②|m/z_3-m/z_1-1|<=m并且m/z_1_in>m/z_3_in;
③|m/z_2-m/z_1|<=m并且m/z_2_in>m/z_3_in(此为相同峰信息,记录误差),执行三个峰向前平移一位,空出第三个峰的位置,即:
m/z_1=m/z_2,m/z_1_in=m/z_2_in;
m/z_2=m/z_3,m/z_2_in=m/z_3_in;
否则,认为目前进入第三位置的峰不是同位素峰,将其作为保留峰存入保留峰容器中,并把三个峰向前平移一位,空出第三个峰的位置,即:
m/z_1=m/z_2,m/z_1_in=m/z_2_in;
1.3)逐个读取下一个峰的信息,重复步骤1.2)直到处理完一张二级质谱图所用峰信息,其保留峰容器中的峰即为去同位素峰之后的非同位素峰。
如图4出示了原始4个峰的去同位素执行过程中三个峰和保留峰的状态改变过程。
2)选取有效质谱峰
本发明鉴定方法在选取有效质谱峰方面与以前鉴定方法有了很大不同,此算法采取以下选取有效峰的方法:
2.1)寻找实验图谱m/z的最大值和最小指分别为maxm/z和minm/z,以及峰强度的最大值max_intensity和对应的m/z值;
2.2)将实验图谱划分为k个窗口,其中k=max(round([(maxm/z-m/z)/50,(m/z-minm/z)/50]+0.5));;
2.3)以max_intensity对应的m/z为基准,并向左右延伸,每次分别开启50Da的窗口(即以100Da为1个窗口),直到窗口数等于k结束;
2.4)对每一窗口的峰进行归一化,也即用每个峰除以该窗口中的最强峰,并选择该窗口下最强的6个峰作为有效峰。
步骤(4)所述的产生符合要求的候选肽段的理论图谱,即对实验图谱进行去同位素峰处理和选取有效峰后产生符合要求的候选肽段的理论图谱:
1)产生候选肽段可能产生的理论碎片b、y离子;
2)如果步骤1)产生b、y离子中包含S、T、E和D四种氨基酸中的一种则产生对应的丢水碎片离子b-H2O和y-H2O;
3)如果步骤1)产生b、y离子中包含R、K、Q和N四种氨基酸中的一种则产生对应的丢氨碎片离子b-NH3和y-NH3
4)待分析二级质谱母离子价态是1价,则考虑产生一价碎片离子;
5)若待分析二级质谱母离子价态大于等于2,并且对应的碎片离子中包含R,K和H三种氨基酸其中一种时,则考虑二价碎片离子峰;
根据步骤1)~5)产生所有理论碎片离子的方法规则,得到候选肽段的理论图谱。
步骤(5)所述的统计不同离子的峰强度信息,并计算出不同离子类型在不同区间内峰强度识别能力,具体包括如下步骤:
(1)将峰强度归一化,并将归一化后峰强度所在区域根据不同离子类型划分为12个区间。
1.1)将图谱中碎片离子的峰强度信息进行大小排序,将强度最高的前三个峰强度的平均值,作为相对最强峰,以此做归一化处理。例如:
假设PEP是一个肽段,经碎裂后产生的碎片离子及其对应的峰强度可表示成如下集合:
PEP={p1,p2,......,pk},I={I1,I2,......,Ik}
对峰强度进行从高到低的排序,选择最高的前三个峰求其平均值,做为相对最强峰IR,不妨假设最高的前三个峰分别为:Im,In,Ik;即并对所有的峰强度相对IR作归一化处理:(如下公式所示)
其中(Ii∈I,i∈[1,k],k∈z+)
1.2)构建6*12的矩阵表,其中列项表示离子类型,在CID碰撞中,由于能量较低,C端和N离子类型较为容易产生,其它离子类型较少,我们这里仅考虑六种离子类型,分别是:b,b-H2O,b-NH3,y,y-H2O,y-NH3。行项为对归一化峰强度进行区间划分:分别是
[0,0.05],[0.05,0.1],[0.1,0.2],[0.2,0.3],[0.3,0.4],[0.4,0.5],[0.5,0.6],[0.6,0.7],[0.7,0.8],[0.8,0.9],[0.9,1],[1,+∞]
(2)统计每一实验质谱峰不同离子类型在不同的强度区间内正确匹配与错误匹配上候选肽段的数量,并定义该离子类型在该区间上的强度识别能力。
以本实验室D39质谱数据集为参数训练数据集,通过Mascot软件搜库,得到FDR<=0.01的肽段集和有效图谱集(97757张图谱和肽段,Tdataset),假设这些图谱其对应的鉴定的肽段都是正确结果,那么每一张图谱对应着一个鉴定正确的肽段,反转每一张图谱鉴定的肽段将对应着每张图谱错误的鉴定结果。正向(正确)和经过反转的两个肽段他们的理论碎片离子重叠度低,可以模拟图谱的正确和随机匹配过程。计算归一化峰强度把0~1分成12个区间来统计(0-0.05,0.05-0.1,0.1-0.2,0.3-0.4,…,0.9-1.0,>1.0)在正确和错误匹配过程中的各种匹配情况;
定义:离子在第j(j=1,2,…11)个区间正确匹配个数和错误匹配个数则第j个区间的强度识别能力为:Ij=Nrj/Nej,则六种离子类型在不同区间对应的强度识别能力如下表所示:
步骤(6)所述的对每个候选肽段基于峰强度识别能力进行打分,选择最高得分的肽段作为此实验图谱鉴定结果,对鉴定结果进行质量控制,即根据待分析实验图谱与候选肽理论图谱的的区分度对分析实验图谱与候选肽理论图谱进行匹配打分,选择最高得分的肽段作为此实验图谱鉴定结果,对鉴定结果进行质量控制。
(1)基于强度识别能力离子匹配打分:
S 0 = k 0 0.1811 n 0 &Sigma; l I l
其中:k0是实验图谱与理论图谱匹配峰的数目;n0是理论碎片离子峰数目;是匹配离子强度识别能力之和;0.1811为随机匹配概率值。等于等于随机肽段实验图谱匹配峰数目除以理论图谱峰数目,它反映了实验图谱和随机理论图谱的匹配能力。
(2)基于强度识别能力连续匹配打分:
S 1 = k 1 0.0828 n 1 &Sigma; l ( I m + I p )
其中:多个离子的连续匹配将转化成多个两个离子的连续匹配,例如b1,b2,b3的连续匹配将转化2个两个离子峰组成的两两连续匹配,即b1和b2,b2和b3的匹配;k1是实验图谱连续匹配(两两连续匹配)的数目;n1是理论连续匹配碎片离子峰(两两连续匹配)的数目;是第m和p个峰(m和p峰构成一个两两连续匹配)的连续匹配离子峰强度识别能力之和,0.0828为随机匹配概率值.等于随机肽段实验图谱连续匹配峰数目除以理论连续峰数目,它反映了实验图谱与随机理论图谱中的连续匹配能力;
(3)基于强度识别能力b,y离子匹配打分:
S 2 = k 2 ( &Sigma; l Ib l + &Sigma; l Iy l ) 0.0604 n 2
其中:其中,是b,y离子实验图谱与理论图谱匹配峰数目;是理论图谱b,y峰数目;是匹配离子峰对应的强度识别能力之和;0.0604是随机匹配概率值,等于随机肽段b、y离子匹配峰数目除以其理论b、y离子峰数目,它反映了在实验图谱与随机理论图谱的匹配能力。
(4)基于强度识别能力总分函数:
Sp=0.01*(S0+S1+S2)
按此打分函数,可知分数越高区分候选肽段的强度识别能力越强,分数越低说明区分候选肽段的能力也越弱。上述打分函数比Mascot和Sequest打分公式鉴定效果要好,因为其基于峰强度识别能力考虑每个峰,峰强度识别能力的新思想是之前的算法没有涉及的,此外该打分公式鉴定效率较之前算法大大提高了。
利用Sp值取最大为其鉴定结果,和利用FDR分数采用排名第一位和第二位之差Sp1-Sp2来过滤结果后产生的鉴定结果。
对鉴定结果采用FDR<<0.01进行质量控制并得出成最终鉴定结果,具体方法如下步骤:
1)统计待分析图谱所有二级图谱中的鉴定结果肽段得分最小值和最大值;
2)统计在最小值和最大值之间,其中大于每个分值的鉴定结果中真实库和随机库肽段的个数,并计算每个分值为阀值时的FDR的值;
3)按得分值从小到大寻找每个分值,直到找到FDR<=0.01时,此分值为待分析图谱的整体阀值;
4)根据步骤3)找到整体阀值,以此阀值过滤待分析图谱的鉴定结果,也就是说小于此阀值结果被过滤掉,其结果作为最终的待分析图谱最终鉴定结果。
本发明涉及的基于峰强度识别能力的蛋白质二级质谱鉴定方法主要对生物质谱产生的二级质谱数据进行解释和鉴定,其鉴定有效质谱的数量和蛋白质肽段数量均高于目前的常用的国外商业软件的算法。现被广泛使用的技术中,Mascot鉴定的有效质谱的数量和蛋白质肽段数量最多,本鉴定方法结果要优于Mascot,该方法的打分模型主要是基于候选肽段强度识别能力信息进行统计的模型,但加入了一些别的统计元素的全新打分模型,该方法在考虑匹配、连续匹配以及b,y离子匹配的基础上融入了强度识别能力的特征信息,鉴定有效质谱峰的效果要远远高于目前的商业软件Mascot和Sequest,而且本鉴定算法鉴定效率较之前算法大大提高。
以上所述实施例仅表达了本发明的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对本发明专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本发明构思的前提下,还可以做出若干变形和改进,这些都属于本发明的保护范围。因此,本发明专利的保护范围应以所附权利要求为准。

Claims (5)

1.一种基于峰强度识别能力的蛋白质二级质谱鉴定方法,其特征在于,包括如下步骤:
(1)虚拟酶解蛋白质数据库序列,并根据肽段的质量数对酶解后的肽段建立肽段数据库和肽段数据库索引;
(2)根据待分析实验图谱中母离子去电荷后的质量数在步骤(1)所述的肽段数据库中找出符合要求的候选肽段;
(3)对待分析实验图谱进行去同位素峰和选取有效峰;
(4)产生符合要求的候选肽段的理论图谱;
(5)统计不同离子的峰强度信息,并计算出不同离子类型在不同区间内峰强度识别能力,具体包括如下步骤:
1)将峰强度归一化,并将归一化后峰强度所在区域根据不同离子类型划分为12个区间,仅考虑b、b-H2O、b-NH3、y、y-H2O、y-NH3六种离子类型;
2)统计每一实验质谱峰不同离子类型在不同的强度区间内正确匹配与错误匹配上候选肽段的数量,并定义该离子类型在该区间上的强度识别能力,计算公式如下:
T i j = N ( r i j ) N ( e i j )
其中,j代表第j个区间(j∈[1,12],j∈Z+);i代表第i种离子类型(i∈{b,b-H2O,b-NH3,y,y-H2O,y-NH3});Tij代表离子类型i在区间j中的强度识别能力;N(rij)代表离子类型i在区间j中正确匹配峰的数目;N(eij)代表离子类型i在区间j中错匹配峰的数目;
(6)对每个候选肽段基于峰强度识别能力进行打分,选择最高得分的肽段作为此实验图谱鉴定结果,并对鉴定结果进行判定;
打分过程包括:基于强度识别能力匹配打分,基于强度识别能力连续匹配打分以及基于强度识别能力b,y离子匹配打分,具体如下:
1)基于强度识别能力离子匹配打分:
S 0 = k 0 01811 n 0 &Sigma; l I l
其中,k0是实验图谱与理论图谱匹配峰的数目;n0是理论图谱峰数目;是匹配峰离子强度识别能力之和;0.1811为随机匹配概率值,等于随机肽段实验图谱匹配峰数目除以理论图谱峰数目;
2)基于强度识别能力连续匹配打分:
S 1 = k 1 0.0828 n 1 &Sigma; l ( I m + I p )
其中,多个离子的连续匹配将转化成多个两个离子的连续匹配;k1是实验图谱连续匹配峰数目;n1是理论图谱连续匹配峰数目,是第m和p个峰构成了一个连续匹配,两个连续匹配峰强度识别能力之和;0.0828为随机匹配概率值,随机肽段实验图谱连续匹配峰数目除以理论连续峰数目;
3)基于强度识别能力b,y离子匹配打分:
S 2 = k 2 ( &Sigma; l Ib l + &Sigma; l Iy l ) 0.0604 n 2
其中,k2是b,y离子实验图谱与理论图谱匹配峰数目;n2是理论图谱b,y峰数目;是匹配b,y离子峰对应的强度识别能力之和;0.0604是随机匹配概率值,等于随机肽段b、y离子匹配峰数目除以其理论b、y离子峰数目
4)基于强度识别能力总分函数:
Sp=0.01*(S0+S1+S2)。
2.根据权利要求1所述的基于峰强度识别能力的蛋白质二级质谱鉴定方法,其特征在于,步骤(3)所述的去同位素峰过程具体包括如下步骤:
1.1)进行初始化,三个比较峰的m/z值及其强度,全部设为0,设三个峰m/z值分别是:m/z_1=0,m/z_2=0,m/z_3=0,其峰强对应是m/z_1_in=0,m/z_2_in=0,m/z_3_in=0,并设置保留峰的容器,已知测量质量误差m;
1.2)读取一个峰的信息,把目前的峰放入第三个峰的位置,即m/z_3,m/z_3_in,把第三个峰与第一个峰和第二个峰比较,判断是否是前两个峰的同位素峰,
1.2.1)如果以下三个条件的任意一个条件成立,则认为是同位素峰,
a.|m/z_3-m/z_2-1|<=m并且m/z_2_in>m/z_3_in;
b.|m/z_3-m/z_1-1|<=m并且m/z_1_in>m/z_3_in;
c.|m/z_2-m/z_1|<=m并且m/z_2_in>m/z_3_in,此为相同峰信息,记录误差,执行三个峰向前平移一位,空出第三个峰的位置,即:
m/z_1=m/z_2,m/z_1_in=m/z_2_in;
m/z_2=m/z_3,m/z_2_in=m/z_3_in;
1.2.2)如果步骤1.2.1)中的三个条件均不成立,则认为目前进入第三位置的峰不是同位素峰,将其作为保留峰存入保留峰容器中,并把三个峰向前平移一位,空出第三个峰的位置,即:m/z_1=m/z_2,m/z_1_in=m/z_2_in;
1.3)逐个读取下一个峰的信息,重复步骤1.2)直到处理完一张二级质谱图所用峰信息,其保留峰容器中的峰即为去同位素峰之后的非同位素峰。
3.根据权利要求1所述的基于峰强度识别能力的蛋白质二级质谱鉴定方法,其特征在于,步骤(4)具体包括如下步骤:
1)产生候选肽段产生的理论碎片b、y离子;
2)如果步骤1)产生b、y离子中包含S、T、E和D四种氨基酸中的一种,则产生对应的丢水碎片离子b-H2O和y-H2O;
3)如果步骤1)产生b、y离子中包含R、K、Q和N四种氨基酸中的一种,则产生对应的丢氨碎片离子b-NH3和y-NH3
4)待分析二级质谱母离子价态是1价,则考虑产生一价碎片离子;
5)若待分析二级质谱母离子价态大于等于2,并且对应的碎片离子中包含R,K和H三种氨基酸其中一种时,则考虑二价碎片离子峰;
根据步骤1)~5)产生所有理论碎片离子的方法规则,得到候选肽段的理论图谱。
4.根据权利要求1所述的基于峰强度识别能力的蛋白质二级质谱鉴定方法,其特征在于,步骤(2)所述的候选肽段的筛选方法如下步骤:
1)加载database.index文件信息到内存数组index,读取待分析二级质谱的母离子的m/z值和电荷信息,并计算其母离子去电荷后的质量数;
2)根据容许的质量误差查找index数组记录并读取相应肽段信息,查找index数组找到其在文件database.ind中的开始位置和行数,由此位置开始顺序读取相应的行数加入内存中,即加载了此区间内的所有肽段信息;
3)对内存加载肽段进行逐步的精细筛选,作为此待分析二级质谱的候选肽段。
5.根据权利要求1所述的基于峰强度识别能力的蛋白质二级质谱鉴定方法,其特征在于,步骤(3)所述的选取有效峰的方法如下步骤:
1)寻找实验图谱m/z的最大值和最小值分别为maxm/z和minm/z,以及峰强度的最大值max_intensity和对应的m/z值;
2)将实验图谱划分为k个窗口,其中k=max(round([(maxm/z-m/z)/50,(m/z-minm/z)/50]+0.5));
3)以max_intensity对应的m/z为基准,并向左右延伸,每次分别开启50Da的窗口,直到窗口数等于k结束;
4)对每一窗口的峰进行归一化,也即用每个峰除以该窗口的最强峰,并选择该窗口下最强的6个峰作为有效峰。
CN201410299214.3A 2014-06-26 2014-06-26 基于峰强度识别能力的蛋白质二级质谱鉴定方法 Active CN104076115B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201410299214.3A CN104076115B (zh) 2014-06-26 2014-06-26 基于峰强度识别能力的蛋白质二级质谱鉴定方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201410299214.3A CN104076115B (zh) 2014-06-26 2014-06-26 基于峰强度识别能力的蛋白质二级质谱鉴定方法

Publications (2)

Publication Number Publication Date
CN104076115A CN104076115A (zh) 2014-10-01
CN104076115B true CN104076115B (zh) 2015-12-30

Family

ID=51597521

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201410299214.3A Active CN104076115B (zh) 2014-06-26 2014-06-26 基于峰强度识别能力的蛋白质二级质谱鉴定方法

Country Status (1)

Country Link
CN (1) CN104076115B (zh)

Families Citing this family (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106033501B (zh) * 2015-03-16 2018-11-30 中国科学院计算技术研究所 一种交联二肽快速鉴定方法
CN104765984B (zh) * 2015-03-20 2017-07-11 同济大学 一种生物质谱数据库快速建立与搜索的方法
CN105823883B (zh) * 2015-11-19 2017-07-18 云南民族大学 基于泊松分布模型的蛋白质二级质谱鉴定方法
CN105527359B (zh) * 2015-11-19 2017-10-31 云南民族大学 基于正反库特征信息匹配的蛋白质二级质谱鉴定方法
CN106404878B (zh) * 2016-08-26 2019-03-19 中山大学中山眼科中心 基于多组学丰度信息的蛋白质二级质谱鉴定方法
CN107729721B (zh) * 2017-10-17 2021-01-19 中国科学院上海有机化学研究所 一种代谢物鉴定及紊乱通路分析方法
AU2018395430A1 (en) * 2017-12-29 2020-07-23 Nautilus Subsidiary, Inc. Decoding approaches for protein identification
EP3870193A4 (en) * 2018-10-24 2022-07-20 Protein Dynamic Solutions, Inc. SYSTEM AND PROCEDURE FOR DEAMINING THE DEAMIDATION AND IMMUNOGENICITY OF POLYPEPTIDES
CN111524549B (zh) * 2020-03-31 2023-04-25 中国科学院计算技术研究所 一种基于离子索引的整体蛋白质鉴定方法
CN115698698A (zh) * 2020-06-02 2023-02-03 株式会社岛津制作所 微生物识别用标记的确定方法
CN112415208A (zh) * 2020-11-17 2021-02-26 北京航空航天大学 一种评价蛋白组学质谱数据质量的方法
CN114596912B (zh) * 2022-02-18 2023-08-29 五邑大学 一种基于多肽长度的短肽组学鉴定方法及其应用
CN117095743B (zh) * 2023-10-17 2024-01-05 山东鲁润阿胶药业有限公司 一种小分子肽阿胶的多肽谱匹配数据分析方法及系统
CN117423400B (zh) * 2023-12-18 2024-04-12 浙江大学长三角智慧绿洲创新中心 一种基于质谱数据的天然分子的解析方法和系统

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101871945A (zh) * 2010-06-13 2010-10-27 中国科学院计算技术研究所 谱库的生成方法和串联质谱谱图鉴定方法
JP4841414B2 (ja) * 2006-12-08 2011-12-21 株式会社島津製作所 質量分析を用いたアミノ酸配列解析方法、アミノ酸配列解析装置、アミノ酸配列解析用プログラム、及びアミノ酸配列解析用プログラムを記録した記録媒体
CN102495127A (zh) * 2011-11-11 2012-06-13 暨南大学 一种基于概率统计模型的蛋白质二级质谱鉴定方法
CN103245714A (zh) * 2013-03-25 2013-08-14 暨南大学 基于候选肽段区分度标记图谱的蛋白质二级质谱鉴定方法

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4841414B2 (ja) * 2006-12-08 2011-12-21 株式会社島津製作所 質量分析を用いたアミノ酸配列解析方法、アミノ酸配列解析装置、アミノ酸配列解析用プログラム、及びアミノ酸配列解析用プログラムを記録した記録媒体
CN101871945A (zh) * 2010-06-13 2010-10-27 中国科学院计算技术研究所 谱库的生成方法和串联质谱谱图鉴定方法
CN102495127A (zh) * 2011-11-11 2012-06-13 暨南大学 一种基于概率统计模型的蛋白质二级质谱鉴定方法
CN103245714A (zh) * 2013-03-25 2013-08-14 暨南大学 基于候选肽段区分度标记图谱的蛋白质二级质谱鉴定方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
335. *
Binomial Probability Distribution Model-Based Protein Identification Algorithm for Tandem Mass Spectrometry Utilizing Peak Intensity Information;Chuan-Le Xiao等;《Journal of Proteome Research》;20121119;第12卷;328-335 *

Also Published As

Publication number Publication date
CN104076115A (zh) 2014-10-01

Similar Documents

Publication Publication Date Title
CN104076115B (zh) 基于峰强度识别能力的蛋白质二级质谱鉴定方法
CN103245714B (zh) 基于候选肽段区分度标记图谱的蛋白质二级质谱鉴定方法
CN102495127B (zh) 一种基于概率统计模型的蛋白质二级质谱鉴定方法
CN104034792B (zh) 基于质荷比误差识别能力的蛋白质二级质谱鉴定方法
CN105527359B (zh) 基于正反库特征信息匹配的蛋白质二级质谱鉴定方法
CN110838340B (zh) 一种不依赖数据库搜索的蛋白质生物标志物鉴定方法
US8694264B2 (en) Mass spectrometry system
CN103810200B (zh) 开放式蛋白质鉴定的数据库搜索方法及其系统
CN105823883B (zh) 基于泊松分布模型的蛋白质二级质谱鉴定方法
CN104215729B (zh) 串联质谱数据母离子检测模型训练方法及母离子检测方法
CN104182658A (zh) 一种串联质谱谱图鉴定方法
CN110349621B (zh) 肽段-谱图匹配可信度检验方法、系统、存储介质及装置
CN101055558B (zh) 基于质谱数据同位素模式的质谱有效峰选取方法
CN106033501B (zh) 一种交联二肽快速鉴定方法
CN112415208A (zh) 一种评价蛋白组学质谱数据质量的方法
CN107563148A (zh) 一种基于离子索引的整体蛋白质鉴定方法与系统
CN106404878A (zh) 基于多组学丰度信息的蛋白质二级质谱鉴定方法
CN103235030B (zh) 基于支持向量机和飞行时间质谱的白酒品牌鉴别方法
CN108388774A (zh) 一种多肽谱匹配数据的在线分析方法
He et al. Optimization-based peptide mass fingerprinting for protein mixture identification
CN107729719A (zh) 一种从头测序方法
CA2543465C (en) Calculating confidence levels for peptide and protein identification
KR100699437B1 (ko) 아미노산 서열 분석 장치 및 방법
Day et al. PPM-chain-De novo peptide identification program comparable in performance to sequest
CN117711491A (zh) 一种基于离子索引的蛋白质串联质谱图鉴定方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
TR01 Transfer of patent right

Effective date of registration: 20170703

Address after: High tech Industrial Development Zone, Guangzhou City, Guangdong province 510663 Science City skim Springs Road No. 3, Guangzhou international business incubator D 504-505

Patentee after: FITGENE BIOTECHNOLOGY CO.,LTD.

Address before: 650031 No. 121, 134 Avenue, Kunming, Yunnan

Patentee before: YUNNAN MINZU University

CP01 Change in the name or title of a patent holder
CP01 Change in the name or title of a patent holder

Address after: 510663 Guangzhou City International Business Incubator D 504-505, science and Technology City, Guangzhou, Guangdong, 3

Patentee after: Guangzhou Huijun Biotechnology Co.,Ltd.

Address before: 510663 Guangzhou City International Business Incubator D 504-505, science and Technology City, Guangzhou, Guangdong, 3

Patentee before: FITGENE BIOTECHNOLOGY CO.,LTD.

PE01 Entry into force of the registration of the contract for pledge of patent right
PE01 Entry into force of the registration of the contract for pledge of patent right

Denomination of invention: Identification of protein by secondary mass spectrometry based on peak intensity recognition ability

Effective date of registration: 20210804

Granted publication date: 20151230

Pledgee: Development Zone sub branch of Bank of Guangzhou Co.,Ltd.

Pledgor: Guangzhou Huijun Biotechnology Co.,Ltd.

Registration number: Y2021980007318

PC01 Cancellation of the registration of the contract for pledge of patent right
PC01 Cancellation of the registration of the contract for pledge of patent right

Date of cancellation: 20220830

Granted publication date: 20151230

Pledgee: Development Zone sub branch of Bank of Guangzhou Co.,Ltd.

Pledgor: Guangzhou Huijun Biotechnology Co.,Ltd.

Registration number: Y2021980007318