CN101776681B - 一种利用蛋白质芯片技术鉴定差异表达蛋白的新方法 - Google Patents

一种利用蛋白质芯片技术鉴定差异表达蛋白的新方法 Download PDF

Info

Publication number
CN101776681B
CN101776681B CN200910045221.XA CN200910045221A CN101776681B CN 101776681 B CN101776681 B CN 101776681B CN 200910045221 A CN200910045221 A CN 200910045221A CN 101776681 B CN101776681 B CN 101776681B
Authority
CN
China
Prior art keywords
protein
ion
peak
differential
mass
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
CN200910045221.XA
Other languages
English (en)
Other versions
CN101776681A (zh
Inventor
陈喆
吴剑丙
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Individual
Original Assignee
Individual
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Individual filed Critical Individual
Priority to CN200910045221.XA priority Critical patent/CN101776681B/zh
Publication of CN101776681A publication Critical patent/CN101776681A/zh
Application granted granted Critical
Publication of CN101776681B publication Critical patent/CN101776681B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Investigating Or Analysing Biological Materials (AREA)

Abstract

本发明根据相关的文献和蛋白质芯片的原理,找到了一种可以直接利用蛋白质芯片找到的差异峰来进行目标蛋白质筛选的生物信息学方法,可以免除中间实验的繁烦步骤,直接针对目标蛋白质进行锁定,以便于进一步的实验验证。本发明主要包括如下流程:步骤1:将实验样本进行蛋白质芯片的实验操作,每个样本都可以得到一系列蛋白质离子峰的数据。步骤2:根据实验设计的情况,对样本进行分组,得到不同组份样本间的差异蛋白峰。步骤3:对步骤二得到的差异蛋白峰进行蛋白质预测。依据蛋白质断裂的三种情况,我们综合3种方法来对差异蛋白峰进行蛋白预测。

Description

一种利用蛋白质芯片技术鉴定差异表达蛋白的新方法
技术领域
本发明属于生物技术领域,涉及生物标记和药物靶标筛选方面。
背景技术
本发明是一种适用于蛋白芯片数据分析的新算法,可以将实验鉴定的差异蛋白峰所对应的目标蛋白进行生物信息学预测。适用于基于SELDI(表面增强激光解吸离子)或MALDI(基质辅助激光解吸电离离子)平台的蛋白芯片实验系统。
飞行时间质谱(TOF)蛋白质芯片能够找到对照及实验样本之间的差异峰,而这些差异峰都是由相应的蛋白经过激发而产生的(蛋白质在吸收能量后脱离芯片表面,由于其中加有一个正电荷,在电场中向阴极飞去,分子量大的飞行时间长,分子量小的飞行时间短,以此标记蛋白质的分子量),蛋白质芯片的原理大致如图1。
由于蛋白质芯片分析的是混合蛋白,通过单次质谱,解析离子峰所对应的蛋白是困难的,故这些差异峰对应的是哪个或者哪些蛋白质却并不知道,需要进一步的利用其他实验方法得到,如western[1],串联质谱[2]等,这样即耗时又耗费金钱。
因为SELDI一般使用能量比较低的激光,因此产生的主要的是一价离子,所以理论的m/z值即为多肽的分子量与一个质子的质量。常规的方法就是将实验分析得到的感兴趣的离子峰的m/z值,与基因的理论的m/z比较,来得到离子峰所对应的基因。由于实验误差的存在,以及理论的m/z可能计算不准,如多肽链可能脱水或脱氨,因此m/z比较的时候可以允许一定的偏差的,一般Δm/z=1~20Da(道尔顿,分子量计量单位)是可以接受的。使用该方法对应到的基因,可以使用western直接进行实验验证。但是该方法也有自己的缺点。我们感兴趣的离子峰的m/z值一般都在1,000~10,000Da左右,而在swiss-prot的人的蛋白数据库中,大约只有2.78%(348/12,484)的基因m/z小于10,000。因此这种方法实际上是将基因组内97%以上的基因都排除在外。这显然是不够合理的。因此我们提出了新的解决方案。
在飞行时间质谱(TOF)蛋白质芯片的实验过程中,蛋白质的断裂有三种情况:一是有些蛋白是完整的,没有在内部发生断裂;第二种是有些蛋白的肽键只发生了一次断裂,并由此产生两种离子,阳离子和阴离子;第三种情况是有些蛋白发生了随机的断裂,且断裂的次数大于一次。
我们的专利方法通过综合分析这3种不同的情况,利用生物信息学方法预测蛋白质芯片质谱峰所对应的蛋白质。
附图说明
图1是蛋白质芯片的原理图。
图2是质谱生成b-ion(负离子)和y-ion(正离子)两种离子的示意图。
图3是直接搜索法的结果。
图4是间接搜索法的结果。
图5是混合搜索法的结果。
发明内容
本发明根据相关的文献和蛋白质芯片的原理,找到了一种可以直接利用蛋白质芯片找到的差异峰来进行目标蛋白质筛选的生物信息学方法,可以免除中间实验的繁烦步骤,直接针对目标蛋白质进行锁定,以便于进一步的实验验证。
其实施步骤如下:
步骤一:将实验样本(病人的血清标本)进行蛋白质芯片的实验操作,每个样本都可以得到一系列蛋白质离子峰的数据。
步骤二:根据实验设计的情况,对样本进行分组,得到不同组份样本间的差异蛋白峰。
步骤三:对步骤二得到的差异蛋白峰进行蛋白质预测。依据蛋白质断裂的三种情况,我们综合3种方法来对差异蛋白峰进行蛋白预测。
方法一:该方式假定目标蛋白没有发生断裂,我们直接将差异蛋白峰与蛋白质数据库(如swiss-prot数据库,www.ebi.ac.uk/swiss)中已经存在的蛋白质进行比较,比较的标准是利用质荷比(m/z)这个参数。
方法二:假蛋白只断裂一次,该方法假定蛋白(多肽)只断裂一次。那么将生成b-ion(负离子)和y-ion(正离子)两种离子。b-ion和y-ion产生的示意图见图2。
通过将我们感兴趣的离子峰的m/z值与蛋白数据库中所有理论的b-ion和y-ion的m/z相比较,既可找出质谱峰对应的蛋白。一般允许误差取Δm/z=0.01~0.1Da比较适宜。
方法三:假设蛋白断裂的次数大于一次,最后利用假设检验的方法可以给出m/z与基因的关联的显著性。对于同时可以获得基因芯片数据的项目,使用这种方法是比较恰当的。
在第二种方法中,假设每个蛋白(多肽)被切割不多于一次。更为宽松的假设则是不限制蛋白(多肽)被切割的次数。即蛋白(多肽)可以被随意切碎,产生任意的子肽段。但是这样的假设会大大的增加理论离子库的规模,结果是,每个我们要分析的离子峰m/z都会找到很多个基因相对应。为了从这些众多的基因中,筛选出真正的对应来,需要用到基因芯片实验的数据。利用基因芯片筛选到的差异基因,作为分析背景,可以大大的缩小理论离子库的规模,提高信噪比。最后利用假设检验的方法可以给出m/z与基因的关联的显著性。对于同时可以获得基因芯片数据的项目,使用混合搜索法是比较恰当的。
简单来讲,比如我们使用swiss-prot数据库,假设该数据库一共有R条蛋白质(多肽)序列。这些序列的长度记为n1,n2,…,nR。对于任何一个质量为m的峰,在数据库中能产生该峰的多肽序列长度应该介于L1和L2之间,其中
Figure GDA00003093992800021
Figure GDA00003093992800022
186.07932和57.02147分别为最大氨基酸残基(tryptophan)和最小残基(glycine)的分子量。
那么,在数据库中,可以产生质量为m的峰的多肽总数为:
N ( m ) = Σ l = L 1 L 2 Σ i = 1 R ( n i - l + 1 )
在这N(m)个多肽中,质量恰好为m的多肽数目记作E(m),那么质量为m的峰的背景分布频率为: θ ~ ( m ) = E ( m ) N ( m ) .
实际上由于精确度的原因,我们允许m值有小的误差δ(比如说δ=0.1Da),那么mδ=[m-δ,m+δ],则: θ ~ ( m δ ) = E ( m δ ) N ( m δ ) .
获得了质量为m的峰的背景分布频率之后,对于一个基因芯片筛选到的差异基因P(氨基酸长度为np),该基因能产生质量为mδ的多肽总数为
N P ( m δ ) = Σ l = L 1 L 2 ( n p - l + 1 )
基因P与质量为m的峰之间的匹配是完全随机的概率为:
P - value = 1 - ( N P ( m δ ) 0 ) θ ( m δ ) 0 ( 1 - θ ( m δ ) ) N P ( m δ )
= 1 - ( 1 - θ ( m δ ) ) N P ( m δ )
如果基因P与质量为m的峰之间的P-value小于某个阈值,比如说0.01,我们就可以认为基因P与质量为m的峰之间的匹配不是随机的,即质量为m的峰很有可能来源于基因P。
本方法的特征:
该方法根据相关的文献和蛋白质芯片的原理,找到了一种可以直接利用蛋白质芯片找到的差异峰来进行目标蛋白质筛选的生物信息学方法,可以免除中间实验的繁烦步骤,直接针对目标蛋白质进行锁定,以便于进一步的实验验证。
在创新性方面,我们的方法解决了常规方法无法预测大分子量蛋白的问题(方法二)。同时提供了一种整合基因芯片与蛋白芯片分析来鉴定蛋白的新方法(方法三)。最后通过整合3种不同的方法,可以大大增加预测的灵敏度和特异度。
下面以一癌症疾病实例,做进一步的说明
疾病类型:一种癌症
SELDI结果:根据SELDI芯片分析,找到了10个差异峰。
进一步的分析:
利用前期的SELDI芯片得到的差异峰,利用上述的算法,对上述的差异峰进行了分析,结果如下:
方法一:直接搜索法的结果(部分结果)
参见图3。
方法二:间接搜索法结果
参见图4。
方法三:混合搜索法结果
参见图5。
参考文献:
[1]JT Huang et al.Independent protein-profiling studies show adecreasein apolipoprotein Al levels in schizophrenia CSF,brain andperipheraltissues.Mol Psychiatry.2007Oct16
[2]G Kwapiszewska et al.Identification of proteinsinlaser-microdissected small cell numbers by SELDI-TOF and TandemMS.BMCBiotechnol.2004Dec3;4:30.
[3]YT Li et al.Identification of a plasma proteomic signaturetodistinguish pediatric osteosarcoma from benign osteochondroma.Proteomics2006,6,3426-3435
[4]XT Deng et al.Link test-a statistical method for findingprostatecancer biomarkers.Computational Biology and Chemistry30(2006)425-433
以上是对本发明的描述而非限定,基于本发明思想的其它实施方式,均在本发明的保护范围之中。

Claims (1)

1.一种非诊断目的的利用蛋白质芯片技术鉴定差异表达蛋白的新方法,其特征在于该方法包括有如下步骤:
步骤1:将实验样本进行蛋白质芯片的实验操作,每个样本都可以得到一系列蛋白质离子峰的数据;
步骤2:根据实验设计的情况,对样本进行分组,得到不同组份样本间的差异蛋白峰;
步骤3:对步骤2得到的差异蛋白峰进行蛋白质预测;依据蛋白质断裂的三种情况,采用三种方式来对差异蛋白峰进行蛋白质预测;
其中,在步骤3中对其得到的差异蛋白峰采用三种方法进行蛋白质预测:方法一:假定目标蛋白没有发生断裂,将差异蛋白峰与蛋白质数据库已经存在的蛋白质进行比较,比较的标准是利用质荷比m/z这个参数;方法二:假设蛋白只断裂一次,该方法假定蛋白只断裂一次,那么将生成负离子b-ion和正离子y-ion两种离子,通过将感兴趣的离子峰的质荷比m/z值与蛋白数据库中所有理论的b-ion和y-ion的质荷比m/z相比较,即可找出质谱峰对应的蛋白,允许误差取Δm/z=0.01~0.1Da;方法三:假设蛋白断裂的次数大于一次,利用假设检验的方法可以给出质荷比m/z与基因的关联的显著性。
CN200910045221.XA 2009-01-13 2009-01-13 一种利用蛋白质芯片技术鉴定差异表达蛋白的新方法 Expired - Fee Related CN101776681B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN200910045221.XA CN101776681B (zh) 2009-01-13 2009-01-13 一种利用蛋白质芯片技术鉴定差异表达蛋白的新方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN200910045221.XA CN101776681B (zh) 2009-01-13 2009-01-13 一种利用蛋白质芯片技术鉴定差异表达蛋白的新方法

Publications (2)

Publication Number Publication Date
CN101776681A CN101776681A (zh) 2010-07-14
CN101776681B true CN101776681B (zh) 2014-05-14

Family

ID=42513193

Family Applications (1)

Application Number Title Priority Date Filing Date
CN200910045221.XA Expired - Fee Related CN101776681B (zh) 2009-01-13 2009-01-13 一种利用蛋白质芯片技术鉴定差异表达蛋白的新方法

Country Status (1)

Country Link
CN (1) CN101776681B (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109187403B (zh) * 2018-10-19 2021-07-23 海南师范大学 一种5-苯基-1-(对甲基苯基)-1h-三唑与血清作用的差异蛋白检测方法

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1928548A (zh) * 2005-09-11 2007-03-14 翁炳焕 蛋白质组学产前诊断方法
CN101169417A (zh) * 2006-10-23 2008-04-30 许洋 用磁珠支持基质及质谱判断正常人与肝癌的试剂盒和方法

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7723045B2 (en) * 2006-02-10 2010-05-25 The Regents Of The University Of California Assays to predict atherosclerosis and dysfunctional high-density lipoprotein

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1928548A (zh) * 2005-09-11 2007-03-14 翁炳焕 蛋白质组学产前诊断方法
CN101169417A (zh) * 2006-10-23 2008-04-30 许洋 用磁珠支持基质及质谱判断正常人与肝癌的试剂盒和方法

Non-Patent Citations (9)

* Cited by examiner, † Cited by third party
Title
A Fragmentation Event Model for Peptide Identification by Mass Spectrometry;Yu Lin et al.;《RECOMB 2008》;20081231;第154-166页 *
A New Strategy for Identification of N-Glycosylated Proteins and Unambiguous Assignment of Their Glycosylation Sites Using HILIC Enrichment and Partial Deglycosylation;Per Ha1gglund et al.;《Journal of Proteome Research》;20041231(第3期);第556-566页 *
Per Ha1gglund et al..A New Strategy for Identification of N-Glycosylated Proteins and Unambiguous Assignment of Their Glycosylation Sites Using HILIC Enrichment and Partial Deglycosylation.《Journal of Proteome Research》.2004,(第3期),第556-566页.
Yu Lin et al..A Fragmentation Event Model for Peptide Identification by Mass Spectrometry.《RECOMB 2008》.2008,第154-166页.
基因芯片的数据处理与分析;张学工等;《中国计算机学会通讯》;20060531;第2卷(第3期);第3-15页 *
应用SELDI-TOF-MS蛋白质芯片技术筛选肝细胞性肝癌血清标志物的研究;耿鑫等;《中国肿瘤临床》;20061231;第33卷(第20期);第1161-1164页 *
张学工等.基因芯片的数据处理与分析.《中国计算机学会通讯》.2006,第2卷(第3期),第3-15页.
耿鑫等.应用SELDI-TOF-MS蛋白质芯片技术筛选肝细胞性肝癌血清标志物的研究.《中国肿瘤临床》.2006,第33卷(第20期),第1161-1164页.
陈喆等.幽门螺杆菌临床菌株尿素酶B亚单位原核表达系统的构建及其重组蛋白免疫性的鉴定.《浙江大学学报(医学版)》.2003,第32卷(第1期),第4-8页. *

Also Published As

Publication number Publication date
CN101776681A (zh) 2010-07-14

Similar Documents

Publication Publication Date Title
Lange et al. Selected reaction monitoring for quantitative proteomics: a tutorial
Fang et al. Glyco-Decipher enables glycan database-independent peptide matching and in-depth characterization of site-specific N-glycosylation
Xu et al. MassMatrix: a database search program for rapid characterization of proteins and peptides from tandem mass spectrometry data
Ning et al. Computational analysis of unassigned high‐quality MS/MS spectra in proteomic data sets
Shao et al. Applications of urinary proteomics in biomarker discovery
CN103698447B (zh) 一种利用高能碰撞诱导电离碎裂技术鉴定蛋白的方法
Huang et al. Top-down tandem mass spectrometry of tRNA via ion trap collision-induced dissociation
Wang et al. Mass spectrometry-based protein identification by integrating de novo sequencing with database searching
Yu et al. Automated glycan sequencing from tandem mass spectra of N-linked glycopeptides
Sun et al. Stratification of follicular thyroid tumours using data‐independent acquisition proteomics and a comprehensive thyroid tissue spectral library
Zhang et al. De novo sequencing of tryptic peptides derived from deinococcus radiodurans ribosomal proteins using 157 nm photodissociation MALDI TOF/TOF mass spectrometry
Potts et al. Neucode labels for multiplexed, absolute protein quantification
Croft et al. Simultaneous Quantification of Viral Antigen Expression Kinetics Using Data-Independent (DIA) Mass Spectrometry*[S]
Liang et al. Serum metabolomics uncovering specific metabolite signatures of intra-and extrahepatic cholangiocarcinoma
Yan et al. A graph-theoretic approach for the separation of b and y ions in tandem mass spectra
EP4033250A1 (en) Method of assaying the purity of a therapeutic polypeptide
Hocker et al. Serum discrimination of early-stage lung cancer patients using electrospray-ionization mass spectrometry
Lau et al. Observations on the detection of b‐and y‐type ions in the collisionally activated decomposition spectra of protonated peptides
JP2007263641A (ja) 構造解析システム
Driver et al. Proteomic database search engine for two-dimensional partial covariance mass spectrometry
US7691643B2 (en) Mass analysis method and mass analysis apparatus
US20120109533A1 (en) Method of analyzing protein using data-independent analysis combined with data-dependent analysis
JP2004279424A (ja) 質量分析法を用いた生体高分子の同定方法及び及びそれに使用されるプログラム製品
CN101776681B (zh) 一种利用蛋白质芯片技术鉴定差异表达蛋白的新方法
JP2015021739A (ja) 質量分析におけるペプチドピークの同定・定量のためのデータベース作成方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20140514

Termination date: 20170113