CN108761084A - 一种完整n-糖蛋白一级结构全面鉴定方法 - Google Patents
一种完整n-糖蛋白一级结构全面鉴定方法 Download PDFInfo
- Publication number
- CN108761084A CN108761084A CN201810503019.6A CN201810503019A CN108761084A CN 108761084 A CN108761084 A CN 108761084A CN 201810503019 A CN201810503019 A CN 201810503019A CN 108761084 A CN108761084 A CN 108761084A
- Authority
- CN
- China
- Prior art keywords
- glycoprotein
- polysaccharide
- solution
- complete
- ion
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 102000003886 Glycoproteins Human genes 0.000 title claims abstract description 81
- 108090000288 Glycoproteins Proteins 0.000 title claims abstract description 81
- 238000000034 method Methods 0.000 title claims abstract description 42
- 229920001282 polysaccharide Polymers 0.000 claims abstract description 76
- 239000005017 polysaccharide Substances 0.000 claims abstract description 76
- 150000004676 glycans Chemical class 0.000 claims abstract description 51
- 239000012634 fragment Substances 0.000 claims abstract description 39
- 239000002243 precursor Substances 0.000 claims abstract description 29
- 238000010494 dissociation reaction Methods 0.000 claims abstract description 21
- 230000005593 dissociations Effects 0.000 claims abstract description 21
- 239000007921 spray Substances 0.000 claims abstract description 13
- 238000006243 chemical reaction Methods 0.000 claims abstract description 12
- 238000001228 spectrum Methods 0.000 claims abstract description 10
- 230000005611 electricity Effects 0.000 claims abstract description 9
- 239000007788 liquid Substances 0.000 claims abstract description 9
- 108090000765 processed proteins & peptides Proteins 0.000 claims abstract description 9
- 150000002500 ions Chemical class 0.000 claims description 64
- 239000000243 solution Substances 0.000 claims description 48
- 150000002772 monosaccharides Chemical class 0.000 claims description 18
- 238000004458 analytical method Methods 0.000 claims description 13
- 238000010586 diagram Methods 0.000 claims description 10
- 230000003068 static effect Effects 0.000 claims description 10
- 238000012360 testing method Methods 0.000 claims description 9
- WEVYAHXRMPXWCK-UHFFFAOYSA-N Acetonitrile Chemical group CC#N WEVYAHXRMPXWCK-UHFFFAOYSA-N 0.000 claims description 7
- 125000003275 alpha amino acid group Chemical group 0.000 claims description 7
- 239000007853 buffer solution Substances 0.000 claims description 7
- 150000004804 polysaccharides Polymers 0.000 claims description 7
- BDAGIHXWWSANSR-UHFFFAOYSA-N methanoic acid Natural products OC=O BDAGIHXWWSANSR-UHFFFAOYSA-N 0.000 claims description 6
- 239000000203 mixture Substances 0.000 claims description 6
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 claims description 6
- 238000002474 experimental method Methods 0.000 claims description 5
- 102100034613 Annexin A2 Human genes 0.000 claims description 4
- 108090000668 Annexin A2 Proteins 0.000 claims description 4
- 238000013467 fragmentation Methods 0.000 claims description 4
- 238000006062 fragmentation reaction Methods 0.000 claims description 4
- OSWFIVFLDKOXQC-UHFFFAOYSA-N 4-(3-methoxyphenyl)aniline Chemical compound COC1=CC=CC(C=2C=CC(N)=CC=2)=C1 OSWFIVFLDKOXQC-UHFFFAOYSA-N 0.000 claims description 3
- 238000010276 construction Methods 0.000 claims description 3
- 238000010790 dilution Methods 0.000 claims description 3
- 239000012895 dilution Substances 0.000 claims description 3
- 235000019253 formic acid Nutrition 0.000 claims description 3
- 102000004169 proteins and genes Human genes 0.000 abstract description 13
- 108090000623 proteins and genes Proteins 0.000 abstract description 13
- 230000013595 glycosylation Effects 0.000 abstract description 11
- 238000006206 glycosylation reaction Methods 0.000 abstract description 9
- 238000004949 mass spectrometry Methods 0.000 abstract description 5
- 241001269238 Data Species 0.000 abstract 1
- 101000900206 Hantaan virus (strain 76-118) Envelopment polyprotein Proteins 0.000 abstract 1
- 230000000155 isotopic effect Effects 0.000 description 19
- 108010066476 ribonuclease B Proteins 0.000 description 9
- 238000004885 tandem mass spectrometry Methods 0.000 description 8
- 108010083644 Ribonucleases Proteins 0.000 description 6
- 102000006382 Ribonucleases Human genes 0.000 description 6
- 238000011160 research Methods 0.000 description 5
- DQJCDTNMLBYVAY-ZXXIYAEKSA-N (2S,5R,10R,13R)-16-{[(2R,3S,4R,5R)-3-{[(2S,3R,4R,5S,6R)-3-acetamido-4,5-dihydroxy-6-(hydroxymethyl)oxan-2-yl]oxy}-5-(ethylamino)-6-hydroxy-2-(hydroxymethyl)oxan-4-yl]oxy}-5-(4-aminobutyl)-10-carbamoyl-2,13-dimethyl-4,7,12,15-tetraoxo-3,6,11,14-tetraazaheptadecan-1-oic acid Chemical compound NCCCC[C@H](C(=O)N[C@@H](C)C(O)=O)NC(=O)CC[C@H](C(N)=O)NC(=O)[C@@H](C)NC(=O)C(C)O[C@@H]1[C@@H](NCC)C(O)O[C@H](CO)[C@H]1O[C@H]1[C@H](NC(C)=O)[C@@H](O)[C@H](O)[C@@H](CO)O1 DQJCDTNMLBYVAY-ZXXIYAEKSA-N 0.000 description 3
- 108010015899 Glycopeptides Proteins 0.000 description 3
- 102000002068 Glycopeptides Human genes 0.000 description 3
- 102000000447 Peptide-N4-(N-acetyl-beta-glucosaminyl) Asparagine Amidase Human genes 0.000 description 3
- 108010055817 Peptide-N4-(N-acetyl-beta-glucosaminyl) Asparagine Amidase Proteins 0.000 description 3
- 238000012512 characterization method Methods 0.000 description 3
- 238000000926 separation method Methods 0.000 description 3
- 206010013457 Dissociation Diseases 0.000 description 2
- -1 Glu-C Proteins 0.000 description 2
- OVRNDRQMDRJTHS-RTRLPJTCSA-N N-acetyl-D-glucosamine Chemical class CC(=O)N[C@H]1C(O)O[C@H](CO)[C@@H](O)[C@@H]1O OVRNDRQMDRJTHS-RTRLPJTCSA-N 0.000 description 2
- 108020002230 Pancreatic Ribonuclease Proteins 0.000 description 2
- 102000005891 Pancreatic ribonuclease Human genes 0.000 description 2
- 150000001413 amino acids Chemical class 0.000 description 2
- 230000008859 change Effects 0.000 description 2
- 230000029087 digestion Effects 0.000 description 2
- 208000018459 dissociative disease Diseases 0.000 description 2
- 235000013399 edible fruits Nutrition 0.000 description 2
- 125000003147 glycosyl group Chemical group 0.000 description 2
- 238000004128 high performance liquid chromatography Methods 0.000 description 2
- 230000006698 induction Effects 0.000 description 2
- 230000010354 integration Effects 0.000 description 2
- 125000000311 mannosyl group Chemical class C1([C@@H](O)[C@@H](O)[C@H](O)[C@H](O1)CO)* 0.000 description 2
- 238000001819 mass spectrum Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004481 post-translational protein modification Effects 0.000 description 2
- 238000012545 processing Methods 0.000 description 2
- 238000003908 quality control method Methods 0.000 description 2
- 108090000317 Chymotrypsin Proteins 0.000 description 1
- 102000005744 Glycoside Hydrolases Human genes 0.000 description 1
- 108010031186 Glycoside Hydrolases Proteins 0.000 description 1
- 101001018085 Lysobacter enzymogenes Lysyl endopeptidase Proteins 0.000 description 1
- 108091005804 Peptidases Proteins 0.000 description 1
- 108010033276 Peptide Fragments Proteins 0.000 description 1
- 102000007079 Peptide Fragments Human genes 0.000 description 1
- 239000004365 Protease Substances 0.000 description 1
- 102100037486 Reverse transcriptase/ribonuclease H Human genes 0.000 description 1
- 239000005864 Sulphur Substances 0.000 description 1
- 108090000631 Trypsin Proteins 0.000 description 1
- 102000004142 Trypsin Human genes 0.000 description 1
- 230000001476 alcoholic effect Effects 0.000 description 1
- 238000005349 anion exchange Methods 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 150000001768 cations Chemical class 0.000 description 1
- 229960002376 chymotrypsin Drugs 0.000 description 1
- 239000008367 deionised water Substances 0.000 description 1
- 229910021641 deionized water Inorganic materials 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000001279 glycosylating effect Effects 0.000 description 1
- 210000000987 immune system Anatomy 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 238000002347 injection Methods 0.000 description 1
- 239000007924 injection Substances 0.000 description 1
- 238000011017 operating method Methods 0.000 description 1
- 230000001575 pathological effect Effects 0.000 description 1
- 230000035479 physiological effects, processes and functions Effects 0.000 description 1
- 230000008569 process Effects 0.000 description 1
- 230000009145 protein modification Effects 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 239000002904 solvent Substances 0.000 description 1
- 230000003595 spectral effect Effects 0.000 description 1
- 230000006641 stabilisation Effects 0.000 description 1
- 238000011105 stabilization Methods 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
- 239000012588 trypsin Substances 0.000 description 1
- 238000012800 visualization Methods 0.000 description 1
- 210000005253 yeast cell Anatomy 0.000 description 1
Classifications
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01N—INVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
- G01N33/00—Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
- G01N33/48—Biological material, e.g. blood, urine; Haemocytometers
- G01N33/50—Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing
- G01N33/68—Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing involving proteins, peptides or amino acids
- G01N33/6803—General methods of protein analysis not limited to specific proteins or families of proteins
- G01N33/6848—Methods of protein analysis involving mass spectrometry
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01N—INVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
- G01N33/00—Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
- G01N33/48—Biological material, e.g. blood, urine; Haemocytometers
- G01N33/50—Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing
- G01N33/68—Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing involving proteins, peptides or amino acids
- G01N33/6803—General methods of protein analysis not limited to specific proteins or families of proteins
- G01N33/6842—Proteomic analysis of subsets of protein mixtures with reduced complexity, e.g. membrane proteins, phosphoproteins, organelle proteins
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01N—INVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
- G01N2333/00—Assays involving biological materials from specific organisms or of a specific nature
- G01N2333/435—Assays involving biological materials from specific organisms or of a specific nature from animals; from humans
- G01N2333/46—Assays involving biological materials from specific organisms or of a specific nature from animals; from humans from vertebrates
- G01N2333/47—Assays involving proteins of known structure or function as defined in the subgroups
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01N—INVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
- G01N2560/00—Chemical aspects of mass spectrometric analysis of biological material
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01N—INVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
- G01N2570/00—Omics, e.g. proteomics, glycomics or lipidomics; Methods of analysis focusing on the entire complement of classes of biological molecules or subsets thereof, i.e. focusing on proteomes, glycomes or lipidomes
Landscapes
- Life Sciences & Earth Sciences (AREA)
- Health & Medical Sciences (AREA)
- Engineering & Computer Science (AREA)
- Molecular Biology (AREA)
- Physics & Mathematics (AREA)
- Hematology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Chemical & Material Sciences (AREA)
- Biomedical Technology (AREA)
- Urology & Nephrology (AREA)
- Immunology (AREA)
- Biophysics (AREA)
- Analytical Chemistry (AREA)
- Microbiology (AREA)
- Biotechnology (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Food Science & Technology (AREA)
- Medicinal Chemistry (AREA)
- Cell Biology (AREA)
- Biochemistry (AREA)
- General Health & Medical Sciences (AREA)
- General Physics & Mathematics (AREA)
- Pathology (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Other Investigation Or Analysis Of Materials By Electrical Means (AREA)
Abstract
本发明涉及一种完整N‑糖蛋白一级结构全面鉴定方法,包括以下步骤:N‑糖蛋白的样品预处理,即糖蛋白溶液与DTT溶液反应后用电喷雾缓冲溶液稀释;通过注射器和注射器泵上样,在正离子模式下喷雾,基于HCD解离的轨道阱质谱仪采集样品的一级谱和二级谱;N‑多糖前体离子理论数据库的生成;N‑糖蛋白前体离子理论数据库的生成;N‑多糖拓扑结构的解析;N‑糖蛋白结构的解析。与现有技术相比,本发明能够在完整蛋白水平上同时获得多糖拓扑结构及蛋白的结构解析并且获得多糖选择性解离的特征碎片离子,方法步骤简单,鉴定高效而准确。适用于糖蛋白基于高分辨串级质谱分析的多糖拓扑结构鉴定、糖基化位点确定、蛋白骨架解析。
Description
技术领域
本发明涉及与生物质谱相关的系统生物学、糖蛋白质组学等技术领域,尤其是涉及一种。
背景技术
糖基化修饰是蛋白质上最普遍、最重要的翻译后修饰之一,人体中百分之五十以上的蛋白都发生了糖基化,糖基化具有极其重要的生理和病理功能(Rudd,P.M.;Elliott,T.;Cresswell,P.;Wilson,I.A.;Dwek,R.A.,Glycosylation and the immunesystem.Science 2001,291(5512),2370-2376.)。基于串级质谱的糖蛋白质组学已经成为蛋白氨基酸序列、蛋白糖基化位点、单糖组成及其拓扑结构鉴定和解析的重要分析方法之一((a)Raman,R.;Raguram,S.;Venkataraman,G.;Paulson,J.C.;Sasisekharan,R.,Glycomics:an integrated systems approach to structure-function relationshipsof glycans.Nat Methods 2005,2(11),817-824;(b)Zaia,J.,Mass Spectrometry andthe Emerging Field of Glycomics.Chemistry&biology 2008,15(9),881-892.)。现有表征蛋白糖基化的方法主要有以下两种;一种是研究蛋白释放的糖链,使用合适的糖苷酶如肽-N-糖苷酶F/A(PNGase F/A)酶切多糖与蛋白上氨基酸连接的糖苷键释放多糖,然后再对多糖进行富集分离分析;另一种方法采用合适的蛋白酶如Glu-C,trypsin,Lys-C或Chymotrypsin酶切糖蛋白形成糖肽与肽段的混合物,然后对糖肽进行富集分离分析(Shajahan,A.;Heiss,C.;Ishihara,M.;Azadi,P.,Glycomic and glycoproteomicanalysis of glycoproteins-a tutorial.Anal Bioanal Chem 2017,409(19),4483-4505.)。以上两种方法操作步骤都繁琐耗时且非常容易发生漏切的情况;获得的糖蛋白结构信息也有限。由于蛋白质糖基化修饰的多糖结构具有很多连接和分支异构体因此存在很大的结构异质性,给深度表征其结构带来极大的困难;另外研究表明糖基化对蛋白的稳定性也有影响,糖基化修饰位点周围的氨基酸序列相对于未糖基化的相同序列更难断裂(以RNase B和RNase A为例)(Bourgoin-Voillard,S.;Leymarie,N.;Costello,C.E.,Top-downtandem mass spectrometry on RNase A and B using a Qh/FT-ICR hybrid massspectrometer.Proteomics 2014,14(10),1174-1184.),因此对于蛋白骨架的表征及糖基化位点定位也提出了挑战。
申请人前期在整体蛋白质一级结构(包括氨基酸序列,氨基酸上翻译后修饰的种类及其位置)鉴定新方法开发方面已做了很多的工作,有较好的基础。2015-2017年间基于自上而下的质谱技术研究酿酒酵母细胞蛋白质组,开发了离线的高通量强阴离子交换色谱及高效液相色谱(SAX-HPLC)联合的二维正交分离方法,最终鉴定了344个蛋白异构体;该方法表现出了很好的通用性和重现性。
发明内容
本发明的目的就是为了克服上述现有技术存在的缺陷而提供一种基于质谱的串级质谱选择性解离和特征碎片离子的完整N-糖蛋白一级结构全面鉴定方法。
本发明基于自上而下质谱技术实现在完整糖蛋白水平上同时表征蛋白序列、糖基化位点及多糖拓扑结构并获得多糖的选择性解离。
本发明的目的可以通过以下技术方案来实现:
一种完整N-糖蛋白一级结构全面鉴定方法,包括以下步骤:
(1)N-糖蛋白的样品预处理:
糖蛋白溶液与DTT溶液反应后用电喷雾缓冲溶液稀释;
(2)N-糖蛋白的一级质谱及二级质谱分析:
通过注射器和注射器泵上样,在正离子模式下喷雾,基于HCD解离的轨道阱质谱仪采集样品的一级谱和二级谱;
(3)N-多糖前体离子理论数据库的生成;
(4)N-糖蛋白前体离子理论数据库的生成;
(5)N-多糖拓扑结构的解析:
(6)N-糖蛋白结构的解析。
在本发明的一个实施方式中,步骤(1)所述N-糖蛋白的样品预处理方法包括以下步骤:
(1.1)溶液的配置:配置糖蛋白溶液、DTT溶液及电喷雾缓冲溶液;
(1.2)糖蛋白溶液与DTT溶液在80℃下反应1h,或,糖蛋白溶液先在95℃下变性5min,然后再与DTT溶液在80℃下反应10min;
(1.3)反应完成后先自然冷却至室温然后用电喷雾缓冲溶液稀释。
在本发明的一个实施方式中,糖蛋白溶液的浓度为1ug/uL,DTT溶液的浓度为200uM,电喷雾缓冲溶液按体积比计由95%水+4.8%乙腈+0.2%甲酸组成。
在本发明的一个实施方式中,步骤(1.2)可以采用两种实现方式:提前把烘箱温度设置到80℃预热;取1ug/uL糖蛋白溶液加入200uM DTT溶液至终浓度50uM,迅速放入烘箱中恒温80℃反应1h。或者取1ug/uL糖蛋白溶液用水浴锅95℃下恒温水浴5min变性;然后加入200uM DTT溶液至终浓度10uM,迅速放入烘箱中恒温80℃反应10min。
在本发明的一个实施方式中,步骤(1.3)用电喷雾缓冲溶液稀释至糖蛋白溶液终浓度为2uM。
在本发明的一个实施方式中,步骤(2)中,优选采用Harvard PHD Ultra注射器泵。
在本发明的一个实施方式中,步骤(2)中,上样的流速为3uL/min的流速。
在本发明的一个实施方式中,步骤(2)所述N-糖蛋白的一级质谱及二级质谱分析包括以下步骤:
(2.1)高分辨轨道阱质谱仪采集一级质谱,获得前体离子的信息;
(2.2)基于HCD碎裂模式对一级质谱中观察到的糖蛋白异构体前体离子采集不同碰撞能量范围的二级质谱。
步骤(2.1)、步骤(2.2)可以采用常规生物技术方法进行。
在本发明的一个实施方式中,步骤(3)所述N-多糖前体离子理论数据库的生成包括以下步骤:
(3.1)对包含一定数量单糖的N-多糖,先对核心结构5个单糖以外的其他单糖进行排列组合;
(3.2)找出所有可能的单糖组成及所有可能的连接方式形成理论的多糖连接及分支异构体;
(3.3)使用GlySeeker根据N-多糖前体离子和理论碎片离子建立多糖的拓扑结构数据库。
步骤(3.1)、步骤(3.2)、步骤(3.3)可以采用常规生物技术方法进行。
其中,GlySeeker是发明人自主研发的搜索引擎,其网址为:proteingoggle.tongji.edu.cn,
GlySeeker已在发表的文章中进行了说明,见Xiao,K.,et al.,Large-scaleidentification and visualization of N-glycans with primary structures usingGlySeeker.Rapid Commun Mass Spectrom,2018.32(2):p.142-148.
其中,核心结构5个单糖包括2个N-乙酰氨基葡萄糖,3个甘露糖。
步骤(3.3)根据N-多糖前体离子和理论碎片离子建立多糖的拓扑结构数据库时,可以建立把蛋白作为静态修饰或者不把蛋白作为静态修饰两种数据库。
在本发明的一个实施方式中,步骤(4)所述N-糖蛋白前体离子理论数据库的生成包括以下步骤:
在Uniprot下载N-糖蛋白的数据库或者氨基酸序列,用ProteinGoggle 2.0建立把多糖作为静态修饰的数据库,可以采用常规生物技术方法进行。
其中,ProteinGoggle 2.0是发明人自主研发的,其网址为:proteingoggle.tongji.edu.cn,ProteinGoggle 2.0已在发表的文章中进行了说明,见Xiao,K.J.,F.Yu,and Z.X.Tian,Top-down protein identification using isotopicenvelope fingerprinting.Journal of Proteomics,2017.152:p.41-47.
在本发明的一个实施方式中,步骤(5)所述N-多糖拓扑结构的解析包括以下步骤:
(5.1)设置GlySeeker搜索数据库的阈值IPACO(isotopic peak abundancecutoff,同位素峰强度阈值)=20%;偏差IPMD(isotopic peak m/z deviation,同位素峰质荷比偏差)=15ppm;偏差IPAD(isotopic peak abundance deviation,同位素峰强度偏差)=30%;
(5.2)每个候选N-多糖的所有理论碎片离子的理论同位素轮廓分别与实验前体离子对应的二级质谱中的碎片离子实验同位素轮廓进行指纹比对,根据一定的偏差阈值找出每个候选N-多糖在实验二级质谱中所匹配的碎片离子;碎片离子实验同位素轮廓指纹比对的质量控制IPACO、IPMD和IPAD来实现,可以采用常规生物技术方法进行;
(5.3)GlySeeker会根据对每个候选N-多糖的二级质谱匹配程度进行统计打分,相似度最高者即为N-多糖ID,并给出碎片离子的同位素轮廓指纹比对及匹配到的多糖结构碎片图解,可以采用常规生物技术方法进行;
(5.4)将低能量下多糖的选择性解离和高能量下高序列覆盖度的糖结构解析的结果手动整合到一起,就获得了信息丰富的多糖拓扑结构的解析,可以采用常规生物技术方法进行。
在本发明的一个实施方式中,步骤(6)所述N-糖蛋白结构的解析包括以下步骤:
(6.1)设置ProteinGoggle 2.0搜索数据库的阈值IPACO(isotopic peakabundance cutoff)=20%,IPMD(isotopic peak m/z deviation)=15ppm和IPAD(isotopic peak abundance deviation)=30%;
(6.2)ProteinGoggle 2.0搜索蛋白的数据库,对每个候选N-糖蛋白的二级质谱匹配程度进行统计打分,相似度最高者即为蛋白ID,并给出碎片离子的同位素轮廓指纹比对及匹配到的蛋白骨架结构碎片图解,可以采用常规生物技术方法进行。
本发明方法基于多糖样本高分辨质谱和串级质谱分析得到实验的一级和二级质谱图、从单糖生成理论多糖二维正交(x和y方向)拓扑结构及其一级质谱前体离子和二级质谱理论碎片离子建立多糖的数据库,包括把蛋白作为静态修饰和不把蛋白作为静态修饰两种建库方法。从Uniprot下载完整N-糖蛋白的数据库,把多糖作为蛋白的静态修饰建库;通过匹配一级质谱与前体离子理论数据库找到理论候选糖蛋白,进一步将实验二级质谱图与这些候选多糖的碎片离子理论数据库及蛋白的碎片离子理论数据库逐一进行比对,数据搜索软件对每一个比对进行相似度打分,打分最高的则是多糖ID或蛋白ID,从而最终鉴定到多糖的拓扑结构(含单糖组成及各单糖的连接方式)并获得多糖的选择性解离及完整N-糖蛋白一级结构全面鉴定。本发明能够在完整蛋白水平上同时获得多糖拓扑结构及蛋白的结构解析并且获得多糖选择性解离的特征碎片离子,方法步骤简单,鉴定高效而准确。适用于糖蛋白基于高分辨串级质谱分析的多糖拓扑结构鉴定、糖基化位点确定、蛋白骨架解析。
与现有技术相比,本发明具有以下优点及有益效果:
本发明的解析方法基于自上而下的质谱技术对完整糖蛋白的结构进行表征分析。本发明的糖蛋白的分析方法样品处理简单,能够同时获得蛋白氨基酸序列、糖基化修饰位点及多糖的拓扑结构的信息;相对于传统的基于糖和糖肽的分析方法,具有更加简便的样品处理步骤及更加全面的数据信息,实现了全面表征糖蛋白。
附图说明
图1:自上而下质谱技术表征完整N-糖蛋白RNase B的流程图;
图2:M5选择性解离的串级质谱注释图(10%NCE);
图3:M5选择性解离的碎片离子图解(10%NCE);
图4:M5二级质谱匹配碎片离子注释图(30%NCE);
图5:M5多糖结构的碎片离子图解(30%NCE);
图6:N-糖蛋白RNase B二级质谱匹配碎片离子注释图(15%NCE);
图7:N-糖蛋白RNase B蛋白骨架的碎片离子图解(15%NCE)。
具体实施方式
一种完整N-糖蛋白一级结构全面鉴定方法,其整体流程如图1所示,包括以下步骤:
(1)N-糖蛋白的样品预处理:
(1.1)溶液的配置:配置糖蛋白溶液、DTT溶液及电喷雾缓冲溶液;
(1.2)糖蛋白溶液与DTT溶液在80℃下反应1h,或,糖蛋白溶液先在95℃下变性5min,然后再与DTT溶液在80℃下反应10min;
(1.3)反应完成后先自然冷却至室温然后用电喷雾缓冲溶液稀释。
(2)N-糖蛋白的一级质谱及二级质谱分析:
通过注射器和注射器泵上样,在正离子模式下喷雾,基于HCD解离的轨道阱质谱仪采集样品的一级谱和二级谱;
(2.1)高分辨轨道阱质谱仪采集一级质谱,获得前体离子的信息;
(2.2)基于HCD碎裂模式对一级质谱中观察到的糖蛋白异构体前体离子采集不同碰撞能量范围的二级质谱。
(3)N-多糖前体离子理论数据库的生成:
(3.1)对包含一定数量单糖的N-多糖,先对核心结构5个单糖以外的其他单糖进行排列组合;
(3.2)找出所有可能的单糖组成及所有可能的连接方式形成理论的多糖连接及分支异构体;
(3.3)使用GlySeeker根据N-多糖前体离子和理论碎片离子建立多糖的拓扑结构数据库。
其中,核心结构5个单糖包括2个N-乙酰氨基葡萄糖,3个甘露糖。
步骤(3.3)根据N-多糖前体离子和理论碎片离子建立多糖的拓扑结构数据库时,可以建立把蛋白作为静态修饰或者不把蛋白作为静态修饰两种数据库。
(4)N-糖蛋白前体离子理论数据库的生成:
在Uniprot下载N-糖蛋白的数据库或者氨基酸序列,用ProteinGoggle 2.0建立把多糖作为静态修饰的数据库。
(5)N-多糖拓扑结构的解析:
(5.1)设置GlySeeker搜索数据库的阈值IPACO(isotopic peak abundancecutoff,同位素峰强度阈值)=20%;偏差IPMD(isotopic peak m/z deviation,同位素峰质荷比偏差)=15ppm;偏差IPAD(isotopic peak abundance deviation,同位素峰强度偏差)=30%;
(5.2)每个候选N-多糖的所有理论碎片离子的理论同位素轮廓分别与实验前体离子对应的二级质谱中的碎片离子实验同位素轮廓进行指纹比对,根据一定的偏差阈值找出每个候选N-多糖在实验二级质谱中所匹配的碎片离子;碎片离子实验同位素轮廓指纹比对的质量控制IPACO、IPMD和IPAD来实现;
(5.3)GlySeeker会根据对每个候选N-多糖的二级质谱匹配程度进行统计打分,相似度最高者即为N-多糖ID,并给出碎片离子的同位素轮廓指纹比对及匹配到的多糖结构碎片图解;
(5.4)将低能量下多糖的选择性解离和高能量下高序列覆盖度的糖结构解析的结果手动整合到一起,就获得了信息丰富的多糖拓扑结构的解析。
(6)N-糖蛋白结构的解析:
(6.1)设置ProteinGoggle 2.0搜索数据库的阈值IPACO(isotopic peakabundance cutoff)=20%,IPMD(isotopic peak m/z deviation)=15ppm和IPAD(isotopic peak abundance deviation)=30%;
(6.2)ProteinGoggle 2.0搜索蛋白的数据库,对每个候选N-糖蛋白的二级质谱匹配程度进行统计打分,相似度最高者即为蛋白ID,并给出碎片离子的同位素轮廓指纹比对及匹配到的蛋白骨架结构碎片图解。
其中,糖蛋白溶液的浓度为1ug/uL,DTT溶液的浓度为200uM,电喷雾缓冲溶液按体积比计由95%水+4.8%乙腈+0.2%甲酸组成。
其中,步骤(1.2)可以采用两种实现方式:提前把烘箱温度设置到80℃预热;取1ug/uL糖蛋白溶液加入200uM DTT溶液至终浓度50uM,迅速放入烘箱中恒温80℃反应1h。或者取1ug/uL糖蛋白溶液用水浴锅95℃下恒温水浴5min变性;然后加入200uM DTT溶液至终浓度10uM,迅速放入烘箱中恒温80℃反应10min。
步骤(1.3)用电喷雾缓冲溶液稀释至糖蛋白溶液终浓度为2uM。
步骤(2)中,优选采用Harvard PHD Ultra注射器泵。
步骤(2)中,上样的流速为3uL/min的流速。
下面结合附图和具体实施例对本发明进行详细说明。
实施例
完整N-糖蛋白RNase B的表征
实验的具体步骤如下:
(1)溶液的配置:以去离子水为溶剂,配置1ug/uL RNase B溶液、200uM的二硫苏糖醇溶液(DTT)和体积比为95%/4.8%/0.2%的电喷雾缓冲溶液。
(2)取15uL 1ug/uL RNase B溶液加入5uL 200uM DTT溶液至终浓度为50uM,迅速放入烘箱中恒温80℃反应1h。
(3)反应完成后先自然冷却至室温然后用电喷雾缓冲溶液稀释至终浓度为2uM。
(4)用注射器直接上样经质谱检测,离子源选用更加稳定的常规源,进样流速为3uL/min。
(5)质谱采集参数如下:离子源的喷雾电压设为2.8kV,离子传输管温度设为250℃,S-lens RF设为100,自动增益控制(AGC)及最大进样时间分别设为5e5和100ms;一级谱的采集范围为800-2000m/z,分辨率为12,000(m/z 200),二级谱的采集范围为100-2000m/z,分辨率为12,000(m/z 200),前体离子的选择宽度为6Th,HCD解离能量范围10-30%NCE。
标准N-糖蛋白RNase B的蛋白异构体RNase B-M5-M9经二硫键还原后在正离子模式下电喷雾电离,Q Exactive轨道阱质谱高能碰撞诱导解离(能量范围10%-30%NCE)得到RNase B-M5-M9的串级质谱;串级质谱分别经GlySeeker和ProteinGoggle 2.0解析分别获得多糖(M5-M9)的结构信息及蛋白序列、糖基化位点的信息。两种软件都获得了二级质谱匹配注释图、前体离子碎片图解及同位素轮廓指纹比对图。
根据实验结果;HCD模式下,多糖的选择性解离一般发生在解离能量10%-15%NCE的范围内,该范围内蛋白骨架的解离较少,大多数蛋白链还保持完整。多糖碎片离子最丰富的能量范围是25%-30%NCE,RNase B-M5-M9一般在30%NCE能量下多糖碎片离子最丰富。
以RNase B-M5为例,图2是在低能量(10%NCE)下Q Exactive轨道阱质谱高能碰撞诱导解离得到的多糖M5碎片离子匹配注释的串级质谱图;图3是经GlySeeker处理数据得到的10%NCE能量下多糖M5的选择性解离的碎片离子图解。图4是高能量(30%NCE)下获得的多糖M5的注释串级质谱图;图5是在高能量(30%NCE)下多糖M5的碎片离子图解,30%NCE能量下HCD解离的碎片离子最丰富。图6是15%NCE下获得的蛋白RNase B-M5的注释串级质谱图。图7是15%NCE下获得的蛋白RNase B-M5的蛋白骨架碎片离子图解。实际上每一张二级谱都可以同时获得多糖和蛋白的结构信息。
上述的对实施例的描述是为便于该技术领域的普通技术人员能理解和使用发明。熟悉本领域技术的人员显然可以容易地对这些实施例做出各种修改,并把在此说明的一般原理应用到其他实施例中而不必经过创造性的劳动。因此,本发明不限于上述实施例,本领域技术人员根据本发明的揭示,不脱离本发明范畴所做出的改进和修改都应该在本发明的保护范围之内。
Claims (9)
1.一种完整N-糖蛋白一级结构全面鉴定方法,其特征在于,包括以下步骤:
(1)N-糖蛋白的样品预处理:
糖蛋白溶液与DTT溶液反应后用电喷雾缓冲溶液稀释;
(2)N-糖蛋白的一级质谱及二级质谱分析:
通过注射器和注射器泵上样,在正离子模式下喷雾,基于HCD解离的轨道阱质谱仪采集样品的一级谱和二级谱;
(3)N-多糖前体离子理论数据库的生成;
(4)N-糖蛋白前体离子理论数据库的生成;
(5)N-多糖拓扑结构的解析:
(6)N-糖蛋白结构的解析。
2.根据权利要求1所述的一种完整N-糖蛋白一级结构全面鉴定方法,其特征在于,步骤(1)所述N-糖蛋白的样品预处理方法包括以下步骤:
(1.1)溶液的配置:配置糖蛋白溶液、DTT溶液及电喷雾缓冲溶液;
(1.2)糖蛋白溶液与DTT溶液在80℃下反应1h,或,糖蛋白溶液先在95℃下变性5min,然后再与DTT溶液在80℃下反应10min;
(1.3)反应完成后先自然冷却至室温然后用电喷雾缓冲溶液稀释。
3.根据权利要求2所述的一种完整N-糖蛋白一级结构全面鉴定方法,其特征在于,糖蛋白溶液的浓度为1ug/uL,DTT溶液的浓度为200uM,电喷雾缓冲溶液按体积比计由95%水+4.8%乙腈+0.2%甲酸组成。
4.根据权利要求1所述的一种完整N-糖蛋白一级结构全面鉴定方法,其特征在于,步骤(2)中,上样的流速为3uL/min的流速。
5.根据权利要求1所述的一种完整N-糖蛋白一级结构全面鉴定方法,其特征在于,步骤(2)所述N-糖蛋白的一级质谱及二级质谱分析包括以下步骤:
(2.1)高分辨轨道阱质谱仪采集一级质谱,获得前体离子的信息;
(2.2)基于HCD碎裂模式对一级质谱中观察到的糖蛋白异构体前体离子采集不同碰撞能量范围的二级质谱。
6.根据权利要求1所述的一种完整N-糖蛋白一级结构全面鉴定方法,其特征在于,步骤(3)所述N-多糖前体离子理论数据库的生成包括以下步骤:
(3.1)对包含一定数量单糖的N-多糖,先对核心结构5个单糖以外的其他单糖进行排列组合;
(3.2)找出所有可能的单糖组成及所有可能的连接方式形成理论的多糖连接及分支异构体;
(3.3)使用GlySeeker根据N-多糖前体离子和理论碎片离子建立多糖的拓扑结构数据库。
7.根据权利要求1所述的一种完整N-糖蛋白一级结构全面鉴定方法,其特征在于,步骤(4)所述N-糖蛋白前体离子理论数据库的生成包括以下步骤:
在Uniprot下载N-糖蛋白的数据库或者氨基酸序列,用ProteinGoggle 2.0建立把多糖作为静态修饰的数据库。
8.根据权利要求1所述的一种完整N-糖蛋白一级结构全面鉴定方法,其特征在于,步骤(5)所述N-多糖拓扑结构的解析包括以下步骤:
(5.1)设置GlySeeker搜索数据库的阈值IPACO=20%;偏差IPMD=15ppm;偏差IPAD=30%;
(5.2)每个候选N-多糖的所有理论碎片离子的理论同位素轮廓分别与实验前体离子对应的二级质谱中的碎片离子实验同位素轮廓进行指纹比对,根据一定的偏差阈值找出每个候选N-多糖在实验二级质谱中所匹配的碎片离子;碎片离子实验同位素轮廓指纹比对的质量控制IPACO、IPMD和IPAD来实现;
(5.3)GlySeeker根据对每个候选N-多糖的二级质谱匹配程度进行统计打分,相似度最高者即为N-多糖ID,并给出碎片离子的同位素轮廓指纹比对及匹配到的多糖结构碎片图解;
(5.4)将低能量下多糖的选择性解离和高能量下高序列覆盖度的糖结构解析的结果手动整合到一起,就获得了信息丰富的多糖拓扑结构的解析。
9.根据权利要求1所述的一种完整N-糖蛋白一级结构全面鉴定方法,其特征在于,步骤(6)所述N-糖蛋白结构的解析包括以下步骤:
(6.1)设置ProteinGoggle 2.0搜索数据库的阈值IPACO=20%,IPMD=15ppm和IPAD=30%;
(6.2)ProteinGoggle 2.0搜索蛋白的数据库,对每个候选N-糖蛋白的二级质谱匹配程度进行统计打分,相似度最高者即为蛋白ID,并给出碎片离子的同位素轮廓指纹比对及匹配到的蛋白骨架结构碎片图解。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810503019.6A CN108761084B (zh) | 2018-05-23 | 2018-05-23 | 一种完整n-糖蛋白一级结构全面鉴定方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810503019.6A CN108761084B (zh) | 2018-05-23 | 2018-05-23 | 一种完整n-糖蛋白一级结构全面鉴定方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN108761084A true CN108761084A (zh) | 2018-11-06 |
CN108761084B CN108761084B (zh) | 2020-06-02 |
Family
ID=64005183
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201810503019.6A Expired - Fee Related CN108761084B (zh) | 2018-05-23 | 2018-05-23 | 一种完整n-糖蛋白一级结构全面鉴定方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN108761084B (zh) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113433200A (zh) * | 2021-06-16 | 2021-09-24 | 华南农业大学 | 一种电喷雾质谱技术鉴定交联聚合物的方法 |
CN114166925A (zh) * | 2021-10-22 | 2022-03-11 | 西安电子科技大学 | 一种基于质谱数据的N-糖链结构鉴定Denovo方法及系统 |
CN115166123A (zh) * | 2022-07-13 | 2022-10-11 | 汉诺生物科技(苏州)有限公司 | 一种异常n-羟乙酰神经氨酸的位点特异性分析方法 |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20030129657A1 (en) * | 2001-11-13 | 2003-07-10 | Bruker Daltonik Gmbh | Mass determination for biopolymers |
CN103163009A (zh) * | 2011-12-14 | 2013-06-19 | 天津市国际生物医药联合研究院 | 鉴定蛋白质的糖基化修饰位点的方法 |
WO2013166169A1 (en) * | 2012-05-01 | 2013-11-07 | Stephenson James L Jr | Apparatus and methods for microbiological analysis |
CN104133027A (zh) * | 2014-06-24 | 2014-11-05 | 江南大学 | 一种分离鉴定糖蛋白n-糖链结构的方法 |
WO2016181299A1 (en) * | 2015-05-13 | 2016-11-17 | Dh Technologies Development Pte. Ltd. | Top down protein identification method |
CN107064517A (zh) * | 2016-01-14 | 2017-08-18 | 萨默费尼根有限公司 | 用于生物分子的基于质谱的表征的方法 |
-
2018
- 2018-05-23 CN CN201810503019.6A patent/CN108761084B/zh not_active Expired - Fee Related
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20030129657A1 (en) * | 2001-11-13 | 2003-07-10 | Bruker Daltonik Gmbh | Mass determination for biopolymers |
CN103163009A (zh) * | 2011-12-14 | 2013-06-19 | 天津市国际生物医药联合研究院 | 鉴定蛋白质的糖基化修饰位点的方法 |
WO2013166169A1 (en) * | 2012-05-01 | 2013-11-07 | Stephenson James L Jr | Apparatus and methods for microbiological analysis |
CN104133027A (zh) * | 2014-06-24 | 2014-11-05 | 江南大学 | 一种分离鉴定糖蛋白n-糖链结构的方法 |
WO2016181299A1 (en) * | 2015-05-13 | 2016-11-17 | Dh Technologies Development Pte. Ltd. | Top down protein identification method |
CN107064517A (zh) * | 2016-01-14 | 2017-08-18 | 萨默费尼根有限公司 | 用于生物分子的基于质谱的表征的方法 |
Non-Patent Citations (10)
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113433200A (zh) * | 2021-06-16 | 2021-09-24 | 华南农业大学 | 一种电喷雾质谱技术鉴定交联聚合物的方法 |
CN114166925A (zh) * | 2021-10-22 | 2022-03-11 | 西安电子科技大学 | 一种基于质谱数据的N-糖链结构鉴定Denovo方法及系统 |
CN114166925B (zh) * | 2021-10-22 | 2024-03-26 | 西安电子科技大学 | 一种基于质谱数据的N-糖链结构鉴定Denovo方法及系统 |
CN115166123A (zh) * | 2022-07-13 | 2022-10-11 | 汉诺生物科技(苏州)有限公司 | 一种异常n-羟乙酰神经氨酸的位点特异性分析方法 |
Also Published As
Publication number | Publication date |
---|---|
CN108761084B (zh) | 2020-06-02 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US10083825B2 (en) | Mass spectrometer with bypass of a fragmentation device | |
US8237106B2 (en) | Mass spectrometer | |
CN108761084A (zh) | 一种完整n-糖蛋白一级结构全面鉴定方法 | |
JP2009068981A (ja) | 質量分析システム及び質量分析方法 | |
JP4959712B2 (ja) | 質量分析計 | |
US10591448B2 (en) | Structural elucidation of isotopically labeled analytes | |
JP4959713B2 (ja) | 質量分析計 | |
WO2016196181A1 (en) | Mass spectrometry with quadrupole and ion mobility separation capabilities | |
TWI547686B (zh) | 醣胜肽之胺基酸定序及醣基鑑定雙功能方法及系統 | |
Panczyk et al. | Evaluation of a Commercial TIMS-Q-TOF Platform for Native Mass Spectrometry | |
Clark | Disulfide Analysis with Mass Spectrometry: Toward Biotherapeutic Characterization |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant | ||
CF01 | Termination of patent right due to non-payment of annual fee |
Granted publication date: 20200602 |