CN108761084A

CN108761084A - 一种完整n-糖蛋白一级结构全面鉴定方法

Info

Publication number: CN108761084A
Application number: CN201810503019.6A
Authority: CN
Inventors: 李莎莎; 田志新
Original assignee: Tongji University
Current assignee: Tongji University
Priority date: 2018-05-23
Filing date: 2018-05-23
Publication date: 2018-11-06
Anticipated expiration: 2038-05-23
Also published as: CN108761084B

Abstract

本发明涉及一种完整N‑糖蛋白一级结构全面鉴定方法，包括以下步骤：N‑糖蛋白的样品预处理，即糖蛋白溶液与DTT溶液反应后用电喷雾缓冲溶液稀释；通过注射器和注射器泵上样，在正离子模式下喷雾，基于HCD解离的轨道阱质谱仪采集样品的一级谱和二级谱；N‑多糖前体离子理论数据库的生成；N‑糖蛋白前体离子理论数据库的生成；N‑多糖拓扑结构的解析；N‑糖蛋白结构的解析。与现有技术相比，本发明能够在完整蛋白水平上同时获得多糖拓扑结构及蛋白的结构解析并且获得多糖选择性解离的特征碎片离子，方法步骤简单，鉴定高效而准确。适用于糖蛋白基于高分辨串级质谱分析的多糖拓扑结构鉴定、糖基化位点确定、蛋白骨架解析。

Description

一种完整N-糖蛋白一级结构全面鉴定方法

技术领域

本发明涉及与生物质谱相关的系统生物学、糖蛋白质组学等技术领域，尤其是涉及一种。

背景技术

糖基化修饰是蛋白质上最普遍、最重要的翻译后修饰之一，人体中百分之五十以上的蛋白都发生了糖基化，糖基化具有极其重要的生理和病理功能(Rudd,P.M.；Elliott,T.；Cresswell,P.；Wilson,I.A.；Dwek,R.A.,Glycosylation and the immunesystem.Science 2001,291(5512),2370-2376.)。基于串级质谱的糖蛋白质组学已经成为蛋白氨基酸序列、蛋白糖基化位点、单糖组成及其拓扑结构鉴定和解析的重要分析方法之一((a)Raman,R.；Raguram,S.；Venkataraman,G.；Paulson,J.C.；Sasisekharan,R.,Glycomics:an integrated systems approach to structure-function relationshipsof glycans.Nat Methods 2005,2(11),817-824；(b)Zaia,J.,Mass Spectrometry andthe Emerging Field of Glycomics.Chemistry&biology 2008,15(9),881-892.)。现有表征蛋白糖基化的方法主要有以下两种；一种是研究蛋白释放的糖链，使用合适的糖苷酶如肽-N-糖苷酶F/A(PNGase F/A)酶切多糖与蛋白上氨基酸连接的糖苷键释放多糖，然后再对多糖进行富集分离分析；另一种方法采用合适的蛋白酶如Glu-C,trypsin,Lys-C或Chymotrypsin酶切糖蛋白形成糖肽与肽段的混合物，然后对糖肽进行富集分离分析(Shajahan,A.；Heiss,C.；Ishihara,M.；Azadi,P.,Glycomic and glycoproteomicanalysis of glycoproteins-a tutorial.Anal Bioanal Chem 2017,409(19),4483-4505.)。以上两种方法操作步骤都繁琐耗时且非常容易发生漏切的情况；获得的糖蛋白结构信息也有限。由于蛋白质糖基化修饰的多糖结构具有很多连接和分支异构体因此存在很大的结构异质性，给深度表征其结构带来极大的困难；另外研究表明糖基化对蛋白的稳定性也有影响，糖基化修饰位点周围的氨基酸序列相对于未糖基化的相同序列更难断裂(以RNase B和RNase A为例)(Bourgoin-Voillard,S.；Leymarie,N.；Costello,C.E.,Top-downtandem mass spectrometry on RNase A and B using a Qh/FT-ICR hybrid massspectrometer.Proteomics 2014,14(10),1174-1184.)，因此对于蛋白骨架的表征及糖基化位点定位也提出了挑战。

申请人前期在整体蛋白质一级结构(包括氨基酸序列，氨基酸上翻译后修饰的种类及其位置)鉴定新方法开发方面已做了很多的工作，有较好的基础。2015-2017年间基于自上而下的质谱技术研究酿酒酵母细胞蛋白质组，开发了离线的高通量强阴离子交换色谱及高效液相色谱(SAX-HPLC)联合的二维正交分离方法，最终鉴定了344个蛋白异构体；该方法表现出了很好的通用性和重现性。

发明内容

本发明的目的就是为了克服上述现有技术存在的缺陷而提供一种基于质谱的串级质谱选择性解离和特征碎片离子的完整N-糖蛋白一级结构全面鉴定方法。

本发明基于自上而下质谱技术实现在完整糖蛋白水平上同时表征蛋白序列、糖基化位点及多糖拓扑结构并获得多糖的选择性解离。

本发明的目的可以通过以下技术方案来实现：

一种完整N-糖蛋白一级结构全面鉴定方法，包括以下步骤：

(1)N-糖蛋白的样品预处理：

糖蛋白溶液与DTT溶液反应后用电喷雾缓冲溶液稀释；

(2)N-糖蛋白的一级质谱及二级质谱分析：

通过注射器和注射器泵上样，在正离子模式下喷雾，基于HCD解离的轨道阱质谱仪采集样品的一级谱和二级谱；

(3)N-多糖前体离子理论数据库的生成；

(4)N-糖蛋白前体离子理论数据库的生成；

(5)N-多糖拓扑结构的解析：

(6)N-糖蛋白结构的解析。

在本发明的一个实施方式中，步骤(1)所述N-糖蛋白的样品预处理方法包括以下步骤：

(1.1)溶液的配置：配置糖蛋白溶液、DTT溶液及电喷雾缓冲溶液；

(1.2)糖蛋白溶液与DTT溶液在80℃下反应1h，或，糖蛋白溶液先在95℃下变性5min，然后再与DTT溶液在80℃下反应10min；

(1.3)反应完成后先自然冷却至室温然后用电喷雾缓冲溶液稀释。

在本发明的一个实施方式中，糖蛋白溶液的浓度为1ug/uL，DTT溶液的浓度为200uM，电喷雾缓冲溶液按体积比计由95％水+4.8％乙腈+0.2％甲酸组成。

在本发明的一个实施方式中，步骤(1.2)可以采用两种实现方式：提前把烘箱温度设置到80℃预热；取1ug/uL糖蛋白溶液加入200uM DTT溶液至终浓度50uM，迅速放入烘箱中恒温80℃反应1h。或者取1ug/uL糖蛋白溶液用水浴锅95℃下恒温水浴5min变性；然后加入200uM DTT溶液至终浓度10uM，迅速放入烘箱中恒温80℃反应10min。

在本发明的一个实施方式中，步骤(1.3)用电喷雾缓冲溶液稀释至糖蛋白溶液终浓度为2uM。

在本发明的一个实施方式中，步骤(2)中，优选采用Harvard PHD Ultra注射器泵。

在本发明的一个实施方式中，步骤(2)中，上样的流速为3uL/min的流速。

在本发明的一个实施方式中，步骤(2)所述N-糖蛋白的一级质谱及二级质谱分析包括以下步骤：

(2.1)高分辨轨道阱质谱仪采集一级质谱，获得前体离子的信息；

(2.2)基于HCD碎裂模式对一级质谱中观察到的糖蛋白异构体前体离子采集不同碰撞能量范围的二级质谱。

步骤(2.1)、步骤(2.2)可以采用常规生物技术方法进行。

在本发明的一个实施方式中，步骤(3)所述N-多糖前体离子理论数据库的生成包括以下步骤：

(3.1)对包含一定数量单糖的N-多糖，先对核心结构5个单糖以外的其他单糖进行排列组合；

(3.2)找出所有可能的单糖组成及所有可能的连接方式形成理论的多糖连接及分支异构体；

(3.3)使用GlySeeker根据N-多糖前体离子和理论碎片离子建立多糖的拓扑结构数据库。

步骤(3.1)、步骤(3.2)、步骤(3.3)可以采用常规生物技术方法进行。

其中，GlySeeker是发明人自主研发的搜索引擎，其网址为：proteingoggle.tongji.edu.cn，

GlySeeker已在发表的文章中进行了说明，见Xiao,K.,et al.,Large-scaleidentification and visualization of N-glycans with primary structures usingGlySeeker.Rapid Commun Mass Spectrom,2018.32(2):p.142-148.

其中，核心结构5个单糖包括2个N-乙酰氨基葡萄糖，3个甘露糖。

步骤(3.3)根据N-多糖前体离子和理论碎片离子建立多糖的拓扑结构数据库时，可以建立把蛋白作为静态修饰或者不把蛋白作为静态修饰两种数据库。

在本发明的一个实施方式中，步骤(4)所述N-糖蛋白前体离子理论数据库的生成包括以下步骤：

在Uniprot下载N-糖蛋白的数据库或者氨基酸序列，用ProteinGoggle 2.0建立把多糖作为静态修饰的数据库，可以采用常规生物技术方法进行。

其中，ProteinGoggle 2.0是发明人自主研发的，其网址为：proteingoggle.tongji.edu.cn，ProteinGoggle 2.0已在发表的文章中进行了说明，见Xiao,K.J.,F.Yu,and Z.X.Tian,Top-down protein identification using isotopicenvelope fingerprinting.Journal of Proteomics,2017.152:p.41-47.

在本发明的一个实施方式中，步骤(5)所述N-多糖拓扑结构的解析包括以下步骤：

(5.1)设置GlySeeker搜索数据库的阈值IPACO(isotopic peak abundancecutoff,同位素峰强度阈值)＝20％；偏差IPMD(isotopic peak m/z deviation,同位素峰质荷比偏差)＝15ppm；偏差IPAD(isotopic peak abundance deviation，同位素峰强度偏差)＝30％；

(5.2)每个候选N-多糖的所有理论碎片离子的理论同位素轮廓分别与实验前体离子对应的二级质谱中的碎片离子实验同位素轮廓进行指纹比对，根据一定的偏差阈值找出每个候选N-多糖在实验二级质谱中所匹配的碎片离子；碎片离子实验同位素轮廓指纹比对的质量控制IPACO、IPMD和IPAD来实现，可以采用常规生物技术方法进行；

(5.3)GlySeeker会根据对每个候选N-多糖的二级质谱匹配程度进行统计打分，相似度最高者即为N-多糖ID，并给出碎片离子的同位素轮廓指纹比对及匹配到的多糖结构碎片图解，可以采用常规生物技术方法进行；

(5.4)将低能量下多糖的选择性解离和高能量下高序列覆盖度的糖结构解析的结果手动整合到一起，就获得了信息丰富的多糖拓扑结构的解析，可以采用常规生物技术方法进行。

在本发明的一个实施方式中，步骤(6)所述N-糖蛋白结构的解析包括以下步骤：

(6.1)设置ProteinGoggle 2.0搜索数据库的阈值IPACO(isotopic peakabundance cutoff)＝20％，IPMD(isotopic peak m/z deviation)＝15ppm和IPAD(isotopic peak abundance deviation)＝30％；

(6.2)ProteinGoggle 2.0搜索蛋白的数据库，对每个候选N-糖蛋白的二级质谱匹配程度进行统计打分，相似度最高者即为蛋白ID，并给出碎片离子的同位素轮廓指纹比对及匹配到的蛋白骨架结构碎片图解，可以采用常规生物技术方法进行。

本发明方法基于多糖样本高分辨质谱和串级质谱分析得到实验的一级和二级质谱图、从单糖生成理论多糖二维正交(x和y方向)拓扑结构及其一级质谱前体离子和二级质谱理论碎片离子建立多糖的数据库，包括把蛋白作为静态修饰和不把蛋白作为静态修饰两种建库方法。从Uniprot下载完整N-糖蛋白的数据库，把多糖作为蛋白的静态修饰建库；通过匹配一级质谱与前体离子理论数据库找到理论候选糖蛋白，进一步将实验二级质谱图与这些候选多糖的碎片离子理论数据库及蛋白的碎片离子理论数据库逐一进行比对，数据搜索软件对每一个比对进行相似度打分，打分最高的则是多糖ID或蛋白ID，从而最终鉴定到多糖的拓扑结构(含单糖组成及各单糖的连接方式)并获得多糖的选择性解离及完整N-糖蛋白一级结构全面鉴定。本发明能够在完整蛋白水平上同时获得多糖拓扑结构及蛋白的结构解析并且获得多糖选择性解离的特征碎片离子，方法步骤简单，鉴定高效而准确。适用于糖蛋白基于高分辨串级质谱分析的多糖拓扑结构鉴定、糖基化位点确定、蛋白骨架解析。

与现有技术相比，本发明具有以下优点及有益效果：

本发明的解析方法基于自上而下的质谱技术对完整糖蛋白的结构进行表征分析。本发明的糖蛋白的分析方法样品处理简单，能够同时获得蛋白氨基酸序列、糖基化修饰位点及多糖的拓扑结构的信息；相对于传统的基于糖和糖肽的分析方法，具有更加简便的样品处理步骤及更加全面的数据信息，实现了全面表征糖蛋白。

附图说明

图1：自上而下质谱技术表征完整N-糖蛋白RNase B的流程图；

图2：M5选择性解离的串级质谱注释图(10％NCE)；

图3：M5选择性解离的碎片离子图解(10％NCE)；

图4：M5二级质谱匹配碎片离子注释图(30％NCE)；

图5：M5多糖结构的碎片离子图解(30％NCE)；

图6：N-糖蛋白RNase B二级质谱匹配碎片离子注释图(15％NCE)；

图7：N-糖蛋白RNase B蛋白骨架的碎片离子图解(15％NCE)。

具体实施方式

一种完整N-糖蛋白一级结构全面鉴定方法，其整体流程如图1所示，包括以下步骤：

(1)N-糖蛋白的样品预处理：

(2)N-糖蛋白的一级质谱及二级质谱分析：

(3)N-多糖前体离子理论数据库的生成：

(4)N-糖蛋白前体离子理论数据库的生成：

在Uniprot下载N-糖蛋白的数据库或者氨基酸序列，用ProteinGoggle 2.0建立把多糖作为静态修饰的数据库。

(5)N-多糖拓扑结构的解析：

(5.2)每个候选N-多糖的所有理论碎片离子的理论同位素轮廓分别与实验前体离子对应的二级质谱中的碎片离子实验同位素轮廓进行指纹比对，根据一定的偏差阈值找出每个候选N-多糖在实验二级质谱中所匹配的碎片离子；碎片离子实验同位素轮廓指纹比对的质量控制IPACO、IPMD和IPAD来实现；

(5.3)GlySeeker会根据对每个候选N-多糖的二级质谱匹配程度进行统计打分，相似度最高者即为N-多糖ID，并给出碎片离子的同位素轮廓指纹比对及匹配到的多糖结构碎片图解；

(5.4)将低能量下多糖的选择性解离和高能量下高序列覆盖度的糖结构解析的结果手动整合到一起，就获得了信息丰富的多糖拓扑结构的解析。

(6)N-糖蛋白结构的解析：

(6.2)ProteinGoggle 2.0搜索蛋白的数据库，对每个候选N-糖蛋白的二级质谱匹配程度进行统计打分，相似度最高者即为蛋白ID，并给出碎片离子的同位素轮廓指纹比对及匹配到的蛋白骨架结构碎片图解。

其中，糖蛋白溶液的浓度为1ug/uL，DTT溶液的浓度为200uM，电喷雾缓冲溶液按体积比计由95％水+4.8％乙腈+0.2％甲酸组成。

其中，步骤(1.2)可以采用两种实现方式：提前把烘箱温度设置到80℃预热；取1ug/uL糖蛋白溶液加入200uM DTT溶液至终浓度50uM，迅速放入烘箱中恒温80℃反应1h。或者取1ug/uL糖蛋白溶液用水浴锅95℃下恒温水浴5min变性；然后加入200uM DTT溶液至终浓度10uM，迅速放入烘箱中恒温80℃反应10min。

步骤(1.3)用电喷雾缓冲溶液稀释至糖蛋白溶液终浓度为2uM。

步骤(2)中，优选采用Harvard PHD Ultra注射器泵。

步骤(2)中，上样的流速为3uL/min的流速。

下面结合附图和具体实施例对本发明进行详细说明。

实施例

完整N-糖蛋白RNase B的表征

实验的具体步骤如下：

(1)溶液的配置：以去离子水为溶剂，配置1ug/uL RNase B溶液、200uM的二硫苏糖醇溶液(DTT)和体积比为95％/4.8％/0.2％的电喷雾缓冲溶液。

(2)取15uL 1ug/uL RNase B溶液加入5uL 200uM DTT溶液至终浓度为50uM，迅速放入烘箱中恒温80℃反应1h。

(3)反应完成后先自然冷却至室温然后用电喷雾缓冲溶液稀释至终浓度为2uM。

(4)用注射器直接上样经质谱检测，离子源选用更加稳定的常规源，进样流速为3uL/min。

(5)质谱采集参数如下：离子源的喷雾电压设为2.8kV，离子传输管温度设为250℃，S-lens RF设为100，自动增益控制(AGC)及最大进样时间分别设为5e5和100ms；一级谱的采集范围为800-2000m/z，分辨率为12,000(m/z 200)，二级谱的采集范围为100-2000m/z，分辨率为12,000(m/z 200)，前体离子的选择宽度为6Th，HCD解离能量范围10-30％NCE。

标准N-糖蛋白RNase B的蛋白异构体RNase B-M5-M9经二硫键还原后在正离子模式下电喷雾电离，Q Exactive轨道阱质谱高能碰撞诱导解离(能量范围10％-30％NCE)得到RNase B-M5-M9的串级质谱；串级质谱分别经GlySeeker和ProteinGoggle 2.0解析分别获得多糖(M5-M9)的结构信息及蛋白序列、糖基化位点的信息。两种软件都获得了二级质谱匹配注释图、前体离子碎片图解及同位素轮廓指纹比对图。

根据实验结果；HCD模式下，多糖的选择性解离一般发生在解离能量10％-15％NCE的范围内，该范围内蛋白骨架的解离较少，大多数蛋白链还保持完整。多糖碎片离子最丰富的能量范围是25％-30％NCE，RNase B-M5-M9一般在30％NCE能量下多糖碎片离子最丰富。

以RNase B-M5为例，图2是在低能量(10％NCE)下Q Exactive轨道阱质谱高能碰撞诱导解离得到的多糖M5碎片离子匹配注释的串级质谱图；图3是经GlySeeker处理数据得到的10％NCE能量下多糖M5的选择性解离的碎片离子图解。图4是高能量(30％NCE)下获得的多糖M5的注释串级质谱图；图5是在高能量(30％NCE)下多糖M5的碎片离子图解,30％NCE能量下HCD解离的碎片离子最丰富。图6是15％NCE下获得的蛋白RNase B-M5的注释串级质谱图。图7是15％NCE下获得的蛋白RNase B-M5的蛋白骨架碎片离子图解。实际上每一张二级谱都可以同时获得多糖和蛋白的结构信息。

上述的对实施例的描述是为便于该技术领域的普通技术人员能理解和使用发明。熟悉本领域技术的人员显然可以容易地对这些实施例做出各种修改，并把在此说明的一般原理应用到其他实施例中而不必经过创造性的劳动。因此，本发明不限于上述实施例，本领域技术人员根据本发明的揭示，不脱离本发明范畴所做出的改进和修改都应该在本发明的保护范围之内。

Claims

1.一种完整N-糖蛋白一级结构全面鉴定方法，其特征在于，包括以下步骤：

(1)N-糖蛋白的样品预处理：

糖蛋白溶液与DTT溶液反应后用电喷雾缓冲溶液稀释；

(2)N-糖蛋白的一级质谱及二级质谱分析：

(3)N-多糖前体离子理论数据库的生成；

(4)N-糖蛋白前体离子理论数据库的生成；

(5)N-多糖拓扑结构的解析：

(6)N-糖蛋白结构的解析。

2.根据权利要求1所述的一种完整N-糖蛋白一级结构全面鉴定方法，其特征在于，步骤(1)所述N-糖蛋白的样品预处理方法包括以下步骤：

3.根据权利要求2所述的一种完整N-糖蛋白一级结构全面鉴定方法，其特征在于，糖蛋白溶液的浓度为1ug/uL，DTT溶液的浓度为200uM，电喷雾缓冲溶液按体积比计由95％水+4.8％乙腈+0.2％甲酸组成。

4.根据权利要求1所述的一种完整N-糖蛋白一级结构全面鉴定方法，其特征在于，步骤(2)中，上样的流速为3uL/min的流速。

5.根据权利要求1所述的一种完整N-糖蛋白一级结构全面鉴定方法，其特征在于，步骤(2)所述N-糖蛋白的一级质谱及二级质谱分析包括以下步骤：

6.根据权利要求1所述的一种完整N-糖蛋白一级结构全面鉴定方法，其特征在于，步骤(3)所述N-多糖前体离子理论数据库的生成包括以下步骤：

7.根据权利要求1所述的一种完整N-糖蛋白一级结构全面鉴定方法，其特征在于，步骤(4)所述N-糖蛋白前体离子理论数据库的生成包括以下步骤：

8.根据权利要求1所述的一种完整N-糖蛋白一级结构全面鉴定方法，其特征在于，步骤(5)所述N-多糖拓扑结构的解析包括以下步骤：

(5.1)设置GlySeeker搜索数据库的阈值IPACO＝20％；偏差IPMD＝15ppm；偏差IPAD＝30％；

(5.3)GlySeeker根据对每个候选N-多糖的二级质谱匹配程度进行统计打分，相似度最高者即为N-多糖ID，并给出碎片离子的同位素轮廓指纹比对及匹配到的多糖结构碎片图解；

9.根据权利要求1所述的一种完整N-糖蛋白一级结构全面鉴定方法，其特征在于，步骤(6)所述N-糖蛋白结构的解析包括以下步骤：

(6.1)设置ProteinGoggle 2.0搜索数据库的阈值IPACO＝20％，IPMD＝15ppm和IPAD＝30％；