CN115326945A - 一种基因突变相关蛋白质n-糖基化的结构特异分析方法 - Google Patents
一种基因突变相关蛋白质n-糖基化的结构特异分析方法 Download PDFInfo
- Publication number
- CN115326945A CN115326945A CN202210736371.0A CN202210736371A CN115326945A CN 115326945 A CN115326945 A CN 115326945A CN 202210736371 A CN202210736371 A CN 202210736371A CN 115326945 A CN115326945 A CN 115326945A
- Authority
- CN
- China
- Prior art keywords
- database
- gene mutation
- glycopeptide
- glycosylation
- theoretical
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 206010064571 Gene mutation Diseases 0.000 title claims abstract description 53
- 108090000623 proteins and genes Proteins 0.000 title claims abstract description 40
- 230000004988 N-glycosylation Effects 0.000 title claims abstract description 39
- 102000004169 proteins and genes Human genes 0.000 title claims abstract description 38
- 238000004458 analytical method Methods 0.000 title claims abstract description 19
- 238000000034 method Methods 0.000 claims abstract description 22
- 238000012216 screening Methods 0.000 claims abstract description 18
- 230000035772 mutation Effects 0.000 claims abstract description 14
- 238000001819 mass spectrum Methods 0.000 claims abstract description 12
- 229920001184 polypeptide Polymers 0.000 claims abstract description 7
- 102000004196 processed proteins & peptides Human genes 0.000 claims abstract description 7
- 108090000765 processed proteins & peptides Proteins 0.000 claims abstract description 7
- 238000004895 liquid chromatography mass spectrometry Methods 0.000 claims abstract description 5
- 150000001413 amino acids Chemical class 0.000 claims description 34
- 150000002500 ions Chemical class 0.000 claims description 25
- 239000012634 fragment Substances 0.000 claims description 21
- 230000004481 post-translational protein modification Effects 0.000 claims description 8
- 238000003745 diagnosis Methods 0.000 claims description 6
- 102000006668 UniProt protein families Human genes 0.000 claims description 5
- 108020004729 UniProt protein families Proteins 0.000 claims description 5
- 150000001720 carbohydrates Chemical class 0.000 claims description 5
- 239000003471 mutagenic agent Substances 0.000 claims description 5
- 231100000707 mutagenic chemical Toxicity 0.000 claims description 5
- 230000003505 mutagenic effect Effects 0.000 claims description 5
- 239000002243 precursor Substances 0.000 claims description 4
- 235000014633 carbohydrates Nutrition 0.000 claims description 3
- 238000001976 enzyme digestion Methods 0.000 claims description 3
- 230000008569 process Effects 0.000 claims description 3
- 108091008146 restriction endonucleases Proteins 0.000 claims description 2
- 238000004885 tandem mass spectrometry Methods 0.000 claims description 2
- 125000003275 alpha amino acid group Chemical group 0.000 claims 5
- 238000011160 research Methods 0.000 abstract description 3
- 235000018102 proteins Nutrition 0.000 description 25
- 235000001014 amino acid Nutrition 0.000 description 17
- 229940024606 amino acid Drugs 0.000 description 17
- 241000282414 Homo sapiens Species 0.000 description 5
- 210000004027 cell Anatomy 0.000 description 4
- 230000008859 change Effects 0.000 description 4
- 206010006187 Breast cancer Diseases 0.000 description 2
- 208000026310 Breast neoplasm Diseases 0.000 description 2
- 102000004142 Trypsin Human genes 0.000 description 2
- 108090000631 Trypsin Proteins 0.000 description 2
- 239000003814 drug Substances 0.000 description 2
- 229940079593 drug Drugs 0.000 description 2
- 230000004907 flux Effects 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 150000002772 monosaccharides Chemical group 0.000 description 2
- 239000012588 trypsin Substances 0.000 description 2
- 238000012795 verification Methods 0.000 description 2
- MTCFGRXMJLQNBG-REOHCLBHSA-N (2S)-2-Amino-3-hydroxypropansäure Chemical compound OC[C@H](N)C(O)=O MTCFGRXMJLQNBG-REOHCLBHSA-N 0.000 description 1
- 101150019828 42 gene Proteins 0.000 description 1
- 239000004475 Arginine Substances 0.000 description 1
- DCXYFEDJOCDNAF-UHFFFAOYSA-N Asparagine Natural products OC(=O)C(N)CC(N)=O DCXYFEDJOCDNAF-UHFFFAOYSA-N 0.000 description 1
- 108090000790 Enzymes Proteins 0.000 description 1
- 102000004190 Enzymes Human genes 0.000 description 1
- 101000986087 Homo sapiens HLA class I histocompatibility antigen, B alpha chain Proteins 0.000 description 1
- 101000772888 Homo sapiens Ubiquitin-protein ligase E3A Proteins 0.000 description 1
- XUJNEKJLAYXESH-REOHCLBHSA-N L-Cysteine Chemical compound SC[C@H](N)C(O)=O XUJNEKJLAYXESH-REOHCLBHSA-N 0.000 description 1
- ONIBWKKTOPOVIA-BYPYZUCNSA-N L-Proline Chemical compound OC(=O)[C@@H]1CCCN1 ONIBWKKTOPOVIA-BYPYZUCNSA-N 0.000 description 1
- QNAYBMKLOCPYGJ-REOHCLBHSA-N L-alanine Chemical compound C[C@H](N)C(O)=O QNAYBMKLOCPYGJ-REOHCLBHSA-N 0.000 description 1
- DCXYFEDJOCDNAF-REOHCLBHSA-N L-asparagine Chemical compound OC(=O)[C@@H](N)CC(N)=O DCXYFEDJOCDNAF-REOHCLBHSA-N 0.000 description 1
- AYFVYJQAPQTCCC-GBXIJSLDSA-N L-threonine Chemical compound C[C@@H](O)[C@H](N)C(O)=O AYFVYJQAPQTCCC-GBXIJSLDSA-N 0.000 description 1
- 239000004472 Lysine Substances 0.000 description 1
- KDXKERNSBIXSRK-UHFFFAOYSA-N Lysine Natural products NCCCCC(N)C(O)=O KDXKERNSBIXSRK-UHFFFAOYSA-N 0.000 description 1
- 206010028980 Neoplasm Diseases 0.000 description 1
- ONIBWKKTOPOVIA-UHFFFAOYSA-N Proline Natural products OC(=O)C1CCCN1 ONIBWKKTOPOVIA-UHFFFAOYSA-N 0.000 description 1
- MTCFGRXMJLQNBG-UHFFFAOYSA-N Serine Natural products OCC(N)C(O)=O MTCFGRXMJLQNBG-UHFFFAOYSA-N 0.000 description 1
- AYFVYJQAPQTCCC-UHFFFAOYSA-N Threonine Natural products CC(O)C(N)C(O)=O AYFVYJQAPQTCCC-UHFFFAOYSA-N 0.000 description 1
- 239000004473 Threonine Substances 0.000 description 1
- 235000004279 alanine Nutrition 0.000 description 1
- ODKSFYDXXFIFQN-UHFFFAOYSA-N arginine Natural products OC(=O)C(N)CCCNC(N)=N ODKSFYDXXFIFQN-UHFFFAOYSA-N 0.000 description 1
- 235000009582 asparagine Nutrition 0.000 description 1
- 229960001230 asparagine Drugs 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 201000011510 cancer Diseases 0.000 description 1
- 238000003776 cleavage reaction Methods 0.000 description 1
- 238000012790 confirmation Methods 0.000 description 1
- 235000018417 cysteine Nutrition 0.000 description 1
- XUJNEKJLAYXESH-UHFFFAOYSA-N cysteine Natural products SCC(N)C(O)=O XUJNEKJLAYXESH-UHFFFAOYSA-N 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 230000002349 favourable effect Effects 0.000 description 1
- 230000013595 glycosylation Effects 0.000 description 1
- 238000006206 glycosylation reaction Methods 0.000 description 1
- 239000007788 liquid Substances 0.000 description 1
- 238000002514 liquid chromatography mass spectrum Methods 0.000 description 1
- 229910052757 nitrogen Inorganic materials 0.000 description 1
- 229910052698 phosphorus Inorganic materials 0.000 description 1
- 235000013930 proline Nutrition 0.000 description 1
- 238000004451 qualitative analysis Methods 0.000 description 1
- 238000004445 quantitative analysis Methods 0.000 description 1
- 230000007017 scission Effects 0.000 description 1
- 235000004400 serine Nutrition 0.000 description 1
- 241000894007 species Species 0.000 description 1
- 235000008521 threonine Nutrition 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01N—INVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
- G01N30/00—Investigating or analysing materials by separation into components using adsorption, absorption or similar phenomena or using ion-exchange, e.g. chromatography or field flow fractionation
- G01N30/02—Column chromatography
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01N—INVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
- G01N30/00—Investigating or analysing materials by separation into components using adsorption, absorption or similar phenomena or using ion-exchange, e.g. chromatography or field flow fractionation
- G01N30/02—Column chromatography
- G01N30/62—Detectors specially adapted therefor
- G01N30/72—Mass spectrometers
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01N—INVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
- G01N30/00—Investigating or analysing materials by separation into components using adsorption, absorption or similar phenomena or using ion-exchange, e.g. chromatography or field flow fractionation
- G01N30/02—Column chromatography
- G01N30/86—Signal analysis
- G01N30/8651—Recording, data aquisition, archiving and storage
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01N—INVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
- G01N30/00—Investigating or analysing materials by separation into components using adsorption, absorption or similar phenomena or using ion-exchange, e.g. chromatography or field flow fractionation
- G01N30/02—Column chromatography
- G01N30/86—Signal analysis
- G01N30/8675—Evaluation, i.e. decoding of the signal into analytical information
- G01N30/8686—Fingerprinting, e.g. without prior knowledge of the sample components
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01N—INVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
- G01N30/00—Investigating or analysing materials by separation into components using adsorption, absorption or similar phenomena or using ion-exchange, e.g. chromatography or field flow fractionation
- G01N30/02—Column chromatography
- G01N2030/022—Column chromatography characterised by the kind of separation mechanism
- G01N2030/027—Liquid chromatography
Landscapes
- Analytical Chemistry (AREA)
- Physics & Mathematics (AREA)
- Health & Medical Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Chemical & Material Sciences (AREA)
- Biochemistry (AREA)
- General Health & Medical Sciences (AREA)
- General Physics & Mathematics (AREA)
- Immunology (AREA)
- Pathology (AREA)
- Library & Information Science (AREA)
- Engineering & Computer Science (AREA)
- Other Investigation Or Analysis Of Materials By Electrical Means (AREA)
Abstract
本发明公开了一种基因突变相关蛋白质N‑糖基化的结构特异分析方法,包括如下步骤:基于现有的理论蛋白质数据库中被注释突变位点的蛋白质,筛选和建立基因突变相关N‑糖肽理论数据库;基于该基因突变相关N‑糖肽理论数据库,对待测样本N‑糖肽通过液相色谱‑质谱联用分析方法获得的数据组进行数据库定性定量搜索;基于串级质谱结构指纹信息对所鉴定的N‑糖肽的N‑糖基化位点和N‑连接糖序列结构进行确认;基于所确认的特征多肽序列筛选基因突变相关N‑糖蛋白。该方法大大提高了基因突变相关N‑糖蛋白的分析速度和准确度,为相关结构和功能研究提供了基础。
Description
技术领域
本发明属于蛋白结构特异分析技术领域,尤其涉及一种基因突变相关蛋白质N-糖基化的结构特异分析方法。
背景技术
N-糖基化是蛋白质上一种常见的翻译后修饰;糖链选择性修饰在序列子N-X-S/T/C(X≠P)中的N上,其中N、S、T、C和P分别代表天冬酰胺、丝氨酸、苏氨酸、半胱氨酸和脯氨酸。基因突变引起的对应的氨基酸的变化如果发生在N-糖基化序列子上则会导致该N-糖基化的丢失和/或带来新的N-糖基化;基因突变引起的对应的氨基酸的变化如果发生在非N-糖基化序列子上但产生了新的N-糖基化的序列子,则会带来新的N-糖基化。对这些基因突变相关丢失或获得的N-糖基化进行分析,则可以研究基因突变相关N-糖蛋白的结构和功能。
现有方法采用生化点突变的方法,每次将一个位点上的N突变成其他不可糖基化修饰的氨基酸(如A,丙氨酸),然后判定相应的糖基化变化;这种分析方法分析通量低,成本高。针对上述问题,有必要提出进一步的解决方案。
发明内容
为解决上述技术问题,本发明的目的在于提供一种基因突变相关蛋白质N-糖基化的结构特异分析方法,该方法大大提高了基因突变相关N-糖蛋白的分析速度和准确度,为相关结构和功能研究提供了基础。
为实现上述技术目的,达到上述技术效果,本发明通过以下技术方案实现:
一种基因突变相关蛋白质N-糖基化的结构特异分析方法,包括如下步骤:
(1)基于现有的理论蛋白质数据库中被注释突变位点的蛋白质,筛选和建立基因突变相关N-糖肽理论数据库;
(2)基于该基因突变相关N-糖肽理论数据库,对待测样本N-糖肽通过液相色谱-质谱联用分析方法获得的数据组进行数据库定性定量搜索;
(3)基于串级质谱结构指纹信息对所鉴定的N-糖肽的N-糖基化位点和N-连接糖序列结构进行确认;
(4)基于所确认的特征多肽序列筛选基因突变相关N-糖蛋白。
进一步的,步骤(1)的具体过程为:基于现有的理论蛋白质数据库文件,遴选出被注释突变位点的蛋白质;将已突变氨基酸替换原始氨基酸并生成带突变氨基酸的新氨基酸序列;对新氨基酸序列进行N-糖基化序列子的筛选;将新氨基酸序列的N-糖基化序列子与原氨基酸序列的N-糖基化序列子进行对比,筛选出基因突变相关N-糖蛋白,建立基因突变相关N-糖肽理论数据库。
更进一步的,基因突变相关N-糖肽理论数据库的建立依据蛋白质酶切规则,并结合理论N-连接糖数据库。
进一步的,基因突变形式包括但不限于MUTAGEN、VAR_SEQ以及VARIANT。
进一步的,所述串级质谱结构指纹信息包括特征氨基酸序列碎片离子、翻译后修饰位点决定性碎片离子和翻译后修饰结构诊断碎片离子
进一步的,在进行数据库定性定量搜索时,前体离子和碎片离子质谱允许偏差20ppm,并基于靶向-诱饵搜索控制假阳性不大于1%。
进一步的,在进行数据库定性定量搜索时,控制基于位点决定性碎片离子的位点打分和基于结构诊断碎片离子的结构打分均不小于1。
进一步的,所述理论蛋白质数据库为UniProt蛋白质数据库。
本发明的有益效果是:
1)本发明预先筛选基因突变相关N-糖基化,并建立相应的N-糖肽理论数据库,用于待测样本N-糖肽液相色谱-质谱数据组的靶向搜索,大大缩小搜索空间,提高搜索通量;
2)本发明基于串级质谱结构指纹信息对所鉴定的N-糖肽的N-糖基化位点和N-连接糖序列结构进行确认,有助于明确区分邻近的多个潜在N-糖基化位点以及一个单糖组成对应的多个可能单糖序列结构;
3)本发明基于特征多肽序列有助于明确区分基因突变相关N-糖蛋白,为下游正交验证提供了准确的验证目标。
本发明通过上述优势的综合最终大大提高了基因突变相关N-糖蛋白分析的速度和准确度,为相关结构和功能研究提供了基础。
本发明的方法可适用于任何生物体基因突变相关N-糖蛋白的分析;
本发明的方法可适用于任何能带来氨基酸变化的基因突变(如在UniProt(www.uniprot.org)蛋白质数据库中,包括但不局限于MUTAGEN、VARIANT和VAR_SEQ);
本发明的方法适用于基因突变相关N-糖蛋白的定性和定量分析,同时适用于任何能在N-连接糖、N-糖肽和N-糖蛋白分子水平上对基因突变相关N-糖基化进行定性定量搜索的搜索工具。
本发明的方法适用于基因突变相关N-糖蛋白在N-连接糖,N-糖肽和N-糖蛋白分子水平上的分析,同时适用于基因突变相关N-糖蛋白N-糖基化和其他共存的蛋白质信息(如氨基酸变化、其他翻译后修饰、人为标记等)的全面分析。
附图说明
图1为本发明分析方法的流程示意图。
具体实施方式
下面将结合具体实施例对本发明中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
本发明提供了一种基因突变相关蛋白质N-糖基化的结构特异分析方法,包括如下步骤:
(1)基于现有的理论蛋白质数据库中被注释突变位点的蛋白质,筛选和建立基因突变相关N-糖肽理论数据库;
(2)基于该基因突变相关N-糖肽理论数据库,对待测样本N-糖肽通过液相色谱-质谱联用分析方法获得的数据组进行数据库定性定量搜索;
(3)基于串级质谱结构指纹信息对所鉴定的N-糖肽的N-糖基化位点和N-连接糖序列结构进行确认;
(4)基于所确认的特征多肽序列筛选基因突变相关N-糖蛋白。
其中,步骤(1)的具体过程为:基于现有的理论蛋白质数据库文件,遴选出被注释突变位点的蛋白质;将已突变氨基酸替换原始氨基酸并生成带突变氨基酸的新氨基酸序列;对新氨基酸序列进行N-糖基化序列子的筛选;将新氨基酸序列的N-糖基化序列子与原氨基酸序列的N-糖基化序列子进行对比,筛选出基因突变相关N-糖蛋白,建立基因突变相关N-糖肽理论数据库。
其中,基因突变相关N-糖肽理论数据库的建立依据蛋白质酶切规则,并结合理论N-连接糖数据库。
其中,基因突变形式包括但不限于MUTAGEN、VAR_SEQ以及VARIANT。
所述串级质谱结构指纹信息包括特征氨基酸序列碎片离子、翻译后修饰位点决定性碎片离子和翻译后修饰结构诊断碎片离子
步骤(2)中,在进行数据库定性定量搜索时,前体离子和碎片离子质谱允许偏差20ppm,并基于靶向-诱饵搜索控制假阳性不大于1%;在进行数据库定性定量搜索时,控制基于位点决定性碎片离子的位点打分和基于结构诊断碎片离子的结构打分均不小于1。
其中,所述理论蛋白质数据库优选为UniProt蛋白质数据库。
实施例
下面将结合人类耐药乳腺癌细胞中基因突变相关蛋白质N-糖基化在N-糖肽水平上的定性鉴定为例。
基于现有的UniProt(https://www.uniprot.org)人体理论蛋白质数据库文件,遴选出被注释突变位点的蛋白质;将已突变氨基酸替换原始氨基酸并生成带突变氨基酸的新氨基酸序列;对新氨基酸序列进行N-糖基化序列子N-X-S/T/C(X≠P)的筛选;将新氨基酸序列的N-糖基化序列子与原氨基酸序列的N-糖基化序列子进行对比,并按照蛋白质酶切规则(如胰蛋白酶酶切赖氨酸和精氨酸的C端),结合人体理论N-连接糖数据库筛选出基因突变相关N-糖蛋白,建立基因突变相关人体N-糖肽理论数据库。
基于当前(2022年6月7日)Uniprot蛋白质数据库以homo sapiens为物种名进行筛选并限制,经过人工确认(reviewed)共有20386条蛋白序列;考虑MUTAGEN、VAR_SEQ以及VARIANT三种突变形式,使用胰蛋白酶酶切并允许一个漏切位点,共筛选出8130条上述三种突变带来的新增的理论N-糖肽,部分代表列举于表1。
表1
基于上述基因突变相关N-糖肽理论数据库,使用N-糖肽搜索引擎GPSeekerPro对公开的人耐药乳腺癌细胞N-糖肽液相色谱-质谱联用分析数据组(Quantitative N-glycoproteomics study of cell-surface N-glycoprotein markers of MCF-7/ADRcancer stem cells.Analytical and Bioanalytical Chemistry,2020,412,2423–2432)进行数据库搜索;设置前体离子和碎片离子质谱允许偏差20ppm,并基于靶向-诱饵搜索控制假阳性不大于1%;控制基于位点决定性碎片离子的位点打分和基于结构诊断碎片离子的结构打分均不小于1。共获得了42条基因突变相关N-糖肽,如表2所示;该42条基因突变相关N-糖肽对应于14个N-糖蛋白(包括P10242、Q6PHR2、P02671、Q14524、P23193、Q96FC9、Q8N6H7、Q14BN4、O95834、Q86SQ6、Q8NCG7、Q13362、Q9Y2K7、P05155)。以P10242为例,多肽骨架FNGTSIR中的基因突变相关660号N-糖基化位点N-G-T来自于原蛋白序列中567到640号氨基酸的VAR_SEQ型氨基酸变化(NILTSSVLMAPASEDEDNVLKAFTVPKNRSLASPLQPCSSTWEPASCGKMEEQMTSSSQARKYVNAFSARTLVM->TGVQWHDFGSLQPLPPGFKRFSCLSLPRSWDYRHPPPRPANFEFLVETGFLHVGQAGLELLTSGDLPASASQSARITGVSHRARPEYSYKLRFNGTSIRR)。
表2
本发明的分析方法基于基因突变相关N-糖基化的筛选,基于N-糖肽搜索引擎建立基因突变相关N-糖肽理论数据库,并基于该数据库对待测样本N-糖肽液相色谱-质谱数据组进行靶向定性定量搜索,基于串级质谱结构指纹信息对所鉴定N-糖肽的N-糖基化位点和N-连接糖序列结构进行确认,基于特征多肽序列筛选基因突变相关N-糖蛋白,有效提高了基因突变相关蛋白质N-糖基化的鉴定准确度和效率。
对于本领域的普通技术人员而言,具体实施例只是对本发明进行了示例性描述,显然本发明具体实现并不受上述方式的限制,只要采用了本发明的方法构思和技术方案进行的各种非实质性的改进,或未经改进将本发明的构思和技术方案直接应用于其它场合的,均在本发明的保护范围之内。
Claims (8)
1.一种基因突变相关蛋白质N-糖基化的结构特异分析方法,其特征在于,包括如下步骤:
(1)基于现有的理论蛋白质数据库中被注释突变位点的蛋白质,筛选和建立基因突变相关N-糖肽理论数据库;
(2)基于该基因突变相关N-糖肽理论数据库,对待测样本N-糖肽通过液相色谱-质谱联用分析方法获得的数据组进行数据库定性定量搜索;
(3)基于串级质谱结构指纹信息对所鉴定的N-糖肽的N-糖基化位点和N-连接糖序列结构进行确认;
(4)基于所确认的特征多肽序列筛选基因突变相关N-糖蛋白。
2.根据权利要求1所述的一种基因突变相关蛋白质N-糖基化的结构特异分析方法,其特征在于,步骤(1)的具体过程为:基于现有的理论蛋白质数据库文件,遴选出被注释突变位点的蛋白质;将已突变氨基酸替换原始氨基酸并生成带突变氨基酸的新氨基酸序列;对新氨基酸序列进行N-糖基化序列子的筛选;将新氨基酸序列的N-糖基化序列子与原氨基酸序列的N-糖基化序列子进行对比,筛选出基因突变相关N-糖蛋白,建立基因突变相关N-糖肽理论数据库。
3.根据权利要求2所述的一种基因突变相关蛋白质N-糖基化的结构特异分析方法,其特征在于,基因突变相关N-糖肽理论数据库的建立依据蛋白质酶切规则,并结合理论N-连接糖数据库。
4.根据权利要求2所述的一种基因突变相关蛋白质N-糖基化的结构特异分析方法,其特征在于,基因突变形式包括但不限于MUTAGEN、VAR_SEQ以及VARIANT。
5.根据权利要求1所述的一种基因突变相关蛋白质N-糖基化的结构特异分析方法,其特征在于,所述串级质谱结构指纹信息包括特征氨基酸序列碎片离子、翻译后修饰位点决定性碎片离子和翻译后修饰结构诊断碎片离子。
6.根据权利要求5所述的一种基因突变相关蛋白质N-糖基化的结构特异分析方法,其特征在于,在进行数据库定性定量搜索时,前体离子和碎片离子质谱允许偏差20ppm,并基于靶向-诱饵搜索控制假阳性不大于1%。
7.根据权利要求5所述的一种基因突变相关蛋白质N-糖基化的结构特异分析方法,其特征在于,在进行数据库定性定量搜索时,控制基于位点决定性碎片离子的位点打分和基于结构诊断碎片离子的结构打分均不小于1。
8.根据权利要求1所述的一种基因突变相关蛋白质N-糖基化的结构特异分析方法,其特征在于,所述理论蛋白质数据库为UniProt蛋白质数据库。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210736371.0A CN115326945A (zh) | 2022-06-27 | 2022-06-27 | 一种基因突变相关蛋白质n-糖基化的结构特异分析方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210736371.0A CN115326945A (zh) | 2022-06-27 | 2022-06-27 | 一种基因突变相关蛋白质n-糖基化的结构特异分析方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN115326945A true CN115326945A (zh) | 2022-11-11 |
Family
ID=83918096
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202210736371.0A Pending CN115326945A (zh) | 2022-06-27 | 2022-06-27 | 一种基因突变相关蛋白质n-糖基化的结构特异分析方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN115326945A (zh) |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102495127A (zh) * | 2011-11-11 | 2012-06-13 | 暨南大学 | 一种基于概率统计模型的蛋白质二级质谱鉴定方法 |
CN104133027A (zh) * | 2014-06-24 | 2014-11-05 | 江南大学 | 一种分离鉴定糖蛋白n-糖链结构的方法 |
CN104198613A (zh) * | 2014-09-17 | 2014-12-10 | 山东大学 | 一种分析蛋白o-糖基化位点的方法 |
CN104820011A (zh) * | 2015-04-21 | 2015-08-05 | 同济大学 | 一种蛋白质翻译后修饰定位的方法 |
CN110277136A (zh) * | 2019-07-05 | 2019-09-24 | 湖南大学 | 蛋白质序列数据库并行搜索鉴定方法与装置 |
CN113393903A (zh) * | 2021-06-15 | 2021-09-14 | 上海君谊生物科技有限公司 | 参考蛋白质数据库的构建方法、存储介质、电子设备 |
-
2022
- 2022-06-27 CN CN202210736371.0A patent/CN115326945A/zh active Pending
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102495127A (zh) * | 2011-11-11 | 2012-06-13 | 暨南大学 | 一种基于概率统计模型的蛋白质二级质谱鉴定方法 |
CN104133027A (zh) * | 2014-06-24 | 2014-11-05 | 江南大学 | 一种分离鉴定糖蛋白n-糖链结构的方法 |
CN104198613A (zh) * | 2014-09-17 | 2014-12-10 | 山东大学 | 一种分析蛋白o-糖基化位点的方法 |
CN104820011A (zh) * | 2015-04-21 | 2015-08-05 | 同济大学 | 一种蛋白质翻译后修饰定位的方法 |
CN110277136A (zh) * | 2019-07-05 | 2019-09-24 | 湖南大学 | 蛋白质序列数据库并行搜索鉴定方法与装置 |
CN113393903A (zh) * | 2021-06-15 | 2021-09-14 | 上海君谊生物科技有限公司 | 参考蛋白质数据库的构建方法、存储介质、电子设备 |
Non-Patent Citations (3)
Title |
---|
YUE WANG 等: "A quantitative N-glycoproteomics study of cell-surface N-glycoprotein markers of MCF-7/ADR cancer stem cells", ANALYTICAL BIOANALYTICAL CHEMISTRY, pages 1 - 10 * |
毕明 等: "结构特异 N-糖蛋白质组学研究进展", 质谱学报, vol. 42, no. 05, pages 897 - 913 * |
程凯 等: "一种位点注释的蛋白质数据库用于磷酸化肽段的鉴定", 色谱, vol. 33, no. 01, pages 10 - 16 * |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Yates et al. | Mining genomes: correlating tandem mass spectra of modified and unmodified peptides to sequences in nucleotide databases | |
James | Protein identification in the post-genome era: the rapid rise of proteomics | |
JP4654230B2 (ja) | マススペクトル測定方法 | |
Henzel et al. | Protein identification: the origins of peptide mass fingerprinting | |
Schiess et al. | Analysis of Cell Surface Proteome Changes via Label-free, Quantitative Mass Spectrometry* S | |
Kempa et al. | An automated GCxGC‐TOF‐MS protocol for batch‐wise extraction and alignment of mass isotopomer matrixes from differential 13C‐labelling experiments: a case study for photoautotrophic‐mixotrophic grown Chlamydomonas reinhardtii cells | |
Graham et al. | Broad‐based proteomic strategies: a practical guide to proteomics and functional screening | |
AU2993401A (en) | Method of non-targeted complex sample analysis | |
Tsai et al. | A brief review of bioinformatics tools for glycosylation analysis by mass spectrometry | |
WO2006096704A2 (en) | Isotopically-labeled proteome standards | |
WO2003042774A2 (en) | Mass intensity profiling system and uses thereof | |
CN105200530A (zh) | 一种适用于高通量全基因组测序的多样品混合文库的构建方法 | |
An et al. | A new computer program (GlycoX) to determine simultaneously the glycosylation sites and oligosaccharide heterogeneity of glycoproteins | |
US20040172200A1 (en) | Constellation mapping and uses thereof | |
CN114708910A (zh) | 一种利用单细胞测序数据计算池测序中细胞亚群富集分数的方法 | |
CN115326945A (zh) | 一种基因突变相关蛋白质n-糖基化的结构特异分析方法 | |
JPWO2006129401A1 (ja) | プロテオーム網羅的解析における特異的蛋白質のスクリーニング方法 | |
CN110438235B (zh) | 基于毛干蛋白质组nsSNP进行人群来源推断的方法 | |
CN111739583B (zh) | 基于优化数据库(Sub-Lib)的数据非依赖性质谱检测方法 | |
CN115961034A (zh) | 一种基于umi技术的肺癌患者外周血基因突变检测分析方法 | |
Sun et al. | An approach for N-linked glycan identification from MS/MS spectra by target-decoy strategy | |
WO2022246416A2 (en) | Biomarkers for diagnosing ovarian cancer | |
Wlaschin et al. | Toward genomic cell culture engineering | |
EP1469314B1 (en) | Method of mass spectometry | |
Moore et al. | Protein identification using a quadrupole ion trap mass spectrometer and SEQUEST database matching |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20221111 |