CN110797079B - 一种代谢-蛋白互作网络集成方法 - Google Patents

一种代谢-蛋白互作网络集成方法 Download PDF

Info

Publication number
CN110797079B
CN110797079B CN201911033021.2A CN201911033021A CN110797079B CN 110797079 B CN110797079 B CN 110797079B CN 201911033021 A CN201911033021 A CN 201911033021A CN 110797079 B CN110797079 B CN 110797079B
Authority
CN
China
Prior art keywords
network
metabolic
protein
reaction
protein interaction
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201911033021.2A
Other languages
English (en)
Other versions
CN110797079A (zh
Inventor
郝彤
孙金生
郜晨晨
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Tianjin Normal University
Original Assignee
Tianjin Normal University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tianjin Normal University filed Critical Tianjin Normal University
Priority to CN201911033021.2A priority Critical patent/CN110797079B/zh
Publication of CN110797079A publication Critical patent/CN110797079A/zh
Application granted granted Critical
Publication of CN110797079B publication Critical patent/CN110797079B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B15/00ICT specially adapted for analysing two-dimensional or three-dimensional molecular structures, e.g. structural or functional relations or structure alignment
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B45/00ICT specially adapted for bioinformatics-related data visualisation, e.g. displaying of maps or networks

Landscapes

  • Physics & Mathematics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Biotechnology (AREA)
  • Theoretical Computer Science (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Health & Medical Sciences (AREA)
  • Evolutionary Biology (AREA)
  • General Health & Medical Sciences (AREA)
  • Medical Informatics (AREA)
  • Biophysics (AREA)
  • Data Mining & Analysis (AREA)
  • Chemical & Material Sciences (AREA)
  • Crystallography & Structural Chemistry (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明涉及生物信息学中生物网络子领域,一种代谢‑蛋白互作网络集成方法,该方法包括代谢网络转换,R‑P‑R网络构建,网络对接三个步骤;代谢网络是代谢物‑代谢物之间的关系联结而成,而蛋白互作网络是蛋白‑蛋白之间的关系联结而成,从节点信息上来看,利用蛋白作为桥梁,找到代谢网络和蛋白互作网络的共性,将其集成为一个网络。

Description

一种代谢-蛋白互作网络集成方法
技术领域
本发明涉及生物信息学中生物网络子领域,具体涉及一种代谢-蛋白互作网络集成方法。
背景技术
生物细胞网络主要包括代谢网络、转录调控网络、信号转导网络、蛋白互作网络等。近些年来,国内外的研究者们展开了基因组规模信号转导网络、基因调控网络、代谢网络模型的构建以及分析,构建出了诸多细胞网络的数据库。在生物领域中,围绕着不同的生物细胞网络模型,许多生物研究团队已经进行了深入的研究和探讨,他们应用不同的生物信息学工具对相关网络进行分析,但随着对单一生物网络的深入研究,研究者们逐渐发现了单一网络的不足之处。研究者们认识到,生物体内各组成成分(基因、蛋白质、代谢物)都是和其他组分共同作用才能体现出其功能的,单一细胞网络的构建整理出单独的某个组分之间的联系,而集成网络可以将这些单独组分的细胞网络联系在一起,构成一个更大的生物网络,能够更好地模拟生物学中的关键活动,因此以单一网络为基础所进行的多个网络的集成工作,已经成为生物细胞网络研究的热点。
网络集成中,代谢网络是被研究者研究的最为透彻、深入的一个细胞网络。目前已构建的集成网络主要集中在代谢-调控集成网络,代谢-信号集成网络,现在已有的细胞网络集成方法包括RFBA(调控通量平衡分析)、PROM(代谢系统概率调控方法)法等,然而对于代谢网络和蛋白互作网络的集成,目前还没有涉及到,本发明将运用一种全新方法,将代谢网络和蛋白互作网络集成在一起,形成一个规模更大、信息更完善的代谢-蛋白互作集成网络。
发明内容
本发明的目的在于克服现有技术中的不足,提供一种代谢-蛋白互作网络集成方法,将代谢网络和蛋白互作网络集成,得到更完善的生物网络。
本发明为解决背景技术中的技术问题,采用的技术方案是一种代谢-蛋白互作网络集成方法,该技术分为代谢网络转换,R-P-R网络构建,网络对接四个步骤。
代谢网络是代谢物-代谢物之间的关系联结而成,而蛋白互作网络是蛋白-蛋白之间的关系联结而成,从节点信息上来看,二者并没有关联,利用蛋白作为桥梁,找到代谢网络和蛋白互作网络的共性,将其集成为一个网络。
本方法的步骤为:
(1)代谢网络转换:通常代谢网络是以代谢物图的形式呈现,即以代谢物为节点,以反应为边。为了为网络集成做准备,首先需要将代谢网络转化为反应图,即以反应为节点,以反应间的共同代谢物为边,简称为R-R形式网络。对于两个不同的反应(R1和R2),R1-R2关系建立的原则为:R1的产物能够作为R2的底物。具体方法为:(a)对于整个网络中的每一个代谢物,搜索其参与的反应,并确定其在各个反应中的位置,即作为底物或产物;(b)将含有该代谢物并作为产物的反应分别与含有该代谢物并作为底物的反应联结起来,建立若干个反应关系对;(c)将所有反应关系对整合起来,形成以反应为节点,以代谢物为边的代谢网络(如图1中的代谢网络R-R关系)。
(2)R-P-R网络构建:在代谢网络中,每一个反应都是由酶催化的,而酶的本质是蛋白,因此每一个代谢反应都对应着一个或多个蛋白-反应关系(即P-R关系,如图1中的代谢网络P-R关系)。根据代谢网络中蛋白(即催化酶)与反应间的催化关系,将蛋白-反应关系(P-R关系)添加到R-R网络中,形成R-P-R代谢网络(如图1中的R-P-R代谢网络)。
(3)网络对接:在蛋白互作网络中,包含大量蛋白-蛋白关系(即P-P关系,如图1中的蛋白互作网络)。比较代谢网络和蛋白互作网络,确定其中的共同蛋白,以该蛋白作为桥梁,将与其相关的代谢网络中的反应-蛋白关系和蛋白互作网络中的蛋白-蛋白关系联结在一起,形成集成网络(如图1中的代谢-蛋白互作集成网络)。
有益效果
1、本发明应用得到的集成网络与单一的代谢网络或蛋白互作网络相比,包含的节点和边数量更多,节点和边的生物学意义更加丰富,不仅有代表蛋白的节点,还包括代表反应的节点,不仅有表示蛋白之间关系的边,还包括表示反应之间关系,以及蛋白-反应之间关系的边。应用本发明方法将代谢网络和蛋白互作网络集成后,得到的集成网络规模更大、信息更完善、生物学意义更明确,有利于后续的生物学分析研究。
2、网络集成前,中华绒螯蟹代谢网络包含1784个节点,2852条边,边仅表示反应之间的关系。中华绒螯蟹蛋白互作网络包含8225个节点,148524条边,边仅表示蛋白之间的关系。应用本发明方法将中华绒螯蟹代谢网络和蛋白互作网络集成后,集成网络中包含10009个节点,152816条边,集成网络不仅包含表示蛋白之间关系和反应之间关系的边,还包含1440个表示蛋白-反应关系的边。网络集成后节点和边的数量都比单一的代谢网络或蛋白互作网络更多,网络中的边代表的生物学意义更加丰富。
3、该方法应用于中华绒螯蟹代谢-蛋白互作集成网络的构建。实验采用实验室前期研究中构建的中华绒螯蟹代谢网络和蛋白互作网络作为基础网络,实验室已构建出的中华绒螯蟹代谢网络包含1971个反应,1122个催化酶,1856个代谢物,中华绒螯蟹蛋白互作网络包含8225个蛋白,148524个蛋白互作关系。
附图说明
图1本发明方法图。
图2中华绒螯蟹集成网络图,红色代表反应节点,蓝色代表蛋白节点。
具体实施方式
以下结合附图和具体实施例来对本发明作进一步的说明。
具备同一物种的代谢网络和蛋白互作网络。
利用本发明所述方法将上述两个网络集成,构建成中华绒螯蟹代谢-蛋白互作集成网络。具体方法如下:
(1)代谢网络转换:将中华绒螯蟹代谢网络整理成以反应为点,以代谢物为边的反应图形式。分别列出每个反应的底物和产物,并根据“R1的产物能够作为R2的底物则建立R1-R2关系”的原则,将代谢网络转换为反应图,最终得到的R-R形式代谢网络共包含1784个节点(即1784个反应),2852条边,其中没有包含在反应图中的反应为孤立反应,与其他反应没有连接关系。
(2)R-P-R网络构建:从KEGG数据库中搜集代谢反应-催化酶信息,根据代谢网络中蛋白(即催化酶)与反应间的催化关系,将蛋白-反应关系(P-R关系)添加到R-R网络中,形成R-P-R代谢网络,中华绒螯蟹的代谢网络中的反应由1122个酶催化,因此得到的R-P-R网络包含1122个蛋白信息。
(3)网络对接:比较中华绒螯蟹代谢网络和蛋白互作网络,确定其中的共同蛋白为307个,以共同蛋白作为桥梁,将与其相关的代谢网络中的反应-蛋白关系和蛋白互作网络中的蛋白-蛋白关系联结在一起,形成集成网络,该集成网络中共有10009个节点,152816条边(如图2所示,红色代表反应节点,蓝色代表蛋白节点)。中华绒螯蟹集成网络与其代谢网络和蛋白互作网络相比,包含的节点和边数量更多,即规模更大、信息更完善,有利于后续的生物学分析研究,如图2所示。

Claims (2)

1.一种代谢-蛋白互作网络集成方法,其特征在于,该方法包括代谢网络转换,R-P-R网络构建,网络对接三个步骤:代谢网络是代谢物-代谢物之间的关系联结而成,而蛋白互作网络是蛋白-蛋白之间的关系联结而成,从节点信息上来看,利用蛋白作为桥梁,找到代谢网络和蛋白互作网络的共性,将其集成为一个网络;具体步骤为:
(1)代谢网络转换:通常代谢网络是以代谢物图的形式呈现,即以代谢物为节点,以反应为边;
(2)R-P-R网络构建:在代谢网络中,每一个反应都是由酶催化的,每一个代谢反应都对应着一个或多个蛋白-反应关系/P代谢网络P-R关系;根据代谢网络中蛋白/催化酶,与反应间的催化关系,将蛋白-反应关系/P-R关系添加到R-R网络中,形成R-P-R代谢网络;
(3)网络对接:在蛋白互作网络中,包含大量蛋白-蛋白关系/P-P关系,蛋白互作网络;比较代谢网络和蛋白互作网络,确定其中的共同蛋白,以该蛋白作为桥梁,将与其相关的代谢网络中的反应-蛋白关系和蛋白互作网络中的蛋白-蛋白关系联结在一起,形成集成网络,即代谢-蛋白互作集成网络。
2.根据权利要求1所述的一种代谢-蛋白互作网络集成方法,其特征在于,所述步骤(1)具体如下:首先需要将代谢网络转化为反应图,即以反应为节点,以反应间的共同代谢物为边,简称为R-R形式网络;对于两个不同的反应/R1和R2,R1-R2关系建立的原则为:R1的产物能够作为R2的底物,具体方法为:
(a)对于整个网络中的每一个代谢物,搜索其参与的反应,并确定其在各个反应中的位置,即作为底物或产物;
(b)将含有该代谢物并作为产物的反应分别与含有该代谢物并作为底物的反应联结起来,建立若干个反应关系对;
(c)将所有反应关系对整合起来,形成以反应为节点,以代谢物为边的代谢网络,即代谢网络R-R关系。
CN201911033021.2A 2019-10-28 2019-10-28 一种代谢-蛋白互作网络集成方法 Active CN110797079B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201911033021.2A CN110797079B (zh) 2019-10-28 2019-10-28 一种代谢-蛋白互作网络集成方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201911033021.2A CN110797079B (zh) 2019-10-28 2019-10-28 一种代谢-蛋白互作网络集成方法

Publications (2)

Publication Number Publication Date
CN110797079A CN110797079A (zh) 2020-02-14
CN110797079B true CN110797079B (zh) 2023-05-09

Family

ID=69441595

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201911033021.2A Active CN110797079B (zh) 2019-10-28 2019-10-28 一种代谢-蛋白互作网络集成方法

Country Status (1)

Country Link
CN (1) CN110797079B (zh)

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105279397A (zh) * 2015-10-26 2016-01-27 华东交通大学 一种识别蛋白质相互作用网络中关键蛋白质的方法
CN105868582A (zh) * 2016-03-25 2016-08-17 陕西师范大学 采用果蝇优化方法识别蛋白质复合物

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2008045306A2 (en) * 2006-10-04 2008-04-17 The Regents Of The University Of California Compositions and methods for modeling human metabolism
CN102306251B (zh) * 2011-09-20 2015-01-07 东南大学 新型生物网络模型的构建方法
CN103186718A (zh) * 2011-12-29 2013-07-03 上海聚类生物科技有限公司 构建细胞代谢产物网络的新算法
CN103778349B (zh) * 2014-01-29 2017-02-15 思博奥科生物信息科技(北京)有限公司 一种基于功能模块的生物分子网络分析的方法

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105279397A (zh) * 2015-10-26 2016-01-27 华东交通大学 一种识别蛋白质相互作用网络中关键蛋白质的方法
CN105868582A (zh) * 2016-03-25 2016-08-17 陕西师范大学 采用果蝇优化方法识别蛋白质复合物

Also Published As

Publication number Publication date
CN110797079A (zh) 2020-02-14

Similar Documents

Publication Publication Date Title
Sachsenberg et al. MetaProSIP: automated inference of stable isotope incorporation rates in proteins for functional metaproteomics
Le et al. A novel mammalian cell line development platform utilizing nanofluidics and optoelectro positioning technology
Costantini et al. Biochemical integration of blood redox state in captive zebra finches (Taeniopygia guttata)
Song et al. Rascaf: improving genome assembly with RNA sequencing data
CN103714180A (zh) 一种生物信息学数据库系统和数据处理方法
Toms et al. Climbing the mountain: experimental design for the efficient optimization of stem cell bioprocessing
Heavner et al. Transparency in metabolic network reconstruction enables scalable biological discovery
Mische et al. A review of the scientific rigor, reproducibility, and transparency studies conducted by the ABRF research groups
CN110797079B (zh) 一种代谢-蛋白互作网络集成方法
Zhao et al. LncPipe: A Nextflow-based pipeline for identification and analysis of long non-coding RNAs from RNA-Seq data
Wakano et al. Ecocultural range-expansion scenarios for the replacement or assimilation of Neanderthals by modern humans
Schallert et al. Pout2Prot: an efficient tool to create protein (sub) groups from percolator output files
Pais et al. ISAnalytics enables longitudinal and high-throughput clonal tracking studies in hematopoietic stem cell gene therapy applications
CN110767261B (zh) 一种自动化构建高精度基因组尺度代谢网络模型的方法
Misra Updates on resources, software tools, and databases for plant proteomics in 2016–2017
Ashwood et al. Proceedings of the EuBIC-MS 2020 Developers’ Meeting
Markert et al. Automated and enhanced clone screening using a fully automated microtiter plate‐based system for suspension cell culture
Ashworth et al. An explorable public transcriptomics compendium for eukaryotic microalgae
CN112802552A (zh) 一种抗生素耐药基因影响因素和差异性分析方法
Ruiz et al. reanalyzerGSE: tackling the everlasting lack of reproducibility and reanalyses in transcriptomics
Durbin et al. Hypomanic personality traits: A multi-method exploration of their association with normal and abnormal dimensions of personality
Chen et al. Improving the performance of single-cell RNA-seq data mining based on relative expression orderings
Tallman et al. Whole-genome sequencing of Bantu-speakers from Angola and Mozambique reveals complex dispersal patterns and interactions throughout sub-Saharan Africa
Yianni et al. Single cell RNA-seq: cell isolation and data analysis
Bittremieux et al. Christopher Ashwood

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
OL01 Intention to license declared
OL01 Intention to license declared