CN105956413B - 识别生物分子网络中关键模块或关键节点的方法 - Google Patents

识别生物分子网络中关键模块或关键节点的方法 Download PDF

Info

Publication number
CN105956413B
CN105956413B CN201610269466.0A CN201610269466A CN105956413B CN 105956413 B CN105956413 B CN 105956413B CN 201610269466 A CN201610269466 A CN 201610269466A CN 105956413 B CN105956413 B CN 105956413B
Authority
CN
China
Prior art keywords
network
node
module
key
protein
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201610269466.0A
Other languages
English (en)
Other versions
CN105956413A (zh
Inventor
张莹莹
王�忠
王永炎
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Individual
Original Assignee
Individual
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Individual filed Critical Individual
Priority to CN201610269466.0A priority Critical patent/CN105956413B/zh
Publication of CN105956413A publication Critical patent/CN105956413A/zh
Priority to PCT/CN2017/071209 priority patent/WO2017185834A1/zh
Priority to US16/096,276 priority patent/US20190139621A1/en
Application granted granted Critical
Publication of CN105956413B publication Critical patent/CN105956413B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B5/00ICT specially adapted for modelling or simulations in systems biology, e.g. gene-regulatory networks, protein interaction networks or metabolic networks
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B10/00ICT specially adapted for evolutionary bioinformatics, e.g. phylogenetic tree construction or analysis
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B20/00ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B40/00ICT specially adapted for biostatistics; ICT specially adapted for bioinformatics-related machine learning or data mining, e.g. knowledge discovery or pattern finding
    • G16B40/20Supervised data analysis
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B45/00ICT specially adapted for bioinformatics-related data visualisation, e.g. displaying of maps or networks

Landscapes

  • Physics & Mathematics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Medical Informatics (AREA)
  • Theoretical Computer Science (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Biotechnology (AREA)
  • Evolutionary Biology (AREA)
  • General Health & Medical Sciences (AREA)
  • Biophysics (AREA)
  • Physiology (AREA)
  • Molecular Biology (AREA)
  • Data Mining & Analysis (AREA)
  • Public Health (AREA)
  • Software Systems (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Databases & Information Systems (AREA)
  • Epidemiology (AREA)
  • Evolutionary Computation (AREA)
  • Artificial Intelligence (AREA)
  • Bioethics (AREA)
  • Animal Behavior & Ethology (AREA)
  • Chemical & Material Sciences (AREA)
  • Analytical Chemistry (AREA)
  • Genetics & Genomics (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)
  • Investigating Or Analysing Biological Materials (AREA)

Abstract

本发明提供了一种针对生物分子的复杂网络,如蛋白质相互作用网络、基因表达调控网络、生物代谢网络、表观遗传网络、表型网络、信号传导网络,基于其拓扑结构融合多种方法进行关键模块和关键节点的方法,主要步骤如下:基于生物分子网络,或对网络进行模块的划分,对网络或各模块,基于网络拓扑结构采用多种度量方法多角度综合定量识别关键模块和关键节点。

Description

识别生物分子网络中关键模块或关键节点的方法
技术领域
本发明属于生物信息技术领域。具体而言,本发明涉及疾病和药物干 预的复杂分子网络如蛋白质相互作用网络、基因表达调控网络、药物代谢 和药物靶点等网络等中关键模块或关键节点的识别方法。
背景技术
随着组学时代的到来和高通量技术的发展,产生了海量的生物数据集, 并随之产生了常见的生物分子网络,例如蛋白质相互作用网络、基因表达调 控网络、药物代谢网络等。对这些数据网络进行有效的分析,可以揭示基 因表达调控、蛋白质相互作用、代谢物相互作用等机制,进而应用于疾病 机制研究与治疗、药物开发等领域。
证据显示生物分子网络中具有模块组织结构,模块结构的识别有助于复 杂网络的降维和简化,是理解生物系统的一个关键因素,可以为系统地揭示 药物作用的复杂机制提供契机。而且网络数据模型表明,针对复杂疾病,抑 制多个靶标比抑制单一靶标更加有效,因此复杂疾病的治疗需要一种模块化 设计来影响多个靶点,同样需要对相关系统与网络进行模块的识别。
但是,虽然生物分子网络中存在多个模块,但它们的地位并非均等,而 是有主次之分。本发明的发明人在之前的研究工作中已经提出,在生物分子 网络中存在关键模块,其是在结构和功能上均占据关键和支配地位的模块, 即在结构上具有强中心性和支配性,在功能上具有强整合性,并能触发一个 或多个一定效应。
在复杂事物中抓住主要矛盾是解决问题的关键所在。目前已有研究者开 展了关键模块的识别工作,但是这些已有研究往往忽视了模块网络的拓扑结 构,忽视了模块间关系对关键模块的影响,缺乏对关键模块或关键节点的定 量分析。
因此目前本领域仍然需要提供能够识别复杂生物分子网络中关键模块 或关键节点的新方法。
发明内容
针对上述技术问题,本发明提供一种能够识别生物分子网络中关键模块 或关键节点的新方法,该方法基于多个重要节点度量方法及网络或模块的拓 扑结构,从生物分子网络中识别出关键模块,或者识别出关键节点。
定义:
如本文所用,术语“生物分子网络”是指在生物系统中以不同组织形式 存在的网络,其由代表各种生物分子的节点与代表生物分子之间的相互作用 关系的边组成。常见的生物分子网络包括基因转录调控网络、生物代谢网络、 表观遗传网络、表型网络、信号传导网络、蛋白质相互作用网络等。
如本文所用,术语“关键模块”是指网络中在结构和功能上均占据关键 和支配地位的模块,即其在结构上占据中心性,在功能上具有强整合性,删 除此模块对网络结构和信息传递的影响超过删除网络中其他模块对网络结 构和信息传递影响的平均值,并能触发一个或多个一定效应。
如本文所用,术语“关键节点”是指网络中在结构和功能上均占据关键 位置的节点,如其对网络的信息传递、节点的相互作用等方面具有重要影响, 删除此节点对网络结构和信息传递的影响超过删除网络中其他节点对网络 结构和信息传递影响的平均值。由于该关键节点在整个生物分子网络、例如 蛋白质相互作用网络中的重要作用,可以被视为在药理方面具有驱动作用, 因此本文又称之为“药理驱动子”。
本发明的具体技术方案如下:
一方面,本发明提供一种识别生物分子网络中关键模块的方法,所述方 法包括以下步骤:
(1)以节点数目≥3为标准,对所述生物分子网络进行模块识别;示例 性模块识别方法为MCODE。
(2)对于经步骤(1)识别的模块,基于模块之间的组件相关性构建加 权或不加权的模块相互作用网络;构建加权的模块相互作用网络即将模块之 间在原网络中实际存在的边恢复连接以构建模块之间的相互作用,将边的数 目的多少作为模块之间关系的权重的大小,两个模块之间节点相互连接的边 数越多,则这两个模块相互作用边的权重越大;不加权的模块相互作用网络 仅以模块之间的边是否存在为标准,将所有模块之间的边均视为1条。
(3)对于经步骤(2)构建的加权或不加权的模块相互作用网络,采用 至少3种度量节点重要性的方法识别关键模块,其中所述关键模块满足以下 条件:根据所述度量节点重要性的方法进行计算,得到的数值按降序排列(A) 在至少一种所述度量节点重要性的方法中排名第一;和(B)在所有所述度 量节点重要性的方法中排名前三之一。
优选地,所述生物分子网络包括基因表达调控网络、蛋白质相互作用网 络、生物代谢网络、表观遗传网络、表型网络、信号传导网络等,优选为蛋 白质相互作用网络;更优选地,所述生物分子网络为疾病相关的蛋白质相互 作用网络;进一步优选地,所述生物分子网络为疾病相关的经药物干预之前 或之后的蛋白质相互作用网络。由于本发明的生物分子网络可为疾病相关网 络,并进一步可组合药物干预,因此本发明的识别方法通过揭示数据网络的 关键部分,为疾病机制研究与相应的药物开发提供科学依据。
从复杂程度来看,所述生物分子网络为蛋白质相互作用网络,优选地所 述网络由≥100个节点(蛋白质)和≥200条边(蛋白质之间的相互作用关系) 组成,更优选由≥200个节点(蛋白质)和≥500条边(蛋白质之间的相互作 用关系)组成,特别是由≥2000个节点(蛋白质)和≥6000条边(蛋白质之 间的相互作用关系)组成。
其中,本发明方法的步骤(3)中度量节点重要性的方法可选自:度中 心性方法、邻近中心性方法、特征向量中心性方法、介数中心性方法、子图 中心性方法、枢纽中心性方法、控制中心性方法、节点强度方法、应力中心 性方法、页面等级方法和邻接矩阵谱方法。具体见下表1。
表1:各种度量重要节点的方法
另一方面,本发明提供一种识别网络或模块中关键节点的方法,所述方 法包括以下步骤:采用至少3种度量节点重要性的方法识别所述网络或模块 中的关键节点,其中所述关键节点满足以下条件:根据所述度量节点重要性 的方法进行计算,得到的数值按降序排列(A)在至少一种所述度量节点重 要性的方法中排名第一;和(B)在所有所述度量节点重要性的方法中排名 前三之一。
关键节点可以从任何网络、例如生物分子网络中识别,也可以从上文方 法的第(1)、(2)步骤中分别得到的模块中识别。
因此,当从网络中识别关键节点时,优选地,所述网络为生物分子网络, 包括基因表达调控网络、蛋白质相互作用网络、生物代谢网络、表观遗传网 络、表型网络、信号传导网络等,优选为蛋白质相互作用网络;更优选地, 所述生物分子网络为疾病相关的蛋白质相互作用网络;进一步优选地,所述 生物分子网络为疾病相关的经药物干预之前或之后的蛋白质相互作用网络。
从复杂程度来看,所述生物分子网络为蛋白质相互作用网络,优选地所 述网络由≥100个节点(蛋白质)和≥200条边(蛋白质之间的相互作用关系) 组成,更优选由≥200个节点(蛋白质)和≥500条边(蛋白质之间的相互作 用关系)组成,特别是由≥2000个节点(蛋白质)和≥6000条边(蛋白质之 间的相互作用关系)组成。
当从模块中识别关键节点时,优选地,所述模块为以节点数目≥3为标 准,对生物分子网络进行识别得到的模块;
或者,所述模块为采用下述步骤得到的关键模块:
(1)以节点数目≥3为标准,对所述生物分子网络进行模块识别;
(2)对于经步骤(1)识别的模块,基于模块之间的组件相关性构建加 权或不加权的模块相互作用网络;构建加权的模块相互作用网络即将模块之 间在原网络中实际存在的边恢复连接以构建模块之间的相互作用,将边的数 目的多少作为模块之间关系的权重的大小,两个模块之间节点相互连接的边 数越多,则这两个模块相互作用边的权重越大;不加权的模块相互作用网络 仅以模块之间的边是否存在为标准,将所有模块之间的边均视为1条。
(3)对于经步骤(2)构建的加权或不加权的模块相互作用网络,采用 至少3种度量节点重要性的方法识别关键模块,其中所述关键模块满足以下 条件:根据所述度量节点重要性的方法进行计算,得到的数值按降序排列(A) 在至少一种所述度量节点重要性的方法中排名第一;和(B)在所有所述度 量节点重要性的方法中排名前三之一。
进一步,识别关键节点的方法包括以下步骤:
(1)以节点数目≥3为标准,对所述生物分子网络进行模块识别;
(2)对于经步骤(1)识别的模块,基于模块之间的组件相关性构建加 权或不加权的模块相互作用网络;构建加权的模块相互作用网络即将模块之 间在原网络中实际存在的边恢复连接以构建模块之间的相互作用,将边的数 目的多少作为模块之间关系的权重的大小,两个模块之间节点相互连接的边 数越多,则这两个模块相互作用边的权重越大;不加权的模块相互作用网络 仅以模块之间的边是否存在为标准,将所有模块之间的边均视为1条。
(3)对于经步骤(2)构建的加权或不加权的模块相互作用网络,采用 至少3种度量节点重要性的方法识别关键模块,其中所述关键模块满足以下 条件:根据所述度量节点重要性的方法进行计算,得到的数值按降序排列(A) 在至少一种所述度量节点重要性的方法中排名第一;和(B)在所有所述度 量节点重要性的方法中排名前三之一;
(4)对于经步骤(3)识别的关键模块,采用至少3种度量节点重要性 的方法识别所述关键模块中的关键节点,其中所述关键节点满足以下条件: 根据所述度量节点重要性的方法进行计算,得到的数值按降序排列(A)在 至少一种所述度量节点重要性的方法中排名第一;和(B)在所有所述度量 节点重要性的方法中排名前三之一。
其中所述步骤(3)和步骤(4)中度量节点重要性的方法选自:度中心 性方法、邻近中心性方法、特征向量中心性方法、介数中心性方法、子图中 心性方法、枢纽中心性方法、控制中心性方法、节点强度方法、应力中心性 方法、页面等级方法和邻接矩阵谱方法。同样参见表1。
本发明提供的识别方法可见图1。
根据本发明的具体实施方式,所述生物分子网络为脑缺血的蛋白质相互 作用网络,特别是源自脑缺血模型组、黄芩组、栀子苷组的蛋白质相互作用 网络。其中脑缺血模型组的蛋白质相互作用网络由3750个节点和9162条边 组成,黄芩苷组的蛋白质相互作用网络由2813个节点和6217条边组成,栀 子苷组的蛋白质相互作用网络由3416个节点和7581条边组成(参见张莹莹, 清开灵多组分干预脑缺血模型蛋白质网络主要模块的识别与比较[D],中国 中医科学院,2014)。
示例性地,从上述四个蛋白质相互作用网络分别识别关键模块与关键节 点的方法分别如下:
(1)以节点数目≥3为标准,采用MCODE方法进行模块识别;
(2)对于经步骤(1)识别的模块,基于模块之间的组件相关性构建加 权的模块相互作用网络或不加权的模块相互作用网络;
(3)对于经步骤(2)构建的加权的模块相互作用网络,从多种度量节 点重要性的方法中例如选用节点强度、介数中心性和页面等级3种度量方法 识别关键模块,其中关键模块满足以下条件:根据所述度量节点重要性的方 法进行计算,得到的数值按降序排列(A)在至少一种方法中排名第一;和 (B)在所有方法中排名前三之一;或者
对于经步骤(2)构建的不加权的模块相互作用网络,从多种度量节点 重要性的方法中例如选用度中心性、介数中心性和页面等级3种度量方法识 别关键模块,其中关键模块满足以下条件:根据所述度量节点重要性的方法 进行计算,得到的数值按降序排列(A)在至少一种方法中排名第一;和(B) 在所有方法中排名前三之一;
(4)对于经步骤(3)识别的关键模块,从多种度量节点重要性的方法 中例如选用度中心性、介数中心性和页面等级3种度量方法或者选用应力中 心性、节点加权度和特征向量中心性3种度量方法识别所述关键模块中的关 键节点(药理驱动子),其中所述关键节点满足以下条件:根据所述度量节 点重要性的方法进行计算,得到的数值按降序排列(A)在至少一种方法中 排名第一;和(B)在所有方法中排名前三之一。
无论是复杂网络还是作为亚网络的模块,均由节点和节点之间的关系 (边)组成。在网络中,模块地位存在差异;而在模块中,节点地位也存在 差异。事实上,重要节点对网络或模块具有不同的功能,枢纽节点可分为聚 会枢纽和约会枢纽,当移除这两种节点时,对网络拓扑结构的影响是截然不 同的。关键模块或节点的识别对于了解整个网络的作用机制是非常重要的。 例如在传染病疫情蔓延时,找到重要的节点可以更好地理解该传染病传播动 态过程,由此有可能采用行之有效的方法阻止严重的后果。故对于复杂生物 分子网络、特别是疾病、药物相关的网络,研究其模块或节点的重要性对于 控制或扭转疾病的发展和药物设计具有重要的意义。
对此,本发明对于疾病和药物干预的复杂网络或模块结构,提出要识别 关键模块和关键节点即药理驱动子之一创新概念,并且针对该概念,具体提 供了从生物分子网络中识别关键模块和关键节点的方法,在该具体识别过程 中,结合多种重要节点度量方法及网络模块的拓扑结构特点,定量识别出关 键模块和药理驱动子。特别是,基于结构对功能的决定性,不论是分子网络 与模块网络还是模块划分与关键模块、驱动子的识别,本发明的方法都给予 网络拓扑结构足够重视,并通过对模块本身、模块网络整体、模块间关系等 多角度定量分析确定关键模块;通过局部、整体及迭代重要性等采用多方法 综合定量分析确定药理驱动子。关键模块和药理驱动子的研究为探索药物联 合应用产生协同效应的主要药理机制奠定基石;为进一步分析药物间相互关 系、指导联合用药和疾病治疗打下基础,为指导疾病治疗和药物研发提供科 学依据。
附图说明
以下,结合附图来详细说明本发明的实施方案,其中:
图1示出本发明所述关键模块和药理驱动子识别方法的流程图。
图2示出脑缺血模型组和清开灵有效组分干预后各组的蛋白质相互作用 网络;图2a-1、2b-1、2c-1中圆形结构分别为脑缺血模型及清开灵组分黄芩 苷、栀子苷的蛋白质相互作用网络,图2a-2、2b-2、2c-2分别为相应网络中 节点的度分布结果,横坐标代表节点的度数,纵坐标代表节点的数目。从图 中可看出各个网络均属于无尺度网络。
图3示出脑缺血模型组和清开灵有效组分干预后各组的蛋白质相互作用 网络的模块识别结果。
图4示出脑缺血模型组和清开灵各组分干预后各组的蛋白质相互作用网 络的加权模块相互作用网络;图中节点代表模块,边代表模块之间相互作用, 边的粗细表示模块之间连接边的数目的多少,越粗表示连接边的数目越多。
图5示出脑缺血模型组和清开灵各组分干预后各组的蛋白质相互作用网 络中关键模块结果;图5a、5b、5c分别为脑缺血模型及清开灵组分黄芩苷、 栀子苷组的关键模块。
图6示出从脑缺血模型和清开灵各组分干预后的蛋白质相互作用网络中 删除各个模块前后网络特征路径长度的变化结果。横坐标代表模块编号,纵 坐标代表删除各模块后网络特征路径长度值,“0”代表没有删除任何模块时 网络的特征路径长度值。
图7示出栀子苷组关键模块MJA-1的药理驱动子验证结果。图中显示在 模块中分别删除各个节点对模块特征路径长度的影响,横坐标是删除每个节 点的名称(“无”为未删除任何节点),纵坐标对应删除各个节点时模块特征 路径长度的值,可看出删除Il6对模块的影响最大,与采用本发明的方法识 别的结果一致。
具体实施方式
以下参照具体的实施例来说明本发明。本领域技术人员能够理解,这些 实施例仅用于说明本发明,其不以任何方式限制本发明的范围。
下述实施例中的实验方法,如无特殊说明,均为常规方法。下述实施 例中所用的药材原料、试剂材料等,如无特殊说明,均为市售购买产品。
本发明的目的是从疾病和药物干预的生物分子网络中识别出关键模块 和药理驱动子,从而为指导疾病治疗和药物研发提供依据。以下的实施例证 明了本发明方法的有效性和可行性。这些实施例是非限制性的,本发明的方 法还可以应用其他类型的网络。
实施例1关键模块的识别和验证
采用清开灵各组分干预脑缺血小鼠模型的蛋白质相互作用网络(图2; 参见张莹莹,清开灵多组分干预脑缺血模型蛋白质网络主要模块的识别与比 较[D],中国中医科学院,2014):
脑缺血模型组(Vehicle组)的蛋白质相互作用网络(图2a-1),由3750 个节点和9162条边组成;
黄芩苷组(BA组)的蛋白质相互作用网络(图2b-1),为药物黄芩苷干 预脑缺血模型后的蛋白质相互作用网络,由2813个节点和6217条边组成;
栀子苷组(JA组)的蛋白质相互作用网络(图2c-1),为药物栀子苷干 预脑缺血模型后的蛋白质相互作用网络,由3416个节点和7581条边组成。
关键网络与药理驱动子的识别过程如下。步骤1,采用MCODE方法对 各个网络进行模块识别,结果如图3所示,其中由脑缺血模型组的蛋白质相 互作用网络识别的模块见图3a,由黄芩苷组的蛋白质相互作用网络识别的模 块见图3b,由栀子苷组的蛋白质相互作用网络识别的模块见图3c。
步骤2,基于模块之间的组件相关性,构建加权的模块相互作用网络,结果如图4所示,其中脑缺血模型组的加权的模块相互作用网络见图4a,黄芩苷组的加权的模块相互作用网络见图4b,栀子苷组的加权的模块相互作用 网络见图4c。
步骤3,从多种度量节点重要性的方法中选用节点强度、介数中心性和 页面等级3种度量方法识别关键模块,其中所述关键模块满足以下条件才确 定为关键模块:根据所述度量节点重要性的方法进行计算,得到的数值按降 序排列(A)在一种方法中排名第一,(B)在另外几种方法中排名位于前三。
结果发现各组中每种方法排名第一的均在其他方法中位于前三,具体结 果见下表2-4。各表中第一列代表计算得到的数值在各方法中的排名,每行 中括号前面的数字代表模块的号码,括号内的数值为此模块在该种方法下计 算的得分。除节点强度外,其余两种结果均四舍五入,保留小数点后3位数, 各方法的结果按照得分从高到低的顺序排列,最后一列标出识别出的关键模 块。
表2:模型组加权模块网络中关键模块识别结果
表3:黄芩苷组加权模块网络中关键模块识别结果
表4:栀子苷组加权模块网络中关键模块识别结果
各组识别出的关键模块图见图5中的图5a、5b、5c。
对于从脑缺血模型及清开灵组分黄芩苷、栀子苷组识别出来的关键模 块,为验证其对网络的重要性,分别将各个模块从各组网络中删除,观察删 除前后网络特征路径长度的变化,结果如图6所示。
如图6所示,从网络中分别删除各个模块前后网络特征路径长度的变化 看,在删除各个关键模块后对网络特征路径长度的影响最大,且大于删除各 个模块后对网络特征路径长度变化的平均值,与上文对各组的识别结果相一 致。
实施例2关键模块的识别和验证
对实施例1中的三种蛋白质相互作用网络(Vehicle组、BA组、JA组), 在步骤2中构建不加权的模块相互作用网络,进行关键网络与药理驱动子的 识别。
过程如下。
步骤1,采用MCODE方法对各个网络进行模块识别。
步骤2,基于模块之间的组件相关性,构建不加权的模块相互作用网络。
步骤3,从多种度量节点重要性的方法中选用度中心性、介数中心性和 页面等级3种度量方法识别关键模块,其中所述关键模块满足以下条件才确 定为关键模块:根据所述度量节点重要性的方法进行计算,得到的数值按降 序排列(A)在一种方法中排名第一,(B)在另外几种方法中排名位于前三。
结果发现各组中每种方法排名第一的均在其他方法中位于前三,具体结 果见下表5-7。各表中第一列代表计算得到的数值在各方法中的排名,每行 中括号前面的数字代表模块的号码,括号内的数值为此模块在该种方法下计 算的得分。除节点强度外,其余两种结果均四舍五入,保留小数点后3位数, 各方法的结果按照得分从高到低的顺序排列,最后一列标出识别出的关键模 块。
表5:模型组不加权模块网络中关键模块识别结果
表6:黄芩苷组不加权模块网络中关键模块识别结果
表7:栀子苷组不加权模块网络中关键模块识别结果
由结果可知,各组的关键模块识别结果均与实施例1识别结果相同。
实施例3关键节点即药理驱动子的识别和验证
分别采用实施例1中识别的栀子苷组蛋白质相互作用网络的关键模块 MJA-1,选用度中心性、介数中心性和页面等级3种度量方法识别这个关键模 块中的关键节点即药理驱动子,其中所述关键节点满足以下条件才确定为关 键节点:根据所述度量节点重要性的方法进行计算,得到的数值按降序排列 (A)在一种方法中排名第一,(B)在另外几种方法中排名位于前三。
对栀子苷组蛋白质相互作用网络中关键模块MJA-1的识别发现,三种方 法的首要结果保持一致,均为Il6,见表8。
表8:栀子苷组关键模块MJA-1中关键节点识别结果
采用另外三种方法组合筛选关键节点,这三种方法的首要结果也保持一 致,均为Il6,见表9,说明只要采用任何三种方法,都得到相同结果。
表9:栀子苷组关键模块MJA-1中关键节点识别结果
为验证识别的关键节点对网络模块的重要性,分别将模块中各个节点分 别从模块中删除,观察删除前后模块特征路径长度的变化,结果如图7所示。
从图中可见从模块中分别删除各个节点前后模块特征路径长度的变化 看,在删除关键节点Il6后对模块特征路径长度的影响最大,且大于删除各 个节点后对模块特征路径长度变化的平均值,与上文对该模块的识别结果相 一致。
通过查阅文献,可知Il6是脑缺血的生物学标记物(biomarker),且Il6 位于Graft-versus-host disease、Hematopoietic cell lineage信号通路的上游位 置,对于疾病及其治疗有重要的意义。
通过上述实施例可知,本发明针对蛋白质相互作用网络采用3种度量重 要节点的方法进行关键模块的识别,疾病模型组和各药物干预组中每种方法 排名第一的均在其他方法中位于前三;采用6种度量重要节点的方法进行药 理驱动子的识别,多方法多角度评价重要节点结果保持一致,这些结果说明 识别关键模块和药理驱动子的思路和方法具有有效性和可行性。
虽然本发明仅针对脑缺血模型组与药物干预组的蛋白质相互作用网络 进行了示例,且采取了特定的重要性度量方法,但是对于其他类型的网络, 也采用其他重要节点的度量方法,依然可以有效地挖掘出复杂网络中的关键 模块或模块中药物干预后网络中的药理驱动子。特别是药理驱动子的识别不 仅限定于关键模块中,其可分为主要驱动子和次要驱动子,存在于关键模块 和/或非关键模块中,同样可揭示网络中各模块、各节点的相互作用关系,为 指导疾病治疗和药物研发提供科学依据。
以上对本发明具体实施方式的描述并不限制本发明,本领域技术人员可 以根据本发明作出各种改变或变形,只要不脱离本发明的精神,均应属于本 发明所附权利要求的范围。

Claims (2)

1.一种识别网络中关键节点的方法,所述方法包括以下步骤:
(1)以节点数目≥3为标准,对生物分子网络进行模块识别,所述生物分子网络为疾病相关的蛋白质相互作用网络,由≥2000个节点和≥6000条边组成;
(2)对于经步骤(1)识别的模块,基于模块之间的组件相关性构建加权或不加权的模块相互作用网络;
(3)对于经步骤(2)构建的加权或不加权的模块相互作用网络,采用至少3种度量节点重要性的方法识别关键模块,其中所述关键模块满足以下条件:根据所述度量节点重要性的方法进行计算,得到的数值按降序排列(A)在至少一种所述度量节点重要性的方法中排名第一;和(B)在所有所述度量节点重要性的方法中排名前三之一,所述度量节点重要性的方法选自:度中心性方法、邻近中心性方法、特征向量中心性方法、介数中心性方法、子图中心性方法、枢纽中心性方法、控制中心性方法、节点强度方法、应力中心性方法、页面等级方法和邻接矩阵谱方法;
(4)对于经步骤(3)识别的关键模块,采用至少3种度量节点重要性的方法识别所述关键模块中的关键节点,其中所述关键节点满足以下条件:根据所述度量节点重要性的方法进行计算,得到的数值按降序排列(A)在至少一种所述度量节点重要性的方法中排名第一;和(B)在所有所述度量节点重要性的方法中排名前三之一,所述度量节点重要性的方法选自:度中心性方法、邻近中心性方法、特征向量中心性方法、介数中心性方法、子图中心性方法、枢纽中心性方法、控制中心性方法、节点强度方法、应力中心性方法、页面等级方法和邻接矩阵谱方法。
2.根据权利要求1所述的方法,其特征在于,所述生物分子网络为疾病相关的经药物干预之前或之后的蛋白质相互作用网络。
CN201610269466.0A 2016-04-27 2016-04-27 识别生物分子网络中关键模块或关键节点的方法 Active CN105956413B (zh)

Priority Applications (3)

Application Number Priority Date Filing Date Title
CN201610269466.0A CN105956413B (zh) 2016-04-27 2016-04-27 识别生物分子网络中关键模块或关键节点的方法
PCT/CN2017/071209 WO2017185834A1 (zh) 2016-04-27 2017-01-16 识别生物分子网络中关键模块或关键节点的方法
US16/096,276 US20190139621A1 (en) 2016-04-27 2017-01-16 Method for identifying key module or key node in biomolecular network

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201610269466.0A CN105956413B (zh) 2016-04-27 2016-04-27 识别生物分子网络中关键模块或关键节点的方法

Publications (2)

Publication Number Publication Date
CN105956413A CN105956413A (zh) 2016-09-21
CN105956413B true CN105956413B (zh) 2019-08-06

Family

ID=56916857

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201610269466.0A Active CN105956413B (zh) 2016-04-27 2016-04-27 识别生物分子网络中关键模块或关键节点的方法

Country Status (3)

Country Link
US (1) US20190139621A1 (zh)
CN (1) CN105956413B (zh)
WO (1) WO2017185834A1 (zh)

Families Citing this family (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105956413B (zh) * 2016-04-27 2019-08-06 王�忠 识别生物分子网络中关键模块或关键节点的方法
CN106709231B (zh) * 2016-10-19 2019-03-26 王�忠 评价生物分子网络中药物对模块间关系的影响的方法
CN108804871B (zh) * 2017-05-02 2021-06-25 中南大学 基于最大邻居子网的关键蛋白质识别方法
CN107292126B (zh) * 2017-05-04 2019-12-24 浙江大学 一种中药对复杂性疾病所致“失和”网络整合调节作用的定量评价方法
CN107423555B (zh) * 2017-06-09 2020-06-30 王�忠 一种探索药物新适应症的方法
WO2020150228A1 (en) * 2019-01-15 2020-07-23 Youngblood Ip Holdings, Llc Health data exchange platform
CN109920473B (zh) * 2019-04-02 2021-02-12 中国科学院城市环境研究所 一种代谢组学标志物权重分析通用方法
CN110504004B (zh) * 2019-06-28 2022-02-22 西安理工大学 一种基于复杂网络结构可控性基因的识别方法
CN110706740B (zh) * 2019-09-29 2022-03-22 长沙理工大学 基于模块分解的蛋白质功能预测的方法、装置、设备
CN110957002B (zh) * 2019-12-17 2023-04-28 电子科技大学 一种基于协同矩阵分解的药物靶点相互作用关系预测方法
CN111370060A (zh) * 2020-03-21 2020-07-03 广西大学 一种蛋白质互作网络共定位共表达复合物识别系统及方法
CN111667881B (zh) * 2020-06-04 2023-06-06 大连民族大学 一种基于多网络拓扑结构的蛋白质功能预测方法
CN111784206B (zh) * 2020-07-29 2021-03-19 南昌航空大学 采用LeaderRank算法评估社交网络关键节点的方法
CN112071362B (zh) * 2020-08-03 2024-04-09 西安理工大学 一种融合全局和局部拓扑结构的蛋白质复合体的检测方法

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102841985A (zh) * 2012-08-09 2012-12-26 中南大学 一种基于结构域特征的关键蛋白质识别方法
CN103559426A (zh) * 2013-11-06 2014-02-05 北京工业大学 一种针对多视图数据融合的蛋白质功能模块挖掘方法
CN103778349A (zh) * 2014-01-29 2014-05-07 思博奥科生物信息科技(北京)有限公司 一种基于功能模块的生物分子网络分析的方法
CN105160206A (zh) * 2015-10-08 2015-12-16 中国科学院数学与系统科学研究院 一种预测药物的蛋白质相互作用靶点的方法和系统
CN105279397A (zh) * 2015-10-26 2016-01-27 华东交通大学 一种识别蛋白质相互作用网络中关键蛋白质的方法

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7869960B2 (en) * 2005-12-08 2011-01-11 Electronics And Telecommunications Research Institute Method and apparatus for detecting bio-complexes using rule-based templates
KR101252649B1 (ko) * 2011-02-01 2013-04-09 충북대학교 산학협력단 암 관련 단백질 도메인을 발굴하는 방법
CN105117617B (zh) * 2015-08-26 2017-10-24 大连海事大学 一种用于筛选环境敏感性生物分子的方法
CN105956413B (zh) * 2016-04-27 2019-08-06 王�忠 识别生物分子网络中关键模块或关键节点的方法

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102841985A (zh) * 2012-08-09 2012-12-26 中南大学 一种基于结构域特征的关键蛋白质识别方法
CN103559426A (zh) * 2013-11-06 2014-02-05 北京工业大学 一种针对多视图数据融合的蛋白质功能模块挖掘方法
CN103778349A (zh) * 2014-01-29 2014-05-07 思博奥科生物信息科技(北京)有限公司 一种基于功能模块的生物分子网络分析的方法
CN105160206A (zh) * 2015-10-08 2015-12-16 中国科学院数学与系统科学研究院 一种预测药物的蛋白质相互作用靶点的方法和系统
CN105279397A (zh) * 2015-10-26 2016-01-27 华东交通大学 一种识别蛋白质相互作用网络中关键蛋白质的方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
基于最短路径的关键蛋白质识别研究;嘉泽宁 等;《广西大学学报:自然科学版》;20111030;第36卷(第5期);第764-769页
清开灵多组分干预脑缺血模型蛋白质网络主要模块的识别与比较;张莹莹;《中国博士学位论文全文数据库医药卫生科技辑》;20150715;第2-109页

Also Published As

Publication number Publication date
CN105956413A (zh) 2016-09-21
WO2017185834A1 (zh) 2017-11-02
US20190139621A1 (en) 2019-05-09

Similar Documents

Publication Publication Date Title
CN105956413B (zh) 识别生物分子网络中关键模块或关键节点的方法
Ma et al. LGIEM: Global and local node influence based community detection
Alpaslan et al. Galaxy And Mass Assembly (GAMA): the large-scale structure of galaxies and comparison to mock universes
Chen et al. Detecting overlapping communities of weighted networks via a local algorithm
Liu et al. Detecting community structure in complex networks using simulated annealing with k-means algorithms
McKenzie et al. Distributions of cherries for two models of trees
Cui et al. Uncovering overlapping community structures by the key bi-community and intimate degree in bipartite networks
Sun et al. A fast community detection method in bipartite networks by distance dynamics
Palla et al. Fundamental statistical features and self-similar properties of tagged networks
DeFord et al. Spectral clustering methods for multiplex networks
Mangioni et al. Multilayer flows in molecular networks identify biological modules in the human proteome
Shi et al. A new genetic algorithm for community detection
Liebig et al. Identifying influential nodes in bipartite networks using the clustering coefficient
Hu et al. A new algorithm CNM-Centrality of detecting communities based on node centrality
Cooper et al. Role-based similarity in directed networks
Kamruzzaman et al. Hyppo-X: A scalable exploratory framework for analyzing complex phenomics data
Nguyen et al. A quantitative approach to study indirect effects among disease proteins in the human protein interaction network
Barrat et al. Traffic-driven model of the World Wide Web graph
CN106471509A (zh) 用于组装来自一个或多个生物体的染色体段的方法、设备和计算机程序
Peng et al. An improved label propagation algorithm using average node energy in complex networks
Dickson Whose genes are they anyway?
Maher et al. The unrooted set covering connected subgraph problem differentiating between HIV envelope sequences
Palla et al. k-clique Percolation and Clustering
Zhang et al. Detecting communities in clustered networks based on group action on set
Zhang et al. Guiding propagation to localized target nodes in complex networks

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant