CN111785333A - 基于生物学网络数据的药物作用靶点筛选方法、装置、电子设备及存储介质 - Google Patents

基于生物学网络数据的药物作用靶点筛选方法、装置、电子设备及存储介质 Download PDF

Info

Publication number
CN111785333A
CN111785333A CN202010429918.3A CN202010429918A CN111785333A CN 111785333 A CN111785333 A CN 111785333A CN 202010429918 A CN202010429918 A CN 202010429918A CN 111785333 A CN111785333 A CN 111785333A
Authority
CN
China
Prior art keywords
network data
biological
biological network
database
node
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202010429918.3A
Other languages
English (en)
Other versions
CN111785333B (zh
Inventor
王湘
赵洪磊
王莹莹
王丽丽
章慧洁
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shenzhen Peoples Hospital
Original Assignee
Individual
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Individual filed Critical Individual
Publication of CN111785333A publication Critical patent/CN111785333A/zh
Application granted granted Critical
Publication of CN111785333B publication Critical patent/CN111785333B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16CCOMPUTATIONAL CHEMISTRY; CHEMOINFORMATICS; COMPUTATIONAL MATERIALS SCIENCE
    • G16C20/00Chemoinformatics, i.e. ICT specially adapted for the handling of physicochemical or structural data of chemical particles, elements, compounds or mixtures
    • G16C20/50Molecular design, e.g. of drugs
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B5/00ICT specially adapted for modelling or simulations in systems biology, e.g. gene-regulatory networks, protein interaction networks or metabolic networks

Landscapes

  • Engineering & Computer Science (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Physics & Mathematics (AREA)
  • General Health & Medical Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Theoretical Computer Science (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Biophysics (AREA)
  • Evolutionary Biology (AREA)
  • Medical Informatics (AREA)
  • Biotechnology (AREA)
  • Physiology (AREA)
  • Molecular Biology (AREA)
  • Medicinal Chemistry (AREA)
  • Pharmacology & Pharmacy (AREA)
  • Crystallography & Structural Chemistry (AREA)
  • Computing Systems (AREA)
  • Apparatus Associated With Microorganisms And Enzymes (AREA)

Abstract

本发明涉及基于生物学网络数据的药物作用靶点筛选方法、装置、电子设备及存储介质包括:得到复杂疾病对应的多种基础疾病和/或症状并检索获取多个第一生物基因集合,进行并集运算以得到复杂疾病对应的第二生物基因集合;建立若干背景生物网络数据集并根据第二生物基因集合获取复杂疾病的第一生物网络数据;基于预设药物获取对应的网络数据所对应的名称列表以获取预设药物的第三生物网络数据;获取第一、第三生物网络数据的网络节点的对应关系,并根据获取的有向性生物网络对第一、第三生物网络数据的交集建立对应的复合网络;获取复合网络中满足条件的节点作为预设药物的药物作用靶点。实施本发明能够提高药物作用靶点确定的准确性。

Description

基于生物学网络数据的药物作用靶点筛选方法、装置、电子设 备及存储介质
技术领域
本发明涉及药物作用靶点的筛选技术领域,更具体地说,涉及一种基于生物学网络数据的药物作用靶点筛选方法、装置、电子设备及存储介质。
背景技术
复杂疾病的相关药物较多,且药物的候选靶基因多而繁杂,故合理有效的缩小范围是急需解决的重要问题。而从复杂疾病的发病机制作为切入点进行分析,则将起到事半功倍的效果。近年来多组学数据的大量涌现及分析技术的兴起,为该领域的发展带来了机遇与挑战。其中,转录组学层面的分析是后续蛋白质组学分析、代谢组学分析、宏基因组学分析的起点与基础,故在转录组学层面的有效分析,可以最大限度的减少后续分析的盲目性。而为实现这一目标,通过计算方法逐步缩小分析范围,在此基础上进行湿实验的验证,是目前最行之有效的方式。转录组学层面的数据类型、种类繁多,最常见的即为以生物学网络为代表的多种在线公开数据及以第一、二、三代测序技术产生的数据为代表的高通量数据。
现有的基于蛋白质网络的药物靶标确定方法或者或者以基因为研究对象进行分析的方法大都基于复杂疾病的某一特征或药物的某个分子通路进行作用靶点的筛选,结论过于片面。
发明内容
本发明要解决的技术问题在于,针对现有技术的上述部分技术缺陷,提供一种基于生物学网络数据的药物作用靶点筛选方法、装置、电子设备及存储介质。
本发明解决其技术问题所采用的技术方案是:构造一种基于生物学网络数据的药物作用靶点筛选方法,包括:
S1、基于某一复杂疾病进行初步筛选以得到其所对应的多种基础疾病和/或症状,检索第一数据库以获取与多种所述基础疾病和/或症状分别对应的多个第一生物基因集合;
S2、将多个所述第一生物基因集合进行并集运算,以得到所述复杂疾病对应的第二生物基因集合;
S3、根据第二数据库建立若干背景生物网络数据集,并将所述第二生物基因集合作为输入进行概率运算,以获取输出结果满足预设阈值的背景生物网络数据集作为所述复杂疾病对应的第一生物网络数据;
S4、基于所述复杂疾病获取对应的预设药物名称,并根据所述预设药物名称和所述基础疾病和/或症状设定第一检索关键词,根据所述第一检索关键词检索第三数据库以获取与所述预设药物名称和所述复杂疾病相对应的第二生物网络数据所对应的名称列表;
S5、将所述名称列表作为第二检索关键词检索所述第二数据库以获取与所述预设药物名称对应的第三生物网络数据;
S6、将所述第一生物网络数据和所述第三生物网络数据通过第四数据库映射,以获取所述第一生物网络数据和所述第三生物网络数据的网络节点的对应关系;
S7、将所述第二数据库进行网络有向性转换以获取对应的生物网络,根据所述第一生物网络数据和所述第三生物网络数据的对应关系获取所述第一生物网络数据和所述第三生物网络数据的交集,并根据所述生物网络构建对应的复合网络;
S8、获取所述复合网络的节点所对应的度,并获取满足第一预设条件的度所对应的第一节点,并将所述第一节点作为所述预设药物名称的药物作用靶点;或/和
获取所述复合网络的节点所对应的第一介数,并获取满足第二预设条件的第一介数所对应的第二节点,并将所述第二节点作为所述预设药物名称的药物作用靶点;或/和
获取所述复合网络的边所对应的第二介数,并获取满足第三预设条件的第二介数所对应的第三节点,并将所述第三节点作为所述预设药物名称的药物作用靶点。
优选地,
在所述步骤S1中,所述第一数据库包括GAD公开数据库和/或NCBI OMIM公开数据库;和/或
在所述步骤S3中,所述第二数据库包括KEGG通路数据库和/或BioCarta通路数据库;和/或
在所述步骤S4中,所述第三数据库为文献数据库NCBI Pubmed;和/或
在所述步骤S6中,所述第四数据库包括NCBI Gene数据库。
优选地,
在所述步骤S3中,所述概率运算包括利用单侧Fisher精确检验方法或超几何分布方法。
优选地,
在所述步骤S3中,所述预设阈值为小于或等于0.05。
优选地,
在所述步骤S7中,所述将所述第二数据库进行网络有向性转换,以获取对应的生物网络,包括:
基于R语言的软件包graphite对所述第二数据库进行网络有向性转换以获取所述生物网络。
优选地,
在所述步骤S8中,
所述获取满足第一预设条件的度所对应的第一节点包括:对所述度进行降序排列以获取其排序在3%以内的度所对应的节点为所述第一节点;和/或
所述获取满足第二预设条件的第一介数对应的第二节点包括:对所述第一介数进行降序排列以获取其排序在3%以内的第一介数所对应的节点为所述第二节点;和/或
所述获取满足第三预设条件的第二介数所对应的第三节点包括:对所述第二介数进行降序排列以获取其排序在3%以内的第二介数所对应的节点为所述第三节点。
本发明还构造一种基于生物学网络数据的药物作用靶点筛选装置,包括:
第一处理单元,用于基于某一复杂疾病中进行初步筛选以得到其所对应的多种基础疾病和/或症状,检索第一数据库以获取与所述多种基础疾病和/或症状分别对应的多个第一生物基因集合;
第二处理单元,用于将多个所述第一生物基因集合进行并集,以得到所述复杂疾病对应的第二生物基因集合;
第一获取单元,用于根据第二数据库建立若干背景生物网络数据集,并将所述第二生物基因集合作为输入进行概率运算,以获取输出结果满足预设阈值的背景生物网络数据集作为所述复杂疾病对应的第一生物网络数据;
第二获取单元,用于基于所述复杂疾病获取对应的预设药物名称,并根据所述预设药物名称和所述基础疾病和/或症状类别设定第一检索关键词,根据所述第一检索关键词检索第三数据库以获取与所述预设药物名称和所述基础疾病和/或症状类别相对应的第二生物网络数据所对应的名称列表;
第三获取单元,用于将所述名称列表作为第二检索关键词检索所述第二数据库以获取与所述预设药物名称对应的第三生物网络数据;
第三处理单元,用于将所述第一生物网络数据和所述第三生物网络数据通过第四数据库映射,以获取所述第一生物网络数据和所述第三生物网络数据的网络节点的对应关系;
第四处理单元,用于将所述第二数据库进行网络有向性转换,以获取对应的生物网络,根据所述第一生物网络数据和所述第三生物网络数据的对应关系获取所述第一生物网络数据和所述第三生物网络数据的交集,并根据所述生物网络构建对应的复合网络;以及
第一输出单元、第二输出单元和第三输出单元中的一个或多个;
所述第一输出单元用于获取所述复合网络的节点所对应的度,并获取满足第一预设条件的度所对应的第一节点,并将所述第一节点作为所述预设药物名称的药物作用靶点;
所述第二输出单元用于获取所述复合网络的节点所对应的第一介数,并获取满足第二预设条件的第一介数所对应的第二节点,并将所述第二节点作为所述预设药物名称的药物作用靶点;
所述第三输出单元用于获取所述复合网络的边所对应的第二介数,并获取满足第三预设条件的第二介数所对应的第三节点,并将所述第三节点作为所述预设药物名称的药物作用靶点。
本发明还构造一种计算机存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现如上面任意一项所述的基于生物学网络数据的药物作用靶点筛选方法。
本发明还构造一种电子设备,包括存储器和处理器;
所述存储器用于存储计算机程序;
所述处理器用于执行所述计算机程序实现如上面任一项所述的基于生物学网络数据的药物作用靶点筛选方法。
实施本发明的基于生物学网络数据的药物作用靶点筛选方法、装置、电子设备及存储介质,具有以下有益效果:利用生物网路数据中所反映出的分子之间的生物学关联,从而设计系统的方法以筛选复杂疾病相关的药物作用靶点,提高药物作用靶点确定的准确性。
附图说明
下面将结合附图及实施例对本发明作进一步说明,附图中:
图1是本发明一种基于生物学网络数据的药物作用靶点筛选方法的程序流程图;
图2是本发明一种基于生物学网络数据的药物作用靶点筛选装置的逻辑框图。
具体实施方式
为了对本发明的技术特征、目的和效果有更加清楚的理解,现对照附图详细说明本发明的具体实施方式。
如图1所示,在本发明的基于生物学网络数据的药物作用靶点筛选方法第一实施例中,包括:
S1、基于某一复杂疾病进行初步筛选以得到其所对应的多种基础疾病和/或症状,检索第一数据库以获取与多种所述基础疾病和/或症状分别对应的多个第一生物基因集合;具体的,复杂疾病通常是指包含多种疾病表象,不符合孟德尔定律的疾病,其不能笼统的归为某一类确切的疾病,可以对其进行分解或者筛选,根据其表象得到其包含的基础疾病和/或症状,例如可以对一个代谢系统疾病进行初步的筛选,可以得到该复杂疾病的基础疾病和/或症状包含糖尿病和冠心病。根据得到的多种基础疾病和/或症状,通过检索第一数据库获取与该多种基础疾病和/或症状分别对应的多个第一生物基因集合,即可以理解,每一个基础疾病和/或症状均有对应的第一生物基因集合,第一数据库的选取可以根据经验进行选择,其可以包含多个不同的数据库。以通过从不同的数据库中获取与该基础疾病和/或症状不同的生物基因以得到该基础疾病和/或症状对应的第一生物基因集合。可以理解,复杂疾病能够确定的基础疾病和/或症状越多越详细或者越准确,其得到的对应的第一生物基因集合的也越多,对复杂疾病在用药过程中,药物靶点的确认的准确性越高。
S2、将多个所述第一生物基因集合进行并集运算,以得到所述复杂疾病对应的第二生物基因集合;具体的,将上述得到多个第一生物基因集合进行并集运算以得个一个大的集合,即第二生物基因集合,可以理解该第二生物基因集合即对应了该复杂疾病。
S3、根据第二数据库建立若干背景生物网络数据集,并将所述第二生物基因集合作为输入进行概率运算,以获取输出结果满足预设阈值的背景生物网络数据集作为所述复杂疾病对应的第一生物网络数据;具体的,选取用于功能分析的背景生物网络数据集,根据第二生物基因集合进行计算,以筛选出满足要求的背景生物网络数据集作为复杂疾病对应的第一生物网路数据。在背景生物网络数据集的选择过程中,其可以基于现有的通路数据库即第二数据库。其具体的获取第一生物网路数据的过程为,将第二生物基因集合作为背景生物网络数据集的输入进行概率运算,获取对应的输出结果,并将输出结果满足阈值的背景生物网络数据集作为复杂疾病对应的第一生物网络数据。
S4、基于所述复杂疾病获取对应的预设药物名称,并根据所述预设药物名称和所述基础疾病和/或症状设定第一检索关键词,根据所述第一检索关键词检索第三数据库以获取与所述预设药物名称和所述复杂疾病相对应的第二生物网络数据所对应的名称列表;具体的,获取针对复杂疾病确定的用药的药物名称,即需要确认药物作用靶点的药物,也为预设药物的名称,根据该要药物名称和该复杂疾病包含的基础疾病和/或症状设定第一检索关键词,在第三数据库进行进行检索,筛选得到该药物与该复杂疾病可能相关的生物网络数据即第二生物网络数据所对应的名称列表。
S5、将所述名称列表作为第二检索关键词检索所述第二数据库以获取与所述预设药物名称对应的第三生物网络数据;具体的,将上面获取的名称列表作为检索关键词基于第二数据库进行检索,以获取与该预设药物成对应的第三生物网络数据。
S6、将所述第一生物网络数据和所述第三生物网络数据通过第四数据库映射,以获取所述第一生物网络数据和所述第三生物网络数据的网络节点的对应关系;具体的,在得到与复杂疾病对应的第一生物网路数据和与预设药物对应的第三生物网路数据后,由于第一生物网络数据和第三生物网络数据的网络结构可能存在差异,例如,生物网络数据的节点的命名规则不同,其需要获取第一生物网络数据和第三生物网络数据的一一对应关系,以便同时对第一生物网络数据和第三生物网络数据进行对应处理。该对应关系的获取可以通过将第一生物网络数据和第三生物网络数据通过第四数据库映射,通过数据库之前的交叉映射,获取第一生物网络数据和第三生物网络数据之间不同的ID之间的对应关系,从而是不同的来源的第一生物网络数据和第三生物网络数据具有可比性。
S7、将所述第二数据库进行网络有向性转换以获取对应的生物网络,根据所述第一生物网络数据和所述第三生物网络数据的对应关系获取所述第一生物网络数据和所述第三生物网络数据的交集,并根据所述生物网络构建对应的复合网络;具体的,获取第一生物网络数据和第三生物网络数据的对应关系,并不能将该两个网络数据作为统一的输入输出进行运算,因此需要基于该第一生物网络数据和第三生物网络数据构建复合网络,其具体过程是,基于第二数据库进行网络有向性转换获取对应的生物网络,对应部分通路数据,以生物学规则与金标准(如蛋白复合物、基因家族等)为条件,通过合并、删除等方法,实现了从复杂通路图谱到网络的转换。而针对蛋白质-蛋白质互作网络,则需要删除与自身互作的信息,并将无向图设定为双向图。然后根据第一生物网络数据和第三生物网络数据的对应关系获取他们的交集得到新的集合,称为“共享候选网络”。即将通路集合中所有的基因取并集,保留其在各自通路之间的互作关系,从而构建一个新的复合网络。基于复合网络的构建,缩小分析对象的范围,得到复杂疾病相关药物的作用靶点预测评分。能够实现从分子层面发现复杂疾病的相关药物作用靶点预测,为复杂疾病的药物作用效果等方面提供参考。
S8、获取所述复合网络的节点所对应的度,并获取满足第一预设条件的度所对应的第一节点,并将所述第一节点作为所述预设药物名称的药物作用靶点;或/和
获取所述复合网络的节点所对应的第一介数,并获取满足第二预设条件的第一介数所对应的第二节点,并将所述第二节点作为所述预设药物名称的药物作用靶点;或/和
获取所述复合网络的边所对应的第二介数,并获取满足第三预设条件的第二介数所对应的第三节点,并将所述第三节点作为所述预设药物名称的药物作用靶点。
具体的,在得到上述的复合网络后,即可以根据该复合弯路来分析药物的作用靶点,其可以获取复合网络中每个节点进行计算获取其对应的度,即与每个节点相连的节点的数目。并获取其中满足第一预设条件的度所对应的第一节点,将该第一节点作为预设药物对应的药物作用靶点。在一实例中,还可以基于上述得到的复合网络,计算每个节点对应的介数即第一介数,也即每个节点所在路径中最短路径的数目。并获取其中满足第二预设条件的介数对应的第二节点,将第二节点做作为预设药物对应的药物作用靶点,还有一实施例中,可以基于上述得到的复合网络,计算该复合网路中的每条边的介数,即每条边所在的路径中最短路径的数目。并获取其中满足第三预设条件的介数对应的第三节点,将第三节点作为所述预设药物的药物作用靶点。可以理解,上面的确定过程均执行以保证确定结果的准确性。整个过程通过充分利用生物网路数据中所反映出的分子之间的生物学关联,从而设计系统的方法以筛选复杂疾病相关的药物作用靶点。其在处理过程中,利用计算机软件将其转换为通用的网络输入形式,再进行后续的网络拓扑性质分析,保证了计算的结果的可靠性。
可选的,在所述步骤S1中,所述第一数据库包括GAD公开数据库和/或NCBI OMIM公开数据库;具体的,对各种基础疾病和/或症状相关的基因的获取可以通过检索包括GAD、NCBI OMIM等若干公开数据库,也理解为公开文献库。
可选的,在所述步骤S3中,所述第二数据库包括KEGG通路数据库和/或BioCarta通路数据库;具体的,可以选取诸如KEGG、BioCarta通路数据库在内的若干通路数据库作为功能分析的背景生物网络数据集。还可以利用诸如KEGG、BioCarta等通路数据库,利用名称列表作为检索的关键词,得到复杂疾病相关药物的生物网络数据
可选的,在所述步骤S4中,所述第三数据库为文献数据库NCBI Pubmed;具体的,可以理解,可以通过检索NCBI Pubmed等文献数据库,筛选得到预设药物与该复杂疾病可能相关的生物网络数据名称列表。
在所述步骤S6中,所述第四数据库包括NCBI Gene数据库。具体的,可以NCBI Gene等数据库,通过数据库之间的交叉映射,获取不同的ID之间的对应关系,从而使不同来源的网络数据间具有可比性。
可选的,在所述步骤S3中,在一实施例中,所述概率运算包括利用单侧Fisher精确检验方法或超几何分布方法;具体的,可以以该复杂疾病相关的基因集合即第二生物基因集合作为输入列表,利用单侧Fisher精确检验,并设定概率运算的阈值,选取阈值满足要求的个生物网络数据集作为复杂疾病生物网络数据。在一实施例中,该概率运算的阈值可以设置的小于或等于0.05。
可选的,在所述步骤S7中,所述将所述第二数据库进行网络有向性转换,以获取对应的生物网络,包括:基于R语言的软件包graphite对所述第二数据库进行网络有向性转换以获取所述生物网络。具体的,可以通过具体的软件实现方式实现生物通路到有向图的转换。其常用的包括基于R语言的软件包graphite。
可选的,在所述步骤S8中,所述获取满足第一预设条件的度所对应的第一节点包括:对所述度进行降序排列以获取其排序在3%以内的度所对应的节点为所述第一节点;具体的,其在获取满足第一预设条件的度所对应的第一节点的过程,可以对获取的所有的度进行降序排列,获取其排序在前3%以内的度所对应的第一节点。
可选的,在所述步骤S8中,所述获取满足第二预设条件的第一介数对应的第二节点包括:对所述第一介数进行降序排列以获取其排序在3%以内的第一介数所对应的节点为所述第二节点;具体的,其在获取满足第二预设条件的度所对应的第二节点的过程,可以对获取的所有的介数进行降序排列,获取其排序在前3%以内的第一介数所对应的节点为第三节点。
可选的,在所述步骤S8中,所述获取满足第三预设条件的第二介数所对应的第三节点包括:对所述第二介数进行降序排列以获取其排序在3%以内的第二介数所对应的节点为所述第三节点。具体的,其在获取满足第三预设条件的介数所对应的第二节点的过程,可以对获取的所有的第二介数进行降序排列,获取其排序在前3%以内的第二介数所对应的节点为第三节点。
可以理解,可以同时获取满足上述条件的第一节点、第二节点和第三节点,作为药物的作用靶点。也可以分别获取该第一节点、第二节点和第三节点作为药物的作用靶点。
一个具体实施例中,其具体的过程如下,
A、先建立复杂疾病对应的生物网络数据,其具体为:对一复杂疾病初步分析,可以获取其可能包含糖尿病和冠心病,然后基于基于GAD及NCBI OMIM等若干公开数据库进行筛选得到以糖尿病为代表的代谢类疾病,以及以冠心病为代表的心血管类疾病分别对应的多个基因集合,将该多个基因集合进行并集,可以得到包含4865个相关基因的集合,该集合即可以理解为该复杂疾病对应的基因集。选取KEGG及BioCarta等通路数据库作为功能分析的背景生物网络数据集。以该复杂疾病对应的基因集合作为输入列表,利用单侧Fisher精确检验,设定阈值为0.05,选取该精确检验p值不超过0.05的179个生物网络数据集作为复杂疾病生物网络数据。
B、然后建立根据复杂疾病选定的药物的生物网络数据,其具体为:选择关键词cinnamon/cinnamaldehyde以及heart,metabolic在NCBI Pubmed等通路数据库进行检索,筛选得到了肉桂醛与心血管疾病及代谢类疾病相关的32个生物网络数据相关的名称列表;选取KEGG及BioCarta等通路数据库,利用上一步得到的列表作为检索的关键词,得到27条复杂疾病相关药物的生物网络数据。
C、将上述得到的复杂疾病对应的生物网络数据和药物的生物网络数据进行转化形成共同生物网络数据,其具体过程为:选择NCBI Gene等数据库,通过数据库之间的交叉映射,获取不同的ID之间的对应关系,实现不同的数据库之间的网络节点ID的统一,同时,通过基于R软件包‘graphite’等实现了通路图谱网络化,将各个数据库形成网络有向性的统一,然后基于统一节点和有向性的通路图谱网络,将上面获取的复杂疾病对应的生物网络数据和药物的生物网络数据进行合并,依次可以得到共有12条共享的通路,并据此构建了包含335个节点、1793条边的复合网络。
D、基于得到的复合网络,即可以分析药物靶点,其具体过程为,D1、依据节点的度进行降序排列,得到的前3%的节点如下,基因用NCBI Gene Symbol标识,括号内的数字为节点的度:IRS1(35)、MAOA(34)、MAOB(34)、AMPK1(33)、AMPK2(33)、PRKAB1(33)、PRKAB2(33)、PRKAG1(33)、PRKAG2(33)、PRKAG3(33)。D2、依据节点的介数进行降序排列,得到的前3%的节点如下,基因用NCBI Gene Symbol标识,括号内的数字为节点的介数:IRS1(1)、OGT(0.853672)、AKT2(0.846933)、INS(0.718213)、AKT1(0.697508)、RAPGEF4(0.638066)、INSR(0.473895)、PDE3B(0.453379)、PTPA(0.400936)、GNAS(0.396772)。D3、依据边的介数进行降序排列,得到的前3%的节点如下,基因用NCBI Gene Symbol标识,括号内的数字为边的介数:PTPA-AKT2(0.420936)、IRS1-IGF1R(0.289674)、PPARGC1A-OGT(0.289639)、AKT1-E2F1(0.264341)、IGF1R-RAF1(0.224958)、AKT2-PDE3B(0.223246)、OGT-AKT1(0.217352)、E2F1-IL2RA(0.217041)、PRKCE-INSR(0.201407)、NOS3-IRS1(0.200897)。
E、通过分子生物学实验对上述的结果进行实验验证,实验结果表明,AKT1、AKT2、IL2RA、INS1的表达在各组间没有显著差异(p>0.05,p用来表示统计学上的差异程度);与野生小鼠给溶剂对照组相比,野生型小鼠给肉桂醛处理可以提高AMPK基因的表达(p<0.05),两组糖尿病小鼠之间没有统计学差异(p>0.05),两组肉桂醛处理组之间也没有统计学差异(p>0.05);与野生型小鼠给溶剂对照相比,糖尿病小鼠给溶剂对照可以提高IGF1R和IRS1基因的表达(p<0.05,p<0.01),两肉桂醛处理组之间没有统计学差异(p>0.05),两糖尿病小鼠组之间没有统计学差异(p>0.05);与野生小鼠给溶剂对照组相比,野生型小鼠给肉桂醛处理可以提高E2F1基因的表达(p<0.05),与野生型小鼠给肉桂醛处理相比,糖尿病小鼠给肉桂醛处理可以提供E2F1基因的表达(p<0.05),给两组糖尿病小鼠之间没有统计学差异(p>0.05);与溶剂对照处理糖尿病小鼠相比,肉桂醛处理糖尿病小鼠可以提高eNOS的表达(p<0.05),两组野生型小鼠之间没有统计学差异(p>0.05),两溶剂组之间也没有统计学差异(p>0.05)。
另,如图2所示,本发明的一种基于生物学网络数据的药物作用靶点筛选装置,包括:
第一处理单元111,用于基于某一复杂疾病中进行初步筛选以得到其所对应的多种基础疾病和/或症状,检索第一数据库以获取与所述多种基础疾病和/或症状分别对应的多个第一生物基因集合;
第二处理单元1121,用于将多个所述第一生物基因集合进行并集,以得到所述复杂疾病对应的第二生物基因集合;
第一获取单元121,用于根据第二数据库建立若干背景生物网络数据集,并将所述第二生物基因集合作为输入进行概率运算,以获取输出结果满足预设阈值的背景生物网络数据集作为所述复杂疾病对应的第一生物网络数据;
第二获取单元122,用于基于所述复杂疾病获取对应的预设药物名称,并根据所述预设药物名称和所述基础疾病和/或症状类别设定第一检索关键词,根据所述第一检索关键词检索第三数据库以获取与所述预设药物名称和所述基础疾病和/或症状类别相对应的第二生物网络数据所对应的名称列表;
第三获取单元123,用于将所述名称列表作为第二检索关键词检索所述第二数据库以获取与所述预设药物名称对应的第三生物网络数据;
第三处理单元113,用于将所述第一生物网络数据和所述第三生物网络数据通过第四数据库映射,以获取所述第一生物网络数据和所述第三生物网络数据的网络节点的对应关系;
第四处理单元114,用于将所述第二数据库进行网络有向性转换,以获取对应的生物网络,根据所述第一生物网络数据和所述第三生物网络数据的对应关系获取所述第一生物网络数据和所述第三生物网络数据的交集,并根据所述生物网络构建对应的复合网络;以及
第一输出单元131、第二输出单元132和第三输出单元133中的一个或多个;
所述第一输出单元131用于获取所述复合网络的节点所对应的度,并获取满足第一预设条件的度所对应的第一节点,并将所述第一节点作为所述预设药物名称的药物作用靶点;
所述第二输出单元132用于获取所述复合网络的节点所对应的第一介数,并获取满足第二预设条件的第一介数所对应的第二节点,并将所述第二节点作为所述预设药物名称的药物作用靶点;
所述第三输出单元133用于获取所述复合网络的边所对应的第二介数,并获取满足第三预设条件的第二介数所对应的第三节点,并将所述第三节点作为所述预设药物名称的药物作用靶点。
具体的,这里的基于生物学网络数据的药物作用靶点筛选装置各单元之间具体的配合操作过程具体可以参照上述基于生物学网络数据的药物作用靶点筛选方法,这里不再赘述。
另,本发明的一种电子设备,包括存储器和处理器;存储器用于存储计算机程序;处理器用于执行计算机程序实现如上面任意的基于生物学网络数据的药物作用靶点筛选方法。具体的,根据本发明的实施例,上文参考流程图描述的过程可以被实现为计算机软件程序。例如,本发明的实施例包括一种计算机程序产品,其包括承载在计算机可读介质上的计算机程序,该计算机程序包含用于执行流程图所示的方法的程序代码。在这样的实施例中,该计算机程序可以通过电子设备下载和安装并且执行时,执行本发明实施例的方法中限定的上述功能。本发明中的电子设备可为笔记本、台式机、平板电脑、智能手机等终端,也可为服务器。
另,本发明的一种计算机存储介质,其上存储有计算机程序,计算机程序被处理器执行时实现上面任意一项的基于生物学网络数据的药物作用靶点筛选方法。具体的,需要说明的是,本发明上述的计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质或者是上述两者的任意组合。计算机可读存储介质例如可以是但不限于电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。计算机可读存储介质的更具体的例子可以包括但不限于:具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机访问存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑磁盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本发明中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。而在本发明中,计算机可读信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。计算机可读信号介质还可以是计算机可读存储介质以外的任何计算机可读介质,该计算机可读信号介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。计算机可读介质上包含的程序代码可以用任何适当的介质传输,包括但不限于:电线、光缆、RF(射频)等等,或者上述的任意合适的组合。
上述计算机可读介质可以是上述电子设备中所包含的;也可以是单独存在,而未装配入该电子设备中。
其中,在上文中出现的部分英文缩写对应表格参照下表,
Figure BDA0002500161590000151
Figure BDA0002500161590000161
可以理解的,以上实施例仅表达了本发明的优选实施方式,其描述较为具体和详细,但并不能因此而理解为对本发明专利范围的限制;应当指出的是,对于本领域的普通技术人员来说,在不脱离本发明构思的前提下,可以对上述技术特点进行自由组合,还可以做出若干变形和改进,这些都属于本发明的保护范围;因此,凡跟本发明权利要求范围所做的等同变换与修饰,均应属于本发明权利要求的涵盖范围。

Claims (9)

1.一种基于生物学网络数据的药物作用靶点筛选方法,其特征在于,包括:
S1、基于某一复杂疾病进行初步筛选以得到其所对应的多种基础疾病和/或症状,检索第一数据库以获取与多种所述基础疾病和/或症状分别对应的多个第一生物基因集合;
S2、将多个所述第一生物基因集合进行并集运算,以得到所述复杂疾病对应的第二生物基因集合;
S3、根据第二数据库建立若干背景生物网络数据集,并将所述第二生物基因集合作为输入进行概率运算,以获取输出结果满足预设阈值的背景生物网络数据集作为所述复杂疾病对应的第一生物网络数据;
S4、基于所述复杂疾病获取对应的预设药物名称,并根据所述预设药物名称和所述基础疾病和/或症状设定第一检索关键词,根据所述第一检索关键词检索第三数据库以获取与所述预设药物名称和所述复杂疾病相对应的第二生物网络数据所对应的名称列表;
S5、将所述名称列表作为第二检索关键词检索所述第二数据库以获取与所述预设药物名称对应的第三生物网络数据;
S6、将所述第一生物网络数据和所述第三生物网络数据通过第四数据库映射,以获取所述第一生物网络数据和所述第三生物网络数据的网络节点的对应关系;
S7、将所述第二数据库进行网络有向性转换以获取对应的生物网络,根据所述第一生物网络数据和所述第三生物网络数据的对应关系获取所述第一生物网络数据和所述第三生物网络数据的交集,并根据所述生物网络构建对应的复合网络;
S8、获取所述复合网络的节点所对应的度,并获取满足第一预设条件的度所对应的第一节点,并将所述第一节点作为所述预设药物名称的药物作用靶点;或/和
获取所述复合网络的节点所对应的第一介数,并获取满足第二预设条件的第一介数所对应的第二节点,并将所述第二节点作为所述预设药物名称的药物作用靶点;或/和
获取所述复合网络的边所对应的第二介数,并获取满足第三预设条件的第二介数所对应的第三节点,并将所述第三节点作为所述预设药物名称的药物作用靶点。
2.根据权利要求1所述的基于生物学网络数据的药物作用靶点筛选方法,其特征在于,
在所述步骤S1中,所述第一数据库包括GAD公开数据库和/或NCBI OMIM公开数据库;和/或
在所述步骤S3中,所述第二数据库包括KEGG通路数据库和/或BioCarta通路数据库;和/或
在所述步骤S4中,所述第三数据库为文献数据库NCBI Pubmed;和/或
在所述步骤S6中,所述第四数据库包括NCBI Gene数据库。
3.根据权利要求1所述的基于生物学网络数据的药物作用靶点筛选方法,其特征在于,在所述步骤S3中,所述概率运算包括利用单侧Fisher精确检验方法或超几何分布方法。
4.根据权利要求1所述的基于生物学网络数据的药物作用靶点筛选方法,其特征在于,在所述步骤S3中,所述预设阈值为小于或等于0.05。
5.根据权利要求1所述的基于生物学网络数据的药物作用靶点筛选方法,其特征在于,在所述步骤S7中,所述将所述第二数据库进行网络有向性转换,以获取对应的生物网络,包括:
基于R语言的软件包graphite对所述第二数据库进行网络有向性转换以获取所述生物网络。
6.根据权利要求1所述的基于生物学网络数据的药物作用靶点筛选方法,其特征在于,在所述步骤S8中,
所述获取满足第一预设条件的度所对应的第一节点包括:对所述度进行降序排列以获取其排序在3%以内的度所对应的节点为所述第一节点;和/或
所述获取满足第二预设条件的第一介数对应的第二节点包括:对所述第一介数进行降序排列以获取其排序在3%以内的第一介数所对应的节点为所述第二节点;和/或
所述获取满足第三预设条件的第二介数所对应的第三节点包括:对所述第二介数进行降序排列以获取其排序在3%以内的第二介数所对应的节点为所述第三节点。
7.一种基于生物学网络数据的药物作用靶点筛选装置,其特征在于,包括:
第一处理单元,用于基于某一复杂疾病中进行初步筛选以得到其所对应的多种基础疾病和/或症状,检索第一数据库以获取与所述多种基础疾病和/或症状分别对应的多个第一生物基因集合;
第二处理单元,用于将多个所述第一生物基因集合进行并集,以得到所述复杂疾病对应的第二生物基因集合;
第一获取单元,用于根据第二数据库建立若干背景生物网络数据集,并将所述第二生物基因集合作为输入进行概率运算,以获取输出结果满足预设阈值的背景生物网络数据集作为所述复杂疾病对应的第一生物网络数据;
第二获取单元,用于基于所述复杂疾病获取对应的预设药物名称,并根据所述预设药物名称和所述基础疾病和/或症状类别设定第一检索关键词,根据所述第一检索关键词检索第三数据库以获取与所述预设药物名称和所述基础疾病和/或症状类别相对应的第二生物网络数据所对应的名称列表;
第三获取单元,用于将所述名称列表作为第二检索关键词检索所述第二数据库以获取与所述预设药物名称对应的第三生物网络数据;
第三处理单元,用于将所述第一生物网络数据和所述第三生物网络数据通过第四数据库映射,以获取所述第一生物网络数据和所述第三生物网络数据的网络节点的对应关系;
第四处理单元,用于将所述第二数据库进行网络有向性转换,以获取对应的生物网络,根据所述第一生物网络数据和所述第三生物网络数据的对应关系获取所述第一生物网络数据和所述第三生物网络数据的交集,并根据所述生物网络构建对应的复合网络;以及
第一输出单元、第二输出单元和第三输出单元中的一个或多个;
所述第一输出单元用于获取所述复合网络的节点所对应的度,并获取满足第一预设条件的度所对应的第一节点,并将所述第一节点作为所述预设药物名称的药物作用靶点;
所述第二输出单元用于获取所述复合网络的节点所对应的第一介数,并获取满足第二预设条件的第一介数所对应的第二节点,并将所述第二节点作为所述预设药物名称的药物作用靶点;
所述第三输出单元用于获取所述复合网络的边所对应的第二介数,并获取满足第三预设条件的第二介数所对应的第三节点,并将所述第三节点作为所述预设药物名称的药物作用靶点。
8.一种计算机存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1-6中任意一项所述的基于生物学网络数据的药物作用靶点筛选方法。
9.一种电子设备,其特征在于,包括存储器和处理器;
所述存储器用于存储计算机程序;
所述处理器用于执行所述计算机程序实现如权利要求1-6任一项所述的基于生物学网络数据的药物作用靶点筛选方法。
CN202010429918.3A 2020-03-20 2020-05-20 基于生物学网络数据的药物作用靶点筛选方法、装置、电子设备及存储介质 Active CN111785333B (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
CN2020102022903 2020-03-20
CN202010202290 2020-03-20

Publications (2)

Publication Number Publication Date
CN111785333A true CN111785333A (zh) 2020-10-16
CN111785333B CN111785333B (zh) 2022-02-25

Family

ID=72754255

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010429918.3A Active CN111785333B (zh) 2020-03-20 2020-05-20 基于生物学网络数据的药物作用靶点筛选方法、装置、电子设备及存储介质

Country Status (1)

Country Link
CN (1) CN111785333B (zh)

Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104978474A (zh) * 2014-04-11 2015-10-14 中国中医科学院中医临床基础医学研究所 一种基于分子网络的药效评价方法及系统
CN105354779A (zh) * 2015-10-31 2016-02-24 大连医科大学 一种用于复杂大脑疾病靶向组合治疗分析的系统及方法
US20160213328A1 (en) * 2013-09-13 2016-07-28 Julia Morris HOENG Systems and methods for evaluating perturbation of xenobiotic metabolism
CN106055921A (zh) * 2016-05-27 2016-10-26 华中农业大学 基于基因表达和药物靶标的药物活性预测与筛选方法
CN107292126A (zh) * 2017-05-04 2017-10-24 浙江大学 一种中药对复杂性疾病所致“失和”网络整合调节作用的定量评价方法
CN108121896A (zh) * 2017-12-19 2018-06-05 深圳先进技术研究院 一种基于miRNA的疾病间关系分析方法和装置
CN109493925A (zh) * 2018-11-20 2019-03-19 北京晶派科技有限公司 一种确定药物和药物靶点关联关系的方法
CN110618987A (zh) * 2019-09-18 2019-12-27 宁夏大学 基于肺癌医学大数据的治疗通路关键结点信息处理方法
US20200090789A1 (en) * 2018-03-27 2020-03-19 Innoplexus Ag System and method for identifying potential targets for pharmaceutical compound

Patent Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20160213328A1 (en) * 2013-09-13 2016-07-28 Julia Morris HOENG Systems and methods for evaluating perturbation of xenobiotic metabolism
CN104978474A (zh) * 2014-04-11 2015-10-14 中国中医科学院中医临床基础医学研究所 一种基于分子网络的药效评价方法及系统
CN105354779A (zh) * 2015-10-31 2016-02-24 大连医科大学 一种用于复杂大脑疾病靶向组合治疗分析的系统及方法
CN106055921A (zh) * 2016-05-27 2016-10-26 华中农业大学 基于基因表达和药物靶标的药物活性预测与筛选方法
CN107292126A (zh) * 2017-05-04 2017-10-24 浙江大学 一种中药对复杂性疾病所致“失和”网络整合调节作用的定量评价方法
CN108121896A (zh) * 2017-12-19 2018-06-05 深圳先进技术研究院 一种基于miRNA的疾病间关系分析方法和装置
US20200090789A1 (en) * 2018-03-27 2020-03-19 Innoplexus Ag System and method for identifying potential targets for pharmaceutical compound
CN109493925A (zh) * 2018-11-20 2019-03-19 北京晶派科技有限公司 一种确定药物和药物靶点关联关系的方法
CN110618987A (zh) * 2019-09-18 2019-12-27 宁夏大学 基于肺癌医学大数据的治疗通路关键结点信息处理方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
QIANG ZENG ET AL: "A combined molecular biology and network pharmacology approach to investigate the multi-target mechanisms of Chaihu Shugan San on Alzheimer’s disease", 《BIOMEDICINE & PHARMACOTHERAPY》 *
陈寅萤等: "网络分析方法在疾病和药物研究中的应用", 《中国中药杂志》 *

Also Published As

Publication number Publication date
CN111785333B (zh) 2022-02-25

Similar Documents

Publication Publication Date Title
Burger Gentle introduction to the statistical foundations of false discovery rate in quantitative proteomics
Ji et al. Machine learning for perturbational single-cell omics
Chowdhury et al. (Differential) co-expression analysis of gene expression: a survey of best practices
Schbath et al. Mapping reads on a genomic sequence: an algorithmic overview and a practical comparative analysis
Yeang et al. Validation and refinement of gene-regulatory pathways on a network of physical interactions
Grafahrend-Belau et al. Modularization of biochemical networks based on classification of Petri net t-invariants
Liu et al. A novel data structure to support ultra-fast taxonomic classification of metagenomic sequences with k-mer signatures
Dong et al. Reverse enGENEering of regulatory networks from big data: a roadmap for biologists
Meher et al. Prediction of donor splice sites using random forest with a new sequence encoding approach
Yu et al. Predicting protein complex in protein interaction network-a supervised learning based method
Li et al. BioSeq-Diabolo: Biological sequence similarity analysis using Diabolo
US20190385706A1 (en) Associating gene expression data with a disease name
Zhang et al. How to balance the bioinformatics data: pseudo-negative sampling
Eldjárn Hjörleifsson et al. Accurate quantification of single-cell and single-nucleus RNA-seq transcripts using distinguishing flanking k-mers
Yi et al. Information-incorporated Gaussian graphical model for gene expression data
Li et al. An effective tri-clustering algorithm combining expression data with gene regulation information
Wang et al. An ensemble learning framework for detecting protein complexes from PPI networks
Acharya et al. Multi-factored gene-gene proximity measures exploiting biological knowledge extracted from gene ontology: application in gene clustering
Carlin et al. Prophetic Granger Causality to infer gene regulatory networks
CN111785333B (zh) 基于生物学网络数据的药物作用靶点筛选方法、装置、电子设备及存储介质
CN115798601A (zh) 肿瘤特征基因识别方法、装置、设备及存储介质
Liu et al. Overlapping functional modules detection in PPI network with pair‐wise constrained non‐negative matrix tri‐factorisation
Assawamakin et al. Biomarker selection and classification of “-omics” data using a two-step bayes classification framework
Sun et al. Robust structured heterogeneity analysis approach for high‐dimensional data
Webel et al. Mass spectrometry-based proteomics imputation using self supervised deep learning

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
TA01 Transfer of patent application right
TA01 Transfer of patent application right

Effective date of registration: 20220127

Address after: 518000 No. 12, Langshan Road, Xili street, Nanshan District, Shenzhen, Guangdong

Applicant after: Shenzhen Hospital, Fuwai Hospital, Chinese Academy of Medical Sciences

Address before: 518000 Shenzhen Hospital, Fuwai Hospital, Chinese Academy of Medical Sciences, No. 12, Langshan Road, Nanshan District, Shenzhen, Guangdong

Applicant before: Zhao Honglei

GR01 Patent grant
GR01 Patent grant
TR01 Transfer of patent right
TR01 Transfer of patent right

Effective date of registration: 20231206

Address after: No.1017 Dongmen North Road, Luohu District, Shenzhen, Guangdong 518000

Patentee after: SHENZHEN PEOPLE'S Hospital

Address before: 518000 No. 12, Langshan Road, Xili street, Nanshan District, Shenzhen, Guangdong

Patentee before: Shenzhen Hospital, Fuwai Hospital, Chinese Academy of Medical Sciences