CN113362963A - 基于多源异构网络的预测药物之间副作用的方法及系统 - Google Patents

基于多源异构网络的预测药物之间副作用的方法及系统 Download PDF

Info

Publication number
CN113362963A
CN113362963A CN202110583454.6A CN202110583454A CN113362963A CN 113362963 A CN113362963 A CN 113362963A CN 202110583454 A CN202110583454 A CN 202110583454A CN 113362963 A CN113362963 A CN 113362963A
Authority
CN
China
Prior art keywords
drugs
medicines
network
side effects
side effect
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202110583454.6A
Other languages
English (en)
Other versions
CN113362963B (zh
Inventor
王红
庄鲁贺
张慧
李威
韩书
杨杰
王正军
杨雪
滑美芳
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shandong Normal University
Original Assignee
Shandong Normal University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shandong Normal University filed Critical Shandong Normal University
Priority to CN202110583454.6A priority Critical patent/CN113362963B/zh
Publication of CN113362963A publication Critical patent/CN113362963A/zh
Application granted granted Critical
Publication of CN113362963B publication Critical patent/CN113362963B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H70/00ICT specially adapted for the handling or processing of medical references
    • G16H70/40ICT specially adapted for the handling or processing of medical references relating to drugs, e.g. their side effects or intended usage
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02ATECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
    • Y02A90/00Technologies having an indirect contribution to adaptation to climate change
    • Y02A90/10Information and communication technologies [ICT] supporting adaptation to climate change, e.g. for weather forecasting or climate simulation

Landscapes

  • Engineering & Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Health & Medical Sciences (AREA)
  • General Physics & Mathematics (AREA)
  • Software Systems (AREA)
  • Computational Linguistics (AREA)
  • Data Mining & Analysis (AREA)
  • Evolutionary Computation (AREA)
  • Biomedical Technology (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Artificial Intelligence (AREA)
  • Mathematical Physics (AREA)
  • Biophysics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Medicinal Chemistry (AREA)
  • Pharmacology & Pharmacy (AREA)
  • Toxicology (AREA)
  • Epidemiology (AREA)
  • Medical Informatics (AREA)
  • Primary Health Care (AREA)
  • Public Health (AREA)
  • Medical Treatment And Welfare Office Work (AREA)

Abstract

本发明属于数据分析挖掘技术领域,提供了一种基于多源异构网络的预测药物之间副作用的方法及系统。其中,该方法包括获取药物之间副作用的数据、药物和副作用之间对应关系的数据及药物和不同生物模态之间对应关系的数据,构建不同药物之间相互作用的符号网络;针对不同生物模态,对药物之间相互作用的符号网络进行图卷积,得到相应特征矩阵,并融合所有生物模态下的特征矩阵;通过解码矩阵对融合的特征矩阵中的药物编码进行解码,得到重构的药物之间的副作用网络;根据重构的药物之间的副作用网络中的信息得到邻接矩阵,根据邻接矩阵计算预测药物之间的副作用的准确率。

Description

基于多源异构网络的预测药物之间副作用的方法及系统
技术领域
本发明属于数据分析挖掘技术领域,尤其涉及一种基于多源异构网络的预 测药物之间副作用的方法及系统。
背景技术
本部分的陈述仅仅是提供了与本发明相关的背景技术信息,不必然构成在 先技术。
最近几年来,需要联合用药来治疗疾病的人数变得越来越多,但是,一起 服用多种药物时可能会导致药物间产生相互作用,产生的相互作用可能是副作 用。因此,预测药物之间的副作用就成了一项并不可少的并且具有挑战性的工 作。同时服用多种药物产生副作用的概率要比服用一种药物产生副作用的概率 大的多。多药副作用的产生是由于药物之间的相互作用而出现的,如果一种药 物与另外一种药物合用,那么其中一种药物的活性可能会向不利的方向发展。 由于药物之间的复杂关系是非常少见的,所以药物之间的复杂关系很有限,并 且一般来说,在相对较少的临床测试中观察不到。因此发现药物之间的不良反 应是一项具有挑战性的工作,发现药物之间的副作用可以有效降低发病率和死 亡率。
如果通过实施实验的方法来发现药物之间的副作用会非常费时费力。目前 来看,出于对时间和成本的考虑,已经出现了很多机器学习方法来对药物之间 的副作用进行预测。具体而言,用机器学习方法表示的药物都必须带有化学分 子结构或者是其他的生物信息,得到药物的特征表示之后,然后对药物之间的 副作用进行预测。发明人发现,尽管这些机器学习方法已经取得了相对成功的 结果,但仍然存在以下问题:首先,只考虑了药物之间的单一类型的关系,而 忽略了药物之间的隐性关系或者间接关系;其次,尽管一些机器学习方法的研 究考虑了药物之间的隐性关系,但是这些方法并未考虑潜在的语义信息。
发明内容
为了解决上述背景技术中存在的技术问题,本发明提供一种基于多源异构 网络的预测药物之间副作用的方法及系统,其对各个生物特征方面的药物特征 向量表达进行融合,这种融合方式可以使药物的最终向量表达更加准确,能够 提高药物之间副作用的预测准确性。
为了实现上述目的,本发明采用如下技术方案:
本发明的第一个方面提供一种基于多源异构网络的预测药物之间副作用的 方法。
一种基于多源异构网络的预测药物之间副作用的方法,其包括:
获取药物之间副作用的数据、药物和副作用之间对应关系的数据及药物和 不同生物模态之间对应关系的数据,构建不同药物之间相互作用的符号网络;
针对不同生物模态,对药物之间相互作用的符号网络进行图卷积,得到相 应特征矩阵,并融合所有生物模态下的特征矩阵;
通过解码矩阵对融合的特征矩阵中的药物编码进行解码,得到重构的药物 之间的副作用网络;
根据重构的药物之间的副作用网络中的信息得到邻接矩阵,根据邻接矩阵 计算预测药物之间的副作用的准确率。
本发明的第二个方面提供一种基于多源异构网络的预测药物之间副作用的 系统。
一种基于多源异构网络的预测药物之间副作用的系统,其包括:
符号网络构建模块,其用于获取药物之间副作用的数据、药物和副作用之 间对应关系的数据及药物和不同生物模态之间对应关系的数据,构建不同药物 之间相互作用的符号网络;
特征矩阵融合模块,其用于针对不同生物模态,对药物之间相互作用的符 号网络进行图卷积,得到相应特征矩阵,并融合所有生物模态下的特征矩阵;
副作用网络重构模块,其用于通过解码矩阵对融合的特征矩阵中的药物编 码进行解码,得到重构的药物之间的副作用网络;
副作用准确率预测模块,其用于根据重构的药物之间的副作用网络中的信 息得到邻接矩阵,根据邻接矩阵计算预测药物之间的副作用的准确率。
本发明的第三个方面提供一种计算机可读存储介质。
一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行 时实现如上述所述的基于多源异构网络的预测药物之间副作用的方法中的步 骤。
本发明的第四个方面提供一种计算机设备。
一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上 运行的计算机程序,所述处理器执行所述程序时实现如上述所述的基于多源异 构网络的预测药物之间副作用的方法中的步骤。
与现有技术相比,本发明的有益效果是:
(1)本发明提供的基于多源异构网络的预测药物之间副作用的方法,考虑 了药物之间副作用的数据、药物和副作用之间对应关系的数据及药物和不同生 物模态之间对应关系的数据多种生物特征信息,对于药物特征向量的表达更加 全面,而且分考虑到了现实世界中的关于药物的语义信息,预测药物之间的副 作用准确率过程中所应用的模型的可解释性;
(2)本发明借助与药物相关的异构信息,搭建起了药物相互作用符号网络, 该网络中包含了丰富的语义关系,再通过图卷积过程,最终得到药物的特征向 量表达,在多源异构网络上,因此卷积完成之后在各个异构信息方面也就是在 各个生物特征方面都会得到药物的特征向量表达,对各个生物特征方面的药物 特征向量表达进行融合,这种融合方式使药物的最终向量表达更加准确,从而 提高了药物之间副作用的预测准确性。
本发明附加方面的优点将在下面的描述中部分给出,部分将从下面的描述 中变得明显,或通过本发明的实践了解到。
附图说明
构成本发明的一部分的说明书附图用来提供对本发明的进一步理解,本发 明的示意性实施例及其说明用于解释本发明,并不构成对本发明的不当限定。
图1为本发明实施例的基于多源异构网络的预测药物之间副作用的方法流 程图;
图2为本发明实施例的药物符号网络搭建过程流程图;
图3(a)为药物符号网络示例1;
图3(b)为药物符号网络示例2;
图4为本发明实施例的药物之间的拓展平衡理论示意图;
图5为本发明实施例的图卷积神经网络卷积过程流程图;
具体实施方式
下面结合附图与实施例对本发明作进一步说明。
应该指出,以下详细说明都是例示性的,旨在对本发明提供进一步的说明。 除非另有指明,本文使用的所有技术和科学术语具有与本发明所属技术领域的 普通技术人员通常理解的相同含义。
需要注意的是,这里所使用的术语仅是为了描述具体实施方式,而非意图 限制根据本发明的示例性实施方式。如在这里所使用的,除非上下文另外明确 指出,否则单数形式也意图包括复数形式,此外,还应当理解的是,当在本说 明书中使用术语“包含”和/或“包括”时,其指明存在特征、步骤、操作、器件、 组件和/或它们的组合。
实施例一
本实施例采用的数据包括548个药物节点,129种酶,4897种适用症,4897 种副作用,78种转运子。药物之间副作用网络的尺寸为548×548×1316(1316 个种副作用)。如果药物对之间发生副作用,则药物之间副作用网络数据集中的 相应元素标记为1。这里,我们集中研究1316种常见副作用,并且每种副作用 至少出现在500种药物中。药物数据统计如表1所示。
表1药物数据统计
Figure BDA0003087081150000051
Figure BDA0003087081150000061
如图1所示,本实施例提供了一种基于多源异构网络的预测药物之间副作 用的方法,其具体包括如下步骤:
步骤S101:获取药物之间副作用的数据、药物和副作用之间对应关系的数 据及药物和不同生物模态之间对应关系的数据,构建不同药物之间相互作用的 符号网络,如图2所示。
本实施例使用的数据分布在三个数据集中。从包括DrugBank和SIDER的 数据库中收集了与毒品有关的数据。DrugBank数据库是具有药物靶标,药物酶 和药物转运蛋白的生物信息学资源。SIDER数据库包含1430种药物和5880种 副作用术语,这些术语是根据公共文档和包装说明书汇编而成的。物副作用和 适应症可在SIDER中获得。药物-药物副作用数据集为:
http://snap.stanford.edu/decagon中使用的药物-药物副作用数据集。
药物-药物副作用数据集的大小为548×548×1316(1316ADR事件)。
需要说明的是,所述生物模态包括但不限于途径、酶、适应症和转运蛋白。
根据不同的生物模态(酶,适应症等),搭建不同的药物之间相互作用的符 号网络,如图2所示:
药物之间是否有积极作用,取决于它们在生物学方式上的相似性。
药物之间的相似性是通过Jaccard相似性标准来计算的。
定义药物之间正作用,在这里我们采用的相似度阈值为0.95。
药物之间的副作用网络被认为是由于联合用药引起的某些不良影响。这些 不良反应大多数是天然药理作用。药物之间的药物之间的副作用关系可以通过 矩阵ADDI-ADR来描述,其元素定义为公式(1)。也就是说,如果药物i和药物j 之间有副作用,则ADDI-ADR(i,j)为1,并且如果药物i和药物j之间的副作用未知, 则ADDI-ADR(i,j)为0。
Figure BDA0003087081150000071
定义药物之间的正作用步骤:药物之间的副作用关系由矩阵APE描述,其元 素定义为公式(2)。
Figure BDA0003087081150000072
在此,Sij表示药物i和药物j之间的归一化相似度,并且μ∈[0,1)是阈值。换 句话说,如果Sij>μ,则在药物i和药物j之间有积极作用。否则,如果Sij<μ, 则在药物i和药物j之间没有积极作用。综上所述,这两种药物是否有积极作 用,取决于它们在生物学方式上的相似性。此处,药物i和药物j之间的相似 性由式(3)定义。
Figure BDA0003087081150000073
给定一个具有特征向量Vi和Vj的药物i和药物j,尽管可以使用其他标准,但 这里的i和j之间的相似性是通过Jaccard相似性标准来计算的。在公式(2) 中,M11是其中Vi和Vj的值都为1的维数;M01是Vi和Vj的值分别为0和1的维数; M10是Vi和Vj的值分别为1和0的维数。
符号网络(DDISN)形式化为GDDISN=(V,E,APE,AADR),其中V是所有 节点的集合,其中节点代表药物);E是所有节点之间的所有关系的集合;AADR是网络GADR的邻接矩阵;APE是网络GDDPE的邻接矩阵。在不失一般性的前提下, 我们假设e(i,j)=e(j,i)。邻接矩阵ADDIPN的元素ADDIPN(i,j)被表示为公式(4)。
Figure BDA0003087081150000081
符号传播步骤:根据扩展的结构平衡理论,我们可以在DDISN中执行符号 传播。在图3(a)和图3(b)中,实线表示符号代表已知边缘,虚线代表预 测边缘的符号。在反复使用以上理论之后,将传播DDIPN中的符号,并获得 更高阶的DDI信息。
符号传播过程是基于符号传播矩阵(SPM)来完成的,该符号传播矩阵由 ADDISN在上面的部分中初始化。然后,根据结构平衡理论,使用传播操作迭代 更新SPM。详细的迭代过程基于公式(5)和(6)。
SPM0=I
SPM1=ADDISN (7)
在这里,I∈RN×N是一个单位矩阵。
Figure BDA0003087081150000082
其中,Sign(x)是公式9所示的符号函数。
Figure BDA0003087081150000083
在DDISN中的符号传播过程之后,我们在DDISN中获得M阶符号传播矩 阵(SPMm)。得到的SPMm就是药物特征网络。
步骤S102:针对不同生物模态,对药物之间相互作用的符号网络进行图卷 积,得到相应特征矩阵,并融合所有生物模态下的特征矩阵。
针对不同的生物模态,对药物的之间的符号网络进行图卷积,如图4所示:
利用深度神经网络对所有生物模态下的特征矩阵进行融合。
图卷积神经网络的配置参数,定义一个图卷积神经网络。在这里,图卷积 神经网络一共有两个隐藏层,第一个隐藏层是32维的,第二个隐藏层是16维 的。我们将tanh函数用作第一层和第二个隐藏层之间的后激活函数。
利用定义好的图卷积神经网络对药物相互作用网络和已知的药物之间的副 作用网络进行卷积。
上述卷积过程分别用于所有类型的生物学特征,例如途径,酶,适应症和 转运蛋白。
针对不同的生物模态,对药物的之间的符号网络进行图卷积的具体步骤为: 输入:不良药物反应相互作用网络的邻接矩阵ArDDI-ADR;培训模型的交互Ep的数 量;卷积神经网络的层数L。
输出:药物特征矩阵H(l)
Figure BDA0003087081150000091
融合所有生物模态下通过图卷积得到的特征矩阵,如图5所示:
设置深度神经网络的配置参数,定义一个深度神经网络。这里采用的深度 神经网络的隐藏层采用了三个全连接层。
利用定义好的深度神经网络融合所有生物模态下通过图卷积得到的特征矩 阵。
融合所有生物模态下通过图卷积得到的特征矩阵的具体步骤为:
这里采用深层神经网络来融合各个生物特征模态下的特征矩阵,深层神经网 络是一种神经网络,具有许多隐藏层,大致分为三个类别,输入层,隐藏层和 输出层。通常,第一层是输入层,最后一层是输出层,并且所有中间层都是隐 藏层。隐藏层通常完全连接,即,第i层中的任何神经元必须连接到I+1层层 中的任何神经元。虽然深层神经网络看起来很复杂,但它与来自小本地模型的 Perceptron仍然是相同的,即,线性关系z=∑ωixi+b加上激活函数σ(x)。
步骤S103:通过解码矩阵对融合的特征矩阵中的药物编码进行解码,得到 重构的药物之间的副作用网络。
对药物之间的副作用进行预测的具体步骤为:通过具有特定维度的初始化 时随机定义并且后期会不断优化的解码矩阵Xr对融合的特征矩阵中的药物编码 进行解码得到重构的药物之间的副作用网络。具体过程为:
Figure BDA0003087081150000101
步骤S104:根据重构的药物之间的副作用网络中的信息得到邻接矩阵,根 据邻接矩阵计算预测药物之间的副作用的准确率。
具体地,在重构的药物之间的副作用网络中,若一对药物之间有副作用, 则在邻接矩阵中该药物对的对应位置上的数字为1。
在重构的药物之间的副作用网络中,若一对药物之间没有副作用或副作用 未知,则在邻接矩阵中该药物对的对应位置上的数字为0。
对提出的预测药物之间的副作用模型进行测试:
为了评估提出的预测药物之间的副作用模型,我们使用三个常用指标来评 估模型性能:接收者工作特性曲线(AUROC)下的面积,准确度调用曲线 (AUPRC)下的面积和F1(F1同时考虑分类模型的准确性和召回率)。三个 评估标准和相关概念定义如下。
首先,对于两个分类问题,分类结果为正(P)或负(N)。
1)真实正值(TP):预测值为P,实际值也为P。
2)误报率(FP):预测值为P,实际值为N。
3)真负(TN):预测为N,实际值也为N。
4)假阴性(FN):预测值为N,但实际值为P。
真实阳性率(TPR)是所有阳性样品中阳性样品的概率,即模型对阳性样品 的敏感性。假阳性率(FPR)是所有阴性样品中阳性样品的概率,即模型对阴 性样品的敏感性。TPR和FPR定义如下。
Figure BDA0003087081150000111
Figure BDA0003087081150000112
以FDR为x轴,以TPR为y轴,可以通过设置不同的分类阈值来获得接收 器工作特性曲线(ROC)。AUROC值越大,模型的识别性能越好。当测试集 中正样本和负样本的分布发生变化时,ROC曲线可以保持稳定。因此,AUROC 值保持稳定。因此,AUROC指数非常稳定。
其次,准确性的概念是正确分类的样本占样本总数的比例。召回的定义与 TPR相同,后者是阳性样本的概率。精度和召回率的定义如下。
Figure BDA0003087081150000121
Figure BDA0003087081150000122
以召回率作为x轴,以精度作为y轴,可以通过设置不同的分类阈值来获 得精确召回曲线(PRC)。AUPRC是PR曲线下面积。注意,当正样本和负样 本的比例完全不同时,AUPRC可以反映实际的分类性能。因此,与AUROC(ROC 曲线下面积)值相比,AUPRC值可以更好地反映分类器的质量。
在这里,Precision(i)是i在测试集预测结果的排名列表中的位置之前的精 度。F1分数的计算方式如下:
Figure BDA0003087081150000123
我们提出的预测药物之间的副作用模型的三个指标的成绩如表2所示:
表2提出的预测药物之间的副作用模型的成绩
AUROC AUPRC F1
0.97302 0.98285 0.93083
实施例二
本实施例提供了一种基于多源异构网络的预测药物之间副作用的系统,其 具体包括如下模块:
符号网络构建模块,其用于获取药物之间副作用的数据、药物和副作用之 间对应关系的数据及药物和不同生物模态之间对应关系的数据,构建不同药物 之间相互作用的符号网络;
特征矩阵融合模块,其用于针对不同生物模态,对药物之间相互作用的符 号网络进行图卷积,得到相应特征矩阵,并融合所有生物模态下的特征矩阵;
副作用网络重构模块,其用于通过解码矩阵对融合的特征矩阵中的药物编 码进行解码,得到重构的药物之间的副作用网络;
副作用准确率预测模块,其用于根据重构的药物之间的副作用网络中的信 息得到邻接矩阵,根据邻接矩阵计算预测药物之间的副作用的准确率。
此处需要说明的是,本实施例的基于多源异构网络的预测药物之间副作用 的系统中的各个模块,与实施例一中的基于多源异构网络的预测药物之间副作 用的方法中的各个步骤一一对应,其具体实施过程相同,此处不再累述。
实施例三
本实施例提供了一种计算机可读存储介质,其上存储有计算机程序,该程 序被处理器执行时实现如上述实施例一所述的基于多源异构网络的预测药物之 间副作用的方法中的步骤。
实施例四
本实施例提供了一种计算机设备,包括存储器、处理器及存储在存储器上 并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现如上述实 施例一所述的基于多源异构网络的预测药物之间副作用的方法中的步骤。
本领域内的技术人员应明白,本发明的实施例可提供为方法、系统、或计 算机程序产品。因此,本发明可采用硬件实施例、软件实施例、或结合软件和 硬件方面的实施例的形式。而且,本发明可采用在一个或多个其中包含有计算 机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器和光学存储器 等)上实施的计算机程序产品的形式。
本发明是参照根据本发明实施例的方法、设备(系统)、和计算机程序产品的 流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框 图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。 可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他 可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程 数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程 和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备 以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的 指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流 程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使 得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处 理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个 流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程, 是可以通过计算机程序来指令相关的硬件来完成,所述的程序可存储于一计算 机可读取存储介质中,该程序在执行时,可包括如上述各方法的实施例的流程。 其中,所述的存储介质可为磁碟、光盘、只读存储记忆体(Read-Only Memory, ROM)或随机存储记忆体(RandomAccessMemory,RAM)等。
以上所述仅为本发明的优选实施例而已,并不用于限制本发明,对于本领 域的技术人员来说,本发明可以有各种更改和变化。凡在本发明的精神和原则 之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之 内。

Claims (10)

1.一种基于多源异构网络的预测药物之间副作用的方法,其特征在于,包括:
获取药物之间副作用的数据、药物和副作用之间对应关系的数据及药物和不同生物模态之间对应关系的数据,构建不同药物之间相互作用的符号网络;
针对不同生物模态,对药物之间相互作用的符号网络进行图卷积,得到相应特征矩阵,并融合所有生物模态下的特征矩阵;
通过解码矩阵对融合的特征矩阵中的药物编码进行解码,得到重构的药物之间的副作用网络;
根据重构的药物之间的副作用网络中的信息得到邻接矩阵,根据邻接矩阵计算预测药物之间的副作用的准确率。
2.如权利要求1所述的基于多源异构网络的预测药物之间副作用的方法,其特征在于,在重构的药物之间的副作用网络中,若一对药物之间有副作用,则在邻接矩阵中该药物对的对应位置上的数字为1。
3.如权利要求1所述的基于多源异构网络的预测药物之间副作用的方法,其特征在于,在重构的药物之间的副作用网络中,若一对药物之间没有副作用或副作用未知,则在邻接矩阵中该药物对的对应位置上的数字为0。
4.如权利要求1所述的基于多源异构网络的预测药物之间副作用的方法,其特征在于,利用深度神经网络对所有生物模态下的特征矩阵进行融合。
5.如权利要求1所述的基于多源异构网络的预测药物之间副作用的方法,其特征在于,所述生物模态包括途径、酶、适应症和转运蛋白。
6.如权利要求1所述的基于多源异构网络的预测药物之间副作用的方法,其特征在于,药物之间是否有积极作用,取决于它们在生物学方式上的相似性。
7.如权利要求6所述的基于多源异构网络的预测药物之间副作用的方法,其特征在于,药物之间的相似性是通过Jaccard相似性标准来计算的。
8.一种基于多源异构网络的预测药物之间副作用的系统,其特征在于,包括:
符号网络构建模块,其用于获取药物之间副作用的数据、药物和副作用之间对应关系的数据及药物和不同生物模态之间对应关系的数据,构建不同药物之间相互作用的符号网络;
特征矩阵融合模块,其用于针对不同生物模态,对药物之间相互作用的符号网络进行图卷积,得到相应特征矩阵,并融合所有生物模态下的特征矩阵;
副作用网络重构模块,其用于通过解码矩阵对融合的特征矩阵中的药物编码进行解码,得到重构的药物之间的副作用网络;
副作用准确率预测模块,其用于根据重构的药物之间的副作用网络中的信息得到邻接矩阵,根据邻接矩阵计算预测药物之间的副作用的准确率。
9.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现如权利要求1-7中任一项所述的基于多源异构网络的预测药物之间副作用的方法中的步骤。
10.一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述程序时实现如权利要求1-7中任一项所述的基于多源异构网络的预测药物之间副作用的方法中的步骤。
CN202110583454.6A 2021-05-27 2021-05-27 基于多源异构网络的预测药物之间副作用的方法及系统 Active CN113362963B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110583454.6A CN113362963B (zh) 2021-05-27 2021-05-27 基于多源异构网络的预测药物之间副作用的方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110583454.6A CN113362963B (zh) 2021-05-27 2021-05-27 基于多源异构网络的预测药物之间副作用的方法及系统

Publications (2)

Publication Number Publication Date
CN113362963A true CN113362963A (zh) 2021-09-07
CN113362963B CN113362963B (zh) 2024-04-02

Family

ID=77527839

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110583454.6A Active CN113362963B (zh) 2021-05-27 2021-05-27 基于多源异构网络的预测药物之间副作用的方法及系统

Country Status (1)

Country Link
CN (1) CN113362963B (zh)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113793696A (zh) * 2021-09-15 2021-12-14 中南大学 一种基于相似性的新药副作用发生频率预测方法、系统、终端及可读存储介质
CN114822691A (zh) * 2022-04-13 2022-07-29 上海人工智能创新中心 基于图卷积神经网络的临床事件预测装置
CN116453710A (zh) * 2023-06-14 2023-07-18 中国地质大学(武汉) 一种药物副作用预测方法、装置、电子设备及存储介质
CN116994700A (zh) * 2023-03-31 2023-11-03 北京诺道认知医学科技有限公司 基于深度学习的喹硫平剂量个体化推荐方法及装置
CN116994700B (zh) * 2023-03-31 2024-06-04 北京诺道认知医学科技有限公司 基于深度学习的喹硫平剂量个体化推荐方法及装置

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111310996A (zh) * 2020-02-13 2020-06-19 山东师范大学 基于图自编码网络的用户信任关系预测方法及系统
CN111401514A (zh) * 2020-02-13 2020-07-10 山东师范大学 基于改进图卷积网络的半监督符号网络嵌入方法及系统
CN112382411A (zh) * 2020-11-13 2021-02-19 大连理工大学 一种基于异质图的药物-蛋白质靶向作用预测方法
KR102225278B1 (ko) * 2020-01-31 2021-03-10 주식회사 스탠다임 질의되는 개체와 관련되는 질병, 유전자 또는 단백질을 예측하는 방법 및 이를 이용하여 구축되는 예측 시스템

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR102225278B1 (ko) * 2020-01-31 2021-03-10 주식회사 스탠다임 질의되는 개체와 관련되는 질병, 유전자 또는 단백질을 예측하는 방법 및 이를 이용하여 구축되는 예측 시스템
CN111310996A (zh) * 2020-02-13 2020-06-19 山东师范大学 基于图自编码网络的用户信任关系预测方法及系统
CN111401514A (zh) * 2020-02-13 2020-07-10 山东师范大学 基于改进图卷积网络的半监督符号网络嵌入方法及系统
CN112382411A (zh) * 2020-11-13 2021-02-19 大连理工大学 一种基于异质图的药物-蛋白质靶向作用预测方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
侯美好: "基于图神经网络的药物不良相互作用预测", 《中国优秀硕士学位论文全文数据库 医药卫生科技辑》 *

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113793696A (zh) * 2021-09-15 2021-12-14 中南大学 一种基于相似性的新药副作用发生频率预测方法、系统、终端及可读存储介质
CN113793696B (zh) * 2021-09-15 2023-11-14 中南大学 一种基于相似性的新药副作用发生频率预测方法、系统、终端及可读存储介质
CN114822691A (zh) * 2022-04-13 2022-07-29 上海人工智能创新中心 基于图卷积神经网络的临床事件预测装置
CN116994700A (zh) * 2023-03-31 2023-11-03 北京诺道认知医学科技有限公司 基于深度学习的喹硫平剂量个体化推荐方法及装置
CN116994700B (zh) * 2023-03-31 2024-06-04 北京诺道认知医学科技有限公司 基于深度学习的喹硫平剂量个体化推荐方法及装置
CN116453710A (zh) * 2023-06-14 2023-07-18 中国地质大学(武汉) 一种药物副作用预测方法、装置、电子设备及存储介质
CN116453710B (zh) * 2023-06-14 2023-09-22 中国地质大学(武汉) 一种药物副作用预测方法、装置、电子设备及存储介质

Also Published As

Publication number Publication date
CN113362963B (zh) 2024-04-02

Similar Documents

Publication Publication Date Title
Lucca et al. CC-integrals: Choquet-like copula-based aggregation functions and its application in fuzzy rule-based classification systems
Gopika et al. Correlation based feature selection algorithm for machine learning
Razavi-Far et al. Similarity-learning information-fusion schemes for missing data imputation
Tama et al. Tree-based classifier ensembles for early detection method of diabetes: an exploratory study
CN111695415A (zh) 图像识别模型的构建方法、识别方法及相关设备
Tran et al. An effective and efficient approach to classification with incomplete data
Vijaya et al. Computing efficient features using rough set theory combined with ensemble classification techniques to improve the customer churn prediction in telecommunication sector
Meyer Information-theoretic variable selection and network inference from microarray data
US9043326B2 (en) Methods and systems for biclustering algorithm
CN113362963B (zh) 基于多源异构网络的预测药物之间副作用的方法及系统
Sarwar et al. A survey of big data analytics in healthcare
Henríquez et al. Twitter sentiment classification based on deep random vector functional link
CN112599187B (zh) 一种基于双流神经网络预测药物与靶标蛋白结合分数的方法
Mahanipour et al. Using fuzzy-rough set feature selection for feature construction based on genetic programming
CN114329029A (zh) 对象检索方法、装置、设备及计算机存储介质
Kovalchuk et al. A Scoring Model for Support Decision Making in Criminal Justice
Rijal et al. Integrating Information Gain methods for Feature Selection in Distance Education Sentiment Analysis during Covid-19.
Samel et al. Active deep learning to tune down the noise in labels
US20230352123A1 (en) Automatic design of molecules having specific desirable characteristics
Aktukmak et al. Any-Shot Learning From Multimodal Observations (ALMO)
Monner et al. Recurrent neural collective classification
Usman et al. Filter-based feature selection: a comparison among binary and continuous Cuckoo optimisation algorithms along with multi-objective optimisation algorithms using gain ratio-based entropy
Dubitzky et al. Data mining and machine learning methods for microarray analysis
Radišić et al. Impact of missing values on the performance of machine learning algorithms
Pham et al. Relational dynamic memory networks

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant