CN113362963A - 基于多源异构网络的预测药物之间副作用的方法及系统 - Google Patents
基于多源异构网络的预测药物之间副作用的方法及系统 Download PDFInfo
- Publication number
- CN113362963A CN113362963A CN202110583454.6A CN202110583454A CN113362963A CN 113362963 A CN113362963 A CN 113362963A CN 202110583454 A CN202110583454 A CN 202110583454A CN 113362963 A CN113362963 A CN 113362963A
- Authority
- CN
- China
- Prior art keywords
- drugs
- medicines
- network
- side effects
- side effect
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 239000003814 drug Substances 0.000 title claims abstract description 197
- 229940079593 drug Drugs 0.000 title claims abstract description 194
- 230000000694 effects Effects 0.000 title claims abstract description 113
- 238000000034 method Methods 0.000 title claims abstract description 41
- 239000011159 matrix material Substances 0.000 claims abstract description 50
- 230000003993 interaction Effects 0.000 claims abstract description 16
- 238000004590 computer program Methods 0.000 claims description 14
- 238000013528 artificial neural network Methods 0.000 claims description 12
- 238000003860 storage Methods 0.000 claims description 9
- 230000008092 positive effect Effects 0.000 claims description 7
- 102000004190 Enzymes Human genes 0.000 claims description 6
- 108090000790 Enzymes Proteins 0.000 claims description 6
- 230000004927 fusion Effects 0.000 claims description 4
- 238000010276 construction Methods 0.000 claims description 3
- 230000037361 pathway Effects 0.000 claims description 3
- 231100000957 no side effect Toxicity 0.000 claims description 2
- 238000007405 data analysis Methods 0.000 abstract description 2
- 238000007418 data mining Methods 0.000 abstract description 2
- 230000008569 process Effects 0.000 description 12
- 238000010586 diagram Methods 0.000 description 9
- 230000006870 function Effects 0.000 description 8
- 239000013598 vector Substances 0.000 description 8
- 208000030453 Drug-Related Side Effects and Adverse reaction Diseases 0.000 description 5
- 206010061623 Adverse drug reaction Diseases 0.000 description 4
- 238000010801 machine learning Methods 0.000 description 4
- 238000012545 processing Methods 0.000 description 4
- 230000002411 adverse Effects 0.000 description 3
- 238000013527 convolutional neural network Methods 0.000 description 3
- 238000012360 testing method Methods 0.000 description 3
- 206010067484 Adverse reaction Diseases 0.000 description 2
- 230000006838 adverse reaction Effects 0.000 description 2
- 238000013459 approach Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 210000002569 neuron Anatomy 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 230000035945 sensitivity Effects 0.000 description 2
- 206010013710 Drug interaction Diseases 0.000 description 1
- 230000004913 activation Effects 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000013145 classification model Methods 0.000 description 1
- 201000010099 disease Diseases 0.000 description 1
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 description 1
- 238000009826 distribution Methods 0.000 description 1
- 239000000890 drug combination Substances 0.000 description 1
- 239000003596 drug target Substances 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 238000002474 experimental method Methods 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- -1 indications Proteins 0.000 description 1
- 238000012804 iterative process Methods 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 230000000144 pharmacologic effect Effects 0.000 description 1
- 230000000644 propagated effect Effects 0.000 description 1
- 239000000126 substance Substances 0.000 description 1
- 238000012549 training Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16H—HEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
- G16H70/00—ICT specially adapted for the handling or processing of medical references
- G16H70/40—ICT specially adapted for the handling or processing of medical references relating to drugs, e.g. their side effects or intended usage
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02A—TECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
- Y02A90/00—Technologies having an indirect contribution to adaptation to climate change
- Y02A90/10—Information and communication technologies [ICT] supporting adaptation to climate change, e.g. for weather forecasting or climate simulation
Landscapes
- Engineering & Computer Science (AREA)
- Health & Medical Sciences (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Health & Medical Sciences (AREA)
- General Physics & Mathematics (AREA)
- Software Systems (AREA)
- Computational Linguistics (AREA)
- Data Mining & Analysis (AREA)
- Evolutionary Computation (AREA)
- Biomedical Technology (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- General Engineering & Computer Science (AREA)
- Artificial Intelligence (AREA)
- Mathematical Physics (AREA)
- Biophysics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Chemical & Material Sciences (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Medicinal Chemistry (AREA)
- Pharmacology & Pharmacy (AREA)
- Toxicology (AREA)
- Epidemiology (AREA)
- Medical Informatics (AREA)
- Primary Health Care (AREA)
- Public Health (AREA)
- Medical Treatment And Welfare Office Work (AREA)
Abstract
本发明属于数据分析挖掘技术领域,提供了一种基于多源异构网络的预测药物之间副作用的方法及系统。其中,该方法包括获取药物之间副作用的数据、药物和副作用之间对应关系的数据及药物和不同生物模态之间对应关系的数据,构建不同药物之间相互作用的符号网络;针对不同生物模态,对药物之间相互作用的符号网络进行图卷积,得到相应特征矩阵,并融合所有生物模态下的特征矩阵;通过解码矩阵对融合的特征矩阵中的药物编码进行解码,得到重构的药物之间的副作用网络;根据重构的药物之间的副作用网络中的信息得到邻接矩阵,根据邻接矩阵计算预测药物之间的副作用的准确率。
Description
技术领域
本发明属于数据分析挖掘技术领域,尤其涉及一种基于多源异构网络的预 测药物之间副作用的方法及系统。
背景技术
本部分的陈述仅仅是提供了与本发明相关的背景技术信息,不必然构成在 先技术。
最近几年来,需要联合用药来治疗疾病的人数变得越来越多,但是,一起 服用多种药物时可能会导致药物间产生相互作用,产生的相互作用可能是副作 用。因此,预测药物之间的副作用就成了一项并不可少的并且具有挑战性的工 作。同时服用多种药物产生副作用的概率要比服用一种药物产生副作用的概率 大的多。多药副作用的产生是由于药物之间的相互作用而出现的,如果一种药 物与另外一种药物合用,那么其中一种药物的活性可能会向不利的方向发展。 由于药物之间的复杂关系是非常少见的,所以药物之间的复杂关系很有限,并 且一般来说,在相对较少的临床测试中观察不到。因此发现药物之间的不良反 应是一项具有挑战性的工作,发现药物之间的副作用可以有效降低发病率和死 亡率。
如果通过实施实验的方法来发现药物之间的副作用会非常费时费力。目前 来看,出于对时间和成本的考虑,已经出现了很多机器学习方法来对药物之间 的副作用进行预测。具体而言,用机器学习方法表示的药物都必须带有化学分 子结构或者是其他的生物信息,得到药物的特征表示之后,然后对药物之间的 副作用进行预测。发明人发现,尽管这些机器学习方法已经取得了相对成功的 结果,但仍然存在以下问题:首先,只考虑了药物之间的单一类型的关系,而 忽略了药物之间的隐性关系或者间接关系;其次,尽管一些机器学习方法的研 究考虑了药物之间的隐性关系,但是这些方法并未考虑潜在的语义信息。
发明内容
为了解决上述背景技术中存在的技术问题,本发明提供一种基于多源异构 网络的预测药物之间副作用的方法及系统,其对各个生物特征方面的药物特征 向量表达进行融合,这种融合方式可以使药物的最终向量表达更加准确,能够 提高药物之间副作用的预测准确性。
为了实现上述目的,本发明采用如下技术方案:
本发明的第一个方面提供一种基于多源异构网络的预测药物之间副作用的 方法。
一种基于多源异构网络的预测药物之间副作用的方法,其包括:
获取药物之间副作用的数据、药物和副作用之间对应关系的数据及药物和 不同生物模态之间对应关系的数据,构建不同药物之间相互作用的符号网络;
针对不同生物模态,对药物之间相互作用的符号网络进行图卷积,得到相 应特征矩阵,并融合所有生物模态下的特征矩阵;
通过解码矩阵对融合的特征矩阵中的药物编码进行解码,得到重构的药物 之间的副作用网络;
根据重构的药物之间的副作用网络中的信息得到邻接矩阵,根据邻接矩阵 计算预测药物之间的副作用的准确率。
本发明的第二个方面提供一种基于多源异构网络的预测药物之间副作用的 系统。
一种基于多源异构网络的预测药物之间副作用的系统,其包括:
符号网络构建模块,其用于获取药物之间副作用的数据、药物和副作用之 间对应关系的数据及药物和不同生物模态之间对应关系的数据,构建不同药物 之间相互作用的符号网络;
特征矩阵融合模块,其用于针对不同生物模态,对药物之间相互作用的符 号网络进行图卷积,得到相应特征矩阵,并融合所有生物模态下的特征矩阵;
副作用网络重构模块,其用于通过解码矩阵对融合的特征矩阵中的药物编 码进行解码,得到重构的药物之间的副作用网络;
副作用准确率预测模块,其用于根据重构的药物之间的副作用网络中的信 息得到邻接矩阵,根据邻接矩阵计算预测药物之间的副作用的准确率。
本发明的第三个方面提供一种计算机可读存储介质。
一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行 时实现如上述所述的基于多源异构网络的预测药物之间副作用的方法中的步 骤。
本发明的第四个方面提供一种计算机设备。
一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上 运行的计算机程序,所述处理器执行所述程序时实现如上述所述的基于多源异 构网络的预测药物之间副作用的方法中的步骤。
与现有技术相比,本发明的有益效果是:
(1)本发明提供的基于多源异构网络的预测药物之间副作用的方法,考虑 了药物之间副作用的数据、药物和副作用之间对应关系的数据及药物和不同生 物模态之间对应关系的数据多种生物特征信息,对于药物特征向量的表达更加 全面,而且分考虑到了现实世界中的关于药物的语义信息,预测药物之间的副 作用准确率过程中所应用的模型的可解释性;
(2)本发明借助与药物相关的异构信息,搭建起了药物相互作用符号网络, 该网络中包含了丰富的语义关系,再通过图卷积过程,最终得到药物的特征向 量表达,在多源异构网络上,因此卷积完成之后在各个异构信息方面也就是在 各个生物特征方面都会得到药物的特征向量表达,对各个生物特征方面的药物 特征向量表达进行融合,这种融合方式使药物的最终向量表达更加准确,从而 提高了药物之间副作用的预测准确性。
本发明附加方面的优点将在下面的描述中部分给出,部分将从下面的描述 中变得明显,或通过本发明的实践了解到。
附图说明
构成本发明的一部分的说明书附图用来提供对本发明的进一步理解,本发 明的示意性实施例及其说明用于解释本发明,并不构成对本发明的不当限定。
图1为本发明实施例的基于多源异构网络的预测药物之间副作用的方法流 程图;
图2为本发明实施例的药物符号网络搭建过程流程图;
图3(a)为药物符号网络示例1;
图3(b)为药物符号网络示例2;
图4为本发明实施例的药物之间的拓展平衡理论示意图;
图5为本发明实施例的图卷积神经网络卷积过程流程图;
具体实施方式
下面结合附图与实施例对本发明作进一步说明。
应该指出,以下详细说明都是例示性的,旨在对本发明提供进一步的说明。 除非另有指明,本文使用的所有技术和科学术语具有与本发明所属技术领域的 普通技术人员通常理解的相同含义。
需要注意的是,这里所使用的术语仅是为了描述具体实施方式,而非意图 限制根据本发明的示例性实施方式。如在这里所使用的,除非上下文另外明确 指出,否则单数形式也意图包括复数形式,此外,还应当理解的是,当在本说 明书中使用术语“包含”和/或“包括”时,其指明存在特征、步骤、操作、器件、 组件和/或它们的组合。
实施例一
本实施例采用的数据包括548个药物节点,129种酶,4897种适用症,4897 种副作用,78种转运子。药物之间副作用网络的尺寸为548×548×1316(1316 个种副作用)。如果药物对之间发生副作用,则药物之间副作用网络数据集中的 相应元素标记为1。这里,我们集中研究1316种常见副作用,并且每种副作用 至少出现在500种药物中。药物数据统计如表1所示。
表1药物数据统计
如图1所示,本实施例提供了一种基于多源异构网络的预测药物之间副作 用的方法,其具体包括如下步骤:
步骤S101:获取药物之间副作用的数据、药物和副作用之间对应关系的数 据及药物和不同生物模态之间对应关系的数据,构建不同药物之间相互作用的 符号网络,如图2所示。
本实施例使用的数据分布在三个数据集中。从包括DrugBank和SIDER的 数据库中收集了与毒品有关的数据。DrugBank数据库是具有药物靶标,药物酶 和药物转运蛋白的生物信息学资源。SIDER数据库包含1430种药物和5880种 副作用术语,这些术语是根据公共文档和包装说明书汇编而成的。物副作用和 适应症可在SIDER中获得。药物-药物副作用数据集为:
http://snap.stanford.edu/decagon中使用的药物-药物副作用数据集。
药物-药物副作用数据集的大小为548×548×1316(1316ADR事件)。
需要说明的是,所述生物模态包括但不限于途径、酶、适应症和转运蛋白。
根据不同的生物模态(酶,适应症等),搭建不同的药物之间相互作用的符 号网络,如图2所示:
药物之间是否有积极作用,取决于它们在生物学方式上的相似性。
药物之间的相似性是通过Jaccard相似性标准来计算的。
定义药物之间正作用,在这里我们采用的相似度阈值为0.95。
药物之间的副作用网络被认为是由于联合用药引起的某些不良影响。这些 不良反应大多数是天然药理作用。药物之间的药物之间的副作用关系可以通过 矩阵ADDI-ADR来描述,其元素定义为公式(1)。也就是说,如果药物i和药物j 之间有副作用,则ADDI-ADR(i,j)为1,并且如果药物i和药物j之间的副作用未知, 则ADDI-ADR(i,j)为0。
定义药物之间的正作用步骤:药物之间的副作用关系由矩阵APE描述,其元 素定义为公式(2)。
在此,Sij表示药物i和药物j之间的归一化相似度,并且μ∈[0,1)是阈值。换 句话说,如果Sij>μ,则在药物i和药物j之间有积极作用。否则,如果Sij<μ, 则在药物i和药物j之间没有积极作用。综上所述,这两种药物是否有积极作 用,取决于它们在生物学方式上的相似性。此处,药物i和药物j之间的相似 性由式(3)定义。
给定一个具有特征向量Vi和Vj的药物i和药物j,尽管可以使用其他标准,但 这里的i和j之间的相似性是通过Jaccard相似性标准来计算的。在公式(2) 中,M11是其中Vi和Vj的值都为1的维数;M01是Vi和Vj的值分别为0和1的维数; M10是Vi和Vj的值分别为1和0的维数。
符号网络(DDISN)形式化为GDDISN=(V,E,APE,AADR),其中V是所有 节点的集合,其中节点代表药物);E是所有节点之间的所有关系的集合;AADR是网络GADR的邻接矩阵;APE是网络GDDPE的邻接矩阵。在不失一般性的前提下, 我们假设e(i,j)=e(j,i)。邻接矩阵ADDIPN的元素ADDIPN(i,j)被表示为公式(4)。
符号传播步骤:根据扩展的结构平衡理论,我们可以在DDISN中执行符号 传播。在图3(a)和图3(b)中,实线表示符号代表已知边缘,虚线代表预 测边缘的符号。在反复使用以上理论之后,将传播DDIPN中的符号,并获得 更高阶的DDI信息。
符号传播过程是基于符号传播矩阵(SPM)来完成的,该符号传播矩阵由 ADDISN在上面的部分中初始化。然后,根据结构平衡理论,使用传播操作迭代 更新SPM。详细的迭代过程基于公式(5)和(6)。
SPM0=I
SPM1=ADDISN (7)
在这里,I∈RN×N是一个单位矩阵。
其中,Sign(x)是公式9所示的符号函数。
在DDISN中的符号传播过程之后,我们在DDISN中获得M阶符号传播矩 阵(SPMm)。得到的SPMm就是药物特征网络。
步骤S102:针对不同生物模态,对药物之间相互作用的符号网络进行图卷 积,得到相应特征矩阵,并融合所有生物模态下的特征矩阵。
针对不同的生物模态,对药物的之间的符号网络进行图卷积,如图4所示:
利用深度神经网络对所有生物模态下的特征矩阵进行融合。
图卷积神经网络的配置参数,定义一个图卷积神经网络。在这里,图卷积 神经网络一共有两个隐藏层,第一个隐藏层是32维的,第二个隐藏层是16维 的。我们将tanh函数用作第一层和第二个隐藏层之间的后激活函数。
利用定义好的图卷积神经网络对药物相互作用网络和已知的药物之间的副 作用网络进行卷积。
上述卷积过程分别用于所有类型的生物学特征,例如途径,酶,适应症和 转运蛋白。
针对不同的生物模态,对药物的之间的符号网络进行图卷积的具体步骤为: 输入:不良药物反应相互作用网络的邻接矩阵ArDDI-ADR;培训模型的交互Ep的数 量;卷积神经网络的层数L。
输出:药物特征矩阵H(l)
融合所有生物模态下通过图卷积得到的特征矩阵,如图5所示:
设置深度神经网络的配置参数,定义一个深度神经网络。这里采用的深度 神经网络的隐藏层采用了三个全连接层。
利用定义好的深度神经网络融合所有生物模态下通过图卷积得到的特征矩 阵。
融合所有生物模态下通过图卷积得到的特征矩阵的具体步骤为:
这里采用深层神经网络来融合各个生物特征模态下的特征矩阵,深层神经网 络是一种神经网络,具有许多隐藏层,大致分为三个类别,输入层,隐藏层和 输出层。通常,第一层是输入层,最后一层是输出层,并且所有中间层都是隐 藏层。隐藏层通常完全连接,即,第i层中的任何神经元必须连接到I+1层层 中的任何神经元。虽然深层神经网络看起来很复杂,但它与来自小本地模型的 Perceptron仍然是相同的,即,线性关系z=∑ωixi+b加上激活函数σ(x)。
步骤S103:通过解码矩阵对融合的特征矩阵中的药物编码进行解码,得到 重构的药物之间的副作用网络。
对药物之间的副作用进行预测的具体步骤为:通过具有特定维度的初始化 时随机定义并且后期会不断优化的解码矩阵Xr对融合的特征矩阵中的药物编码 进行解码得到重构的药物之间的副作用网络。具体过程为:
步骤S104:根据重构的药物之间的副作用网络中的信息得到邻接矩阵,根 据邻接矩阵计算预测药物之间的副作用的准确率。
具体地,在重构的药物之间的副作用网络中,若一对药物之间有副作用, 则在邻接矩阵中该药物对的对应位置上的数字为1。
在重构的药物之间的副作用网络中,若一对药物之间没有副作用或副作用 未知,则在邻接矩阵中该药物对的对应位置上的数字为0。
对提出的预测药物之间的副作用模型进行测试:
为了评估提出的预测药物之间的副作用模型,我们使用三个常用指标来评 估模型性能:接收者工作特性曲线(AUROC)下的面积,准确度调用曲线 (AUPRC)下的面积和F1(F1同时考虑分类模型的准确性和召回率)。三个 评估标准和相关概念定义如下。
首先,对于两个分类问题,分类结果为正(P)或负(N)。
1)真实正值(TP):预测值为P,实际值也为P。
2)误报率(FP):预测值为P,实际值为N。
3)真负(TN):预测为N,实际值也为N。
4)假阴性(FN):预测值为N,但实际值为P。
真实阳性率(TPR)是所有阳性样品中阳性样品的概率,即模型对阳性样品 的敏感性。假阳性率(FPR)是所有阴性样品中阳性样品的概率,即模型对阴 性样品的敏感性。TPR和FPR定义如下。
以FDR为x轴,以TPR为y轴,可以通过设置不同的分类阈值来获得接收 器工作特性曲线(ROC)。AUROC值越大,模型的识别性能越好。当测试集 中正样本和负样本的分布发生变化时,ROC曲线可以保持稳定。因此,AUROC 值保持稳定。因此,AUROC指数非常稳定。
其次,准确性的概念是正确分类的样本占样本总数的比例。召回的定义与 TPR相同,后者是阳性样本的概率。精度和召回率的定义如下。
以召回率作为x轴,以精度作为y轴,可以通过设置不同的分类阈值来获 得精确召回曲线(PRC)。AUPRC是PR曲线下面积。注意,当正样本和负样 本的比例完全不同时,AUPRC可以反映实际的分类性能。因此,与AUROC(ROC 曲线下面积)值相比,AUPRC值可以更好地反映分类器的质量。
在这里,Precision(i)是i在测试集预测结果的排名列表中的位置之前的精 度。F1分数的计算方式如下:
我们提出的预测药物之间的副作用模型的三个指标的成绩如表2所示:
表2提出的预测药物之间的副作用模型的成绩
AUROC | AUPRC | F1 |
0.97302 | 0.98285 | 0.93083 |
实施例二
本实施例提供了一种基于多源异构网络的预测药物之间副作用的系统,其 具体包括如下模块:
符号网络构建模块,其用于获取药物之间副作用的数据、药物和副作用之 间对应关系的数据及药物和不同生物模态之间对应关系的数据,构建不同药物 之间相互作用的符号网络;
特征矩阵融合模块,其用于针对不同生物模态,对药物之间相互作用的符 号网络进行图卷积,得到相应特征矩阵,并融合所有生物模态下的特征矩阵;
副作用网络重构模块,其用于通过解码矩阵对融合的特征矩阵中的药物编 码进行解码,得到重构的药物之间的副作用网络;
副作用准确率预测模块,其用于根据重构的药物之间的副作用网络中的信 息得到邻接矩阵,根据邻接矩阵计算预测药物之间的副作用的准确率。
此处需要说明的是,本实施例的基于多源异构网络的预测药物之间副作用 的系统中的各个模块,与实施例一中的基于多源异构网络的预测药物之间副作 用的方法中的各个步骤一一对应,其具体实施过程相同,此处不再累述。
实施例三
本实施例提供了一种计算机可读存储介质,其上存储有计算机程序,该程 序被处理器执行时实现如上述实施例一所述的基于多源异构网络的预测药物之 间副作用的方法中的步骤。
实施例四
本实施例提供了一种计算机设备,包括存储器、处理器及存储在存储器上 并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现如上述实 施例一所述的基于多源异构网络的预测药物之间副作用的方法中的步骤。
本领域内的技术人员应明白,本发明的实施例可提供为方法、系统、或计 算机程序产品。因此,本发明可采用硬件实施例、软件实施例、或结合软件和 硬件方面的实施例的形式。而且,本发明可采用在一个或多个其中包含有计算 机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器和光学存储器 等)上实施的计算机程序产品的形式。
本发明是参照根据本发明实施例的方法、设备(系统)、和计算机程序产品的 流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框 图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。 可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他 可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程 数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程 和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备 以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的 指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流 程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使 得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处 理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个 流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程, 是可以通过计算机程序来指令相关的硬件来完成,所述的程序可存储于一计算 机可读取存储介质中,该程序在执行时,可包括如上述各方法的实施例的流程。 其中,所述的存储介质可为磁碟、光盘、只读存储记忆体(Read-Only Memory, ROM)或随机存储记忆体(RandomAccessMemory,RAM)等。
以上所述仅为本发明的优选实施例而已,并不用于限制本发明,对于本领 域的技术人员来说,本发明可以有各种更改和变化。凡在本发明的精神和原则 之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之 内。
Claims (10)
1.一种基于多源异构网络的预测药物之间副作用的方法,其特征在于,包括:
获取药物之间副作用的数据、药物和副作用之间对应关系的数据及药物和不同生物模态之间对应关系的数据,构建不同药物之间相互作用的符号网络;
针对不同生物模态,对药物之间相互作用的符号网络进行图卷积,得到相应特征矩阵,并融合所有生物模态下的特征矩阵;
通过解码矩阵对融合的特征矩阵中的药物编码进行解码,得到重构的药物之间的副作用网络;
根据重构的药物之间的副作用网络中的信息得到邻接矩阵,根据邻接矩阵计算预测药物之间的副作用的准确率。
2.如权利要求1所述的基于多源异构网络的预测药物之间副作用的方法,其特征在于,在重构的药物之间的副作用网络中,若一对药物之间有副作用,则在邻接矩阵中该药物对的对应位置上的数字为1。
3.如权利要求1所述的基于多源异构网络的预测药物之间副作用的方法,其特征在于,在重构的药物之间的副作用网络中,若一对药物之间没有副作用或副作用未知,则在邻接矩阵中该药物对的对应位置上的数字为0。
4.如权利要求1所述的基于多源异构网络的预测药物之间副作用的方法,其特征在于,利用深度神经网络对所有生物模态下的特征矩阵进行融合。
5.如权利要求1所述的基于多源异构网络的预测药物之间副作用的方法,其特征在于,所述生物模态包括途径、酶、适应症和转运蛋白。
6.如权利要求1所述的基于多源异构网络的预测药物之间副作用的方法,其特征在于,药物之间是否有积极作用,取决于它们在生物学方式上的相似性。
7.如权利要求6所述的基于多源异构网络的预测药物之间副作用的方法,其特征在于,药物之间的相似性是通过Jaccard相似性标准来计算的。
8.一种基于多源异构网络的预测药物之间副作用的系统,其特征在于,包括:
符号网络构建模块,其用于获取药物之间副作用的数据、药物和副作用之间对应关系的数据及药物和不同生物模态之间对应关系的数据,构建不同药物之间相互作用的符号网络;
特征矩阵融合模块,其用于针对不同生物模态,对药物之间相互作用的符号网络进行图卷积,得到相应特征矩阵,并融合所有生物模态下的特征矩阵;
副作用网络重构模块,其用于通过解码矩阵对融合的特征矩阵中的药物编码进行解码,得到重构的药物之间的副作用网络;
副作用准确率预测模块,其用于根据重构的药物之间的副作用网络中的信息得到邻接矩阵,根据邻接矩阵计算预测药物之间的副作用的准确率。
9.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现如权利要求1-7中任一项所述的基于多源异构网络的预测药物之间副作用的方法中的步骤。
10.一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述程序时实现如权利要求1-7中任一项所述的基于多源异构网络的预测药物之间副作用的方法中的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110583454.6A CN113362963B (zh) | 2021-05-27 | 2021-05-27 | 基于多源异构网络的预测药物之间副作用的方法及系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110583454.6A CN113362963B (zh) | 2021-05-27 | 2021-05-27 | 基于多源异构网络的预测药物之间副作用的方法及系统 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN113362963A true CN113362963A (zh) | 2021-09-07 |
CN113362963B CN113362963B (zh) | 2024-04-02 |
Family
ID=77527839
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110583454.6A Active CN113362963B (zh) | 2021-05-27 | 2021-05-27 | 基于多源异构网络的预测药物之间副作用的方法及系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113362963B (zh) |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113793696A (zh) * | 2021-09-15 | 2021-12-14 | 中南大学 | 一种基于相似性的新药副作用发生频率预测方法、系统、终端及可读存储介质 |
CN114822691A (zh) * | 2022-04-13 | 2022-07-29 | 上海人工智能创新中心 | 基于图卷积神经网络的临床事件预测装置 |
CN116453710A (zh) * | 2023-06-14 | 2023-07-18 | 中国地质大学(武汉) | 一种药物副作用预测方法、装置、电子设备及存储介质 |
CN116994700A (zh) * | 2023-03-31 | 2023-11-03 | 北京诺道认知医学科技有限公司 | 基于深度学习的喹硫平剂量个体化推荐方法及装置 |
CN116994700B (zh) * | 2023-03-31 | 2024-06-04 | 北京诺道认知医学科技有限公司 | 基于深度学习的喹硫平剂量个体化推荐方法及装置 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111310996A (zh) * | 2020-02-13 | 2020-06-19 | 山东师范大学 | 基于图自编码网络的用户信任关系预测方法及系统 |
CN111401514A (zh) * | 2020-02-13 | 2020-07-10 | 山东师范大学 | 基于改进图卷积网络的半监督符号网络嵌入方法及系统 |
CN112382411A (zh) * | 2020-11-13 | 2021-02-19 | 大连理工大学 | 一种基于异质图的药物-蛋白质靶向作用预测方法 |
KR102225278B1 (ko) * | 2020-01-31 | 2021-03-10 | 주식회사 스탠다임 | 질의되는 개체와 관련되는 질병, 유전자 또는 단백질을 예측하는 방법 및 이를 이용하여 구축되는 예측 시스템 |
-
2021
- 2021-05-27 CN CN202110583454.6A patent/CN113362963B/zh active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR102225278B1 (ko) * | 2020-01-31 | 2021-03-10 | 주식회사 스탠다임 | 질의되는 개체와 관련되는 질병, 유전자 또는 단백질을 예측하는 방법 및 이를 이용하여 구축되는 예측 시스템 |
CN111310996A (zh) * | 2020-02-13 | 2020-06-19 | 山东师范大学 | 基于图自编码网络的用户信任关系预测方法及系统 |
CN111401514A (zh) * | 2020-02-13 | 2020-07-10 | 山东师范大学 | 基于改进图卷积网络的半监督符号网络嵌入方法及系统 |
CN112382411A (zh) * | 2020-11-13 | 2021-02-19 | 大连理工大学 | 一种基于异质图的药物-蛋白质靶向作用预测方法 |
Non-Patent Citations (1)
Title |
---|
侯美好: "基于图神经网络的药物不良相互作用预测", 《中国优秀硕士学位论文全文数据库 医药卫生科技辑》 * |
Cited By (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113793696A (zh) * | 2021-09-15 | 2021-12-14 | 中南大学 | 一种基于相似性的新药副作用发生频率预测方法、系统、终端及可读存储介质 |
CN113793696B (zh) * | 2021-09-15 | 2023-11-14 | 中南大学 | 一种基于相似性的新药副作用发生频率预测方法、系统、终端及可读存储介质 |
CN114822691A (zh) * | 2022-04-13 | 2022-07-29 | 上海人工智能创新中心 | 基于图卷积神经网络的临床事件预测装置 |
CN116994700A (zh) * | 2023-03-31 | 2023-11-03 | 北京诺道认知医学科技有限公司 | 基于深度学习的喹硫平剂量个体化推荐方法及装置 |
CN116994700B (zh) * | 2023-03-31 | 2024-06-04 | 北京诺道认知医学科技有限公司 | 基于深度学习的喹硫平剂量个体化推荐方法及装置 |
CN116453710A (zh) * | 2023-06-14 | 2023-07-18 | 中国地质大学(武汉) | 一种药物副作用预测方法、装置、电子设备及存储介质 |
CN116453710B (zh) * | 2023-06-14 | 2023-09-22 | 中国地质大学(武汉) | 一种药物副作用预测方法、装置、电子设备及存储介质 |
Also Published As
Publication number | Publication date |
---|---|
CN113362963B (zh) | 2024-04-02 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Lucca et al. | CC-integrals: Choquet-like copula-based aggregation functions and its application in fuzzy rule-based classification systems | |
Gopika et al. | Correlation based feature selection algorithm for machine learning | |
Razavi-Far et al. | Similarity-learning information-fusion schemes for missing data imputation | |
Tama et al. | Tree-based classifier ensembles for early detection method of diabetes: an exploratory study | |
CN111695415A (zh) | 图像识别模型的构建方法、识别方法及相关设备 | |
Tran et al. | An effective and efficient approach to classification with incomplete data | |
Vijaya et al. | Computing efficient features using rough set theory combined with ensemble classification techniques to improve the customer churn prediction in telecommunication sector | |
Meyer | Information-theoretic variable selection and network inference from microarray data | |
US9043326B2 (en) | Methods and systems for biclustering algorithm | |
CN113362963B (zh) | 基于多源异构网络的预测药物之间副作用的方法及系统 | |
Sarwar et al. | A survey of big data analytics in healthcare | |
Henríquez et al. | Twitter sentiment classification based on deep random vector functional link | |
CN112599187B (zh) | 一种基于双流神经网络预测药物与靶标蛋白结合分数的方法 | |
Mahanipour et al. | Using fuzzy-rough set feature selection for feature construction based on genetic programming | |
CN114329029A (zh) | 对象检索方法、装置、设备及计算机存储介质 | |
Kovalchuk et al. | A Scoring Model for Support Decision Making in Criminal Justice | |
Rijal et al. | Integrating Information Gain methods for Feature Selection in Distance Education Sentiment Analysis during Covid-19. | |
Samel et al. | Active deep learning to tune down the noise in labels | |
US20230352123A1 (en) | Automatic design of molecules having specific desirable characteristics | |
Aktukmak et al. | Any-Shot Learning From Multimodal Observations (ALMO) | |
Monner et al. | Recurrent neural collective classification | |
Usman et al. | Filter-based feature selection: a comparison among binary and continuous Cuckoo optimisation algorithms along with multi-objective optimisation algorithms using gain ratio-based entropy | |
Dubitzky et al. | Data mining and machine learning methods for microarray analysis | |
Radišić et al. | Impact of missing values on the performance of machine learning algorithms | |
Pham et al. | Relational dynamic memory networks |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |