CN116403730A - 一种基于图神经网络的药物相互作用预测方法及系统 - Google Patents

一种基于图神经网络的药物相互作用预测方法及系统 Download PDF

Info

Publication number
CN116403730A
CN116403730A CN202310376573.3A CN202310376573A CN116403730A CN 116403730 A CN116403730 A CN 116403730A CN 202310376573 A CN202310376573 A CN 202310376573A CN 116403730 A CN116403730 A CN 116403730A
Authority
CN
China
Prior art keywords
drug
molecular
interaction
graph
network
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202310376573.3A
Other languages
English (en)
Inventor
张维玉
韩慧
朱子红
明岩
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Qilu University of Technology
Original Assignee
Qilu University of Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Qilu University of Technology filed Critical Qilu University of Technology
Priority to CN202310376573.3A priority Critical patent/CN116403730A/zh
Publication of CN116403730A publication Critical patent/CN116403730A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H70/00ICT specially adapted for the handling or processing of medical references
    • G16H70/40ICT specially adapted for the handling or processing of medical references relating to drugs, e.g. their side effects or intended usage
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • G06N3/084Backpropagation, e.g. using gradient descent
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B15/00ICT specially adapted for analysing two-dimensional or three-dimensional molecular structures, e.g. structural or functional relations or structure alignment
    • G16B15/30Drug targeting using structural data; Docking or binding prediction
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02ATECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
    • Y02A90/00Technologies having an indirect contribution to adaptation to climate change
    • Y02A90/10Information and communication technologies [ICT] supporting adaptation to climate change, e.g. for weather forecasting or climate simulation

Landscapes

  • Engineering & Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Physics & Mathematics (AREA)
  • General Health & Medical Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Theoretical Computer Science (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Biophysics (AREA)
  • Medical Informatics (AREA)
  • Medicinal Chemistry (AREA)
  • Pharmacology & Pharmacy (AREA)
  • Artificial Intelligence (AREA)
  • Biomedical Technology (AREA)
  • Crystallography & Structural Chemistry (AREA)
  • Epidemiology (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Biotechnology (AREA)
  • Evolutionary Biology (AREA)
  • Public Health (AREA)
  • Primary Health Care (AREA)
  • Toxicology (AREA)
  • Computational Linguistics (AREA)
  • Data Mining & Analysis (AREA)
  • Evolutionary Computation (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Medical Treatment And Welfare Office Work (AREA)

Abstract

本发明提出了一种基于图注意力网络的药物相互作用预测方法及系统,包括:获取待预测的两种药物的分子图;利用键感知消息传递神经网络将药物的分子图进行编码;获取药物‑药物相互作用关系DDI网络图;将分子图的嵌入向量作为DDI网络图的特征向量,使用多层图注意力网络融合特征向量和外部DDI特征,获得更新后的药物分子表示向量;将更新后的药物分子表示向量输入至交互预测器,得到待预测的两种药物之间的相互作用关系。本发明提出了一种基于图注意力网络的多视图特征融合策略—MV‑GAT来预测药物相互作用。它采用包含自注意机制的键感知消息传递神经网络的图表示学习法,实现了从多视图角度对DDI进行准确预测。

Description

一种基于图神经网络的药物相互作用预测方法及系统
技术领域
本发明属于药物相互作用预测技术领域,尤其涉及一种基于图神经网络的药物相互作用预测方法及系统。
背景技术
本部分的陈述仅仅是提供了与本发明相关的背景技术信息,不必然构成在先技术。
药物相互作用一直以来被描述为一种药物的药效因另一种药物的存在而发生的变化。随着获得批准的药物数量迅速增长,通过使用联合药物处方来治疗患者疾病已成为一种普遍现象。然而,同时使用多种药物可能会导致药物不良反应(Adverse DrugReaction,ADR)。有效识别潜在的药物相互作用(Drug-Drug Interaction,DDI)可以最小化意外ADR并最大限度地发挥协同效应,因此,为了缓解意外药理作用的影响,预测潜在的DDI对医生、患者和社会至关重要。
尽管DDI可以通过体内和体外实验来鉴定,但由于药物数量众多,传统的实验方法既耗时繁琐又成本高昂,一方面几乎不可能对每两种药物都进行DDI测试,另一方面还可能限制DDI检测的效率。因此,开发一种新的计算方法来辅助完成DDI预测显得尤为重要。
近年来,图数据结构领域的大量研究人员促进了图数据结构分析技术的高度推广,基于图表示学习的方法已被广泛应用于药物-药物相互作用的预测。由于每一种药物都可以用以原子为节点,化学键为边的分子图来表示,图形神经网络(GNN)显示了药物分子令人印象深刻的表示学习能力。
在大多数DDI预测算法中,药物表示学习方法将信息建模在单一视图上,它仅限于考虑药物的结构、序列或相互作用信息,未考虑药物之间的协同作用,因此可能阻碍DDI预测精度的提高。同时,在信息融合阶段,以往基于图的研究未考虑到不同邻居的重要性,导致顶点特征之间的相关性未能很好地融入到模型中。此外,在DDI网络中,通过堆叠多层GNN得到的节点特征会变得平滑和模糊化,未能很好地整合药物嵌入的信息。
发明内容
为克服上述现有技术的不足,本发明提供了一种基于图注意力网络的药物相互作用预测方法及系统,采用键感知消息传递神经网络的图表示学习法来获取分子图中每个原子的局部特征和分子图的全局特征。同时,提出了一种基于注意力机制的融合策略来处理每个视图下药物特征和拓扑信息的融合,它可以有效地整合从分子图和相互作用图中提取的特征。此外,为保证节点特征的多样性,在每个GNN层中使用无监督对比学习组件来解决信息传递过程中的过平滑问题。
为实现上述目的,本发明的一个或多个实施例提供了如下技术方案:
本发明第一方面提供了一种基于图注意力网络的药物相互作用预测方法,包括:
获取待预测的两种药物的分子图;
利用键感知消息传递神经网络将药物的分子图进行编码,获取相应的分子图的嵌入向量;
获取待预测的两种药物与其已知相互作用关系药物的药物-药物相互作用关系DDI(drug-drug interaction)网络图;
将分子图的嵌入向量作为DDI网络图的特征向量,使用多层图注意力网络融合特征向量和外部DDI特征,获得更新后的药物分子表示向量;
将更新后的药物分子表示向量输入至交互预测器,得到待预测的两种药物之间的相互作用关系。
本发明第二方面提供了一种基于图注意力网络的药物相互作用预测系统,包括:
药物的分子图获取模块,被配置为:获取待预测的两种药物的分子图;
分子图编码模块,被配置为:利用键感知消息传递神经网络将药物的分子图进行编码,获取相应的分子图的嵌入向量;
DDI网络图获取模块,被配置为:获取待预测的两种药物与其已知相互作用关系药物的药物-药物相互作用关系DDI(drug-drug interaction)网络图;
药物分子表示向量更新模块,被配置为:将分子图的嵌入向量作为DDI网络图的特征向量,使用多层图注意力网络融合特征向量和外部DDI特征,获得更新后的药物分子表示向量;
相互作用关系预测模块,被配置为:将更新后的药物分子表示向量输入至交互预测器,得到待预测的两种药物之间的相互作用关系。
本发明第三方面提供了计算机可读存储介质,其上存储有程序,该程序被处理器执行时实现如本发明第一方面所述的一种基于图注意力网络的药物相互作用预测方法中的步骤。
本发明第四方面提供了电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的程序,所述处理器执行所述程序时实现如本发明第一方面所述的一种基于图注意力网络的药物相互作用预测方法中的步骤。
以上一个或多个技术方案存在以下有益效果:
(1)本发明提出了一种基于图注意力网络的多视图特征融合策略—MV-GAT来预测药物相互作用。它采用包含自注意机制的键感知消息传递神经网络的图表示学习法,实现了从多视图角度对DDI进行准确预测。
(2)为了更好的融合多视图信息,本发明提出了一种基于注意力机制的融合策略来处理每个视图下药物特征和拓扑信息的融合,它可以有效地整合从药物分子图和相互作用图中提取的特征;通过在三个不同规模数据集上进行的大量实验表明,与各种基线方法相比,本发明提供的MV-GAT具有良好的泛化性能。
本发明附加方面的优点将在下面的描述中部分给出,部分将从下面的描述中变得明显,或通过本发明的实践了解到。
附图说明
构成本发明的一部分的说明书附图用来提供对本发明的进一步理解,本发明的示意性实施例及其说明用于解释本发明,并不构成对本发明的不当限定。
图1为第一个实施例的一种基于图注意力网络的药物相互作用预测方法流程图。
图2(a)和图2(b)分别为第一个实施例的待预测药物I和药物J的分子图。
图3为第一个实施例的DDI网络图。
图4为第一个实施例的图对比学习方法流程图。
具体实施方式
实施例一
如图1所示,本实施例公开了一种基于图注意力网络的药物相互作用预测方法,包括:
步骤1、获取待预测的两种药物的分子图;
步骤2、使用键感知消息传递神经网络将药物分子图数据编码为相应的低维嵌入向量;
步骤3、获取待预测的两种药物与其已知相互作用关系药物之间的药物-药物相互作用关系DDI网络图;
步骤4、将分子图的嵌入向量作为DDI网络图的特征向量,使用多层图注意力网络融合特征向量和外部DDI特征,获得更新后的药物分子表示向量;
步骤5、将更新后的药物分子表示向量输入至交互预测器,得到待预测的两种药物之间的相互作用关系。
在步骤1中,如图2(a)和图2(b)所示,分别为待预测的药物A和药物B的图表示,其中,一个节点(圆圈)代表一个原子,一条边(黑色直线)代表一个化学键。
图G由
Figure BDA0004170620400000061
表示,其中/>
Figure BDA0004170620400000062
是节点集,/>
Figure BDA0004170620400000063
是边集。更具体地,将药物I的节点集中第i个原子表示为节点/>
Figure BDA0004170620400000064
将药物J的节点集中第j个原子表示为节点/>
Figure BDA0004170620400000065
第i和第j个原子节点之间连接的无向化学键表示为/>
Figure BDA0004170620400000066
在步骤2中,针对药物的分子图(由原子和化学键构成),本发明使用键感知消息传递神经网络(BAMPN)将药物分子图数据编码为相应的低维嵌入向量。根据基本的化学知识,为模型配备一个基于传播的消息传递层,并为图形读出层配备了注意池,以此来实现图形的迭代更新过程。
迭代更新过程:
具体来说,本发明首先定义了一个消息函数,将每个药物分子视为一个图,分子中每个原子视为节点v,连接原子之间的化学键视为边ε。通过堆叠每个原子的随机初始化嵌入向量(考虑其核电荷数)和多通道邻接矩阵来构建节点特征向量矩阵,其中,多通道邻接矩阵中通道维度指示不同的化学键类型,包括单键、双键、三键和芳香键。对于分子图中任意一个节点(原子),将具有相同化学键类型的邻居节点信息同时聚合,然后将得到的聚合结果与当前节点在上一层学习到的向量表示进行拼接,从而得到新的节点表示向量。可以用以下消息函数描述:
Figure BDA0004170620400000071
Figure BDA0004170620400000072
其中,式(1)中
Figure BDA0004170620400000073
是在第l层由相同类型的化学键eij共享的可训练参数矩阵,/>
Figure BDA0004170620400000074
表示在第l-1层邻居节点vj的候选隐藏状态,/>
Figure BDA0004170620400000075
表示在第l层节点vi的候选隐藏状态,C(i)表示中心节点vi对应的相邻节点vj的集合,/>
Figure BDA0004170620400000076
表示在第-1层节点i的候选隐藏状态,/>
Figure BDA0004170620400000077
表示第l层节点vi的隐藏状态,/>
Figure BDA0004170620400000078
表示拼接后的节点vi的表示向量;式(2)中[;]表示沿着特征维度的串联操作;
对本文中采用的符号进行详细总结说明:其中大写粗体字母表示矩阵(例如
Figure BDA0004170620400000079
),小写粗体字母表示矢量(例如/>
Figure BDA00041706204000000710
),非粗体小写字母表示标量(例如dg表示分子水平嵌入的维度,dh表示原子级嵌入的维度)。
公式(1)中相邻节点vi向中心节点vj发送的消息被建模为线性变换,其可训练权重参数由具有相同类型化学键的边共享。节点级相互作用的建模在化学上有一个直观的解释:来自具有相同化学键的相邻原子的影响将是相似的,而来自具有不同化学键的原子的影响将非常不同。公式(1)描述了相邻节点对聚焦中心节点的影响,但还要考虑上一层中心节点的影响。所以设计了融合门层融合候选隐藏状态
Figure BDA00041706204000000711
和之前的隐藏状态/>
Figure BDA00041706204000000712
最后的输出过程输堆叠多个图卷积层(总共L层)来学习图G中每个节点v的嵌入。
具体的:
为了进一步考虑相邻节点以及上一层学习到的节点向量对中心节点的影响,本发明定义了三层变换函数,通过“融合”门F(fuse gate)、“变换”门T(transform gate)以及“进位”门C(carry gate),更新节点的表示向量。该过程可描述为以下更新函数:
Figure BDA0004170620400000081
Figure BDA0004170620400000082
Figure BDA0004170620400000083
Figure BDA0004170620400000084
其中,⊙表示元素之间的乘积;
Figure BDA0004170620400000085
为融合门,/>
Figure BDA0004170620400000086
为变换门,/>
Figure BDA0004170620400000087
为进位门,它们分别表示通过变换候选和先前隐藏状态的融合并携带它来产生多少隐藏状态。通过这个更新过程,既可以考虑相邻节点对集中中心节点的影响,也可以考虑上一层自身对集中中心节点的影响;σ表示激活函数;bF、bT和bC分别表示融合门、变换门和进位门的偏置参数,WF、WT和WC分别表示融合门F、变换门T和进位门C的权重参数。
输出过程:
本发明堆叠了多个消息传递层(总共L层)来学习分子图G中每个节点/原子v的嵌入。在最终的消息传递层中,获得每个节点的最终隐藏状态。为了使用药物表示进行预测,需要为每个分子图生成嵌入向量g以表示整个图形。因此,本发明采用了一种简单但高效的基于注意力的图池化层,如下所示:
Figure BDA0004170620400000091
Figure BDA0004170620400000092
其中σ表示激活函数,
Figure BDA0004170620400000093
是每个原子节点vi的随机初始化嵌入向量,/>
Figure BDA0004170620400000094
是第L个图卷积层(最后一个)中的节点vi的隐藏状态,注意力得分/>
Figure BDA0004170620400000095
表示原子的重要性,⊙表示Hadamard乘法,/>
Figure BDA0004170620400000096
是获得的分子图的嵌入向量,其中g={g1,g2,...,gn},dg表示分子水平嵌入的维度,需要注意的是参数在所有节点之间都共享;
W表示权重参数;第i个原子表示为vi∈V;Wa、ba表示计算注意力得分时的权重和偏置参数,计算分子图嵌入向量g时,表示偏置参数。
在步骤3中,构建的DDI网络图如图3所示,在多视图中,药物I和药物J用内部显示了药物自身化学结构的图表示,双向箭头的实线和虚线表示药物I和药物J现有的和可能的相互作用。
本文中DDI预测任务可以定义为图3上的链路预测问题。给定已经定义好的的药物分子图
Figure BDA0004170620400000097
和DDI网络图/>
Figure BDA0004170620400000098
其中/>
Figure BDA0004170620400000099
表示药物分子之间的交互链路。对于DDI网络图D,MV-GAT模型的主要任务为预测药物分子之间缺失链路的存在。
在步骤4中,为了学习到DDI网络中药物的表示向量,考虑到药物分子的不同相邻分子节点重要性可能不同,采用自注意机制来自适应地学习权重。使用上一步学习到的分子图的嵌入向量g={g1,g2,...,gn}作为GAT网络的特征向量,进而学习DDI网络图D中药物分子间的相互作用信息,针对DDI网络图中每个分子节点实行self-attention的注意力机制,注意力系数为:
Figure BDA0004170620400000101
其中||表示串联操作,T表示转置,w表示参数矩阵。gI和gJ分别表示药物I和药物J的特征向量。类似地,通过此操作可以获得其他相邻分子节点的关注度分数;注意力机制是一个单层的前馈神经网络,在该前馈神将网络的输出层上加入了LeakyReLu函数,LeakyReLu在这里表示一个函数,即给所有负值赋予一个非零斜率。
为了使得注意力系数更容易计算和便于比较,引入了softmax函数对分子节点I所有的邻居分子节点J进行正则化,得到注意力机制αIJ
Figure BDA0004170620400000102
其中C(I)表示分子节点I的所有相邻的药物分子节点的集合。最后,对平均值进行加权以更新分子节点表示,从而得到最后的分子表示向量z:
Figure BDA0004170620400000103
同理公式(11),可得到分子节点J的表示向量zJ
利用正则化后的不同分子节点之间的注意力系数,可以用来预测每个节点的输出特征。公式(11)表示该分子节点的输出特征与和它相邻的所有分子节点有关,是它们的线性和的非线性激活后得到的;
在获得药物分子的表示向量后,本发明基于图对比学习框架整合多视角药物表示向量:
在步骤4中直接堆叠GCN与GAT层之后,一方面,虽然它有助于使同一集群中的节点表示趋于近似,但药物分子图内部特征在整个DDI网络图上可能会变得更加平滑,从而丧失节点特征的多样性。另一方面,药物分子图嵌入时,直接从分子图中学习节点的原始属性和结构信息,这些信息对DDI预测具有重要影响。具体来说,其表示包含由相同原子和化学键的各种组合所构建的不同的局部连接以及分子内的多个官能团信息等。由于节点特征信息过于集中也可能会导致所获得的嵌入缺乏相应的结构信息,因此,针对药物嵌入的多视图信息可能存在的问题,本发明利用图对比表示学习框架来对其进行处理;
如图4所示,采用图对比学习的方式来平衡药物内外的信息。具体而言,对于每一种药物I,将自己固定为锚A,则正样本
Figure BDA0004170620400000111
由自身及其它的k-order相邻节点组成,负样本/>
Figure BDA0004170620400000112
由其k-hop邻居以外的节点组成,通常设置k=1。接下来,(A,P)其中/>
Figure BDA0004170620400000113
和(A,N)其中
Figure BDA0004170620400000114
分别表示生成的正样本对和负样本对。应该注意的是,负样本由多视图中全部药物的可能出现的所有嵌入组合生成,这意味着在所有药物中对负对进行采样。接下来,通过使用对比目标,以加强DDI网络图内锚点A的与药物分子图中的正样本表示一致,并且可以与负样本的药物分子图表示区分开来。对比目标制定如下:
Figure BDA0004170620400000121
式中
Figure BDA0004170620400000122
是由/>
Figure BDA0004170620400000123
建模的互信息估计器,其中/>
Figure BDA0004170620400000124
是带有参数ω的神经网络建模的鉴别器函数,φ和ψ分别表示BAMPN和GAT编码器的一组参数,/>
Figure BDA0004170620400000125
基于对比学习的方法主要集中于关注互信息(MI)最大化,即最大化其输入和输出之间的互信息,而不关注其精确值,而KL散度是一种用于衡量两个概率分布之间差异的方法。在信息论中,KL散度被用于衡量两个概率分布P和Q之间的差异,其值越小,表示两个分布越相似。而MI(互信息)是一种用于衡量两个随机变量之间的相关性的方法。利用KL散度实现MI最大化的目的是为了找到一个近似分布Q,使得它与真实分布P的差异最小,从而使得它们之间的互信息最大化。因此,本发明可以依赖KL散度表示上使用的MI下限,这在实践中可能会获得更好的性能,其公式如下::
Figure BDA0004170620400000126
其中x是输入样本,x′是从
Figure BDA0004170620400000127
采样得出的输入样本,/>
Figure BDA0004170620400000128
表示经验概率分布,并且sp(y)=log(1+ey)是softplus function软加函数。由于/>
Figure BDA0004170620400000129
与包含两个视图信息的样本有较高的MI,这有利于对不同样本和视图中共享的数据进行编码。
在步骤5中,首先,将步骤4中得到的药物分子对特征向量压缩成相互作用链接嵌入向量:
f(zI,zJ)=zI⊙zJ (14)
其中
Figure BDA0004170620400000131
接下来,通过所获得的药物对嵌入向量,应用两个全连接层以预测药物对之间发生相互作用的概率,用p(此处,p为小写字母)表示:
p=σ(WpReLU(Wff(zI,zJ)+bf)+bp) (15)
其中
Figure BDA0004170620400000132
当对药物对之间的相互作用进行预测时,k为2。除此之外,通过将消息传递网络最后一层与一个完全连接层和一个sigmoid变换函数级联来设计辅助预测器。其中,药物分子图中相互作用预测结果用/>
Figure BDA0004170620400000133
表示。因此,对应于两个不同的预测器得到了两个预测结果。需要注意的是,本发明只使用p进行DDI的最终预测。
其中,相互作用预测器的训练为:在训练过程中,通过设计的两个交互作用预测器,主要目标是既能最小化预测值与真实标签之间的距离(用
Figure BDA0004170620400000134
表示),也可以尽量减小两个预测器预测结果之间的差距(用/>
Figure BDA0004170620400000135
表示),使模型更加关注两个不同视图之间的共性以及两种预测值之间的一致性。
Figure BDA0004170620400000141
其中
Figure BDA0004170620400000142
表示监督损失,/>
Figure BDA0004170620400000143
表示不一致损失,公式表示已标记交互链接的监督损失和未标记交互链接的分歧损失。yI是lI的真实标签,/>
Figure BDA0004170620400000144
和/>
Figure BDA0004170620400000145
分别表示/>
Figure BDA0004170620400000146
中的标记链接和未标记链接,/>
Figure BDA0004170620400000147
是交叉熵损失函数,/>
Figure BDA0004170620400000148
是Kullback-Leibler散度。
因此,目标函数为:
Figure BDA0004170620400000149
本发明将DDI预测任务和对比学习任务统一到学习框架中,
Figure BDA00041706204000001410
表示对比学习损失。其中α和β是用于控制不同损失分量大小的超参数。同时,使用反向传播算法来找到可训练参数的最佳解ω,φ,。
为了验证本发明提出的MV-GAT的有效性,使用三个不同规模大小的数据集来评估所提出的模型。
·对于小规模数据集,采用BinaryDDI,该数据集包含548种药物和48548个成对DDI以及关于这些药物对的多种类型的成对相似性信息,其中所有药物的指纹都可用。
·对于中等规模数据集,采用ChCh-Miner,该数据集虽然药物数量相对较多,但只有与BinaryDDI相似数量的DDI链接,其涵盖1514种药物和48514个DDI链接。
·对于大规模数据集,采用MultiDDI:该数据集中每种药物都表示为规范的SMILES字符串。在数据预处理中删除了无法转换为图的数据项。最终数据集包含1704个分子和192,284个相互作用对。
为了说明本发明提出的模型与最先进的DDI预测方法相比的优越性,本实施例实施了以下基线方法来比较它们的性能:
·Nearest Neighbor:使用已知的药物对之间的相互作用和从子结构得出的相似性来进行DDI预测,将该模型简称为NN。
·多特征集成(Multi-Feature Ensemble):基于邻居推荐(NR)、标签传播(LP)和矩阵扰动(MD)三种不同的算法上构建的混合集成模型,将模型命名为Ens。
·GCN:基于GCN来执行半监督节点分类任务,应用GCN来编码药物分子图,提取药物的结构信息以进行预测。
·GAT:基于GAT通过在图上设计良好的注意机制来学习节点嵌入本实施例使用GAT获得DDI图中的药物嵌入进行预测。
·SEAL-CI:从层次图的角度执行半监督图分类任务。本实施例使用该模型来学习DDI预测的药物特征。
·NFP-GCN:为针对分子指纹的图神经网络,它是第一个图卷积算子。将该模型简称为NFP-GCN。
·MIRACLE:该模型同时学习了用于DDI预测的药物的视图间分子结构信息和视图内相互作用信息。实验结果如表1所示:
表1
Figure BDA0004170620400000161
通过对比表1中药物相互作用预测实验结果可知。本实施例的方法MV-GAT在三个数据集上均得到了出色结果。在BinaryDDI数据集上,所有基线的药物特征都可用于DDI预测任务。在多视图模型中,SEAL-CI、NFP-GCN和MIRACLE的结果优于其他基线模型,说明多视图的设置可以获得更好的结果。然而,MV-GAT具有最好的性能。MV-GAT不仅考虑了药物分子内部以及药物之间的相互作用信息,还考虑了药物分子的不同相邻节点重要性,同时,还注意到多视图信息之间的平衡,学习更全面的药物表示。这表明多视图图形特征融合可以提高模型的性能。与其他基准相比,模型在ChCh-Miner数据集上表现的最为出色,与MIRACLE相比,AUPRC和F1分别提高了3.71%和6.33%。在MultiDDI数据集上,MIRACLE模型的AUROC指标比MV-GAT更高,但MV-GAT具有最高的AUPRC和F1值。一般来说,AUPRC能更好地惩罚误报DDI指标,F1则侧重于能够正确预测DDI的比例。
实施例二
本实施例公开了一种基于图注意力网络的药物相互作用预测系统,包括:
药物的分子图获取模块,被配置为:获取待预测的两种药物的分子图;
分子图编码模块,被配置为:利用键感知消息传递神经网络将药物的分子图进行编码,获取相应的分子图的嵌入向量;
DDI网络图获取模块,被配置为:获取待预测的两种药物与其已知相互作用关系药物的药物-药物相互作用关系DDI(drug-drug interaction)网络图;
药物分子表示向量更新模块,被配置为:将分子图的嵌入向量作为DDI网络图的特征向量,使用多层图注意力网络融合特征向量和外部DDI特征,获得更新后的药物分子表示向量;
相互作用关系预测模块,被配置为:将更新后的药物分子表示向量输入至交互预测器,得到待预测的两种药物之间的相互作用关系。
实施例三
本实施例的目的是提供计算机可读存储介质。
计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现如本公开实施例1所述的一种基于图注意力网络的药物相互作用预测方法中的步骤。
实施例四
本实施例的目的是提供电子设备。
电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的程序,所述处理器执行所述程序时实现如本公开实施例1所述的一种基于图注意力网络的药物相互作用预测方法中的步骤。
以上实施例二、三和四的装置中涉及的各步骤与方法实施例一相对应,具体实施方式可参见实施例一的相关说明部分。术语“计算机可读存储介质”应该理解为包括一个或多个指令集的单个介质或多个介质;还应当被理解为包括任何介质,所述任何介质能够存储、编码或承载用于由处理器执行的指令集并使处理器执行本发明中的任一方法。
本领域技术人员应该明白,上述本发明的各模块或各步骤可以用通用的计算机装置来实现,可选地,它们可以用计算装置可执行的程序代码来实现,从而,可以将它们存储在存储装置中由计算装置来执行,或者将它们分别制作成各个集成电路模块,或者将它们中的多个模块或步骤制作成单个集成电路模块来实现。本发明不限制于任何特定的硬件和软件的结合。
上述虽然结合附图对本发明的具体实施方式进行了描述,但并非对本发明保护范围的限制,所属领域技术人员应该明白,在本发明的技术方案的基础上,本领域技术人员不需要付出创造性劳动即可做出的各种修改或变形仍在本发明的保护范围以内。

Claims (10)

1.一种基于图注意力网络的药物相互作用预测方法,其特征在于,包括:
获取待预测的两种药物的分子图;
利用键感知消息传递神经网络将药物的分子图进行编码,获取相应的分子图的嵌入向量;
获取待预测的两种药物与其已知相互作用关系药物的药物-药物相互作用关系DDI(drug-drug interaction)网络图;
将分子图的嵌入向量作为DDI网络图的特征向量,使用多层图注意力网络融合特征向量和外部DDI特征,获得更新后的药物分子表示向量;
将更新后的药物分子表示向量输入至交互预测器,得到待预测的两种药物之间的相互作用关系。
2.如权利要求1所述的一种基于图注意力网络的药物相互作用预测方法,其特征在于,所述获取待预测的两种药物的分子图包括:将每个药物分子视为一个图,以原子为节点,连接原子之间的化学键视为边,获取分子图中的原子列表和多通道邻接矩阵。
3.如权利要求2所述的一种基于图注意力网络的药物相互作用预测方法,其特征在于,所述利用键感知消息传递神经网络将药物的分子图进行编码,获取相应的分子图的嵌入向量包括:
利用消息函数通过堆叠每个原子节点的随机初始化嵌入向量和多通道邻接矩阵构建原子节点特征向量矩阵;
对于分子图中任意一个原子节点,将具有相同化学键类型的邻居节点信息同时聚合;
将该原子节点的聚合结果与该原子节点的特征向量矩阵进行拼接,得到原子节点表示向量;
利用三层变换函数更新原子节点表示向量;
利用多个消息传递层将更新后的原子节点表示向量输出为分子图的嵌入向量以表示整个分子图。
4.如权利要求1所述的一种基于图注意力网络的药物相互作用预测方法,其特征在于,所述使用多层图注意力网络融合特征向量和外部DDI特征,获得更新后的药物分子表示向量,包括:
对DDI网络图中每个分子节点实行自注意力机制;
引入softmax函数对分子节点所有的邻居分子节点进行正则化得到更新后的注意力系数;
对更新后的不同分子节点之间的注意力系数进行加权得到药物分子表示向量。
5.如权利要求4所述的一种基于图注意力网络的药物相互作用预测方法,其特征在于,还包括:在得到药物分子表示向量后,基于图对比学习整合多视图药物分子表示向量;
所述图对比学习方法包括:
对于每一种药物,将其自身固定为锚点,
确定该锚点药物的正样本和负样本范围;
定义对比目标;
基于KL散度对定义的对比目标进行最大化,获取最终的药物分子表示向量。
6.如权利要求5所述的一种基于图注意力网络的药物相互作用预测方法,其特征在于,所述将药物分子的表示向量输入至交互预测器,得到待预测的两种药物之间的相互作用关系,包括:
将最终获取的药物分子表示向量压缩成相互作用链接嵌入向量;
通过获取的药物的链接嵌入向量,应用两个全连接层以预测药物对之间发生相互作用的概率。
7.如权利要求6所述的一种基于图注意力网络的药物相互作用预测方法,其特征在于,所述交互预测器的训练过程包括:
设计辅助交互预测器,所述辅助交互预测器设置在消息传递网络的最后一层,包括级联的完全连接层和sigmoid变换函数;
基于交互预测器和辅助交互预测器的差距设计目标函数;
利用反向传播算法优化目标函数,完成交互预测器的训练。
8.一种基于图注意力网络的药物相互作用预测系统,其特征在于:包括:
药物的分子图获取模块,被配置为:获取待预测的两种药物的分子图;
分子图编码模块,被配置为:利用键感知消息传递神经网络将药物的分子图进行编码,获取相应的分子图的嵌入向量;
DDI网络图获取模块,被配置为:获取待预测的两种药物与其已知相互作用关系药物的药物-药物相互作用关系DDI(drug-drug interaction)网络图;
药物分子表示向量更新模块,被配置为:将分子图的嵌入向量作为DDI网络图的特征向量,使用多层图注意力网络融合特征向量和外部DDI特征,获得更新后的药物分子表示向量;
相互作用关系预测模块,被配置为:将更新后的药物分子表示向量输入至交互预测器,得到待预测的两种药物之间的相互作用关系。
9.计算机可读存储介质,其上存储有程序,其特征在于,该程序被处理器执行时实现如权利要求1-7任一项所述的一种基于图注意力网络的药物相互作用预测方法中的步骤。
10.电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的程序,其特征在于,所述处理器执行所述程序时实现如权利要求1-7任一项所述的一种基于图注意力网络的药物相互作用预测方法中的步骤。
CN202310376573.3A 2023-04-04 2023-04-04 一种基于图神经网络的药物相互作用预测方法及系统 Pending CN116403730A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202310376573.3A CN116403730A (zh) 2023-04-04 2023-04-04 一种基于图神经网络的药物相互作用预测方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202310376573.3A CN116403730A (zh) 2023-04-04 2023-04-04 一种基于图神经网络的药物相互作用预测方法及系统

Publications (1)

Publication Number Publication Date
CN116403730A true CN116403730A (zh) 2023-07-07

Family

ID=87019535

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202310376573.3A Pending CN116403730A (zh) 2023-04-04 2023-04-04 一种基于图神经网络的药物相互作用预测方法及系统

Country Status (1)

Country Link
CN (1) CN116403730A (zh)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116936103A (zh) * 2023-09-12 2023-10-24 神州医疗科技股份有限公司 一种基于同向网络的用户健康预测管理方法及系统
CN117095767A (zh) * 2023-08-16 2023-11-21 中国人民解放军空军军医大学 基于深度学习的未知物质急性毒性预测方法、系统及设备
CN117198426A (zh) * 2023-11-06 2023-12-08 武汉纺织大学 一种多尺度的药物-药物反应可解释预测方法和系统
CN117316333A (zh) * 2023-11-28 2023-12-29 烟台国工智能科技有限公司 基于通用的分子图表示学习模型的逆合成预测方法及装置
CN117976244A (zh) * 2024-04-01 2024-05-03 天津理工大学 基于多维特征的药物相互作用预测方法及装置

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117095767A (zh) * 2023-08-16 2023-11-21 中国人民解放军空军军医大学 基于深度学习的未知物质急性毒性预测方法、系统及设备
CN116936103A (zh) * 2023-09-12 2023-10-24 神州医疗科技股份有限公司 一种基于同向网络的用户健康预测管理方法及系统
CN116936103B (zh) * 2023-09-12 2023-12-15 神州医疗科技股份有限公司 一种基于同向网络的用户健康预测管理方法及系统
CN117198426A (zh) * 2023-11-06 2023-12-08 武汉纺织大学 一种多尺度的药物-药物反应可解释预测方法和系统
CN117198426B (zh) * 2023-11-06 2024-01-30 武汉纺织大学 一种多尺度的药物-药物反应可解释预测方法和系统
CN117316333A (zh) * 2023-11-28 2023-12-29 烟台国工智能科技有限公司 基于通用的分子图表示学习模型的逆合成预测方法及装置
CN117316333B (zh) * 2023-11-28 2024-02-13 烟台国工智能科技有限公司 基于通用的分子图表示学习模型的逆合成预测方法及装置
CN117976244A (zh) * 2024-04-01 2024-05-03 天津理工大学 基于多维特征的药物相互作用预测方法及装置
CN117976244B (zh) * 2024-04-01 2024-06-07 天津理工大学 基于多维特征的药物相互作用预测方法及装置

Similar Documents

Publication Publication Date Title
Zhou et al. Graph neural networks: A review of methods and applications
Zhang et al. An overview on restricted Boltzmann machines
Amer et al. A review of modularization techniques in artificial neural networks
CN110083705B (zh) 一种用于目标情感分类的多跳注意力深度模型、方法、存储介质和终端
CN116403730A (zh) 一种基于图神经网络的药物相互作用预测方法及系统
CN112417219B (zh) 基于超图卷积的超边链接预测方法
Wang et al. Architecture evolution of convolutional neural network using monarch butterfly optimization
Wu et al. Interpretable graph convolutional network for multi-view semi-supervised learning
CN112765370B (zh) 知识图谱的实体对齐方法、装置、计算机设备和存储介质
CN112380835B (zh) 融合实体和句子推理信息的问题答案提取方法及电子装置
CN113918834B (zh) 融合社交关系的图卷积协同过滤推荐方法
Bi et al. GNEA: a graph neural network with ELM aggregator for brain network classification
Jia et al. Weakly supervised label distribution learning based on transductive matrix completion with sample correlations
CN114743037A (zh) 一种基于多尺度结构学习的深度医学图像聚类方法
CN115952424A (zh) 一种基于多视图结构的图卷积神经网络聚类方法
CN114613437A (zh) 一种基于异构图的miRNA与疾病关联预测方法及系统
Bayoudh A survey of multimodal hybrid deep learning for computer vision: Architectures, applications, trends, and challenges
CN117349494A (zh) 空间图卷积神经网络的图分类方法、系统、介质及设备
Lu et al. Soft-orthogonal constrained dual-stream encoder with self-supervised clustering network for brain functional connectivity data
CN117131933A (zh) 一种多模态知识图谱建立方法及应用
CN117390267A (zh) 基于知识图谱的个性化多任务增强推荐模型
Msuya et al. Deep Learning Model Compression Techniques: Advances, Opportunities, and Perspective
CN115691817A (zh) 一种基于融合神经网络的LncRNA-疾病关联预测方法
CN115423076A (zh) 基于两步式框架的有向超图链式预测方法
Han et al. Multi-view Feature Fusion Based on Self-attention Mechanism for Drug-drug Interaction Prediction

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination