CN114530258A - 一种深度学习药物相互作用预测方法、装置、介质和设备 - Google Patents

一种深度学习药物相互作用预测方法、装置、介质和设备 Download PDF

Info

Publication number
CN114530258A
CN114530258A CN202210105604.7A CN202210105604A CN114530258A CN 114530258 A CN114530258 A CN 114530258A CN 202210105604 A CN202210105604 A CN 202210105604A CN 114530258 A CN114530258 A CN 114530258A
Authority
CN
China
Prior art keywords
drug
molecular
information
level network
node
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202210105604.7A
Other languages
English (en)
Inventor
张通
饶晓洁
孟献兵
陈俊龙
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
South China University of Technology SCUT
Original Assignee
South China University of Technology SCUT
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by South China University of Technology SCUT filed Critical South China University of Technology SCUT
Priority to CN202210105604.7A priority Critical patent/CN114530258A/zh
Publication of CN114530258A publication Critical patent/CN114530258A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H70/00ICT specially adapted for the handling or processing of medical references
    • G16H70/40ICT specially adapted for the handling or processing of medical references relating to drugs, e.g. their side effects or intended usage
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods

Landscapes

  • Engineering & Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Health & Medical Sciences (AREA)
  • General Physics & Mathematics (AREA)
  • Biophysics (AREA)
  • Computational Linguistics (AREA)
  • Data Mining & Analysis (AREA)
  • Evolutionary Computation (AREA)
  • Biomedical Technology (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Artificial Intelligence (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Medicinal Chemistry (AREA)
  • Pharmacology & Pharmacy (AREA)
  • Toxicology (AREA)
  • Epidemiology (AREA)
  • Medical Informatics (AREA)
  • Primary Health Care (AREA)
  • Public Health (AREA)
  • Medical Treatment And Welfare Office Work (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Investigating Or Analysing Biological Materials (AREA)

Abstract

本发明提供了一种深度学习药物相互作用预测方法、装置、介质和设备;其中方法为:获取待预测的两种药物的药物分子信息;原子级网络对每个药物分子信息进行编码,捕获原子和化学键之间的相互作用信息,并输出编码后的药物分子图表示z_atomj;分子级网络利用多头注意力机制分别从每个药物分子图表示z_atomj提取出不同药物分子之间的关系,并输出分子图表示z_molj;将两种药物的输出分子图表示z_mol1和z_mol2转换为一个向量,进而得到药物相互作用预测结果。该方法可解决传统框架中不能充分考虑边信息的问题,可捕捉到不同药物分子之间的关系信息,从而提高预测结果的准确度。

Description

一种深度学习药物相互作用预测方法、装置、介质和设备
技术领域
本发明涉及医药技术领域,更具体地说,涉及一种深度学习药物相互作用预测方法、装置、介质和设备。
背景技术
如今,多药处方已经成为一种常见现象,这也导致药物相互作用的几率增大。药物相互作用(Drug-Drug Interaction,DDI)是指病人在同时服用两种或两种以上的药物时,一种药物的药效受到另一种药物的影响而发生改变,从而导致药效减弱,或是产生毒副作用。因此,在联合用药时,如何提前预测和发现可能会出现的药物不良相互作用,从而降低潜在风险、促进安全的药物联合处方,已经成为生物信息学领域急需解决的一大难题。
随着越来越多公共数据集的建立和发展,使用基于化学和生物信息的预测模型进行DDI预测具有很大的发展潜力。DDI预测方法分为基于机器学习的方法和基于深度学习的方法。基于机器学习和深度学习的预测方法通常将DDI预测作为一个链接预测任务,来检测不同药物分子之间是否存在相互作用。
其中,基于传统机器学习的预测方法分为三类:1)基于传统分类器的方法;2)基于回归的方法;3)基于矩阵分解的方法。此外,基于深度学习的预测方法因其强大的表达能力,在DDI预测任务中也取得了很好的结果。基于深度学习的预测方法大致分为以下四类:1)基于深度神经网络的方法;2)基于图嵌入的方法;3)基于网络传播的方法;4)基于集成学习的方法。其中,基于深度神经网络的方法通常利用各种药物数据,基于深度神经网络模型构建预测框架,然后利用从模型中学习到的更具表达性的特征向量进行DDI预测。在基于图嵌入的方法中,研究者发现生物医学图数据通常可以表示为图,如异构相互作用网络和分子图。为了分析图数据,许多图嵌入方法被应用于处理生物医学任务。基于网络传播的方法通常采用基于图的算法来收集生物医学网络中的信息进行预测。基于集成学习的方法因其在管理小样本、复杂数据结构和高维方面的独特优势,在DDI预测任务中得到了越来越多的应用。
尽管上述药物相互作用预测方法已经达到了较为良好的性能,但仍然存在一些局限性:目前,在大多数基于深度学习的药物相互作用预测方法中,研究者将不同药物分子视为节点,药物分子之间是否发生相互作用视为边,构造出图网络结构,从而进行药物相互作用预测。此类方法忽略了每个药物分子内部的图结构信息,而这一信息对于药物相互作用预测任务是非常重要的。
由于每个药物分子都是由一个复杂的结构(即分子内部的图结构)表示,这使得DDI任务涉及两种类型的图:药物分子内部由原子和化学键组成的原子级图网络,以及捕获不同药物分子之间交互的分子级图网络。因此,如何充分利用两个不同的图网络输出的图表示进行DDI预测,需要进一步研究。
综上,目前基于深度学习的药物相互作用预测方法仍存在一定的改进空间,研究基于深度学习的药物相互作用预测方法具有重要的理论和应用前景。
发明内容
为克服现有技术中的缺点与不足,本发明的目的在于提供一种深度学习药物相互作用预测方法、装置、介质和设备;该方法可解决传统框架中不能充分考虑边信息的问题,可捕捉到不同药物分子之间的关系信息,从而提高预测结果的准确度。
为了达到上述目的,本发明通过下述技术方案予以实现:一种深度学习药物相互作用预测方法,包括如下步骤:
获取待预测的两种药物的药物分子信息;
将各个药物分子信息分别输入至原子级网络中;原子级网络对每个药物分子信息进行编码,捕获原子和化学键之间的相互作用信息,并输出编码后的药物分子图表示z_atomj;j=1,2;
将各个药物分子图表示z_atomj分别输入至分子级网络中;分子级网络利用多头注意力机制分别从每个药物分子图表示z_atomj提取出不同药物分子之间的关系,并输出分子图表示z_molj
将两种药物的输出分子图表示z_mol1和z_mol2转换为一个向量I;对向量I进行处理,得到药物相互作用预测结果;
所述原子级网络和分子级网络分别是指经过训练的原子级网络和分子级网络。
优选地,所述原子级网络将每个药物分子信息由SMILES序列转为分子图结构,以原子为节点、化学键为边,提取出每个药物分子中的节点信息、边信息,以及拓扑连接矩阵,将节点信息、边信息和拓扑连接矩阵输入到Transformer编码器中;Transformer编码器采用节点信息和边信息的相互作用分数矩阵;Transformer编码器输出编码后的药物分子图表示z_atomj
优选地,所述Transformer编码器设有N个依次连接的消息更新块;
首先分别对节点信息和边信息进行编码,得到节点特征h(X)和边特征h(E);
然后,消息更新块根据节点特征h(X)计算出矩阵Q、V,根据边特征h(E)计算出矩阵K:
Figure BDA0003493405720000031
其中,WQ、WV、WK分别为可学习的线性变换参数;
进而求出交互分数矩阵M:
M=matmul(Q,K.transpose(-2,-1))
使用交互分数矩阵M分别与矩阵V、K进行点乘,以更新节点特征h(X)和边特征h(E);
Figure BDA0003493405720000032
之后,输入下一个消息更新块,再次进行节点特征h(X)和边特征h(E)更新;如此循环,直至最后一个消息更新块完成节点特征h(X)和边特征h(E)更新;最终得到的节点特征h(X)通过层归一化和平均池化,输出药物分子图表示z_atomj
优选地,根据药物分子图表示z_atomj得到分子特征矩阵:分子特征矩阵的每一行代表药物分子,每一列代表药物分子表示的每一维特征;
将不同药物分子视为节点;将所有节点输入多头注意力层,多头注意力层采用H个独立的注意力分数矩阵进行并行计算;将多头注意力层得到的特征通过Z层感知机进行维度转换,Z层感知机之间使用密集连接网络结构以加强特征重用;最终输出一个捕捉到不同分子间关系的分子图表示z_molj
优选地,所述多头注意力层采用H个独立的注意力分数矩阵进行并行计算,是指:将药物分子图表示z_atomj作为输入X,经过第i组权重参数
Figure BDA0003493405720000041
Figure BDA0003493405720000042
得到第i组矩阵Q'、K'、V':
Figure BDA0003493405720000043
Figure BDA0003493405720000044
其中,dk表示矩阵Q’、K’的特征维度。
多头注意力层采用H个独立的注意力分数矩阵进行并行计算,将多头注意力的输出通过拼接的方式进行输出:
MultiHead(Q',K',V')=Concat(head1,head2,...,headH)
所述将多头注意力层的输出通过Z层感知机进行维度转换,Z层感知机之间使用密集连接结构以加强特征重用,是指:
Figure BDA0003493405720000051
其中,layerl表示第l个线性层,xl表示第l个线性层的输出,当l=Z时,得到最终输出xZ
优选地,将两种药物的输出分子图表示z_mol1和z_mol2按元素乘积的操作,计算出向量I:
I=z_mol1⊙z_mol2
对向量I使用全连接层和sigmoid激活函数进行处理,得到最终的链接预测结果p,根据链接预测结果p得到药物相互作用预测结果。
优选地,原子级网络和分子级网络的训练方法是:采用二值交叉熵损失函数BCE和对比损失函数进行训练;
所述采用二值交叉熵损失函数BCE进行训练是指:对于给定标签的边信息li,分别衡量原子级网络和分子级网络输出的预测值和真实标签值的差异,利用差异经过反向传播去更新网络参数:
Figure BDA0003493405720000052
其中,yi是指边信息li的真实标签,r'i、p'i分别是原子级网络和分子级网络输出的预测结果;
所述采用对比损失函数进行训练是指:在分子级网络中,将节点视为固定锚点,则将锚点的一阶邻居节点对应的原子级网络中的输出向量作为其正样本,将锚点的非一阶邻居节点对应的原子级网络中的输出向量作为其负样本;
采用对比损失函数,最大化原子级网络输出的药物分子图表示z_atomj和分子级网络输出的分子图表示z_molj之间的互信息:
Figure BDA0003493405720000061
其中,
Figure BDA0003493405720000062
分别表示原子级网络和分子级网络的参数,
Figure BDA0003493405720000063
表示互信息估计器;C(i)表示节点i的一阶邻居集合;D表示所有药物分子集合。
一种深度学习药物相互作用预测装置,包括:
数据获取模块,用于获取待预测的两种药物的药物分子信息;
原子级网络,用于输入各个药物分子信息,对每个药物分子信息进行编码,捕获原子和化学键之间的相互作用信息,并输出编码后的药物分子图表示z_atomj;j=1,2;
分子级网络,用于输入各个药物分子图表示z_atomj,利用多头注意力机制分别从每个药物分子图表示z_atomj提取出不同药物分子之间的关系,并输出分子图表示z_molj
预测模块,用于将两种药物的输出分子图表示z_mol1和z_mol2转换为一个向量I;对向量I进行处理,得到药物相互作用预测结果。
一种存储介质,其中所述存储介质存储有计算机程序,所述计算机程序当被处理器执行时使所述处理器执行上述深度学习药物相互作用预测方法。
一种计算设备,包括处理器以及用于存储处理器可执行程序的存储器,所述处理器执行存储器存储的程序时,实现上述深度学习药物相互作用预测方法。
与现有技术相比,本发明具有如下优点与有益效果:
本发明的优点在于针对当前端到端的药物相互作用预测方法存在的问题,提出一个更契合药物相互作用预测方法。在原子级网络中,通过使用基于图结构的Transformer模型,引入节点和边相互作用模块,来解决传统MPNN框架中不能充分考虑边信息的问题。在分子级网络中,通过使用基于多头注意力机制的多层密集连接网络,捕捉到不同药物分子之间的关系信息,从而提高预测结果的准确度。利用本发明方法来进行药物相互作用预测,有助于研究者预先选择出有可能产生相互作用的药物分子,设计更加安全的药物处方,减小病人在联合用药时产生不良反应的概率。
附图说明
图1是本发明深度学习药物相互作用预测方法的流程图;
图2是本发明深度学习药物相互作用预测方法的模型结构图;
图3是本发明深度学习药物相互作用预测方法中原子级网络架构图;
图4是本发明深度学习药物相互作用预测方法中分子级网络架构图。
具体实施方式
下面结合附图与具体实施方式对本发明作进一步详细的描述。
实施例一
本实施例一种深度学习药物相互作用预测方法,其原理如图1所示,其模型结构如图2所示。其中,原子级网络是指以原子为节点、化学键为边,组成的药物分子内部图结构。分子级网络是指以不同药物分子为节点、是否发生相互作用为边,组成的药物分子之间的图结构。通过在两个不同层次的图网络之间构建模型,解决现有分子图表示存在的问题,提高药物相互作用预测结果的准确性。
预测方法包括如下步骤:
S1步,获取待预测的两种药物的药物分子信息。
S2步,将各个药物分子信息分别输入至原子级网络中;原子级网络对每个药物分子信息进行编码,捕获原子和化学键之间的相互作用信息,并输出编码后的药物分子图表示z_atomj;j=1,2。
具体地说,在原子级网络中,利用RDKIT化学信息库,将每个药物分子信息由SMILES(Simplified molecular input line entry specification)序列转为分子图结构,以原子为节点、化学键为边,提取出每个药物分子中的节点信息(原子特征)、边信息(化学键特征),以及拓扑连接矩阵,将节点信息、边信息和拓扑连接矩阵输入到Transformer编码器中。
在Transformer编码器中,对原始Transformer编码器中的多头注意力模块进行改进,因药物相互作用预测任务中处理的数据为药物分子,所以本发明着重考虑药物分子内部的结构信息,并引入了消息传递网络(Message Passing Neural Network,MPNN)。与传统的MPNN框架没有考虑边信息不同,本发明同时利用节点信息和边信息,并且节点信息和边信息一起参与消息传递。计算得到的节点信息和边信息的相互作用分数矩阵来取代原始Transformer编码器中的注意力分数矩阵。
为了充分利用到边信息,本发明将利用节点特征和边特征计算交互分数矩阵M。如图3所示,Transformer编码器设有N个依次连接的消息更新块。
首先分别对节点信息和边信息进行编码,得到节点特征h(X)和边特征h(E);
然后,消息更新块根据节点特征h(X)计算出矩阵Q、V,根据边特征h(E)计算出矩阵K:
Figure BDA0003493405720000081
其中,WQ、WV、WK分别为可学习的线性变换参数;
进而求出交互分数矩阵M:
M=matmul(Q,K.transpose(-2,-1))
使用交互分数矩阵M分别与矩阵V、K进行点乘,以更新节点特征h(X)和边特征h(E);
Figure BDA0003493405720000091
之后,输入下一个消息更新块,再次进行节点特征h(X)和边特征h(E)更新;如此循环,直至最后一个消息更新块完成节点特征h(X)和边特征h(E)更新;最终得到的节点特征h(X)通过层归一化和平均池化,输出药物分子图表示z_atomj
S3步,将各个药物分子图表示z_atomj分别输入至分子级网络中;分子级网络利用多头注意力机制分别从每个药物分子图表示z_atomj提取出不同药物分子之间的关系,并输出分子图表示z_molj
具体地说,根据药物分子图表示z_atomj得到分子特征矩阵:分子特征矩阵的每一行代表药物分子,每一列代表药物分子表示的每一维特征;
将不同药物分子视为节点;若两个分子之间能产生相互作用,则该节点对(分子-分子)之间会形成一条边,进而形成了一张分子网络图。通过该分子网络图,本发明拟挖掘不同药物分子之间的关系。由于步骤S2原子级网络没有考虑分子间的相互作用,因此分子特征矩阵并没有包含分子间关系信息;如果直接使用分子特征矩阵进行链接预测,将会损失掉该部分信息。因此,本发明利用多头注意力机制去捕捉到不同药物分子之间的相关性。由于随机初始化会破坏学习过程的稳定性,因此可以通过并行的执行多个头的注意力来克服该问题。
将所有节点输入多头注意力层,多头注意力层采用H个独立的注意力分数矩阵进行并行计算,各个注意力分数矩阵的权重系数不同。
如图4所示,将药物分子图表示z_atomj作为输入X,经过第i组权重参数
Figure BDA0003493405720000092
Figure BDA0003493405720000104
得到第i组矩阵Q'、K'、V':
Figure BDA0003493405720000101
Figure BDA0003493405720000102
其中,dk表示矩阵Q’、K’的特征维度。
多头注意力层采用H个独立的注意力分数矩阵进行并行计算,将多头注意力的输出通过拼接的方式进行输出:
MultiHead(Q',K',V')=Concat(head1,head2,...,headH)
将多头注意力层得到的特征通过Z层感知机(Multi-layer Perceptron,MLP)进行维度转换。为防止网络层数过深导致的梯度消失,本发明在Z层感知机之间使用密集连接网络结构以加强特征重用:
Figure BDA0003493405720000103
其中,layerl表示第l个线性层,xl表示第l个线性层的输出,当l=Z时,得到最终输出xZ
最终输出一个捕捉到不同分子间关系的分子图表示z_molj
S4步,将两种药物的输出分子图表示z_mol1和z_mol2按元素乘积的操作,计算出向量I:
I=z_mol1⊙z_mol2
对向量I使用全连接层和sigmoid激活函数进行处理,得到最终的链接预测结果p,根据链接预测结果p得到药物相互作用预测结果。
原子级网络和分子级网络分别经过训练。训练方法是:采用二值交叉熵损失函数BCE和对比损失函数进行训练。
所述采用二值交叉熵损失函数BCE进行训练是指:对于给定标签的边信息li,分别衡量原子级网络和分子级网络输出的预测值和真实标签值的差异,利用差异经过反向传播去更新网络参数:
Figure BDA0003493405720000111
其中,yi是指边信息li的真实标签,r'i、p'i分别是原子级网络和分子级网络输出的预测结果。
为了充分利用原子级网络和分子级网络的信息,本发明将对比学习用于模型学习过程。对比学习是在特征空间中将目标样本分别与其正样本和负样本进行对比,来学习样本的特征表示。本发明利用分子级网络中的邻接矩阵信息,构建对比学习中的正负样本对。
所述采用对比损失函数进行训练是指:在分子级网络中,将节点视为固定锚点,则将锚点的一阶邻居节点对应的原子级网络中的输出向量作为其正样本,将锚点的非一阶邻居节点对应的原子级网络中的输出向量作为其负样本;
采用对比损失函数,最大化原子级网络输出的药物分子图表示z_atomj和分子级网络输出的分子图表示z_molj之间的互信息:
Figure BDA0003493405720000112
其中,
Figure BDA0003493405720000113
分别表示原子级网络和分子级网络的参数,
Figure BDA0003493405720000114
表示互信息估计器;C(i)表示节点i的一阶邻居集合;D表示所有药物分子集合。
互信息用来衡量两个随机变量之间的相关程度,通过互信息最大化,使得锚点药物与其正样本相接近,与其负样本区分开来。由于直接评估互信息是极度困难的,往往通过最大化其下界来到达最大化互信息的目的。因此,本发明使用JS散度优化互信息的下界,从而使得互信息最大化。
本发明的优点在于针对当前端到端的药物相互作用预测方法存在的问题,提出一个更契合药物相互作用预测方法。在原子级网络中,通过使用基于图结构的Transformer模型,引入节点和边相互作用模块,来解决传统MPNN框架中不能充分考虑边信息的问题。在分子级网络中,通过使用基于多头注意力机制的多层密集连接网络,捕捉到不同药物分子之间的关系信息,从而提高预测结果的准确度。利用本发明方法来进行药物相互作用预测,有助于研究者预先选择出有可能产生相互作用的药物分子,设计更加安全的药物处方,减小病人在联合用药时产生不良反应的概率。
为实现实施例一所述的方法,本实施例提供一种深度学习药物相互作用预测装置,包括:
数据获取模块,用于获取待预测的两种药物的药物分子信息;
原子级网络,用于输入各个药物分子信息,对每个药物分子信息进行编码,捕获原子和化学键之间的相互作用信息,并输出编码后的药物分子图表示z_atomj;j=1,2;
分子级网络,用于输入各个药物分子图表示z_atomj,利用多头注意力机制分别从每个药物分子图表示z_atomj提取出不同药物分子之间的关系,并输出分子图表示z_molj
预测模块,用于将两种药物的输出分子图表示z_mol1和z_mol2转换为一个向量I;对向量I进行处理,得到药物相互作用预测结果。
实施例二
本实施例一种存储介质,其特征在于,其中所述存储介质存储有计算机程序,所述计算机程序当被处理器执行时使所述处理器执行实施例一所述的深度学习药物相互作用预测方法。
实施例三
本实施例一种计算设备,包括处理器以及用于存储处理器可执行程序的存储器,其特征在于,所述处理器执行存储器存储的程序时,实现实施例一所述的深度学习药物相互作用预测方法。
上述实施例为本发明较佳的实施方式,但本发明的实施方式并不受上述实施例的限制,其他的任何未背离本发明的精神实质与原理下所作的改变、修饰、替代、组合、简化,均应为等效的置换方式,都包含在本发明的保护范围之内。

Claims (10)

1.一种深度学习药物相互作用预测方法,其特征在于:包括如下步骤:
获取待预测的两种药物的药物分子信息;
将各个药物分子信息分别输入至原子级网络中;原子级网络对每个药物分子信息进行编码,捕获原子和化学键之间的相互作用信息,并输出编码后的药物分子图表示z_atomj;j=1,2;
将各个药物分子图表示z_atomj分别输入至分子级网络中;分子级网络利用多头注意力机制分别从每个药物分子图表示z_atomj提取出不同药物分子之间的关系,并输出分子图表示z_molj
将两种药物的输出分子图表示z_mol1和z_mol2转换为一个向量I;对向量I进行处理,得到药物相互作用预测结果;
所述原子级网络和分子级网络分别是指经过训练的原子级网络和分子级网络。
2.根据权利要求1所述的深度学习药物相互作用预测方法,其特征在于:所述原子级网络将每个药物分子信息由SMILES序列转为分子图结构,以原子为节点、化学键为边,提取出每个药物分子中的节点信息、边信息,以及拓扑连接矩阵,将节点信息、边信息和拓扑连接矩阵输入到Transformer编码器中;Transformer编码器采用节点信息和边信息的相互作用分数矩阵;Transformer编码器输出编码后的药物分子图表示z_atomj
3.根据权利要求2所述的深度学习药物相互作用预测方法,其特征在于:所述Transformer编码器设有N个依次连接的消息更新块;
首先分别对节点信息和边信息进行编码,得到节点特征h(X)和边特征h(E);
然后,消息更新块根据节点特征h(X)计算出矩阵Q、V,根据边特征h(E)计算出矩阵K:
Figure FDA0003493405710000021
其中,WQ、WV、WK分别为可学习的线性变换参数;
进而求出交互分数矩阵M:
M=matmul(Q,K.transpose(-2,-1))
使用交互分数矩阵M分别与矩阵V、K进行点乘,以更新节点特征h(X)和边特征h(E);
Figure FDA0003493405710000022
之后,输入下一个消息更新块,再次进行节点特征h(X)和边特征h(E)更新;如此循环,直至最后一个消息更新块完成节点特征h(X)和边特征h(E)更新;最终得到的节点特征h(X)通过层归一化和平均池化,输出药物分子图表示z_atomj
4.根据权利要求1所述的深度学习药物相互作用预测方法,其特征在于:根据药物分子图表示z_atomj得到分子特征矩阵:分子特征矩阵的每一行代表药物分子,每一列代表药物分子表示的每一维特征;
将不同药物分子视为节点;将所有节点输入多头注意力层,多头注意力层采用H个独立的注意力分数矩阵进行并行计算;将多头注意力层得到的特征通过Z层感知机进行维度转换,Z层感知机之间使用密集连接网络结构以加强特征重用;最终输出一个捕捉到不同分子间关系的分子图表示z_molj
5.根据权利要求4所述的深度学习药物相互作用预测方法,其特征在于:所述多头注意力层采用H个独立的注意力分数矩阵进行并行计算,是指:将药物分子图表示z_atomj作为输入X,经过第i组权重参数
Figure FDA0003493405710000031
得到第i组矩阵Q'、K'、V':
Figure FDA0003493405710000032
Figure FDA0003493405710000033
其中,dk表示矩阵Q’、K’的特征维度。
将多头注意力的输出通过拼接的方式进行输出:
MultiHead(Q',K',V')=Concat(head1,head2,...,headH)
所述将多头注意力层的输出通过Z层感知机进行维度转换,Z层感知机之间使用密集连接结构以加强特征重用,是指:
Figure FDA0003493405710000034
其中,layerl表示第l个线性层,xl表示第l个线性层的输出,当l=Z时,得到最终输出xZ
6.根据权利要求1所述的深度学习药物相互作用预测方法,其特征在于:将两种药物的输出分子图表示z_mol1和z_mol2按元素乘积的操作,计算出向量I:
I=z_mol1⊙z_mol2
对向量I使用全连接层和sigmoid激活函数进行处理,得到最终的链接预测结果p,根据链接预测结果p得到药物相互作用预测结果。
7.根据权利要求1所述的深度学习药物相互作用预测方法,其特征在于:原子级网络和分子级网络的训练方法是:采用二值交叉熵损失函数BCE和对比损失函数进行训练;
所述采用二值交叉熵损失函数BCE进行训练是指:对于给定标签的边信息li,分别衡量原子级网络和分子级网络输出的预测值和真实标签值的差异,利用差异经过反向传播去更新网络参数:
Figure FDA0003493405710000041
其中,yi是指边信息li的真实标签,r'i、p'i分别是原子级网络和分子级网络输出的预测结果;
所述采用对比损失函数进行训练是指:在分子级网络中,将节点视为固定锚点,则将锚点的一阶邻居节点对应的原子级网络中的输出向量作为其正样本,将锚点的非一阶邻居节点对应的原子级网络中的输出向量作为其负样本;
采用对比损失函数,最大化原子级网络输出的药物分子图表示z_atomj和分子级网络输出的分子图表示z_molj之间的互信息:
Figure FDA0003493405710000042
其中,
Figure FDA0003493405710000043
分别表示原子级网络和分子级网络的参数,
Figure FDA0003493405710000044
表示互信息估计器;C(i)表示节点i的一阶邻居集合;D表示所有药物分子集合。
8.一种深度学习药物相互作用预测装置,其特征在于,包括:
数据获取模块,用于获取待预测的两种药物的药物分子信息;
原子级网络,用于输入各个药物分子信息,对每个药物分子信息进行编码,捕获原子和化学键之间的相互作用信息,并输出编码后的药物分子图表示z_atomj;j=1,2;
分子级网络,用于输入各个药物分子图表示z_atomj,利用多头注意力机制分别从每个药物分子图表示z_atomj提取出不同药物分子之间的关系,并输出分子图表示z_molj
预测模块,用于将两种药物的输出分子图表示z_mol1和z_mol2转换为一个向量I;对向量I进行处理,得到药物相互作用预测结果。
9.一种存储介质,其特征在于,其中所述存储介质存储有计算机程序,所述计算机程序当被处理器执行时使所述处理器执行权利要求1-7中任一项所述的深度学习药物相互作用预测方法。
10.一种计算设备,包括处理器以及用于存储处理器可执行程序的存储器,其特征在于,所述处理器执行存储器存储的程序时,实现权利要求1-7中任一项所述的深度学习药物相互作用预测方法。
CN202210105604.7A 2022-01-28 2022-01-28 一种深度学习药物相互作用预测方法、装置、介质和设备 Pending CN114530258A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210105604.7A CN114530258A (zh) 2022-01-28 2022-01-28 一种深度学习药物相互作用预测方法、装置、介质和设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210105604.7A CN114530258A (zh) 2022-01-28 2022-01-28 一种深度学习药物相互作用预测方法、装置、介质和设备

Publications (1)

Publication Number Publication Date
CN114530258A true CN114530258A (zh) 2022-05-24

Family

ID=81622331

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210105604.7A Pending CN114530258A (zh) 2022-01-28 2022-01-28 一种深度学习药物相互作用预测方法、装置、介质和设备

Country Status (1)

Country Link
CN (1) CN114530258A (zh)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114792574A (zh) * 2022-06-23 2022-07-26 普瑞基准生物医药(苏州)有限公司 基于图神经网络模型预测药物互作所致肝毒性的方法
CN115171807A (zh) * 2022-09-07 2022-10-11 合肥机数量子科技有限公司 一种分子编码模型训练方法、分子编码方法和系统
CN115206421A (zh) * 2022-07-19 2022-10-18 北京百度网讯科技有限公司 药物重定位方法、重定位模型的训练方法及装置
CN115761250A (zh) * 2022-11-21 2023-03-07 北京科技大学 一种化合物逆合成方法及装置
CN117198426A (zh) * 2023-11-06 2023-12-08 武汉纺织大学 一种多尺度的药物-药物反应可解释预测方法和系统
CN117275608A (zh) * 2023-09-08 2023-12-22 浙江大学 基于协同注意力的可解释性抗癌药物协同预测方法及装置

Cited By (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114792574A (zh) * 2022-06-23 2022-07-26 普瑞基准生物医药(苏州)有限公司 基于图神经网络模型预测药物互作所致肝毒性的方法
CN115206421A (zh) * 2022-07-19 2022-10-18 北京百度网讯科技有限公司 药物重定位方法、重定位模型的训练方法及装置
CN115171807A (zh) * 2022-09-07 2022-10-11 合肥机数量子科技有限公司 一种分子编码模型训练方法、分子编码方法和系统
CN115171807B (zh) * 2022-09-07 2022-12-06 合肥机数量子科技有限公司 一种分子编码模型训练方法、分子编码方法和系统
CN115761250A (zh) * 2022-11-21 2023-03-07 北京科技大学 一种化合物逆合成方法及装置
CN115761250B (zh) * 2022-11-21 2023-10-10 北京科技大学 一种化合物逆合成方法及装置
CN117275608A (zh) * 2023-09-08 2023-12-22 浙江大学 基于协同注意力的可解释性抗癌药物协同预测方法及装置
CN117275608B (zh) * 2023-09-08 2024-04-26 浙江大学 基于协同注意力的可解释性抗癌药物协同预测方法及装置
CN117198426A (zh) * 2023-11-06 2023-12-08 武汉纺织大学 一种多尺度的药物-药物反应可解释预测方法和系统
CN117198426B (zh) * 2023-11-06 2024-01-30 武汉纺织大学 一种多尺度的药物-药物反应可解释预测方法和系统

Similar Documents

Publication Publication Date Title
Weerakody et al. A review of irregular time series data handling with gated recurrent neural networks
CN114530258A (zh) 一种深度学习药物相互作用预测方法、装置、介质和设备
Mugunthan et al. Design of improved version of sigmoidal function with biases for classification task in ELM domain
García-Ordás et al. Diabetes detection using deep learning techniques with oversampling and feature augmentation
Adel et al. Discovering interpretable representations for both deep generative and discriminative models
Gaw et al. Multimodal data fusion for systems improvement: A review
CN114519469B (zh) 一种基于Transformer框架的多变量长序列时间序列预测模型的构建方法
Weng et al. Multi-agent-based unsupervised detection of energy consumption anomalies on smart campus
Chen et al. One-dimensional convolutional neural network-based active feature extraction for fault detection and diagnosis of industrial processes and its understanding via visualization
CN113704075B (zh) 一种基于故障日志的高性能计算系统故障预测方法
CN115983087B (zh) 一种注意力机制与lstm结合检测时序数据异常方法及终端机
Biswas et al. Hybrid expert system using case based reasoning and neural network for classification
Xie et al. A predictive model of gene expression using a deep learning framework
CN112397155A (zh) 一种单步逆向合成方法及系统
CN116386899A (zh) 基于图学习的药物疾病关联关系预测方法及相关设备
CN115083537A (zh) 分子骨架跃迁的处理方法、装置、介质及电子设备
Zhu et al. Associative learning mechanism for drug‐target interaction prediction
Sun et al. Ehr2hg: Modeling of ehrs data based on hypergraphs for disease prediction
Li et al. Knowledge enhanced ensemble method for remaining useful life prediction under variable working conditions
Vo et al. Harnessing attention mechanisms in a comprehensive deep learning approach for induction motor fault diagnosis using raw electrical signals
CN115860056B (zh) 一种用于混合气体浓度预测的传感器阵列神经网络方法
CN116910049A (zh) 基于mdan的电力负荷数据缺失值填充模型及其构建方法
CN116978581A (zh) 基于深度学习预测模型的药物分子有效性验证方法及系统
Chen et al. Scale-aware neural architecture search for multivariate time series forecasting
Kashyap et al. Quantum convolutional neural network architecture for multi-class classification

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination