CN114765060B

CN114765060B - 预测药物靶标相互作用的多注意力方法

Info

Publication number: CN114765060B
Application number: CN202110045057.3A
Authority: CN
Inventors: 彭德中; 曾煜妮; 王骞
Original assignee: Sichuan University
Current assignee: Sichuan University
Priority date: 2021-01-13
Filing date: 2021-01-13
Publication date: 2023-12-08
Anticipated expiration: 2041-01-13
Also published as: CN114765060A

Abstract

本发明公开了一种预测药物靶标相互作用的方法，该方法基于多注意力模块的端到端模型(MATT‑DTI)，来预测药物靶标对的亲和力分数。该模型通过两个自注意力模块分布建模药物以及药物靶标对的相互作用来是想。MATT‑DTI,如图1所示，首先利用一个相关自注意力模型和卷积神经网络通过编码原子与原子之间的相关关系来提取药物序列的特征，从而得到药物的深层表达。其次，MATT‑DTI通过一个卷积神经网络模型编码得到靶标序列的深层表达。最后，建立基于多头自注意力机制的模块，通过对药物深层表达和靶标深层表达之间的相似性建模，提取药物靶标对的相互作用信息，从而得到预测的亲和力分数。

Description

预测药物靶标相互作用的多注意力方法

技术领域

本发明涉及计算机多媒体技术领域，特别涉及一种预测药物靶标相互作用的多注意力方法。

背景技术

在现实场景中，药物靶标相互作用的预测任务，因其在药物发现过程中的重要地位而受到越来越多的关注。药物靶标相互作用预测的方法可当作分类任务和回归任务。分类任务是去预测在药物靶标对是否存在相互作用。回归任务是预测药物标靶对之间相互作用的程度，通常用亲和力分数来衡量。大多数药物靶标相互作用预测方法忽略了化合物原子与原子之间的相关关系。例如DeepDTA，它通过字符级别的字典编码药物和靶标，这不仅将多字符原子编码为多个字符，还忽略了原子与原子之间的相关关系，这导致了其可能捕捉不到非线性的高层语义信息。

本发明提出一种基于多注意力模块的端到端模型(MATT-DTI)，来预测药物靶标对的亲和力分数，如图1所示。通过多个自注意力模块分布考虑化合物中原子与原子的相关关系以及药物靶标对之间的相互作用。

发明内容

本发明所要解决的技术问题在于针对上述现有技术中的不足，提供一种多头自注意力方法。采用深度网络DNN用作药物、靶标、药物的特征提取，然后寻找一组变换W＝{W⁽¹⁾，…，W^(k)…，W^(v)}，在同过深度网络DNN来预测药物靶标对的亲和力。

为解决上述技术问题，本发明采用的技术方案是：一种预测药物靶标相互作用的多注意力方法，包括以下步骤：

1)使用DNN提取药物特征：

其中，为药物序列数据中的第i个样本。

优选的是，DNN的结构参数如表1所示。

表1 DNN结构参数

Layer	Channel	Kernel	Stride	Padding	Activation
						Embed_1	-	-	-	-	-
Rel_Att	128	-	-	-	ReLU
						Fc1_1	128	-	-	-	ReLU
Add1	-	-	-	-	-
						Conv1_1	32	8	1	same	ReLU
Conv1_2	64	8	1	same	ReLU
						Conv1_3	96	8	1	same	ReLU
Pool1	-	-	-	same	Max

2)使用DNN提取蛋白特征：

其中，为蛋白质序列数据中的第i个样本。

优选的是，DNN的结构参数如表2所示。

表2 DNN结构参数

Layer	Channel	Kernel	Stride	Padding	Activation
						Embed_2	-	-	-	-	-
Conv2_1	32	12	1	same	ReLU
						Conv2_2	64	12	1	same	ReLU
Conv2_3	96	12	1	same	ReLU
						Pool2	-	-	-	same	Max

3)使用DNN预测药物靶标对的亲和力分数：

其中，为第i个药物样本和第j个蛋白样本之间预测的亲和力分数。

优选的是，DNN的结构参数如表3所示。

表3 DNN结构参数

附图说明

图1为本发明的一种实施例中的输入与输出网络结构图。

具体实施方式

下面结合实施例对本发明做进一步的详细说明，以令本领域技术人员参照说明书文字能够据以实施。

应当理解，本文所使用的诸如“具有”、“包含”以及“包括”术语并不排除一个或多个其它网络或其组合的存在或添加。

本实施例的一种预测药物靶标相互作用的多注意力方法，包括以下步骤：

1)准备训练集以及标签y，batch的大小N_b及学习率α。

2)计算mini-batch的DNN网络输出：

3)根据下式损失函数，

4)更新每个DNN网络的参数通过最小化式(5)

5)计算线性变换矩阵W。

6)输出模型MATT-DTI

尽管本发明的实施方案已公开如上，但其并不仅仅限于说明书和实施方式中所列运用，它完全可以被适用于各种适合本发明的领域，对于熟悉本领域的人员而言，可容易地实现另外的修改，因此在不背离权利要求及等同范围所限定的一般概念下，本发明并不限于特定的细节。

Claims

1.一种预测药物靶标相互作用的多注意力方法，包括以下步骤：

1)计算基于多注意力模块的药物-靶标相互作用模型MATT-DTI输出：

其中，将药物序列数据中的第i个样本蛋白质序列数据中的第j个样本/>代入上式，预测的药物-靶标的亲和力分数/>

2)根据下式损失函数，

3)更新MATT-DTI模型的网络参数通过最小化式(5)，

4)计算线性变换矩阵W；

5)输出训练好的MATT-DTI模型，该MATT-DTI模型由一个药物表达学习模块f_D，一个靶标表达学习模块f_P、一个亲和力分数预测神经模型f组成，其输出预测的亲和力值；

其中，药物表达学习模块f_D由输入层，相关自注意力层、全连接层、3层卷积层、池化层的顺序组合，其输出为药物深层表达D_i：

其输入为药物序列数据中的第i个样本输出该样本的深层特征表达；

靶标表达学习模块f_P由3层卷积层和1层池化层组成，输出靶标深度表达P_i：

其输入为蛋白质序列数据中的第i个样本输出该样本的深层特征表达；

亲和力分数预测神经模型f，将药物深层表达D_i和靶标的深层表达P_j作为多头自注意力层的输入，再连接3层全连接层输出预测的亲和力值。