CN114765060B - 预测药物靶标相互作用的多注意力方法 - Google Patents

预测药物靶标相互作用的多注意力方法 Download PDF

Info

Publication number
CN114765060B
CN114765060B CN202110045057.3A CN202110045057A CN114765060B CN 114765060 B CN114765060 B CN 114765060B CN 202110045057 A CN202110045057 A CN 202110045057A CN 114765060 B CN114765060 B CN 114765060B
Authority
CN
China
Prior art keywords
drug
target
expression
layer
attention
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202110045057.3A
Other languages
English (en)
Other versions
CN114765060A (zh
Inventor
彭德中
曾煜妮
王骞
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sichuan University
Original Assignee
Sichuan University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sichuan University filed Critical Sichuan University
Priority to CN202110045057.3A priority Critical patent/CN114765060B/zh
Publication of CN114765060A publication Critical patent/CN114765060A/zh
Application granted granted Critical
Publication of CN114765060B publication Critical patent/CN114765060B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B15/00ICT specially adapted for analysing two-dimensional or three-dimensional molecular structures, e.g. structural or functional relations or structure alignment
    • G16B15/30Drug targeting using structural data; Docking or binding prediction
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Biophysics (AREA)
  • General Physics & Mathematics (AREA)
  • Chemical & Material Sciences (AREA)
  • Evolutionary Computation (AREA)
  • Computational Linguistics (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Biomedical Technology (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Artificial Intelligence (AREA)
  • Data Mining & Analysis (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Pharmacology & Pharmacy (AREA)
  • Crystallography & Structural Chemistry (AREA)
  • Medicinal Chemistry (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Biotechnology (AREA)
  • Evolutionary Biology (AREA)
  • Medical Informatics (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明公开了一种预测药物靶标相互作用的方法,该方法基于多注意力模块的端到端模型(MATT‑DTI),来预测药物靶标对的亲和力分数。该模型通过两个自注意力模块分布建模药物以及药物靶标对的相互作用来是想。MATT‑DTI,如图1所示,首先利用一个相关自注意力模型和卷积神经网络通过编码原子与原子之间的相关关系来提取药物序列的特征,从而得到药物的深层表达。其次,MATT‑DTI通过一个卷积神经网络模型编码得到靶标序列的深层表达。最后,建立基于多头自注意力机制的模块,通过对药物深层表达和靶标深层表达之间的相似性建模,提取药物靶标对的相互作用信息,从而得到预测的亲和力分数。

Description

预测药物靶标相互作用的多注意力方法
技术领域
本发明涉及计算机多媒体技术领域,特别涉及一种预测药物靶标相互作用的多注意力方法。
背景技术
在现实场景中,药物靶标相互作用的预测任务,因其在药物发现过程中的重要地位而受到越来越多的关注。药物靶标相互作用预测的方法可当作分类任务和回归任务。分类任务是去预测在药物靶标对是否存在相互作用。回归任务是预测药物标靶对之间相互作用的程度,通常用亲和力分数来衡量。大多数药物靶标相互作用预测方法忽略了化合物原子与原子之间的相关关系。例如DeepDTA,它通过字符级别的字典编码药物和靶标,这不仅将多字符原子编码为多个字符,还忽略了原子与原子之间的相关关系,这导致了其可能捕捉不到非线性的高层语义信息。
本发明提出一种基于多注意力模块的端到端模型(MATT-DTI),来预测药物靶标对的亲和力分数,如图1所示。通过多个自注意力模块分布考虑化合物中原子与原子的相关关系以及药物靶标对之间的相互作用。
发明内容
本发明所要解决的技术问题在于针对上述现有技术中的不足,提供一种多头自注意力方法。采用深度网络DNN用作药物、靶标、药物的特征提取,然后寻找一组变换W={W(1),…,W(k)…,W(v)},在同过深度网络DNN来预测药物靶标对的亲和力。
为解决上述技术问题,本发明采用的技术方案是:一种预测药物靶标相互作用的多注意力方法,包括以下步骤:
1)使用DNN提取药物特征:
其中,为药物序列数据中的第i个样本。
优选的是,DNN的结构参数如表1所示。
表1 DNN结构参数
Layer Channel Kernel Stride Padding Activation
Embed_1 - - - - -
Rel_Att 128 - - - ReLU
Fc1_1 128 - - - ReLU
Add1 - - - - -
Conv1_1 32 8 1 same ReLU
Conv1_2 64 8 1 same ReLU
Conv1_3 96 8 1 same ReLU
Pool1 - - - same Max
2)使用DNN提取蛋白特征:
其中,为蛋白质序列数据中的第i个样本。
优选的是,DNN的结构参数如表2所示。
表2 DNN结构参数
Layer Channel Kernel Stride Padding Activation
Embed_2 - - - - -
Conv2_1 32 12 1 same ReLU
Conv2_2 64 12 1 same ReLU
Conv2_3 96 12 1 same ReLU
Pool2 - - - same Max
3)使用DNN预测药物靶标对的亲和力分数:
其中,为第i个药物样本和第j个蛋白样本之间预测的亲和力分数。
优选的是,DNN的结构参数如表3所示。
表3 DNN结构参数
附图说明
图1为本发明的一种实施例中的输入与输出网络结构图。
具体实施方式
下面结合实施例对本发明做进一步的详细说明,以令本领域技术人员参照说明书文字能够据以实施。
应当理解,本文所使用的诸如“具有”、“包含”以及“包括”术语并不排除一个或多个其它网络或其组合的存在或添加。
本实施例的一种预测药物靶标相互作用的多注意力方法,包括以下步骤:
1)准备训练集以及标签y,batch的大小Nb及学习率α。
2)计算mini-batch的DNN网络输出:
3)根据下式损失函数,
4)更新每个DNN网络的参数通过最小化式(5)
5)计算线性变换矩阵W。
6)输出模型MATT-DTI
尽管本发明的实施方案已公开如上,但其并不仅仅限于说明书和实施方式中所列运用,它完全可以被适用于各种适合本发明的领域,对于熟悉本领域的人员而言,可容易地实现另外的修改,因此在不背离权利要求及等同范围所限定的一般概念下,本发明并不限于特定的细节。

Claims (1)

1.一种预测药物靶标相互作用的多注意力方法,包括以下步骤:
1)计算基于多注意力模块的药物-靶标相互作用模型MATT-DTI输出:
其中,将药物序列数据中的第i个样本蛋白质序列数据中的第j个样本/>代入上式,预测的药物-靶标的亲和力分数/>
2)根据下式损失函数,
3)更新MATT-DTI模型的网络参数通过最小化式(5),
4)计算线性变换矩阵W;
5)输出训练好的MATT-DTI模型,该MATT-DTI模型由一个药物表达学习模块fD,一个靶标表达学习模块fP、一个亲和力分数预测神经模型f组成,其输出预测的亲和力值;
其中,药物表达学习模块fD由输入层,相关自注意力层、全连接层、3层卷积层、池化层的顺序组合,其输出为药物深层表达Di
其输入为药物序列数据中的第i个样本输出该样本的深层特征表达;
靶标表达学习模块fP由3层卷积层和1层池化层组成,输出靶标深度表达Pi
其输入为蛋白质序列数据中的第i个样本输出该样本的深层特征表达;
亲和力分数预测神经模型f,将药物深层表达Di和靶标的深层表达Pj作为多头自注意力层的输入,再连接3层全连接层输出预测的亲和力值。
CN202110045057.3A 2021-01-13 2021-01-13 预测药物靶标相互作用的多注意力方法 Active CN114765060B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110045057.3A CN114765060B (zh) 2021-01-13 2021-01-13 预测药物靶标相互作用的多注意力方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110045057.3A CN114765060B (zh) 2021-01-13 2021-01-13 预测药物靶标相互作用的多注意力方法

Publications (2)

Publication Number Publication Date
CN114765060A CN114765060A (zh) 2022-07-19
CN114765060B true CN114765060B (zh) 2023-12-08

Family

ID=82364000

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110045057.3A Active CN114765060B (zh) 2021-01-13 2021-01-13 预测药物靶标相互作用的多注意力方法

Country Status (1)

Country Link
CN (1) CN114765060B (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117275608B (zh) * 2023-09-08 2024-04-26 浙江大学 基于协同注意力的可解释性抗癌药物协同预测方法及装置

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103123672A (zh) * 2011-11-21 2013-05-29 华中农业大学 抗结核抑制剂筛选的靶标基因Rv0233及应用
CN107038348A (zh) * 2017-05-04 2017-08-11 四川大学 基于蛋白‑配体相互作用指纹图谱的药物靶标预测方法
CN108509765A (zh) * 2018-03-26 2018-09-07 中山大学 一种基于fm-n-dnn的药物靶标相互作用预测方法
CN110289050A (zh) * 2019-05-30 2019-09-27 湖南大学 一种基于图卷积和词向量的药物-靶标相互作用预测方法
CN110689965A (zh) * 2019-10-10 2020-01-14 电子科技大学 一种基于深度学习的药物靶点亲和力预测方法
CN111370073A (zh) * 2020-02-27 2020-07-03 福州大学 一种基于深度学习的药物互作规则预测方法
CN111916145A (zh) * 2020-07-24 2020-11-10 湖南大学 基于图表示学习的新冠病毒靶标预测和药物发现方法

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20190304568A1 (en) * 2018-03-30 2019-10-03 Board Of Trustees Of Michigan State University System and methods for machine learning for drug design and discovery
CN113421658B (zh) * 2021-07-06 2023-06-16 西北工业大学 基于近邻注意力网络的“药物-靶标”相互作用预测方法

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103123672A (zh) * 2011-11-21 2013-05-29 华中农业大学 抗结核抑制剂筛选的靶标基因Rv0233及应用
CN107038348A (zh) * 2017-05-04 2017-08-11 四川大学 基于蛋白‑配体相互作用指纹图谱的药物靶标预测方法
CN108509765A (zh) * 2018-03-26 2018-09-07 中山大学 一种基于fm-n-dnn的药物靶标相互作用预测方法
CN110289050A (zh) * 2019-05-30 2019-09-27 湖南大学 一种基于图卷积和词向量的药物-靶标相互作用预测方法
CN110689965A (zh) * 2019-10-10 2020-01-14 电子科技大学 一种基于深度学习的药物靶点亲和力预测方法
CN111370073A (zh) * 2020-02-27 2020-07-03 福州大学 一种基于深度学习的药物互作规则预测方法
CN111916145A (zh) * 2020-07-24 2020-11-10 湖南大学 基于图表示学习的新冠病毒靶标预测和药物发现方法

Non-Patent Citations (6)

* Cited by examiner, † Cited by third party
Title
Qichang Zhao等.AttentionDTA: prediction of drug–target binding affinity using attention model.《2019 IEEE International Conference on Bioinformatics and Biomedicine (BIBM)》.2020,第64-69页. *
Yuni Zeng等.Deep drug-target binding affinity prediction with multiple attention blocks.《Briefings in Bioinformatics》.2021,第1-10页. *
ZTüRKHAKIME等.DeepDTA:deepdrug-target binding affinity prediction.《Bioinformatics》.2018,第34卷(第17期),第821-829页. *
张生东.具有注意力机制的BiLSTM-CRF药物相互作用提取.《中国优秀硕士学位论文全文数据库 医药卫生科技辑》.2020,(第(2020)05期),E079-91. *
曾煜妮.面向药物-靶标相互作用预测的多特征学习方法.《中国博士学位论文全文数据库 医药卫生科技辑》.2022,(第(2022)04期),E079-5. *
郑小平.基于特征组合与迁移学习的药物—靶标相互作用预测研究.《中国优秀硕士学位论文全文数据库 医药卫生科技辑》.2020,(第2020(07)期),E079-6. *

Also Published As

Publication number Publication date
CN114765060A (zh) 2022-07-19

Similar Documents

Publication Publication Date Title
US11651286B2 (en) Method and system for distributed machine learning
CN113239700A (zh) 改进bert的文本语义匹配设备、系统、方法及存储介质
CN111370073B (zh) 一种基于深度学习的药物互作规则预测方法
CN115982403B (zh) 一种多模态哈希检索方法及装置
CN112232087A (zh) 一种基于Transformer的多粒度注意力模型的特定方面情感分析方法
EP4202725A1 (en) Joint personalized search and recommendation with hypergraph convolutional networks
CN112599187B (zh) 一种基于双流神经网络预测药物与靶标蛋白结合分数的方法
Liu et al. EACP: An effective automatic channel pruning for neural networks
CN108536735A (zh) 基于多通道自编码器的多模态词汇表示方法与系统
CN111353313A (zh) 基于进化神经网络架构搜索的情感分析模型构建方法
CN106997379A (zh) 一种基于图片文本点击量的相近文本的合并方法
WO2022056841A1 (en) Neural architecture search via similarity-based operator ranking
CN114765060B (zh) 预测药物靶标相互作用的多注意力方法
CN116386899A (zh) 基于图学习的药物疾病关联关系预测方法及相关设备
CN114093422A (zh) 一种基于多关系图卷积网络的miRNA和基因相互作用的预测方法及其系统
CN109147868A (zh) 蛋白质功能预测方法、装置、设备及存储介质
CN111582287A (zh) 一种基于充足视觉信息与文本信息的图像描述方法
CN114783507B (zh) 基于二级结构特征编码的药物-蛋白亲和力预测方法及装置
CN113468311B (zh) 一种基于知识图谱的复杂问句问答方法、装置及存储介质
CN115577111A (zh) 基于自注意力机制的文本分类方法
CN115881244A (zh) 基于深度迁移学习模型的药物分子骨架替换和筛选方法
CN105468680A (zh) 一种数据检索方法和装置
CN116189047A (zh) 一种基于多模态信息聚合的短视频分类方法
CN116246698A (zh) 基于神经网络的信息提取方法、装置、设备及存储介质
CN115525835A (zh) 一种长短期注意力循环网络推荐方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant