CN114765060B - 预测药物靶标相互作用的多注意力方法 - Google Patents
预测药物靶标相互作用的多注意力方法 Download PDFInfo
- Publication number
- CN114765060B CN114765060B CN202110045057.3A CN202110045057A CN114765060B CN 114765060 B CN114765060 B CN 114765060B CN 202110045057 A CN202110045057 A CN 202110045057A CN 114765060 B CN114765060 B CN 114765060B
- Authority
- CN
- China
- Prior art keywords
- drug
- target
- expression
- layer
- attention
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 239000003596 drug target Substances 0.000 title claims abstract description 20
- 230000003993 interaction Effects 0.000 title claims abstract description 15
- 238000000034 method Methods 0.000 title claims abstract description 10
- 239000003814 drug Substances 0.000 claims abstract description 15
- 229940079593 drug Drugs 0.000 claims abstract description 12
- 108090000623 proteins and genes Proteins 0.000 claims description 5
- 102000004169 proteins and genes Human genes 0.000 claims description 4
- 230000009466 transformation Effects 0.000 claims description 3
- 230000006870 function Effects 0.000 claims description 2
- 239000011159 matrix material Substances 0.000 claims description 2
- 230000001537 neural effect Effects 0.000 claims 2
- 238000011176 pooling Methods 0.000 claims 2
- 238000009826 distribution Methods 0.000 abstract description 2
- 238000013527 convolutional neural network Methods 0.000 abstract 2
- 206010013710 Drug interaction Diseases 0.000 abstract 1
- 238000000605 extraction Methods 0.000 description 3
- 230000004913 activation Effects 0.000 description 2
- 101150005267 Add1 gene Proteins 0.000 description 1
- 150000001875 compounds Chemical class 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 238000012912 drug discovery process Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000012514 protein characterization Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B15/00—ICT specially adapted for analysing two-dimensional or three-dimensional molecular structures, e.g. structural or functional relations or structure alignment
- G16B15/30—Drug targeting using structural data; Docking or binding prediction
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Health & Medical Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- General Health & Medical Sciences (AREA)
- Biophysics (AREA)
- General Physics & Mathematics (AREA)
- Chemical & Material Sciences (AREA)
- Evolutionary Computation (AREA)
- Computational Linguistics (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- General Engineering & Computer Science (AREA)
- Biomedical Technology (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Artificial Intelligence (AREA)
- Data Mining & Analysis (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Pharmacology & Pharmacy (AREA)
- Crystallography & Structural Chemistry (AREA)
- Medicinal Chemistry (AREA)
- Bioinformatics & Computational Biology (AREA)
- Biotechnology (AREA)
- Evolutionary Biology (AREA)
- Medical Informatics (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明公开了一种预测药物靶标相互作用的方法,该方法基于多注意力模块的端到端模型(MATT‑DTI),来预测药物靶标对的亲和力分数。该模型通过两个自注意力模块分布建模药物以及药物靶标对的相互作用来是想。MATT‑DTI,如图1所示,首先利用一个相关自注意力模型和卷积神经网络通过编码原子与原子之间的相关关系来提取药物序列的特征,从而得到药物的深层表达。其次,MATT‑DTI通过一个卷积神经网络模型编码得到靶标序列的深层表达。最后,建立基于多头自注意力机制的模块,通过对药物深层表达和靶标深层表达之间的相似性建模,提取药物靶标对的相互作用信息,从而得到预测的亲和力分数。
Description
技术领域
本发明涉及计算机多媒体技术领域,特别涉及一种预测药物靶标相互作用的多注意力方法。
背景技术
在现实场景中,药物靶标相互作用的预测任务,因其在药物发现过程中的重要地位而受到越来越多的关注。药物靶标相互作用预测的方法可当作分类任务和回归任务。分类任务是去预测在药物靶标对是否存在相互作用。回归任务是预测药物标靶对之间相互作用的程度,通常用亲和力分数来衡量。大多数药物靶标相互作用预测方法忽略了化合物原子与原子之间的相关关系。例如DeepDTA,它通过字符级别的字典编码药物和靶标,这不仅将多字符原子编码为多个字符,还忽略了原子与原子之间的相关关系,这导致了其可能捕捉不到非线性的高层语义信息。
本发明提出一种基于多注意力模块的端到端模型(MATT-DTI),来预测药物靶标对的亲和力分数,如图1所示。通过多个自注意力模块分布考虑化合物中原子与原子的相关关系以及药物靶标对之间的相互作用。
发明内容
本发明所要解决的技术问题在于针对上述现有技术中的不足,提供一种多头自注意力方法。采用深度网络DNN用作药物、靶标、药物的特征提取,然后寻找一组变换W={W(1),…,W(k)…,W(v)},在同过深度网络DNN来预测药物靶标对的亲和力。
为解决上述技术问题,本发明采用的技术方案是:一种预测药物靶标相互作用的多注意力方法,包括以下步骤:
1)使用DNN提取药物特征:
其中,为药物序列数据中的第i个样本。
优选的是,DNN的结构参数如表1所示。
表1 DNN结构参数
Layer | Channel | Kernel | Stride | Padding | Activation |
Embed_1 | - | - | - | - | - |
Rel_Att | 128 | - | - | - | ReLU |
Fc1_1 | 128 | - | - | - | ReLU |
Add1 | - | - | - | - | - |
Conv1_1 | 32 | 8 | 1 | same | ReLU |
Conv1_2 | 64 | 8 | 1 | same | ReLU |
Conv1_3 | 96 | 8 | 1 | same | ReLU |
Pool1 | - | - | - | same | Max |
2)使用DNN提取蛋白特征:
其中,为蛋白质序列数据中的第i个样本。
优选的是,DNN的结构参数如表2所示。
表2 DNN结构参数
Layer | Channel | Kernel | Stride | Padding | Activation |
Embed_2 | - | - | - | - | - |
Conv2_1 | 32 | 12 | 1 | same | ReLU |
Conv2_2 | 64 | 12 | 1 | same | ReLU |
Conv2_3 | 96 | 12 | 1 | same | ReLU |
Pool2 | - | - | - | same | Max |
3)使用DNN预测药物靶标对的亲和力分数:
其中,为第i个药物样本和第j个蛋白样本之间预测的亲和力分数。
优选的是,DNN的结构参数如表3所示。
表3 DNN结构参数
附图说明
图1为本发明的一种实施例中的输入与输出网络结构图。
具体实施方式
下面结合实施例对本发明做进一步的详细说明,以令本领域技术人员参照说明书文字能够据以实施。
应当理解,本文所使用的诸如“具有”、“包含”以及“包括”术语并不排除一个或多个其它网络或其组合的存在或添加。
本实施例的一种预测药物靶标相互作用的多注意力方法,包括以下步骤:
1)准备训练集以及标签y,batch的大小Nb及学习率α。
2)计算mini-batch的DNN网络输出:
3)根据下式损失函数,
4)更新每个DNN网络的参数通过最小化式(5)
5)计算线性变换矩阵W。
6)输出模型MATT-DTI
尽管本发明的实施方案已公开如上,但其并不仅仅限于说明书和实施方式中所列运用,它完全可以被适用于各种适合本发明的领域,对于熟悉本领域的人员而言,可容易地实现另外的修改,因此在不背离权利要求及等同范围所限定的一般概念下,本发明并不限于特定的细节。
Claims (1)
1.一种预测药物靶标相互作用的多注意力方法,包括以下步骤:
1)计算基于多注意力模块的药物-靶标相互作用模型MATT-DTI输出:
其中,将药物序列数据中的第i个样本蛋白质序列数据中的第j个样本/>代入上式,预测的药物-靶标的亲和力分数/>
2)根据下式损失函数,
3)更新MATT-DTI模型的网络参数通过最小化式(5),
4)计算线性变换矩阵W;
5)输出训练好的MATT-DTI模型,该MATT-DTI模型由一个药物表达学习模块fD,一个靶标表达学习模块fP、一个亲和力分数预测神经模型f组成,其输出预测的亲和力值;
其中,药物表达学习模块fD由输入层,相关自注意力层、全连接层、3层卷积层、池化层的顺序组合,其输出为药物深层表达Di:
其输入为药物序列数据中的第i个样本输出该样本的深层特征表达;
靶标表达学习模块fP由3层卷积层和1层池化层组成,输出靶标深度表达Pi:
其输入为蛋白质序列数据中的第i个样本输出该样本的深层特征表达;
亲和力分数预测神经模型f,将药物深层表达Di和靶标的深层表达Pj作为多头自注意力层的输入,再连接3层全连接层输出预测的亲和力值。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110045057.3A CN114765060B (zh) | 2021-01-13 | 2021-01-13 | 预测药物靶标相互作用的多注意力方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110045057.3A CN114765060B (zh) | 2021-01-13 | 2021-01-13 | 预测药物靶标相互作用的多注意力方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN114765060A CN114765060A (zh) | 2022-07-19 |
CN114765060B true CN114765060B (zh) | 2023-12-08 |
Family
ID=82364000
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110045057.3A Active CN114765060B (zh) | 2021-01-13 | 2021-01-13 | 预测药物靶标相互作用的多注意力方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN114765060B (zh) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117275608B (zh) * | 2023-09-08 | 2024-04-26 | 浙江大学 | 基于协同注意力的可解释性抗癌药物协同预测方法及装置 |
Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103123672A (zh) * | 2011-11-21 | 2013-05-29 | 华中农业大学 | 抗结核抑制剂筛选的靶标基因Rv0233及应用 |
CN107038348A (zh) * | 2017-05-04 | 2017-08-11 | 四川大学 | 基于蛋白‑配体相互作用指纹图谱的药物靶标预测方法 |
CN108509765A (zh) * | 2018-03-26 | 2018-09-07 | 中山大学 | 一种基于fm-n-dnn的药物靶标相互作用预测方法 |
CN110289050A (zh) * | 2019-05-30 | 2019-09-27 | 湖南大学 | 一种基于图卷积和词向量的药物-靶标相互作用预测方法 |
CN110689965A (zh) * | 2019-10-10 | 2020-01-14 | 电子科技大学 | 一种基于深度学习的药物靶点亲和力预测方法 |
CN111370073A (zh) * | 2020-02-27 | 2020-07-03 | 福州大学 | 一种基于深度学习的药物互作规则预测方法 |
CN111916145A (zh) * | 2020-07-24 | 2020-11-10 | 湖南大学 | 基于图表示学习的新冠病毒靶标预测和药物发现方法 |
Family Cites Families (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20190304568A1 (en) * | 2018-03-30 | 2019-10-03 | Board Of Trustees Of Michigan State University | System and methods for machine learning for drug design and discovery |
CN113421658B (zh) * | 2021-07-06 | 2023-06-16 | 西北工业大学 | 基于近邻注意力网络的“药物-靶标”相互作用预测方法 |
-
2021
- 2021-01-13 CN CN202110045057.3A patent/CN114765060B/zh active Active
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103123672A (zh) * | 2011-11-21 | 2013-05-29 | 华中农业大学 | 抗结核抑制剂筛选的靶标基因Rv0233及应用 |
CN107038348A (zh) * | 2017-05-04 | 2017-08-11 | 四川大学 | 基于蛋白‑配体相互作用指纹图谱的药物靶标预测方法 |
CN108509765A (zh) * | 2018-03-26 | 2018-09-07 | 中山大学 | 一种基于fm-n-dnn的药物靶标相互作用预测方法 |
CN110289050A (zh) * | 2019-05-30 | 2019-09-27 | 湖南大学 | 一种基于图卷积和词向量的药物-靶标相互作用预测方法 |
CN110689965A (zh) * | 2019-10-10 | 2020-01-14 | 电子科技大学 | 一种基于深度学习的药物靶点亲和力预测方法 |
CN111370073A (zh) * | 2020-02-27 | 2020-07-03 | 福州大学 | 一种基于深度学习的药物互作规则预测方法 |
CN111916145A (zh) * | 2020-07-24 | 2020-11-10 | 湖南大学 | 基于图表示学习的新冠病毒靶标预测和药物发现方法 |
Non-Patent Citations (6)
Title |
---|
Qichang Zhao等.AttentionDTA: prediction of drug–target binding affinity using attention model.《2019 IEEE International Conference on Bioinformatics and Biomedicine (BIBM)》.2020,第64-69页. * |
Yuni Zeng等.Deep drug-target binding affinity prediction with multiple attention blocks.《Briefings in Bioinformatics》.2021,第1-10页. * |
ZTüRKHAKIME等.DeepDTA:deepdrug-target binding affinity prediction.《Bioinformatics》.2018,第34卷(第17期),第821-829页. * |
张生东.具有注意力机制的BiLSTM-CRF药物相互作用提取.《中国优秀硕士学位论文全文数据库 医药卫生科技辑》.2020,(第(2020)05期),E079-91. * |
曾煜妮.面向药物-靶标相互作用预测的多特征学习方法.《中国博士学位论文全文数据库 医药卫生科技辑》.2022,(第(2022)04期),E079-5. * |
郑小平.基于特征组合与迁移学习的药物—靶标相互作用预测研究.《中国优秀硕士学位论文全文数据库 医药卫生科技辑》.2020,(第2020(07)期),E079-6. * |
Also Published As
Publication number | Publication date |
---|---|
CN114765060A (zh) | 2022-07-19 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11651286B2 (en) | Method and system for distributed machine learning | |
CN113239700A (zh) | 改进bert的文本语义匹配设备、系统、方法及存储介质 | |
CN111370073B (zh) | 一种基于深度学习的药物互作规则预测方法 | |
CN115982403B (zh) | 一种多模态哈希检索方法及装置 | |
CN112232087A (zh) | 一种基于Transformer的多粒度注意力模型的特定方面情感分析方法 | |
EP4202725A1 (en) | Joint personalized search and recommendation with hypergraph convolutional networks | |
CN112599187B (zh) | 一种基于双流神经网络预测药物与靶标蛋白结合分数的方法 | |
Liu et al. | EACP: An effective automatic channel pruning for neural networks | |
CN108536735A (zh) | 基于多通道自编码器的多模态词汇表示方法与系统 | |
CN111353313A (zh) | 基于进化神经网络架构搜索的情感分析模型构建方法 | |
CN106997379A (zh) | 一种基于图片文本点击量的相近文本的合并方法 | |
WO2022056841A1 (en) | Neural architecture search via similarity-based operator ranking | |
CN114765060B (zh) | 预测药物靶标相互作用的多注意力方法 | |
CN116386899A (zh) | 基于图学习的药物疾病关联关系预测方法及相关设备 | |
CN114093422A (zh) | 一种基于多关系图卷积网络的miRNA和基因相互作用的预测方法及其系统 | |
CN109147868A (zh) | 蛋白质功能预测方法、装置、设备及存储介质 | |
CN111582287A (zh) | 一种基于充足视觉信息与文本信息的图像描述方法 | |
CN114783507B (zh) | 基于二级结构特征编码的药物-蛋白亲和力预测方法及装置 | |
CN113468311B (zh) | 一种基于知识图谱的复杂问句问答方法、装置及存储介质 | |
CN115577111A (zh) | 基于自注意力机制的文本分类方法 | |
CN115881244A (zh) | 基于深度迁移学习模型的药物分子骨架替换和筛选方法 | |
CN105468680A (zh) | 一种数据检索方法和装置 | |
CN116189047A (zh) | 一种基于多模态信息聚合的短视频分类方法 | |
CN116246698A (zh) | 基于神经网络的信息提取方法、装置、设备及存储介质 | |
CN115525835A (zh) | 一种长短期注意力循环网络推荐方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |