CN116994644B - 基于预训练模型的药靶亲和力预测方法 - Google Patents
基于预训练模型的药靶亲和力预测方法 Download PDFInfo
- Publication number
- CN116994644B CN116994644B CN202310946122.9A CN202310946122A CN116994644B CN 116994644 B CN116994644 B CN 116994644B CN 202310946122 A CN202310946122 A CN 202310946122A CN 116994644 B CN116994644 B CN 116994644B
- Authority
- CN
- China
- Prior art keywords
- protein
- representation
- module
- compound
- learning
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000012549 training Methods 0.000 title claims abstract description 18
- 238000000034 method Methods 0.000 title claims description 28
- 239000003814 drug Substances 0.000 title abstract description 11
- 229940079593 drug Drugs 0.000 title description 5
- 102000004169 proteins and genes Human genes 0.000 claims abstract description 98
- 108090000623 proteins and genes Proteins 0.000 claims abstract description 98
- 150000001875 compounds Chemical group 0.000 claims abstract description 67
- 230000003993 interaction Effects 0.000 claims abstract description 31
- 230000004927 fusion Effects 0.000 claims abstract description 11
- 239000013598 vector Substances 0.000 claims abstract description 4
- 238000013528 artificial neural network Methods 0.000 claims description 19
- 239000003596 drug target Substances 0.000 claims description 10
- 230000006870 function Effects 0.000 claims description 8
- 238000005070 sampling Methods 0.000 claims description 8
- 230000002776 aggregation Effects 0.000 claims description 7
- 238000004220 aggregation Methods 0.000 claims description 7
- 230000007787 long-term memory Effects 0.000 claims description 7
- 230000010354 integration Effects 0.000 claims description 6
- 230000006403 short-term memory Effects 0.000 claims description 6
- 230000008569 process Effects 0.000 claims description 4
- 230000015654 memory Effects 0.000 claims 1
- 238000002474 experimental method Methods 0.000 description 4
- 230000007246 mechanism Effects 0.000 description 4
- 230000007547 defect Effects 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- 230000000306 recurrent effect Effects 0.000 description 2
- 230000009471 action Effects 0.000 description 1
- 230000004075 alteration Effects 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 230000000052 comparative effect Effects 0.000 description 1
- 238000013527 convolutional neural network Methods 0.000 description 1
- 238000009509 drug development Methods 0.000 description 1
- 230000002452 interceptive effect Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000003032 molecular docking Methods 0.000 description 1
- 238000007500 overflow downdraw method Methods 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B15/00—ICT specially adapted for analysing two-dimensional or three-dimensional molecular structures, e.g. structural or functional relations or structure alignment
- G16B15/30—Drug targeting using structural data; Docking or binding prediction
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/241—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/27—Regression, e.g. linear or logistic regression
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/042—Knowledge-based neural networks; Logical representations of neural networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
- G06N3/0455—Auto-encoder networks; Encoder-decoder networks
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B40/00—ICT specially adapted for biostatistics; ICT specially adapted for bioinformatics-related machine learning or data mining, e.g. knowledge discovery or pattern finding
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16C—COMPUTATIONAL CHEMISTRY; CHEMOINFORMATICS; COMPUTATIONAL MATERIALS SCIENCE
- G16C20/00—Chemoinformatics, i.e. ICT specially adapted for the handling of physicochemical or structural data of chemical particles, elements, compounds or mixtures
- G16C20/70—Machine learning, data mining or chemometrics
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02A—TECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
- Y02A90/00—Technologies having an indirect contribution to adaptation to climate change
- Y02A90/10—Information and communication technologies [ICT] supporting adaptation to climate change, e.g. for weather forecasting or climate simulation
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Data Mining & Analysis (AREA)
- Health & Medical Sciences (AREA)
- Evolutionary Computation (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Artificial Intelligence (AREA)
- Bioinformatics & Computational Biology (AREA)
- General Health & Medical Sciences (AREA)
- Biophysics (AREA)
- Evolutionary Biology (AREA)
- Medical Informatics (AREA)
- General Engineering & Computer Science (AREA)
- Software Systems (AREA)
- Computer Vision & Pattern Recognition (AREA)
- General Physics & Mathematics (AREA)
- Chemical & Material Sciences (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Computing Systems (AREA)
- Molecular Biology (AREA)
- Computational Linguistics (AREA)
- Databases & Information Systems (AREA)
- Biomedical Technology (AREA)
- Mathematical Physics (AREA)
- Biotechnology (AREA)
- Crystallography & Structural Chemistry (AREA)
- Pharmacology & Pharmacy (AREA)
- Public Health (AREA)
- Epidemiology (AREA)
- Medicinal Chemistry (AREA)
- Bioethics (AREA)
- Investigating Or Analysing Biological Materials (AREA)
Abstract
本申请涉及生物信息领域,公开了基于预训练模型的药靶亲和力预测系统,包括蛋白语言嵌入表示模块,用于生成丰富的蛋白语义特征表示;蛋白质序列表示学习模块,用于生成蛋白序列的连续性表示,并获得蛋白序列的深层表示;化合物序列表示学习模块,用于生成化合物结构信息表示;克罗内克积的融合模块,用于通过克罗内克积计算蛋白与化合物特征向量的共同表示,来明确捕获化合物和蛋白质特征的重要相互作用。通过预训练的蛋白语言模型(如ESM、TAPE等)对蛋白序列进行编码,可以获得丰富的蛋白序列的语料表示并加快模型收敛。通过整合多种化合物中的原子特征,本模型能够更全面地捕获化合物的特征。
Description
技术领域
本发明涉及生物信息技术领域,具体为基于预训练模型的药靶亲和力预测方法。
背景技术
在药物研发领域,实验方法已积累了大量的蛋白质与化合物数据,为蛋白质与化合物相互作用预测研究提供了丰富的数据支持。对于蛋白质-化合物互相作用预测,现有的实现方案主要包括基于结构的方法和基于序列的方法。基于结构的方法如分子对接、复合物3D-CNN神经网络等,这些方法依赖于蛋白质以及化合物的3D结构,然而自然界存在大量尚未获得结构信息的蛋白质,这限制了模型的适用性。另一方面,基于序列的方法如递归神经网络、图神经网络、注意力机制等已成功应用于提取蛋白质和化合物序列的语义特征操作,为了更准确地描述蛋白质的特性,他们使用了SPS(Structural Property Sequence)表示方法对蛋白序列进行编码,并通过融合了注意力机制的递归神经网络对大量无标签的SPS序列和化合物序列进行预训练。该方法得通过蛋白质的序列和结构信息共同表示,从而更准确地预测蛋白质和化合物之间的相互作用,另外也有人提出一种基于自注意力机制的蛋白质-化合物互相作用模型框架(TransformerCPI)。该框架采用图卷积网络和图神经网络对蛋白序列和化合物序列分别进行编码,并将蛋白序列视为编码器输入、化合物序列视为解码器输入,由解码器输出包含交互特征的序列并将序列通过全连接层以获得最终的预测结果,然而上述方法均存在以下不足之处;(1)它们通常基于数据集内的蛋白序列实现蛋白质的嵌入表达,可能无法充分捕获蛋白序列的深层语义信息;(2)这些方法关注了蛋白序列与化合物序列互相作用的机制,但只针对某个特定任务训练模型(如预测是否接触或预测亲和力值),不便于人们使用,为此本领域技术人员提出基于预训练模型的药靶亲和力预测方法来解决上述问题。
发明内容
针对现有技术的不足,本发明提供了基于预训练模型的药靶亲和力预测方法,解决了的问题。
为实现以上目的,本发明通过以下技术方案予以实现:基于预训练模型的药靶亲和力预测系统,包括:
蛋白语言嵌入表示模块,用于生成丰富的蛋白语义特征表示;
蛋白质序列表示学习模块,用于生成蛋白序列的连续性表示,并获得蛋白序列的深层表示;
化合物序列表示学习模块,用于用于生成化合物结构信息表示;
克罗内克积的融合模块,用于通过克罗内克积计算蛋白与化合物特征向量的共同表示,来明确捕获化合物和蛋白质特征的重要相互作用;
多任务的解码器模块,用于共享特征学习和表示学习的过程;
蛋白质-化合物互相作用多任务预测模块,用于明确捕获化合物和蛋白质特征的重要相互作用。
优选地,所述化合物序列表示学习模块包括:
RDKit工具包单元,用于通过RDKit工具包生成每个化合物的拓扑结构;
图神经网络学习单元,用于通过图神经网络学习分子图的拓扑表示信息;
整合单元,用于将多种化合物中原子特征进行整合,构建化合物拓扑图;
采样聚合图神经网络单元,用于学习图中各节点表示。
优选地,所述多任务的解码器模块包括
回归任务解码单元、用于采用交叉熵损失函数计算预测值和真实值的损失;
分类任务解码单元、用于采用均方误差损失函数计算预测值和真实值的损失。
优选的,还包括搜集模块,用于从BindingDB数据库中搜集数据,构建数据集。
基于预训练模型的药靶亲和力预测方法,具体使用步骤如下:
步骤一:首先通过搜集模块从BindingDB数据库中构建数据集,其中BindingDB数据库收集和记录了蛋白质-小分子化合物相互作用的实验数据,之后通过蛋白语言嵌入表示模块生产丰富的蛋白特征表示,其次通过蛋白质序列表示学习模块生成蛋白序列的连续性表示,并获得蛋白序列的深层表示,之后通过化合物序列表示学习模块用于生成化合物结构信息表示;
步骤二:通过长短期记忆网络学习蛋白信息深层表示,其次,通过整合单元对将多种化合物中原子特征进行整合,构建化合物拓扑图,并通过采样聚合图神经网络学习图中节点表示,通过克罗内克积的融合模块特计算了每个化合物特征与蛋白特征的互相作用情况,提高模型的预测准确性;
步骤三:此外,通过克罗内克积的融合模块特计算了每个化合物特征与蛋白特征的互相作用情况,提高模型的预测准确性。
本发明提供了基于预训练模型的药靶亲和力预测方法。具备以下
有益效果:
1、本发明通过预训练的蛋白语言模型(如ESM、TAPE等)对蛋白序列进行编码,可以获得丰富的蛋白序列的语料表示并加快模型收敛。通过整合多种化合物中的原子特征,本模型能够更全面地捕获化合物的特征。我们进一步设计了基于克罗内克积的蛋白与化合物融合特征编码器,从而更好地捕捉化合物与蛋白质互相作用关系。通过不同的解码器,可以分别实现对回归任务以及分类任务的预测。
2、本发明通过蛋白语言模型的嵌入表达与长短期记忆网络结合,能够有效学习蛋白序列特征信息,充分捕捉蛋白上下文信息以及注释信息,其次,通过采样聚合图神经网络可以有效地学习化合物分子特征。此外,通过设计了多任务预测功能,可以比单任务模型在训练时更好地学习和利用共同的特征信息,可以使已学习到的特征表示更加丰富和泛化,为预测蛋白质-化合物的互相作用提供了更为准确和有效的解决方案。
附图说明
图1为本发明的主流程图;
图2为本发明的蛋白语言嵌入表示模块流程图;
图3为本发明的蛋白质序列表示学习模块流程图;
图4为本发明的多任务的解码器模块流程图;
图5为本发明的不同的药物选择性数据集上微调表现显示图;
图6为本发明的蛋白质-化合物互相作用多任务预测模块工作示意图;
图7为本发明的技术路线图;
图8为本发明模型对比示意图;
图9为本发明在分类数据集上不同模型的比较示意图;
图10为本发明不同模块的比较图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整的描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
实施例:
请参阅附图1-附图10,本发明实施例提供基于预训练模型的药靶亲和力预测系统,包括蛋白语言嵌入表示模块,用于生成丰富的蛋白语义特征表示;
蛋白语言生成模块包括:长短期记忆网络学习单元,用于学习蛋白序列的上下文信息;
蛋白质序列表示学习模块,用于生成蛋白序列的连续性表示,并获得蛋白序列的深层表示。
蛋白质序列表示学习模块包括长短期记忆网络学习单元,用于学习蛋白序列的上下文信息。
化合物序列表示学习模块,用于用于生成化合物结构信息表示;
化合物序列表示学习模块包括:
RDKit工具包单元,用于通过RDKit工具包生成每个化合物的拓扑结构;
图神经网络学习单元,用于通过图神经网络学习分子图的拓扑表示信息;
整合单元,用于将多种化合物中原子特征进行整合,构建化合物拓扑图;
采样聚合图神经网络单元,用于学习图中各节点表示。
克罗内克积的融合模块,用于通过克罗内克积计算蛋白与化合物特征向量的共同表示,来明确捕获化合物和蛋白质特征的重要相互作用;
多任务的解码器模块,用于共享特征学习和表示学习的过程;
多任务的解码器模块包括:
回归任务解码单元、用于采用交叉熵损失函数计算预测值和真实值的损失;
分类任务解码单元、用于采用均方误差损失函数计算预测值和真实值的损失。
蛋白质-化合物互相作用多任务预测模块,用于明确捕获化合物和蛋白质特征的重要相互作用。
还包括搜集模块,用于BindingDB数据库中搜集数据,构建数据集
基于预训练模型的药靶亲和力预测方法,具体使用步骤如下:
步骤一:首先通过搜集模块从BindingDB数据库中构建数据集,其中BindingDB数据库收集和记录了蛋白质-小分子化合物相互作用的实验数据,之后通过蛋白语言嵌入表示模块生产丰富的蛋白特征表示,其次通过蛋白质序列表示学习模块生成蛋白序列的连续性表示,并获得蛋白序列的深层表示,之后通过化合物序列表示学习模块用于生成化合物结构信息表示;
步骤二:通过长短期记忆网络学习蛋白信息深层表示,其次,通过整合单元对将多种化合物中原子特征进行整合,构建化合物拓扑图,并通过采样聚合图神经网络学习图中节点表示,通过克罗内克积的融合模块特计算了每个化合物特征与蛋白特征的互相作用情况,提高模型的预测准确性;
步骤三:此外,通过克罗内克积的融合模块特计算了每个化合物特征与蛋白特征的互相作用情况,提高模型的预测准确性。
此外本发明回归任务实验对这376751个蛋白质-化合物对进行了实验,实验结果如图8所示,为了体现模型的有效性,比较了其他三个蛋白-化合物亲和力预测模型,与其他模型相比,PMF-CPI在MSE,Pearson上取得了最好的表现。此外我们还在BindingDB的分类数据集上进行了测试(如图9所示)。与其他方法相比,本发明的模型在AUC,AUPR上取得了最好的表现。
其中为了强调模型在多任务下药物选择性研究中的作用,本实施例针对四个数据集进行了一系列实验,其中三个为回归数据集(图5a、b和c),一个为分类数据集(图5d),与从头开始训练选择性预测模型相比,微调可以节省时间并在有限的训练数据下达到良好的预测性能。微调使用了不同比例的缺失数据,随着缺失条目的比例下降,预测性能得到了明显改善。AR数据集在仅训练5%的数据时均方误差(MSE)为1.005,当可见数据达到30%时,其MSE值将下降至0.482。在JAK和CYP数据集上,我们的模型在仅使用每个数据集的30%的训练数据时也能够实现约0.2的MSE和约0.8的Pearson相关系数。对于分类任务,PMF-CPI的预测结果AUC达到了0.864,AUPR达到了0.896。这表明我们的模型可以为选择性靶向类似目标的药物提供准确和直接的结合亲和力和相互作用关系预测,其中图5中(a)为测试集在模型最后一层的可视化结果,(b)为模型与其他方法的比较,从图5(a)中可以看出模型能很清晰区分出正负样本。
请参阅附图10,图10是模型各个模块选取不同策略的比较,结果表明,使用蛋白语言模型作为蛋白序列嵌入可以有效提高预测性能。此外,与直接串联蛋白、化合物特征相比,本发明的特征融合方法能有效地捕捉蛋白-化合物的互相作用信息,并提升预测性能。
本发明通过这些模块共同作用,实现了基于预训练模型的药靶亲和力预测(PMF-CPI)模型。模型能够充分捕获蛋白和化合物互相作用关系,多任务模型在训练时共享特征学习和表示学习的过程,可以比单任务模型更好地学习和利用共同的特征信息。这可以在训练时减少计算和存储开销,同时可以使已学习到的特征表示更加丰富和泛化,从而提高蛋白质-化合物互相作用预测的准确性和泛化能力,同时通过蛋白语言模型的嵌入表达与长短期记忆网络结合,能够有效学习蛋白序列特征信息,充分捕捉蛋白上下文信息以及注释信息,其次,通过采样聚合图神经网络可以有效地学习化合物分子特征。此外,通过设计了多任务预测功能,可以比单任务模型在训练时更好地学习和利用共同的特征信息,可以使已学习到的特征表示更加丰富和泛化,为预测蛋白质-化合物的互相作用提供了更为准确和有效的解决方案。
尽管已经示出和描述了本发明的实施例,对于本领域的普通技术人员而言,可以理解在不脱离本发明的原理和精神的情况下可以对这些实施例进行多种变化、修改、替换和变型,本发明的范围由所附权利要求及其等同物限定。
Claims (6)
1.基于预训练模型的药靶亲和力预测系统,其特征在于,包括:
蛋白语言嵌入表示模块,用于生成丰富的蛋白语义特征表示;
蛋白质序列表示学习模块,用于生成蛋白序列的连续性表示,并获得蛋白序列的深层表示;
化合物序列表示学习模块,用于生成化合物结构信息表示;
克罗内克积的融合模块,用于通过克罗内克积计算蛋白与化合物特征向量的共同表示,来明确捕获化合物和蛋白质特征的重要相互作用;
多任务的解码器模块,用于共享特征学习和表示学习的过程;
蛋白质-化合物互相作用多任务预测模块,用于明确捕获化合物和蛋白质特征的重要相互作用。
2.根据权利要求1所述的基于预训练模型的药靶亲和力预测系统,其特征在于,所述蛋白质序列表示学习模块包括长短期记忆网络学习单元,用于学习蛋白序列的上下文信息。
3.根据权利要求1所述的基于预训练模型的药靶亲和力预测系统,其特征在于,所述化合物序列表示学习模块包括:
RDKit工具包单元,用于通过RDKit工具包生成每个化合物的拓扑结构;
图神经网络学习单元,用于通过图神经网络学习分子图的拓扑表示信息;
整合单元,用于将多种化合物中原子特征进行整合,构建化合物拓扑图;
采样聚合图神经网络单元,用于学习图中各节点表示。
4.根据权利要求1所述的基于预训练模型的药靶亲和力预测系统,其特征在于,所述多任务的解码器模块包括
回归任务解码单元、用于采用交叉熵损失函数计算预测值和真实值的损失;
分类任务解码单元、用于采用均方误差损失函数计算预测值和真实值的损失。
5.根据权利要求1所述的基于预训练模型的药靶亲和力预测系统,其特征在于,还包括搜集模块,用于从BindingDB数据库中搜集数据,构建数据集。
6.基于预训练模型的药靶亲和力预测方法,依据权利要求1-5任一项所述基于预训练模型的药靶亲和力预测系统,其特征在于,具体使用步骤如下:
步骤一:首先通过搜集模块从BindingDB数据库中构建数据集,其中BindingDB数据库收集和记录了蛋白质-小分子化合物相互作用的实验数据,之后通过蛋白语言嵌入表示模块生产丰富的蛋白特征表示,其次通过蛋白质序列表示学习模块生成蛋白序列的连续性表示,并获得蛋白序列的深层表示,之后通过化合物序列表示学习模块用于生成化合物结构信息表示;
步骤二:通过长短期记忆网络学习蛋白信息深层表示,其次,通过整合单元对将多种化合物中原子特征进行整合,构建化合物拓扑图,并通过采样聚合图神经网络学习图中节点表示,通过克罗内克积的融合模块特计算了每个化合物特征与蛋白特征的互相作用情况,提高模型的预测准确性;
步骤三:此外,通过克罗内克积的融合模块特计算了每个化合物特征与蛋白特征的互相作用情况,提高模型的预测准确性。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310946122.9A CN116994644B (zh) | 2023-07-28 | 2023-07-28 | 基于预训练模型的药靶亲和力预测方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310946122.9A CN116994644B (zh) | 2023-07-28 | 2023-07-28 | 基于预训练模型的药靶亲和力预测方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN116994644A CN116994644A (zh) | 2023-11-03 |
CN116994644B true CN116994644B (zh) | 2024-02-02 |
Family
ID=88533285
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202310946122.9A Active CN116994644B (zh) | 2023-07-28 | 2023-07-28 | 基于预训练模型的药靶亲和力预测方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN116994644B (zh) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117393036A (zh) * | 2023-11-09 | 2024-01-12 | 中国海洋大学 | 一种用于药物-靶点亲和力预测的蛋白多层次语义聚合表征方法 |
Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105160206A (zh) * | 2015-10-08 | 2015-12-16 | 中国科学院数学与系统科学研究院 | 一种预测药物的蛋白质相互作用靶点的方法和系统 |
CN110689965A (zh) * | 2019-10-10 | 2020-01-14 | 电子科技大学 | 一种基于深度学习的药物靶点亲和力预测方法 |
CN113327644A (zh) * | 2021-04-09 | 2021-08-31 | 中山大学 | 一种基于图与序列的深度嵌入学习的药物-靶标相互作用预测方法 |
CN113823352A (zh) * | 2021-09-26 | 2021-12-21 | 南开大学 | 药物-靶蛋白亲和力预测方法及系统 |
CN113936735A (zh) * | 2021-11-02 | 2022-01-14 | 上海交通大学 | 一种药物分子与靶标蛋白的结合亲和力预测方法 |
KR20220071064A (ko) * | 2020-11-23 | 2022-05-31 | 주식회사 아론티어 | 유사도 기반의 합성곱 신경망을 이용한 약물-표적 결합 친화도의 예측 방법 및 이를 위한 시스템 |
CN114649054A (zh) * | 2020-12-18 | 2022-06-21 | 深圳吉诺因生物科技有限公司 | 基于深度学习的抗原亲和力预测方法和系统 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US9373059B1 (en) * | 2014-05-05 | 2016-06-21 | Atomwise Inc. | Systems and methods for applying a convolutional network to spatial data |
-
2023
- 2023-07-28 CN CN202310946122.9A patent/CN116994644B/zh active Active
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105160206A (zh) * | 2015-10-08 | 2015-12-16 | 中国科学院数学与系统科学研究院 | 一种预测药物的蛋白质相互作用靶点的方法和系统 |
CN110689965A (zh) * | 2019-10-10 | 2020-01-14 | 电子科技大学 | 一种基于深度学习的药物靶点亲和力预测方法 |
KR20220071064A (ko) * | 2020-11-23 | 2022-05-31 | 주식회사 아론티어 | 유사도 기반의 합성곱 신경망을 이용한 약물-표적 결합 친화도의 예측 방법 및 이를 위한 시스템 |
CN114649054A (zh) * | 2020-12-18 | 2022-06-21 | 深圳吉诺因生物科技有限公司 | 基于深度学习的抗原亲和力预测方法和系统 |
CN113327644A (zh) * | 2021-04-09 | 2021-08-31 | 中山大学 | 一种基于图与序列的深度嵌入学习的药物-靶标相互作用预测方法 |
CN113823352A (zh) * | 2021-09-26 | 2021-12-21 | 南开大学 | 药物-靶蛋白亲和力预测方法及系统 |
CN113936735A (zh) * | 2021-11-02 | 2022-01-14 | 上海交通大学 | 一种药物分子与靶标蛋白的结合亲和力预测方法 |
Non-Patent Citations (1)
Title |
---|
Compound–protein interaction prediction by deep learning: Databases, descriptors and models;Bing-Xue Du 等;Drug Discovery Today;第27卷(第5期);1350-1366 * |
Also Published As
Publication number | Publication date |
---|---|
CN116994644A (zh) | 2023-11-03 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111914085B (zh) | 文本细粒度情感分类方法、系统、装置及存储介质 | |
AU2019204399B2 (en) | A neural dialog state tracker for spoken dialog systems using dynamic memory networks | |
CN116994644B (zh) | 基于预训练模型的药靶亲和力预测方法 | |
CN115329127A (zh) | 一种融合情感信息的多模态短视频标签推荐方法 | |
Abbasi et al. | Modeling teacher-student techniques in deep neural networks for knowledge distillation | |
CN111488807A (zh) | 基于图卷积网络的视频描述生成系统 | |
CN111460979A (zh) | 一种基于多层时空框架的关键镜头视频摘要方法 | |
CN108665055A (zh) | 一种图说生成方法及装置 | |
CN114493014A (zh) | 多元时间序列预测方法、系统及计算机产品、存储介质 | |
CN115687687A (zh) | 一种面向开放域查询的视频片段搜索方法及系统 | |
CN114020891A (zh) | 双通道语义定位多粒度注意互增强的视频问答方法与系统 | |
CN113889179A (zh) | 基于多视图深度学习的化合物-蛋白质相互作用预测方法 | |
Wang et al. | TF-SOD: a novel transformer framework for salient object detection | |
CN113822368A (zh) | 一种基于无锚的增量式目标检测方法 | |
Jhunjhunwala et al. | Multi-action dialog policy learning with interactive human teaching | |
CN109635282B (zh) | 用于多方对话的篇章解析方法、装置、介质及计算设备 | |
CN117217368A (zh) | 预测模型的训练方法、装置、设备、介质及程序产品 | |
CN115984330A (zh) | 一种边界感知的目标跟踪模型及目标跟踪方法 | |
CN117238436A (zh) | 用于药物分子分析设计的模型预训练方法及装置 | |
CN116663523A (zh) | 多角度增强网络的语义文本相似度计算方法 | |
CN116977509A (zh) | 虚拟对象动作生成方法、装置、计算机设备和存储介质 | |
CN116977701A (zh) | 视频分类模型训练的方法、视频分类的方法和装置 | |
US11816148B1 (en) | Sampling technique for data clustering | |
CN114610871B (zh) | 基于人工智能算法的情报系统建模分析方法 | |
CN116307224A (zh) | 基于递归门控卷积和注意力机制改进的enso时空预测方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |