CN114464270A - 一种针对不同靶点蛋白进行药物设计的通用性方法 - Google Patents
一种针对不同靶点蛋白进行药物设计的通用性方法 Download PDFInfo
- Publication number
- CN114464270A CN114464270A CN202210051113.9A CN202210051113A CN114464270A CN 114464270 A CN114464270 A CN 114464270A CN 202210051113 A CN202210051113 A CN 202210051113A CN 114464270 A CN114464270 A CN 114464270A
- Authority
- CN
- China
- Prior art keywords
- model
- affinity
- protein
- drug
- smiles
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 102000004169 proteins and genes Human genes 0.000 title claims abstract description 47
- 108090000623 proteins and genes Proteins 0.000 title claims abstract description 47
- 239000003814 drug Substances 0.000 title claims abstract description 41
- 238000000034 method Methods 0.000 title claims abstract description 23
- 229940079593 drug Drugs 0.000 title claims description 31
- 230000006870 function Effects 0.000 claims abstract description 35
- 238000013528 artificial neural network Methods 0.000 claims abstract description 31
- 125000003275 alpha amino acid group Chemical group 0.000 claims abstract description 20
- 230000002787 reinforcement Effects 0.000 claims abstract description 16
- 238000012549 training Methods 0.000 claims abstract description 16
- 238000009510 drug design Methods 0.000 claims abstract description 8
- 150000001875 compounds Chemical class 0.000 claims abstract description 7
- 150000003384 small molecules Chemical class 0.000 claims abstract description 7
- 239000003112 inhibitor Substances 0.000 claims abstract description 4
- 238000010801 machine learning Methods 0.000 claims abstract description 4
- 239000003795 chemical substances by application Substances 0.000 claims description 22
- 239000003596 drug target Substances 0.000 claims description 9
- 230000009471 action Effects 0.000 claims description 6
- 238000005070 sampling Methods 0.000 claims description 5
- 239000003446 ligand Substances 0.000 claims description 4
- 230000007774 longterm Effects 0.000 claims description 4
- 230000008901 benefit Effects 0.000 claims description 3
- 239000011159 matrix material Substances 0.000 claims description 3
- 150000001413 amino acids Chemical class 0.000 claims description 2
- 230000002708 enhancing effect Effects 0.000 claims description 2
- 125000004122 cyclic group Chemical group 0.000 claims 1
- 238000005457 optimization Methods 0.000 claims 1
- 230000003014 reinforcing effect Effects 0.000 claims 1
- 238000013461 design Methods 0.000 abstract description 7
- 238000013473 artificial intelligence Methods 0.000 abstract description 3
- 239000002547 new drug Substances 0.000 description 11
- 230000003993 interaction Effects 0.000 description 9
- 238000003062 neural network model Methods 0.000 description 6
- 238000013135 deep learning Methods 0.000 description 5
- 230000008569 process Effects 0.000 description 5
- 230000000306 recurrent effect Effects 0.000 description 5
- 238000013527 convolutional neural network Methods 0.000 description 4
- 238000011161 development Methods 0.000 description 3
- 238000012827 research and development Methods 0.000 description 3
- 238000012216 screening Methods 0.000 description 3
- 239000000126 substance Substances 0.000 description 3
- 238000012360 testing method Methods 0.000 description 3
- 210000004027 cell Anatomy 0.000 description 2
- 238000000605 extraction Methods 0.000 description 2
- HPTJABJPZMULFH-UHFFFAOYSA-N 12-[(Cyclohexylcarbamoyl)amino]dodecanoic acid Chemical compound OC(=O)CCCCCCCCCCCNC(=O)NC1CCCCC1 HPTJABJPZMULFH-UHFFFAOYSA-N 0.000 description 1
- ORILYTVJVMAKLC-UHFFFAOYSA-N Adamantane Natural products C1C(C2)CC3CC1CC2C3 ORILYTVJVMAKLC-UHFFFAOYSA-N 0.000 description 1
- 206010013710 Drug interaction Diseases 0.000 description 1
- 241000288105 Grus Species 0.000 description 1
- 238000007476 Maximum Likelihood Methods 0.000 description 1
- 241001465754 Metazoa Species 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- 230000002238 attenuated effect Effects 0.000 description 1
- 238000010876 biochemical test Methods 0.000 description 1
- 230000001186 cumulative effect Effects 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 238000012912 drug discovery process Methods 0.000 description 1
- 238000002474 experimental method Methods 0.000 description 1
- 239000012634 fragment Substances 0.000 description 1
- 238000007429 general method Methods 0.000 description 1
- 238000007689 inspection Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 210000002569 neuron Anatomy 0.000 description 1
- 230000008520 organization Effects 0.000 description 1
- 229940043263 traditional drug Drugs 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16C—COMPUTATIONAL CHEMISTRY; CHEMOINFORMATICS; COMPUTATIONAL MATERIALS SCIENCE
- G16C20/00—Chemoinformatics, i.e. ICT specially adapted for the handling of physicochemical or structural data of chemical particles, elements, compounds or mixtures
- G16C20/50—Molecular design, e.g. of drugs
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16C—COMPUTATIONAL CHEMISTRY; CHEMOINFORMATICS; COMPUTATIONAL MATERIALS SCIENCE
- G16C20/00—Chemoinformatics, i.e. ICT specially adapted for the handling of physicochemical or structural data of chemical particles, elements, compounds or mixtures
- G16C20/70—Machine learning, data mining or chemometrics
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Chemical & Material Sciences (AREA)
- Physics & Mathematics (AREA)
- Computing Systems (AREA)
- Health & Medical Sciences (AREA)
- Bioinformatics & Cheminformatics (AREA)
- General Health & Medical Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Bioinformatics & Computational Biology (AREA)
- Data Mining & Analysis (AREA)
- Crystallography & Structural Chemistry (AREA)
- Software Systems (AREA)
- Evolutionary Computation (AREA)
- Artificial Intelligence (AREA)
- Medicinal Chemistry (AREA)
- Biophysics (AREA)
- Databases & Information Systems (AREA)
- Medical Informatics (AREA)
- Pharmacology & Pharmacy (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Biomedical Technology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Computational Linguistics (AREA)
- Molecular Biology (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Mathematical Physics (AREA)
- Investigating Or Analysing Biological Materials (AREA)
Abstract
一种针对不同靶点蛋白进行药物设计的通用性方法属于计算机人工智能与新药设计领域,包括训练分子生成模型、训练药物靶标亲和力预测模型,以亲和力模型输出作为奖励函数,通过强化学习使分子生成神经网络生成的分子与蛋白质有更好的亲和力。将某个靶点蛋白的氨基酸序列输入到已经训练好的药物设计机器学习模型中,得到针对这个靶点蛋白的小分子抑制剂化合物。
Description
技术领域
本发明涉及计算机人工智能与新药设计的交叉技术领域,是一种基于神经网络、深度强化学习的针对不同蛋白靶标进行新药分子设计的通用性方法,适用于新药发现过程中候选药物分子的设计与生成。
背景技术
小分子主要用于调节生物系统中特定靶蛋白的功能。传统的药物设计方法通过筛选公共和商业仓库中可用的化合物库,或通过使用片段和药效团模型从头生成分子来识别目标蛋白特异性分子。虽然筛选过程非常耗时,但只用传统方法探索了化学空间的一部分,大约10亿个小分子,然而,实际的化学空间估计有1063个分子或更多。深度学习方法可以弥补这一差距,设计出多种新的具有期望的药物性质的药物分子。深度生成模型的发展已经产生了一系列有前景的建议来解决分子生成的问题,为新药设计提供了一个有前景的新方向。化合物的简化分子输入线输入规范(SMILES)表示是一种从分子图派生出来的基于字符串的表示,在这一领域得到了广泛的应用。对于基于SMILES的生成模型,将字符串的一次性编码输入循环神经网络(RNN)模型进行学习,然后根据学习的分布逐字符生成字符串。将强化学习的概念被整合到分子生成中。对预先训练的基于RNN的生成器进行微调,可以生成理想的分子。基于此,我们将药物靶标相互作用模型集成到强化学习中,开发了一种能够设计适合任何目标蛋白的小分子的方法。开发这种方法可以快速设计针对任何靶标蛋白的药物。
发明内容
本发明的目的在于提供了一种基于人工智能针对不同靶点蛋白进行药物设计的通用性方法,将某个靶点蛋白的氨基酸序列输入到已经训练好的药物设计机器学习模型中,得到针对这个靶点蛋白的小分子抑制剂化合物库。
为了实现上述目的,本发明的技术方案如下:
一种针对不同靶点蛋白进行药物设计的通用性方法,包括以下步骤:
第一步是训练分子生成模型。生成模型训练的数据集来自CHEMBL数据库,这些分子以SMILES格式表示。分子生成模型在CHEMBL数据库96万SMILES字符串的数据集上进行训练。生成模型的神经网络架构使用门控循环单元(GRU)神经网络。这个模型为分子生成预训练模型。
许多强化学习中的问题都被称为马尔科夫决策,这就意味着当前的状态包含了所有指导命令选择的必要信息,并且不需要从之前的状态中获取任何信息。对于大多数实际问题,这只是一种近似而不是事实。然而,我们可以把这一概念概括为一种部分可观察的马尔科夫决策。智能通过可以与不完整的环境代表发生互作。将r(a|s)定义为评估在某一特定状态下采取某种动作的优势的奖励,那么长期反馈则被定义为从时间t积累到时间T的累计奖励。因为通常只有完整的SMILES字符串能够产生可取的分子形式,因此我们只参考完整序列的反馈。
由于使用SMILES来表示一个分子需要神经网络输出一系列字符,每输出一个字符都可以视为一个动作。例如,成功输出一个有效的SMILES编码分子并且具有一定的特征,强化学习的奖励函数就会给予一定的奖励。这里的奖励函数可以采用多重中间奖励的加权和:药物化学和药物相似性评分、活性化学评分、结构评分(适合配体特征和/或结合袋)、新颖性评分和多样性评分。利用药物与蛋白质亲和力神经网络的预测模型预测亲和力作为奖励函数,这样整体模型与蛋白质建立关系。分子生成神经网络生成的分子传递给亲和力预测模型,通过预测模型预测分子与蛋白质的亲和力。亲和力作为奖励函数通过强化学习反馈给分子生成神经网络,通过强化学习使分子生成神经网络生成的分子与蛋白质有更好的亲和力。
对于药物靶标亲和力预测模型,基于深度学习开发的药物靶标亲和力预测模型能够针对任何蛋白靶标和药物分子进行预测。使用深度学习的优势是能够挖掘药物和靶标之间隐藏的相互作用,并且目前基于深度学习开发的药物靶标亲和力预测模型能够针对任何蛋白靶标和药物分子进行预测。我们利用的是药物的SMILES编码与蛋白质的氨基酸序列作为输入,通过神经网络进行训练,亲和力数值作为输出。训练数据是BindingDB数据库中配体靶点数据集,将SMILES编码和氨基酸序列转换为one-hot编码,再通过卷积操作将药物分子和氨基酸序列的高维矩阵转换为相同的一维矩阵,进行矩阵拼接,再通过全连接神经网络输出亲和力,得到训练好的模型作为强化学习中的奖励函数。
对于强化学习,先验分子生成模型和智能体分子生成模型都利用分子生成神经网络,先验模型的作用是作为一个参考点,对给定的SMILES进行抽样的可能性。对于智能体生成的每一批SMILES,先验模型计算负对数似然值,记为logP(A)prior。P(Xi=Ti|Xi-1=Ti-1…X1=x1)是给定先前的抽样字符条件下,第Xi步抽取Ti字符的概率;logP(A)prior反映从模型中抽取字符的概率可能性。
采样给定SMILES字符串的模型可能性由行动概率的乘积给出。设R(A)为基于亲和力预测模型的奖励函数。智能体通过增强似然函数计算先验概率,公式如下:
logP(A)U=logP(A)prior+δR(A)
logP(A)prior表示先验模型的似然函数,δ表示奖励函数的权重为0.1,利用先前的策略和智能体的策略之间找到一个平衡的策略,长期收益写成:
r(ST)=-[logP(A)U-logP(A)A]2
logP(A)A表示智能体的似然函数,通过最小化目标函数来最大化奖励
在本发明的一种实例中,分子结构检查使用RDKIT工具包;深度学习框架使用Pytorch1.7.0,CUDA版本为11.1,操作系统为Ubuntu LTS 20.04,所有计算工作均于1*Geforce RTX-3090GPU服务器上完成。
附图说明
图1是本发明实施例中所使用方法流程示意图。
具体实施方式
下面结合附图对本发明的具体实施方式进行描述,以便更好地理解本发明。
如图1所示,本发明中的针对不同靶点蛋白进行药物设计的通用性方法,包括以下步骤:
本发明提供一种基于药物靶标相互作用神经网络和深度强化学习的药物分子生成通用性方法,搭建一个面向新药设计的药物分子开发流程。如图1所示,包括用于药物分子生成的神经网络模型、药物靶标相互作用预测亲和力的神经网络模型、强化学习模块。
分子生成神经网络模型选用的训练数据集:Chembl(https://www.ebi.ac.uk/chembl/)数据库的144万个药物分子;药物靶标相互作用神经网络选用的训练数据集:Binding DB(http://www.bindingdb.org/bind/index.jsp)数据库的13392个药物分子、1507个蛋白靶标、70750个药物靶标对。基于药物靶标相互作用神经网络和深度强化学习的药物分子生成通用性方法包括如下步骤:
步骤一:训练分子生成神经网络模型
分子生成神经网络包含5层:1个输入层、3个循环层和1个输出层。SMILES编码转换为one-hot编码表示后,one-hot编码输入到输入层。循环层使用128个门控循环单元(GRU)作为单元格,最后通过softmax函数输出每个字符串的概率。
采用具有三层结构的递归神经网络来构建分子生成神经网络模型,运用最大似然估计来训练它,它每层具有128个门控递归单元,通过Chembl数据库的144万个有效的化学结构(SMILES格式)来训练初始的神经网络,用随机梯度下降训练模型50000步,初始学习率为0.001,学习率为0.02,每100步衰减一次。
步骤二:训练药物靶标相互作用神经网络
将蛋白质配体相互作用预测作为一个回归问题,目的是预测结合亲和力评分。首先,将氨基酸序列和SMILES数据应用于卷积神经网络(CNN)。在氨基酸序列输入中,采用one-hot编码对氨基酸序列进行分布表示。对于SMILES输入,采用one-hot编码对SMILES进行分布表示。将氨基酸序列的1D-CNN和蛋白质-药物相互作用网络的CNN所得到的特征向量通过连接层连接到最终输出层,输出药物和靶标蛋白的亲和力评分。
SMILES和氨基酸序列的输入长度分别为1024和8420,SMILES和氨基酸序列的输入长度不足时以字符A补齐。药物和氨基酸序列的卷积核分别为[4,6,8]和[4,8,12],一次训练的样本(batch size)为128,训练次数(train epoch)为100,学习率为0.001,优化器为adam优化器,全连接层的神经元分别为1024、1024、512,使用均方误差(MSE)作为损失函数,其中P是预测值,Y对应真实值。其中n表示采样个数,公式如下:
步骤三:分子生成的基本过程
通过递归神经网络作为部分可观察的马尔科夫决策过程来构建具有指定期望属性的用SMILES表示的分子,其中智能体必须在当前给定单元状态的情况下决定接下来选择什么字符。使用之前初始模型学习到的概率分布作为我们的初始先验策略,将初始网络和它的策略修改后变为智能体的网络。所以,智能体与初始网络具有相同架构的神经网络。从递归神经网络的第一步开始到采样结束。智能体遇到的任务都是随机的。动作A=X1X2…Xi的集合按顺序生成了SMILES字符串。P(Xi=Ti|Xi-1=Ti-1…X1=x1)是给定先前的抽样字符条件下,第Xi步抽取Ti字符的概率;logP(A)prior反映从模型中抽取字符的概率可能性。
对于强化学习,先验分子生成模型和智能体分子生成模型都利用分子生成神经网络,先验模型的作用是作为一个参考点,对给定的SMILES进行抽样的可能性。对于智能体生成的每一批SMILES,先验模型计算负对数似然值,表示为先验模型的似然函数,记为logP(A)prior。
设R(A)为基于亲和力预测模型的奖励函数。智能体通过先验模型的似然函数计算智能体的似然函数,公式如下:
logP(A)U=logP(A)prior+δR(A)
δ表示奖励函数的权重为0.1,R(A)表示奖励函数,在本发明中表示药物靶标相互作用的亲和力,logP(A)U表示先验模型的增强似然函数,利用先验模型的策略和智能体的策略之间找到一个平衡的策略,长期收益写成:
r(ST)=-[logP(A)U-logP(A)Agent]2
logP(A)Agent表示智能体的似然函数。
如图1所示,图右侧输入蛋白质的氨基酸序列,左侧神经网络作为分子生成模型,生成分子传递给右侧药物蛋白质预测模型,预预测出药物与蛋白质的亲和力,亲和力数值传递给分子生成模型,通过强化学习优化分子生成模型,使分子生成模型生成的分子传递给药物与蛋白质的亲和力预测模型,使分子与蛋白质有更高的亲和力。经过1000次迭代,得到针对这个靶点蛋白的分子。经过上述技术流程方法,将某个靶点蛋白的氨基酸序列输入到已经训练好的药物设计机器学习模型中,得到针对这个靶点蛋白的小分子抑制剂化合物库。奖励函数采用药物与蛋白靶标的亲和力模型,此模型能够选取不同氨基酸序列和药物作为输入,计算不同药物与蛋白氨基酸的亲和力,具有通用性。
本方案所生成的分子,即作为新药的候选分子输出其结构描述。本方案的定位是为辅助新药研发,旨在提高其对候选分子的筛选效率,并不能取代新药研发各项实体实验,包括生化试验、动物试验和各期临床试验等,新药研发机构需要完成后续试验,以得到最终的新药化合物。
以上所述是本发明的优选实施方案,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以做出若干改进和润饰,这些改进和润湿也视为本发明的保护范围。
Claims (2)
1.一种针对不同靶点蛋白进行药物设计的通用性方法,其特征在于,包括以下步骤:
第一步是训练分子生成模型,学习分子的语法;
生成模型训练的数据集来自CHEMBL数据库,这些分子以SMILES格式表示;生成模型的神经网络架构使用门控循环单元(GRU)神经网络;这个模型为分子生成预训练模型;
由于使用SMILES来表示一个分子需要神经网络输出一系列字符,每输出一个字符视为一个动作;
对于药物靶标亲和力预测模型,利用的是药物的SMILES编码与蛋白质的氨基酸序列作为输入,通过神经网络进行训练,亲和力数值作为输出;训练数据是BindingDB数据库中配体靶点数据集,将SMILES编码和氨基酸序列转换为one-hot编码,再通过卷积操作将药物分子和氨基酸序列的高维矩阵转换为相同的一维矩阵,进行矩阵拼接,再通过全连接神经网络输出亲和力,得到训练好的通用性模型作为奖励函数;
对于强化学习,先验(Prior)分子生成模型和智能体(Agent)分子生成模型都利用分子生成神经网络,先验模型的作用是作为一个参考点,对给定的SMILES进行抽样的可能性;对于智能体生成的每一批SMILES,先验模型计算负对数似然值,记为logP(A)prior;
采样给定SMILES字符串的模型可能性由行动概率的乘积给出;设R(A)为基于亲和力预测模型的奖励函数;智能体通过增强似然函数计算先验概率,公式如下:
logP(A)U=log P(A)prior+δR(A)
logP(A)prior表示似然函数,δ表示奖励函数的权重为0.1,长期收益写成:
r(ST)=-[log P(A)U-log P(A)A]2
logP(A)A表示智能体的似然函数,通过最小化目标函数来最大化奖励;
通过预测出药物与蛋白质的亲和力,亲和力数值传递给分子生成模型,通过强化学习优化分子生成模型,使分子生成模型生成的分子传递给药物与蛋白质的亲和力预测模型,使分子与蛋白质有更高的亲和力;经过1000次以上迭代,得到多个针对这个靶点蛋白的分子;
将某个靶点蛋白的氨基酸序列输入到已经训练好的药物设计机器学习模型中,得到针对这个靶点蛋白的小分子抑制剂化合物库。
2.根据权利要求1所述的方法,其特征在于:奖励函数采用药物与蛋白靶标的亲和力模型,此模型能够选取不同氨基酸序列和药物作为输入,计算不同药物与蛋白氨基酸的亲和力。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210051113.9A CN114464270A (zh) | 2022-01-17 | 2022-01-17 | 一种针对不同靶点蛋白进行药物设计的通用性方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210051113.9A CN114464270A (zh) | 2022-01-17 | 2022-01-17 | 一种针对不同靶点蛋白进行药物设计的通用性方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN114464270A true CN114464270A (zh) | 2022-05-10 |
Family
ID=81410552
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202210051113.9A Pending CN114464270A (zh) | 2022-01-17 | 2022-01-17 | 一种针对不同靶点蛋白进行药物设计的通用性方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN114464270A (zh) |
Cited By (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114974461A (zh) * | 2022-06-15 | 2022-08-30 | 烟台国工智能科技有限公司 | 基于策略学习的多目标属性分子生成方法及系统 |
CN115328117A (zh) * | 2022-07-15 | 2022-11-11 | 大理大学 | 基于强化学习的蛋白质动态配体通道最优路径分析方法 |
CN115762662A (zh) * | 2022-11-30 | 2023-03-07 | 苏州创腾软件有限公司 | 基于图神经网络的特定靶标药物生成方法、装置和MaxFlow平台 |
CN116597892A (zh) * | 2023-05-15 | 2023-08-15 | 之江实验室 | 一种模型训练的方法以及分子结构信息的推荐方法及装置 |
WO2023246834A1 (en) * | 2022-06-24 | 2023-12-28 | King Abdullah University Of Science And Technology | Reinforcement learning (rl) for protein design |
CN117854630A (zh) * | 2023-12-26 | 2024-04-09 | 之江实验室 | 基于人工智能的多靶点药物发现系统 |
CN118262828A (zh) * | 2024-05-29 | 2024-06-28 | 中国石油大学(华东) | 基于结构的创新型多尺度生成模型 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112530515A (zh) * | 2020-12-18 | 2021-03-19 | 中国石油大学(华东) | 一种预测化合物蛋白质亲和力的新型深度学习模型、计算机设备、存储介质 |
CN113066525A (zh) * | 2021-03-30 | 2021-07-02 | 中山大学 | 一种基于集成学习与混合神经网络的多靶标药物筛选方法 |
CN113488102A (zh) * | 2021-06-30 | 2021-10-08 | 中国石油大学(华东) | 基于遗传算法集成深度学习网络的药物推荐系统、计算机设备、存储介质 |
-
2022
- 2022-01-17 CN CN202210051113.9A patent/CN114464270A/zh active Pending
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112530515A (zh) * | 2020-12-18 | 2021-03-19 | 中国石油大学(华东) | 一种预测化合物蛋白质亲和力的新型深度学习模型、计算机设备、存储介质 |
CN113066525A (zh) * | 2021-03-30 | 2021-07-02 | 中山大学 | 一种基于集成学习与混合神经网络的多靶标药物筛选方法 |
CN113488102A (zh) * | 2021-06-30 | 2021-10-08 | 中国石油大学(华东) | 基于遗传算法集成深度学习网络的药物推荐系统、计算机设备、存储介质 |
Cited By (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114974461A (zh) * | 2022-06-15 | 2022-08-30 | 烟台国工智能科技有限公司 | 基于策略学习的多目标属性分子生成方法及系统 |
WO2023246834A1 (en) * | 2022-06-24 | 2023-12-28 | King Abdullah University Of Science And Technology | Reinforcement learning (rl) for protein design |
CN115328117A (zh) * | 2022-07-15 | 2022-11-11 | 大理大学 | 基于强化学习的蛋白质动态配体通道最优路径分析方法 |
CN115762662A (zh) * | 2022-11-30 | 2023-03-07 | 苏州创腾软件有限公司 | 基于图神经网络的特定靶标药物生成方法、装置和MaxFlow平台 |
CN116597892A (zh) * | 2023-05-15 | 2023-08-15 | 之江实验室 | 一种模型训练的方法以及分子结构信息的推荐方法及装置 |
CN116597892B (zh) * | 2023-05-15 | 2024-03-19 | 之江实验室 | 一种模型训练的方法以及分子结构信息的推荐方法及装置 |
CN117854630A (zh) * | 2023-12-26 | 2024-04-09 | 之江实验室 | 基于人工智能的多靶点药物发现系统 |
CN118262828A (zh) * | 2024-05-29 | 2024-06-28 | 中国石油大学(华东) | 基于结构的创新型多尺度生成模型 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN114464270A (zh) | 一种针对不同靶点蛋白进行药物设计的通用性方法 | |
Nguyen et al. | Hyenadna: Long-range genomic sequence modeling at single nucleotide resolution | |
Jin et al. | Predicting organic reaction outcomes with weisfeiler-lehman network | |
US20210090690A1 (en) | Molecular design using reinforcement learning | |
Hu et al. | Deep learning frameworks for protein–protein interaction prediction | |
US11651841B2 (en) | Drug compound identification for target tissue cells | |
Liang et al. | Drugchat: towards enabling chatgpt-like capabilities on drug molecule graphs | |
CN115104105A (zh) | 用于图到序列模型方法的对抗性自动编码器架构 | |
US20210027864A1 (en) | Active learning model validation | |
KR20220111215A (ko) | 자기주의 기반 심층 신경망 모델을 이용한 약물-표적 상호작용 예측 장치 및 그 방법 | |
CN118318222A (zh) | 使用序列到序列转换器的自动笔记本补全 | |
Zhong et al. | DNA computing inspired deep networks design | |
Jebbara et al. | Improving opinion-target extraction with character-level word embeddings | |
CN114743600A (zh) | 基于门控注意力机制的靶标-配体结合亲和力的深度学习预测方法 | |
CN113257359A (zh) | 一种基于CNN-SVR的CRISPR/Cas9向导RNA编辑效率预测方法 | |
Hoang et al. | Splice sites detection using chaos game representation and neural network | |
Zhu et al. | Associative learning mechanism for drug‐target interaction prediction | |
Zhu et al. | GSRNet, an adversarial training-based deep framework with multi-scale CNN and BiGRU for predicting genomic signals and regions | |
CN116312856A (zh) | 基于子结构的药物相互作用预测方法及系统 | |
CN116611504A (zh) | 一种基于进化的神经架构搜索方法 | |
Zhang et al. | Neural architecture search for joint optimization of predictive power and biological knowledge | |
Nawaz et al. | Proof searching and prediction in HOL4 with evolutionary/heuristic and deep learning techniques | |
Devisetty | Deep Learning for Genomics: Data-driven approaches for genomics applications in life sciences and biotechnology | |
Phan et al. | Deep learning based biomedical NER framework | |
Patel et al. | Introduction to machine learning and its application |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |