CN114464270A

CN114464270A - 一种针对不同靶点蛋白进行药物设计的通用性方法

Info

Publication number: CN114464270A
Application number: CN202210051113.9A
Authority: CN
Inventors: 孙少瑞; 张云江; 何洪
Original assignee: Beijing University of Technology
Current assignee: Beijing University of Technology
Priority date: 2022-01-17
Filing date: 2022-01-17
Publication date: 2022-05-10

Abstract

一种针对不同靶点蛋白进行药物设计的通用性方法属于计算机人工智能与新药设计领域，包括训练分子生成模型、训练药物靶标亲和力预测模型，以亲和力模型输出作为奖励函数，通过强化学习使分子生成神经网络生成的分子与蛋白质有更好的亲和力。将某个靶点蛋白的氨基酸序列输入到已经训练好的药物设计机器学习模型中，得到针对这个靶点蛋白的小分子抑制剂化合物。

Description

一种针对不同靶点蛋白进行药物设计的通用性方法

技术领域

本发明涉及计算机人工智能与新药设计的交叉技术领域，是一种基于神经网络、深度强化学习的针对不同蛋白靶标进行新药分子设计的通用性方法，适用于新药发现过程中候选药物分子的设计与生成。

背景技术

小分子主要用于调节生物系统中特定靶蛋白的功能。传统的药物设计方法通过筛选公共和商业仓库中可用的化合物库，或通过使用片段和药效团模型从头生成分子来识别目标蛋白特异性分子。虽然筛选过程非常耗时，但只用传统方法探索了化学空间的一部分，大约10亿个小分子，然而，实际的化学空间估计有10⁶³个分子或更多。深度学习方法可以弥补这一差距，设计出多种新的具有期望的药物性质的药物分子。深度生成模型的发展已经产生了一系列有前景的建议来解决分子生成的问题，为新药设计提供了一个有前景的新方向。化合物的简化分子输入线输入规范(SMILES)表示是一种从分子图派生出来的基于字符串的表示，在这一领域得到了广泛的应用。对于基于SMILES的生成模型，将字符串的一次性编码输入循环神经网络(RNN)模型进行学习，然后根据学习的分布逐字符生成字符串。将强化学习的概念被整合到分子生成中。对预先训练的基于RNN的生成器进行微调，可以生成理想的分子。基于此，我们将药物靶标相互作用模型集成到强化学习中，开发了一种能够设计适合任何目标蛋白的小分子的方法。开发这种方法可以快速设计针对任何靶标蛋白的药物。

发明内容

本发明的目的在于提供了一种基于人工智能针对不同靶点蛋白进行药物设计的通用性方法，将某个靶点蛋白的氨基酸序列输入到已经训练好的药物设计机器学习模型中，得到针对这个靶点蛋白的小分子抑制剂化合物库。

为了实现上述目的，本发明的技术方案如下：

一种针对不同靶点蛋白进行药物设计的通用性方法，包括以下步骤：

第一步是训练分子生成模型。生成模型训练的数据集来自CHEMBL数据库，这些分子以SMILES格式表示。分子生成模型在CHEMBL数据库96万SMILES字符串的数据集上进行训练。生成模型的神经网络架构使用门控循环单元(GRU)神经网络。这个模型为分子生成预训练模型。

许多强化学习中的问题都被称为马尔科夫决策，这就意味着当前的状态包含了所有指导命令选择的必要信息，并且不需要从之前的状态中获取任何信息。对于大多数实际问题，这只是一种近似而不是事实。然而，我们可以把这一概念概括为一种部分可观察的马尔科夫决策。智能通过可以与不完整的环境代表发生互作。将r(a|s)定义为评估在某一特定状态下采取某种动作的优势的奖励，那么长期反馈

则被定义为从时间t积累到时间T的累计奖励。因为通常只有完整的SMILES字符串能够产生可取的分子形式，因此我们只参考完整序列的反馈。

由于使用SMILES来表示一个分子需要神经网络输出一系列字符，每输出一个字符都可以视为一个动作。例如，成功输出一个有效的SMILES编码分子并且具有一定的特征，强化学习的奖励函数就会给予一定的奖励。这里的奖励函数可以采用多重中间奖励的加权和：药物化学和药物相似性评分、活性化学评分、结构评分(适合配体特征和/或结合袋)、新颖性评分和多样性评分。利用药物与蛋白质亲和力神经网络的预测模型预测亲和力作为奖励函数，这样整体模型与蛋白质建立关系。分子生成神经网络生成的分子传递给亲和力预测模型，通过预测模型预测分子与蛋白质的亲和力。亲和力作为奖励函数通过强化学习反馈给分子生成神经网络，通过强化学习使分子生成神经网络生成的分子与蛋白质有更好的亲和力。

对于药物靶标亲和力预测模型，基于深度学习开发的药物靶标亲和力预测模型能够针对任何蛋白靶标和药物分子进行预测。使用深度学习的优势是能够挖掘药物和靶标之间隐藏的相互作用,并且目前基于深度学习开发的药物靶标亲和力预测模型能够针对任何蛋白靶标和药物分子进行预测。我们利用的是药物的SMILES编码与蛋白质的氨基酸序列作为输入，通过神经网络进行训练，亲和力数值作为输出。训练数据是BindingDB数据库中配体靶点数据集，将SMILES编码和氨基酸序列转换为one-hot编码，再通过卷积操作将药物分子和氨基酸序列的高维矩阵转换为相同的一维矩阵，进行矩阵拼接，再通过全连接神经网络输出亲和力，得到训练好的模型作为强化学习中的奖励函数。

对于强化学习，先验分子生成模型和智能体分子生成模型都利用分子生成神经网络,先验模型的作用是作为一个参考点，对给定的SMILES进行抽样的可能性。对于智能体生成的每一批SMILES，先验模型计算负对数似然值，记为logP(A)_prior。P(X_i＝T_i|X_i-1＝T_i-1…X₁＝x₁)是给定先前的抽样字符条件下，第X_i步抽取T_i字符的概率；logP(A)_prior反映从模型中抽取字符的概率可能性。

采样给定SMILES字符串的模型可能性由行动概率的乘积给出。设R(A)为基于亲和力预测模型的奖励函数。智能体通过增强似然函数计算先验概率，公式如下：

logP(A)_U＝logP(A)_prior+δR(A)

logP(A)_prior表示先验模型的似然函数，δ表示奖励函数的权重为0.1，利用先前的策略和智能体的策略之间找到一个平衡的策略，长期收益写成：

r(S_T)＝-[logP(A)_U-logP(A)_A]²

logP(A)_A表示智能体的似然函数，通过最小化目标函数来最大化奖励

在本发明的一种实例中，分子结构检查使用RDKIT工具包；深度学习框架使用Pytorch1.7.0，CUDA版本为11.1,操作系统为Ubuntu LTS 20.04,所有计算工作均于1*Geforce RTX-3090GPU服务器上完成。

附图说明

图1是本发明实施例中所使用方法流程示意图。

具体实施方式

下面结合附图对本发明的具体实施方式进行描述，以便更好地理解本发明。

如图1所示，本发明中的针对不同靶点蛋白进行药物设计的通用性方法，包括以下步骤：

本发明提供一种基于药物靶标相互作用神经网络和深度强化学习的药物分子生成通用性方法，搭建一个面向新药设计的药物分子开发流程。如图1所示，包括用于药物分子生成的神经网络模型、药物靶标相互作用预测亲和力的神经网络模型、强化学习模块。

分子生成神经网络模型选用的训练数据集：Chembl(https://www.ebi.ac.uk/chembl/)数据库的144万个药物分子；药物靶标相互作用神经网络选用的训练数据集：Binding DB(http://www.bindingdb.org/bind/index.jsp)数据库的13392个药物分子、1507个蛋白靶标、70750个药物靶标对。基于药物靶标相互作用神经网络和深度强化学习的药物分子生成通用性方法包括如下步骤：

步骤一：训练分子生成神经网络模型

分子生成神经网络包含5层：1个输入层、3个循环层和1个输出层。SMILES编码转换为one-hot编码表示后，one-hot编码输入到输入层。循环层使用128个门控循环单元(GRU)作为单元格，最后通过softmax函数输出每个字符串的概率。

采用具有三层结构的递归神经网络来构建分子生成神经网络模型，运用最大似然估计来训练它，它每层具有128个门控递归单元，通过Chembl数据库的144万个有效的化学结构(SMILES格式)来训练初始的神经网络，用随机梯度下降训练模型50000步，初始学习率为0.001，学习率为0.02，每100步衰减一次。

步骤二：训练药物靶标相互作用神经网络

将蛋白质配体相互作用预测作为一个回归问题，目的是预测结合亲和力评分。首先，将氨基酸序列和SMILES数据应用于卷积神经网络(CNN)。在氨基酸序列输入中，采用one-hot编码对氨基酸序列进行分布表示。对于SMILES输入，采用one-hot编码对SMILES进行分布表示。将氨基酸序列的1D-CNN和蛋白质-药物相互作用网络的CNN所得到的特征向量通过连接层连接到最终输出层，输出药物和靶标蛋白的亲和力评分。

SMILES和氨基酸序列的输入长度分别为1024和8420，SMILES和氨基酸序列的输入长度不足时以字符A补齐。药物和氨基酸序列的卷积核分别为[4,6,8]和[4,8,12]，一次训练的样本(batch size)为128，训练次数(train epoch)为100，学习率为0.001，优化器为adam优化器，全连接层的神经元分别为1024、1024、512，使用均方误差(MSE)作为损失函数，其中P是预测值，Y对应真实值。其中n表示采样个数，公式如下：

步骤三：分子生成的基本过程

通过递归神经网络作为部分可观察的马尔科夫决策过程来构建具有指定期望属性的用SMILES表示的分子，其中智能体必须在当前给定单元状态的情况下决定接下来选择什么字符。使用之前初始模型学习到的概率分布作为我们的初始先验策略，将初始网络和它的策略修改后变为智能体的网络。所以，智能体与初始网络具有相同架构的神经网络。从递归神经网络的第一步开始到采样结束。智能体遇到的任务都是随机的。动作A＝X₁X₂…X_i的集合按顺序生成了SMILES字符串。P(X_i＝T_i|X_i-1＝T_i-1…X₁＝x₁)是给定先前的抽样字符条件下，第X_i步抽取T_i字符的概率；logP(A)_prior反映从模型中抽取字符的概率可能性。

对于强化学习，先验分子生成模型和智能体分子生成模型都利用分子生成神经网络,先验模型的作用是作为一个参考点，对给定的SMILES进行抽样的可能性。对于智能体生成的每一批SMILES，先验模型计算负对数似然值，表示为先验模型的似然函数，记为logP(A)_prior。

设R(A)为基于亲和力预测模型的奖励函数。智能体通过先验模型的似然函数计算智能体的似然函数，公式如下：

logP(A)_U＝logP(A)_prior+δR(A)

δ表示奖励函数的权重为0.1，R(A)表示奖励函数，在本发明中表示药物靶标相互作用的亲和力，logP(A)_U表示先验模型的增强似然函数，利用先验模型的策略和智能体的策略之间找到一个平衡的策略，长期收益写成：

r(S_T)＝-[logP(A)_U-logP(A)_Agent]²

logP(A)_Agent表示智能体的似然函数。

如图1所示，图右侧输入蛋白质的氨基酸序列，左侧神经网络作为分子生成模型，生成分子传递给右侧药物蛋白质预测模型，预预测出药物与蛋白质的亲和力，亲和力数值传递给分子生成模型，通过强化学习优化分子生成模型，使分子生成模型生成的分子传递给药物与蛋白质的亲和力预测模型，使分子与蛋白质有更高的亲和力。经过1000次迭代，得到针对这个靶点蛋白的分子。经过上述技术流程方法，将某个靶点蛋白的氨基酸序列输入到已经训练好的药物设计机器学习模型中，得到针对这个靶点蛋白的小分子抑制剂化合物库。奖励函数采用药物与蛋白靶标的亲和力模型，此模型能够选取不同氨基酸序列和药物作为输入，计算不同药物与蛋白氨基酸的亲和力，具有通用性。

本方案所生成的分子，即作为新药的候选分子输出其结构描述。本方案的定位是为辅助新药研发，旨在提高其对候选分子的筛选效率，并不能取代新药研发各项实体实验，包括生化试验、动物试验和各期临床试验等，新药研发机构需要完成后续试验，以得到最终的新药化合物。

以上所述是本发明的优选实施方案，应当指出，对于本技术领域的普通技术人员来说，在不脱离本发明原理的前提下，还可以做出若干改进和润饰，这些改进和润湿也视为本发明的保护范围。

Claims

1.一种针对不同靶点蛋白进行药物设计的通用性方法，其特征在于，包括以下步骤：

第一步是训练分子生成模型，学习分子的语法；

生成模型训练的数据集来自CHEMBL数据库，这些分子以SMILES格式表示；生成模型的神经网络架构使用门控循环单元(GRU)神经网络；这个模型为分子生成预训练模型；

由于使用SMILES来表示一个分子需要神经网络输出一系列字符，每输出一个字符视为一个动作；

对于药物靶标亲和力预测模型，利用的是药物的SMILES编码与蛋白质的氨基酸序列作为输入，通过神经网络进行训练，亲和力数值作为输出；训练数据是BindingDB数据库中配体靶点数据集，将SMILES编码和氨基酸序列转换为one-hot编码，再通过卷积操作将药物分子和氨基酸序列的高维矩阵转换为相同的一维矩阵，进行矩阵拼接，再通过全连接神经网络输出亲和力，得到训练好的通用性模型作为奖励函数；

对于强化学习，先验(Prior)分子生成模型和智能体(Agent)分子生成模型都利用分子生成神经网络,先验模型的作用是作为一个参考点，对给定的SMILES进行抽样的可能性；对于智能体生成的每一批SMILES，先验模型计算负对数似然值，记为logP(A)_prior；

采样给定SMILES字符串的模型可能性由行动概率的乘积给出；设R(A)为基于亲和力预测模型的奖励函数；智能体通过增强似然函数计算先验概率，公式如下：

logP(A)_U＝log P(A)_prior+δR(A)

logP(A)_prior表示似然函数，δ表示奖励函数的权重为0.1，长期收益写成：

r(S_T)＝-[log P(A)_U-log P(A)_A]²

logP(A)_A表示智能体的似然函数，通过最小化目标函数来最大化奖励；

通过预测出药物与蛋白质的亲和力，亲和力数值传递给分子生成模型，通过强化学习优化分子生成模型，使分子生成模型生成的分子传递给药物与蛋白质的亲和力预测模型，使分子与蛋白质有更高的亲和力；经过1000次以上迭代，得到多个针对这个靶点蛋白的分子；

将某个靶点蛋白的氨基酸序列输入到已经训练好的药物设计机器学习模型中，得到针对这个靶点蛋白的小分子抑制剂化合物库。

2.根据权利要求1所述的方法，其特征在于：奖励函数采用药物与蛋白靶标的亲和力模型，此模型能够选取不同氨基酸序列和药物作为输入，计算不同药物与蛋白氨基酸的亲和力。