CN116453587B

CN116453587B - 一种基于分子动力学模型预测配体亲和力的任务执行方法

Info

Publication number: CN116453587B
Application number: CN202310709904.0A
Authority: CN
Inventors: 张迪鸣; 范敏之; 杨文剑; 叶景
Original assignee: Zhejiang Lab
Current assignee: Zhejiang Lab
Priority date: 2023-06-15
Filing date: 2023-06-15
Publication date: 2023-08-29
Anticipated expiration: 2043-06-15
Also published as: CN116453587A

Abstract

本说明书公开了一种基于分子动力学模型预测配体亲和力的任务执行方法。所述任务执行方法包括：在仿真环境中构建目标蛋白质的初始受体模型，根据目标蛋白质所处的细胞环境信息以及天然氨基酸的结构约束信息，在仿真环境中进行分子动力学模拟，得到目标受体模型，在仿真环境中对配体化合物模型与目标受体模型进行分子对接模拟，确定目标位置，确定按照该配体化合物对应的目标位置将目标受体模型和配体化合物模型对接后得到的复合物模型，在仿真环境中对复合物模型进行分子动力学模拟，以计算结合自由能，根据每个目标蛋白质与每个配体化合物对应的结合自由能，在各配体化合物中确定出目标化合物，并根据目标化合物执行任务。

Description

一种基于分子动力学模型预测配体亲和力的任务执行方法

技术领域

本说明书涉及生物工程技术领域，尤其涉及一种基于分子动力学模型预测配体亲和力的任务执行方法。

背景技术

随着科技的发展，计算机模拟技术被逐渐的应用于各个领域，其中，分子对接和分子动力学模拟技术在药物设计、蛋白质设计、生物传感器设计等领域有着广泛的应用，通过模拟蛋白质结构与不同化合物配体之间的相互作用，确定出与基础蛋白质相适配的化合物，进而根据该化合物执行上述生物工程设计任务。

然而，目前对蛋白质与配体化合物之间的相互作用进行模拟的过程中，对不同化合物与受体蛋白之间的适配性评估结果的准确性以及精度较低，严重限制了生物工程任务的执行。

基于此，如何准确的对不同化合物与受体蛋白之间进行准确的适配，以保证后续生物工程任务的准确顺利执行，则是一个亟待解决的问题。

发明内容

本说明书提供一种基于分子动力学模型预测配体亲和力的任务执行方法，以部分的解决现有技术存在的上述问题。

本说明书采用下述技术方案：

本说明书提供了一种基于分子动力学模型预测配体亲和力的任务执行方法，包括：

获取目标蛋白质的氨基酸序列；

基于所述氨基酸序列，在仿真环境中构建所述目标蛋白质的初始受体模型；

根据所述目标蛋白质所处的细胞环境信息以及天然氨基酸的结构约束信息，在所述仿真环境中对所述初始受体模型进行分子动力学模拟，以对所述初始受体模型进行优化，得到所述目标蛋白质对应的目标受体模型；

针对每个配体化合物，在所述仿真环境中对该配体化合物对应的配体化合物模型与所述目标受体模型进行分子对接模拟，确定在所述配体化合物模型上与所述目标受体模型进行结合的目标位置，作为该配体化合物对应的目标位置；

针对每个配体化合物，确定按照该配体化合物对应的目标位置将所述目标受体模型和该配体化合物对应的配体化合物模型对接后得到的复合物模型，作为该配体化合物对应的复合物模型；

在所述仿真环境中对每个配体化合物对应的复合物模型进行分子动力学模拟，以计算所述目标蛋白质和每个配体化合物之间的结合自由能；

根据每个所述目标蛋白质与每个配体化合物对应的结合自由能，在各配体化合物中确定出目标化合物，并根据所述目标化合物，执行目标任务。

可选地，根据所述目标蛋白质所处的细胞环境信息以及所述结构约束信息，在所述仿真环境中对所述初始受体模型进行分子动力学模拟，具体包括：

将所述初始受体模型放置在所述仿真环境中的水分子力场模型TIP3P溶液中，并对所述水分子力场模型的溶液进行离子中和；

根据所述分子结构约束信息，对所述初始受体模型进行谐波约束，根据所述细胞环境信息，在指定时间内将所述仿真环境加热至目标温度，并对所述初始受体模型的指定转角施加距离约束；

在指定压力下对所述仿真环境中的受体模型进行模拟采样，确定所述受体模型的能量反应路径，并将采集到的能量最低的一帧所对应的受体模型作为所述目标受体模型。

可选地，针对每个配体化合物，在所述仿真环境中对该配体化合物对应的配体化合物模型与所述目标受体模型进行分子对接模拟，确定在所述配体化合物模型上与所述目标受体模型进行结合的目标位置，作为该配体化合物对应的目标位置，具体包括：

根据预设的构象搜索参数对所述目标受体模型和所述配体化合物模型进行构象搜索，确定满足指定条件的配体构象并将所述配体构象对应结合口袋位置作为所述目标位置。

可选地，在所述仿真环境中对每个配体化合物对应的复合物模型进行分子动力学模拟，以计算所述目标蛋白质和每个配体化合物之间的结合自由能，具体包括：

针对每个配体化合物，将该配体化合物对应的复合物模型放置在所述仿真环境中的TIP3P溶液中，并添加抗衡离子中和所述溶液中的电荷；

设置周期性边界条件，并处理所述复合物模型在所述TIP3P溶液中的长程相互作用；

在所述仿真环境中对复合物模型的轨迹进行模拟采样，并基于采集到的数据对复合物模型进行热力学分析，计算所述目标蛋白质和该配体化合物之间的结合自由能。

可选地，所述抗衡离子包括：钠离子以及氯离子。

可选地，在所述仿真环境中对所述复合物模型的轨迹进行模拟采样，具体包括：

按照预设的时间间隔，在指定时间内对所述复合物模型的轨迹进行模拟采样，得到若干个数据快照；

基于采集到的数据对复合物模型进行热力学分析，计算所述目标蛋白质和该配体化合物之间的结合自由能，具体包括：

针对每个数据快照，根据该数据快照中所述TIP3P溶液中的自由能、该数据快照中复合物模型的自由能、该数据快照中配体化合物模型的自由能以及该数据快照中目标受体模型的自由能确定该数据快照中目标蛋白质和该配体化合物之间的结合自由能。

可选地，根据每个所述目标蛋白质与每个配体化合物对应的结合自由能，在各配体化合物中确定出目标化合物，具体包括：

根据每个配体化合物对应的结合自由能，确定各配体化合物与所述目标蛋白质之间的亲和力，并基于所述亲和力在各化合物中确定出目标化合物。

可选地，所述自由能的绝对值越大，所述亲和力越大。

本说明书提供了一种基于分子动力学模型预测配体亲和力的任务执行装置，包括：

获取模块，获取目标蛋白质的氨基酸序列；

构建模块，基于所述氨基酸序列，在仿真环境中构建所述目标蛋白质的初始受体模型；

优化模块，根据所述目标蛋白质所处的细胞环境信息以及天然氨基酸的结构约束信息，在所述仿真环境中对所述初始受体模型进行分子动力学模拟，以对所述初始受体模型进行优化，得到所述目标蛋白质对应的目标受体模型；

对接模块，针对每个配体化合物，在所述仿真环境中对该配体化合物对应的配体化合物模型与所述目标受体模型进行分子对接模拟，确定在所述配体化合物模型上与所述目标受体模型进行结合的目标位置，作为该配体化合物对应的目标位置；

确定模块，针对每个配体化合物，确定按照该配体化合物对应的目标位置将所述目标受体模型和该配体化合物对应的配体化合物模型对接后得到的复合物模型，作为该配体化合物对应的复合物模型；

计算模块，在所述仿真环境中对每个配体化合物对应的复合物模型进行分子动力学模拟，以计算所述目标蛋白质和每个配体化合物之间的结合自由能；

执行模块，根据每个所述目标蛋白质与每个配体化合物对应的结合自由能，在各配体化合物中确定出目标化合物，并根据所述目标化合物，执行目标任务。

可选地，所述优化模块具体用于，

将所述初始受体模型放置在所述仿真环境中的水分子力场模型TIP3P溶液中，并对所述水分子力场模型的溶液进行离子中和；根据所述结构约束信息，对所述初始受体模型进行谐波约束，根据所述细胞环境信息，在指定时间内将所述仿真环境加热至目标温度，并对所述初始受体模型的指定转角施加距离约束；在指定压力下对所述仿真环境中的受体模型进行模拟采样，确定所述受体模型的能量反应路径，并将采集到的能量最低的一帧所对应的受体模型作为所述目标受体模型。

可选地，所述对接模块具体用于，

可选地，所述计算模块具体用于，针对每个配体化合物，将该配体化合物对应的复合物模型放置在所述仿真环境中的TIP3P溶液中，并添加抗衡离子中和所述溶液中的电荷；设置周期性边界条件，并处理所述复合物模型在所述TIP3P溶液中的长程相互作用；在所述仿真环境中对复合物模型的轨迹进行模拟采样，并基于采集到的数据对复合物模型进行热力学分析，计算所述目标蛋白质和该配体化合物之间的结合自由能。

可选地，所述抗衡离子包括：钠离子以及氯离子。

可选地，所述计算模块具体用于，按照预设的时间间隔，在指定时间内对所述复合物模型的轨迹进行模拟采样，得到若干个数据快照；

所述计算模块具体用于，针对每个数据快照，根据该数据快照中所述TIP3P溶液中的自由能、该数据快照中复合物模型的自由能、该数据快照中配体化合物模型的自由能以及该数据快照中目标受体模型的自由能确定该数据快照中目标蛋白质和该配体化合物之间的结合自由能。

可选地，所述执行模块具体用于，根据每个配体化合物对应的结合自由能，确定各配体化合物与所述目标蛋白质之间的亲和力，并基于所述亲和力在各化合物中确定出目标化合物。

可选地，所述自由能的绝对值越大，所述亲和力越大。

本说明书提供了一种计算机可读存储介质，所述存储介质存储有计算机程序，所述计算机程序被处理器执行时实现上述基于分子动力学模型预测配体亲和力的任务执行方法。

本说明书提供了一种电子设备，包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序，所述处理器执行所述程序时实现上述基于分子动力学模型预测配体亲和力的任务执行方法。

本说明书采用的上述至少一个技术方案能够达到以下有益效果：

在本说明书提供的基于分子动力学模型预测配体亲和力的任务执行方法中，在仿真环境中构建目标蛋白质的初始受体模型，根据目标蛋白质所处的细胞环境信息以及天然氨基酸的结构约束信息，在仿真环境中进行分子动力学模拟，得到目标受体模型，在仿真环境中对配体化合物模型与目标受体模型进行分子对接模拟，确定目标位置，确定按照该配体化合物对应的目标位置将目标受体模型和配体化合物模型对接后得到的复合物模型，在仿真环境中对复合物模型进行分子动力学模拟，以计算结合自由能，根据每个目标蛋白质与每个配体化合物对应的结合自由能，在各配体化合物中确定出目标化合物，并根据目标化合物执行任务。

从上述方法可以看出，本方案在构建目标蛋白质对应的受体模型时，不仅仅基于目标蛋白质对应的氨基酸序列进行构建，还会对目标蛋白质实际所处的细胞环境以及分子动力学约束对其进行动力学仿真并进行优化，从而得到更加符合实际情况的虚拟受体模型，这样一来，在后续进行分子对接以及结合自由能计算的过程中得到的计算结果更为精确，保证将不同配体化合物与目标蛋白质进行准确的适配。

附图说明

此处所说明的附图用来提供对本说明书的进一步理解，构成本说明书的一部分，本说明书的示意性实施例及其说明用于解释本说明书，并不构成对本说明书的不当限定。在附图中：

图1为本说明书中提供的一种基于分子动力学模型预测配体亲和力的任务执行方法的流程示意图；

图2为本说明书中提供的一种配体化合物与目标蛋白质之间的结合自由能的计算过程示意图；

图3为本说明书提供的一种基于分子动力学模型预测配体亲和力的任务执行装置的示意图；

图4为本说明书提供的一种对应于图1的电子设备示意图。

具体实施方式

为使本说明书的目的、技术方案和优点更加清楚，下面将结合本说明书具体实施例及相应的附图对本说明书技术方案进行清楚、完整地描述。显然，所描述的实施例仅是本说明书一部分实施例，而不是全部的实施例。基于本说明书中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本说明书保护的范围。

以下结合附图，详细说明本说明书各实施例提供的技术方案。

图1为本说明书中提供的一种基于分子动力学模型预测配体亲和力的任务执行方法的流程示意图，包括以下步骤：

S101：获取目标蛋白质的氨基酸序列。

S102：基于所述氨基酸序列，在仿真环境中构建所述目标蛋白质的初始受体模型。

蛋白质分子与配体化合物相互作用通常使用分子对接和分子动力学模拟实现，分子对接模拟将小分子（配体）放置于大分子靶标（受体）的结合区域，再通过计算物理、化学参数预测两者的结合力（结合亲和性）和结合方式(构象)，进而找到配体与受体在其活性区域相结合时能量最低构象，分子动力学模拟则是利用理论方法与计算技术模拟或仿真分子运动的微观行为。

精确的蛋白质结构对模拟蛋白受体和小分子化合物相互作用至关重要，但是通过实验解析晶体结构尤为困难，虽然目前的人工智能算法可以预测部分蛋白分子的结构和功能，但是人工智能算法预测的结构也存在局限性，比如AlphaFold2通常无法对蛋白质所有残基侧链进行精准预测，这是由于蛋白质序列的多序列比对的规模和准确度有限，导致可用的关于残基共变的信息有限。而这些局限性对以蛋白结构为基础的蛋白质-配体对接及相关应用具有深远的影响。

基于此，本说明书提供了一种任务执行方法，以根据目标蛋白质所处的细胞环境以及天然氨基酸的结构约束信息，在仿真环境中对初始受体模型进行分子动力学模拟，从而完成对初始受体模型进行优化，提高后需进行分子对接和结合自由能计算的精度，从而将配体化合物与受体蛋白进行准确的适配，保证生物工程任务的顺利执行。

在本说明书中，用于实现一种任务执行方法的执行主体可以是诸如笔记本电脑、平板电脑等终端设备，当然，也可以是服务器，为了便于描述，本说明书仅以终端设备作为执行主体为例，对本说明书中提供的一种任务执行方法进行说明。

其中，用户可以向终端设备输入目标蛋白质对应的FASTA格式的氨基酸序列，并设置仿真模型的参数，在本说明书中，该仿真模型可以为AlphaFold2模型，在对其参数进行设置的过程中，终端设备可以首先同时利用多序列对多序列的搜索（many-against-manysequences searching，MMseqs）测量系统分析（Measurement Systems Analysis ，MSA）多序列比对和程序数据库文件（Program Database File，PDB）库进行同源建模，然后将预测循环24次，增加预测的质量。最后利用Amber力场进行结构精化和弛豫，选择残基置信度（predicted local distance difference test，pLDDT）分数最高的三维结构模型，作为目标蛋白质对应的初始受体模型。

在本所明书中，目标蛋白质可以为味觉受体蛋白，当然，也可以为其他类型的受体蛋白，本说明书对此不做具体限定。

S103：根据所述目标蛋白质所处的细胞环境信息以及天然氨基酸的结构约束信息，在所述仿真环境中对所述初始受体模型进行分子动力学模拟，以对所述初始受体模型进行优化，得到所述目标蛋白质对应的目标受体模型。

在本说明书中，上述细胞环境信息可以包括人体细胞的温度、压强等信息，天然氨基酸的结构约束信息可以包括：氨基酸链的谐波约束以及指定转角的距离约束（即两个氨基酸被交联剂连接，则它们的空间距离是在一定范围内）。

终端设备可以将初始受体模型放置在仿真环境中的水分子力场模型（transferable interatomic potential with three points model，TIP3P）溶液中，并对水分子力场模型的溶液进行离子中和，而后根据天然氨基酸的结构约束信息，对初始受体模型进行谐波约束，根据细胞环境信息，在指定时间内将仿真环境加热至目标温度，并对初始受体模型的指定转角施加距离约束，最后在指定压力下对仿真环境中的受体模型进行模拟采样，确定受体模型的能量反应路径，并将采集到的能量最低的一帧所对应的受体模型作为目标受体模型。

具体的，终端设备可以利用Amber ff19SB蛋白质力场参数，将初始受体模型置于TIP3P溶液的水盒中，添加钠离子和氯离子对溶液环境进行中和，将盐溶液配比为0.15M，并编辑进目标蛋白质的拓扑和参数文件。

上述初始受体模型经过1000次最陡下降循环和2000次共轭梯度循环后被最小化。整个系统自由最小化了1000次迭代，与此同时对初始受体模型进行谐波约束，谐波约束的谐波力常数初始值取决于链长，并随着模拟时常不断减少直至为0。加热阶段可以通过恒温器（如Langevin恒温器）在50ps内从0K加热到300K，随后在等温等压环境中以2fs时间步长在300K下平衡至500ps，此阶段在AlphaFold2预测的低置信度区域，例如终端设备可以对初始受体模型的β转角施加距离约束，约束的值由配对的Cα原子之间的距离计算：

其中是距离约束力，/>是Cα原子/>和Cα原子/>之间的距离。

同时在平衡阶段用恒压器（如Barostat恒压器）维持1bar的恒定压力。随后进行持续1µs的模拟采样，通过轨迹分析程序（如cpptraj）进行轨迹分析和定位最低能量帧，从而得到在细胞环境以及细胞环境对应分子动力学约束下进行优化后的目标受体模型，并输出目标受体模型的PDB文件。

S104：针对每个配体化合物，在所述仿真环境中对该配体化合物对应的配体化合物模型与所述目标受体模型进行分子对接模拟，确定在所述配体化合物模型上与所述目标受体模型进行结合的目标位置，作为该配体化合物对应的目标位置。

S105：针对每个配体化合物，确定按照该配体化合物对应的目标位置将所述目标受体模型和该配体化合物对应的配体化合物模型对接后得到的复合物模型，作为该配体化合物对应的复合物模型。

对于每个待测定亲和力的配体化合物，终端设备可以在仿真环境中构建该化合物对应的小分子结构模型，作为配体化合物模型，而后根据预设的构象搜索参数对目标受体模型和配体化合物模型进行构象搜索，确定满足指定条件的配体构象并将配体构象对应结合口袋位置作为最优结合口袋位置。

例如，终端设备可以通过分子对接模拟程序（如AutoDock4）对目标受体模型和配体化合物模型进行分子对接，使用遗传算法（如Lamarckian）进行构象搜索并设置构象搜索参数为10。选择满足指定条件（如对接模拟程序输出中打分最高）的配体构象并得到预测的结合口袋位置，该结合口袋的位置即为最优结合口袋的位置，终端设备可以将其作为目标受体模型和配体化合物模型进行对接的目标位置。

而后针对每个配体化合物，终端设备可以确定按照该配体化合物对应的目标位置将目标受体模型和该配体化合物对应的配体化合物模型对接后得到的复合物模型，作为该配体化合物对应的复合物模型。

S106：在所述仿真环境中对每个配体化合物对应的复合物模型进行分子动力学模拟，以计算所述目标蛋白质和每个配体化合物之间的结合自由能。

S107：根据每个所述目标蛋白质与每个配体化合物对应的结合自由能，在各配体化合物中确定出目标化合物，并根据所述目标化合物，执行目标任务。

终端设备可以将上述复合物模型放置在仿真环境中的TIP3P溶液中，并添加抗衡离子中和所述溶液中的电荷，而后设置周期性边界条件，并处理复合物模型在所述TIP3P溶液中的长程相互作用，在仿真环境中对复合物模型的轨迹进行模拟采样，并基于采集到的数据对复合物模型进行热力学分析，计算目标蛋白质和该化合物之间的结合自由能。其中，上述抗衡离子包括钠离子和率离子。

而后按照预设的时间间隔，在指定时间内对复合物模型的轨迹进行模拟采样，得到若干个数据快照，针对每个数据快照，根据该数据快照中TIP3P溶液中的自由能、复合物模型的自由能、配体化合物模型的自由能以及目标受体模型的自由能确定该数据快照中所述目标蛋白质和该化合物之间的结合自由能。

具体的，服务器可以将对接后的蛋白质-配体复合物结构，再次进行分子动力学模拟，首先利用antechamber模拟程序，在Amber力场和Gaff2立场的基础上，设置配体有机小分子的力场参数。随后将该体系置于TIP3P溶液的水盒中，添加抗衡离子钠离子，氯离子来中和体系电荷，使用周期边界条件来表示无限溶剂环境。

与此同时执行立方周期边界条件，并且用粒子网格Ewald方法处理长程经典相互作用，非键合阶段距离为10 Å，目标压力为1 bar，压力耦合常数为2 ps，以分析复杂的能量稳定化和均方根偏差（Root Mean Square Deviation，RMSD）值。坐标文件每1 ps保存一次，轨迹每隔1 ps通过轨迹分析程序（如CPPtraj）进行分析。100ns的模拟采样阶段之后进行热力学分析，目标蛋白质的结合位点和配体化合物之间的结合自由能由分子力学/泊松-玻尔兹曼表面积（Molecular Mechanics / Poisson Boltzmann (Generalized Born) SurfaceArea ，MM/PB-SA）计算，在采样轨迹中以100ps的间隔取10，000个数据快照，从每个数据快照中，从以下公式计算自由结合能：

其中为每个数据快照中目标蛋白质和配体化合物之间的结合自由能，/>为TIP3P溶液中的自由能，/>为复合物模型的自由能，为配体化合物模型的自由能，/>为目标受体模型的自由能。为了便于理解，本说明书中提供了一种配体化合物与目标蛋白质之间的结合自由能的计算过程示意图，如图2所示。

图2为本说明书中提供的一种配体化合物与目标蛋白质之间的结合自由能的计算过程示意图。

其中，将目标蛋白质的氨基酸序列输入仿真模型后，可得到目标蛋白质的三维晶体结构，作为初始受体模型，而后对其进行分子动力学约束模拟，得到高精度的目标受体模型，将目标受体模型与配体化合物模型进行分子对接模拟，确定结合口袋的目标位置，并得到复合物模型，而后对复合物模型进行分子动力学模拟，确定其运动轨迹，进而计算结合自由能。

终端设备可以根据基于每个数据快照确定出的结合自由能确定出最终的结合自由能，并根据最终确定出的结合自由能确定不同配体化合物与目标蛋白质之间的亲和力。该亲和力用于表征目标蛋白质与配体化合物之间的适配性，并且自由能的绝对值越大，亲和力越大，反之越小。

而后终端设备可以根据不同配体化合物对应的亲和力从中选取出目标化合物（如将亲和力最高的配体化合物作为目标化合物），而后基于该目标化合物以及上述最优结合口袋位置，生成诸如药物设计、食品研发、蛋白质设计以及蛋白质传感器设计等生物工程领域中的设计或研究任务的任务计划，并通过终端设备执行该任务计划，如对上述药品或食品的设计进行仿真模拟等。

例如，终端设备可以通过上数方法计算味觉受体蛋白T1R2和已知甜味化合物的结合自由能评估不同糖类和味觉蛋白T1R2的亲和力。亲和力越高则添堵也就越高。

经过本方案中对目标蛋白质初始受体模型的优化，T1R2的结构准确度较AlphaFold2预测的值综合提高2.5%，其中按照UCLA saves6.0的结构评分，原子间相互作用评分由92.46上升至93.4,氨基酸结构兼容性由84.72%提高至86.23%。经过和不同糖类化合物分子对接，包括蔗糖、阿斯巴甜、纽甜、果糖、乳糖、糖精、三氯蔗糖、麦芽糖、葡萄糖等，并相应进行分子动力学模拟并计算结合自由能。

另外，终端设备还可以确定出不同非糖类化合物与味觉蛋白之间的亲和力，从而找到甜度较高的非糖类化合物，进而通过目标化合物执行无糖食品（如无糖口香糖、无糖饮料等）的涉及与研发任务。

此外，终端设备还可以通过上述方法确定出与人体中病灶部位的蛋白质受体亲和力较高的药物以及药物靶点，从而在终端设备上进行药物的研发任务的仿真模拟。

通过以上实施方式描述可知，本方案对评估蛋白质-配体亲和力具有相对高的准确性，并且该方法可以通过调整参数以适应不同的蛋白质-配体体系，对评估不同类型的蛋白质，比如嗅觉蛋白等G蛋白偶联受体都可以达到高准确度的预测，具有一定的泛化能力。该方法可以应用于开发筛选新药物，决定药物靶点，有助于药物开发。

本方案在构建目标蛋白质对应的受体模型时，不仅仅基于目标蛋白质对应的氨基酸序列进行构建，还会对目标蛋白质实际所处的细胞环境以及分子动力学约束对其进行动力学仿真并进行优化，从而得到更加符合实际情况的虚拟受体模型，这样一来，在后续进行分子对接以及结合自由能评估的过程中得到的评估结果更为精确，保证了确定出的不同配体化合物与目标蛋白质的适配性的准确性。

以上为本说明书的一个或多个实施基于分子动力学模型预测配体亲和力的任务执行方法，基于同样的思路，本说明书还提供了相应的基于分子动力学模型预测配体亲和力的任务执行装置，如图3所示。

图3为本说明书提供的一种基于分子动力学模型预测配体亲和力的任务执行装置的示意图，包括：

获取模块301，用于获取目标蛋白质的氨基酸序列；

构建模块302，用于基于所述氨基酸序列，在仿真环境中构建所述目标蛋白质的初始受体模型；

优化模块303，用于根据所述目标蛋白质所处的细胞环境信息以及天然氨基酸的结构约束信息，在所述仿真环境中对所述初始受体模型进行分子动力学模拟，以对所述初始受体模型进行优化，得到所述目标蛋白质对应的目标受体模型；

对接模块304，用于针对每个配体化合物，在所述仿真环境中对该配体化合物对应的配体化合物模型与所述目标受体模型进行分子对接模拟，确定在所述配体化合物模型上与所述目标受体模型进行结合的目标位置，作为该配体化合物对应的目标位置；

确定模块305，用于针对每个配体化合物，确定按照该配体化合物对应的目标位置将所述目标受体模型和该配体化合物对应的配体化合物模型对接后得到的复合物模型，作为该配体化合物对应的复合物模型；

计算模块306，用于在所述仿真环境中对每个配体化合物对应的复合物模型进行分子动力学模拟，以计算所述目标蛋白质和每个配体化合物之间的结合自由能；

执行模块307，用于根据每个所述目标蛋白质与每个配体化合物对应的结合自由能，在各配体化合物中确定出目标化合物，并根据所述目标化合物，执行目标任务。

可选地，所述优化模块303具体用于，将所述初始受体模型放置在所述仿真环境中的水分子力场模型TIP3P溶液中，并对所述水分子力场模型的溶液进行离子中和；根据所述结构约束信息，对所述初始受体模型进行谐波约束，根据所述细胞环境信息，在指定时间内将所述仿真环境加热至目标温度，并对所述初始受体模型的指定转角施加距离约束；在指定压力下对所述仿真环境中的受体模型进行模拟采样，确定所述受体模型的能量反应路径，并将采集到的能量最低的一帧所对应的受体模型作为所述目标受体模型。

可选地，所述对接模块304具体用于，根据预设的构象搜索参数对所述目标受体模型和所述配体化合物模型进行构象搜索，确定满足指定条件的配体构象并将所述配体构象对应结合口袋位置作为所述目标位置。

可选地，所述计算模块306具体用于，针对每个配体化合物，将该配体化合物对应的复合物模型放置在所述仿真环境中的TIP3P溶液中，并添加抗衡离子中和所述溶液中的电荷；设置周期性边界条件，并处理所述复合物模型在所述TIP3P溶液中的长程相互作用；在所述仿真环境中对复合物模型的轨迹进行模拟采样，并基于采集到的数据对复合物模型进行热力学分析，计算所述目标蛋白质和该配体化合物之间的结合自由能。

可选地，所述抗衡离子包括：钠离子以及氯离子。

可选地，所述计算模块306具体用于，按照预设的时间间隔，在指定时间内对所述复合物模型的轨迹进行模拟采样，得到若干个数据快照；所述计算模块具体用于，针对每个数据快照，根据该数据快照中所述TIP3P溶液中的自由能、该数据快照中复合物模型的自由能、该数据快照中配体化合物模型的自由能以及该数据快照中目标受体模型的自由能确定该数据快照中目标蛋白质和该配体化合物之间的结合自由能。

可选地，所述执行模块307具体用于，根据每个配体化合物对应的结合自由能，确定各配体化合物与所述目标蛋白质之间的亲和力，并基于所述亲和力在各化合物中确定出目标化合物。

可选地，所述自由能的绝对值越大，所述亲和力越大。

本说明书还提供了一种计算机可读存储介质，该存储介质存储有计算机程序，计算机程序可用于执行上述图1提供的一种基于分子动力学模型预测配体亲和力的任务执行方法。

本说明书还提供了图4所示的一种对应于图1的电子设备的示意结构图。如图4所述，在硬件层面，该电子设备包括处理器、内部总线、网络接口、内存以及非易失性存储器，当然还可能包括其他业务所需要的硬件。处理器从非易失性存储器中读取对应的计算机程序到内存中然后运行，以实现上述图1所述的基于分子动力学模型预测配体亲和力的任务执行方法。当然，除了软件实现方式之外，本说明书并不排除其他实现方式，比如逻辑器件抑或软硬件结合的方式等等，也就是说以下处理流程的执行主体并不限定于各个逻辑单元，也可以是硬件或逻辑器件。

对于一个技术的改进可以很明显地区分是硬件上的改进（例如，对二极管、晶体管、开关等电路结构的改进）还是软件上的改进（对于方法流程的改进）。然而，随着技术的发展，当今的很多方法流程的改进已经可以视为硬件电路结构的直接改进。设计人员几乎都通过将改进的方法流程编程到硬件电路中来得到相应的硬件电路结构。因此，不能说一个方法流程的改进就不能用硬件实体模块来实现。例如，可编程逻辑器件（ProgrammableLogic Device, PLD）（例如现场可编程门阵列（Field Programmable Gate Array，FPGA））就是这样一种集成电路，其逻辑功能由用户对器件编程来确定。由设计人员自行编程来把一个数字系统“集成”在一片PLD上，而不需要请芯片制造厂商来设计和制作专用的集成电路芯片。而且，如今，取代手工地制作集成电路芯片，这种编程也多半改用“逻辑编译器（logic compiler）”软件来实现，它与程序开发撰写时所用的软件编译器相类似，而要编译之前的原始代码也得用特定的编程语言来撰写，此称之为硬件描述语言（HardwareDescription Language，HDL），而HDL也并非仅有一种，而是有许多种，如ABEL（AdvancedBoolean Expression Language）、AHDL（Altera Hardware Description Language）、Confluence、CUPL（Cornell University Programming Language）、HDCal、JHDL（JavaHardware Description Language）、Lava、Lola、MyHDL、PALASM、RHDL（Ruby HardwareDescription Language）等，目前最普遍使用的是VHDL（Very-High-Speed IntegratedCircuit Hardware Description Language）与Verilog。本领域技术人员也应该清楚，只需要将方法流程用上述几种硬件描述语言稍作逻辑编程并编程到集成电路中，就可以很容易得到实现该逻辑方法流程的硬件电路。

控制器可以按任何适当的方式实现，例如，控制器可以采取例如微处理器或处理器以及存储可由该（微）处理器执行的计算机可读程序代码（例如软件或固件）的计算机可读介质、逻辑门、开关、专用集成电路（Application Specific Integrated Circuit，ASIC）、可编程逻辑控制器和嵌入微控制器的形式，控制器的例子包括但不限于以下微控制器：ARC 625D、Atmel AT91SAM、Microchip PIC18F26K20 以及Silicone Labs C8051F320，存储器控制器还可以被实现为存储器的控制逻辑的一部分。本领域技术人员也知道，除了以纯计算机可读程序代码方式实现控制器以外，完全可以通过将方法步骤进行逻辑编程来使得控制器以逻辑门、开关、专用集成电路、可编程逻辑控制器和嵌入微控制器等的形式来实现相同功能。因此这种控制器可以被认为是一种硬件部件，而对其内包括的用于实现各种功能的装置也可以视为硬件部件内的结构。或者甚至，可以将用于实现各种功能的装置视为既可以是实现方法的软件模块又可以是硬件部件内的结构。

上述实施例阐明的系统、装置、模块或单元，具体可以由计算机芯片或实体实现，或者由具有某种功能的产品来实现。一种典型的实现设备为计算机。具体的，计算机例如可以为个人计算机、膝上型计算机、蜂窝电话、相机电话、智能电话、个人数字助理、媒体播放器、导航设备、电子邮件设备、游戏控制台、平板计算机、可穿戴设备或者这些设备中的任何设备的组合。

为了描述的方便，描述以上装置时以功能分为各种单元分别描述。当然，在实施本说明书时可以把各单元的功能在同一个或多个软件和/或硬件中实现。

本领域内的技术人员应明白，本说明书的实施例可提供为方法、系统、或计算机程序产品。因此，本说明书可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且，本说明书可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质（包括但不限于磁盘存储器、CD-ROM、光学存储器等）上实施的计算机程序产品的形式。

本说明书是参照根据本说明书实施例的方法、设备（系统）、和计算机程序产品的流程图和／或方框图来描述的。应理解可由计算机程序指令实现流程图和／或方框图中的每一流程和／或方框、以及流程图和／或方框图中的流程和／或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器，使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和／或方框图一个方框或多个方框中指定的功能的装置。

这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中，使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品，该指令装置实现在流程图一个流程或多个流程和／或方框图一个方框或多个方框中指定的功能。

这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上，使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理，从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和／或方框图一个方框或多个方框中指定的功能的步骤。

在一个典型的配置中，计算设备包括一个或多个处理器(CPU)、输入/输出接口、网络接口和内存。

内存可能包括计算机可读介质中的非永久性存储器，随机存取存储器(RAM)和/或非易失性内存等形式，如只读存储器(ROM)或闪存(flash RAM)。内存是计算机可读介质的示例。

计算机可读介质包括永久性和非永久性、可移动和非可移动媒体可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括，但不限于相变内存(PRAM)、静态随机存取存储器(SRAM)、动态随机存取存储器(DRAM)、其他类型的随机存取存储器(RAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、快闪记忆体或其他内存技术、只读光盘只读存储器(CD-ROM)、数字多功能光盘(DVD)或其他光学存储、磁盒式磁带，磁带磁磁盘存储或其他磁性存储设备或任何其他非传输介质，可用于存储可以被计算设备访问的信息。按照本文中的界定，计算机可读介质不包括暂存电脑可读媒体(transitory media)，如调制的数据信号和载波。

还需要说明的是，术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含，从而使得包括一系列要素的过程、方法、商品或者设备不仅包括那些要素，而且还包括没有明确列出的其他要素，或者是还包括为这种过程、方法、商品或者设备所固有的要素。在没有更多限制的情况下，由语句“包括一个……”限定的要素，并不排除在包括所述要素的过程、方法、商品或者设备中还存在另外的相同要素。

本领域技术人员应明白，本说明书的实施例可提供为方法、系统或计算机程序产品。因此，本说明书可采用完全硬件实施例、完全软件实施例或结合软件和硬件方面的实施例的形式。而且，本说明书可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质（包括但不限于磁盘存储器、CD-ROM、光学存储器等）上实施的计算机程序产品的形式。

本说明书可以在由计算机执行的计算机可执行指令的一般上下文中描述，例如程序模块。一般地，程序模块包括执行特定任务或实现特定抽象数据类型的例程、程序、对象、组件、数据结构等等。也可以在分布式计算环境中实践本说明书，在这些分布式计算环境中，由通过通信网络而被连接的远程处理设备来执行任务。在分布式计算环境中，程序模块可以位于包括存储设备在内的本地和远程计算机存储介质中。

本说明书中的各个实施例均采用递进的方式描述，各个实施例之间相同相似的部分互相参见即可，每个实施例重点说明的都是与其他实施例的不同之处。尤其，对于系统实施例而言，由于其基本相似于方法实施例，所以描述的比较简单，相关之处参见方法实施例的部分说明即可。

以上所述仅为本说明书的实施例而已，并不用于限制本说明书。对于本领域技术人员来说，本说明书可以有各种更改和变化。凡在本说明书的精神和原理之内所作的任何修改、等同替换、改进等，均应包含在本说明书的权利要求范围之内。

Claims

1.一种基于分子动力学模型预测配体亲和力的任务执行方法，其特征在于，包括：

获取目标蛋白质的氨基酸序列；

2.如权利要求1所述的方法，其特征在于，根据所述目标蛋白质所处的细胞环境信息以及所述细胞环境中的分子动力学天然氨基酸的结构约束信息，在所述仿真环境中对所述初始受体模型进行分子动力学模拟，具体包括：

根据所述结构约束信息，对所述初始受体模型进行谐波约束，根据所述细胞环境信息，在指定时间内将所述仿真环境加热至目标温度，并对所述初始受体模型的指定转角施加距离约束；

3.如权利要求1所述的方法，其特征在于，针对每个配体化合物，在所述仿真环境中对该配体化合物对应的配体化合物模型与所述目标受体模型进行分子对接模拟，确定在所述配体化合物模型上与所述目标受体模型进行结合的目标位置，作为该配体化合物对应的目标位置，具体包括：

4.如权利要求1所述的方法，其特征在于，在所述仿真环境中对每个配体化合物对应的复合物模型进行分子动力学模拟，以计算所述目标蛋白质和每个配体化合物之间的结合自由能，具体包括：

5.如权利要求4所述的方法，其特征在于，所述抗衡离子包括：钠离子以及氯离子。

6.如权利要求4所述的方法，其特征在于，在所述仿真环境中对所述复合物模型的轨迹进行模拟采样，具体包括：

7.如权利要求1所述的方法，其特征在于，根据每个所述目标蛋白质与每个配体化合物对应的结合自由能，在各配体化合物中确定出目标化合物，具体包括：

8.如权利要求7所述的方法，其特征在于，所述自由能的绝对值越大，所述亲和力越大。

9.一种基于分子动力学模型预测配体亲和力的任务执行装置，其特征在于，包括：

获取模块，获取目标蛋白质的氨基酸序列；

10.如权利要求9所述的装置，其特征在于，所述优化模块具体用于，

11.如权利要求9所述的装置，其特征在于，所述对接模块具体用于，

12.如权利要求9所述的装置，其特征在于，所述计算模块具体用于，针对每个配体化合物，将该配体化合物对应的复合物模型放置在所述仿真环境中的TIP3P溶液中，并添加抗衡离子中和所述溶液中的电荷；设置周期性边界条件，并处理所述复合物模型在所述TIP3P溶液中的长程相互作用；在所述仿真环境中对复合物模型的轨迹进行模拟采样，并基于采集到的数据对复合物模型进行热力学分析，计算所述目标蛋白质和该配体化合物之间的结合自由能。

13.如权利要求12所述的装置，其特征在于，所述抗衡离子包括：钠离子以及氯离子。

14.如权利要求12所述的装置，其特征在于，所述计算模块具体用于，按照预设的时间间隔，在指定时间内对所述复合物模型的轨迹进行模拟采样，得到若干个数据快照；

15.如权利要求9所述的装置，其特征在于，所述执行模块具体用于，根据每个配体化合物对应的结合自由能，确定各配体化合物与所述目标蛋白质之间的亲和力，并基于所述亲和力在各化合物中确定出目标化合物。

16.如权利要求15所述的装置，其特征在于，所述自由能的绝对值越大，所述亲和力越大。

17.一种计算机可读存储介质，其特征在于，所述存储介质存储有计算机程序，所述计算机程序被处理器执行时实现上述权利要求1~8任一项所述的方法。

18.一种电子设备，包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序，其特征在于，所述处理器执行所述程序时实现上述权利要求1~8任一项所述的方法。