CN117497071A

CN117497071A - 一种通过量子计算确定药物分子的稳定构象的方法和装置

Info

Publication number: CN117497071A
Application number: CN202311452110.7A
Authority: CN
Inventors: 黄蕾蕾
Original assignee: Regular Quantum Beijing Technology Co ltd
Current assignee: Regular Quantum Beijing Technology Co ltd
Priority date: 2023-11-02
Filing date: 2023-11-02
Publication date: 2024-02-02
Anticipated expiration: 2043-11-02
Also published as: CN117497071B

Abstract

本发明实施例提供了通过量子计算确定药物分子的稳定构象的方法和装置，该方法包括：从药物分子的二维化学表达式对应的分子构象组成的构象空间中确定出目标搜索空间；根据目标搜索空间，进行包括多次迭代处理的寻象操作，得到目标构象，任意一次迭代处理包括：获取本次迭代的初始搜索空间，根据本次迭代的颗粒度离散化初始搜索空间，得到本次迭代的多个第一构象样本；基于预定量子算法，确定多个第一构象样本的基态能量；若颗粒度未达到预定阈值，根据多个第一构象样本的基态能量，确定出第二构象样本，并据以确定下一次迭代处理的初始搜索空间；若颗粒度达到预定阈值，则根据多个第一构象样本的基态能量，从中确定出目标构象，并结束寻象操作。

Description

一种通过量子计算确定药物分子的稳定构象的方法和装置

技术领域

本发明涉及计算机辅助药物设计领域，尤其涉及一种通过量子计算确定药物分子的稳定构象的方法和装置。

背景技术

在计算机辅助药物设计(CADD)中，分子药物的最低能量构象(全局最低能量构象，GMEC)具有重要意义，因为它代表了分子在自然环境中的最稳定状态，对药物的生物活性和药效学性质(如吸收、分布、代谢、排泄)产生影响。在药物设计过程中，通过需要了解药物分子与目标蛋白(受体)的相互作用，即分子对接问题。这需要确定蛋白质的3D结构和药物分子的可能构象，特别是最低能量构象，因为它是分子系统在自然环境下最可能达到的稳定状态，也是最有可能在生物体内出现并与目标蛋白质进行相互作用的状态。但是，现有的通过经典计算机进行的确定分子药物的最低能量构象的方法，存在这计算量过大而不适于大分子药物的问题，或者存在只能找到局部最低能量构象而不是全局最低能量构象，因而查找结果不是全局最优的问题。

发明内容

本发明实施例提供一种通过量子计算确定药物分子的稳定构象的方法和装置。利用该方法，可以通过量子计算方法高效的确定分子的不同构象的基态能量，从而大大提高搜索药物分子的最稳定构象的整体效率。

本发明为解决上述技术问题采用的技术方案为，一方面提供一种通过量子计算确定药物分子的稳定构象的方法，包括：

获取药物分子的二维化学表达式，从所述二维化学表达式对应的分子构象组成的构象空间中确定出目标搜索空间；

根据所述目标搜索空间，进行包括多次迭代处理的寻象操作，得到目标构象，其中，任意一次迭代处理包括：

获取本次迭代的初始搜索空间，根据本次迭代对应的颗粒度离散化所述初始搜索空间，得到本次迭代对应的多个第一构象样本；基于预定量子算法，确定所述多个第一构象样本的基态能量；

若所述颗粒度未达到预定阈值，根据所述多个第一构象样本的基态能量，从多个第一构象样本中确定出第二构象样本，并根据所述第二构象样本确定下一次迭代处理的初始搜索空间；

若所述颗粒度达到预定阈值，则根据所述多个第一构象样本的基态能量，从中确定出目标构象，并结束所述寻象操作。

优选地，所述预定量子算法包括变分量子算法VQE、矩阵乘积状态结合变分量子算法MPS-VQE、密度矩阵嵌入算法DMET、以及张量网络结合变分量子算法中的一种或多种。

优选地，所述构象空间基于药物分子的构象参数确定；

从所述二维化学表达式对应的分子构象组成的构象空间中确定出目标搜索空间，包括：

从所述构象参数中确定出目标参数，根据目标参数确定所述目标搜索空间。

优选地，所述构象参数包括所述药物分子包括各个原子之间的扭转角和键角。

优选地，根据本次迭代对应的颗粒度离散化所述初始搜索空间，得到本次迭代对应的多个第一构象样本，包括：

根据本次迭代对应的颗粒度，划分目标参数包括的扭转角和/或键角，得到本次迭代对应的多个第一构象样本。

优选地，根据所述多个第一构象样本的基态能量，从多个第一构象样本中确定出第二构象样本，并根据所述第二构象样本确定下一次迭代处理的初始搜索空间，包括：

根据所述多个第一构象样本的基态能量构建能量景观图，确定能量景观图中的能量波谷，根据所述能量波谷，确定出多个第一构象样本中的至少一个第二构象样本，并以所述第二构象样本作为下一次迭代处理的初始搜索空间。

优选地，根据所述多个第一构象样本的基态能量，从中确定出目标构象,包括：

从所述多个第一构象样本中，确定出基态能量最低的目标构象。

优选地，根据权利要求1所述的方法，其中，所述多次迭代处理中，迭代次序居后的迭代处理对应的颗粒度小于迭代次序居后的迭代处理对应的颗粒度。

第二方面，提供一种通过量子计算确定药物分子的稳定构象的装置,所述装置包括：

空间确定单元，配置为，获取药物分子的二维化学表达式，从所述二维化学表达式对应的分子构象组成的构象空间中确定出目标搜索空间；

寻象单元，配置为，根据所述目标搜索空间，进行包括多次迭代处理的寻象操作，得到目标构象，所述寻象单元还包括用于任意一次迭代处理的迭代子单元；

所述迭代子单元，配置为，获取本次迭代的初始搜索空间，根据本次迭代对应的颗粒度离散化所述初始搜索空间，得到本次迭代对应的多个第一构象样本；基于预定量子算法，确定所述多个第一构象样本的基态能量；

所述迭代子单元，还配置为，若所述颗粒度未达到预定阈值，根据所述多个第一构象样本的基态能量，从多个第一构象样本中确定出第二构象样本，并根据所述第二构象样本确定下一次迭代处理的初始搜索空间；

所述迭代子单元，还配置为，若所述颗粒度达到预定阈值，则根据所述多个第一构象样本的基态能量，从中确定出目标构象，并结束所述寻象操作。

第三方面，提供一种计算设备，包括存储器和处理器，所述存储器中存储有可执行代码，所述处理器执行所述可执行代码时，实现第一方面所述的方法。

附图说明

为了更清楚说明本发明实施例的技术方案，下面将对实施例描述中所需使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1是系统搜索方案的示意图；

图2是随机搜索方案的示意图；

图3为本发明实施例提供的通过量子计算确定药物分子的稳定构象的方法的示意图；

图4为本发明实施例提供的通过量子计算确定药物分子的稳定构象的方法的流程图；

图5为本发明实施例提供的每次迭代处理包括的子步骤流程图；

图6为本发明另一实施例提供的预定量子算法的备选算法示意图；

图7为本发明实施例提供的一种通过量子计算确定药物分子的稳定构象的装置的结构图。

具体实施方式

为使本发明实施例的目的、技术方案和优点更加清楚，下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

传统的新药研发是一种复杂的系统工程，一种创新药从研发到最后上市，常常需要花费大量资金和大量时间。而如果针对一种疾病的具体类型开发不同的药物，或称精准医疗，也需要花费巨大的的人力物力。为了提高药物研发效率，缩短研发周期，节约研发成本，利用高效的药物设计方法显得尤为重要。一般而言，新药研发包括以下几个过程，目标识别、目标验证、药物筛选、药物优化、药效学和毒理学研究、临床和病理学测试。其中，药物筛选就是通过高通量筛选或计算机辅助设计(CADD)，从大量的化合物中筛选出能够与目标分子相互作用的候选药物；而药物优化则是对筛选出的候选药物进行化学改造，以优化其药效学性质(如活性、选择性、稳定性、生物利用度等)。在这个过程中，确定药物分子的最低能量三维(3D)构象是药物设计中的一个重要步骤。其目的是确定药物分子在生物体内可能采取的形状，这对于确定药物如何与其目标(通常是蛋白质)相互作用非常重要。

目前，常规的可以通过经典计算机求解分子全局最低能量构象的问题。例如，构象搜索算法(Conformational Search Algorithms)是一种常用的寻找分子最低能量构象的方法，通过改变分子中的键角(bond angles)和扭转角(torsion angles)来实现。这里的"键角"指的是分子中两个原子之间的角度，而"扭转角"则是指分子中四个原子形成的二面角的角度。在分子中改变这些角度可以得到不同的分子构象，然后通过计算每个构象的能量，可以找到能量最低的构象，即最稳定的构象。构象搜索算法可以进一步划分为不同的类别：

一种类别是系统搜索(Systematic Search)。图1是系统搜索方案的示意图。如图1所示，这种方法可以通过改变分子中的例如键角和扭转角，生成所有可能的分子构象，然后计算每个构象的能量，找到能量最低的构象。该方法的优点是，可以找到全局最低能量构象。但其缺点是计算量较大，不适用于大分子的应用场景。

另一种类别，随机搜索(Random Search)。图2是随机搜索方案的示意图。如图2所示，这种方法可以通过随机改变分子中的键角和扭转角，生成一些随机的分子构象，然后计算每个构象的能量，找到能量最低的构象。这种方法的优点是，相对于全局搜索其计算量较小，并且可以用于大分子的应用场景。但其缺点是，常常只能找到局部最低能量构象，而不是全局最低能量构象，即其搜索结果常常不是全局最优。

并且，随着分子大小和复杂性的增加，可能的构象数量呈指数级增长，这使得在全局范围内获取最优的构象变得极其困难。同时，在求解分子全局最低能量构象，需要大量计算在给定分子结构的情况的基态能量。而精确计算分子能量在经典计算机上通常需要大量的计算资源和时间，这些问题的复杂性和计算成本限制了使用经典计算机在这一领域的整体求解效率。

针对上述问题，本说明书实施例提供一种通过量子计算确定药物分子的稳定构象的方法。其主要思想为：先例如根据颗粒度A划分分子构象的全局空间，得到颗粒度A下的多个构象样本。确定这些构象样本的基态能量，根据其基态能量构建能量景观图，根据能量景观图中的能量波谷，从多个构象样本出确定出至少一个被选样本。再根据低于颗粒度A的例如颗粒度B，划分被选样本对应的区域，得到颗粒度B下的多个构象样本。重复迭代上述过程，从颗粒度B下的多个构象样本对应的区域中选择用于进一步细化颗粒度的样本区域，知道颗粒度达到预定阈值。进而，从最后的细化区域中确定出基态能量最低的构象，作为全局最稳定构象。图3为本发明实施例提供的通过量子计算确定药物分子的稳定构象的方法的示意图。如图3所示，例如第一迭代处理，在颗粒度A(例如键角或扭转角间隔20°)下的全局搜索空间中，例如根据量子算法确定多个构象样本S1～S9的基态能量，并依据基态能量从中确定出构象样本S5。例如在第二迭代处理，在颗粒度B(例如键角或扭转角间隔10°)下进一步细化S5对应的搜索空间，例如得到进一步细化的多个构象样本S51～S54，例如根据S51～S52的基态能量，从中确定出样本S54。例如在第三迭代处理，在颗粒度C(例如键角或扭转角间隔5°)下进一步细化S54对应的搜索空间，得到构象样本S541～S544。其后，以此类推重复迭代处理，直到细化颗粒度达到预定阈值(例如键角或扭转角间隔0.01°)。从最后一次迭代处理得到的细化样本中确定出基态能量最低的构象作为检索结果。

该方案的优点在于，一方面，可以通过量子计算方法高效的确定分子的不同构象的基态能量，从而大大提高搜索药物分子的最稳定构象的整体效率。另一方面，通过多次迭代逐步细化搜索空间从细化后的区域中搜索构象，且每次迭代中均根据基态能量的峰值选取部分区域进行细化，从而在保证的搜素结果的精确度的同时，进一步大大减少了搜索药物分子的最稳定构象的整体计算消耗。

下面详细介绍本说明书实施例提供的通过量子计算确定药物分子的稳定构象的方法。图4为本发明实施例提供的通过量子计算确定药物分子的稳定构象的方法的流程图。如图4所示，该方法至少包括如下步骤：

步骤S401，获取药物分子的二维化学表达式，从所述二维化学表达式对应的分子构象组成的构象空间中确定出目标搜索空间；

步骤S403，据所述目标搜索空间，进行包括多次迭代处理的寻象操作，得到目标构象。

首先，在步骤S401，获取药物分子的二维化学表达式，从所述二维化学表达式对应的分子构象组成的构象空间中确定出目标搜索空间。

该步骤中，获取药物分子的二维化学表达式。在不同的实施例中，所述药物分子可以是不同的具体分子，在不同的实施例中，获取药物分子的二维化学表达式的具体方式可以不同，本说明书对此均不做限制。在一些实施例中，可以确定疾病在分子层面的运作机制，从而确定可能的药物作用靶点。这些靶点例如可以是蛋白质或其他大分子，它们在疾病的发生和发展中具有关键作用。一旦确定了药物靶点，可以使用高通量筛选技术从数以万计的化合物中筛选出可能与靶点结合的候选分子。一般而言，例如对于一种新的疾病，可以根据其症状找到治疗类似疾病或症状的药物分子，通过更改药物分子的部分结构而实现治疗效果。为了通过计算机模拟技术，来预测和优化候选分子与靶点的结合，可以先获取确定药物分子的二维(2D)化学表达式。

在获取药物分子的二维化学表达式之后，可以从所述二维化学表达式对应的分子构象组成的构象空间中确定出目标搜索空间。在一个实施例中，所述构象空间可以基于药物分子的构象参数确定。在一个具体的实施例中，所述构象参数可以包括所述药物分子包括各个原子之间的扭转角和键角。进而，可以从所述构象参数中确定出目标参数，根据目标参数确定所述目标搜索空间。在实际生产场合，分子的一些健实际是固定的，比如苯环，C-O链接，这些健在任何化学分子体系中是以固定形式存在的。因此，确定目标搜索空间的过程本质上确立可变参数的过程。因此，在一个实施例中，例如可以确定药物分子包括的原子之间的哪些键角和扭转角是可变的，进而根据这些键角和扭转角确定目标搜索空间。在一个具体实施例中，在确定可变的键角和扭转角，可以例如通过罗德里格斯旋转公式(Rodrigues'rotation formula)，确定键角和扭转角变化后的构象。进而，可以根据这些键角和扭转角的可变值的组合，可以构成目标搜索空间。

并且，实际生产场景中，对于药物分子，不是所有的原子间角度都需要考虑。例如，在一个例子中，对于原子间的双键，其扭转角是固定的。在一个例子中，根据分子内的斥力之间的几何关系，可变动的原子间角度也是受到几何约束的。因此，在上述例子中，例如可以根据原子间键的类型或分子内斥力，分子内可变的键角和扭转角。进而，根据可变的键角和扭转角，确定目标搜索空间。目标搜索空间可以包括多个构象样本，每个构象样本是这些可变键角和扭转角的不同取值的组合。例如，一个例子中，一种药物分子内可变的键角或扭转角有3个(例如为A角、B角和C角)，目标搜索空间中的样本可以是这3个键角或扭转角之间取值的组合，进而目标搜索空间中的多个样本可以对应于这3个键角或扭转角取值的多种组合。为了方便计算，在后续步骤中可以将键角或扭转角取值离散化。在离散化后，例如上述例子中3个键角或扭转角各有10个取值，则离散化后目标搜索空间中的样本例如可以有10*10*10＝1000个样本。

此后，在步骤S403，根据所述目标搜索空间，进行包括多次迭代处理的寻象操作，得到目标构象。具体的，其中任意一次迭代处理的过程可以包括步骤S4031～S4033，如图5所示。对于步骤S4031～S4033具体描述如下：

步骤S4031，获取本次迭代的初始搜索空间，根据本次迭代对应的颗粒度离散化所述初始搜索空间，得到本次迭代对应的多个第一构象样本；基于预定量子算法，确定所述多个第一构象样本的基态能量。

在一个实施例中，可以根据本次迭代对应的颗粒度，划分目标参数包括的扭转角和/或键角，得到本次迭代对应的多个第一构象样本。在一个实施例中，所述多次迭代处理中，迭代次序居后的迭代处理对应的颗粒度小于迭代次序居后的迭代处理对应的颗粒度。在不同的实施例中，多次迭代处理中首次迭代处理对应的颗粒度可以不同，在一个实施例中，例如可以为20°。

在不同的实施例中，预定量子算法可以不同。在一个实施例中，所述预定量子算法可以包括变分量子算法VQE、矩阵乘积状态结合变分量子算法MPS-VQE、密度矩阵嵌入算法DMET、以及张量网络结合变分量子算法中的一种或多种，如图所示。在不同的实施例中，预定量子算法可以通过不同具体类型的量子计算机，本说明书对此不做限制。在一些实施例中，还可以通过量子经典混合服务器，所述量子经典混合服务器中包括量子处理器和经典处理器，可以由所述量子处理器执行量子计算部分，由所述经典处理器执行量子计算之外经典计算部分。通过量子计算方法，可以高效的确定分子的不同构象的基态能量，从而大大提高搜索药物分子的最稳定构象的整体效率。

步骤S4032，若所述颗粒度未达到预定阈值，根据所述多个第一构象样本的基态能量，从多个第一构象样本中确定出第二构象样本，并根据所述第二构象样本确定下一次迭代处理的初始搜索空间。

在一个实施例中，可以根据所述多个第一构象样本的基态能量构建能量景观图，确定能量景观图中的能量波谷，根据所述能量波谷，确定出多个第一构象样本中的至少一个第二构象样本，并以所述第二构象样本作为下一次迭代处理的初始搜索空间。

步骤S4033，若所述颗粒度达到预定阈值，则根据所述多个第一构象样本的基态能量，从中确定出目标构象，并结束所述寻象操作。在一个实施例中，可以从所述多个第一构象样本中，确定出基态能量最低的目标构象，也就是全局范围内的最稳定结构。在不同的实施例中，所述预定阈值可以不同。在一个具体的实施例中，例如可以为0.01°。

在一个具体的实施例中，当目标搜索空间确立以后，可以可变参数的颗粒化。在一个例子中，例如其中的特定旋转角的可变动范围是0到135度，颗粒化的参数设置则可以假设为以15度为一个间隔，共10个间隔。与其他参数的的可变动间隔组合在一起，可以构成一个颗粒化的参数搜索空间。对于该搜索空间的每个样本，例如量子计算的方法计算它的基态能量，并绘制能量景观图。通过能量景观图可以确定波峰和波谷位置。在不同的例子中，波谷位置可以不止一个。在一个例子中，为了提高计算准确度，可以在例如第一轮迭代获取所有的波谷位置，并根据波谷位置的上限阈值(例如3个)，确定超过3个波谷则选择能量最低的三个波谷，如没有超过则选择所有波谷位置。下一轮迭代，在上一轮被选的波谷区域再次进行参数离散化，再次离散化的间隔小于上一轮的离散间隔，并对再次离散化后得到更小的区域样本进行新一轮的基态能量计算，并再次进行选择。此后，每一轮重复之前的过程。直到参数离散化的颗粒度达到预定阈值，终止迭代并确定最低能量构象。在一个例子中，还可以在当前迭代轮次得到能量最低值和上一轮的最低值的误差不超过预定精度时，终止迭代并确定最低能量构象。

根据以上描述可见，该方法中通过多次迭代逐步细化搜索空间从细化后的区域中搜索构象，且每次迭代中均根据基态能量的峰值选取部分区域进行细化。由于每次细化均是对于前次细化区域的能量波谷区域的进一步喜欢，从而可以在保证的搜素结果的精确度。由于每次迭代细化均是对前次细化区域的部分区域的进一步细化，每次迭代均减少了进一步细化的区域。相对于全局以最小颗粒度细化的方案，该方法叠加多次迭代处理的效果，大大减少了搜索药物分子的最稳定构象的整体计算消耗。

根据又一方面的实施例，还提供了一种通过量子计算确定药物分子的稳定构象的装置。图7为本发明实施例提供的一种通过量子计算确定药物分子的稳定构象的装置的结构图。如图7所示，该装置700包括：

空间确定单元701，配置为，获取药物分子的二维化学表达式，从所述二维化学表达式对应的分子构象组成的构象空间中确定出目标搜索空间；

寻象单元702，配置为，根据所述目标搜索空间，进行包括多次迭代处理的寻象操作，得到目标构象，所述寻象单元还包括用于任意一次迭代处理的迭代子单元；

根据又一方面的实施例，还提供一种计算机可读介质，包括存储于其上的计算机程序，所述计算机在运行时执行上述的方法。

根据又一方面的实施例，还提供一种计算设备，包括存储器和处理器，所述存储器中存储有可执行代码，所述处理器执行所述可执行代码时，实现上述的方法。

上述对本说明书特定实施例进行了描述。其它实施例在所附权利要求书的范围内。在一些情况下，在权利要求书中记载的动作或步骤可以按照不同于实施例中的顺序来执行并且仍然可以实现期望的结果。另外，在附图中描绘的过程不一定要求示出的特定顺序或者连续顺序才能实现期望的结果。在某些实施方式中，多任务处理和并行处理也是可以的或者可能是有利的。

专业人员应该还可以进一步意识到，结合本文中所公开的实施例描述的各示例的单元及算法步骤，能够以电子硬件、计算机软件或者二者的结合来实现，为了清楚地说明硬件和软件的可互换性，在上述说明中已经按照功能一般性地描述了各示例的组成及步骤。这些功能究竟以硬件还是软件方式来执行，取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能，但是这种实现不应认为超出本发明的范围。

结合本文中所公开的实施例描述的方法或算法的步骤可以用硬件、处理器执行的软件模块，或者二者的结合来实施。软件模块可以置于随机存储器(RAM)、内存、只读存储器(ROM)、电可编程ROM、电可擦除可编程ROM、寄存器、硬盘、可移动磁盘、CD-ROM、或技术领域内所公知的任意其它形式的存储介质中。

以上所述的具体实施方式，对本发明的目的、技术方案和有益效果进行了进一步详细说明，所应理解的是，以上所述仅为本发明的具体实施方式而已，并不用于限定本发明的保护范围，凡在本发明的精神和原则之内，所做的任何修改、等同替换、改进等，均应包含在本发明的保护范围之内。

Claims

1.一种通过量子计算确定药物分子的稳定构象的方法，包括：

2.根据权利要求1所述的方法，其中，所述预定量子算法包括变分量子算法VQE、矩阵乘积状态结合变分量子算法MPS-VQE、密度矩阵嵌入算法DMET、以及张量网络结合变分量子算法中的一种或多种。

3.根据权利要求1所述的方法，其中，所述构象空间基于药物分子的构象参数确定；

4.根据权利要求3所述的方法，其中，所述构象参数包括所述药物分子包括各个原子之间的扭转角和键角。

5.根据权利要求4所述的方法，其中，根据本次迭代对应的颗粒度离散化所述初始搜索空间，得到本次迭代对应的多个第一构象样本，包括：

6.根据权利要求1所述的方法，其中，根据所述多个第一构象样本的基态能量，从多个第一构象样本中确定出第二构象样本，并根据所述第二构象样本确定下一次迭代处理的初始搜索空间，包括：

7.根据权利要求1所述的方法，其中，根据所述多个第一构象样本的基态能量，从中确定出目标构象,包括：

8.根据权利要求1所述的方法，其中，所述多次迭代处理中，迭代次序居后的迭代处理对应的颗粒度小于迭代次序居后的迭代处理对应的颗粒度。

9.一种通过量子计算确定药物分子的稳定构象的装置,所述装置包括：

10.一种计算设备，包括存储器和处理器，所述存储器中存储有可执行代码，所述处理器执行所述可执行代码时，实现权利要求1-8中任一项所述的方法。