CN117079738B

CN117079738B - 一种基于量子计算的分子结合能综合计算方法

Info

Publication number: CN117079738B
Application number: CN202211298587.XA
Authority: CN
Inventors: 左芬; 吴垂雄; 李亚麟; 吕川
Original assignee: Hefei Micro Era Digital Technology Co ltd
Current assignee: Hefei Micro Era Digital Technology Co ltd
Priority date: 2022-10-24
Filing date: 2022-10-24
Publication date: 2024-07-09
Anticipated expiration: 2042-10-24
Also published as: CN117079738A

Abstract

本发明涉及药物分子活性的评价。一种基于量子计算的结合能综合计算方法，包括：步骤一，利用分子对接或分子动力学模拟确定化合物分子与蛋白质的复合构象；步骤二，将蛋白质抽象为一组环境电荷；步骤三，在存在环境电荷情况下对整个化合物进行Hartree‑Fock求解；步骤四，将化合物进行分块，抽取跟蛋白质结合紧密相关的片段；步骤五，利用步骤三中得到的Hartree‑Fock解，得到与选取片段相纠缠的槽轨道，以及片段哈密顿量；步骤六，对化合物片段进行高精度求解，选择CCSD(T)经典算法或者VQE量子算法；步骤七，将步骤三和与步骤六的计算结果进行匹配，达到自洽即综合步骤三与步骤六的结果可得到系统能量，并进一步得出结合能。本发明具有更好的扩展性，以及更高的计算效率。

Description

一种基于量子计算的分子结合能综合计算方法

技术领域

本发明涉及药物分子活性的评价，尤其涉及一种基于量子计算的药物分子结合能的计算评价方法。

背景技术

分子结合自由能(binding free energy)，简称分子结合能，通常是指蛋白与配体分子之间的相互作用，包括非键相互作用和共价相互作用。其中，非键相互作用包括范德瓦尔斯相互作用和静电相互作用；共价相互作用本质上是指蛋白和配体间化学键的断裂和生成。在实际的药物分子和蛋白质复合物体系中，一般只存在非键相互作用。

分子结合能可用来表征配体分子的生物活性。许多药物分子的生物活性是通过其与受体蛋白之间的相互作用表现出来的，分子结合能反映了药物分子和受体蛋白间相互作用的强弱。药物分子活性的评价是生物制药行业面临的重要问题之一。通过实验手段测定单个配体分子与蛋白的生物活性是相对容易的，但是对数百万的配体分子进行活性实验十分昂贵。

传统的分子结合能计算方法可以分为两大类：基于打分函数的结合能预测和基于分子动力学模拟的结合能计算。其中应用广泛的结合能计算方法有：Rosetta打分函数、分子力学/泊松-玻尔兹曼(广义波恩)表面积(Molecular Mechanics/Poisson Boltzmann(Generalized Born)Surface Area,MM/PB(GB)SA)方法、线性相互作用能(LinearInteraction Energy,LIE)方法、自由能微扰(Free Energy Perturbation,FEP)和热力学积分(Thermodynamic Integration,TI)方法等。

分子力学/泊松-玻尔兹曼(广义波恩)表面积方法(MM/PB(GB)SA)是Kollman等人基于MD模拟轨迹发展的分子力学结合连续性溶剂模型的分子结合能计算方法，该方法很好的平衡了计算精度和计算成本，被广泛应用于蛋白-配体分子结合能的计算中；自由能微扰计算方法(FEP)也被称为“炼金术”算法，最早由Kirkwood等人于1935年提出，是评估药物小分子和靶点蛋白结合强度的一种高精度方法，也是业界公认的精度最高的分子结合能计算方法。

上述计算方法都是基于打分函数的自由能预测，具有运算简便，计算速度快和资源需求少等特点，常用于数以万计的配体药物的虚拟筛选中。但是简单的经验性打分函数结果一般是不可靠的，具有较大误差，通过虚拟筛选得到的打分较高的配体往往需要进行后续基于动力学模拟的结合能评估。

MMPB(GB)SA方法已被证明可以有效的平衡计算成本和准确性，计算误差约10kcal/mol，速度介于打分函数和FEP之间，是近千个配体分子筛选的不错选择。由于该方法在熵的计算上存在近似且没有考虑各个能量项之间的耦合，计算结果往往高于实验预测的结合亲和力。

FEP方法理论基础严格，计算误差范围小于1kcal/mol，结果和实验符合良好。但是由于需要对研究体系的各个状态进行大量的样本采集，计算资源消耗很大；另外，该方法对计算体系有比较严格的限制，只适合计算结构差别较小的体系，而不适用于结构差别较大的体系。虽然GPU显著提高了FEP的计算效率，但是由于计算量巨大，该方法仍然不适合进行大量复合物结合自由能的计算。

综上可见，当前结合能计算的主流方法较强地依赖于分子力场。而分子力场作为一种经典框架，只能在一定程度上间接地反映分子微观的量子性质。随着应用场景中对计算精度的要求越来越高，上述这些算法已经不能直接地对分子体系的微观量子行为进行更直接的刻画，并在此基础上直接进行结合能的计算，计算效率低下。

发明内容

本发明旨在解决现有技术的缺陷，提供一种基于量子计算的结合能综合计算方法。本发明具有更好的扩展性，以及更高的计算效率。

本发明的技术方案是这样实现的，一种基于量子计算的结合能综合计算方法，包括下列步骤：

步骤一，利用分子对接或分子动力学模拟确定化合物分子与蛋白质的复合构象；

步骤二，将蛋白质抽象为一组环境电荷；

步骤三，在存在环境电荷情况下对整个化合物进行Hartree-Fock求解；

步骤四，将化合物进行分块，抽取跟蛋白质结合紧密相关的片段；

步骤五，利用步骤三中得到的Hartree-Fock解，得到与选取片段相纠缠的槽轨道，以及片段哈密顿量；

步骤六，对化合物片段进行高精度求解，选择CCSD(T)经典算法，或者VQE量子算法；

步骤七，将步骤三和与步骤六的计算结果进行匹配，达到自洽即综合步骤三与步骤六的结果可得到系统能量，并进一步得出结合能。

所述的一种基于量子计算的结合能综合计算方法，所述步骤四包括，对所述化合分块，抽取跟蛋白质结合紧密相关的片段包括：蛋白质部分、化合物和结合部位。

所述的一种基于量子计算的结合能综合计算方法，所述步骤六包括，对选定的化合物片段的薛定谔方程进行高精度求解，针对不同的片段大小，相应的精度需求，以及可用的计算资源，选择算法。

所述的一种基于量子计算的结合能综合计算方法，所述VQE量子算法即变分量子本征求解器，它利用量子与经典计算机的分工合作，是一种混合量子-经典算法以缩短量子电路的深度并减少门数目。

本发明直接把量子化学特别是基于波函数的计算方法直接应用到分子体系中，即主要考虑蛋白质与配体化合物的结合能，先通过求解整个复合体系的薛定谔方程，得到基态及基态能量；再将基态能量减去蛋白质以及化合物自身的能量，得到结合能。提高了计算效率。

本发明通过经典计算的引入，VQE算法大大简化了量子电路。VQE不再像相位估计算法那样需要多次将哈密顿算符/演化算符编码进电路中，只需要对哈密顿算符的单项做计算即可。因此，VQE算法可以在当前的量子计算硬件上有效运行，得到相应化学体系的基态和基态能量。

本发明利用量子计算来获得结合能，实际上是在量子计算机的协助下，通过直接求解量子化学体系的薛定谔方程来得到相应的能量。这是一种完全从底层的基本原理出发的计算方案，充分地体现了物理学与化学、化学与生物学之间的深层联系，符合大自然的基本规律。跟目前广泛采用的其他计算方案相比，这一计算思路具有以下优越性：

理论基础坚实，物理图像清晰：

目前普遍使用的结合能方法都或多或少地依赖分子力场，而分子力场只是对分子体系性质的一种经典近似。本方案直接从薛定谔方程出发，通过对体系量子性质的直接描述来导出体系的宏观性质，具有更加坚实的理论基础，也能更直接地刻画微观量子行为对宏观性质的影响。

应用范围广泛：

当前的许多计算方案都有一定的局限性。本方案则较为灵活，可以自动地将系统的各种因素和过程纳入进来，并根据影响的大小分别进行处理。

具有很好的扩展性：

尽管当前受量子硬件规模和性能的限制，我们能精确处理的体系还比较小，比如局限在化合物的某个片段上。但是随着量子硬件规模的扩大和性能的大幅提升，我们可以很快扩大高精度计算的体系范围。同时经典计算能力的进一步提高也会有助于我们计算规模的扩大。

附图说明

下面结合附图对本发明作进一步的说明：

图1是所述VQE算法的协同方式示意图。

图2是M^pro与抑制剂双嘧达莫形成的复合物示意图

图3是双嘧达莫结构示意图。

具体实施方式

下面，结合实施例对本发明做进一步的说明，

参见图1，本发明一种基于量子计算的结合能综合计算方法，包括下列步骤：

步骤二，将蛋白质抽象为一组环境电荷；

所述的一种基于量子计算的结合能综合计算方法，所述步骤四包括，对所述化合物分块，抽取与蛋白质结合紧密相关的片段，包括：蛋白质部分、化合物和结合部位。

实施例

新冠病毒SARS-CoV-2主蛋白酶M^pro与抑制剂的结合。M^pro作为一种酶，可以催化新冠病毒多聚蛋白向单蛋白的分裂，而这是病毒复制过程所必需的。因此M^pro可以用作新冠病毒药物设计的靶标。M^pro与抑制剂双嘧达莫(Dipyridamole)形成的复合物构象如图2，所述Dipyridamole的结构式如图3。

从复合物构象出发，一个初步的判断是，这里的四个羟基在与Mpro的结合中起着比较重要的作用。因此，我们可以将四个羟基分离出来，采用高精度经典计算或者量子计算，而对整个Dipyridamole采用低精度的Hartree-Fock计算。利用量子纠缠将二者结果综合起来，可得出Dipyridamole与Mpro的结合能。Mpro的其它抑制剂可用类似思路处理。

Claims

1.一种基于量子计算的结合能综合计算方法，其特征在于，包括下列步骤：

步骤二，将蛋白质抽象为一组环境电荷；

步骤七，将步骤三与步骤六的计算结果进行匹配，达到自洽即综合步骤三与步骤六的结果可得到系统能量，并进一步得出结合能。

2.根据权利要求1所述的一种基于量子计算的结合能综合计算方法，其特征在于，所述步骤四包括，对所述化合物分块，抽取跟蛋白质结合紧密相关的片段包括：蛋白质部分、化合物和结合部位。

3.根据权利要求1所述的一种基于量子计算的结合能综合计算方法，其特征在于，所述步骤六包括，对选定的化合物片段的薛定谔方程进行高精度求解，针对不同的片段大小，相应的精度需求，以及可用的计算资源，选择算法。

4.根据权利要求1所述的一种基于量子计算的结合能综合计算方法，其特征在于，所述VQE量子算法即变分量子本征求解器，它利用量子与经典计算机的分工合作，是一种混合量子-经典算法以缩短量子电路的深度并减少门数目。