CN117079738B - 一种基于量子计算的分子结合能综合计算方法 - Google Patents

一种基于量子计算的分子结合能综合计算方法 Download PDF

Info

Publication number
CN117079738B
CN117079738B CN202211298587.XA CN202211298587A CN117079738B CN 117079738 B CN117079738 B CN 117079738B CN 202211298587 A CN202211298587 A CN 202211298587A CN 117079738 B CN117079738 B CN 117079738B
Authority
CN
China
Prior art keywords
quantum
calculation
compound
protein
algorithm
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202211298587.XA
Other languages
English (en)
Other versions
CN117079738A (zh
Inventor
左芬
吴垂雄
李亚麟
吕川
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hefei Micro Era Digital Technology Co ltd
Original Assignee
Hefei Micro Era Digital Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hefei Micro Era Digital Technology Co ltd filed Critical Hefei Micro Era Digital Technology Co ltd
Priority to CN202211298587.XA priority Critical patent/CN117079738B/zh
Publication of CN117079738A publication Critical patent/CN117079738A/zh
Application granted granted Critical
Publication of CN117079738B publication Critical patent/CN117079738B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16CCOMPUTATIONAL CHEMISTRY; CHEMOINFORMATICS; COMPUTATIONAL MATERIALS SCIENCE
    • G16C20/00Chemoinformatics, i.e. ICT specially adapted for the handling of physicochemical or structural data of chemical particles, elements, compounds or mixtures
    • G16C20/30Prediction of properties of chemical compounds, compositions or mixtures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N10/00Quantum computing, i.e. information processing based on quantum-mechanical phenomena
    • G06N10/20Models of quantum computing, e.g. quantum circuits or universal quantum computers

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Computing Systems (AREA)
  • General Physics & Mathematics (AREA)
  • Physics & Mathematics (AREA)
  • Computational Mathematics (AREA)
  • Crystallography & Structural Chemistry (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Chemical & Material Sciences (AREA)
  • Condensed Matter Physics & Semiconductors (AREA)
  • Data Mining & Analysis (AREA)
  • Evolutionary Computation (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Mathematical Analysis (AREA)
  • Mathematical Optimization (AREA)
  • Pure & Applied Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明涉及药物分子活性的评价。一种基于量子计算的结合能综合计算方法,包括:步骤一,利用分子对接或分子动力学模拟确定化合物分子与蛋白质的复合构象;步骤二,将蛋白质抽象为一组环境电荷;步骤三,在存在环境电荷情况下对整个化合物进行Hartree‑Fock求解;步骤四,将化合物进行分块,抽取跟蛋白质结合紧密相关的片段;步骤五,利用步骤三中得到的Hartree‑Fock解,得到与选取片段相纠缠的槽轨道,以及片段哈密顿量;步骤六,对化合物片段进行高精度求解,选择CCSD(T)经典算法或者VQE量子算法;步骤七,将步骤三和与步骤六的计算结果进行匹配,达到自洽即综合步骤三与步骤六的结果可得到系统能量,并进一步得出结合能。本发明具有更好的扩展性,以及更高的计算效率。

Description

一种基于量子计算的分子结合能综合计算方法
技术领域
本发明涉及药物分子活性的评价,尤其涉及一种基于量子计算的药物分子结合能的计算评价方法。
背景技术
分子结合自由能(binding free energy),简称分子结合能,通常是指蛋白与配体分子之间的相互作用,包括非键相互作用和共价相互作用。其中,非键相互作用包括范德瓦尔斯相互作用和静电相互作用;共价相互作用本质上是指蛋白和配体间化学键的断裂和生成。在实际的药物分子和蛋白质复合物体系中,一般只存在非键相互作用。
分子结合能可用来表征配体分子的生物活性。许多药物分子的生物活性是通过其与受体蛋白之间的相互作用表现出来的,分子结合能反映了药物分子和受体蛋白间相互作用的强弱。药物分子活性的评价是生物制药行业面临的重要问题之一。通过实验手段测定单个配体分子与蛋白的生物活性是相对容易的,但是对数百万的配体分子进行活性实验十分昂贵。
传统的分子结合能计算方法可以分为两大类:基于打分函数的结合能预测和基于分子动力学模拟的结合能计算。其中应用广泛的结合能计算方法有:Rosetta打分函数、分子力学/泊松-玻尔兹曼(广义波恩)表面积(Molecular Mechanics/Poisson Boltzmann(Generalized Born)Surface Area,MM/PB(GB)SA)方法、线性相互作用能(LinearInteraction Energy,LIE)方法、自由能微扰(Free Energy Perturbation,FEP)和热力学积分(Thermodynamic Integration,TI)方法等。
分子力学/泊松-玻尔兹曼(广义波恩)表面积方法(MM/PB(GB)SA)是Kollman等人基于MD模拟轨迹发展的分子力学结合连续性溶剂模型的分子结合能计算方法,该方法很好的平衡了计算精度和计算成本,被广泛应用于蛋白-配体分子结合能的计算中;自由能微扰计算方法(FEP)也被称为“炼金术”算法,最早由Kirkwood等人于1935年提出,是评估药物小分子和靶点蛋白结合强度的一种高精度方法,也是业界公认的精度最高的分子结合能计算方法。
上述计算方法都是基于打分函数的自由能预测,具有运算简便,计算速度快和资源需求少等特点,常用于数以万计的配体药物的虚拟筛选中。但是简单的经验性打分函数结果一般是不可靠的,具有较大误差,通过虚拟筛选得到的打分较高的配体往往需要进行后续基于动力学模拟的结合能评估。
MMPB(GB)SA方法已被证明可以有效的平衡计算成本和准确性,计算误差约10kcal/mol,速度介于打分函数和FEP之间,是近千个配体分子筛选的不错选择。由于该方法在熵的计算上存在近似且没有考虑各个能量项之间的耦合,计算结果往往高于实验预测的结合亲和力。
FEP方法理论基础严格,计算误差范围小于1kcal/mol,结果和实验符合良好。但是由于需要对研究体系的各个状态进行大量的样本采集,计算资源消耗很大;另外,该方法对计算体系有比较严格的限制,只适合计算结构差别较小的体系,而不适用于结构差别较大的体系。虽然GPU显著提高了FEP的计算效率,但是由于计算量巨大,该方法仍然不适合进行大量复合物结合自由能的计算。
综上可见,当前结合能计算的主流方法较强地依赖于分子力场。而分子力场作为一种经典框架,只能在一定程度上间接地反映分子微观的量子性质。随着应用场景中对计算精度的要求越来越高,上述这些算法已经不能直接地对分子体系的微观量子行为进行更直接的刻画,并在此基础上直接进行结合能的计算,计算效率低下。
发明内容
本发明旨在解决现有技术的缺陷,提供一种基于量子计算的结合能综合计算方法。本发明具有更好的扩展性,以及更高的计算效率。
本发明的技术方案是这样实现的,一种基于量子计算的结合能综合计算方法,包括下列步骤:
步骤一,利用分子对接或分子动力学模拟确定化合物分子与蛋白质的复合构象;
步骤二,将蛋白质抽象为一组环境电荷;
步骤三,在存在环境电荷情况下对整个化合物进行Hartree-Fock求解;
步骤四,将化合物进行分块,抽取跟蛋白质结合紧密相关的片段;
步骤五,利用步骤三中得到的Hartree-Fock解,得到与选取片段相纠缠的槽轨道,以及片段哈密顿量;
步骤六,对化合物片段进行高精度求解,选择CCSD(T)经典算法,或者VQE量子算法;
步骤七,将步骤三和与步骤六的计算结果进行匹配,达到自洽即综合步骤三与步骤六的结果可得到系统能量,并进一步得出结合能。
所述的一种基于量子计算的结合能综合计算方法,所述步骤四包括,对所述化合分块,抽取跟蛋白质结合紧密相关的片段包括:蛋白质部分、化合物和结合部位。
所述的一种基于量子计算的结合能综合计算方法,所述步骤六包括,对选定的化合物片段的薛定谔方程进行高精度求解,针对不同的片段大小,相应的精度需求,以及可用的计算资源,选择算法。
所述的一种基于量子计算的结合能综合计算方法,所述VQE量子算法即变分量子本征求解器,它利用量子与经典计算机的分工合作,是一种混合量子-经典算法以缩短量子电路的深度并减少门数目。
本发明直接把量子化学特别是基于波函数的计算方法直接应用到分子体系中,即主要考虑蛋白质与配体化合物的结合能,先通过求解整个复合体系的薛定谔方程,得到基态及基态能量;再将基态能量减去蛋白质以及化合物自身的能量,得到结合能。提高了计算效率。
本发明通过经典计算的引入,VQE算法大大简化了量子电路。VQE不再像相位估计算法那样需要多次将哈密顿算符/演化算符编码进电路中,只需要对哈密顿算符的单项做计算即可。因此,VQE算法可以在当前的量子计算硬件上有效运行,得到相应化学体系的基态和基态能量。
本发明利用量子计算来获得结合能,实际上是在量子计算机的协助下,通过直接求解量子化学体系的薛定谔方程来得到相应的能量。这是一种完全从底层的基本原理出发的计算方案,充分地体现了物理学与化学、化学与生物学之间的深层联系,符合大自然的基本规律。跟目前广泛采用的其他计算方案相比,这一计算思路具有以下优越性:
理论基础坚实,物理图像清晰:
目前普遍使用的结合能方法都或多或少地依赖分子力场,而分子力场只是对分子体系性质的一种经典近似。本方案直接从薛定谔方程出发,通过对体系量子性质的直接描述来导出体系的宏观性质,具有更加坚实的理论基础,也能更直接地刻画微观量子行为对宏观性质的影响。
应用范围广泛:
当前的许多计算方案都有一定的局限性。本方案则较为灵活,可以自动地将系统的各种因素和过程纳入进来,并根据影响的大小分别进行处理。
具有很好的扩展性:
尽管当前受量子硬件规模和性能的限制,我们能精确处理的体系还比较小,比如局限在化合物的某个片段上。但是随着量子硬件规模的扩大和性能的大幅提升,我们可以很快扩大高精度计算的体系范围。同时经典计算能力的进一步提高也会有助于我们计算规模的扩大。
附图说明
下面结合附图对本发明作进一步的说明:
图1是所述VQE算法的协同方式示意图。
图2是Mpro与抑制剂双嘧达莫形成的复合物示意图
图3是双嘧达莫结构示意图。
具体实施方式
下面,结合实施例对本发明做进一步的说明,
参见图1,本发明一种基于量子计算的结合能综合计算方法,包括下列步骤:
步骤一,利用分子对接或分子动力学模拟确定化合物分子与蛋白质的复合构象;
步骤二,将蛋白质抽象为一组环境电荷;
步骤三,在存在环境电荷情况下对整个化合物进行Hartree-Fock求解;
步骤四,将化合物进行分块,抽取跟蛋白质结合紧密相关的片段;
步骤五,利用步骤三中得到的Hartree-Fock解,得到与选取片段相纠缠的槽轨道,以及片段哈密顿量;
步骤六,对化合物片段进行高精度求解,选择CCSD(T)经典算法,或者VQE量子算法;
步骤七,将步骤三和与步骤六的计算结果进行匹配,达到自洽即综合步骤三与步骤六的结果可得到系统能量,并进一步得出结合能。
所述的一种基于量子计算的结合能综合计算方法,所述步骤四包括,对所述化合物分块,抽取与蛋白质结合紧密相关的片段,包括:蛋白质部分、化合物和结合部位。
所述的一种基于量子计算的结合能综合计算方法,所述步骤六包括,对选定的化合物片段的薛定谔方程进行高精度求解,针对不同的片段大小,相应的精度需求,以及可用的计算资源,选择算法。
所述的一种基于量子计算的结合能综合计算方法,所述VQE量子算法即变分量子本征求解器,它利用量子与经典计算机的分工合作,是一种混合量子-经典算法以缩短量子电路的深度并减少门数目。
实施例
新冠病毒SARS-CoV-2主蛋白酶Mpro与抑制剂的结合。Mpro作为一种酶,可以催化新冠病毒多聚蛋白向单蛋白的分裂,而这是病毒复制过程所必需的。因此Mpro可以用作新冠病毒药物设计的靶标。Mpro与抑制剂双嘧达莫(Dipyridamole)形成的复合物构象如图2,所述Dipyridamole的结构式如图3。
从复合物构象出发,一个初步的判断是,这里的四个羟基在与Mpro的结合中起着比较重要的作用。因此,我们可以将四个羟基分离出来,采用高精度经典计算或者量子计算,而对整个Dipyridamole采用低精度的Hartree-Fock计算。利用量子纠缠将二者结果综合起来,可得出Dipyridamole与Mpro的结合能。Mpro的其它抑制剂可用类似思路处理。

Claims (4)

1.一种基于量子计算的结合能综合计算方法,其特征在于,包括下列步骤:
步骤一,利用分子对接或分子动力学模拟确定化合物分子与蛋白质的复合构象;
步骤二,将蛋白质抽象为一组环境电荷;
步骤三,在存在环境电荷情况下对整个化合物进行Hartree-Fock求解;
步骤四,将化合物进行分块,抽取跟蛋白质结合紧密相关的片段;
步骤五,利用步骤三中得到的Hartree-Fock解,得到与选取片段相纠缠的槽轨道,以及片段哈密顿量;
步骤六,对化合物片段进行高精度求解,选择CCSD(T)经典算法,或者VQE量子算法;
步骤七,将步骤三与步骤六的计算结果进行匹配,达到自洽即综合步骤三与步骤六的结果可得到系统能量,并进一步得出结合能。
2.根据权利要求1所述的一种基于量子计算的结合能综合计算方法,其特征在于,所述步骤四包括,对所述化合物分块,抽取跟蛋白质结合紧密相关的片段包括:蛋白质部分、化合物和结合部位。
3.根据权利要求1所述的一种基于量子计算的结合能综合计算方法,其特征在于,所述步骤六包括,对选定的化合物片段的薛定谔方程进行高精度求解,针对不同的片段大小,相应的精度需求,以及可用的计算资源,选择算法。
4.根据权利要求1所述的一种基于量子计算的结合能综合计算方法,其特征在于,所述VQE量子算法即变分量子本征求解器,它利用量子与经典计算机的分工合作,是一种混合量子-经典算法以缩短量子电路的深度并减少门数目。
CN202211298587.XA 2022-10-24 2022-10-24 一种基于量子计算的分子结合能综合计算方法 Active CN117079738B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202211298587.XA CN117079738B (zh) 2022-10-24 2022-10-24 一种基于量子计算的分子结合能综合计算方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202211298587.XA CN117079738B (zh) 2022-10-24 2022-10-24 一种基于量子计算的分子结合能综合计算方法

Publications (2)

Publication Number Publication Date
CN117079738A CN117079738A (zh) 2023-11-17
CN117079738B true CN117079738B (zh) 2024-07-09

Family

ID=88708554

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202211298587.XA Active CN117079738B (zh) 2022-10-24 2022-10-24 一种基于量子计算的分子结合能综合计算方法

Country Status (1)

Country Link
CN (1) CN117079738B (zh)

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114127856A (zh) * 2019-05-13 2022-03-01 1Qb信息技术公司 用于量子计算使能的分子从头算模拟的方法和系统

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7739091B2 (en) * 2006-03-23 2010-06-15 The Research Foundation Of State University Of New York Method for estimating protein-protein binding affinities
CN107004064B (zh) * 2014-09-30 2020-09-29 国立大学法人大阪大学 自由能计算装置、方法、程序、以及记录有该程序的记录介质
US10984152B2 (en) * 2016-09-30 2021-04-20 Rigetti & Co, Inc. Simulating quantum systems with quantum computation
CN110400598B (zh) * 2019-07-03 2023-07-11 江苏理工学院 基于mm/pbsa模型的蛋白质-配体结合自由能计算方法
CN111599414B (zh) * 2020-03-25 2022-05-06 清华大学 一种基于量子计算机的全量子分子模拟方法
US20220284337A1 (en) * 2021-03-05 2022-09-08 Zapata Computing, Inc. Classically-boosted variational quantum eigensolver

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114127856A (zh) * 2019-05-13 2022-03-01 1Qb信息技术公司 用于量子计算使能的分子从头算模拟的方法和系统

Also Published As

Publication number Publication date
CN117079738A (zh) 2023-11-17

Similar Documents

Publication Publication Date Title
Pauwels et al. Predicting drug side-effect profiles: a chemical fragment-based approach
Zhao et al. Imbalance learning for the prediction of N 6-Methylation sites in mRNAs
Kryshtafovych et al. Protein structure prediction and model quality assessment
CN110400598B (zh) 基于mm/pbsa模型的蛋白质-配体结合自由能计算方法
Stahl et al. EPSILON-CP: using deep learning to combine information from multiple sources for protein contact prediction
Olson et al. In search of the protein native state with a probabilistic sampling approach
López et al. Clinical proteomics and OMICS clues useful in translational medicine research
Banach et al. Ligand-binding-site recognition
Ovek et al. Artificial intelligence based methods for hot spot prediction
CN114678082A (zh) 一种计算机辅助虚拟高通量筛选算法
Gao et al. bSiteFinder, an improved protein-binding sites prediction server based on structural alignment: more accurate and less time-consuming
Ding et al. Computational prediction of DNA-protein interactions: a review
CN117079738B (zh) 一种基于量子计算的分子结合能综合计算方法
Ge et al. Inter-domain distance prediction based on deep learning for domain assembly
Wickramarachchi et al. Metagenomics binning of long reads using read-overlap graphs
JP2016527481A5 (zh)
Shubina et al. Reliability of virtual screening methods in prediction of PDE4Binhibitor activity
Olson et al. Enhancing sampling of the conformational space near the protein native state
Branduardi et al. Atomic‐resolution dissection of the energetics and mechanism of isomerization of hydrated ATP‐M g2+ through the SOMA string method
Wiktorowicz et al. Introduction to clinical proteomics
Fang et al. Discover protein sequence signatures from protein-protein interaction data
Abdel-Rehim et al. Beating the best: improving on AlphaFold2 at protein structure prediction
Jadczyk et al. Examining protein folding process simulation and searching for common structure motifs in a protein family as experiments in the gridspace2 virtual laboratory
Ma et al. A novel method to predict protein-protein interactions based on the information of protein-protein interaction networks and protein sequence
Mungmunpuntipantip et al. Bioinformatics approach for searching for natural products in vector-borne disease management.

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
CB02 Change of applicant information

Address after: Room 220, Embedded R&D Building, Advanced Technology Research Institute, University of Science and Technology of China, No. 5089 Wangjiang West Road, High tech Zone, Hefei City, Anhui Province, 230000

Applicant after: Hefei Micro Era Digital Technology Co.,Ltd.

Address before: 201306 building C, No. 888, Huanhu West 2nd Road, Lingang New Area, Pudong New Area, Shanghai

Applicant before: Shanghai Micro Era Digital Technology Co.,Ltd.

CB02 Change of applicant information
GR01 Patent grant
GR01 Patent grant