CN116597917A - 一种基于光量子计算机的分子对接方法和装置 - Google Patents
一种基于光量子计算机的分子对接方法和装置 Download PDFInfo
- Publication number
- CN116597917A CN116597917A CN202310882617.XA CN202310882617A CN116597917A CN 116597917 A CN116597917 A CN 116597917A CN 202310882617 A CN202310882617 A CN 202310882617A CN 116597917 A CN116597917 A CN 116597917A
- Authority
- CN
- China
- Prior art keywords
- ligand
- receptor
- grid
- docking
- atom
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000003032 molecular docking Methods 0.000 title claims abstract description 71
- 238000000034 method Methods 0.000 title claims abstract description 60
- 239000003446 ligand Substances 0.000 claims abstract description 150
- 238000005457 optimization Methods 0.000 claims abstract description 38
- 238000010586 diagram Methods 0.000 claims abstract description 28
- 210000001503 joint Anatomy 0.000 claims abstract description 25
- 230000001427 coherent effect Effects 0.000 claims abstract description 11
- 102000005962 receptors Human genes 0.000 claims description 111
- 108020003175 receptors Proteins 0.000 claims description 111
- 230000003287 optical effect Effects 0.000 claims description 19
- 230000008569 process Effects 0.000 claims description 19
- 238000006243 chemical reaction Methods 0.000 claims description 9
- 230000000694 effects Effects 0.000 claims description 5
- 238000010276 construction Methods 0.000 claims description 4
- 230000008878 coupling Effects 0.000 claims description 4
- 238000010168 coupling process Methods 0.000 claims description 4
- 238000005859 coupling reaction Methods 0.000 claims description 4
- 239000000243 solution Substances 0.000 abstract description 21
- 239000003814 drug Substances 0.000 abstract description 14
- 102000004169 proteins and genes Human genes 0.000 abstract description 11
- 108090000623 proteins and genes Proteins 0.000 abstract description 11
- 238000004422 calculation algorithm Methods 0.000 abstract description 5
- 229940079593 drug Drugs 0.000 abstract description 4
- 238000009510 drug design Methods 0.000 abstract description 4
- 238000000302 molecular modelling Methods 0.000 abstract description 2
- 239000012086 standard solution Substances 0.000 abstract description 2
- 230000001133 acceleration Effects 0.000 abstract 1
- 125000004429 atom Chemical group 0.000 description 45
- 230000006872 improvement Effects 0.000 description 7
- 150000003384 small molecules Chemical class 0.000 description 7
- 238000012827 research and development Methods 0.000 description 5
- 238000007877 drug screening Methods 0.000 description 4
- 230000006870 function Effects 0.000 description 4
- 150000002611 lead compounds Chemical class 0.000 description 4
- 230000005366 Ising model Effects 0.000 description 3
- 239000011159 matrix material Substances 0.000 description 3
- 238000012900 molecular simulation Methods 0.000 description 3
- 230000009466 transformation Effects 0.000 description 3
- 230000009286 beneficial effect Effects 0.000 description 2
- 238000004364 calculation method Methods 0.000 description 2
- 238000011161 development Methods 0.000 description 2
- 238000009509 drug development Methods 0.000 description 2
- 230000005283 ground state Effects 0.000 description 2
- 230000003993 interaction Effects 0.000 description 2
- 238000013178 mathematical model Methods 0.000 description 2
- 239000002096 quantum dot Substances 0.000 description 2
- 238000010845 search algorithm Methods 0.000 description 2
- 230000009897 systematic effect Effects 0.000 description 2
- 238000012360 testing method Methods 0.000 description 2
- 238000012549 training Methods 0.000 description 2
- 102000012440 Acetylcholinesterase Human genes 0.000 description 1
- 108010022752 Acetylcholinesterase Proteins 0.000 description 1
- OKTJSMMVPCPJKN-UHFFFAOYSA-N Carbon Chemical compound [C] OKTJSMMVPCPJKN-UHFFFAOYSA-N 0.000 description 1
- 108010016183 Human immunodeficiency virus 1 p16 protease Proteins 0.000 description 1
- 108090000190 Thrombin Proteins 0.000 description 1
- 102000003990 Urokinase-type plasminogen activator Human genes 0.000 description 1
- 108090000435 Urokinase-type plasminogen activator Proteins 0.000 description 1
- 238000005411 Van der Waals force Methods 0.000 description 1
- 229940022698 acetylcholinesterase Drugs 0.000 description 1
- QVGXLLKOCUKJST-UHFFFAOYSA-N atomic oxygen Chemical compound [O] QVGXLLKOCUKJST-UHFFFAOYSA-N 0.000 description 1
- 229910052799 carbon Inorganic materials 0.000 description 1
- 238000004590 computer program Methods 0.000 description 1
- 239000013078 crystal Substances 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000012362 drug development process Methods 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 238000004880 explosion Methods 0.000 description 1
- 230000004907 flux Effects 0.000 description 1
- 229910052739 hydrogen Inorganic materials 0.000 description 1
- 239000001257 hydrogen Substances 0.000 description 1
- 125000004435 hydrogen atom Chemical class [H]* 0.000 description 1
- 239000000203 mixture Substances 0.000 description 1
- 239000002547 new drug Substances 0.000 description 1
- 229910052760 oxygen Inorganic materials 0.000 description 1
- 239000001301 oxygen Substances 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 238000012216 screening Methods 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 229960004072 thrombin Drugs 0.000 description 1
- 229940043263 traditional drug Drugs 0.000 description 1
- 238000012795 verification Methods 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16C—COMPUTATIONAL CHEMISTRY; CHEMOINFORMATICS; COMPUTATIONAL MATERIALS SCIENCE
- G16C20/00—Chemoinformatics, i.e. ICT specially adapted for the handling of physicochemical or structural data of chemical particles, elements, compounds or mixtures
- G16C20/50—Molecular design, e.g. of drugs
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N10/00—Quantum computing, i.e. information processing based on quantum-mechanical phenomena
- G06N10/20—Models of quantum computing, e.g. quantum circuits or universal quantum computers
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Computing Systems (AREA)
- General Physics & Mathematics (AREA)
- Chemical & Material Sciences (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Artificial Intelligence (AREA)
- Evolutionary Computation (AREA)
- Crystallography & Structural Chemistry (AREA)
- Life Sciences & Earth Sciences (AREA)
- Bioinformatics & Computational Biology (AREA)
- Pharmacology & Pharmacy (AREA)
- Medicinal Chemistry (AREA)
- General Health & Medical Sciences (AREA)
- Computational Mathematics (AREA)
- Condensed Matter Physics & Semiconductors (AREA)
- Data Mining & Analysis (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Health & Medical Sciences (AREA)
- Mathematical Analysis (AREA)
- Mathematical Optimization (AREA)
- Pure & Applied Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
- Peptides Or Proteins (AREA)
Abstract
本发明涉及一种基于光量子计算机的分子对接方法和装置,属于药物设计技术领域,解决启发式算法消耗时间长但无法得出标准解的问题。方法包括:将配体的二维分子结构图转换为三维分子结构图;基于配体和受体的三维分子结构图构建受体靶点内部的对接盒网格点以对配体原子与受体网格点进行最佳匹配;将求解配体原子与受体网格点的最佳匹配问题转化为寻找最大加权团;根据最大加权团建立二次无约束二值优化模型,通过二次无约束二值优化模型计算在几何限制下受体与配体之间的最强结合亲和力;利用相干伊辛机获取二次无约束二值优化模型的最优解。使用伊辛模型求解分子模拟问题更为快速和准确。使用量子计算机加速可以快速计算药物和蛋白的亲和力。
Description
技术领域
本发明涉及药物设计技术领域,尤其涉及一种基于光量子计算机的分子对接方法和装置。
背景技术
传统的药物筛选是一个十分昂贵且需要消耗大量资源的过程,一般需要花费数十亿美元,而成功率则越10%。近年来,随着功能强大的分子建模工具的发展以及蛋白质小分子复合物解析结构的数目的增长,基于结构的药物设计成为新药开发中必不可少的工具。分子对接研究的重点是通过计算模拟分子识别过程。该识别过程旨在模拟蛋白质和配体之间的最佳构象,使整个系统的自由能最小化是药物筛选前期过程中的十分重要的一个环节,借助分子对接可以加快药物研发进程。
在制药领域的传统模型的筛选方式大多数采用启发式算法以及系统搜索算法,耗时长,且可能无法计算出最优解,在药物研发过程中假阳性居高。其缺点如下:
(1)使用启发式算法:需要大量的时间来进行迭代,有可能无法求出最优解,计算量大。
(2)使用系统搜索算法则可能面临组合爆炸的问题,传统计算机处理此类问题的能力较弱。
传统模型需要大量的采样才可以拿到一个能量较低的构象,且此构象有可能并非全局最优解。
发明内容
鉴于上述的分析,本发明实施例旨在提供一种基于光量子计算机的分子对接方法和装置,用以解决启发式算法消耗时间长但无法得出标准解等问题。
一方面,本发明实施例提供了一种基于光量子计算机的分子对接方法,包括:将配体的二维分子结构图转换为三维分子结构图;基于配体和受体的三维分子结构图构建受体靶点内部的对接盒网格点以对配体原子与受体网格点进行最佳匹配;将求解所述配体原子与所述受体网格点的最佳匹配问题转化为寻找最大加权团;根据所述最大加权团建立二次无约束二值优化模型,其中,通过所述二次无约束二值优化模型计算在几何限制下受体与配体之间的最强结合亲和力;以及利用相干伊辛机获取所述二次无约束二值优化模型的最优解。
上述技术方案的有益效果如下:根据本申请实施例的基于光量子计算机的分子对接方法使用伊辛模型求解分子模拟问题的方法更为快速和准确。使用量子计算机进行加速,可以快速的计算药物和蛋白的亲和力,帮助研究人员筛选出潜在的先导化合物,助力药物研发过程。
基于上述方法的进一步改进,基于配体和受体的三维分子结构图构建受体靶点内部的对接盒网格点以对配体原子与受体网格点进行最佳匹配包括:根据配体大小在受体结构空间上构建连续的对接盒;在网格点匹配过程中,将所述受体的对接盒离散为等距的网格点;将配体的每个原子放置在一个网格点上以将所述配体的每个原子与受体网格点进行匹配;以及通过将匹配结果与最佳匹配结果之间的差值最小化实现受体与配体的对接姿势。
基于上述方法的进一步改进,通过将匹配结果与最佳匹配结果的之间的差值最小化实现受体与配体的对接姿势包括通过以下公式表示所述配体与所述受体的对接姿势:;
其中,R表示所述受体与所述配体的一种可能匹配,R grid 表示所述受体与所述配体的最佳匹配,‖R-R grid ‖是所述可能匹配与所述最佳匹配的差值距离,表示在所有匹配中选择一个可能匹配使得所述差值距离最小化。
基于上述方法的进一步改进,对配体原子与受体网格点进行最佳匹配包括当满足以下约束项1和约束项2时,确定两个顶点的匹配共存,链接所述两个顶点:所述约束项1:受体对接盒网格点与配体原子之间的距离偏差小于可调阈值参数;以及所述约束项2:一个配体原子仅与一个网格点匹配,其中,每个顶点表示一个可能的匹配。
基于上述方法的进一步改进,受体对接盒网格点与配体原子之间的距离偏差小于可调阈值参数包括:对于顶点集V中的两个顶点(a i ,p j )和(a k ,p l ),当满足以下两个约束时对所述两个顶点加边:|‖r i -r k ‖-‖pr j -pr l ‖|<c dist , 其中,c dist 为可调阈值参数,双竖线表示距离,单竖线表示绝对值,所述约束1表示当相对距离与配体形状协调时,两种匹配共存;以及一个配体原子仅与一个网格点匹配包括:p j ≠p l ,使得一个配体原子与一个网格点匹配;其中,A={a i }为配体中的原子集合,t i 和r i 分别为原子a i 的类型和坐标,P={p i }为对接盒网格点集合,p i 的坐标是pr i ,顶点集V={(a i ,p j )|Van(t i ,p j )<0},Van(t i ,p j )是原子类型t i 放置在网格点d i 上时的范德华瓦尔斯能量,每个顶点表示一个可能的匹配。
基于上述方法的进一步改进,根据所述最大加权团建立二次无约束二值优化模型,其中,通过所述二次无约束二值优化模型计算在几何限制下受体与配体之间的最强结合亲和力包括通过以下公式计算能量点以获得打分函数:
;
其中,为决策变量,取值为{0,1},表示原子a i 是否放在网格顶点d j 的位置,如果是则为1,否则为0;/>为顶点(a i ,d j )的权重,公式中的第二项和第三项分别对应约束项1和约束项2, 其中K dist 、K mono 分别为两项的惩罚系数;公式中的第一项意味着加权顶点越多越好,如果(a i ,d j )和(a k ,d l )符合约束项1,则/>,否则,类似地,如果(a i ,d j )和(a k ,d l )符合约束项2, 则/>,否则,/>,K dist 、K mono 和C dist 为三个可调参数。
基于上述方法的进一步改进,利用相干伊辛机获取所述二次无约束二值优化模块的最优解包括:将所述二次无约束二值优化模块转换为伊辛模型;将所述伊辛模型编码成一组光学脉冲的幅值和相位;利用干涉效应将不同自旋之间的耦合关系传递给光学干涉;以及使用非线性光学效应将光脉冲转换为对应自旋的取值以获得所述二次无约束二值优化模块的最优解。
另一方面,本发明实施例提供了一种基于光量子计算机的分子对接装置,包括:分子结构转换模块,用于将配体的二维分子结构图转换为三维分子结构图;匹配模块,用于基于配体和受体的三维分子结构图构建受体靶点内部的对接盒网格点以对配体原子与受体网格点进行最佳匹配;问题转换模块,用于将求解所述配体原子与所述受体网格点的最佳匹配问题转化为寻找最大加权团;模型生成模块,用于根据所述最大加权团问题建立二次无约束二值优化模型,其中,通过所述二次无约束二值优化模型计算在几何限制下受体与配体之间的最强结合亲和力;以及模型求解模块,用于利用相干伊辛机获取所述二次无约束二值优化模块的最优解。
基于上述装置的进一步改进,匹配模块用于:对接网格盒构建子模块,用于根据配体大小在受体结构空间上构建连续的对接盒;离散子模块,用于在网格点匹配过程中,将所述受体的对接盒离散为等距的网格点;受配体匹配子模块,用于将配体的每个原子放置在一个网格点上以将所述配体的每个原子与受体网格点进行匹配;以及对接子模块,用于通过将匹配结果与最佳匹配结果之间的差值最小化实现受体与配体的对接姿势。
基于上述装置的进一步改进,对接子模块用于通过以下公式表示所述配体与所述受体的对接姿势:
;
其中,R表示所述受体与所述配体的一种可能匹配,R grid 表示所述受体与所述配体的最佳匹配,‖R-R grid ‖是所述可能匹配与所述最佳匹配的差值距离,表示在所有匹配中选择一个可能匹配使得所述差值距离最小化。
与现有技术相比,本发明至少可实现如下有益效果之一:
1、根据本申请实施例的基于光量子计算机的分子对接方法使用伊辛模型求解分子模拟问题的方法更为快速和准确。
2、使用量子计算机进行加速,可以快速的计算药物和蛋白的亲和力,帮助研究人员筛选出潜在的先导化合物,助力药物研发过程。
3、本申请利用量子计算机的纠缠态和重叠态以及全联接的特性,提出了一个更为优秀的求解分子结合模式的模型,并将其放置于web端以进行展示,供给用户使用。
本发明中,上述各技术方案之间还可以相互组合,以实现更多的优选组合方案。本发明的其他特征和优点将在随后的说明书中阐述,并且,部分优点可从说明书中变得显而易见,或者通过实施本发明而了解。本发明的目的和其他优点可通过说明书以及附图中所特别指出的内容中来实现和获得。
附图说明
附图仅用于示出具体实施例的目的,而并不认为是对本发明的限制,在整个附图中,相同的参考符号表示相同的部件;
图1为根据本发明实施例的基于光量子计算机的分子对接方法的流程图;
图2A为根据本发明的第一实施例的小分子配体和受体的不同维度结构展示;
图2B为根据本发明的第二实施例的小分子配体和受体的不同维度结构展示;
图2C为根据本发明的第三实施例的小分子配体和受体的不同维度结构展示;
图2D为根据本发明的第四实施例的小分子配体和受体的不同维度结构展示;
图3为根据本发明实施例的受体网格盒点与配体原子匹配示意图;
图4为根据本发明实施例的求解受配体最佳匹配转换为求最大团问题示图;
图5为根据本发明实施例的最大图问题示图中的两个顶点添加边的约束项示意图;
图6为根据本发明实施例的基于光量子计算机的分子对接方法的整体流程图;
图7为根据本发明实施例的基于光量子计算机的分子对接装置的框图。
具体实施方式
下面结合附图来具体描述本发明的优选实施例,其中,附图构成本申请一部分,并与本发明的实施例一起用于阐释本发明的原理,并非用于限定本发明的范围。
参考图1,本发明的一个具体实施例,公开了一种基于光量子计算机的分子对接方法包括:在步骤S101中,将配体的二维分子结构图转换为三维分子结构图。在具体实施例中,图2A示出了配体(C13H11N3)的二维结构、三维结构和受体(凝血酶α)的三维结构。图2B示出了配体(C7H9N2)的二维结构、三维结构和受体(尿激酶型纤溶酶原激活剂)的三维结构。图2C示出了配体(C18H19ClN2)的二维结构、三维结构和受体(乙酰胆碱酯酶)的三维结构。图2D示出了配体(C38H40N2O8)的二维结构、三维结构和受体(HIV-1蛋白酶)的三维结构。
在步骤S102中,基于配体和受体的三维分子结构图构建受体靶点内部的对接盒网格点以对配体原子与受体网格点进行最佳匹配。参考图3,基于配体和受体的三维分子结构图构建受体靶点内部的对接盒网格点以对配体原子与受体网格点进行最佳匹配包括:根据配体大小在受体结构空间上构建连续的对接盒并将对接盒离散为等距的网格点;在网格点匹配过程中,将受体的对接盒网格点离散为等距的网格点;将配体的每个原子放置在一个网格点上以将配体的每个原子与受体网格点进行匹配;以及通过将匹配结果与最佳匹配结果之间的差值最小化实现受体与配体的对接姿势。
通过将匹配结果与最佳匹配结果的之间的差值最小化实现受体与配体的对接姿势包括通过以下公式表示配体与受体的对接姿势:
;
其中,R表示所述受体与所述配体的一种可能匹配,R grid 表示受体与配体的最佳匹配,‖R-R grid ‖是所述可能匹配与最佳匹配的差值距离,表示在所有匹配中选择一个可能匹配使得差值距离最小化。
参考图4,对配体原子与受体网格点进行最佳匹配包括当满足以下约束项1和约束项2时,确定两个顶点的匹配共存,链接两个顶点,进行匹配:约束项1:受体对接盒网格点与配体原子之间的距离偏差小于可调阈值参数;以及约束项2:一个配体原子仅与一个网格点匹配,其中,每个顶点表示一个可能的匹配。
约束项1:受体对接盒网格点与配体原子之间的距离偏差小于可调阈值参数包括对于顶点集V中的两个顶点(a i ,p j )和(a k ,p l ),当满足以下两个约束时对两个顶点加边:
|‖r i -r k ‖-‖pr j -pr l ‖|<c dist ,
其中,c dist 为可调阈值参数,双竖线表示距离,单竖线表示绝对值,约束1表示当相对距离与配体形状协调时,两种匹配共存。A={a i }为配体中的原子集合,t i 和r i 分别为原子a i 的类型和坐标,P={p i }为对接盒网格点,p i 的坐标是pr i ,顶点集V={(a i ,p j )|Van(t i ,p j )<0},Van(t i ,p j )是原子类型t i 放置在网格点d i 上时的范德华瓦尔斯能量,每个顶点表示一个可能的匹配。约束项2:一个配体原子仅与一个网格点匹配包括:p j ≠p l ,使得一个配体原子与一个网格点匹配。
在步骤S103中,将求解配体原子与受体网格点的最佳匹配问题转化为寻找最大加权团的问题。求解受配体网格点最佳匹配转化为了寻找G(V,E)的最大权重团,以便在几何限制下找到更多更强的蛋白质-配体相互作用。
在步骤S104中,根据最大加权团建立二次无约束二值优化模型,其中,通过二次无约束二值优化模型计算在几何限制下受体与配体之间的最强结合亲和力。根据最大加权团建立二次无约束二值优化模型,其中,通过二次无约束二值优化模型计算在几何限制下受体与配体之间的最强结合亲和力包括通过以下公式计算能量点以获得打分函数:
;
其中,为决策变量,取值为{0,1},表示原子a i 是否放在网格顶点d j 的位置,如果是则为1,否则为0;/>为顶点(a i ,d j )的权重,公式中的第二项和第三项分别对应约束项1和约束项2, 其中K dist 、K mono 分别为两项的惩罚系数;公式中的第一项意味着加权顶点越多越好,如果(a i ,d j )和(a k ,d l )符合约束项1,则/>,否则,类似地,如果(a i ,d j )和(a k ,d l )符合约束项2, 则/>,否则,/>,K dist 、K mono 和C dist 为三个可调参数。
在步骤S105中,利用相干伊辛机获取二次无约束二值优化模型的最优解。利用相干伊辛机获取二次无约束二值优化模块的最优解包括:将二次无约束二值优化模块转换为伊辛模型;将伊辛模型编码成一组光学脉冲的幅值和相位;利用干涉效应将不同自旋之间的耦合关系传递给光学干涉;以及使用非线性光学效应将光脉冲转换为对应自旋的取值以获得二次无约束二值优化模块的最优解。
与现有技术相比,本实施例提供的基于光量子计算机的分子对接方法使用伊辛模型求解分子模拟问题的方法更为快速和准确。使用量子计算机进行加速,可以快速的计算药物和蛋白的亲和力,帮助研究人员筛选出潜在的先导化合物,助力药物研发过程。
下文中,参考图2A至图6以具体实例的方式对根据本发明实施例的基于光量子计算机的分子对接方法进行详细说明。
分子对接:其基于配体受体识别的锁钥模型提出的,通过计算配体受体之间的空间互补以及能量匹配来寻找其复合物模式,其在药物设计领域应用广泛,可分为刚性对接,半柔性对接以及柔性对接。
可用于药物研发的基于光量子计算机的分子对接方法。可以高通量的筛选巨量的药物库,使用者输入分子结构和蛋白结构,服务器便可以计算其亲和力,返回给使用者,加速药物研发过程。本申请使用光量子计算机将药物筛选过程中重要的分子对接问题转化为QUBO模型将分子三维模型转化为数学中的图,使用图的形式来表示配体与受体,通过数学建模来通过QUBO模型实现对配体受体结合模式的预测以及评价其亲和力。使用者可以上传不同的小分子和蛋白结构,后续服务器会对其进行转化,并通过光量子计算机给出最优计算结果,展示三维模型给使用者。对于药物筛选问题,与传统计算机相比,光量子计算机可以更快的给出结果,并且其结果更加准确。
1、分子展示
首先进行分子展示,本发明获取的分子三维结构均来自Protein Data Bank, PDB数据库(采用晶体结构或者能量最小化之后的结构),图2A、图2B、图2C和图2D示出了四个受配体的二维和三维结构,随后将分子的3D结构简化为数学中图的形式:简化后的结构显示为距离矩阵/边有权重的图。
2、构建受体靶点内部的对接网格盒(GridBox)点
参考图3,首先需要根据配体的大小在受体结构空间上构建连续的对接盒,在Grid点匹配中,首先将受体对接盒离散为间距为2Å 的网格点,然后将配体的每个原子放在一个网格点上,即将配体的每个原子与受体网格点匹配。真正的对接姿势为:
;
其中R是所有解空间中的任意解,R grid 对应于最佳匹配,‖R-R grid ‖是解R与最佳匹配的差值距离,通过最小化解R与最佳匹配的差值来实现真正的对接姿势。这种最小化可以通过Kabsch RMSD旋转矩阵实现(Prody)。上述受体靶点内部的对接盒网格点由ADFR包中的AutoGrid生成。
3、将求解受配体最佳匹配转化为求最大团问题(Maximum Clique Problem, MCP)
在网格点匹配求解问题中,配体中的所有原子组成的集合为A={a i },t i 和r i 是a i 的类型(比如氢原子、碳原子、氧原子)和坐标。所有对接盒中的方格点组成的结合为P={p i },方格中的顶点p i 对应的坐标是pr i 。在这里我们将求解受体和配体最佳匹配问题转化为一个求最大团问题(图4)。具体转化过程如下:给定一个图G(V,E)中,顶点集V={(a i ,p j )|Van(t i ,p j )<0},其中a i 表示配体原子,p j 表示受体离散化后的对接盒顶点,Van(t i ,p j )是原子a i 所对应的原子类型t i 放置在受体网格点d j 上时的范德华力,顶点(a i ,p j )的权重为。这里的每个顶点表示一个可能的匹配,其权重显示其对整个结合亲和力的贡献。对于V中的两个顶点(a i ,p j )和(a k ,p l ),当满足如下两个约束时为此两个顶点加边:约束1 为|‖r i -r k ‖-‖pr j -pr l ‖|<c dist , 这里c dist 为一个阈值,是一个可调参数,双竖线表示距离,单竖线表示绝对值,约束1表示当相对距离与配体形状协调时,两种匹配可以共存;约束2为p j ≠p l 时,表示一个原子只能与一个网格点匹配。基于上述描述,求解受配体网格点最佳匹配转化为了寻找G(V,E)的最大权重团,以便在几何限制下找到更多更强的蛋白质-配体相互作用。
4. 数学模型
完成上述过程后,我们最终构造一个权重在节点上的图(Graph)G(V,E)。3d姿势以及打分函数的信息存储在图的节点与边中。最大加权团问题是NP-Hard问题,传统计算机很难给出解决方案。在这里,我们将其转换为QUBO公式(公式1)。在图G(V,E)中,每个顶点表示一个可能的匹配。顶点的权重定义为配体原子和受体对接盒网格点其匹配对结合亲和力的贡献。只有当两个顶点的匹配可以共存时,才会为此两顶点加边,即连接这两个顶点,如图5所示。一方面,它们应该遵守几何限制,以保持配体的形状。空间点与配体原子之间的距离偏差应低于临界值c dist (约束1)。另一方面,配体原子只能与一个空间点匹配(约束2)。在上述定义之后,图的最大加权团表示在几何限制下蛋白质和配体之间的最强结合亲和力,也是一个良好的对接姿势。
图5是约束项的示意图,用意是判断构建的图G(V,E)中两点(a i ,p j )和(a k ,p l )间是否存在边。当满足以下两个约束时添加边:1. 如果(a i ,p j )与任意其他点(a k ,p l )距离与原本配体的a i 原子与a k 原子之间的距离小于阈值C dist 。2.i≠j,即一个原子不出现在多个格点d i ,若违反上述约束条件则两点的边不存在。将求解受配体的最佳匹配转化为求最大团问题结果,点点配对将在找到最大加权团后获得。我们使用Kabsch RMSD 旋转矩阵将原子坐标叠加到受体对接盒离散后的网格点上,然后产生最终的对接姿势。最后,我们可以将原子-原子对转换为3D坐标。并且可以计算能量点以获得最后的打分函数。
;
其中,为决策变量,取值为{0,1},表示原子a i 是否放在网格顶点d j 的位置,如果是则为1,否则为0;/>为顶点(a i ,d j )的权重。公式中的后面两项分别对应3中的两个约束项1和约束项2,其中K dist 、K mono 分别为两项的惩罚系数。第一项意味着加权顶点越多越好。如果(a i ,d j )和(a k ,d l )符合约束1,则/>,否则/>。类似地,如果(a i ,d j )和(a k ,d l )符合约束2, 则/>。否则,/>。K dist 、K mono 和C dist 是三个可调参数。
上述模型为一个二次无约束二值优化模型(Quadratic Unconstrained BinaryOptimization,QUBO),将该模型转换为Ising模型后可在伊辛相干伊辛机(coherent Isingmachine,CIM)上求解。在CIM中每个二进制变量都由一个量子比特的状态表示,而哈密尔顿对应于量子系统的能量。CIM 使用基于光学干涉的非线性光学效应来实现 QUBO 问题的求解。具体来说, QUBO 被问题转化为一个特殊的Ising模型,然后 CIM 将这个Ising模型编码成一组光学脉冲的幅度和相位,利用干涉效应将不同自旋之间的耦合关系传递给光学干涉。然后,使用非线性光学效应将光脉冲转换为对应自旋的取值,最终得到Ising模型的基态,即 QUBO 问题的最优解。它的优点是可以高效地处理大规模的 QUBO 问题,并且具有高度的并行性和快速的响应速度。因此,可以从量子比特的基态读取最佳解。
5、上述模型在CASF-2016 core set 数据集上的测试表现
基于上述的数学模型我们构建了一种受配体的匹配算法并利用CIM 量子计算机进行求解,通过在训练数据集上训练得到了模型的三个最优参数:Cdist = 2.565 ,K dist =2.337,K mono =39.530,接下来测试了在上述参数下模型在CASF-2016 core set 数据集上的表现,CASF-2016 core set是一个相对较小的高质量的蛋白质-配体复合物数据集,常用于验证对接方法。均方根偏差(Root Mean Square Deviation, RMSD)常用于衡量原子偏离比对位置的程度,通过计算此值可判断受配体原子位置匹配的好坏。经过测试发现上述方法共有257 个示例可以实现匹配,在成功配对的受配体集合中,75% 的受配体复合物RMSD 小于2 Å (表1),说明上述模型能够较好的实现受配体的匹配。
/>
/>
/>
/>
6、流程图
参考图6,在用户使用时,只需要输入筛选的药物库文件以及靶点蛋白结构文件,在用户端会展示其初始的配体结构以及受体结构,便于用户进行可视化的三维操作,随后在确定靶点范围之后,数据传输回服务器,服务器根据以上的参数构建QUBO模型传输给光量子计算机,并计算出最优解,整个过程在使用量子计算机情况下,时间消耗大大减少,并且用户可以在使用界面看到筛选出的结构模型以及打分。随后使用这些分子进行下一步实验验证,来获取先导化合物。
参考图7,本发明的另一个具体实施例,公开了一种基于光量子计算机的分子对接装置包括分子结构转换模块701、匹配模块702、问题转换模块703、模型生成模块704和模型求解模块705。
分子结构转换模块701用于将配体的二维分子结构图转换为三维分子结构图。
匹配模块702用于基于配体和受体的三维分子结构图构建受体靶点内部的对接盒网格点以对配体原子与受体网格点进行最佳匹配。匹配模块702包括:对接网格盒构建子模块,用于根据配体大小在受体结构空间上构建连续的对接盒;离散子模块,用于在网格点匹配过程中,将受体的对接盒离散为等距的网格点;受配体匹配子模块,用于将配体的每个原子放置在一个网格点上以将配体的每个原子与受体网格点进行匹配;以及对接子模块,用于通过将匹配结果与最佳匹配结果之间的差值最小化实现受体与配体的对接姿势。
对接子模块用于通过以下公式表示配体与受体的对接姿势:
;其中,R表示受体与配体的一种可能匹配,R grid 表示受体与配体的最佳匹配,‖R-R grid ‖是可能匹配与最佳匹配的差值距离,/>表示在所有匹配中选择一个可能匹配使得差值距离最小化。
问题转换模块703用于将求解配体原子与受体网格点的最佳匹配问题转化为寻找最大加权团。
模型生成模块704用于根据最大加权团问题建立二次无约束二值优化模型,其中,通过二次无约束二值优化模型计算在几何限制下受体与配体之间的最强结合亲和力。
模型求解模块705用于利用相干伊辛机获取二次无约束二值优化模块的最优解。
本领域技术人员可以理解,实现上述实施例方法的全部或部分流程,可以通过计算机程序来指令相关的硬件来完成,所述的程序可存储于计算机可读存储介质中。其中,所述计算机可读存储介质为磁盘、光盘、只读存储记忆体或随机存储记忆体等。
以上所述,仅为本发明较佳的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到的变化或替换,都应涵盖在本发明的保护范围之内。
Claims (10)
1.一种基于光量子计算机的分子对接方法,其特征在于,包括:
将配体的二维分子结构图转换为三维分子结构图;
基于配体和受体的三维分子结构图构建受体靶点内部的对接盒网格点以对配体原子与受体网格点进行最佳匹配;
将求解所述配体原子与所述受体网格点的最佳匹配问题转化为寻找最大加权团;
根据所述最大加权团建立二次无约束二值优化模型,其中,通过所述二次无约束二值优化模型计算在几何限制下受体与配体之间的最强结合亲和力;以及
利用相干伊辛机获取所述二次无约束二值优化模型的最优解。
2.根据权利要求1所述的基于光量子计算机的分子对接方法,其特征在于,基于配体和受体的三维分子结构图构建受体靶点内部的对接盒网格点以对配体原子与受体网格点进行最佳匹配包括:
根据配体大小在受体结构空间上构建连续的对接盒;
在网格点匹配过程中,将所述受体的对接盒离散为等距的网格点;
将配体的每个原子放置在一个网格点上以将所述配体的每个原子与受体网格点进行匹配;以及
通过将匹配结果与最佳匹配结果之间的差值最小化实现受体与配体的对接姿势。
3.根据权利要求2所述的基于光量子计算机的分子对接方法,其特征在于,通过将匹配结果与最佳匹配结果的之间的差值最小化实现受体与配体的对接姿势包括:
通过以下公式表示所述配体与所述受体的对接姿势:
;
其中,R表示所述受体与所述配体的一种可能匹配,Rgrid表示所述受体与所述配体的最佳匹配,‖R-Rgrid‖是所述可能匹配与所述最佳匹配的差值距离,表示在所有匹配中选择一个可能匹配使得所述差值距离最小化。
4.根据权利要求1所述的基于光量子计算机的分子对接方法,其特征在于,对配体原子与受体网格点进行最佳匹配包括:当满足以下约束项1和约束项2时,确定两个顶点的匹配共存,连接所述两个顶点:
所述约束项1:受体对接盒网格点与配体原子之间的距离偏差小于可调阈值参数;以及
所述约束项2:一个配体原子仅与一个网格点匹配,其中,每个顶点表示一个可能的匹配。
5.根据权利要求4所述的基于光量子计算机的分子对接方法,其特征在于,
受体对接盒网格点与配体原子之间的距离偏差小于可调阈值参数包括:对于顶点集V中的两个顶点(ai,pj)和(ak,pl),当满足以下两个约束时对所述两个顶点加边:
|‖ri-rk‖-‖prj-prl‖|<cdist, 其中,cdist为可调阈值参数,双竖线表示距离,单竖线表示绝对值,所述约束1表示当相对距离与配体形状协调时,两种匹配共存;以及
一个配体原子仅与一个网格点匹配包括:pj≠pl,使得一个配体原子与一个网格点匹配;
其中,A={ai}为配体中的原子集合,ti和ri分别为原子ai的类型和坐标,P={pi}为对接盒网格点集合,pi的坐标是pri,顶点集V={(ai,pj)|Van(ti,pj)<0},Van(ti,pj)是原子类型ti放置在网格点di上时的范德华瓦尔斯能量,每个顶点表示一个可能的匹配。
6.根据权利要求5所述的基于光量子计算机的分子对接方法,其特征在于,根据所述最大加权团建立二次无约束二值优化模型,其中,通过所述二次无约束二值优化模型计算在几何限制下受体与配体之间的最强结合亲和力包括通过以下公式计算能量点以获得打分函数:
;
其中,为决策变量,取值为{0,1},表示原子ai是否放在网格顶点dj的位置, 如果是则为1,否则为0;/>为顶点(ai,dj)的权重,公式中的第二项和第三项分别对应约束项1和约束项2, 其中Kdist、Kmono分别为两项的惩罚系数;公式中的第一项意味着加权顶点越多越好,如果(ai,dj)和(ak,dl)符合约束项1,则/>,否则/>,类似地,如果(ai,dj)和(ak,dl)符合约束项2, 则/>,否则,/>,Kdist、Kmono和Cdist为三个可调参数。
7.根据权利要求6所述的基于光量子计算机的分子对接方法,其特征在于,利用相干伊辛机获取所述二次无约束二值优化模块的最优解包括:
将所述二次无约束二值优化模块转换为伊辛模型;
将所述伊辛模型编码成一组光学脉冲的幅值和相位;
利用干涉效应将不同自旋之间的耦合关系传递给光学干涉;以及
使用非线性光学效应将光脉冲转换为对应自旋的取值以获得所述二次无约束二值优化模块的最优解。
8.一种基于光量子计算机的分子对接装置,其特征在于,包括:
分子结构转换模块,用于将配体的二维分子结构图转换为三维分子结构图;
匹配模块,用于基于配体和受体的三维分子结构图构建受体靶点内部的对接盒网格点以对配体原子与受体网格点进行最佳匹配;
问题转换模块,用于将求解所述配体原子与所述受体网格点的最佳匹配问题转化为寻找最大加权团;
模型生成模块,用于根据所述最大加权团问题建立二次无约束二值优化模型,其中,通过所述二次无约束二值优化模型计算在几何限制下受体与配体之间的最强结合亲和力;以及
模型求解模块,用于利用相干伊辛机获取所述二次无约束二值优化模块的最优解。
9.根据权利要求8所述的基于光量子计算机的分子对接装置,其特征在于,匹配模块用于:
对接网格盒构建子模块,用于根据配体大小在受体结构空间上构建连续的对接网格盒;
离散子模块,用于在网格点匹配过程中,将所述受体的对接网格盒离散为等距的网格点;
受配体匹配子模块,用于将配体的每个原子放置在一个网格点上以将所述配体的每个原子与受体网格点进行匹配;以及
对接子模块,用于通过将匹配结果与最佳匹配结果之间的差值最小化实现受体与配体的对接姿势。
10.根据权利要求9所述的基于光量子计算机的分子对接装置,其特征在于,对接子模块用于通过以下公式表示所述配体与所述受体的对接姿势:
;
其中,R表示所述受体与所述配体的一种可能匹配,Rgrid表示所述受体与所述配体的最佳匹配,‖R-Rgrid‖是所述可能匹配与所述最佳匹配的差值距离,表示在所有匹配中选择一个可能匹配使得所述差值距离最小化。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310882617.XA CN116597917B (zh) | 2023-07-19 | 2023-07-19 | 一种基于光量子计算机的分子对接方法和装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310882617.XA CN116597917B (zh) | 2023-07-19 | 2023-07-19 | 一种基于光量子计算机的分子对接方法和装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN116597917A true CN116597917A (zh) | 2023-08-15 |
CN116597917B CN116597917B (zh) | 2023-10-20 |
Family
ID=87606658
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202310882617.XA Active CN116597917B (zh) | 2023-07-19 | 2023-07-19 | 一种基于光量子计算机的分子对接方法和装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN116597917B (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117423379A (zh) * | 2023-12-19 | 2024-01-19 | 合肥微观纪元数字科技有限公司 | 采用量子计算的分子筛选方法及相关装置 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20110172981A1 (en) * | 2008-09-26 | 2011-07-14 | The Regents Of The University Of Michigan | High throughput ensemble-based docking and elucidation of three-dimensional structural confirmations of flexible biomolecular targets |
US20120053067A1 (en) * | 2009-05-04 | 2012-03-01 | University Of Maryland, Baltimore | Method for binding site identification by molecular dynamics simulation (silcs: site identification by ligand competitive saturation) |
CN114678082A (zh) * | 2022-03-08 | 2022-06-28 | 南昌立德生物技术有限公司 | 一种计算机辅助虚拟高通量筛选算法 |
CN114882940A (zh) * | 2022-03-28 | 2022-08-09 | 北京玻色量子科技有限公司 | 一种基于相干伊辛机的分子对接方法和装置 |
CN116052802A (zh) * | 2023-03-31 | 2023-05-02 | 北京玻色量子科技有限公司 | 一种相干伊辛机、基于其的多肽设计方法和装置 |
-
2023
- 2023-07-19 CN CN202310882617.XA patent/CN116597917B/zh active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20110172981A1 (en) * | 2008-09-26 | 2011-07-14 | The Regents Of The University Of Michigan | High throughput ensemble-based docking and elucidation of three-dimensional structural confirmations of flexible biomolecular targets |
US20120053067A1 (en) * | 2009-05-04 | 2012-03-01 | University Of Maryland, Baltimore | Method for binding site identification by molecular dynamics simulation (silcs: site identification by ligand competitive saturation) |
CN114678082A (zh) * | 2022-03-08 | 2022-06-28 | 南昌立德生物技术有限公司 | 一种计算机辅助虚拟高通量筛选算法 |
CN114882940A (zh) * | 2022-03-28 | 2022-08-09 | 北京玻色量子科技有限公司 | 一种基于相干伊辛机的分子对接方法和装置 |
CN116052802A (zh) * | 2023-03-31 | 2023-05-02 | 北京玻色量子科技有限公司 | 一种相干伊辛机、基于其的多肽设计方法和装置 |
Non-Patent Citations (1)
Title |
---|
王乐希;郑珩;劳兴珍;: "蛋白质分子柔性对接方法研究进展", 药物生物技术, no. 04, pages 72 - 76 * |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117423379A (zh) * | 2023-12-19 | 2024-01-19 | 合肥微观纪元数字科技有限公司 | 采用量子计算的分子筛选方法及相关装置 |
CN117423379B (zh) * | 2023-12-19 | 2024-03-15 | 合肥微观纪元数字科技有限公司 | 采用量子计算的分子筛选方法及相关装置 |
Also Published As
Publication number | Publication date |
---|---|
CN116597917B (zh) | 2023-10-20 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Krone et al. | Visual analysis of biomolecular cavities: State of the art | |
Hahn et al. | A new approach to simulating collisionless dark matter fluids | |
Turk et al. | yt: A multi-code analysis toolkit for astrophysical simulation data | |
Botsch et al. | Geometric modeling based on triangle meshes | |
KR101103085B1 (ko) | 3차원(3d) 보로노이 다이어그램 계산 | |
Khan et al. | Surface remeshing: A systematic literature review of methods and research directions | |
Freytag et al. | Finite element analysis in situ | |
Dietrich et al. | Edge transformations for improving mesh quality of marching cubes | |
CN116597917B (zh) | 一种基于光量子计算机的分子对接方法和装置 | |
Kozlikova et al. | Visualization of biomolecular structures: State of the art | |
CN114882940B (zh) | 一种基于相干伊辛机的分子对接方法和装置 | |
Anderson et al. | Smooth, volume-accurate material interface reconstruction | |
Krone et al. | Interactive extraction and tracking of biomolecular surface features | |
Hermosilla et al. | Interactive gpu-based generation of solvent-excluded surfaces | |
Simões et al. | CavVis—a field-of-view geometric algorithm for protein cavity detection | |
Scharnowski et al. | Comparative visualization of molecular surfaces using deformable models | |
Xu et al. | Developing an extended IFC data schema and mesh generation framework for finite element modeling | |
Cerutti et al. | DRACO-STEM: an automatic tool to generate high-quality 3d meshes of shoot apical meristem tissue at cell resolution | |
Kim et al. | Interaction interfaces in proteins via the Voronoi diagram of atoms | |
Li et al. | Interactive deformation and cutting simulation directly using patient‐specific volumetric images | |
Tian et al. | A multi‐GPU finite element computation and hybrid collision handling process framework for brain deformation simulation | |
CN116994660A (zh) | 复合物结构的生成方法、装置、设备及存储介质 | |
Siwei et al. | Review of bounding box algorithm based on 3D point cloud | |
Chang et al. | Review of Three-Dimensional Model Simplification Algorithms Based on Quadric Error Metrics and Bibliometric Analysis by Knowledge Map | |
Husain et al. | Relating memory performance data to application domain data using an integration API |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |