CN107423570A - 快速准确计算蛋白酶与药物分子之间亲和自由能的算法 - Google Patents
快速准确计算蛋白酶与药物分子之间亲和自由能的算法 Download PDFInfo
- Publication number
- CN107423570A CN107423570A CN201710652094.4A CN201710652094A CN107423570A CN 107423570 A CN107423570 A CN 107423570A CN 201710652094 A CN201710652094 A CN 201710652094A CN 107423570 A CN107423570 A CN 107423570A
- Authority
- CN
- China
- Prior art keywords
- mrow
- state
- msubsup
- msup
- standard
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Classifications
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16C—COMPUTATIONAL CHEMISTRY; CHEMOINFORMATICS; COMPUTATIONAL MATERIALS SCIENCE
- G16C10/00—Computational theoretical chemistry, i.e. ICT specially adapted for theoretical aspects of quantum chemistry, molecular mechanics, molecular dynamics or the like
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16C—COMPUTATIONAL CHEMISTRY; CHEMOINFORMATICS; COMPUTATIONAL MATERIALS SCIENCE
- G16C20/00—Chemoinformatics, i.e. ICT specially adapted for the handling of physicochemical or structural data of chemical particles, elements, compounds or mixtures
- G16C20/50—Molecular design, e.g. of drugs
Landscapes
- Engineering & Computer Science (AREA)
- Computing Systems (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Theoretical Computer Science (AREA)
- Bioinformatics & Computational Biology (AREA)
- General Health & Medical Sciences (AREA)
- Chemical & Material Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Physics & Mathematics (AREA)
- Health & Medical Sciences (AREA)
- Medicinal Chemistry (AREA)
- Crystallography & Structural Chemistry (AREA)
- Pharmacology & Pharmacy (AREA)
- Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
- Investigating Or Analysing Biological Materials (AREA)
Abstract
本发明属于制药技术领域,涉及一种快速准确计算蛋白酶与药物分子之间亲和自由能的算法,其特征是,分别计算自由态的配体,受体,以及结合态的受体‑配体综合体的标准化学势,它们之间的差值就是标准结合自由能,其中标准化学势计算时,首先找到该类分子的M个最稳态构象,j表示最稳态构象对应的能量井,j=1…N,然后计算每一个最稳态构象对应的能量井j的构型积分zj,并由此算出相应的玻尔兹曼因子RT,最后合并所有的构型积分而得到配体、受体或结合态的受体‑配体综合体的标准化学势。本发明通过计算机模拟替代实验的手段,大大提高先导药物筛选和优化的准确性,并且大幅减少筛选和优化的时间和成本。
Description
技术领域
本发明属于生物医药领域,属于药物制造领域,特别涉及药物设计领域,可以用于快速筛选及优化先导药物。
背景技术
先导药物的筛选与优化阶段为新药的后期研发提供候选药物,是整个药物研发的关键。先导药物的优化目前只能采用试错法,通过反复的化学合成和测试来进行。单纯使用这种试错方法来优化先导药物需要做大量的化学合成和测试工作,在时间和金钱上的投入是非常大的。按照这种传统的对先导药物的筛选模式,要获得一个成为新药的先导药物,平均需投入2.6亿美元,并且耗时数年之久。
目前国际上广泛使用的计算机模拟技术主要包括分子对接和评分法,自由能微扰法,半经验性的量子力学法,以及MM-PBSA法等等。但由于准确度及速度问题主要应用的范围还局限在先导药物的初选阶段。
发明内容
基于现有技术的上述状况,本发明提供了一种快速准确计算蛋白酶与药物分子之间亲和自由能的算法,本发明通过计算机模拟替代实验的手段,大大提高先导药物筛选和优化的准确性,并且大幅减少筛选和优化的时间和成本。
本发明通过下述技术方案来实现:本发明依据统计热力学的理论,使用精确的溶剂化模型和分子力学模型来计算亲和力。由于本发明的方法的研究对象是分子的最稳态构象,它们又被称作“主要状态”法。本发明分别计算自由态的配体,受体,以及结合态的受体-配体综合体的标准化学势,它们之间的差值就是标准结合自由能:
在上式中R代表受体,L代表配体,以及RL代表结合态的受体-配体综合体,代表受体的标准化学势,代表配体的标准化学势,代表结合态的受体-配体综合体的标准化学势,ΔG0代表标准结合自由能。
上式中的每一项标准化学势是由如下方法计算出。我们首先找到该类分子的M个最稳态构象,j表示最稳态构象对应的能量井,j=1…N,然后计算每一个最稳态构象对应的能量井j的构型积分zj,并由此算出相应的玻尔兹曼因子RT(其中R是理想气体常数,T是开式温度),最后依据下面的公式合并所有的构型积分而得到配体、受体或结合态的受体-配体综合体的标准化学势:
在上式中X=R,L,或者RL,C0是标准浓度,e是自然对数,是单个构象j的标准化学势。C0和8π2一起表达了自由分子在标准浓度时方位自由度对标准化学势的贡献。上式第二项是根据单个构象的标准化学势来求和。上述技术模型能够快速找到低能量的构象。
本发明运算的高速,一方面是因为采用了隐溶剂模型。这种模型被广泛认为比显溶剂模型更加快速有效。另一方面是因为对于像蛋白受体-配体综合体这样的大系统,只有一部分原子被设定为可以自由移动,其他的原子在运算过程中都是固定不动的。这样的处理大大减少了运算量。
本发明可以从每个构象的构型积分和对每个能量井求和来计算出由于受体和配体结合引起自由度的损失而产生的熵的变化,溶剂熵的变化隐含在溶剂的自由能中。
在实际应用过程中,我们发现以下因素对于蛋白质受体-配体亲和力的预测精度至关重要:恰当的溶剂化模型;柔性配体和柔性受体作用区;可靠的确定配体在受体作用区的低能量构象的方法;以及可靠的通过求解能量的二阶导数和玻尔兹曼平均来确定熵产生影响的方法。
本发明的一个关键点在于,它的寻找构象的算法能够快速找到低能量的构象。本发明的另一个关键点在于,对于像蛋白受体-配体综合体这样的大系统,只有一部分原子被设定为可以自由移动,其他的原子在运算过程中都是固定不动的,这样的处理大大减少了运算量。
本发明是一种全新的,能够比较快速准确地计算出真正的结合自由能的算法。目前在制药领域还没有适用于先导药物优化阶段的计算机模拟技术。本发明提供了通过分析结构变化对亲和力的影响来引导先导药物优化的可行性,大大提高先导药物筛选和优化的准确性,并且大幅减少筛选和优化的时间和成本。
附图说明
图1是计算PDE10A受体与配体之间的亲和自由能的过程中,考虑了配体柔性(熵)的贡献之后的结果图示;
图2是计算PDE10A受体与配体之间的亲和自由能的过程中,仅仅考虑焓的变化量的结果图示。
具体实施方式
下面对本发明作进一步详细说明。
一种快速准确计算蛋白酶与药物分子之间亲和自由能的算法,它分别计算自由态的配体,受体,以及结合态的受体-配体综合体的标准化学势,它们之间的差值就是标准结合自由能:
在上式中R代表受体,L代表配体,以及RL代表结合态的受体-配体综合体,代表受体的标准化学势,代表配体的标准化学势,代表结合态的受体-配体综合体的标准化学势,ΔG0代表标准结合自由能。
上式中的每一项标准化学势是由如下方法计算出。我们首先找到该类分子的M个最稳态构象,j表示最稳态构象对应的能量井,j=1…N,然后计算每一个最稳态构象对应的能量井j的构型积分zj,并由此算出相应的玻尔兹曼因子RT(其中R是理想气体常数,T是开式温度),最后依据下面的公式合并所有的构型积分而得到配体、受体或结合态的受体-配体综合体的标准化学势:
在上式中X=R,L,或者RL,C0是标准浓度,e是自然对数,是单个构象j的标准化学势。C0和8π2一起表达了自由分子在标准浓度时方位自由度对标准化学势的贡献。上式第二项是根据单个构象的标准化学势来求和。上述技术模型能够快速找到低能量的构象。
本发明一方面是因为采用了隐溶剂模型。在隐溶剂模型中,大量的溶剂分子不再被当做单独的个体,而是将它们整体的溶剂化效应隐式化处理。常用的模型包括泊松-玻尔兹曼模型和广义玻恩模型。这种模型被广泛认为比显溶剂模型更加快速有效。另一方面是因为对于像蛋白受体-配体综合体这样的大系统,在寻找构象的算法和能量最小化运算中只有一部分原子被设定为可以自由移动,其他的原子在运算过程中都是固定不动的。这样的处理大大减少了运算量。
本发明可以从每个构象的构型积分和对每个能量井求和来计算出由于受体和配体结合引起自由度的损失而产生的熵的变化,溶剂熵的变化隐含在溶剂的自由能中。
在实际应用过程中,我们发现以下因素对于蛋白质受体-配体亲和力的预测精度至关重要:恰当的溶剂化模型;柔性配体和柔性受体作用区;可靠的确定配体在受体作用区的低能量构象的方法;以及可靠的通过求解能量的二阶导数和玻尔兹曼平均来确定熵产生影响的方法。如下图所示,在计算PDE10A受体与配体之间的亲和自由能的过程中,我们发现在考虑了配体柔性(熵)的贡献之后(图1),计算的精确度比仅仅考虑焓的变化量(右图2)显著提高了。
Claims (2)
1.一种快速准确计算蛋白酶与药物分子之间亲和自由能的算法,其特征是:分别计算自由态的配体,受体,以及结合态的受体-配体综合体的标准化学势,它们之间的差值就是标准结合自由能:
<mrow>
<msup>
<mi>&Delta;G</mi>
<mn>0</mn>
</msup>
<mo>=</mo>
<msubsup>
<mi>&mu;</mi>
<mrow>
<mi>R</mi>
<mi>L</mi>
</mrow>
<mn>0</mn>
</msubsup>
<mo>-</mo>
<msubsup>
<mi>&mu;</mi>
<mi>R</mi>
<mn>0</mn>
</msubsup>
<mo>-</mo>
<msubsup>
<mi>&mu;</mi>
<mi>L</mi>
<mn>0</mn>
</msubsup>
<mo>-</mo>
<mo>-</mo>
<mo>-</mo>
<mrow>
<mo>(</mo>
<mn>1</mn>
<mo>)</mo>
</mrow>
</mrow>
在上式中R代表受体,L代表配体,以及RL代表结合态的受体-配体综合体,代表受体的标准化学势,代表配体的标准化学势,代表结合态的受体-配体综合体的标准化学势,ΔG0代表标准结合自由能。
2.根据权利要求1所述的快速准确计算蛋白酶与药物分子之间亲和自由能的算法,其特征是:公式(1)中的每一项标准化学势是由如下方法计算出:首先找到该类分子的M个最稳态构象,j表示最稳态构象对应的能量井,j=1…N,然后计算每一个最稳态构象对应的能量井j的构型积分zj,并由此算出相应的玻尔兹曼因子RT,最后依据下面的公式合并所有的构型积分而得到配体、受体或结合态的受体-配体综合体的标准化学势:
<mrow>
<msubsup>
<mi>&mu;</mi>
<mi>X</mi>
<mn>0</mn>
</msubsup>
<mo>=</mo>
<mo>-</mo>
<mi>R</mi>
<mi>T</mi>
<mi>ln</mi>
<mfrac>
<mrow>
<mn>8</mn>
<msup>
<mi>&pi;</mi>
<mn>2</mn>
</msup>
</mrow>
<msup>
<mi>C</mi>
<mn>0</mn>
</msup>
</mfrac>
<munderover>
<mo>&Sigma;</mo>
<mrow>
<mi>j</mi>
<mo>=</mo>
<mn>1</mn>
</mrow>
<mi>N</mi>
</munderover>
<msub>
<mi>z</mi>
<mi>j</mi>
</msub>
<mo>=</mo>
<mo>-</mo>
<mi>R</mi>
<mi>T</mi>
<mi>l</mi>
<mi>n</mi>
<munderover>
<mo>&Sigma;</mo>
<mrow>
<mi>j</mi>
<mo>=</mo>
<mn>1</mn>
</mrow>
<mi>N</mi>
</munderover>
<msup>
<mi>e</mi>
<mrow>
<mo>-</mo>
<mfrac>
<msubsup>
<mi>&mu;</mi>
<mrow>
<mi>X</mi>
<mo>,</mo>
<mi>j</mi>
</mrow>
<mi>o</mi>
</msubsup>
<mrow>
<mi>R</mi>
<mi>T</mi>
</mrow>
</mfrac>
</mrow>
</msup>
<mo>-</mo>
<mo>-</mo>
<mo>-</mo>
<mrow>
<mo>(</mo>
<mn>2</mn>
<mo>)</mo>
</mrow>
</mrow>
在上式中X=R,L,或者RL,C0是标准浓度,e是自然对数,是单个构象j的标准化学势。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710652094.4A CN107423570B (zh) | 2017-08-02 | 2017-08-02 | 快速准确计算蛋白酶与药物分子之间亲和自由能的算法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710652094.4A CN107423570B (zh) | 2017-08-02 | 2017-08-02 | 快速准确计算蛋白酶与药物分子之间亲和自由能的算法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN107423570A true CN107423570A (zh) | 2017-12-01 |
CN107423570B CN107423570B (zh) | 2021-01-08 |
Family
ID=60437182
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201710652094.4A Active CN107423570B (zh) | 2017-08-02 | 2017-08-02 | 快速准确计算蛋白酶与药物分子之间亲和自由能的算法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN107423570B (zh) |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108959846A (zh) * | 2018-07-03 | 2018-12-07 | 南昌立德生物技术有限公司 | 一种计算机辅助先导药物优化设计的亲和自由能分解算法 |
CN109256180A (zh) * | 2018-07-03 | 2019-01-22 | 南昌立德生物技术有限公司 | 一种计算机辅助先导药物优化设计的敏感性分析算法 |
CN111048158A (zh) * | 2019-12-26 | 2020-04-21 | 哈尔滨理工大学 | 基于spparks软件的kmc方法uo2势能力场 |
CN111161810A (zh) * | 2019-12-31 | 2020-05-15 | 中山大学 | 一种基于约束概率分布函数优化的自由能微扰方法 |
CN111341391A (zh) * | 2020-02-25 | 2020-06-26 | 深圳晶泰科技有限公司 | 一种用于异构集群环境中的自由能微扰计算调度方法 |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
AU2238501A (en) * | 1999-12-17 | 2001-06-25 | Leiv Eiriksson Nyfotek As | Entropy optimal operation and design of one or several chemical reactors |
CN1715926A (zh) * | 2004-07-02 | 2006-01-04 | 上海泽生科技开发有限公司 | 神经调节蛋白突变体、筛选方法及应用 |
CN1886659A (zh) * | 2003-10-14 | 2006-12-27 | 维颂公司 | 分子构像及组合的分析方法及仪器 |
CN101542284A (zh) * | 2005-03-11 | 2009-09-23 | 施罗丁格有限公司 | 用于估计结合亲和力的预测性得分函数 |
CN102067317A (zh) * | 2008-04-22 | 2011-05-18 | 索尼公司 | 用于电子器件的包含双分子层的结 |
CN106575320A (zh) * | 2014-05-05 | 2017-04-19 | 艾腾怀斯股份有限公司 | 结合亲和力预测系统和方法 |
-
2017
- 2017-08-02 CN CN201710652094.4A patent/CN107423570B/zh active Active
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
AU2238501A (en) * | 1999-12-17 | 2001-06-25 | Leiv Eiriksson Nyfotek As | Entropy optimal operation and design of one or several chemical reactors |
CN1886659A (zh) * | 2003-10-14 | 2006-12-27 | 维颂公司 | 分子构像及组合的分析方法及仪器 |
CN1715926A (zh) * | 2004-07-02 | 2006-01-04 | 上海泽生科技开发有限公司 | 神经调节蛋白突变体、筛选方法及应用 |
CN101542284A (zh) * | 2005-03-11 | 2009-09-23 | 施罗丁格有限公司 | 用于估计结合亲和力的预测性得分函数 |
CN102067317A (zh) * | 2008-04-22 | 2011-05-18 | 索尼公司 | 用于电子器件的包含双分子层的结 |
CN106575320A (zh) * | 2014-05-05 | 2017-04-19 | 艾腾怀斯股份有限公司 | 结合亲和力预测系统和方法 |
Non-Patent Citations (3)
Title |
---|
ZAHEER UL HAQ 等: ""Docking and 3D-QSAR modeling of cyclin-dependent kinase 5/p25 inhibitors"", 《JOURNAL OF MOLECULAR MODELING》 * |
刘吉元: ""蛋白质与配体相互作用分子模拟研究"", 《中国优秀博士学位论文全文数据库 基础科学辑》 * |
董珂珂 等: ""基于蛋白质专一性力场和分子动力学模拟研究细胞周期依赖性蛋白激酶5与Roscovitine衍生物的作用机制"", 《南京工业大学学报(自然科学版)》 * |
Cited By (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108959846A (zh) * | 2018-07-03 | 2018-12-07 | 南昌立德生物技术有限公司 | 一种计算机辅助先导药物优化设计的亲和自由能分解算法 |
CN109256180A (zh) * | 2018-07-03 | 2019-01-22 | 南昌立德生物技术有限公司 | 一种计算机辅助先导药物优化设计的敏感性分析算法 |
CN108959846B (zh) * | 2018-07-03 | 2021-09-14 | 南昌立德生物技术有限公司 | 一种计算机辅助先导药物优化设计的亲和自由能分解算法 |
CN109256180B (zh) * | 2018-07-03 | 2022-02-11 | 南昌立德生物技术有限公司 | 一种计算机辅助先导药物优化设计的敏感性分析算法 |
CN111048158A (zh) * | 2019-12-26 | 2020-04-21 | 哈尔滨理工大学 | 基于spparks软件的kmc方法uo2势能力场 |
CN111161810A (zh) * | 2019-12-31 | 2020-05-15 | 中山大学 | 一种基于约束概率分布函数优化的自由能微扰方法 |
CN111161810B (zh) * | 2019-12-31 | 2022-03-22 | 中山大学 | 一种基于约束概率分布函数优化的自由能微扰方法 |
CN111341391A (zh) * | 2020-02-25 | 2020-06-26 | 深圳晶泰科技有限公司 | 一种用于异构集群环境中的自由能微扰计算调度方法 |
CN111341391B (zh) * | 2020-02-25 | 2023-12-01 | 深圳晶泰科技有限公司 | 一种用于异构集群环境中的自由能微扰计算调度方法 |
Also Published As
Publication number | Publication date |
---|---|
CN107423570B (zh) | 2021-01-08 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN107423570A (zh) | 快速准确计算蛋白酶与药物分子之间亲和自由能的算法 | |
CN1886659B (zh) | 计算在分子构型的多个分子子集之间亲合力函数的方法和系统 | |
Diamantonis et al. | Evaluation of statistical associating fluid theory (SAFT) and perturbed chain-SAFT equations of state for the calculation of thermodynamic derivative properties of fluids related to carbon capture and sequestration | |
Gupta et al. | Prediction of capillary gas chromatographic retention times of fatty acid methyl esters in human blood using MLR, PLS and back-propagation artificial neural networks | |
Kitchen et al. | Conserving energy during molecular dynamics simulations of water, proteins, and proteins in water | |
Orozco et al. | Optimization of intermolecular potential parameters for the CO2/H2O mixture | |
Dang et al. | A novel deep learning framework for industrial multiphase flow characterization | |
Ali et al. | Redundant sensor network design for linear processes | |
Pan et al. | Predicting the net heat of combustion of organic compounds from molecular structures based on ant colony optimization | |
Mittal et al. | Assessment of counterflow to measure laminar burning velocities using direct numerical simulations | |
Siewert | The linearized Boltzmann equation: a concise and accurate solution of the temperature-jump problem | |
Aghaie et al. | Estimation of CO2 solubility in ionic liquids using connectionist tools based on thermodynamic and structural characteristics | |
Fan et al. | Effects of data quality and quantity on deep learning for protein-ligand binding affinity prediction | |
Baidakov et al. | Surface tension of methane–nitrogen solutions: 2. Description in the framework of the van der Waals gradient theory | |
Kuntz et al. | Machine learning, artificial intelligence, and chemistry: How smart algorithms are reshaping simulation and the laboratory | |
Fooladgar et al. | A new post-processing technique for analyzing high-dimensional combustion data | |
Liem et al. | The hydration of serine: multipole moments versus point charges | |
Wales | Dynamical signatures of multifunnel energy landscapes | |
CN110516920A (zh) | 基于指标融合的陀螺仪质量等级评估方法 | |
Al-Shayji et al. | Predictive modeling of large-scale commercial water desalination plants: data-based neural network and model-based process simulation | |
Irwin et al. | Deep imputation on large‐scale drug discovery data | |
Song et al. | PMF-CPI: assessing drug selectivity with a pretrained multi-functional model for compound–protein interactions | |
CN109063418A (zh) | 疾病预测分类器的确定方法、装置、设备及可读存储介质 | |
Bolhuis et al. | Force field optimization by imposing kinetic constraints with path reweighting | |
Horsch et al. | Molecular simulation of nano-dispersed fluid phases |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |