CN116864015B - 一种基于副本交换分子动力学的蛋白质构象变化分析方法 - Google Patents
一种基于副本交换分子动力学的蛋白质构象变化分析方法 Download PDFInfo
- Publication number
- CN116864015B CN116864015B CN202310785457.7A CN202310785457A CN116864015B CN 116864015 B CN116864015 B CN 116864015B CN 202310785457 A CN202310785457 A CN 202310785457A CN 116864015 B CN116864015 B CN 116864015B
- Authority
- CN
- China
- Prior art keywords
- simulation
- protein
- molecular dynamics
- exchange
- analysis
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 102000004169 proteins and genes Human genes 0.000 title claims abstract description 64
- 108090000623 proteins and genes Proteins 0.000 title claims abstract description 64
- 238000000329 molecular dynamics simulation Methods 0.000 title claims abstract description 46
- 238000004458 analytical method Methods 0.000 title claims abstract description 19
- 230000008859 change Effects 0.000 title claims abstract description 13
- 238000000034 method Methods 0.000 claims abstract description 33
- 238000006243 chemical reaction Methods 0.000 claims abstract description 23
- 238000005070 sampling Methods 0.000 claims abstract description 7
- 238000004364 calculation method Methods 0.000 claims abstract description 3
- 230000008876 conformational transition Effects 0.000 claims abstract description 3
- 238000004088 simulation Methods 0.000 claims description 50
- 239000013078 crystal Substances 0.000 claims description 19
- 238000004422 calculation algorithm Methods 0.000 claims description 18
- 238000000137 annealing Methods 0.000 claims description 11
- 238000010586 diagram Methods 0.000 claims description 11
- 125000004429 atom Chemical group 0.000 claims description 9
- 230000008878 coupling Effects 0.000 claims description 8
- 238000010168 coupling process Methods 0.000 claims description 8
- 238000005859 coupling reaction Methods 0.000 claims description 8
- 238000010438 heat treatment Methods 0.000 claims description 6
- 230000003993 interaction Effects 0.000 claims description 5
- 239000013598 vector Substances 0.000 claims description 5
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 claims description 5
- 239000002904 solvent Substances 0.000 claims description 4
- 230000009466 transformation Effects 0.000 claims description 4
- 150000002500 ions Chemical class 0.000 claims description 3
- 230000003204 osmotic effect Effects 0.000 claims description 3
- 230000008030 elimination Effects 0.000 claims description 2
- 238000003379 elimination reaction Methods 0.000 claims description 2
- 125000004435 hydrogen atom Chemical group [H]* 0.000 claims description 2
- 229910021645 metal ion Inorganic materials 0.000 claims description 2
- 230000007935 neutral effect Effects 0.000 claims description 2
- 239000002245 particle Substances 0.000 claims description 2
- 230000006916 protein interaction Effects 0.000 claims description 2
- 230000001502 supplementing effect Effects 0.000 claims description 2
- 210000004899 c-terminal region Anatomy 0.000 claims 1
- 230000000694 effects Effects 0.000 claims 1
- 230000010354 integration Effects 0.000 claims 1
- 230000009467 reduction Effects 0.000 claims 1
- 201000010099 disease Diseases 0.000 abstract description 5
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 abstract description 5
- 230000003281 allosteric effect Effects 0.000 abstract description 4
- 238000002474 experimental method Methods 0.000 abstract description 4
- 230000007246 mechanism Effects 0.000 abstract description 3
- 230000007704 transition Effects 0.000 abstract description 2
- 238000012377 drug delivery Methods 0.000 abstract 1
- 230000035790 physiological processes and functions Effects 0.000 abstract 1
- 239000013589 supplement Substances 0.000 abstract 1
- 230000008569 process Effects 0.000 description 4
- 229940079593 drug Drugs 0.000 description 3
- 239000003814 drug Substances 0.000 description 3
- 238000011160 research Methods 0.000 description 3
- 230000004913 activation Effects 0.000 description 2
- 230000008901 benefit Effects 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 229910052739 hydrogen Inorganic materials 0.000 description 2
- 238000000302 molecular modelling Methods 0.000 description 2
- 230000004962 physiological condition Effects 0.000 description 2
- 230000001594 aberrant effect Effects 0.000 description 1
- 125000003275 alpha amino acid group Chemical group 0.000 description 1
- 239000003125 aqueous solvent Substances 0.000 description 1
- 238000005094 computer simulation Methods 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000012217 deletion Methods 0.000 description 1
- 230000037430 deletion Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000003745 diagnosis Methods 0.000 description 1
- 238000001647 drug administration Methods 0.000 description 1
- 238000007876 drug discovery Methods 0.000 description 1
- 231100000089 gene mutation induction Toxicity 0.000 description 1
- 238000011835 investigation Methods 0.000 description 1
- 239000000463 material Substances 0.000 description 1
- 230000005012 migration Effects 0.000 description 1
- 238000013508 migration Methods 0.000 description 1
- 238000012900 molecular simulation Methods 0.000 description 1
- 239000000178 monomer Substances 0.000 description 1
- 230000035772 mutation Effects 0.000 description 1
- 230000036632 reaction speed Effects 0.000 description 1
- 230000002441 reversible effect Effects 0.000 description 1
- 238000013515 script Methods 0.000 description 1
- 239000012453 solvate Substances 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 230000008685 targeting Effects 0.000 description 1
- 238000000844 transformation Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16C—COMPUTATIONAL CHEMISTRY; CHEMOINFORMATICS; COMPUTATIONAL MATERIALS SCIENCE
- G16C10/00—Computational theoretical chemistry, i.e. ICT specially adapted for theoretical aspects of quantum chemistry, molecular mechanics, molecular dynamics or the like
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16C—COMPUTATIONAL CHEMISTRY; CHEMOINFORMATICS; COMPUTATIONAL MATERIALS SCIENCE
- G16C20/00—Chemoinformatics, i.e. ICT specially adapted for the handling of physicochemical or structural data of chemical particles, elements, compounds or mixtures
- G16C20/70—Machine learning, data mining or chemometrics
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16C—COMPUTATIONAL CHEMISTRY; CHEMOINFORMATICS; COMPUTATIONAL MATERIALS SCIENCE
- G16C60/00—Computational materials science, i.e. ICT specially adapted for investigating the physical or chemical properties of materials or phenomena associated with their design, synthesis, processing, characterisation or utilisation
Landscapes
- Engineering & Computer Science (AREA)
- Computing Systems (AREA)
- Theoretical Computer Science (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Life Sciences & Earth Sciences (AREA)
- Health & Medical Sciences (AREA)
- General Health & Medical Sciences (AREA)
- Artificial Intelligence (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Physics & Mathematics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- Evolutionary Computation (AREA)
- Medical Informatics (AREA)
- Software Systems (AREA)
- Chemical & Material Sciences (AREA)
- Crystallography & Structural Chemistry (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明公开了一种基于副本交换分子动力学对蛋白质构象变化分析方法,本发明通过副本交换分子动力学对生理状态下的蛋白进行模拟,对蛋白变构行为及构象转变速率进行分析,补充实验对构象的解析结果,与实验计算所得转变速率具有一致性;结果验证了该方法的可行性。该方法能够对疾病中异常表达的蛋白进行分析,相比于传统分子动力学方法,能够大大提供采样效率;并且该方法计算出来的转变效率与实验结果一致,可以降低实验成本;从原子层面对靶向用药的可行性提供机理分析。
Description
技术领域
本发明涉及应用分子动力学方法的计算结构生物学领域,尤其涉及基于副本交换分子动力学的蛋白质构象变化分析方法。
背景技术
多态蛋白自2008年被提出后一直被结构生物学家所关注,多态蛋白是一类在自然条件下采用多种折叠构象和构象间发生可逆转换的单一氨基酸序列组成的一类蛋白质。对于多态蛋白的研究还有许多未知的空间,包括对其进化、药物发现和对未被识别的多态蛋白进行探索,并可以根据多态蛋白设计人造靶向蛋白、可变换功能的药物和生物传感器等。目前人类已确定多种与疾病相关的多态蛋白,这些疾病的进展通常与某些多态蛋白的异常表达相关,并且疾病引发的基因突变能导致病变细胞的主要靶标的变构行为。因此,研究多态蛋白对于特定疾病的治疗具有积极意义。
近年来,随着计算机技术的快速发展,分子模拟技术越来越成为理论和实验上的有力辅助工具。全原子的分子建模以更加细致的真实原子对复杂体系进行表征。提供了研究体系在原子尺度上的结构和动力学行为,极大地提高了模拟结果的可靠度。使得研究人员能够有效地通过理解物质微观模型来预测宏观性质。经典的分子动力学模拟基于牛顿第二定律,能够根据初始系统中各个原子的位置和速度及原子间相互作用势,得到系统中任一原子的受力情况。进一步通过数值求解运动方程及使用蛙跳算法经过迭代的方式获得体系中所有原子的运动轨迹,形成一个时间连续的动力学过程。
传统的分子动力学受限于时间尺度,难以对粗糙自由能图的系统中的构象进行有效采样。在此基础上副本交换方法被提出,并与分子动力学模拟进行结合。该方法被广泛地应用于多种生物学、计算化学等问题中。该方法应用简单并具有较高的采样效率,并能够根据生化体系所关注的现象和性质不断发展。综上所述,将计算生物学方法引入医疗技术领域,能够协助医生对疾病靶向进行分析,提高医疗的精确性。
发明内容
基于以上现有技术的不足,本发明所解决的技术问题在于提出了基于副本交换分子动力学的蛋白质构象变化分析方法,本发明采用副本交换分子动力学方法作为模拟手段,对广义系综下的蛋白体系进行模拟,通过对模拟后的轨迹提取反应坐标构建自由能图及确定构象间折叠/展开速率,弥补实验中难以捕捉到的原子层面的变构细节,并对处于不同生理状况下的蛋白构象转变速率进行分析,从而帮助医生进行辅助诊断,进一步明确靶向用药,给患者提供有效治疗方案。
为了解决上述技术问题,本发明通过以下技术方案实现:
基于副本交换分子动力学的蛋白质构象变化分析方法,包括以下步骤:
S1:从RCSB数据库(https://www.rcsb.org/)中获取蛋白晶体结构,对缺失的晶体结构进行补齐,构建特定pH值及浓度下包含溶剂的模拟系统;
S2:对模拟系统进行能量最小化、退火模拟、NVT和NPT系综下进行预平衡,解除约束进行常规分子动力学模拟,从模拟轨迹中提取连续结构信息;
S3:从常规分子动力学模拟提取稳定构象,作为副本交换分子动力学的初始构象,在NPT系综下进行预平衡,解除约束进行副本交换分子动力学,从模拟轨迹中提取反应坐标系构建自由能图并计算构象间转化速率。
其中,S1包括以下步骤:
S11:从RCSB数据库(https://www.rcsb.org/)下载合适的蛋白晶体结构,选择结构完整且高分辨率的解析晶体结构;
S12:利用软件对蛋白晶体结构中多余组分,如金属离子、结晶水等进行删除;
S13:利用软件对蛋白晶体结构中缺失结构部分进行同源建模补齐;如利用MODELEER软件将蛋白结构的pdb文件和蛋白序列的fasta文件作为输入,通过同源建模,生成能量较低的结构。
此外,S2包括以下步骤:
S21:使用CHARMM36力场对蛋白分子及原子间的相互作用进行表征,并使用TIP3P水分子模型对整个系统进行溶剂化;
S22:对溶剂化后的系统添加离子,使得系统净电荷为零;为对生理系统进行模拟,选用Na+和Cl-对系统电荷进行中和;并将渗透压设置为150mM;
S23:对模拟系统进行退火模拟,在100ps内将系统从3K升温至310K;
S24:使用V-rescale算法对模拟体系温度进行耦合,在NVT系综下进行100ps模拟;
S25:使用Parrinello-Rahman算法对模拟体系压强进行耦合,在NPT系综下进行100ps模拟;
S26:对多轮预平衡后的系统进行时长为数百纳秒到微秒量级的解除约束后的常规分子动力学模拟,系统选用蛙跳算法进行积分。使用LINCS算法将含有氢原子的键转化为约束,短程非键相互作用的截断半径设置为1.0nm,使用粒子网络方法计算长程经典相互作用;
S27:对模拟后的系统轨迹进行提取,对系统的宏观特性和动力学行为进行探究。
最后,S3包括如下步骤:
S31:从常规分子动力学模拟中按照一定步长生成具有稳定构象的蛋白结构文件作为副本交换分子动力学模拟的初始构象;
S32:利用副本交换温度生成器工具(https://virtualchemistry.org/remd-temperature-generator/)根据模拟系统生成满足预设交换率下的温度区间;
S33:对模拟系统进行退火模拟,在100ps内将系统从3K升温至对应温度;
S34:使用V-rescale算法对模拟体系温度进行耦合,在NVT系综下进行100ps模拟;
S35:使用Parrinello-Rahman算法对模拟体系压强进行耦合,在NPT系综下进行100ps模拟;
S36:对上述预平衡后的系统进行并行模拟,进行约100ns左右的副本交换分子动力学模拟;
S37:从模拟轨迹中提取反应坐标作为特征向量,绘制自由能图;并提取二级结构信息,计算蛋白构象转变速率。
因此,本发明具有以下优点:
1.本发明将研究目标设定为多态蛋白,并利用副本交换分子动力学方法提高采样效率,对蛋白构象进行挖掘,探究不同生理条件下不同构象的分布情况,为医生的靶向蛋白分析提供必要的参考信息,能大大辅助医生进行精准用药。
2.相比于传统的分子动力学方法,副本交换分子动力学能够对蛋白构象进行充分挖掘,因此能够对粗糙的自由能图进行精确的描绘。此外,相比于实验,计算机模拟具有便捷性和可操作性等优点,并能够在更细微的原子尺度了解蛋白结构转变的机理。可大大提高蛋白变构行为的研究,为治疗提供更多角度的分析。
附图说明
图1为本发明的方法流程图;
图2为本发明中从常规分子动力学轨迹中提取的用于区分构型的关键指标;
图3为本发明中自由能图及对应势阱中(energy well)的蛋白构型;
图4为本发明中对二级结构进行描绘,并对模拟曲线进行拟合。
具体实施方式
为了更详细的说明本发明的技术方案,下面结合实例和附图对本发明的技术方案进行具体说明。
基于副本交换分子动力学的蛋白质构象变化分析方法,包括以下步骤:
S1:从RCSB数据库(https://www.rcsb.org/)中下载蛋白的晶体机构,此处选择PDB ID:2N54的蛋白二聚体晶体结构,晶体结构包含两个chain,对应两个单体,利用Pymol选择其中一个单体用于模拟;
S2:建立常规分子动力学模型,模拟软件采用Gromacs-2018.3版本;
S3:建立副本交换分子动力学模型,模拟软件采用Gromacs-2018.3版本,控制软件plumed版本为2.8.0,副本间预设交换概率为0.30。
进一步的,S1包括以下步骤:
S11:从RCSB数据库获取蛋白的fasta序列,与蛋白晶体结构进行序列比对,补全缺失结构;
S111:将蛋白序列与晶体结构传给MODERLLER软件,通过
python align.py
python single_model.py
命令完成同源建模,选取打分Z-score最低的构型用于分子模拟。
进一步的,S2包括以下步骤
S21:利用pdb2gmx命令生成结构拓扑文件和位置限制文件,力场根据软件版本选择对应CHARMM36力场,此模拟中选择CHARMM36 Mar-2019,溶剂选择TIP3P水模型;
S22:利用editconf命令生成模拟盒子,并将蛋白结构置于盒子中心;
S23:利用solvate命令将水溶剂添加到盒子中;
S24:利用genion命令将系统调整至电中性,并设置离子浓度;
S25:对系统进行能量最小化,通过调节
emtol=10.0
nsteps=500000
设置能量最小化过程的步长及收敛时系统原子所受最大的力的大小;
S26:对系统进行退火模拟,通过调节
annealing_time=01000100
annealing_temp=33103310
设置系统的初始温度和升温温度,并设置这一升温过程需要的时间;
S27:对系统进行预平衡,包括NVT和NPT系综下两轮预平衡;
S271:对系统进行NVT系综下预平衡,在配置文件中通过
tcoupl=V-rescale
将系统设置为用V-rescale算法对温度进行耦合;
S272:对系统进行NVT系综下预平衡,在配置文件中通过
pcoupl=berendsen
将系统设置为用berendsen算法对压强进行耦合;
S28:解除约束后进行常规分子动力学模拟,在配置文件中通过
integrator=md
nsteps=500000000
表明系统解除约束后通过蛙跳算法进行积分,模拟时长设置为1微秒;
S29:对模拟后的轨迹进行提取,本模拟中用于区分蛋白构象的特征分别是可接触溶剂表面积(SASA)及原子间质心距离(COM),因此分别通过软件中SASA和distance命令进行计算;
进一步的,S3包括以下步骤:
S31:通过trjconv命令从常规分子动力学模拟中按照一定时间间隔提取系统结构,此处将时间间隔设置为20ns,预计提取50个初始结构;
S32:通过replica exchange temperature generator网站设定交换率,并生成所需副本数及对应温度,生成后的副本数及温度如表1;
表1:副本交换分子动力学副本设置温度温度(K)
S33:通过脚本对每个副本生成对应温度的退火模拟、NVT和NPT配置文件;
S34:利用并行执行mpiexec指令对所有副本进行退火模拟、NVT和NPT预平衡;
mpiexec-np 40 gmx_mpi mdrun-ntomp 2-gpu_id 01-s ltn40.annealing.tpr-oltn40.annealing.trr-c ltn40.em-e annealing-g annealing-multidir 0 1 2 3 4 5 67 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 3334 35 36 37 38 39
mpiexec-np 40 gmx_mpi mdrun-ntomp 2-gpu_id 01-s ltn40.nvt.tpr-oltn40.nvt.trr-c ltn40.annealing-e nvt-g nvt-multidir 0 1 2 3 4 5 6 7 8 9 1011 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 3637 38 39
mpiexec-np 40 gmx_mpi mdrun-ntomp 2-gpu_id 01-s ltn40.npt1.tpr-oltn40.npt1.trr-c ltn40.md-e npt1-g npt1-multidir 0 1 2 3 4 5 6 7 8 9 10 11 1213 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 3839
S35:利用并行执行mpiexec指令对副本进行解除约束后的副本交换分子动力学模拟
mpiexec-np 40 gmx_mpi mdrun-ntomp 2-gpu_id 01-s ltn40.md.tpr-oltn40.md.trr-c ltn40.npt1-e md-g md-multidir 0 1 2 3 4 5 6 7 8 9 10 11 12 1314 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39
S351:模拟过程中副本间的计算交换概率与实际交换概率如表2所示;
表2交换概率
结果表明模拟中的交换概率满足了既定概率设置;
S36:提取特征向量构建自由能图;
S361:平衡系综下的相对吉布斯自由能是模拟过程中概率密度的函数,定义形式如下:
其中kB表示玻尔兹曼常数,T表示温度。通过对平衡系综中的分子动力学模拟轨迹进行采样,可以得到两个反应坐标对应位置的概率密度P(R1,R2),PMax则表示最大概率密度;
S362:对系统轨迹进行采样后,将原子间距离作为系统反应坐标,根据反应坐标对自由能图进行绘制;
S37:提取轨迹,计算构象间反应速率;
S371:通过对蛋白DSSP进行计算后共得出8种二级结构,分别为~,E,B,S,T,H,I,和G,进一步分类得到3种二级结构,分别为α-螺旋(α-helix)、β-折叠(β-strand)和无规则卷曲(randomcoil),用符号H、E和T进行表示;
S372:构象间的转化行为可由如下控制方程确定:
其中H、T及E分别表示系统中这三种构象的占比;
S373:反应速率由阿伦尼乌斯方程确定,该方程反应中速率常数和温度之间的关系,表达形式为:
其中A表示指前因子,Ea表示反应活化能;
S374反应中每一时刻某种构型的占比可以通过对模拟轨迹计算获得,分别为H(t)、T(t)和E(t),通过对指前因子和反应活化能进行拟合后并积分后,可得到每一步迭代的变化量,表达形式如下:
S375:通过将上述方程预测得到的构象比例与模拟测得的比例计算误差残值,并将误差残值最小化后,可得到构象间转变速率,拟合方程如下:
通过该方法采样得到的自由能图能较好地揭示蛋白构象的迁移路径,并且计算得到的反应速率与实验解得的反应速率具有一致性。因此通过本实施例的基于副本交换分子动力学绘制自由能图与计算反应速率模型可以很好的为协助医生进行靶向用药时的数据参考依据。
以上,仅为本发明的具体实施方式,但本发明的保护范围并不局限于此,任何不经过创造性劳动想到的变化或替换,都应涵盖在本发明保护范围之内。
Claims (9)
1.基于副本交换分子动力学的蛋白质构象变化分析方法,包括以下步骤:
S1:从RCSB数据库中获取蛋白晶体结构,对缺失的晶体结构进行补齐,构建包含溶剂的模拟系统;
S2:对模拟系统进行能量最小化、退火模拟、NVT和NPT系综下进行预平衡,解除约束进行常规分子动力学模拟,从模拟轨迹中提取连续结构信息;
S3:从常规分子动力学模拟提取稳定构象,作为副本交换分子动力学的初始构象,在NPT系综下进行预平衡,解除约束进行副本交换分子动力学,对模拟轨迹进行采样,将原子间距离作为系统反应坐标,提取反应坐标作为特征向量,进行自由能图绘制;通过对蛋白DSSP进行计算,得到3种蛋白二级结构:H、E和T;通过阿伦尼乌斯方程确定反应速率,并基于反应速率进行模拟轨迹计算、拟合、积分,获取所述H、E和T的预测构象比例,最后与模拟测得的比例计算误差残值,将误差残值最小化后,即可得到蛋白构象转变速率;
所述对模拟轨迹进行采样,构建的自由能图的方程为:其中kB表示玻尔兹曼常数,T表示温度,P(R1,R2)表示采样获得反应坐标对应位置处的概率密度,PMax表示最大概率密度。
2.根据权利要求1所述的基于副本交换分子动力学的蛋白质构象变化分析方法,其特征是,S1包括以下步骤:
S11:从RCSB数据库下载合适的蛋白晶体结构,选择结构完整且高分辨率的解析晶体结构;
S12:利用软件对蛋白晶体结构中多余组分,所述多余组分为金属离子或结晶水;
S13:利用软件对蛋白晶体结构中缺失结构部分进行同源建模补齐。
3.根据权利要求2所述的基于副本交换分子动力学的蛋白质构象变化分析方法,其特征是,S11选择分辨率<的晶体结构;S12要求仅保留蛋白及与蛋白相关的组分;S13要求将除N端和C端外缺失的结构进行补齐。
4.根据权利要求1所述的基于副本交换分子动力学的蛋白质构象变化分析方法,其特征是,S2包括以下步骤:
S21:使用CHARMM36力场对蛋白分子及原子间的相互作用进行表征,并使用TIP3P水分子模型对整个系统进行溶剂化;
S22:对溶剂化后的系统添加离子,使得系统净电荷为零;为对生理系统进行模拟,选用Na+和Cl-对系统电荷进行中和;并将渗透压设置为150mM;
S23:对模拟系统进行退火模拟,在100ps内将系统从3K升温至310K;
S24:使用V-rescale算法对模拟体系温度进行耦合,在NVT系综下进行100ps模拟;
S25:使用Parrinello-Rahman算法对模拟体系压强进行耦合,在NPT系综下进行100ps模拟;
S26:对多轮预平衡后的系统进行时长为数百纳秒到微秒量级的解除约束后的常规分子动力学模拟,系统选用蛙跳算法进行积分;使用LINCS算法将含有氢原子的键转化为约束,短程非键相互作用的截断半径设置为1.0nm,使用粒子网络方法计算长程经典相互作用;
S27:对模拟后的系统轨迹进行提取,对系统的宏观特性和动力学行为进行探究。
5.根据权利要求4所述的基于副本交换分子动力学的蛋白质构象变化分析方法,其特征是,系统处于电中性的系统中,并将渗透压保持为150mM;在NVT和NPT系综下的预平衡模拟时间均设置为100ps。
6.根据权利要求4所述的基于副本交换分子动力学的蛋白质构象变化分析方法,其特征是,分别使用V-rescale算法及Parrinello-Rahman算法对模拟体系的温度和压强进行耦合。
7.根据权利要求1所述的基于副本交换分子动力学的蛋白质构象变化分析方法,其特征是,S3包括以下步骤:
S31:从常规分子动力学模拟中按照一定步长生成具有稳定构象的蛋白结构文件作为副本交换分子动力学模拟的初始构象;
S32:利用副本交换温度生成器工具根据模拟系统生成满足预设交换率下的温度区间;
S33:对模拟系统进行退火模拟,在100ps内将系统从3K升温至对应温度;
S34:使用V-rescale算法对模拟体系温度进行耦合,在NVT系综下进行100ps模拟;
S35:使用Parrinello-Rahman算法对模拟体系压强进行耦合,在NPT系综下进行100ps模拟;
S36:对上述预平衡后的系统进行并行模拟,进行100ns的副本交换分子动力学模拟;
S37:从模拟轨迹中提取反应坐标作为特征向量,绘制自由能图;并提取二级结构信息,计算蛋白构象转变速率。
8.根据权利要求7所述的基于副本交换分子动力学的蛋白质构象变化分析方法,其特征是根据副本交换温度生成器的温度对模拟的配置文件进行温度指派;提取距离反应坐标作为特征向量。
9.根据权利要求7所述的基于副本交换分子动力学的蛋白质构象变化分析方法,其特征
是通过提取轨迹文件中各二级结构的占比,通过拟合参数将预测值与实际值进行残差缩小,
当误差残值达到最小时表明具有最佳的拟合效果。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310785457.7A CN116864015B (zh) | 2023-06-29 | 2023-06-29 | 一种基于副本交换分子动力学的蛋白质构象变化分析方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310785457.7A CN116864015B (zh) | 2023-06-29 | 2023-06-29 | 一种基于副本交换分子动力学的蛋白质构象变化分析方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN116864015A CN116864015A (zh) | 2023-10-10 |
CN116864015B true CN116864015B (zh) | 2024-04-26 |
Family
ID=88231514
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202310785457.7A Active CN116864015B (zh) | 2023-06-29 | 2023-06-29 | 一种基于副本交换分子动力学的蛋白质构象变化分析方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN116864015B (zh) |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105787292A (zh) * | 2014-12-18 | 2016-07-20 | 中国科学院大连化学物理研究所 | 蛋白质折叠的并行预测方法 |
CN107633157A (zh) * | 2017-08-29 | 2018-01-26 | 浙江工业大学 | 一种基于分布估计和副本交换策略的蛋白质构象空间优化方法 |
CN113990401A (zh) * | 2021-11-18 | 2022-01-28 | 北京深势科技有限公司 | 固有无序蛋白的药物分子设计方法和装置 |
CN116092576A (zh) * | 2021-11-03 | 2023-05-09 | 北京深势科技有限公司 | 蛋白质结构优化方法和装置 |
CN116092600A (zh) * | 2022-12-28 | 2023-05-09 | 星希尔生物科技(上海)有限公司 | 一种单gpu副本交换自由能计算方法及系统 |
Family Cites Families (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7925484B2 (en) * | 2003-10-27 | 2011-04-12 | Wayne Dawson | Method for predicting the spatial-arrangement topology of an amino acid sequence using free energy combined with secondary structural information |
CN112669900B (zh) * | 2021-01-05 | 2022-08-05 | 杭州诺莘科技有限责任公司 | 预测/验证激活剂对Sirtuin与烟酰胺腺嘌呤结合效果的影响 |
-
2023
- 2023-06-29 CN CN202310785457.7A patent/CN116864015B/zh active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105787292A (zh) * | 2014-12-18 | 2016-07-20 | 中国科学院大连化学物理研究所 | 蛋白质折叠的并行预测方法 |
CN107633157A (zh) * | 2017-08-29 | 2018-01-26 | 浙江工业大学 | 一种基于分布估计和副本交换策略的蛋白质构象空间优化方法 |
CN116092576A (zh) * | 2021-11-03 | 2023-05-09 | 北京深势科技有限公司 | 蛋白质结构优化方法和装置 |
CN113990401A (zh) * | 2021-11-18 | 2022-01-28 | 北京深势科技有限公司 | 固有无序蛋白的药物分子设计方法和装置 |
CN116092600A (zh) * | 2022-12-28 | 2023-05-09 | 星希尔生物科技(上海)有限公司 | 一种单gpu副本交换自由能计算方法及系统 |
Non-Patent Citations (3)
Title |
---|
Enhanced Sampling and Free Energy Methods to Study Protein Folding and Dynamics;Muthuraja Arun Pravin 等;《Protein Folding Dynamics and Stability》;20230528;165-179 * |
From Quantum Mechanics, Classical Mechanics, and Bioinformatics to Artificial Intelligence Studies in Neurodegenerative Diseases;Orkid Coskuner-Weber 等;《Computer Simulations of Aggregation of Proteins and Peptides》;20220215;139-173 * |
积分方法改进的生物质热解反应速率模型构建;刘宣佐 等;《农业工程学报》;20191231;第35卷(第23期);242-249 * |
Also Published As
Publication number | Publication date |
---|---|
CN116864015A (zh) | 2023-10-10 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Lenoir | Shaping biomedicine as an information science | |
Heinzelmann et al. | Computation of standard binding free energies of polar and charged ligands to the glutamate receptor GluA2 | |
CN115240762A (zh) | 多尺度小分子虚拟筛选方法及系统 | |
Zheng et al. | Protein structure prediction constrained by solution X-ray scattering data and structural homology identification | |
Mirela-Bota et al. | Galaxy InteractoMIX: an integrated computational platform for the study of protein–protein interaction data | |
CN116864015B (zh) | 一种基于副本交换分子动力学的蛋白质构象变化分析方法 | |
Zhang et al. | A novel virtual drug screening pipeline with deep-leaning as core component identifies inhibitor of pancreatic alpha-amylase | |
Hansmann | Protein folding in silico: an overview | |
Dhakal et al. | Predicting protein-ligand binding structure using E (n) Equivariant graph neural networks | |
Chen et al. | A deep learning approach to identify association of disease–gene using information of disease symptoms and protein sequences | |
Forouzesh | Binding free energy of the novel coronavirus spike protein and the human ace2 receptor: An mmgb/sa computational study | |
Sulimov et al. | Supercomputing, docking and quantum mechanics in quest for inhibitors of Papain-like protease of SARS-CoV-2 | |
Čechová et al. | Comparison of three nature inspired molecular docking algorithms | |
Dong et al. | Methods for optimizing the structure alphabet sequences of proteins | |
Borodin et al. | Two-step strategy for the search for ligands for target proteins. | |
Okamoto et al. | Ligand docking simulations by generalized-ensemble algorithms | |
Zhao et al. | Recent advances in protein folding pathway prediction through computational methods | |
Al-Khafaji et al. | Computational techniques for studying protein-protein interactions | |
Gomes et al. | QwikMD 2.0: bridging the gap between sequence, structure, and protein function | |
Alber et al. | Integrative structure determination of protein assemblies by satisfaction of spatial restraints | |
Samish | Search and sampling in structural bioinformatics | |
Litterer et al. | An improved computational approach to predict HIV protein functions | |
Künzel | Studying the binding of phosphorylated peptides to proteins by molecular dynamics simulations | |
Dwevedi | Protein folding: Examining the challenges from synthesis to folded form | |
Kang et al. | Development of a Flexible-receptor Docking Method |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |