CN103827875B - 用于预测质点系统的行为的仿真装置 - Google Patents
用于预测质点系统的行为的仿真装置 Download PDFInfo
- Publication number
- CN103827875B CN103827875B CN201280046929.7A CN201280046929A CN103827875B CN 103827875 B CN103827875 B CN 103827875B CN 201280046929 A CN201280046929 A CN 201280046929A CN 103827875 B CN103827875 B CN 103827875B
- Authority
- CN
- China
- Prior art keywords
- coordinate
- coordinates
- slow
- collective
- fast
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000004088 simulation Methods 0.000 title claims abstract description 115
- 230000033001 locomotion Effects 0.000 claims abstract description 77
- 229920002521 macromolecule Polymers 0.000 claims abstract description 66
- 238000004364 calculation method Methods 0.000 claims abstract description 56
- 230000008859 change Effects 0.000 claims abstract description 39
- 238000000605 extraction Methods 0.000 claims abstract description 33
- 230000009466 transformation Effects 0.000 claims abstract description 30
- 239000002245 particle Substances 0.000 claims description 205
- 238000000034 method Methods 0.000 claims description 130
- 238000005381 potential energy Methods 0.000 claims description 66
- 108090000623 proteins and genes Proteins 0.000 claims description 55
- 102000004169 proteins and genes Human genes 0.000 claims description 55
- 238000009739 binding Methods 0.000 claims description 42
- 108020004707 nucleic acids Proteins 0.000 claims description 32
- 102000039446 nucleic acids Human genes 0.000 claims description 32
- 150000007523 nucleic acids Chemical class 0.000 claims description 32
- 239000013598 vector Substances 0.000 claims description 24
- 239000011159 matrix material Substances 0.000 claims description 13
- 230000015572 biosynthetic process Effects 0.000 claims description 10
- 230000005484 gravity Effects 0.000 claims description 10
- 230000002123 temporal effect Effects 0.000 claims description 9
- 230000014509 gene expression Effects 0.000 claims description 8
- 238000006467 substitution reaction Methods 0.000 claims description 2
- 230000006870 function Effects 0.000 description 58
- 238000006243 chemical reaction Methods 0.000 description 41
- 125000004429 atom Chemical group 0.000 description 29
- 239000004576 sand Substances 0.000 description 26
- 230000008569 process Effects 0.000 description 20
- 238000004458 analytical method Methods 0.000 description 14
- 238000000926 separation method Methods 0.000 description 14
- 238000010586 diagram Methods 0.000 description 10
- 230000002441 reversible effect Effects 0.000 description 10
- 230000003044 adaptive effect Effects 0.000 description 9
- 238000012916 structural analysis Methods 0.000 description 9
- 230000003993 interaction Effects 0.000 description 8
- 230000009467 reduction Effects 0.000 description 8
- 230000000694 effects Effects 0.000 description 7
- 238000000329 molecular dynamics simulation Methods 0.000 description 7
- 230000005658 nuclear physics Effects 0.000 description 7
- 230000004888 barrier function Effects 0.000 description 6
- 239000003814 drug Substances 0.000 description 6
- 229940079593 drug Drugs 0.000 description 6
- 230000006872 improvement Effects 0.000 description 6
- 238000005182 potential energy surface Methods 0.000 description 6
- 150000001875 compounds Chemical class 0.000 description 5
- 239000011295 pitch Substances 0.000 description 5
- 238000012545 processing Methods 0.000 description 5
- 238000012216 screening Methods 0.000 description 5
- 239000013543 active substance Substances 0.000 description 4
- 238000011161 development Methods 0.000 description 4
- 230000006698 induction Effects 0.000 description 4
- 101001024120 Homo sapiens Nipped-B-like protein Proteins 0.000 description 3
- 102100035377 Nipped-B-like protein Human genes 0.000 description 3
- 229940000406 drug candidate Drugs 0.000 description 3
- 230000007246 mechanism Effects 0.000 description 3
- 125000004433 nitrogen atom Chemical group N* 0.000 description 3
- 239000000126 substance Substances 0.000 description 3
- 101100240606 Caenorhabditis elegans scc-2 gene Proteins 0.000 description 2
- 108010036176 Melitten Proteins 0.000 description 2
- 238000000342 Monte Carlo simulation Methods 0.000 description 2
- 238000002441 X-ray diffraction Methods 0.000 description 2
- 230000008901 benefit Effects 0.000 description 2
- 230000015556 catabolic process Effects 0.000 description 2
- 238000004587 chromatography analysis Methods 0.000 description 2
- 238000002939 conjugate gradient method Methods 0.000 description 2
- 238000010276 construction Methods 0.000 description 2
- 230000008602 contraction Effects 0.000 description 2
- 230000007423 decrease Effects 0.000 description 2
- 238000006731 degradation reaction Methods 0.000 description 2
- 230000004069 differentiation Effects 0.000 description 2
- 238000007877 drug screening Methods 0.000 description 2
- 239000000284 extract Substances 0.000 description 2
- 238000011049 filling Methods 0.000 description 2
- 239000003446 ligand Substances 0.000 description 2
- VDXZNPDIRNWWCW-JFTDCZMZSA-N melittin Chemical compound NCC(=O)N[C@@H]([C@@H](C)CC)C(=O)NCC(=O)N[C@@H](C)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(=O)NCC(=O)N[C@@H](CC(C)C)C(=O)N1CCC[C@H]1C(=O)N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CO)C(=O)N[C@H](C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(N)=O)CC1=CNC2=CC=CC=C12 VDXZNPDIRNWWCW-JFTDCZMZSA-N 0.000 description 2
- 230000000877 morphologic effect Effects 0.000 description 2
- 239000002547 new drug Substances 0.000 description 2
- 238000004806 packaging method and process Methods 0.000 description 2
- 230000000737 periodic effect Effects 0.000 description 2
- 238000011002 quantification Methods 0.000 description 2
- 238000013139 quantization Methods 0.000 description 2
- 230000006641 stabilisation Effects 0.000 description 2
- 238000011105 stabilization Methods 0.000 description 2
- 238000002945 steepest descent method Methods 0.000 description 2
- OVSKIKFHRZPJSS-UHFFFAOYSA-N 2,4-D Chemical compound OC(=O)COC1=CC=C(Cl)C=C1Cl OVSKIKFHRZPJSS-UHFFFAOYSA-N 0.000 description 1
- 101100391182 Dictyostelium discoideum forI gene Proteins 0.000 description 1
- 241000282890 Sus Species 0.000 description 1
- 150000001413 amino acids Chemical class 0.000 description 1
- 230000003321 amplification Effects 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- 238000005452 bending Methods 0.000 description 1
- 239000000470 constituent Substances 0.000 description 1
- 238000007796 conventional method Methods 0.000 description 1
- 239000013078 crystal Substances 0.000 description 1
- 230000007850 degeneration Effects 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 150000004676 glycans Chemical class 0.000 description 1
- 230000036571 hydration Effects 0.000 description 1
- 238000006703 hydration reaction Methods 0.000 description 1
- 239000003112 inhibitor Substances 0.000 description 1
- 230000010354 integration Effects 0.000 description 1
- 150000002632 lipids Chemical class 0.000 description 1
- 230000007774 longterm Effects 0.000 description 1
- 238000003032 molecular docking Methods 0.000 description 1
- 238000003199 nucleic acid amplification method Methods 0.000 description 1
- 239000002773 nucleotide Substances 0.000 description 1
- 125000003729 nucleotide group Chemical group 0.000 description 1
- 230000037361 pathway Effects 0.000 description 1
- 229920001282 polysaccharide Polymers 0.000 description 1
- 239000005017 polysaccharide Substances 0.000 description 1
- 238000005036 potential barrier Methods 0.000 description 1
- 238000007614 solvation Methods 0.000 description 1
- 238000003786 synthesis reaction Methods 0.000 description 1
- 230000007704 transition Effects 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F30/00—Computer-aided design [CAD]
- G06F30/20—Design optimisation, verification or simulation
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B15/00—ICT specially adapted for analysing two-dimensional or three-dimensional molecular structures, e.g. structural or functional relations or structure alignment
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B15/00—ICT specially adapted for analysing two-dimensional or three-dimensional molecular structures, e.g. structural or functional relations or structure alignment
- G16B15/30—Drug targeting using structural data; Docking or binding prediction
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16C—COMPUTATIONAL CHEMISTRY; CHEMOINFORMATICS; COMPUTATIONAL MATERIALS SCIENCE
- G16C10/00—Computational theoretical chemistry, i.e. ICT specially adapted for theoretical aspects of quantum chemistry, molecular mechanics, molecular dynamics or the like
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F2111/00—Details relating to CAD techniques
- G06F2111/10—Numerical modelling
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16C—COMPUTATIONAL CHEMISTRY; CHEMOINFORMATICS; COMPUTATIONAL MATERIALS SCIENCE
- G16C20/00—Chemoinformatics, i.e. ICT specially adapted for the handling of physicochemical or structural data of chemical particles, elements, compounds or mixtures
- G16C20/30—Prediction of properties of chemical compounds, compositions or mixtures
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16C—COMPUTATIONAL CHEMISTRY; CHEMOINFORMATICS; COMPUTATIONAL MATERIALS SCIENCE
- G16C20/00—Chemoinformatics, i.e. ICT specially adapted for the handling of physicochemical or structural data of chemical particles, elements, compounds or mixtures
- G16C20/50—Molecular design, e.g. of drugs
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Life Sciences & Earth Sciences (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Health & Medical Sciences (AREA)
- General Health & Medical Sciences (AREA)
- Chemical & Material Sciences (AREA)
- Bioinformatics & Computational Biology (AREA)
- Biotechnology (AREA)
- Biophysics (AREA)
- Medical Informatics (AREA)
- Evolutionary Biology (AREA)
- Crystallography & Structural Chemistry (AREA)
- Computing Systems (AREA)
- Evolutionary Computation (AREA)
- Geometry (AREA)
- Computer Hardware Design (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Medicinal Chemistry (AREA)
- Pharmacology & Pharmacy (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
- Measuring And Recording Apparatus For Diagnosis (AREA)
- Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
- Measurement Of The Respiration, Hearing Ability, Form, And Blood Characteristics Of Living Organisms (AREA)
Abstract
为了在用于预测包括生物大分子的系统的动力学行为的模拟中实现改进的计算准确性和减少的计算时间,提供了一种模拟装置(10),其包括:用于基于质点坐标设置慢坐标和快坐标的坐标设置装置(16);用于通过使快坐标从属于慢坐标来获得快坐标的结构并且通过考虑由于慢坐标的变化导致的快坐标的变化对于慢坐标的影响来获得作为集体坐标的函数的慢坐标的结构的坐标提取装置(18);以及逆变换装置(20),用于基于能够获得为运动方程的解的集体坐标、慢坐标的结构和快坐标的结构来预测质点坐标的演变。
Description
技术领域
本发明涉及一种用于使用计算机预测模型化质点系统的动力学行为的仿真装置和仿真方法。本发明还涉及一种用于实现该方法的程序和记录介质。
背景技术
随着计算机技术的发展,已进行了深入的研究以尝试通过使用理论计算的仿真来在逻辑上澄清诸如蛋白质、核酸、脂质和多糖的生物大分子的原子级别的动力学大变形行为。更具体地讲,这类研究可以包括其中在理论上预测靶蛋白和结合的候选分子(用于针对是否具有与靶蛋白的结合亲和性的分析的靶分子)之间的亲和性的药物筛选以及其中揭示来自蛋白质的一级序列的三维结构的构造机制以在理论上从一级结构构造高维结构的蛋白质的折叠机制的分析。
用于预测生物大分子的动力学行为的仿真方法可以包括例如在原子级别甚至对于大分子也能够执行仿真的分子动力学方法和基于蒙特卡洛方法的仿真方法,例如在下面的非专利文献中所描述的:T.J.A.Ewing和I.D.Kuntz,“Critical evaluation of searchalgorithms for automated molecular docking and database screening”,Journal ofComputational Chemistry,Vol.18,Issue9,pp.1175–1189,1997、G.M.Morris等人,“Automated docking using a Lamarckian genetic algorithm and an empiricalbinding free energy function”,Journal of Computational Chemistry,Vol.19,Issue14,pp.1639–1662,1998、M.Rarey等人,“A Fast Flexible Docking Method usingan Incremental Construction”,Journal of Molecular Biology,Vol.261,Issue3,pp.470-489,1996、R.Abagyan等人,“ICM-A new method for protein modeling anddesign:Applications to docking and structure prediction from the distortednative conformation”,Journal of Computational Chemistry,Vol.15,Issue5,pp.488–506,1994、G.Jones等人,“Development and validation of a genetic algorithm forflexible docking”,Journal of Molecular Biology,Vol.267,Issue3,pp.727-748,1997、R.A.Friesner等人,“Glide:ANew Approach for Rapid,Accurate Docking andScoring.1.Method and Assessment of Docking Accuracy”,Journal of MedicinalChemistry,Vol.47,Issue7,pp.1739–1749,2004、T.A.Halgren等人,“Glide:A NewApproach for Rapid,Accurate Docking and Scoring.2.Enrichment Factors inDatabase Screening”,Journal of Medicinal Chemistry,Vol.47,Issue7,pp.1750–1759,2004。根据分子动力学方法,多原子系统的时间演化可以根据运动方程以小的时间间隔顺序地跟踪。在包括生物大分子的多原子系统的势能面上存在尽可能多的局部极小或许多势垒,前述方法具有下述问题:即多原子系统的状态陷于接近初始结构的局部最小,从而需要的大量的计算时间。这个问题也适用于基于蒙特卡罗方法的方法。
发明内容
因此,作为解决局部最小的陷入的问题的方法,已知下述计算方法,其中将“强制力”施加到基于分子动力学方法的计算从局部最小的陷入脱出。例如,日本未审专利公开号2005-267592和PCT日本公开号2005-524129、PCT日本再公开号2006/068271和非专利文献Y.Fukunishi等人,“The Filling Potential Method:A Method for Estimating theFree Energy Surface for Protein-Ligand Docking”,THE JOURNAL OF PHYSICALCHEMISTRY B,Vol.107,Issue47,pp.13201–13210,2003以及Y.Sugita和Y.Okamoto,“Replica-exchange molecular dynamics method for protein folding”,ChemicalPhysics Letters,Vol.314,Issues1-2,pp.141-151,1999公开了依次引入虚拟相互作用使得多原子系统不再采用同样的结构或在多原子系统中在高温相的加速运动中发现的结构依次反映在低温相中的多原子系统中的运动中。这样的相互作用等的引入可以加速多原子系统所通过的势能表面的路径搜索,从而允许计算生物大分子的动力学行为。
然而,基于描述代表模型化的生物大分子等等的质点系统的运动方程并使用分子动力学来通过关于时间的积分预测质点系统的行为的计算带来了下述问题,即仿真的计算时间和计算精度处于折衷关系。更具体地,在日本未审查专利公开号2005-267592和PCT日本公开号2005-524129、PCT日本再公开号2006/068271和非专利文献Y.Fukunishi等人,“The Filling Potential Method:A Method for Estimating the Free Energy Surfacefor Protein-Ligand Docking”,THE JOURNAL OF PHYSICAL CHEMISTRY B,Vol.107,Issue47,pp.13201–13210,2003和Y.Sugita和Y.Okamoto,“Replica-exchange moleculardynamics method for protein folding”,Chemical Physics Letters,Vol.314,Issues1-2,pp.141-151,1999中公开的仿真方法中,质点系统所固有的运动顺序被施加的“强制力”破坏,从而,虽然计算时间缩短了,但是作为计算结果,计算出了不合理地大的变形的行为。随着“强制力”的作用变大以便于更高效地从局部最小值的陷入中脱出,该趋势变得越来越严重。
鉴于上述的情况开发了本发明,并且本发明的目的在于提供一种能够在预测质点系统的动力学行为的仿真中提高计算准确性同时减少计算时间的仿真装置和仿真方法。本发明的另一目的在于提供一种实施该方法的程序和记录介质。
为了解决上述问题,根据本发明的仿真装置是一种用于预测由模型化的N个质点构成的质点系统的行为的装置,该装置包括:
坐标设置装置,用于基于描述质点系统的结构的3N个质点坐标设置慢坐标,慢坐标是主要呈现质点系统的结构变化的M个坐标,并且设置快坐标,该快坐标是描述质点系统的结构并且独立于慢坐标的坐标;
坐标提取装置,用于通过使快坐标从属于慢坐标来获得作为慢坐标的函数的快坐标的结构,并且通过考虑由于慢坐标的变化导致的快坐标的变化对慢坐标的影响来获得作为通过正则变换与慢坐标关联的一般坐标的K个集体坐标的函数的慢坐标的结构,其中,所述一般坐标由随时间变化的变化分量和用作相对于时间的常数的不变分量构成并且K个集体坐标是一般坐标的可变分量;以及
逆变换装置,用于基于能够获得为关于集体坐标的运动方程的解的作为时间的函数的集体坐标、慢坐标的结构以及快坐标的结构来预测质点系统的时间演变。
此处K、M和N满足关系式K<M<3N,并且均表示不小于1的整数。
本文使用的术语“质点系统的结构”是指由构成质点系统N个质点形成的三维结构。
本文使用的术语“主要呈现质点系统中的结构变化的慢坐标”是指对于质点系统的三维结构的形成施加大的影响的坐标。
本文使用的术语“设置慢坐标”是指将质点坐标中的一些坐标本身、能够通过组合质点坐标来定义的坐标或者它们的组合设置为慢坐标。这同样适用于快坐标。
优选地,根据本发明的仿真装置的坐标提取装置是通过下述方式获得慢坐标的结构的装置:
执行第一步骤,该第一步骤用于获得表示为慢坐标和快坐标的函数的势能V;
执行第二步骤,该第二步骤用于使用势能根据绝热近似条件使快坐标从属于慢坐标;
在慢坐标和快坐标的当前状态下,执行第三步骤,该第三步骤用于通过考虑到上述影响来获得关于慢坐标的势能的差分系数;
在势能的差分系数下,执行第四步骤,该第四步骤用于使用势能的差分系数根据自洽集体坐标方法的基本方程获得关于集体坐标的慢坐标的差分系数;
在慢坐标的差分系数下,执行第五步骤,该第五步骤用于以小量更新集体坐标并且获得更新后的慢坐标;
在更新后的慢坐标下,执行第六步骤,该第六步骤用于对于从属于慢坐标的快坐标进行结构弛豫;以及
此后,基于快坐标的结构弛豫之后的状态中的慢坐标和快坐标重复第三至第六步骤。
本文使用的术语“在当前状态下的慢坐标和快坐标下”是指第一次在由坐标设置装置设置的状态下的慢坐标和快坐标下执行第三步骤,并且在第二次以后,在紧前的第六步骤中对于快坐标执行结构弛豫之后的状态中的慢坐标和快坐标下执行第三步骤。
优选地,在本发明的仿真装置中,通过使用下面给出的式1至3中的至少一个的方法来考虑上述影响。
式1
式2
式3
如本文所用,下面参考以下:
i、j和k均表示从1到M的范围内的整数;
α、β和γ均表示1至3N-M的范围内的整数;
RSi表示质点系统中的第i个慢坐标;
RFα表示质点系统中的第α个快坐标;
RS表示(RS1,RS2,------,RSM);
RF表示(RF1,RF2,------,RF(3N-M));
RF(RS)表示从属于慢坐标的快坐标;
V(RS,RF)表示由慢坐标和快坐标表示的质点系统的势能;并且
VEFF(RS)表示将RF(RS)代入V(RS,RF)获得的有效势能。
在式2中,第三项中的表示通过在第二项中相互替换字母i和j获得的项(即,通过在第二项中与将i替换为j并且将j替换为i获得的项,下同)。
在式3中,第三项中的表示通过在第二项中相互替换字母i和k获得的项,第四项中的表示通过在第二项中相互替换字母j和k获得的项,第六项中的表示通过在第五项中相互替换字母i和k获得的项,并且第七项中的 表示通过在第五项中相互替换字母j和k获得的项。
此外,在式1至3中,使用下面给出的式4。
式4
其中:Kαβ -1(RS)表示Kαβ(RS)的逆矩阵,以及
Kαβ(RS)和Jαi(RS)分别由下面给出的式5和6定义。
式5
式6
优选地,在本发明的仿真装置中,绝热近似条件为下面给出的式7。
对于α=1,...,3N-M 式(7)
优选地,在本发明的仿真装置中,集体坐标的数目K满足K=l并且自洽集体坐标方法的基本方程由下面给出的式8和9来表示。
对于i=1,...,M 式8
对于 i=1,...,M 式9
如本文所用,下面参考以下:
q1表示集体坐标;
mi表示质点系统中的第i个慢坐标的质量;
表示满足式9的函数(本征向量)的第i分量;以及
Λ(RS)表示满足式9的函数(本征值)。
替选地,在本发明的仿真装置中,优选的是,集体坐标的数目K满足K=1,并且自洽集体坐标方法的基本方程由下面给出的式10至12表示。
对于 i=1,...,M 式10
式11
对于 i=1,...,M
式12
其中,和κ(RS,λ)是满足式12的函数,并且,表示第i分量,并且λ表示辅助坐标(独立于慢坐标的作为集体坐标的函数的变量)。
优选地,在本发明的仿真装置中,坐标提取装置是下述装置,其通过在求解基本方程中增加独立于慢坐标而处理的并且作为集体坐标(即,辅助坐标)的函数的变量的数目以便于在基本方程中消除关于集体坐标的慢坐标或辅助坐标的差分系数的符号的任意性来在第四步骤中执行计算。
此外,在辅助坐标的数目增加的情况下,优选的是,坐标提取装置是下述装置,其根据由由于其结果获得的下面给出的式13表示的基本方程执行计算。更进一步,在这种情况下,集体坐标的数目K满足K=1。
对于 μ=1,...,K 式13
其中,Y是由下面给出的式14定义的MK+M+K维向量,并且vμ是由下面给出的式15的非齐次线性方程的解向量。
式14
Cvμ=sμ对于 μ=1,...,K 式15
式15中的C和sμ分别由下面给出的式16和17进行定义。
式16
对于 μ=1,...,K 式17
其中,Vij(RS)和Vijk(RS)分别由下面给出的式18和19定义。
式18
式19
其中,μ和ν均表示从1至K的范围内的整数,qμ表示第μ个集体坐标,并且和Λμ均表示辅助坐标。
替选地,在辅助坐标的数目增加的情况下,优选的是,坐标提取装置是下述装置,其根据由于其结果而获得的在下面给出的式20表示的基本方程来执行计算。此外,在这种情况下,集体坐标的数目K满足K=1。
对于 μ=1,...,K 式20
其中,Z是由下面给出的式21定义的MK+M+2K维向量,cμν为唯一确定的常数,使得关于每个μ定义的下面示出的式22表示的值最小,并且wμ表示跨越由下面给出的式23定义的矩阵D的K维奇异值空间的MK+M+2K维K单位向量。注意,如一样,λμ和ρμ均表示独立于RS的辅助坐标。
式21
式22
式23
优选地,在本发明的仿真装置中,坐标提取装置是基于下面给出的式24计算势能的三阶导数的项的装置。Φi表示任意向量的第i分量并且n由下面给出的式25定义。
式24
式25
优选地,在本发明的仿真装置中,坐标设置装置是下述装置,其将从质点系统的结构的每个特征部分结构提取的表示该特征部分结构的代表坐标设置为慢坐标。
本文使用的术语“特征部分结构”是指质点系统的结构的具有形态和/或功能特征的部分结构。
在本发明的仿真装置中,该质点系统可以是包括生物大分子的多原子系统,部分结构可以是生物大分子的二级结构、生物大分子的构建块或生物大分子的主链,并且各部分结构的代表坐标是构成部分结构的各原子的坐标、通过组合原子的坐标而定义的坐标或者部分结构的节距。
在本发明的仿真装置中,如果质点系统是包括生物大分子的多原子系统,则优选的是,所述生物大分子是蛋白质,部分结构是蛋白质的二级结构,并且二级结构的代表坐标是构成二级结构的原子组的重心的坐标或者二级结构的屈曲角。在这种情况下,优选的是二级结构是螺旋结构、β折叠、转角、环和无规卷曲中的至少一个。
进一步,在本发明的仿真装置中,如果质点系统是包括生物大分子的多原子系统,则优选的是,所述生物大分子是蛋白质,部分结构是蛋白质的残基,并且残基的代表坐标是构成残基的原子组的重心坐标。
仍然进一步地,在本发明的仿真装置中,如果质点系统是包括生物大分子的多原子系统,则优选的是,所述生物大分子是蛋白质,部分结构是蛋白质的主链,并且主链的代表坐标是构成主链的每个原子的坐标。
进一步,在本发明的仿真装置中,如果质点系统是包括生物大分子的多原子系统,则优选的是,所述生物大分子是核酸,部分结构是核酸的二级结构,并且二级结构的代表坐标是构成二级结构的原子组的重心的坐标或者二级结构的屈曲角。在该情况下,优选的是,二级结构是螺旋结构。
进一步,在本发明的仿真装置中,如果质点系统是包括生物大分子的多原子系统,则优选的是,所述生物大分子是核酸,部分结构是核酸的残基,并且残基的代表坐标是构成残基的原子组的重心坐标。
仍然进一步地,在本发明的仿真装置中,如果质点系统是包括生物大分子的多原子系统,则优选的是,所述生物大分子是核酸,部分结构是核酸的主链,并且主链的代表坐标是构成主链的每个原子的坐标。
进一步,在本发明的仿真装置中,如果质点系统是包括生物大分子的多原子系统,则优选的是,所述生物大分子是核酸,部分结构是核酸的螺旋结构,并且螺旋结构的代表坐标是螺旋结构的节距。
仍然进一步地,在本发明的仿真装置中,多原子系统可以包括用于生物大分子的结合候选分子。
本发明的仿真方法是用于利用上述仿真装置来预测由模型化的N个质点构成的质点系统的行为的方法,该方法包括以下步骤:
基于描述质点系统的结构的3N个质点坐标设置慢坐标,慢坐标是主要呈现质点系统的结构变化的M个坐标,
设置快坐标,快坐标是描述质点系统的结构并且独立于慢坐标的坐标;
通过使快坐标从属于慢坐标来获得作为慢坐标的函数的快坐标的结构;
通过考虑由于慢坐标的变化导致的快坐标的变化对慢坐标的影响来获得作为通过正则变换与慢坐标关联的一般坐标的K个集体坐标的函数的慢坐标的结构,其中,所述一般坐标由随时间变化的变化分量和用作相对于时间的常数的不变分量构成并且K个集体坐标是一般坐标的可变分量;以及
基于能够获得为关于集体坐标的运动方程的解的作为时间的函数的集体坐标、慢坐标的结构以及快坐标的结构来预测质点系统的时间演变。
本发明的仿真程序是用于使计算机执行上面描述的仿真方法的程序。
本发明的计算机可读记录介质是其上记录上述仿真程序的介质。
本发明的仿真装置包括上述坐标设置装置、坐标提取装置以及逆变换装置,并通过引入分级的慢坐标,通过考虑由于慢坐标的变化导致的快坐标的变化对慢坐标的影响来提取描述质点系统的集体且本征行为的集体运动理论中的集体坐标,并且求解关于集体坐标的运动方程来预测质点的时间演变。因此,集体坐标的提取允许在原子级别执行仿真并且引入慢坐标允许减少为提取集体坐标而处理的坐标的数目。因此,在用于预测质点系统的动力学行为的仿真中可以实现计算精度的改进和计算时间的减少。
本发明的仿真方法是用于利用上述仿真装置的方法并且通过引入分级的慢坐标,通过考虑由于慢坐标的变化导致的快坐标的变化对慢坐标的影响来提取描述质点系统的集体且本征行为的集体运动理论中的集体坐标,并且关于集体坐标求解运动方程来预测质点的时间演变。因此,集体坐标的提取允许在原子级别执行仿真并且引入慢坐标允许减少为提取集体坐标而处理的坐标的数目。因此,在用于预测质点系统的动力学行为的仿真中可以实现计算精度的改进和计算时间的减少。
本发明的程序和记录介质可以使得执行上述仿真方法,从而在用于预测质点系统的动力学行为的仿真中可以实现计算精度的改进和计算时间的减少。
附图说明
图1是示出在本发明的仿真方法中考虑诱导契合的情况下蛋白质与结合候选分子的结合过程的示意图。
图2是示出其中考虑了诱导契合的包括蛋白质和结合候选分子的多原子系统的概念性势能面上的反应路径的示意图。
图3是概念性地示出使用集体坐标的提取获得多原子系统的反应路径的处理的视图。
图4示出了变量变换和逆变换的概念。
图5是示意性地示出其构造的根据实施方式的仿真装置的框图。
图6A是示意性地示出根据实施方式的仿真方法的计算步骤的流程图。
图6B是示意性地示出根据实施方式的仿真方法的计算步骤的流程图。
图7示意性地示出慢坐标RS、快坐标RF和原子坐标x之间的关系。
图8是示出由根据实施方式的仿真方法获得的预定复合体的反应路径的图。
图9是示出图8的图中所示的复合体的结合过程的示意图,其中,A和B分别示出了复合体的结合过程的起始状态和最终状态。
图10是示出其中消除了符号的任意性的计算与其中没有消除符号的任意性的计算之间的比较的结果的图。
具体实施方式
下面,将参考附图详细描述本发明的实施方式,但是将理解的是,本发明不限于实施方式。注意的是,为了方便视觉识别,附图中的每个组件不必按比例绘制。
在详细描述之前,将首先描述本发明所基于的技术理念和本发明的背景以便于澄清本发明相对于现有技术的技术优势。为了解释的清楚起见,将具体描述预测包括生物体大分子与结合候选分子的复合体的多原子系统的动力学行为的情况。
从减少开发周期和成本的角度,像上述那样的多原子系统的动力学行为的预测例如在新药开发中起到了重要的作用。诸如药物的生理活性物质可以通过结合到特定蛋白质而表现出化学性质。因此,在新药开发中,需要从数十万到数百万的大量化合物中减少可能结合到目标蛋白质的候选的数目(药物筛选)。此外,最终需要将药物候选减少到大约几个候选。为了高效地从大量化合物中减少药物候选,需要在原子级别处理多原子系统的行为并且准确地评估分子之间(进一步地,原子之间)的相互作用。
图1是示出考虑蛋白质的动力学行为的情况下的蛋白质与结合候选分子的结合过程的示意图。蛋白质2具有用于结合结合候选分子6的口袋4。即,结合候选分子6能够说是蛋白质2的生理活性物质。然而,注意的是,口袋4不必具有允许结合候选分子6直接契合在其中的形状(图1的a)。例如,图1示出了口袋4的开口的大小小于结合候选分子6的大小。因此,在这样的情况下,蛋白质2根据与接近的结合候选分子6的相互作用改变其结构以便于使开口的形状和大小适应结合候选分子6的形状和大小(图1的b和c)。
诸如蛋白质、核酸等等的生物大分子以上述方式由于与生理活性物质的相互作用而改变其结构的现象被称为“诱导契合”。为了准确地计算分子之间的相互作用,自然应该考虑“诱导契合”。这能够通过在原子级别处理多原子系统来实现。
图2是示出考虑了诱导契合的多原子系统的概念性势能面上的反应路径的示意图。图2的水平轴X1概念性地示出了蛋白质的结构改变并且竖直轴X2示出了蛋白质与结合候选分子之间的距离。即,图2表示根据蛋白质的结构改变和分子之间的距离的多原子系统的势能面。如图2中所示,其中发生诱导契合的系统在连接两个稳定点(复合体处于解体的点A和复合体的结合完成的点B)的反应路径RP上具有能量势垒B(鞍点)。
因此,为了通过考虑诱导契合分析蛋白质2与结合候选分子6的结合过程,有效的是,针对蛋白质2和结合候选分子6,在势能面上的能量势垒B上搜索连接两个稳定点A和C的反应路径。
鉴于此,为了在用于预测多原子系统的动力学行为的仿真中实现改进的计算准确性和计算时间的减少,需要使得能够在原子级别处理多原子系统并且使得容易搜索从头算的反应路径。
然而,具有几千到几百万原子的多原子系统的行为是缓慢并且在从一秒到一小时的量级的时间尺度上发生的变形较大。这对于传统的仿真方法引起了下述问题,即,理论计算虽然在原子级别处理多原子系统,但是要求数十年的大量时间。因此,为了使得能够在可行的时间段内对于多原子系统的行为执行理论计算,已经研究或开发了各种仿真方法。其中施加“强制力”的分子动力学方法是这样的仿真方法中的一种,但是其具有上述问题。也正在研究通过将目标蛋白质近似为刚体并且减少使用的变量的数目来减少计算量的另一方法。但是这样的粗略近似自然不能够考虑蛋白质的动力学行为的影响,使得不能够正确地计算分子之间的相互作用。例如,在这样的情况下,一百万候选化合物可以仅缩小到一万化合物作为药物候选。在其它仿真方法也仍然存在计算时间与计算准确性之间的权衡关系的问题。
本发明人已经提出了下述理念:将包括生物大分子的多原子系统建模为具有N个质点的质点系统,然后将质点系统的行为处理为集体运动并且从基于质点坐标的集体运动中提取具有小于质点坐标的自由度的集体坐标(一维地描述质点系统的结构的质点的坐标)(集体坐标)。
现在将描述集体坐标。一般来说,术语“集体坐标”是指集体变量的坐标元素。术语“集体变量”是指通过正则变换与质点系统的正则变量(质点系统中的质点坐标和质点动量)关联的具有小于正则变量的自由度的一般变量(q,p)中的一个。在通过正则变换关联的一般变量(q,p)中,q表示坐标元素,并且p表示动量元素。坐标元素q和动量元素p分别由下面给出的式26和27来定义。
q≡(q1,...,qη,...,q3N) 式26
p≡(p1,...,pη,...,p3N) 式27
在式26和27中,η表示从1至3N的范围内的整数。
因此,使用分别由下面给出的式28和29定义的和可以将集体变量表示为
式28
式29
式28和29表示集体变量包括在式28和29中的每一个中由μ=1至K表示的2K个变量。换言之,能够说集体变量是由随时间变化的可变分量(q1,q2,-----,qK,p1,p2,-----,pK)和用作相对于时间的常数的不可变分量(qK+1=0,qK+2=0,-----,q3N=0,pK+1=0,pK+2=0,-----,p3N=0)构成的一般坐标的可变分量。虽然式28和29表示不可变分量取零值作为常数,但是该常数不限于零。
然后,由于集体坐标是集体变量的坐标元素,因此,其可以表示为更具体地,集体坐标是由((q1,q2,-----,qK)构成的一组变量。注意的是,集体变量可以仅通过正则变换从质点坐标获得。
以上述方式从将处理为集体运动的坐标到具有较小的自由度的集体坐标的变量变换也称为“变量分离”。
对于集体坐标的自由度没有任何限制,只要其小于变量分离的对象坐标的自由度。但是,由于自由度越小使得接下来的计算操作越容易,因此,集体坐标的自由度优选地为1(即,K=1)。
(作为集体运动的处理)
对于质点坐标的变量分离允许质点系统的行为中的本征运动(即,低维集体运动)由集体坐标来描述。因此,由3N维质点坐标进行的运动的描述被替换为由K维集体坐标进行的运动的描述,从而质点系统的运动的描述得到了简化。更具体地,由质点坐标描述的运动方程被简化为具有集体坐标作为变元的质点坐标x的结构与关于的运动方程的组合。注意的是,x表示(x1,x2,-----,x3N)。质点坐标的具体结构将行为的方式表示为质点系统的集体运动并且关于集体坐标的运动方程表示行为的基本法则。因此,随着用于求解运动方程的处理变量的自由度进一步减少,理论计算变得更加容易。
然后,对于质点坐标x执行变量分离以找出关于集体坐标的势能面上的反应路径并且集体坐标被逆变换为质点坐标x以表示关于质点坐标x的势能面上的反应路径。以该方式,可以获得质点系统的反应路径。根据上述方法,在求解低维运动方程之后,仅从集体坐标到质点坐标x执行变量变换。因此,质点系统将不会固有地陷入本地最小。
例如,用于获得图2中所示的包括复合体的多原子系统的反应路径的概念性过程如下。图3是概念性地示出使用集体坐标的提取获得多原子系统的反应路径的过程的视图。首先,将关于质点坐标X1、X2的势能面(图3中的a)变换为所提取的集体坐标q1、q2的势能面(图3中的b)。这里,作为集体坐标,重要的是,采用其中两个稳定点A、C和能量势垒B在直线上对齐的集体坐标。连接两个稳定点A、C的反应路径RP可以关于这样的集体坐标q1、q2在势能面上一次绘制(图3中的b)。之后,对坐标进行逆变换并且获得关于变量X1、X2的势能面上的反应路径RP。这里获得的一维轨迹可以是识别为在理论化学中长期使用的“反应坐标”的变量。
(将包括生物大分子的多原子系统的行为处理为集体运动的问题)
基于集体运动理论来执行变量分离。作为集体运动理论之一,例如,可以采用自洽集体坐标(SCC)方法。SCC方法是物理学中在原子核领域中研究的集体运动理论之一。更具体地,SCC方法是下述运动理论,其获得描述系统的集体运动的固有集体变量,然后从系统的哈密尔顿中包括的正则变量所横跨的6N维相空间找出离散流形,并且通过在离散流形或其邻近上限定的哈密尔顿来描述集体运动。本文使用的术语“离散流形”是指表示系统的行为的轨迹被约束在其中的系统的哈密尔顿中包括的正则变量所横跨的6N维相空间的部分空间。即,在离散流形中的任一任意点用作初始值的情况下,轨迹始终被约束在离散流形中。关于SCC方法的更多细节,请参见S.Tomonaga,“Elementary Theory of Quantum-Mechanical Collective Motion of Particles,II”,Progress of TheoreticalPhysics,Vol.13,No.5,pp.482-496,1955,T.Marumori等人,“Self-ConsistentCollective-Coordinate Method for the Large-Amplitude Nuclear CollectiveMotion”,Progress of Theoretical Physics,Vol.64,No.4,pp.1294-1314,1980,和G.D.Dang等人,“Self-consistent theory of large-amplitude collective motion:applications to approximate quantization of nonseparable systems and tonuclear physics”,Physics Reports,Vol.335,Issues3-5,pp.93-274,2000等等。
因此,可见的是,在核反应中处理的核子(质子和中子)替换为在化学反应中处理的原子并且应用SCC方法,可以将多原子系统的动力学行为处理为集体运动并且可以获得多原子系统的反应路径。
本发明人新发现了诸如SCC方法的传统的集体运动理论直接应用于如包括生物大分子(其是本发明的对象)的系统的大尺度系统不足以改进计算准确性并减少计算时间。这是由于下述事实,即,虽然核子反应仅需要最多处理数百个核子,但是水中包括生物大分子的多原子系统的化学反应需要处理几千至几百万原子。即,在现有方法,虽然其是集体运动理论,但是变量的控制(即,变量分离)变得复杂。
前述问题不限于获得包括复合体的多原子系统的反应路径的情况。即,在更一般的意义上,容易想到的是,在获得包括生物大分子的系统的反应路径的情况下发生同样的问题。
(本发明的描述)
通过上述研究,本发明人已经发现了一种基于通过具有比质点坐标更小的自由度的集体坐标来描述集体运动的可应用于包括是大原子组的生物大分子的多原子系统的结构计算的新颖的集体运动理论来预测质点系统的动力学行为的仿真装置和仿真方法以及用于实施该方法的程序和记录介质。
更具体地,根据本发明的仿真装置是一种用于预测由模型化的N个质点构成的质点系统的行为的装置,该装置包括:
坐标设置装置,用于基于描述质点系统的结构的3N个质点坐标设置慢坐标,慢坐标是主要呈现质点系统的结构变化的M个坐标,并且设置快坐标,该快坐标是描述质点系统的结构并且独立于慢坐标的坐标;
坐标提取装置,用于通过使快坐标从属于慢坐标来获得作为慢坐标的函数的快坐标的结构,并且通过考虑由于慢坐标的变化导致的快坐标的变化对慢坐标的影响来获得作为通过正则变换与慢坐标关联的一般坐标的K个集体坐标的函数的慢坐标的结构,其中,所述一般坐标由随时间变化的变化分量和用作相对于时间的常数的不变分量构成并且K个集体坐标是一般坐标的可变分量;以及
逆变换装置,用于基于能够获得为关于集体坐标的运动方程的解的作为时间的函数的集体坐标、慢坐标的结构以及快坐标的结构来预测质点系统的时间演变。
本发明的仿真方法是用于利用上述仿真装置来预测由模型化的N个质点构成的质点系统的行为的方法,该方法包括以下步骤:
基于描述质点系统的结构的3N个质点坐标设置慢坐标,慢坐标是主要呈现质点系统的结构变化的M个坐标,
设置快坐标,快坐标是描述质点系统的结构并且独立于慢坐标的坐标;
通过使快坐标从属于慢坐标来获得作为慢坐标的函数的快坐标的结构;
通过考虑由于慢坐标的变化导致的快坐标的变化对慢坐标的影响来获得作为通过正则变换与慢坐标关联的一般坐标的K个集体坐标的函数的慢坐标的结构,其中,所述一般坐标由随时间变化的变化分量和用作相对于时间的常数的不变分量构成并且K个集体坐标是一般坐标的可变分量;以及
基于能够获得为关于集体坐标的运动方程的解的作为时间的函数的集体坐标、慢坐标的结构以及快坐标的结构来预测质点系统的时间演变。
本发明的仿真程序是用于使计算机执行上面描述的仿真方法的程序。
本发明的计算机可读记录介质是其上记录上述仿真程序的介质。
本文使用的术语“具有N个质点的质点系统”是指作为质点系统的组成元素的质点的总数为N。
(坐标设置装置)
坐标设置装置是下述装置,其用于基于描述质点系统的结构的3N个质点坐标设置慢坐标,慢坐标是主要呈现质点系统的结构变化的M个坐标,并且设置快坐标,该快坐标是描述质点系统的结构并且独立于慢坐标的坐标。本文使用的术语“3N个质点坐标”具体地是指三维空间中的N个质点的坐标。
首先,坐标设置装置基于质点坐标的结构设置M个慢坐标,所述M个慢坐标在描述质点系统的宏观集体运动(大幅度集体运动)时主要呈现质点系统的结构变化。然后,坐标提取装置对于慢坐标执行变量分离。换言之,在本发明中,预先在集体运动理论中从变量分离的对象中排除了已知的描述对于由于质点坐标的大幅度集体运动而导致的质点系统的结构变化基本上没有影响的质点系统的独立坐标。即,通过从M维慢坐标中而不是从3N维质点坐标中提取集体坐标来简化用于变量分离的计算。这里,M是满足关系式K<M<3N的整数。K表示集体坐标的元素的数目,与式28和29中一样。
注意的是,可以从慢坐标执行进一步的分级。即,基于以上述方式设置的慢坐标的结构,可以设置在维度上较低的二级慢坐标并且可以从二级慢坐标中提取集体坐标。
基于大幅度集体运动对于质点系统的结构变化的影响的程度来设置慢坐标。具有较大影响的坐标更适合作为慢坐标。换言之,慢坐标及其具体内容的设置方法依赖于针对质点系统的大幅度集体运动的哪种类型。
更具体地,使用质点坐标中的一些坐标、能够通过组合质点坐标来定义的坐标或者它们的组合来例如关于质点系统的结构的特征部分结构设置慢坐标。在该情况下,更优选的是,慢坐标中的每一个是从各特征部分结构提取的表示该部分结构的代表坐标。多个代表坐标可以被设置到一个特征部分结构。
本文使用的术语“特征部分结构”是指质点系统的结构的具有形态和/或功能特征的部分结构。在质点系统是包括生物大分子的多原子系统的情况下,特征部分结构是例如生物大分子的二级结构(部分折叠结构)、生物大分子的构建块和生物大分子的主链。本文使用的术语特征部分结构的“代表坐标”是指代表性地表示特征部分结构的坐标。代表坐标例如为构成特征部分结构的质点(原子)的坐标本身、能够通过组合原子的坐标而定义的坐标、部分结构的周期性间隔等等。
更具体地,在生物大分子是蛋白质的情况下,蛋白质的二级结构可以被用作特征部分结构。具体的二级结构包括螺旋结构(310螺旋、α螺旋、π螺旋、β螺旋等等)、β折叠、转角、环和无规卷曲等等。关于二级结构的代表坐标,可以使用构成二级结构的原子组的重心的坐标或者二级结构的屈曲角。例如,一般的蛋白质中包括的特征部分结构(较高维度结构)的数目最多为几个至几打。这可以在很大程度上减少用于变量分离的对象变量的数目。在预测生物大分子与结合候选分子之间的结合反应的行为的情况下,结合候选的结构本身可以被作为多原子系统的特征部分结构之一来处理。
另外,在生物大分子是蛋白质的情况下,特征部分结构可以是蛋白质的残基(作为蛋白质的构建块的包括n端残基和c端残基的氨基酸部分)。然后,关于针对蛋白质的残基的代表坐标,可以采用构成残基的原子组的重心的坐标。
此外,在生物大分子是蛋白质的情况下,特征部分结构可以是蛋白质的主链。然后,关于针对蛋白质的主链的代表坐标,可以采用构成主链的各原子的坐标。
另外,在生物大分子是核酸的情况下,特征部分结构可以是核酸的二级结构。然具体二级结构可以是螺旋结构等等。在螺旋结构的情况下,每个预定节距被作为特征部分结构处理。然后,关于针对核酸的二级结构的代表坐标,可以采用构成二级结构的原子组的重心的坐标或者二级结构的屈曲角。
另外,在生物大分子是核酸的情况下,特征部分结构可以是核酸的残基(作为核酸的构建块的核苷酸部分)。然后,关于针对核酸的残基的代表坐标,可以采用构成残基的原子组的重心的坐标。
此外,在生物大分子是核酸的情况下,特征部分结构可以是核酸的主链。然后,关于针对核酸的主链的代表坐标,可以采用构成主链的各原子的坐标。
另外,在生物大分子是核酸并且部分结构是核酸的螺旋结构的情况下,可以使用螺旋结构的节距间隔作为代表坐标。
根据仿真对象质点系统的结构和/或现象来适当地进行如何实际设置特征部分结构的确定。例如,在蛋白质的折叠结构的形成过程或核酸的螺旋结构的形成过程是分析对象的情况下,优选的是,使用能够被视为生物大分子的构建块或生物大分子的基础骨架的主链作为特征部分结构。关于生物大分子的主链,可以使用通过共价结合链接的一个主链的整体作为一个特征部分结构或者可以使用通过划分该一个主链获得的每个部分结构作为特征部分结构。除了上述主链之外,在蛋白质与结合候选分子之间的结合反应的行为是分析对象的情况下,螺旋结构、β折叠、转角、环、无规卷曲等等中的每一个或其组合可以用作特征部分结构。特征部分结构可以包括多个二级结构。即,每个二级结构可以被作为一个特征部分结构处理或者沿着主链的多个相邻的二级结构可以被分组为一个特征部分结构。此外,在抑制剂被投放并且结合到核酸的螺旋结构的反应是分析对象的情况下,可以使用上述主链、螺旋结构的周期性结构或其组合。关于螺旋结构,可以使用整体作为一个特征部分结构或者可以使用通过以预定节距划分螺旋结构获得的每个部分结构作为特征部分结构。
“快坐标”是描述质点系统的结构并且独立于慢坐标的坐标。与慢坐标中一样,使用质点系统中包括的质点坐标本身中的一些、能够通过组合质点坐标来定义的坐标或者它们的组合来设置快坐标。根据质点坐标的组合,可以由一些慢坐标来表示快坐标的形成的一部分。然而,由于快坐标是独立于慢坐标的坐标,因此,快坐标的形成从不仅由一些慢坐标来表示。在质点中的一些的坐标被设置为慢坐标的情况下,快坐标是N个质点减去被设置为慢坐标的质点的坐标。在只有能够通过组合质点的坐标定义的坐标被设置为慢坐标的情况下,快坐标是能够通过组合质点的坐标的全部或一些来定义的独立于慢坐标的坐标。
将描述用于设置慢坐标的具体方法的两个示例。
一个示例方法是其中多原子系统中包括的N个原子被关于每个特征部分结构来分组以提取每个组的重心并且仅将这些重心的坐标设置为慢坐标的方法。在该情况下,优选的是,每个快坐标是关于原子所属于的部分结构的重心的坐标的相关且独立的坐标。因此,快坐标的数目是3N-M。这是由于下述事实,当3N个质点坐标被分为M个重心坐标和3N个相对坐标时,按照定义,在相对坐标之间出现M个关系表达,即,所有相对坐标的M个相对坐标不是独立坐标。该方法考虑到特征部分结构之间的位置关系对于由于较大幅度的集体运动而导致的对于多原子系统的结构变化具有显著的影响。特征部分结构本身的变形尺度较小并且变形时间尺度短于化学反应,从而变形对于多原子系统中的结构改变很小。
另一示例方法是下述方法,其中,构成生物大分子的主链的原子的每个坐标被设置为慢坐标。在该情况下,优选的是,诸如侧链和水合(solvation)的其它原子的坐标被设置为快坐标。因此,快坐标的数目为3N-M。该方法认为,多原子系统的形状对于由于大幅度的集体运动导致的多原子系统的结构改变具有较大的影响。由于侧链与主链相关地移动,因此侧链的变形对于多原子系统的结构变化的影响较小。在该情况下,如果除了生物大分子之外的诸如结合候选分子等等的分子包括在多原子系统中,则分子的重心点可以被设置为慢坐标。在该情况下,例如,构成该分子的原子的坐标被设置为快坐标。
注意的是,下面将要描述的第一实施方式使用前一设置方法。
优选地,根据需要在其中所有质点自由的状态(没有被固定到质点系统的状态)下执行总结构弛豫之后设置慢坐标。本文使用的术语“总结构弛豫”是指移动质点的坐标使得质点系统的势能从适合的起始状态一致地降低直到势能的梯度变为零。术语“总结构弛豫”与通常所谓的结构弛豫类似并且使用该术语以便于与下面将要描述的部分结构弛豫区分。通过总结构弛豫发现的质点系统的状态是接近上述起始状态的局部最小之一。即,总结构弛豫不是通过在势能面上上下重复来找出在稳定点之间连接的反应路径和最小点的操作。特别地,总结构弛豫与“部分结构弛豫”的区别在于其移动构成结构弛豫对象的所有原子。使用诸如共轭梯度方法、最陡下降方法、逆海森方法等等的已知方法来执行总结构弛豫。
坐标提取装置
坐标提取装置是用于获得作为慢坐标的函数的快坐标的结构以及作为集体坐标的函数的慢坐标的结构的装置。本文使用的术语“作为慢坐标的函数的快坐标的结构”是指关于由慢坐标RS表示的快坐标RF的函数RF(RS)的具体内容,并且本文使用的术语“作为集体坐标的函数的慢坐标的结构”是指关于由集体坐标表示的慢坐标RS的函数的具体内容。
作为慢坐标的函数的快坐标的结构
可以通过使快坐标RF从属于慢坐标RS,即通过给出定义快坐标RF与慢坐标RS之间的关系的条件表达式来获得快坐标的结构RF(RS)。对于该条件表达式没有任何具体的限制,并且例如,可以使用从绝热近似条件获得的下面给出的式30的条件表达式。这里使用的术语“绝热近似”是指其中快坐标RF呈现为能够瞬时地跟随慢坐标RS的变化的近似(参见,M.Born和J.R.Oppenheimer,“On the Quantum Theory of Molecules”,Ann.Physik,Vol.84,pp.457-484,1927以及H.Haken,“Nonequilibrium Phase Transitions and Self-Organization in Physics,Chemistry,and Biology”,Synergetics2nd Edition,Springer-Verlag,1978)。式30表示下述条件,对于给定的RS,RF处于势能V的局部稳定点,即,处于势能V关于RF的梯度为零的点。
对于 α=1,...,3N-M 式30
在式30中,V(RS,RF)表示由慢坐标RS和快坐标RF表示的质点系统的势能。可以通过将在由质点坐标x表示的势能V(x)中代入当设置慢坐标RS时确定的质点坐标x的结构x(RS,RF)来获得V(RS,RF)。例如,质点坐标x的结构x(RS,RF)可以通过下述方式来获得:基于当设置慢坐标RS时确定的快坐标RF的结构RF(x)和慢坐标RS的结构RS(x)来获得其逆函数。
注意的是,需要关于所有快坐标RF1至RF(3N-M)来对于V(RS,RF)执行部分差分以便于使得所有快坐标RF1至RF(3N-M)从属于慢坐标RS。
在其中快坐标RF从属于慢坐标RS的质点系统中,快坐标RF被表示为慢坐标RS(如下面给出的式31中所示),并且质点系统的势能V被表示为下面给出的式32。下面,在快坐标RF从属于慢坐标RS的条件下表示为仅慢坐标RS的函数的质点系统的势能Veff也被称为有效势能。
RF=RF(RS) 式31
Veff(RS)≡V(RS,RF=(RS)) 式32
在快坐标RF从属于慢坐标RS(如式31中所示)的情况下,质点坐标x可以表示为慢坐标的函数,如下面给出的式33中所示。
x=x(RS,RF=RF(RS)) 式33
作为集体坐标的函数的慢坐标的结构
可以在考虑由于慢坐标RS的变化导致的快坐标RF的变化对于慢坐标RS的影响的情况下在快坐标RF从属于慢坐标RS的条件下求解关于慢坐标RS的集体运动理论的基本方程来获得慢坐标的结构获得结构的重要之处在于当求解基本方程时“求解关于慢坐标RS的集体运动理论的基本方程”以及“考虑由于慢坐标RS的变化导致的快坐标RF的变化对于慢坐标RS的影响”。
下面,将描述上述两个重要之处。
关求解关于慢坐标RS的集体运动理论的基本方程的原因在于通过从M维慢坐标RS提取集体坐标而不是从3N维质点坐标x提取集体坐标来简化变量分离的计算(如上所述)。
SCC方法中的最基础的基本方程由下面给出的式34至36表示(G.D.Dang等人,“Self-consistent theory of large-amplitude collective motion:applications toapproximate quantization of nonseparable systems and to nuclear physics”,Physics Reports,Vol.335,Issues3-5,pp.93-274,2000)。
对于 i=1,...,Mμ=1,...,K 式34
对于 i=1,...,Mμ=1,...,K 式35
对于 i=1,...,M 式36
其中,mi表示质点系统中的第i个慢坐标的质量。注意的是,如果第i个慢坐标是多个质点的重心坐标,则mi是这些质点的总质量。在慢坐标是组合后的质点坐标的坐标而不是重心坐标的情况下,mi不是其简单的总质量。在这样的情况下,通过一般的分析动力学的公式来获得对应于慢坐标的一般动量,然后写出哈密尔顿,并且将慢坐标的质量获得为包括哈密尔顿的一般动量的项的系数。λμ(RS)和ρμ(RS)是满足式35和36的函数,其中,是第(i,μ)分量而λμ(RS)和ρμ(RS)是第μ分量。V,i(RS)和V,ij(RS)分别由下面给出的式37和38定义。
式37
式38
因此,一般来说,可以通过根据式34至36在由M个坐标(RS1,RS2,-----,RSM)横跨的M维超空间中形成由K个集体坐标(q1,q2,-----,qK)参数化的K维超平面(下面,简称为“平面”)来获得函数RSi(qμ)。
关于基本方程,也可以使用.D.Dang等人“Self-consistent theory of large-amplitude collective motion:applications to approximate quantization ofnonseparable systems and to nuclear physics”,Physics Reports,Vol.335,Issues3-5,pp.93-274,2000中用于近似计算的基本方程。这里,例如,在慢坐标的结构RS(q1)被获得为具有自由度1(K=1)的集体坐标的函数的情况下,使用慢坐标RS的集体运动理论中的基本方程可以表示为下面给出的式39至40。
对于 i=1,...,M 式39
对于 i=1,...,M 式40
其中,表示满足式40的函数(本征向量)的第i分量,并且Λ(RS)表示满足式40的函数(本征值)。
同时,高准确性地在不会允许变量分离的在G.D.Dang等人,“Self-consistenttheory of large-amplitude collective motion:applications to approximatequantization of nonseparable systems and to nuclear physics”,Physics Reports,Vol.335,Issues3-5,pp.93-274,2000中的传统SCC方法中执行近似计算。因此,本发明人已经基于允许关于慢坐标RS的变量分离的更准确的计算的新的近似方法开发了新的基本方程并且基于该新的基本方程建立了新的SCC方法(SCC2方法)理论。
例如,在基于SCC2方法将慢坐标的结构RS(q1)获得为具有自由度1(K=1)的集体坐标的函数的情况下,使用慢坐标RS的集体运动理论中的基本方程可以表示为下面给出的式41至43。
对于 i=1,...,M 式41
式42
对于 i=1,...,M
式43
其中,和κ(RS,λ)是满足式43的函数,其中,表示第i分量并且λ表示辅助坐标。
作为式39或41的解,最终获得由式44表示的慢坐标RS的结构。
式44
这里,已经在K=1的情况下描述了基本方程,但是本发明不限于其中K=1的情况。更具体地,在K≥2的情况下,式39和40可以通过使用如例如G.D.Dang等人“Self-consistenttheory of large-amplitude collective motion:applications to approximatequantization of nonseparable systems and to nuclear physics”,Physics Reports,Vol.335,Issues3-5,pp.93-274,2000中描述的弗罗宾尼斯定理扩展为SCC方法的基本方程。而且,式41至43可以显而易见地在K≥2的情况下以相同的方式扩展为SCC2方法的基本方程。
如上所述,被称为慢坐标(二级描述质点系统的结构的低维变量)的分级变量的引入可以将从3N维到K维的收缩问题简化为从M维到K维的收缩问题,从而使得变量分离的计算变得更加容易。
然而,在本发明中,需要通过考虑反馈来执行变量分离以便于准确地计算质点系统的结构。不管反馈与通过将现有的质点(或快坐标)假设为不存在来执行计算类似,并且如果在没有考虑此影响的情况下执行变量分离,则在计算中会发生不一致,并且会破坏计算结果。因此,基于新的理论来修改现有的集体运动理论以便于考虑反馈。新的理论是下述理论,其中在快坐标RF从属于慢坐标RS的条件下准确地计算集体运动理论的基本方程中的势能的坐标的差分系数,并且每次对于慢坐标进行了小的更新时对于快坐标RF进行部分结构弛豫。
在传统的集体运动理论中,在关于势能V(x)的质点坐标x的差分系数的预定本征向量的方向上仅重复质点坐标x的小的更新
在本发明中,当计算关于势能V的坐标的差分系数时可以应用式45至47的反馈方程。
式45
式46
式47
在式46中,第三项中的表示通过在第二项中互换字母i和j获得的项。
在式47中,第三项中的表示通过在第二项中互换字母i和k获得的项,第四项中的表示通过在第二项中互换字母j和k获得的项,第六项中的表示通过在第五项中互换字母i和k获得的项,并且第七项中的表示通过在第五项中互换字母j和k获得的项。
在式45至47中,使用下面给出的式48。
式48
其中,Kαβ -1(RS)表示Kαβ(RS)的逆矩阵,并且Kαβ(RS)和Jαi(RS)分别由下面给出的式49和50来定义。
式49
式50
在式45至47中的每一个中,右侧除了第一项之外的项表示由于慢坐标RS的变化导致的快坐标RS的变化对于慢坐标RS的影响。这样的反馈方程的构造在以前是未知的并且由本发明人首次发现。反馈方程包括一阶、二阶和三阶差分方程的三个公式并且可以根据集体运动理论中的基本方程的内容仅使用所要求的方程。例如,在采用式39和40作为集体运动理论中的基本方程的情况下,仅式46的二阶差分方程就足以作为反馈方程。
因此,通过在由反馈方程定义的差分系数的本征向量的方向上对于慢坐标执行小的更新并且在更新后的慢坐标下根据快坐标RF从属于慢坐标RS的条件执行结构弛豫来执行对于快坐标RF的部分结构弛豫。本文使用的术语“在更新后的慢坐标下”是指“在更新后的慢坐标被固定在质点系统中的状态下”。此外,本文使用的术语“根据快坐标RF从属于慢坐标RS的条件执行结构弛豫”是指移动快坐标RF使得质点系统的势能一致地减少直到势能的梯度变为零同时保持其中快坐标RF从属于慢坐标RS的状态。在慢坐标RS被固定到质点系统的情况下执行的结构弛豫被称为“部分结构弛豫”。如上所述,部分结构弛豫与总结构弛豫的不同之处在于其在慢坐标RS被固定到质点系统的情况下执行。但是,关于执行部分结构弛豫的方法,与总结构弛豫类似地,可以使用诸如共轭梯度方法、最陡下降方法或逆海森方法的已知方法。优选地,确定更新方向的本征向量对应于最小本征值的方向。原因在于,本发明的主题在于大幅度集体运动。
在K=1的情况下,部分结构弛豫中的快坐标RF的起始状态可以是RFα(RS(q1)),但是其优选地是其中快坐标RF改变由下面给出的式51给出的小量,即,由下面给出的式52表示的状态
式51
式52
如果小的更新是无限小的,则由式52表示的坐标对应于快坐标RF(RS(q1+Δq1))。然而,在实际计算中,小的更新是有限的。通过将部分结构弛豫中的快坐标RF的起始状态设置为可以增强用于部分结构弛豫的安全性。
由坐标提取装置执行的处理
现在将描述由坐标提取装置执行的一系列具体步骤。
首先,坐标提取装置执行第一步骤,用于获得由慢坐标RS和快坐标RF的函数表示的势能V(RS,RF)。
接下来,坐标提取装置执行第二步骤,用于使快坐标RF从属于慢坐标RS。快坐标RF的结构被获得为慢坐标RS的函数。这里,借助于示例,假设根据式30的绝热近似条件来使快坐标RF从属于慢坐标RS。
接下来,在由坐标设置装置设置了慢坐标RS和快坐标RF的状态下,坐标提取装置执行第三步骤,用于根据例如式46的反馈方程获得关于慢坐标RS的势能V的差分系数。
接下来,在势能V的差分系数下,坐标提取装置执行第四步骤,用于根据例如当K=1时的式39和40的SCC方法的基本方程获得关于集体坐标q的慢坐标RS(q)的差分系数。
接下来,坐标提取装置执行第五步骤,用于在慢坐标RS(q)的差分系数下以小量Δq更新集体坐标q并且获得更新后的慢坐标RS(q+Δq)。
接下来,在更新后的慢坐标RS(q+Δq)下,坐标提取装置执行第六步骤,用于根据绝热近似条件对于从属于慢坐标RS的快坐标RF执行部分结构弛豫。在该情况下,如果使用由式52表示的状态作为部分结构弛豫的起始状态,则根据式51从在第四步骤中获得的慢坐标RS(q)的差分系数获得关于集体坐标q的快坐标RF(q)的差分系数,并且在获得的差分系数下,以小量Δq更新快坐标。
然后,坐标提取装置通过重复第三至第六步骤直到例如达到了下一局部最小同时交替地更新慢坐标RS和快坐标RF来获得作为集体坐标q的函数的慢坐标RS。即,在从第二次起的第三步骤中,将在就在前一第六步骤中执行了快坐标RF的部分结构弛豫之后的状态中在慢坐标RS和快坐标RF下与上述第三步骤中一样地获得关于慢坐标RS的势能V的差分系数。对于确定局部最小的方法没有任何特定的限制,并且例如,可以采用确定势能V的差分系数是否等于零的方法作为示例。
逆变换装置
逆变换装置基于能够获得为关于集体坐标的运动方程的解的作为时间t的函数的集体坐标由式44表示的结构RS(q)和由式31表示的快坐标RF的结构RF(RS)来预测质点坐标x的时间演变。
下面将进行更详细的描述。图4示出了变量变换和逆变换的概念。图4借助于示例示出了使用质点坐标x中的一些作为慢坐标RS并且从慢坐标RS中提取具有自由度1的集体坐标的情况。
图4的a示出了基于质点坐标x的慢坐标RS和快坐标RF的设置。在图4中,M个质点坐标被设置为慢坐标RS并且其余的3N-M个质点坐标被设置为快坐标RF。如上所述,由坐标设置装置设置慢坐标RS和快坐标RF。图4的b示出了快坐标RF被给出为慢坐标RS的函数。图4的c示出了慢坐标RS被给出为集体坐标q1的函数。如上所述,由坐标提取装置获得慢坐标RS和快坐标RF的结构。
图4的d示出了集体坐标q1的被给出为时间t的函数,其是通过求解关于集体坐标q1的运动方程而获得的。可以通过将当设置慢坐标RS时确定的结构X(RS,RF)带入关于质点坐标x的运动方程来获得关于慢坐标RS和快坐标RF的运动方程并且将式31和44带入所获得的运动方程而获得关于集体坐标q1的运动方程。
使用图4的a至d的关系允许将所有质点坐标x获得为时间t的函数(图4的e)。即,逆变换装置是下述装置,其通过将集体坐标q1获得为时间t的函数并且经由慢坐标RS将变量变换从质点坐标x逆变换为集体坐标q1来将质点坐标x的结构获得为时间t的函数,x(t)。由于函数x(t)表示质点坐标x关于时间变化的行为,从而函数x(t)正好对应于将要获得的反应路径。因此,通过观察函数x(t)随时间的变化,可以预测时间演变。
本发明的第一实施方式
图5是根据本实施方式的仿真装置10的框图,其示意性地示出了其构造。图6A、6B是示意性地示出根据本实施方式的仿真方法中的计算步骤的流程图。在实施方式中,将描述从由N个原子构成的包括生物大分子和用于生物大分子的结合候选分子的多原子系统的结构的每个特征部分结构提取的重心点的坐标被设置为M个慢坐标并且集体坐标的自由度为1(K=1)的情况。
本实施方式的仿真装置10是用于预测由生物大分子和结合候选分子构成的复合体的行为的装置。如图5中所示,仿真装置10包括用于输入指定分析对象多原子系统所要求的数据(输入数据)的输入装置12、用于控制装置的各部的控制装置14、坐标设置装置16、坐标提取装置18、逆变换装置20和用于显示分析结果的显示装置22。
本实施方式的仿真方法是由仿真装置10执行的方法,其包括下述步骤:利用输入装置12输入输入数据,由坐标设置装置16设置M个慢坐标RS和3N-M个快坐标RF,由坐标提取装置18获得作为集体坐标q1的函数的慢坐标RS的结构以及作为慢坐标RS的函数的快坐标RF的结构,由逆变换装置20获得作为时间的函数的原子坐标x(t),以及在显示装置22上显示分析结果。
本实施方式的仿真程序是使得计算机执行上述仿真方法的程序。
本实施方式的计算机可读记录介质是其上记录上述仿真程序的介质。
输入装置
输入装置12是用户从其输入输入数据的部件。所输入的输入数据被输出到控制装置14。对于输入输入数据的方法没有任何特定的限制,并且例如可以使用用户通过操作仿真装置10的手动方法、从预定记录介质进行读取的方法等等作为示例。
控制装置
控制装置14是控制包括与各部交换数据等等的处理的部件。从输入装置12输入到控制装置14的输入数据被输出到坐标设置装置16。当输入数据被输出到坐标设置装置16时,开始针对多原子系统的行为的计算。控制装置包括诸如存储器的存储介质,以记录通过与各部交换数据生成的中间和最终的计算结果。
此外,控制装置14控制显示装置22以基于由逆变换装置20获得的原子的坐标x(t)的数据使用图表或曲线图显示结果。
坐标设置装置
坐标设置装置16是下述装置,其基于从控制装置14接收的输入数据来优化复合体并且设置M个慢坐标RS和3N-M个快坐标RF。关于所获得的慢坐标RS和快坐标RF的数据经由控制装置14输出到坐标提取装置18。
坐标提取装置
坐标提取装置18是下述装置,其基于关于由坐标设置装置16获得的慢坐标RS和快坐标RF的数据获得整个多原子系统的势能V(RS,RF),并且基于所获得的V(RS,RF),获得作为集体坐标q1的函数的慢坐标RS的结构和作为慢坐标RS的函数的快坐标RF的结构。关于所获得的慢坐标RS和快坐标RF的结构的数据经由控制装置14输出到逆变换装置20。
逆变换装置
逆变换装置20是下述装置,其基于关于由坐标提取装置18获得的慢坐标RS和快坐标RF的结构的数据获得作为时间的函数的原子的坐标x(t)。关于所获得的原子的坐标x(t)的数据被输出到控制装置14。
显示装置
显示装置是下述装置,其例如根据来自控制装置14的指令将多原子系统的势能V显示为曲线,将复合体的结合过程中的结构或者最终状态的结构显示为图像,将复合体的结合过程显示为运动图片等等。对于显示方法没有任何特定的限制,并且可以使用诸如2D显示、3D显示等等的任何已知方法。
下面,将参考图6A和图6B描述使用本实施方式的装置的仿真方法的过程。
步骤1
首先,将输入数据从输入装置12输入到仿真装置10(图6A中的ST1)。输入数据的具体内容包括表示构成包括生物大分子和结合候选分子的多原子系统的N个原子的初始布置的类型、数目和坐标x、用于从坐标x形成势能V(x)的规则等等。
步骤2
接下来,对包括复合体的多原子系统进行优化并且获得初始状态结构(图6A中的ST2)。
下面将进行更详细的描述。首先,坐标设置装置16独立地对生物大分子和结合候选分子进行总结构弛豫以分别优化生物大分子和结合候选分子的结构。然后,结构被优化的生物大分子和结合候选分子被布置在允许在其间开始相互作用的距离(例如,结合候选分子略微地接触生物大分子)。该状态是由生物大分子和结合候选分子构成的复合体的初始状态。
步骤3
接下来,基于在步骤2中获得的初始状态结构设置慢坐标RS和快坐标RF(图6A中的ST3)。
坐标设置装置16将生物大分子的结构划分为(M-3)/3个特征部分结构同时将整个结合候选分子作为一个部分结构来处理,并且从M/3个部分结构中的每一个中提取重心。然后,将M/3个重心点的坐标设置为慢坐标RS并且将M/3个部分结构中的每一个中包括的原子的每个重心的相对坐标设置为3N-M个快坐标RF。在本实施方式中,作为快坐标RF,设置其中包括原子的部分结构的重心的坐标的相对坐标。
步骤4
接下来,获得由慢坐标RS和快坐标RF表示的多原子系统的势能V(RS,RF)(图6A中的ST4)。
图7示意性地示出了本实施方式的慢坐标RS、快坐标RF和原子坐标x之间的关系。在图7中,第m(m是满足1≤m≤M/3的整数)个特征部分结构中包括的原子的数目被表示为Nm。即,N1+N2+-----+Nm+-----NM/3=N。在本发明中,M表示三维空间中的原子坐标(质点)的数目,从而M/3通常为整数。此外,在本实施方式中,从图7中可知,慢坐标RS、快坐标RF和原子坐标x具有由下面给出的式53和54表示的关系。
式53
式54
式53是表示第m个慢坐标RS(即,第m个特征部分结构的重心的坐标)与原子坐标x之间的关系的公式。式54是表示属于第m个特征部分结构的第n个原子的坐标x、慢坐标RS和快坐标RF之间的关系的公式。在式53和54中,n表示每个特征部分结构中包括的原子的顺序号。因此,关于第m个特征部分结构的n取为从1至Nm的范围中的整数。此外,当m=1时,3N1+3N2+-----3Nm-1为零。
因此,通过将式54应用于势能V(x)可以获得势能V(RS,RF)。
步骤5
接下来,根据使用势能V(RS,RF)的式30的绝热近似条件使快坐标RF从属于慢坐标RS(图6A中的ST5)。在本实施方式中,关于所有快坐标RF1至RF3N对V(RS,RF)进行部分差分。
步骤6
接下来,在当前慢坐标RS和快坐标RF下,根据式46的反馈方程获得关于慢坐标RS的势能V的二阶差分系数(图6A中的ST6)。
步骤7
接下来,在步骤6中获得的二阶差分系数下,根据式39和40中的SCC方法的基本方程获得关于集体坐标q1的差分系数dRS/dq1(图6A中的ST7)。
步骤8
接下来,在步骤7中获得的差分系数dRS/dq1下,根据式51获得关于集体坐标q1的快坐标RF的差分系数dRF/dq1(图6B中的ST8)。
步骤9
接下来,在步骤7中获得的差分系数dRS/dq1和步骤8中获得的差分系数dRF/dq1下,以小量Δq1更新集体坐标q1(图6B中的ST9)。
步骤10
接下来,获得以Δq1更新的慢坐标RS(q1+Δq1)和更新后的快坐标RF(q1+Δq1)(图6B中的ST10)。
例如,在步骤2中的初始状态被设置为集体坐标q1的初始条件(即,当q1=0时,多原子系统取为初始状态)的情况下,慢坐标RS(q1+Δq1)和快坐标RF(q1+Δq1)可以表示为下面给出的式55。
式55
在根据步骤13中的确定结果重复步骤6至步骤12的情况下,从第二次以后的步骤10中依次获得可以表示为式56的RSi(2Δq1),RSi(3Δq1)-----,然而,差分系数dRS/dq1每次没有始终取为相同的值。通过重复上述操作,最终获得作为集体坐标q1的函数的慢坐标RS的结构RS(q1)。
式56
步骤11
在步骤11,在步骤10中更新的慢坐标RS(q1+Δq1)下,以在步骤10中更新的快坐标RF(q1+Δq1)作为起始状态来对于快坐标RF进行部分结构弛豫(图6B中的ST11)。
步骤12
接下来,在步骤12,计算部分结构弛豫之后的状态中的多原子系统的势能V(图6B中的ST12)。注意的是,根据步骤13中的确定结果,每次重复时计算势能V。可以基于有效势能Veff来计算势能的数值计算。
步骤13
接下来,在步骤13中,确定在步骤12中计算的势能V是否已经达到局部最小(图6B中的ST13)。鉴于生物大分子和结合候选分子之间的化学反应,化学反应的结束点是势能V将下次变为局部最小的点,即,势能面上的下一稳定点。因此,参考势能的值来确定化学反应的结束点。如果确定势能V已经达到下一局部最小,则处理前进至步骤14,否则再次重复步骤6至步骤12。此外,即使在势能被确定为已经达到局部最小的情况下,也能够根据需要继续分析直到势能V将达到下一局部最小。
步骤14
如果在步骤13中势能V被确定为已经达到局部最小,则步骤14中的势能V的多原子系统的结构是将要获得的最终状态(图6B中的ST14)。
然后,除了最终状态结构,还获得由式44表示的慢坐标RS的结构RS(q1)和由式31表示的快坐标RF的结构RF(RS)。之后,获得作为时间的函数的坐标x(t)。
有利效果
图8是示出通过本实施方式的仿真方法获得的预定蛋白质2和生理活性物质6(药物)的复合体的反应路径的图。图9示意性地示出了图8中所示的复合体的结合过程。图9的a和b分别示出了复合体的结合过程的初始状态和最终状态。
在图8中,水平轴表示预定蛋白质2的残基2a、2b之间的距离而竖直轴表示药物6与残基2c之间的距离。残基2a、2b是位于蛋白质2的口袋4的开口处的残基,而残基2c是当蛋白质与药物结合时位于与药物6相对的位置的残基(图9)。图中的点A和C对应于例如图2的稳定点A和C,并且图中的点B对应于例如图2的能量势垒B。图中的曲线表示时间轴上均等隔开的点。曲线示出了反应在到达能量势垒B之前缓慢进行并且反应在能量势垒B之后快速地进行。本实施方式的仿真方法获得包括大约2000个原子的多原子系统中的反应路径所要求的时间大约为30分钟。
图8中所示的图中的“X射线分析”的位置表示作为通过X射线衍射测量的晶体结构分析的结果而实际获得的测量值。这示出了该仿真方法即使本发明非经验地执行仿真也可以以非常高的准确性计算复合体的结合状态。
如上所述,本实施方式的仿真装置包括坐标设置装置、坐标提取装置以及逆变换装置,并通过引入分级的慢坐标,通过考虑由于慢坐标的变化导致的快坐标的变化对慢坐标的影响来提取描述质点系统的集体且本征行为的集体运动理论中的集体坐标,并且求解关于集体坐标的运动方程来预测质点的时间演变。因此,集体坐标的提取允许在原子级别执行仿真并且引入慢坐标允许减少为提取集体坐标而处理的坐标的数目。因此,在用于预测质点系统的动力学行为的仿真中可以实现计算精度的改进和计算时间的减少。
本实施方式的仿真方法是用于利用上述仿真装置的方法并且通过引入分级的慢坐标,通过考虑由于慢坐标的变化导致的快坐标的变化对慢坐标的影响来提取描述质点系统的集体且本征行为的集体运动理论中的集体坐标,并且求解关于集体坐标的运动方程来预测质点的时间演变。因此,集体坐标的提取允许在原子级别执行仿真并且引入慢坐标允许减少为提取集体坐标而处理的坐标的数目。因此,在用于预测质点系统的动力学行为的仿真中可以实现计算精度的改进和计算时间的减少。
本实施方式的程序和记录介质可以使得执行上述仿真方法,从而在用于预测质点系统的动力学行为的仿真中可以实现计算精度的改进和计算时间的减少。
本发明的第二实施方式
接下来,将描述第二实施方式,本实施方式与第一实施方式的不同之处在于,为了获得采用在G.D.Dang等人,“Self-consistent theory of large-amplitude collectivemotion:applications to approximate quantization of nonseparable systems andto nuclear physics”,Physics Reports,Vol.335,Issues3-5,pp.93-274,2000中描述的SCC方法的基本方程(式39和40)或者SCC2方法的基本方程(式41至43)的解,对于与这些基本方程等价的方程进行求解。因此,这里没有进一步详细描述与第一实施方式相同的组件,除非有特别的要求。
本实施方式的仿真装置10包括输入装置12、控制装置14、坐标设置装置16、坐标提取装置18、逆变换装置20和用于显示分析结果的显示装置22,与第一实施方式中一样。
在本实施方式中,坐标提取装置18使用式57作为SCC方法的基本方程以便于获得与式39和40相同的解。
对于 μ=1,...,K 式57
其中,Y是由下面给出的式58定义的MK+M+K维向量。即,Y包括通过遍历i和μ中的每个获得的每个分量:m1 1/2RS1,-----,mM 1/2RSM; 和Λ1,-----,ΛK。注意的是,和Λμ表示辅助坐标。
式58
其中,vμ是下面给出的式59的非齐次线性方程的解向量。注意的是,vμ是MK+M+K维向量。
Cvμ=sμ对于 μ=1,...,K 式59
式59中的c和sμ分别由下面给出的式60和61来定义。C是(MK+M+K)×(MK+M+K)的方矩阵。虽然C示出为3×3矩阵,但是每个分量进一步具有矩阵。即,在表示为3×3矩阵的C中,第一行第一列的分量是MK×M矩阵(即,具有MK行和M列),第一行第二列中的分量是MK×MK矩阵,第一行第三列中的分量是MK×K矩阵,第二行第二列中的分量是K×MK矩阵,第三行第一列中的分量是M×M矩阵,并且其它分量为零矩阵。每个分量的元素通过遍历i或μ(i=1至M或μ=1至K)来形成为行中的变量并且遍历j或ν(j=1至M或ν=1至K)形成为列中的变量。sμ是MK+M+K维向量。与C类似地,sμ也示出为三维向量,但是每个分量进一步具有向量。即,作为sμ的三维向量的第三分量是M维向量并且其它分量为零向量。第三分量的元素通过遍历从1至M的i来形成。
式60
对于 μ=1,...,K 式61
V,ijk(RS)由下面给出的式62来定义。
式62
式57是当K被一般化时的基本方程,并且如果K=1,则式57等价于下面给出的式63。此外,如G.D.Dang等人,“Self-consistent theory of large-amplitude collectivemotion:applications to approximate quantization of nonseparable systems andto nuclear physics”,Physics Reports,Vol.335,Issues3-5,pp.93-274,2000中所描述的,可以通过使用弗罗宾尼斯定理从其中K=1的式63获得关于一般化的K的式57。
对于 i=1,...,M 式63
在式63中,(χ1,-----,χM,ψ1,-----,ψM,κ)是由下面给出的式64表示的非齐次线性方程的2M+1维解向量。
对于 i=1,...,M 式64
在式64中,取矩阵和本征向量的乘积并且当由三个方程来表示式60时,关于j和k来取1至M的和。
可以以下述方式来证明式63和64与式39和40的等价。如果通过注意式38、62和63,关于通过q1来积分式64,则可以获得下面给出的式65。
对于 i=1,...,M
式65
此外,如果式64中包括的恒等式被代入到式63的第一方程,则可以获得下面给出的式66。
对于 i=1,...,M 式66
这里,通过利用和Λ(RS)替换式65的第一方程和式66中的和Λ1(即,当和Λ1被作为RS的函数处理时),再现了式39和40。
在获得与式41至43相同的解的情况下,坐标提取装置18使用式67作为SCC2方法的基本方程。
对于 μ=1,...,K 式67
其中,Z是由下面给出的式68定义的MK+M+2K维向量。即,Z包括通过遍历i和μ中的每个获得的每个分量:m1 1/2RS1,-----,mM 1/2RSM; λ1,-----,λK;和ρ1,-----,ρK。注意的是,λμ和ρμ表示与类似的辅助坐标。cμν是唯一地确定使得将关于每个μ定义的由下面给出的式65表示的值最小的常数,并且wμ表示横跨由下面给出的式70定义的(MK+M+K)×(MK+M+2K)维退化矩阵D的K维奇异值空间的MK+M+2K维K单位向量。虽然D示出为3×4矩阵,但是每个分量进一步具有矩阵。即,在表示为3×4矩阵的D中,第一行第一列的分量是MK×M矩阵,第一行第二列中的分量是MK×MK矩阵,第一行第三列中的分量是MK×K矩阵,第二行第一列中的分量是M×M矩阵,第二行第二列中的分量是M×MK矩阵,第二行第四列中的分量是M×K矩阵,第三行第二列中的分量是K×MK矩阵,并且其它分量为零矩阵。每个分量的元素通过遍历i或μ(i=1至M或μ=1至K)来形成为行中的变量并且遍历j或ν(j=1至M或ν=1至K)形成为列中的变量。
式68
式69
式70
式67是当K被一般化时的基本方程,并且如果K=1,则式67等价于下面给出的式71。此外,如G.D.Dang等人,“Self-consistent theory of large-amplitude collectivemotion:applications to approximate quantization of nonseparable systems andto nuclear physics”,Physics Reports,Vol.335,Issues3-5,pp.93-274,2000中所描述的,可以通过使用弗罗宾尼斯定理从其中K=1的式71获得关于一般化的K的式67。
对于i=1,...,M 式71
在式71中,(χ1,-----,χM,ψ1,-----,ψM,κ,σ)是由下面给出的式72表示的(2M+1)×(2M+2)的退化矩阵的齐次线性方程的2M+2维解向量(不确定解)。
式72
在式72中,取矩阵和本征向量的乘积并且当由三个方程来表示式68时,关于j和k来取1至M的和。即,可以通过使用属于式72的退化矩阵的一维奇异值空间的单位向量μ来由式73表示(χ1,-----,χM,ψ1,-----,ψM,κ,σ)。这里,c是唯一地确定为使得由下面给出的式74表示的值最小的常数。
式73
式74
可以以下述方式来证明式71和72与式41至43的等价。如果通过注意式38、6271和73关于通过q1来积分式72,可以获得下面给出的式75。
对于i=1,...,M
式75
如果从式75的第一和第二方程中消除和ρ1,则可以获得下面给出的式76。然后,如果通过假设RSi和λ1是q1的函数来对式76进行差分并且使用式71的第一和第三方程,则可以获得下面给出的式77。
对于 i=1,...,M 式76
对于 i=1,...,M
式77
这里,通过利用λ、κ(RS,λ)和Veff(RS)替换式71的第一和第三方程以及式77中的λ1、χi、κ和V,再现了式41至43。
在本实施方式中,如例如从式63至71中所知道的,增加了在求解基本方程式作为独立坐标处理的作为q1的函数的变量(慢坐标RS与辅助坐标的总和,并且下面称为“独立变量”)的数目。更具体地,在式39和40中,独立变量仅是M个RSi(i=1至M),而在等价于式39和40的式63中,独立变量是M个RSi(i=1至M),M个(i=1至M)和Λ1,总计2M+1个。同时,在式41至43中,独立变量仅是M个RSi(i=1至M)和λ,而在等价于式41至43的式71中,独立变量仅是M个RSi(i=1至M)、M个(i=1至M)、λ1和ρ1,总计2M+2.
下面将描述以该方式增加独立变量(更具体地,辅助坐标)的数目以等价变换方程的优点。
例如,在从式40获得的情况下,在的符号中保留了任意性,反映了式40对于的符号反转是不变的。此外,同样适用于从式43获得和κ(RS,λ)的情况。符号的任意性表示也包括反向地行进反应路径的路径。假设下述事实,如果反向行进的路径可以通过再次反向行进来返回到正向方向,则可以最终找到反应路径,能够说的是,符号的任意性是自然现象。但是,符号的任意性会引起反向行进使得难以高效地形成反应路径的问题。此外,在实际中通过差分来求解式40和43并且差分化的程度Δq1具有有限值,从而当发生反向行进时,系统的状态可能没有返回到原始的反应路径,即,这样的反向行进会触发形成错误的反应路径。
因此,在本实施方式中,通过增加独立变量的数目来消除符号的任意性。结果,解决了反向行进的问题并且可以更高效且准确地形成反应路径。注意的是,即使独立变量的数目翻倍,由于计算负荷的增大导致的负担也是可忽略的。
图10是示出消除了符号的任意性的计算与没有消除符号的任意性的计算之间的比较的结果的图。更具体地,由附图标记24表示的曲线示出了使用式71至74的关于每个结构改变的被称为蜂毒肽的蛋白质的势能的计算结果,而由附图标记26指示的曲线图示出了使用式41至43关于每个结构变化的同一蛋白质的势能的计算结果。水平轴表示蜂毒肽的屈曲角θ并且竖直轴表示系统的势能。θ=140度的状态对应于初始状态。
在保留了符号的任意性的计算中,能量在发生反向行进的大约θ=95度处急剧升高。相反地,在消除了符号的任意性的计算中,没有出现这样的现象并且能量在大约θ=80度处达到局部最大点。图24中θ=60度处的分离点是通过向系统施加整体结构弛豫而从局部最大点的状态获得的系统的另一局部状态点。
如上所述,根据本实施方式的仿真装置和仿真方法也通过引入分级的慢坐标,通过考虑由于慢坐标的变化导致的快坐标的变化对慢坐标的影响来提取描述质点系统的集体且本征行为的集体运动理论中的集体坐标,并且求解关于集体坐标的运动方程来预测质点的时间演变。因此,本实施方式可以提供与第一实施方式相同的有利效果。
设计改变
在上述各实施方式中,在基本方程中出现势能V(RS)的三阶导数的项(例如,式43、60、64、70和72)。三阶导数的计算所要求的时间的量级与M3(M表示慢坐标的数目)成比例并且鉴于二阶导数的计算所要求的时间的量级与M2成比例,三阶导数的计算对于仿真来说是非常重的负担。因此,例如,关于式64中的如果首先计算V,ijk(RS)并且然后获取计算值与的乘积会花费大量的时间。因此,本发明人已经开发了下面给出的式78,从而允许通过取两个二阶导数之间的差来直接计算式78的应用允许将计算时间的量级从大约M3减少到大约M2。此外,优选的是,式41的反馈方程应用于式78的右手侧的二阶导数。
式78
其中,表示任意向量的第i分量并且n由下面给出的式79来定义。
式79
SCC方法的基本方程
最终,将简要描述最基础的基本方程(式34至36)与四组基本方程(式39和40的组、式41至43的组、式57和式67)之间的关系。
如上所述,一般来说,可以通过根据最基础的基本方程形成平面来获得函数RSi(qμ)。然而,在形成平面时实际存在两个问题。一个问题是基础问题,即严格满足式34至36的平面对于一般的势能来说并不是始终存在的。式34至36对于一般的势能来说并不是始终存在的。另一问题是实际问题,即,如果试图根据式34至36形成平面则会发生反向行进(上述反向行进的问题)。特别地,后一问题的原因是清楚的。即,式35和36不能够确定和ρμ(RS)的符号,换言之,它们对于符号反转来说是不变的。
因此,对于基础问题来说,通过近似来寻找满足式34至36的平面的方法是有效的。实际上,在G.D.Dang等人,“Self-consistent theory of large-amplitude collectivemotion:applications to approximate quantization of nonseparable systems andto nuclear physics”,Physics Reports,Vol.335,Issues3-5,pp.93-274,2000的描述中,丢弃了式36并且试图仅利用式34和35来形成平面。该措施将在K=1时给出式39和40。此外,本发明开发了通过式35和36来形成平面同时在最大程度上满足式34的方法。该措施将在K=1时从式41给出式43。更具体地,如果通过假设λ1是q1的函数(像RS一样)而利用q1来对通过从式35和36中消除和ρ1(RS)获得的式80进行差分,则可以从式41获得式43。
对于 i=1,...,M 式80
关于实际问题,其中假设式34至36中的λμ和ρμ独立于作为的函数的变量(即,辅助坐标)和RS的方法是有效的。原因在于,如果假设λμ和ρμ独立于RS,则它们中的每一个在形成平面时变为一点一点连续变化的量(如RS那样),从而不会出现符号的突然变化。为了将λμ和ρμ作为辅助坐标来处理,要求如式34那样的包括利用qν的差分的公式。因此,式35和36中的每一个被利用qν进行全微分并且结果被除以d qν以获得下面给出的式81和82。以该方式,最基础的基本方程被转换为由式34、81和82构成的基本方程,同时消除了实际问题。
对于 i=1,...,Mμ,ν=1,...,K 式81
对于 i=1,...,Mν=1,...,K 式82
然后,考虑在由式34、81和82构成的基本方程中解决基础问题。解决该问题的方法例如是如上所述通过近似找到满足式34、81和82的平面的方法。更具体地,仅通过式34和81形成平面的措施将给出式57,而通过式81和82形成平面同时在最大程度上满足式34的措施将给出式67。
工业实用性
在各实施方式中,已经描述了本发明应用于由蛋白质和药物构成的复合体的结合过程的情况,但是本发明不限于此。即,本发明可以更一般地应用于由生物大分子和结合候选分子构成的复合体的形成过程。本发明还可以应用于除了复合体的结合过程之外的包括生物大分子的多原子系统的行为的分析,包括生物大分子的多原子系统的行为例如为复合体的解体过程、蛋白质的apo体的结构、生物大分子的折叠机制等等。
Claims (25)
1.一种仿真装置,所述仿真装置用于预测由模型化的N个质点构成的质点系统的行为,所述仿真装置包括:
坐标设置装置,所述坐标设置装置用于基于描述所述质点系统的结构的3N个质点坐标设置慢坐标,所述慢坐标是主要呈现所述质点系统的结构变化的M个坐标、即对于质点系统的三维结构的形成施加大的影响的坐标,并且所述坐标设置装置还用于设置快坐标,所述快坐标是描述所述质点系统的结构并且独立于所述慢坐标的坐标;
坐标提取装置,所述坐标提取装置用于通过使所述快坐标从属于所述慢坐标、即通过给出规定所述快坐标和所述慢坐标的关系的条件表达式来获得作为所述慢坐标的函数的所述快坐标的结构,并且通过考虑由于所述慢坐标的变化导致的所述快坐标的变化对所述慢坐标的影响来获得作为一般坐标的K个集体坐标的函数的所述慢坐标的结构,其中,所述一般坐标通过正则变换与所述慢坐标关联,所述一般坐标由随时间变化的变化分量和用作相对于时间为常数的不变分量构成并且所述K个集体坐标是所述一般坐标的所述变化分量;以及
逆变换装置,所述逆变换装置用于基于能够作为关于所述集体坐标的运动方程的解而得到的作为时间的函数的所述集体坐标、所述慢坐标的结构以及所述快坐标的结构来预测所述质点系统的时间演化,
其中,K、M和N满足关系式K<M<3N,并且均表示不小于1的整数。
2.根据权利要求1所述的仿真装置,其中,所述坐标提取装置通过下述方式获得所述慢坐标的结构:
执行第一步骤,所述第一步骤用于获得表示为所述慢坐标和所述快坐标的函数的势能V;
执行第二步骤,所述第二步骤用于根据使用了所述势能的绝热近似条件使所述快坐标从属于所述慢坐标;
在所述慢坐标和所述快坐标的当前状态下,执行第三步骤,所述第三步骤用于通过考虑到所述影响来获得关于所述慢坐标的所述势能的差分系数;
在所述势能的所述差分系数下,执行第四步骤,所述第四步骤用于按照自洽集体坐标方法的使用了所述势能的差分系数的基本方程,获得所述慢坐标的关于所述集体坐标的差分系数;
在所述慢坐标的所述差分系数下,执行第五步骤,所述第五步骤用于以小量更新所述集体坐标并且获得更新后的慢坐标;
在所述更新后的慢坐标下,执行第六步骤,所述第六步骤用于对从属于所述慢坐标的所述快坐标进行结构弛豫;以及
之后,基于所述快坐标的所述结构弛豫之后的状态中的所述慢坐标和所述快坐标重复所述第三步骤至所述第六步骤。
3.根据权利要求2所述的仿真装置,其中,通过使用下面给出的式1至3中的至少一个的方法来考虑所述影响:
其中,i、j和k均表示从1到M的范围内的整数;
α、β和γ均表示从1至3N-M的范围内的整数;
RSi表示所述质点系统中的第i个慢坐标;
RFα表示所述质点系统中的第α个快坐标;
RS表示(RS1,RS2,......,RSM);
RF表示(RF1,RF2,......,RF(3N-M));
RF(RS)表示从属于所述慢坐标的所述快坐标;
V(RS,RF)表示由所述慢坐标和所述快坐标表示的所述势能;
Veff(RS)表示将RF(RS)代入V(RS,RF)获得的有效势能;
在式2中,第三项中的表示通过在第二项中相互替换字母i和j获得的项;
在式3中,第三项中的表示通过在第二项中相互替换字母i和k获得的项,第四项中的表示通过在第二项中相互替换字母j和k获得的项,第六项中的表示通过在第五项中相互替换字母i和k获得的项,并且第七项中的 表示通过在第五项中相互替换字母j和k获得的项;
此外,在式1至3中,使用下面给出的式4,
其中:Kαβ -1(RS)表示Kαβ(RS)的逆矩阵,
i、j均表示从1到M的范围内的整数,
α、β均表示从1至3N-M的范围内的整数,并且
Kαβ(RS)和Jαi(RS)分别由下面给出的式5和6定义,
4.根据权利要求2所述的仿真装置,其中,所述绝热近似条件为下面给出的式7:
对于α=1,…,3N-M 式(7)
其中:RFα表示所述质点系统中的第α个快坐标;
RS表示(RS1,RS2,......,RSM);
RF表示(RF1,RF2,......,RF(3N-M));并且
V(RS,RF)表示由所述慢坐标和所述快坐标表示的所述势能。
5.根据权利要求2所述的仿真装置,其中,所述集体坐标的数目K满足K=l并且所述基本方程由下面给出的式8和9来表示:
对于i=1,…,M 式8
对于i=1,…,M 式9
其中:i和j均表示从1到M的范围内的整数;
RSi表示所述质点系统中的第i个慢坐标;
RS表示(RS1,RS2,......,RSM);
q1表示所述集体坐标;
mi表示所述质点系统中的第i个慢坐标的质量;
表示满足式9的函数的第i分量;
Λ(RS)表示满足式9的函数;并且
Veff(RS)表示有效势能。
6.根据权利要求2所述的仿真装置,其中,所述集体坐标的数目K满足K=1,并且所述基本方程由下面给出的式10至12表示:
对于i=1,…,M 式10
对于i=1,…,M
式12
其中,i、j和k均表示从1到M的范围内的整数;
RSi表示所述质点系统中的第i个慢坐标;
RS表示(RS1,RS2,......,RSM);
q1表示所述集体坐标;
mi表示所述质点系统中的第i个慢坐标的质量;
和κ(RS,λ)表示满足式12的函数的第i分量,并且λ表示辅助坐标;并且Veff(RS)表示有效势能。
7.根据权利要求2至4中的任一项所述的仿真装置,其中,所述坐标提取装置是下述装置,该装置通过在求解所述基本方程的过程中增加独立于所述慢坐标并且被当作所述集体坐标的函数的变量的数目以便于消除所述基本方程中的与所述集体坐标相关的所述慢坐标的差分系数的符号的任意性来在所述第四步骤中执行计算。
8.根据权利要求7所述的仿真装置,其中,所述坐标提取装置是按照下面给出的式13所示的基本方程来执行计算的装置,其中,式13表示的基本方程是增加独立于所述慢坐标并被当作所述集体坐标的函数的变量的数目而获得的,
对于μ=1,…,K 式13
其中,Y是由下面给出的式14定义的MK+M+K维向量,并且vμ是由下面给出的式15的非齐次线性方程的解向量,
Cvμ=sμ对于μ=1,…,K 式15
式15中的C和sμ分别由下面给出的式16和17定义,
对于μ=1,…,K 式17
其中,V,ij(RS)和V,ijk(RS)分别由下面给出的式18和19定义,
其中,i、j和k均表示从1到M的范围内的整数;
μ和ν均表示从1至K的范围内的整数;
qμ表示第μ个集体坐标;
RSi表示所述质点系统中的第i个慢坐标;
RS表示(RS1,RS2,......,RSM);
mi表示所述质点系统中的第i个慢坐标的质量;
和Λμ均表示独立于RS的辅助坐标;并且
Veff(RS)表示有效势能。
9.根据权利要求8所述的仿真装置,其中,所述集体坐标的数目K满足K=1。
10.根据权利要求7所述的仿真装置,其中,所述坐标提取装置是按照下面给出的式20所示的基本方程来执行计算的装置,其中式20所示的基本方程是增加独立于所述慢坐标并且被当作所述集体坐标的函数的变量的数目而获得的,
对于μ=1,…,K 式20
其中,Z是由下面给出的式21定义的MK+M+2K维向量;
cμν为唯一地确定为使得针对每个μ定义的下面示出的式22表示的值最小的常数;并且
wμ表示跨越由下面给出的式23定义的矩阵D的K维奇异值空间的MK+M+2K维K单位向量,
其中,V,ij(RS)和V,ijk(RS)分别由下面给出的式24和25定义,
其中:i、j和k均表示从1到M的范围内的整数;
μ和ν均表示从1至K的范围内的整数;
qμ表示第μ个集体坐标;
RSi表示所述质点系统中的第i个慢坐标;
RS表示(RS1,RS2,......,RSM);
mi表示所述质点系统中的第i个慢坐标的质量;
λu和ρu均表示独立于RS的辅助坐标;并且
Veff(RS)表示有效势能。
11.根据权利要求10所述的仿真装置,其中,所述集体坐标的数目K满足K=1。
12.根据权利要求6所述的仿真装置,其中,所述坐标提取装置是下述装置,该装置基于下面给出的式26来计算所述势能的三阶导数的项,
其中,表示任意向量的第i分量,并且V,ij(RS)、V,ijk(RS)和n分别由下面给出的式27至29来定义,
13.根据权利要求1所述的仿真装置,其中,所述坐标设置装置是下述装置,该装置将针对所述质点系统的结构中的每个特征部分结构提取的表示该特征部分结构的代表坐标设置为所述慢坐标。
14.根据权利要求13所述的仿真装置,其中:
所述质点系统是包括生物大分子的多原子系统;
所述部分结构是生物大分子的二级结构、生物大分子的构建块或生物大分子的主链;并且
各部分结构的代表坐标是构成该部分结构的各原子的坐标、通过组合原子的坐标而定义的坐标或者所述部分结构的节距。
15.根据权利要求14所述的仿真装置,其中,所述生物大分子是蛋白质,所述部分结构是蛋白质的二级结构,并且所述二级结构的代表坐标是构成所述二级结构的原子组的重心的坐标或者所述二级结构的屈曲角。
16.根据权利要求15所述的仿真装置,其中,所述二级结构是螺旋结构、β折叠、转角、环和无规卷曲中的至少一种。
17.根据权利要求14所述的仿真装置,其中,所述生物大分子是蛋白质,所述部分结构是蛋白质的残基,并且所述残基的代表坐标是构成该残基的原子组的重心的坐标。
18.根据权利要求14所述的仿真装置,其中,所述生物大分子是蛋白质,所述部分结构是蛋白质的主链,并且所述主链的代表坐标是构成该主链的各个原子的坐标。
19.根据权利要求14所述的仿真装置,其中,所述生物大分子是核酸,所述部分结构是所述核酸的二级结构,并且所述二级结构的代表坐标是构成该二级结构的原子组的重心的坐标或者该二级结构的屈曲角。
20.根据权利要求19所述的仿真装置,其中,所述二级结构是螺旋结构。
21.根据权利要求14所述的仿真装置,其中,所述生物大分子是核酸,所述部分结构是该核酸的残基,并且所述残基的代表坐标是构成该残基的原子组的重心的坐标。
22.根据权利要求14所述的仿真装置,其中,所述生物大分子是核酸,所述部分结构是该核酸的主链,并且所述主链的代表坐标是构成该主链的各个原子的坐标。
23.根据权利要求14所述的仿真装置,其中,所述生物大分子是核酸,所述部分结构是该核酸的螺旋结构,并且所述螺旋结构的代表坐标是该螺旋结构的节距。
24.根据权利要求14至23中的任一项所述的仿真装置,其中,所述多原子系统包括针对所述生物大分子的结合候选分子。
25.一种仿真方法,所述仿真方法用于利用根据权利要求1所述的仿真装置来预测由模型化的N个质点构成的质点系统的行为,该方法包括以下步骤:
基于描述所述质点系统的结构的3N个质点坐标设置慢坐标,所述慢坐标是主要呈现所述质点系统的结构变化的M个坐标、即对于质点系统的三维结构的形成施加大的影响的坐标,
设置快坐标,所述快坐标是描述所述质点系统的结构并且独立于所述慢坐标的坐标;
通过使所述快坐标从属于所述慢坐标、即通过给出规定所述快坐标和所述慢坐标的关系的条件表达式来获得作为所述慢坐标的函数的所述快坐标的结构;
通过考虑由于所述慢坐标的变化导致的所述快坐标的变化对所述慢坐标的影响来获得作为一般坐标的K个集体坐标的函数的所述慢坐标的结构,其中,所述一般坐标通过正则变换与所述慢坐标关联,所述一般坐标由随时间变化的变化分量和相对于时间为常数的不变分量构成,并且所述K个集体坐标是所述一般坐标的所述变化分量;以及
基于能够作为关于所述集体坐标的运动方程的解而得到的作为时间的函数的所述集体坐标、所述慢坐标的结构以及所述快坐标的结构来预测所述质点系统的时间演变,
其中,K、M和N满足关系式K<M<3N,并且均表示不小于1的整数。
Applications Claiming Priority (5)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2011208444 | 2011-09-26 | ||
JP2011-208444 | 2011-09-26 | ||
JP2012208211A JP5697638B2 (ja) | 2011-09-26 | 2012-09-21 | 質点系の挙動を予測するシミュレーション装置およびシミュレーション方法並びにその方法を実行するためのプログラムおよび記録媒体 |
JP2012-208211 | 2012-09-21 | ||
PCT/JP2012/075576 WO2013047881A1 (en) | 2011-09-26 | 2012-09-26 | Simulation apparatus for predicting behavior of mass point system |
Publications (2)
Publication Number | Publication Date |
---|---|
CN103827875A CN103827875A (zh) | 2014-05-28 |
CN103827875B true CN103827875B (zh) | 2017-02-15 |
Family
ID=47995904
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201280046929.7A Active CN103827875B (zh) | 2011-09-26 | 2012-09-26 | 用于预测质点系统的行为的仿真装置 |
Country Status (9)
Country | Link |
---|---|
US (1) | US20140229150A1 (zh) |
EP (1) | EP2761519A4 (zh) |
JP (1) | JP5697638B2 (zh) |
CN (1) | CN103827875B (zh) |
BR (1) | BR112014006614A2 (zh) |
IL (1) | IL231712A (zh) |
IN (1) | IN2014CN02937A (zh) |
RU (1) | RU2661089C2 (zh) |
WO (1) | WO2013047881A1 (zh) |
Families Citing this family (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20170356024A1 (en) * | 2014-11-04 | 2017-12-14 | Brandeis University | Biophysical platform for drug development based on energy landscape |
DK3374906T3 (da) | 2015-11-09 | 2022-03-07 | Univ British Columbia | Systemer og fremgangsmåder til forudsigelse af forkert foldede proteinepitoper gennem kollektivt koordinatbias |
JP6844930B2 (ja) * | 2017-09-05 | 2021-03-17 | 住友重機械工業株式会社 | シミュレーション方法及びシミュレーション装置 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1581178A (zh) * | 2004-05-20 | 2005-02-16 | 上海交通大学 | 简化线形柔性大分子动力学的仿真方法 |
CN1628316A (zh) * | 2002-03-26 | 2005-06-15 | 科学与工业研究委员会 | 构建三维分子结构最佳模型的方法与系统 |
Family Cites Families (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2000194685A (ja) * | 1998-12-28 | 2000-07-14 | Canon Inc | シミュレ―ション方法及び装置 |
WO2002036744A2 (en) * | 2000-11-02 | 2002-05-10 | Protein Mechanics, Inc. | Method for residual form in molecular modeling |
JP2005267592A (ja) * | 2004-03-18 | 2005-09-29 | Japan Science & Technology Agency | エネルギー地形解析方法、エネルギー地形解析プログラムおよびこのプログラムを記録したコンピュータ読み取り可能な記録媒体ならびにエネルギー地形解析装置 |
EP1832233A4 (en) * | 2004-12-24 | 2008-04-16 | Yd Ltd | METHOD AND DEVICE FOR MEASURING HEADLAPSE DATA |
-
2012
- 2012-09-21 JP JP2012208211A patent/JP5697638B2/ja active Active
- 2012-09-26 WO PCT/JP2012/075576 patent/WO2013047881A1/en active Application Filing
- 2012-09-26 IN IN2937CHN2014 patent/IN2014CN02937A/en unknown
- 2012-09-26 BR BR112014006614A patent/BR112014006614A2/pt not_active Application Discontinuation
- 2012-09-26 EP EP12835159.0A patent/EP2761519A4/en active Pending
- 2012-09-26 CN CN201280046929.7A patent/CN103827875B/zh active Active
- 2012-09-26 RU RU2014117019A patent/RU2661089C2/ru active
-
2014
- 2014-03-25 US US14/225,252 patent/US20140229150A1/en not_active Abandoned
- 2014-03-26 IL IL231712A patent/IL231712A/en active IP Right Grant
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1628316A (zh) * | 2002-03-26 | 2005-06-15 | 科学与工业研究委员会 | 构建三维分子结构最佳模型的方法与系统 |
CN1581178A (zh) * | 2004-05-20 | 2005-02-16 | 上海交通大学 | 简化线形柔性大分子动力学的仿真方法 |
Non-Patent Citations (5)
Title |
---|
Critical evaluation of search algorithms for automated molecular docking and database screening;T.J.A.Ewing et al.;《Journal of Computational Chemistry》;19971231;第18卷;1175-1189 * |
Multidimensional quantum dynamics and infrared spectroscopy of hydrogen bonds;K.Giese et al.;《Physics Reports》;20060801;第430卷;211-276 * |
Nonadiabatic dynamics with trajectory surface hopping method;Mario Barbatti;《WIREs Computational Molecular Science》;20110506;第1卷(第4期);620-633 * |
The filling potential method:a method for estimating the free energy surface for protein-ligand docking;Yoshifumi Fukunishi et al.;《The Journal of Physical Chemistry B》;20031231;第107卷(第47期);13201-13210 * |
蛋白质三维结构预测问题的求解方法;许如初等;《华中科技大学学报(自然科学版)》;20070930;第35卷(第9期);98-100 * |
Also Published As
Publication number | Publication date |
---|---|
WO2013047881A1 (en) | 2013-04-04 |
JP2013084255A (ja) | 2013-05-09 |
JP5697638B2 (ja) | 2015-04-08 |
RU2661089C2 (ru) | 2018-07-11 |
US20140229150A1 (en) | 2014-08-14 |
RU2014117019A (ru) | 2015-11-10 |
EP2761519A1 (en) | 2014-08-06 |
IL231712A (en) | 2017-03-30 |
IN2014CN02937A (zh) | 2015-07-03 |
CN103827875A (zh) | 2014-05-28 |
IL231712A0 (en) | 2014-05-28 |
BR112014006614A2 (pt) | 2017-04-25 |
EP2761519A4 (en) | 2015-06-10 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Yao et al. | Reinforcement learning for many-body ground-state preparation inspired by counterdiabatic driving | |
Yim et al. | SE (3) diffusion model with application to protein backbone generation | |
Abueidda et al. | Prediction and optimization of mechanical properties of composites using convolutional neural networks | |
Masi et al. | Multiscale modeling of inelastic materials with Thermodynamics-based Artificial Neural Networks (TANN) | |
Bishara et al. | A state-of-the-art review on machine learning-based multiscale modeling, simulation, homogenization and design of materials | |
Zhang et al. | Machine learning materials physics: Multi-resolution neural networks learn the free energy and nonlinear elastic response of evolving microstructures | |
Orth et al. | Nonperturbative stochastic method for driven spin-boson model | |
Elber | A new paradigm for atomically detailed simulations of kinetics in biophysical systems | |
Teichert et al. | Scale bridging materials physics: Active learning workflows and integrable deep neural networks for free energy function representations in alloys | |
CN103827875B (zh) | 用于预测质点系统的行为的仿真装置 | |
Li et al. | Energy, momentum, and angular momentum transfer between electrons and nuclei | |
Kohnert et al. | Spectral discrete dislocation dynamics with anisotropic short range interactions | |
Vanderstraeten | Tensor network states and effective particles for low-dimensional quantum spin systems | |
Weber | Implications of PCCA+ in molecular simulation | |
Guo et al. | Learning constitutive models from microstructural simulations via a non-intrusive reduced basis method | |
Eivazi et al. | FE2 computations with deep neural networks: algorithmic structure, data generation, and implementation | |
Lesičar et al. | Convergence Check Phase-Field Scheme for Modelling of Brittle and Ductile Fractures | |
Rashid et al. | Revealing the predictive power of neural operators for strain evolution in digital composites | |
Zhang et al. | Variant design generation and machine learning aided deformation prediction for auxetic metamaterials | |
Vecsei et al. | Lee-Yang theory of quantum phase transitions with neural network quantum states | |
Challacombe | Linear scaling solution of the time-dependent self-consistent-field equations | |
Wang et al. | Carbon-based molecular properties efficiently predicted by deep learning-based quantum chemical simulation with large language models | |
Badreddine et al. | Factorized structure of the long-range two-electron integrals tensor and its application in quantum chemistry | |
Palchoudhary et al. | A plastic correction algorithm for full-field elasto-plastic finite element simulations: critical assessment of predictive capabilities and improvement by machine learning | |
Trstanova | Mathematical and algorithmic analysis of modified Langevin dynamics |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
REG | Reference to a national code |
Ref country code: HK Ref legal event code: DE Ref document number: 1196169 Country of ref document: HK |
|
C14 | Grant of patent or utility model | ||
GR01 | Patent grant | ||
REG | Reference to a national code |
Ref country code: HK Ref legal event code: GR Ref document number: 1196169 Country of ref document: HK |