CN114464263A - 一种分子晶体能量计算方法、装置及存储介质 - Google Patents
一种分子晶体能量计算方法、装置及存储介质 Download PDFInfo
- Publication number
- CN114464263A CN114464263A CN202111600787.1A CN202111600787A CN114464263A CN 114464263 A CN114464263 A CN 114464263A CN 202111600787 A CN202111600787 A CN 202111600787A CN 114464263 A CN114464263 A CN 114464263A
- Authority
- CN
- China
- Prior art keywords
- energy
- shell
- lattice
- cluster
- crystal
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 239000013078 crystal Substances 0.000 title claims abstract description 298
- 238000004364 calculation method Methods 0.000 title claims abstract description 97
- 238000000034 method Methods 0.000 claims abstract description 100
- 238000001311 chemical methods and process Methods 0.000 claims abstract description 9
- 230000003993 interaction Effects 0.000 claims description 56
- 239000000126 substance Substances 0.000 claims description 20
- 238000003775 Density Functional Theory Methods 0.000 claims description 19
- 238000012937 correction Methods 0.000 claims description 14
- 239000006185 dispersion Substances 0.000 claims description 8
- 230000008569 process Effects 0.000 claims description 4
- 238000001514 detection method Methods 0.000 claims description 2
- 239000011258 core-shell material Substances 0.000 abstract description 6
- BSYNRYMUTXBXSQ-UHFFFAOYSA-N Aspirin Chemical compound CC(=O)OC1=CC=CC=C1C(O)=O BSYNRYMUTXBXSQ-UHFFFAOYSA-N 0.000 description 8
- 229960001138 acetylsalicylic acid Drugs 0.000 description 8
- 238000010586 diagram Methods 0.000 description 6
- 238000013213 extrapolation Methods 0.000 description 6
- 230000006870 function Effects 0.000 description 5
- 238000004590 computer program Methods 0.000 description 4
- 230000002085 persistent effect Effects 0.000 description 4
- 230000000694 effects Effects 0.000 description 3
- 230000003287 optical effect Effects 0.000 description 3
- 238000004422 calculation algorithm Methods 0.000 description 2
- 238000004836 empirical method Methods 0.000 description 2
- 239000011159 matrix material Substances 0.000 description 2
- 230000007718 nuclear exclusion Effects 0.000 description 2
- 238000005457 optimization Methods 0.000 description 2
- 230000002093 peripheral effect Effects 0.000 description 2
- 238000012545 processing Methods 0.000 description 2
- 238000003077 quantum chemistry computational method Methods 0.000 description 2
- 238000012360 testing method Methods 0.000 description 2
- 208000037280 Trisomy Diseases 0.000 description 1
- 230000009471 action Effects 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- 239000000539 dimer Substances 0.000 description 1
- 239000002355 dual-layer Substances 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000002474 experimental method Methods 0.000 description 1
- 238000005259 measurement Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000012216 screening Methods 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 238000012163 sequencing technique Methods 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16C—COMPUTATIONAL CHEMISTRY; CHEMOINFORMATICS; COMPUTATIONAL MATERIALS SCIENCE
- G16C10/00—Computational theoretical chemistry, i.e. ICT specially adapted for theoretical aspects of quantum chemistry, molecular mechanics, molecular dynamics or the like
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16C—COMPUTATIONAL CHEMISTRY; CHEMOINFORMATICS; COMPUTATIONAL MATERIALS SCIENCE
- G16C20/00—Chemoinformatics, i.e. ICT specially adapted for the handling of physicochemical or structural data of chemical particles, elements, compounds or mixtures
- G16C20/30—Prediction of properties of chemical compounds, compositions or mixtures
Landscapes
- Theoretical Computer Science (AREA)
- Engineering & Computer Science (AREA)
- Computing Systems (AREA)
- Life Sciences & Earth Sciences (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Health & Medical Sciences (AREA)
- General Health & Medical Sciences (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Physics & Mathematics (AREA)
- Chemical & Material Sciences (AREA)
- Crystallography & Structural Chemistry (AREA)
- Analysing Materials By The Use Of Radiation (AREA)
Abstract
本申请提供一种分子晶体能量计算方法、装置及存储介质。其中,该方法包括:获取目标晶体结构,并从目标晶体结构中确定中心分子、M个团簇和M个壳结构;采用量子化学方法分别计算中心分子的分子能量、每一团簇的团簇能量和每一壳结构的壳能量;根据分子能量、团簇能量和壳能量,计算得到目标晶体结构的晶格能量;根据分子能量和晶格能量,计算得到目标晶体结构的晶体总能量。本申请的技术方案,通过建立“核‑壳”计算方案,能够提高晶体能量的计算效率和计算精度。
Description
技术领域
本申请属于分子晶体技术领域,尤其涉及一种分子晶体能量计算方法、装置及存储介质。
背景技术
分子晶体是一类有机分子通过非键类型的弱相互作用堆积形成的结构。弱相互作用的准确描述通常需要算法复杂度极高的高精度方法,此类方法通常难以运用到体系较大的分子晶体体系。分子晶体计算通常选择较为廉价的密度泛函理论方法、半经验方法或者经验的力场方法。为了能够将高精度方法运用到分子晶体上,人们通常将晶体的总能量分解为若干子体系的和。
现有的计算方案,通常均需要从晶体中按照特定的规则抽取大量的团簇结构,以进行二体、三体、甚至四体的计算,通常随着精度的增加和多体效应的考虑,团簇规模和个数迅速增加,这造成最终的计算流程复杂、成本较高。
由于计算资源限制,现有计算方案通常会按照一定的规则抛弃掉贡献较小团簇,这可能会引入一定的误差。并且,现有方案为引入晶体的整体效应,通常使用低精度方法进行晶体能量的计算,这也引入了一定的误差。
发明内容
为解决或部分解决相关技术中存在的问题,本申请提供一种分子晶体能量计算方法、装置及存储介质,通过建立“核-壳”计算方案,能够提高晶体能量的计算效率和计算精度。
本申请第一方面提供一种分子晶体能量计算方法,包括:
获取目标晶体结构,并从所述目标晶体结构中确定中心分子、M个团簇和M个壳结构,所述M为大于或等于1的整数;
采用量子化学方法分别计算所述中心分子的分子能量、每一所述团簇的团簇能量和每一所述壳结构的壳能量;
根据所述分子能量、所述团簇能量和所述壳能量,计算得到所述目标晶体结构的晶格能量;
根据所述分子能量和所述晶格能量,计算得到所述目标晶体结构的晶体总能量。
优选的,所述从所述目标晶体结构中确定中心分子、M个团簇和M个壳结构,包括:
从所述目标晶体结构中选取一个分子作为中心分子;
以所述中心分子的几何中心为球心,且以M个不同的预设半径作为截断半径分别对所述目标晶体结构进行原子截取,选取原子位于所述截断半径内的分子构建团簇,得到M个所述团簇;
将所述中心分子从每一所述团簇中进行删除,得到对应的M个壳结构。
优选的,所述选取原子位于所述截断半径内的分子构建团簇,包括:
选取所有原子均位于所述截断半径内的分子构建团簇;或者,
若有分子仅部分原子位于所述截断半径内,对所述分子进行补全处理,并利用补全后的分子以及所有原子均位于所述截断半径内的分子构建团簇。
优选的,所述采用量子化学方法分别计算所述中心分子的分子能量、每一所述团簇的团簇能量和每一所述壳结构的壳能量,包括:
以所述中心分子的分子结构作为输入,采用量子化学方法计算得到所述中心分子的分子能量以及构成所述分子能量的各分项能量;
分别以每一所述团簇的结构作为输入,采用所述量子化学方法计算得到每一所述团簇的团簇能量以及构成所述团簇能量的各分项能量;
分别以每一所述壳结构作为输入,采用所述量子化学方法计算得到每一所述壳结构的壳能量以及构成所述壳能量的各分项能量。
优选的,所述量子化学方法包括基于密度泛函理论的紧束缚DFTB方法,能量计算公式为:
E能量=E0近似+Escc+Erep+Enuc+Edisp_corr;
其中,各分项能量E0近似、Escc、Erep、Enuc、Edisp_corr分别为:零阶近似下的轨道能,二/三阶静电能,价键的近程排斥能,核排斥能,长程的色散校正能。
优选的,所述量子化学方法包括密度泛函理论DFT方法,能量计算公式为:
E能量=E0+Ej+Ex+Ec+Enuc+Edisp_corr;
其中,各分项能量E0、Ej、Ex、Ec、Enuc、Edisp_corr分别为:轨道能,电子静电能,交换能,相关能,核排斥能,长程的色散校正能。
优选的,所述根据所述分子能量、所述团簇能量和所述壳能量,计算得到所述目标晶体结构的晶格能量,包括:
根据所述分子能量的各分项能量、每一所述团簇能量的各分项能量以及每一所述壳能量的各分项能量,利用第一预设公式计算得到所述中心分子与每一所述壳结构之间的相互作用能的各分项能量;
根据所述中心分子与每一所述壳结构之间的相互作用能的各分项能量,利用第二预设公式计算得到所述目标晶体结构的晶格能量的各分项能量;
根据所述晶格能量的各分项能量以及各分项能量的贡献系数,利用第三预设公式计算得到所述目标晶体结构的晶格能量。
优选的,所述第一预设公式为:
E壳n相互作用能,i=E团簇n,i–E分子,i–E壳n,i;
其中,所述n为团簇编号,所述n的取值为1~M,所述i为各分项能量的编号,所述E团簇n,i为第n个团簇的团簇能量的第i个分项能量,所述E分子,i为所述中心分子的分子能量的第i个分项能量,所述E壳n,i为第n个壳结构的壳能量的第i个分项能量,所述E壳n相互作用能,i为所述中心分子与所述第n个壳结构之间的相互作用能的第i个分项能量。
优选的,当所述M大于或等于3时,所述第二预设公式为:
E壳n相互作用能.i=E晶格,i+A*(Rn)-B;
其中,所述E晶格,i为所述目标晶体结构的晶格能量的第i个分项能量,所述Rn为构建所述第n个团簇时采用的截取半径,所述A和所述B为两个不同的衰减系数;
所述根据所述中心分子与每一所述壳结构之间的相互作用能的各分项能量,利用第二预设公式计算得到所述目标晶体结构的晶格能量的各分项能量,包括:
对所述中心分子与每一所述壳结构之间的相互作用能的各分项能量利用所述第二预设公式进行计算,得到多组所述E晶格,i、A和B;
对多组所述E晶格,i、A和B进行拟合,得到所述目标晶体结构的晶格能量的各分项能量。
优选的,当所述M为2时,所述第二预设公式为:
E晶格,i=[E壳1相互作用能,i(R1)3-E壳2相互作用能,i(R2)3]/[(R1)3-(R2)3];
其中,所述E晶格,i为所述目标晶体结构的晶格能量的第i个分项能量,E壳1相互作用能,i为所述中心分子与第1个壳结构之间的相互作用能的第i个分项能量,E壳2相互作用能,i为所述中心分子与第2个壳结构之间的相互作用能的第i个分项能量,所述R1为构建第1个团簇时采用的截取半径,所述R2为构建第2个团簇时采用的截取半径。
优选的,当所述M为1时,所述n为1,所述第二预设公式为:
E晶格,i=E壳1相互作用能,i;
其中,所述E晶格,i为所述目标晶体结构的晶格能量的第i个分项能量,E壳1相互作用能,i为所述中心分子与壳结构之间的相互作用能的第i个分项能量。
优选的,所述第三预设公式为:
E晶格=sum(kiE晶格,i);
其中,所述E晶格为所述目标晶体结构的晶格能量,所述E晶格,i为所述目标晶体结构的晶格能量的第i个分项能量,所述ki为所述晶格能量的第i个分项能量的贡献系数。
优选的,所述晶格能量的各分项能量的贡献系数的计算方式包括:
获取多个参考晶体结构以及每一所述参考晶体结构的参考晶格能量的各分项能量;
分别计算每一所述参考晶体结构的晶格能量的各分项能量;
设定所述晶格能量的各分项能量的贡献系数;
根据每一所述参考晶体结构的晶格能量的各分项能量以及设定的贡献系数,得到每一所述参考晶体结构的预测晶格能量的各分项能量;
利用每一所述参考晶体结构的参考晶格能量的各分项能量和预测晶格能量的各分项能量,对设定的贡献系数进行拟合,得到拟合后的各分项能量的贡献系数。
优选的,所述根据所述分子能量和所述晶格能量,计算得到所述目标晶体结构的晶体总能量,包括:
对所述分子能量进行能量校正,得到校正后的分子能量;
利用所述校正后的分子能量和所述晶格能量,计算得到所述目标晶体结构的晶体总能量。
本申请第二方面提供一种分子晶体能量比较方法,包括:
获取待比较的至少两个晶体结构;
利用如本申请第一方面提供的所述分子晶体能量计算方法对每一所述晶体结构进行晶体能量计算,得到每一所述晶体结构的晶体总能量;
根据每一所述晶体结构的晶体总能量,确定所述至少两个晶体结构的晶体能量大小关系。
本申请第三方面提供一种分子晶体能量计算装置,包括:
获取模块,用于获取目标晶体结构,并从所述目标晶体结构中确定中心分子、M个团簇和M个壳结构,所述M为大于或等于1的整数;
第一计算模块,用于采用量子化学方法分别计算所述中心分子的分子能量、每一所述团簇的团簇能量和每一所述壳结构的壳能量;
第二计算模块,用于根据所述分子能量、所述团簇能量和所述壳能量,计算得到所述目标晶体结构的晶格能量;
第三计算模块,用于根据所述分子能量和所述晶格能量,计算得到所述目标晶体结构的晶体总能量。
本申请第四方面提供一种分子晶体能量比较装置,包括:
获取模块,用于获取待比较的至少两个晶体结构;
计算模块,用于利用如本申请第三方面提供的所述分子晶体能量计算装置对每一所述晶体结构进行晶体能量计算,得到每一所述晶体结构的晶体总能量;
确定模块,用于根据每一所述晶体结构的晶体总能量,确定所述至少两个晶体结构的晶体能量大小关系。
本申请第五方面提供一种电子设备,包括:
处理器;以及
存储器,其上存储有可执行代码,当所述可执行代码被所述处理器执行时,使所述处理器执行如本申请第一方面提供的所述分子晶体能量计算方法或者如本申请第二方面提供的所述分子晶体能量比较方法。
本申请第六方面提供一种计算机可读存储介质,其上存储有可执行代码,当所述可执行代码被电子设备的处理器执行时,使所述处理器执行如本申请第一方面提供的所述分子晶体能量计算方法或者如本申请第二方面提供的所述分子晶体能量比较方法。
本申请提供的技术方案,在获取到目标晶体结构后,可以从中确定出中心分子以及至少一个团簇结构和相应的壳结构,并利用量子化学方法分别计算得到中心分子的分子能量、各团簇结构的团簇能量以及各壳结构的壳能量,基于上述各能量计算得到目标晶体结构的晶格能量,再利用中心分子的分子能量和该晶格能量,计算得到目标晶体结构的晶体总能量。本申请通过计算中心分子(核)和团簇(壳)的能量,建立“核-壳”计算方案,能够回避现有技术中大量的二体、三体等多体团簇的计算,能够获得比原先直接采用低精度计算方法更高的能量精度,并且计算效率也得到较大提高。
附图说明
通过结合附图对本申请示例性实施方式进行更详细地描述,本申请的上述以及其它目的、特征和优势将变得更加明显,其中,在本申请示例性实施方式中,相同的参考标号通常代表相同部件。
图1是本申请实施例提供的一种分子晶体能量计算方法的流程示意图;
图2是本申请实施例提供的一种Aspirin晶体中的中心分子结构图;
图3是以图2中的中心分子为球心,以R1作为截断半径进行原子截取后的分子结构图;
图4是对图3的分子结构进行分子补齐后的团簇1结构图;
图5是以图2中的中心分子为球心,以R2作为截断半径进行原子截取并补齐后的团簇2结构图;
图6是本申请实施例提供的一种分子晶体能量计算装置的结构示意图;
图7是本申请实施例提供的一种电子设备的结构示意图。
具体实施方式
下面将参照附图更详细地描述本申请的实施方式。虽然附图中显示了本申请的实施方式,然而应该理解,可以以各种形式实现本申请而不应被这里阐述的实施方式所限制。相反,提供这些实施方式是为了使本申请更加透彻和完整,并且能够将本申请的范围完整地传达给本领域的技术人员。
在本申请使用的术语是仅仅出于描述特定实施例的目的,而非旨在限制本申请。在本申请和所附权利要求书中所使用的单数形式的“一种”、“所述”和“该”也旨在包括多数形式,除非上下文清楚地表示其他含义。还应当理解,本文中使用的术语“和/或”是指并包含一个或多个相关联的列出项目的任何或所有可能组合。
应当理解,尽管在本申请可能采用术语“第一”、“第二”、“第三”等来描述各种信息,但这些信息不应限于这些术语。这些术语仅用来将同一类型的信息彼此区分开。例如,在不脱离本申请范围的情况下,第一信息也可以被称为第二信息,类似地,第二信息也可以被称为第一信息。由此,限定有“第一”、“第二”的特征可以明示或者隐含地包括一个或者更多个该特征。在本申请的描述中,“多个”的含义是两个或两个以上,除非另有明确具体的限定。
相关技术中,在计算晶体的能量时,通常是从晶体中抽取大量的团簇结构进行二体、三体、甚至四体的计算。然而随着精度需求的增加和多体效应的考虑,团簇规模和个数迅速增加,这将会造成计算流程复杂、成本较高。并且,目前多采用低精度方法来进行晶体能量的计算,这也引入了一定的误差。
针对上述问题,本申请实施例提供一种分子晶体能量计算方法、装置及存储介质,通过建立“核-壳”计算方案,能够提高晶体能量的计算效率和计算精度。
以下结合附图详细描述本申请实施例的技术方案。
本申请实施例提供了一种分子晶体能量计算方法。如图1所示,该方法可以包括以下步骤:
S110、获取目标晶体结构,并从目标晶体结构中确定中心分子、M个团簇和M个壳结构。其中,M可以为大于或等于1的整数。
其中,目标晶体结构可以是由单一分子构成的晶体结构,也可以是由多种分子构成的晶体结构,这里不作限定。
在一实施方式中,从目标晶体结构中确定中心分子、M个团簇和M个壳结构的具体实施方式可以包括:从目标晶体结构中选取一个分子作为中心分子;以中心分子的几何中心为球心,且以M个不同的预设半径作为截断半径分别对目标晶体结构进行原子截取,选取原子位于截断半径内的分子构建团簇,得到M个团簇;将中心分子从每一团簇中进行删除,得到对应的M个壳结构。
其中,若目标晶体结构是由单一分子构成的晶体结构,可以从目标晶体结构中随机选取一个分子作为中心分子,也可以从目标晶体结构的几何中心附近选取一个分子作为中心分子。
若目标晶体结构是由两种分子(如分子A和分子B)构成的晶体结构,可以从目标晶体结构中选取相互之间最靠近(分子几何中心之间的距离最短)的分子A和分子B共同作为中心分子。
进一步地,构建团簇时,可以选取所有原子均位于截断半径内的分子构建团簇,而排除掉仅有部分原子位于截断半径内的分子;
或者,若有分子仅部分原子位于截断半径内,可以对该分子进行补全处理,并利用补全后的分子以及所有原子均位于截断半径内的分子共同构建团簇。即以中心分子的几何中心和半径R划球,选定半径R内的全部原子,并保证球内至少包含中心分子的全部第一近邻分子上的原子,按照晶体排布,将原子补齐为完整分子,该分子集合为“团簇”,去除中心分子的团簇即为“壳”。
S120、采用量子化学方法分别计算中心分子的分子能量、每一团簇的团簇能量和每一壳结构的壳能量。
具体的,可以以中心分子的分子结构作为输入,采用量子化学方法计算得到中心分子的分子能量以及构成分子能量的各分项能量;分别以每一团簇的结构作为输入,采用同一量子化学方法计算得到每一团簇的团簇能量以及构成团簇能量的各分项能量;分别以每一壳结构作为输入,采用同一量子化学方法计算得到每一壳结构的壳能量以及构成壳能量的各分项能量。
在一实施方式中,量子化学方法可以包括基于密度泛函理论的紧束缚(DensityFunctional based Tight Binding,DFTB)方法,上述各能量的计算方法均可以采用如下公式:
E能量=E0近似+Escc+Erep+Enuc+Edisp_corr; (1-1)
其中,各分项能量E0近似为零阶近似下的轨道能,Escc为二/三阶静电能,Erep为价键的近程排斥能,Enuc为核排斥能,Edisp_corr为长程的色散校正能。由于Enuc默认为精确值,不需要进行额外修正,这里可以将Enuc与Erep进行合并,或直接忽略Enuc,即公式(1-1)可以表示为:E能量=E0近似+Escc+Erep+Edisp_corr。
在一实施方式中,量子化学方法可以包括密度泛函理论(DensityFunctionalTheory,DFT)方法,上述各能量的计算方法均可以采用如下公式:
E能量=E0+Ej+Ex+Ec+Enuc+Edisp_corr; (1-2)
其中,各分项能量E0为轨道能,Ej为电子静电能,Ex为交换能,Ec为相关能,Enuc为核排斥能,Edisp_corr为长程的色散校正能。
可以理解的是,量子化学方法除可以采用上述DFTB和DFT方法外,还可以采用其他半经验方法或经验力场方法等,这里不作限定。
这里以DFTB为例作进一步说明。以中心分子的分子结构作为输入,利用公式(1-1)计算得到中心分子的分子能量及其各分项能量。
以中心分子的几何中心作为球心,以预设半径R1作为截断半径对目标晶体结构进行原子截取,将原子位于该预设半径R1范围内的分子构成一个团簇,得到团簇1;以团簇1的结构作为输入,同样利用公式(1-1)计算得到团簇1的团簇能量及其各分项能量;从团簇1中将中心分子删除,得到壳1结构,将壳1结构作为输入,同样利用公式(1-1)计算得到壳1结构的壳能量及其各分项能量。
仍以中心分子的几何中心作为球心,以预设半径R2作为截断半径对目标晶体结构进行原子截取,将原子位于该预设半径R2范围内的分子构成一个团簇,得到团簇2;以团簇2的结构作为输入,同样利用公式(1-1)计算得到团簇2的团簇能量及其各分项能量;从团簇2中将中心分子删除,得到壳2结构,将壳2结构作为输入,同样利用公式(1-1)计算得到壳2结构的壳能量及其各分项能量。
仍以中心分子的几何中心作为球心,以预设半径R3作为截断半径对目标晶体结构进行原子截取,将原子位于该预设半径R3范围内的分子构成一个团簇,得到团簇3;以团簇3的结构作为输入,同样利用公式(1-1)计算得到团簇3的团簇能量及其各分项能量;从团簇3中将中心分子删除,得到壳3结构,将壳3结构作为输入,同样利用公式(1-1)计算得到壳3结构的壳能量及其各分项能量。
S130、根据分子能量、团簇能量和壳能量,计算得到目标晶体结构的晶格能量。
本申请实施例中,可以利用中心分子的分子能量、每一团簇的团簇能量和每一壳结构的壳能量,确定出中心分子与每一壳结构之间的相互作用能,再使用相互作用能进行外推,得到目标晶体结构的晶格能量。
在一实施方式中,可以根据分子能量的各分项能量、每一团簇能量的各分项能量以及每一壳能量的各分项能量,利用第一预设公式计算得到中心分子与每一壳结构之间的相互作用能的各分项能量;进一步地,可以根据中心分子与每一壳结构之间的相互作用能的各分项能量,利用第二预设公式计算得到目标晶体结构的晶格能量的各分项能量;再根据晶格能量的各分项能量以及各分项能量的贡献系数,利用第三预设公式计算得到目标晶体结构的晶格能量。
本实施方式中,第一预设公式的表示形式如下:
E壳n相互作用能,i=E团簇n,i–E分子,i–E壳n,i; (1-3)
其中,n为团簇编号,且n的取值为1~M。i为各分项能量的编号,以DFTB方法为例,当i为1时,对应分项能量为E0近似;当i为2时,对应分项能量为Escc;当i为3时,对应分项能量为Erep;当i为4时,对应分项能量为Enuc;当i为5时,对应分项能量为Edisp_corr。E团簇n,i为第n个团簇的团簇能量的第i个分项能量,E分子,i为中心分子的分子能量的第i个分项能量,E壳n,i为第n个壳结构的壳能量的第i个分项能量,E壳n相互作用能,i为中心分子与第n个壳结构之间的相互作用能的第i个分项能量。
例如,根据公式(1-3),中心分子与第1个壳结构(壳1结构)之间的相互作用能的第i个分项能量的表示形式为:E壳1相互作用能,i=E团簇1,i–E分子,i–E壳1,i。中心分子与第2个壳结构(壳2结构)之间的相互作用能的第i个分项能量的表示形式为:E壳2相互作用能,i=E团簇2,i–E分子,i–E壳2,i。
考虑到不同截断半径(Rn)下的壳结构与中心分子之间的相互作用能可能存在衰减的情况,且衰减符合与Rn有关的衰减函数。在一实施方式中,当M大于或等于3时,第二预设公式可以表示如下:
E壳n相互作用能.i=E晶格,i+A*(Rn)-B; (1-4)
其中,E晶格,i为目标晶体结构的晶格能量的第i个分项能量,Rn为构建第n个团簇时采用的截取半径,A和B为两个不同的衰减系数,且A和B均未知。
相应地,可以对中心分子与每一壳结构之间的相互作用能的各分项能量利用第二预设公式进行计算,得到多组E晶格,i、A和B;并对多组E晶格,i、A和B进行拟合,得到目标晶体结构的晶格能量的各分项能量。
利用E壳n相互作用能.i进行能量外推,得到E晶格,i。对于外推,公式(1-4)中E壳n相互作用能.i和Rn已知,E晶格,i、A和B未知,因此可以采用3个壳结构与中心分子之间的相互作用能对E晶格,i、A和B进行求解,最终得到E晶格,i。对于大于3个壳结构(M大于3)的情况,利用每3个壳结构可以对应求出一组E晶格,i、A和B,从而得到多组E晶格,i、A和B,再对多组E晶格,i、A和B进行拟合优化,最终得到E晶格,i。优选的,对多组E晶格,i、A和B进行拟合优化可以是对多组E晶格,i、A和B分别进行求平均值。由于团簇(或壳结构)数量越多,使得Rn随之增大,从而导致计算量迅速增加,为减小计算量,提高计算效率,本申请实施例优选M在3以内,即不超过3个团簇。
可以理解的是,衰减函数除了可以采用公式(1-4)外,也可以使用其它衰减函数,如以下两种表示函数:
E壳n相互作用能,i=E晶格,i+A*exp(-B*Rn);
E壳n相互作用能,i=E晶格,i+A*exp[-B*sqrt(Rn)];
在上述两个函数中,A和B为两个不同的衰减系数,且A和B均未知。E晶格,i的计算过程可以与公式(1-4)的计算过程类似,这里不再赘述。
对于公式(1-4),通常可以将B看作是一个物理确定的参数,其理论值可以设为3.0,因此,公式(1-4)中仅E晶格,i和A未知。在一实施方式中,当M为2时,第二预设公式可以由公式(1-4)转化为如下公式(1-5):
E晶格,i=[E壳1相互作用能,i(R1)3-E壳2相互作用能,i(R2)3]/[(R1)3-(R2)3]; (1-5)
其中,E晶格,i为目标晶体结构的晶格能量的第i个分项能量,E壳1相互作用能,i为中心分子与第1个壳结构之间的相互作用能的第i个分项能量,E壳2相互作用能,i为中心分子与第2个壳结构之间的相互作用能的第i个分项能量,R1为构建第1个团簇时采用的截取半径,R2为构建第2个团簇时采用的截取半径。
此时,可以仅采用2个团簇进行外推,计算得到E晶格,i,在保证计算精度的同时,可以进一步提高计算效率。
在一实施方式中,可以仅考虑使用1个团簇结构进行壳相互作用能计算的情况,此时无法进行外推,但依然可以使用分项进行拟合,获得E晶格,i。
具体的,当M为1时,n也为1,此时第二预设公式可以表示如下:
E晶格,i=E壳1相互作用能,i=E团簇1,i–E分子,i–E壳1,i; (1-6)
其中,E晶格,i为目标晶体结构的晶格能量的第i个分项能量,E壳1相互作用能,i为中心分子与壳结构之间的相互作用能的第i个分项能量。
在一实施方式中,第三预设公式的表示形式如下:
E晶格=sum(kiE晶格,i); (1-7)
其中,E晶格为目标晶体结构的晶格能量,E晶格,i为目标晶体结构的晶格能量的第i个分项能量,ki为晶格能量的第i个分项能量的贡献系数。
本实施方式中,晶格能量的各分项能量的贡献系数可以为设定的经验值,也可以是在晶体能量计算前计算一定数量的E壳n相互作用能.i,并与实验或高精度晶格能结合,拟合确定。
虽然各个外推后的晶格能分项直接求和,从物理上应与晶格能相等,但在实际应用中发现:a)尽管能量总体可能一致,但不同的方法在分项的表现上趋势出现差异;b)分项的能量差异可能导致晶格能计算出现较大误差。因此这里使用试验晶格能或者高精度晶格能作为参考,对较低精度方法的各个晶格能分项进行重新标定,以获得与参考更为接近的晶格能。
以下为拟合确定各分项能量的贡献系数的具体实施方式:
1)获取多个参考晶体结构以及每一参考晶体结构的参考晶格能量。
其中,可以从过往实验结果、文献报道和/或结构数据库中收集N个参考晶体结构以及这些参考晶体结构的参考晶格能量Eref,j,j为1~N。参考晶体结构是指利用理论方法(如DFT、DFTB等)预测得到的力收敛的晶体结构或试验晶体结构,参考晶格能量为由高精度理论方法(如DFT)预测得到的晶体晶格能量或者试验测量值。
2)分别计算每一参考晶体结构的晶格能量的各分项能量。
利用与前述得到目标晶体结构的晶格能量的各分项能量相同的计算方法,计算各参考晶体结构的晶格能量的各分项能量。以DFTB为例,将各参考晶体结构分别作为输入,通过前述一系列计算可以得到每一参考晶体结构的晶格能量的各分项能量:E晶格,0近似、E晶格,scc、E晶格,rep、E晶格,disp_corr、Enuc。
进一步地,可以将N个参考晶体结构的晶格能量的各分项能量E晶格,i整理为一个矩阵,该矩阵(X)的表示形式如下:
并且,各参考晶体结构的参考晶格能量Eref,j可以以矢量形式来表示:
E=[Eref,1 Eref,2 ... Eref,N]T;
3)设定晶格能量的各分项能量的贡献系数ki。
贡献系数ki为待确定的参数,其可以以矢量形式来表示:
K=[k0近似 kscc krep kdisp_corr knuc]T;
由于Enuc为精确值,不需要重新标定,因此可以将上述矢量K修改为:
K=[k0近似 kscc krep kdisp_corr 1]T;
4)根据每一参考晶体结构的晶格能量的各分项能量以及设定的贡献系数,得到每一参考晶体结构的预测晶格能量的各分项能量。
理想情况下,E=XK;而实际情况下,E*=XK。其中,E*中包含有各参考晶体结构的预测晶格能量的各分项能量。
5)利用每一参考晶体结构的参考晶格能量的各分项能量和预测晶格能量的各分项能量,对设定的贡献系数进行拟合,得到拟合后的各分项能量的贡献系数。
通过调节K,使得E*与E靠近,当E*与E之间的误差(如均方根误差RMSE、均方误差MSE等)最小时,即获得K。在实际应用中,参考晶体结构的数量N通常远大于分项能量数量i,因此,可以采用优化算法(如最小二乘法)对K进行直接拟合得到。
S140、根据分子能量和晶格能量,计算得到目标晶体结构的晶体总能量。
本申请实施例中,在求得中心分子的分子能量和目标晶体结构的晶格能量后,可以计算两者的能量和,以得到目标晶体结构的晶体总能量。具体计算公式如下:
E总能=E分子+E晶格=E分子+sum(kiE晶格,i); (1-8)
其中,E总能为目标晶体结构的晶体总能量,E分子为中心分子的分子能量,E晶格为目标晶体结构的晶格能量。
这里以Aspirin晶体为例进行说明,该Aspirin晶体为P21/c对称性,一个单元晶胞内包含4个等价分子。本实例选择低精度的DFTB方法进行2壳结构的外推,预测晶体总能量。根据文献报道,高精度的DFT方法计算得到的该Aspirin晶格能量为-118kJ/mol。
1)选择4个等价分子中的一个作为中心分子,计算E分子,0近似、E分子,scc、E分子,rep、E分子,disp_corr。其中,Aspirin晶体中的中心分子的分子结构如图2所示。
2)使用R1=4.0埃作为截断半径,以中心分子的几何中心为球心,进行原子选择,如图3所示,图中示出的为在截断半径R1内的所有原子的结构。从图中可以看出外围分子并不完整,因此需要进行分子补齐操作;
3)对残缺的分子进行补齐,获得团簇1和壳1结构,图4所示为补齐分子后的团簇1结构,球棍模型的结构表示为中心分子,其余线模型部分为壳1结构。
4)使用R2=8.0埃作为截断半径,重复上述步骤2)和3),得到团簇2和壳2结构,图5所示为补齐后的团簇2结构,球棍模型的结构表示为中心分子,其余线模型部分为壳2结构。
5)通过DFTB方法在3OB参数下对中心分子、团簇1、团簇2、壳1和壳2结构进行各分项能量的计算,获得E分子,i、E团簇1,i、E壳1,i、E团簇2,i和E壳2,i,如表1所示:
表1 DFTB方法在3OB参数下计算得到的各个分项能量(单位:a.u.)
6)使用公式(1-3),计算得到E壳1相互作用能,i和E壳2相互作用能,i。此外,利用公式(1-5)进行外推,得到晶格能量的各分项能量。其各分项能量数据如表2所示。
表2 DFTB方法在3OB参数下外推得到的各分项能量(单位:a.u.)
7)选择预先针对DFTB拟合完成的KDFTB,壳1/2,使用公式(1-7)获得E晶格。采用表2中针对DFTB/3OB确定的参数得到E晶格=-119.8kJ/mol,与文献报道值非常接近。
8)使用公式(1-8)计算得到晶体总能量。根据以上晶格能量,可以得到Aspirin晶体在当前方法的晶体总能量为:-83023.0kJ/mol。
仍以Aspirin晶体为例进行说明,该Aspirin晶体为P21/c对称性,一个单元晶胞内包含4个等价分子。本实例选择密度泛函理论(DFT)方法中正常精度的PBE-D3BJ方法和6-31G*基组的组合对1壳结构进行晶体能量预测。
1)选择4个等价分子中的一个作为中心分子,计算E分子,0、E分子,j、E分子,x、E分子,c、E分子,nuc、E分子,disp_corr。中心分子的分子结构如图2所示。
2)使用R1=4.0埃作为截断半径,以中心分子的几何中心为球心,进行原子选择,如图3所示,球棍模型的结构表示为中心分子。以截断半径4.0埃选定的原子,可以看到外围分子并不完整,需要进行分子补齐。
3)对残缺的分子进行补齐,获得团簇1和壳1结构,如图4所示。补齐分子后的团簇1结构,球棍模型的结构为中心分子,其余部分为壳1结构。
4)使用PBE-D3BJ方法和def-SV(P)对中心分子、团簇1和壳1结构进行各分项能量的计算,获得E分子,i、E团簇1,i、E壳1,i,其计算方式可以参见公式(1-2),并利用公式(1-3)计算得到E壳1相互作用能,i。其各分项能量如表3所示:表3为PBE-D3BJ和def-SV(P)下得到的各个分量和当前参数。
表3 PBE-D3BJ和def-SV(P)下得到的各分项能量(单位:a.u.)
5)选择预先针对PBE-D3BJ方法和def-SV(P)拟合的KPBE-D3BJ/6-31G*,壳1,使用公式(1-7)获得E晶格=-117.1kJ/mol,也非常接近文献报道的高精度计算的结果。
6)使用公式(1-8)计算得到晶体总能量。根据以上晶格能量,可以得到Aspirin晶体在当前方法的晶体总能量为:-1700088.5kJ/mol。
在一实施方式中,可以先对中心分子的分子能量进行能量校正,得到校正后的分子能量;再利用校正后的分子能量和晶格能量,计算得到目标晶体结构的晶体总能量。
例如,分子能量和晶格能量均为采用DFTB方法计算得到的,之后可以使用更高精度的方法(如MP2/aug-cc-pVQZ方法)对中心分子的分子能量进行重新计算,以替换掉前面采用低精度方法(DFTB)计算得到的分子能量,从而获得更佳可信的分子能量,继而得到置信度更高的晶体总能量,以进一步提升计算精度。
可以理解的是,也可以采用其他校正方式,例如对分子能量的至少一个分项能量进行校正,以得到更佳可信的分子能量。
本申请实施例提供的方法,通过计算中心分子(核)和团簇(壳)的能量,建立“核-壳”计算方案,能够回避现有技术中大量的二体、三体等多体团簇的计算,能够获得比原先直接采用低精度计算方法更高的能量精度,并且计算效率也得到较大提高。
本申请使用中心分子-外围团簇进行晶体能量评估的技术,兼容主流的量子化学计算方法,能够较好的平衡计算精度和成本,可用于晶体能量的快速计算。
本申请可以直接使用一个大团簇进行计算,减少了计算次数,回避现有方法中二体等小团簇的划分、筛选和计算的步骤。
本申请的全部计算可在相同的计算精度下进行,通过根据不同物理起源的能量项引入多个经验参数,能够获得相对较高精度的晶体总能量。
本申请可以针对中心分子和壳结构选择不同精度的方法进行组合,分别对分子能量和晶格能进行不同高精度的处理,以获得更可靠的晶体总能量。
本申请原则上使用两个壳的计算结果进行外推,实际使用中可以直接用低精度方法对团簇进行拟合,直接得到晶格能,进一步提高总体的计算效率。
本申请实施例还提供了一种分子晶体能量比较方法,包括以下步骤:
S210、获取待比较的至少两个晶体结构。
S220、利用前述实施例中提供的分子晶体能量计算方法对每一晶体结构进行晶体能量计算,得到每一晶体结构的晶体总能量。
S230、根据每一晶体结构的晶体总能量,确定上述至少两个晶体结构的晶体能量大小关系。
采用上述方法,可以对多个晶体结构进行快速而准确的晶体能量计算,并对这些晶体结构进行能量排序,以确定各晶体结构的晶体能量大小关系,方便在后续应用中能够快速地从中选出较稳定的晶体结构。
本申请实施例还提供了一种分子晶体能量计算装置,该装置可以用于执行前述实施例提供的分子晶体能量计算方法。如图6所示,该装置可以包括:
获取模块610,用于获取目标晶体结构,并从目标晶体结构中确定中心分子、M个团簇和M个壳结构,M为大于或等于1的整数;
第一计算模块620,用于采用量子化学方法分别计算中心分子的分子能量、每一团簇的团簇能量和每一壳结构的壳能量;
第二计算模块630,用于根据分子能量、团簇能量和壳能量,计算得到目标晶体结构的晶格能量;
第三计算模块640,用于根据分子能量和晶格能量,计算得到目标晶体结构的晶体总能量。
可选的,获取模块610从目标晶体结构中确定中心分子、M个团簇和M个壳结构的实施方式可以包括:从目标晶体结构中选取一个分子作为中心分子;以中心分子的几何中心为球心,且以M个不同的预设半径作为截断半径分别对目标晶体结构进行原子截取,选取原子位于截断半径内的分子构建团簇,得到M个团簇;将中心分子从每一团簇中进行删除,得到对应的M个壳结构。
可选的,获取模块610选取原子位于截断半径内的分子构建团簇的实施方式可以包括:选取所有原子均位于截断半径内的分子构建团簇;或者,若有分子仅部分原子位于截断半径内,对该分子进行补全处理,并利用补全后的分子以及所有原子均位于截断半径内的分子构建团簇。
可选的,第一计算模块620可以进一步包括:
第一计算单元,用于以中心分子的分子结构作为输入,采用量子化学方法计算得到中心分子的分子能量以及构成分子能量的各分项能量;
第二计算单元,用于分别以每一团簇的结构作为输入,采用量子化学方法计算得到每一团簇的团簇能量以及构成团簇能量的各分项能量;
第三计算单元,用于分别以每一壳结构作为输入,采用量子化学方法计算得到每一壳结构的壳能量以及构成壳能量的各分项能量。
可选的,量子化学方法可以包括基于密度泛函理论的紧束缚DFTB方法,其能量计算公式可以为:E能量=E0近似+Escc+Erep+Enuc+Edisp_corr;
其中,各分项能量E0近似、Escc、Erep、Enuc、Edisp_corr分别为:零阶近似下的轨道能,二/三阶静电能,价键的近程排斥能,核排斥能,长程的色散校正能。
可选的,量子化学方法可以包括密度泛函理论DFT方法,其能量计算公式可以为:E能量=E0+Ej+Ex+Ec+Enuc+Edisp_corr;
其中,各分项能量E0、Ej、Ex、Ec、Enuc、Edisp_corr分别为:轨道能,电子静电能,交换能,相关能,核排斥能,长程的色散校正能。
可选的,第二计算模块630可以进一步包括:
第四计算单元,用于根据分子能量的各分项能量、每一团簇能量的各分项能量以及每一壳能量的各分项能量,利用第一预设公式计算得到中心分子与每一壳结构之间的相互作用能的各分项能量;
第五计算单元,用于根据中心分子与每一壳结构之间的相互作用能的各分项能量,利用第二预设公式计算得到目标晶体结构的晶格能量的各分项能量;
第六计算单元,用于根据晶格能量的各分项能量以及各分项能量的贡献系数,利用第三预设公式计算得到目标晶体结构的晶格能量。
可选的,第一预设公式可以为:E壳n相互作用能,i=E团簇n,i–E分子,i–E壳n,i;
其中,n为团簇编号,n的取值为1~M,i为各分项能量的编号,E团簇n,i为第n个团簇的团簇能量的第i个分项能量,E分子,i为中心分子的分子能量的第i个分项能量,E壳n,i为第n个壳结构的壳能量的第i个分项能量,E壳n相互作用能,i为中心分子与第n个壳结构之间的相互作用能的第i个分项能量。
可选的,当M大于或等于3时,第二预设公式可以为:
E壳n相互作用能.i=E晶格,i+A*(Rn)-B;
其中,E晶格,i为目标晶体结构的晶格能量的第i个分项能量,Rn为构建第n个团簇时采用的截取半径,A和B为两个不同的衰减系数;
此时,第五计算单元具体可以用于对中心分子与每一壳结构之间的相互作用能的各分项能量利用第二预设公式进行计算,得到多组E晶格,i、A和B;对多组E晶格,i、A和B进行拟合,得到目标晶体结构的晶格能量的各分项能量。
可选的,当M为2时,第二预设公式可以为:
E晶格,i=[E壳1相互作用能,i(R1)3-E壳2相互作用能,i(R2)3]/[(R1)3-(R2)3];
其中,E晶格,i为目标晶体结构的晶格能量的第i个分项能量,E壳1相互作用能,i为中心分子与第1个壳结构之间的相互作用能的第i个分项能量,E壳2相互作用能,i为中心分子与第2个壳结构之间的相互作用能的第i个分项能量,R1为构建第1个团簇时采用的截取半径,R2为构建第2个团簇时采用的截取半径。
可选的,当M为1时,n为1,第二预设公式可以为:E晶格,i=E壳1相互作用能,i;
其中,E晶格,i为目标晶体结构的晶格能量的第i个分项能量,E壳1相互作用能,i为中心分子与壳结构之间的相互作用能的第i个分项能量。
可选的,第三预设公式可以为:E晶格=sum(kiE晶格,i);
其中,E晶格为目标晶体结构的晶格能量,E晶格,i为目标晶体结构的晶格能量的第i个分项能量,ki为晶格能量的第i个分项能量的贡献系数。
可选的,晶格能量的各分项能量的贡献系数的计算方式可以包括:获取多个参考晶体结构以及每一参考晶体结构的参考晶格能量;分别计算每一参考晶体结构的晶格能量的各分项能量;设定晶格能量的各分项能量的贡献系数;根据每一参考晶体结构的晶格能量的各分项能量以及设定的贡献系数,得到每一参考晶体结构的预测晶格能量的各分项能量;利用每一参考晶体结构的参考晶格能量的各分项能量和预测晶格能量的各分项能量,对设定的贡献系数进行拟合,得到拟合后的各分项能量的贡献系数。
可选的,第三计算模块640可以进一步包括:
校正单元,用于对分子能量进行能量校正,得到校正后的分子能量;
第七计算单元,用于利用校正后的分子能量和晶格能量,计算得到目标晶体结构的晶体总能量。
本申请实施例中的装置,通过计算中心分子(核)和团簇(壳)的能量,建立“核-壳”计算方案,能够回避现有技术中大量的二体、三体等多体团簇的计算,能够获得比原先直接采用低精度计算方法更高的能量精度,并且计算效率也得到较大提高。
关于上述实施例中的装置,其中各个模块执行操作的具体方式已经在有关该方法的实施例中进行了详细描述,此处将不再做详细阐述说明。
本申请实施例还提供了一种分子晶体能量比较装置,可以用于执行前述实施例提供的分子晶体能量比较方法。具体的,该装置可以包括:
获取模块,用于获取待比较的至少两个晶体结构;
计算模块,用于利用前述实施例提供的分子晶体能量计算装置对每一晶体结构进行晶体能量计算,得到每一晶体结构的晶体总能量;
确定模块,用于根据每一晶体结构的晶体总能量,确定上述至少两个晶体结构的晶体能量大小关系。
本申请实施例还提供了一种电子设备,可以用于执行前述实施例提供的分子晶体能量计算方法和/或分子晶体能量比较方法。如图7所示,电子设备700包括存储器710和处理器720。
处理器720可以是中央处理单元(Central Processing Unit,CPU),还可以是其他通用处理器、数字信号处理器(Digital Signal Processor,DSP)、专用集成电路(Application Specific Integrated Circuit,ASIC)、现场可编程门阵列(Field-Programmable Gate Array,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。
存储器710可以包括各种类型的存储单元,例如系统内存、只读存储器(ROM)和永久存储装置。其中,ROM可以存储处理器720或者计算机的其他模块需要的静态数据或者指令。永久存储装置可以是可读写的存储装置。永久存储装置可以是即使计算机断电后也不会失去存储的指令和数据的非易失性存储设备。在一些实施方式中,永久性存储装置采用大容量存储装置(例如磁或光盘、闪存)作为永久存储装置。另外一些实施方式中,永久性存储装置可以是可移除的存储设备(例如软盘、光驱)。系统内存可以是可读写存储设备或者易失性可读写存储设备,例如动态随机访问内存。系统内存可以存储一些或者所有处理器在运行时需要的指令和数据。此外,存储器710可以包括任意计算机可读存储媒介的组合,包括各种类型的半导体存储芯片(例如DRAM,SRAM,SDRAM,闪存,可编程只读存储器),磁盘和/或光盘也可以采用。在一些实施方式中,存储器710可以包括可读和/或写的可移除的存储设备,例如激光唱片(CD)、只读数字多功能光盘(例如DVD-ROM,双层DVD-ROM)、只读蓝光光盘、超密度光盘、闪存卡(例如SD卡、min SD卡、Micro-SD卡等)、磁性软盘等。计算机可读存储媒介不包含载波和通过无线或有线传输的瞬间电子信号。
存储器710上存储有可执行代码,当可执行代码被处理器720处理时,可以使处理器720执行上文述及的方法中的部分或全部。
此外,根据本申请的方法还可以实现为一种计算机程序或计算机程序产品,该计算机程序或计算机程序产品包括用于执行本申请的上述方法中部分或全部步骤的计算机程序代码指令。
或者,本申请还可以实施为一种计算机可读存储介质(或非暂时性机器可读存储介质或机器可读存储介质),其上存储有可执行代码(或计算机程序或计算机指令代码),当可执行代码(或计算机程序或计算机指令代码)被电子设备(或服务器等)的处理器执行时,使处理器执行根据本申请的上述方法的各个步骤的部分或全部。
以上已经描述了本申请的各实施例,上述说明是示例性的,并非穷尽性的,并且也不限于所披露的各实施例。在不偏离所说明的各实施例的范围和精神的情况下,对于本技术领域的普通技术人员来说许多修改和变更都是显而易见的。本文中所用术语的选择,旨在最好地解释各实施例的原理、实际应用或对市场中的技术的改进,或者使本技术领域的其他普通技术人员能理解本文披露的各实施例。
Claims (19)
1.一种分子晶体能量计算方法,其特征在于,包括:
获取目标晶体结构,并从所述目标晶体结构中确定中心分子、M个团簇和M个壳结构,所述M为大于或等于1的整数;
采用量子化学方法分别计算所述中心分子的分子能量、每一所述团簇的团簇能量和每一所述壳结构的壳能量;
根据所述分子能量、所述团簇能量和所述壳能量,计算得到所述目标晶体结构的晶格能量;
根据所述分子能量和所述晶格能量,计算得到所述目标晶体结构的晶体总能量。
2.如权利要求1所述的方法,其特征在于,所述从所述目标晶体结构中确定中心分子、M个团簇和M个壳结构,包括:
从所述目标晶体结构中选取一个分子作为中心分子;
以所述中心分子的几何中心为球心,且以M个不同的预设半径作为截断半径分别对所述目标晶体结构进行原子截取,选取原子位于所述截断半径内的分子构建团簇,得到M个所述团簇;
将所述中心分子从每一所述团簇中进行删除,得到对应的M个壳结构。
3.如权利要求2所述的方法,其特征在于,所述选取原子位于所述截断半径内的分子构建团簇,包括:
选取所有原子均位于所述截断半径内的分子构建团簇;或者,
若有分子仅部分原子位于所述截断半径内,对所述分子进行补全处理,并利用补全后的分子以及所有原子均位于所述截断半径内的分子构建团簇。
4.如权利要求1所述的方法,其特征在于,所述采用量子化学方法分别计算所述中心分子的分子能量、每一所述团簇的团簇能量和每一所述壳结构的壳能量,包括:
以所述中心分子的分子结构作为输入,采用量子化学方法计算得到所述中心分子的分子能量以及构成所述分子能量的各分项能量;
分别以每一所述团簇的结构作为输入,采用所述量子化学方法计算得到每一所述团簇的团簇能量以及构成所述团簇能量的各分项能量;
分别以每一所述壳结构作为输入,采用所述量子化学方法计算得到每一所述壳结构的壳能量以及构成所述壳能量的各分项能量。
5.如权利要求4所述的方法,其特征在于,所述量子化学方法包括基于密度泛函理论的紧束缚DFTB方法,能量计算公式为:
E能量=E0近似+Escc+Erep+Enuc+Edisp_corr;
其中,各分项能量E0近似、Escc、Erep、Enuc、Edisp_corr分别为:零阶近似下的轨道能,二/三阶静电能,价键的近程排斥能,核排斥能,长程的色散校正能。
6.如权利要求4所述的方法,其特征在于,所述量子化学方法包括密度泛函理论DFT方法,能量计算公式为:
E能量=E0+Ej+Ex+Ec+Enuc+Edisp_corr;
其中,各分项能量E0、Ej、Ex、Ec、Enuc、Edisp_corr分别为:轨道能,电子静电能,交换能,相关能,核排斥能,长程的色散校正能。
7.如权利要求4所述的方法,其特征在于,所述根据所述分子能量、所述团簇能量和所述壳能量,计算得到所述目标晶体结构的晶格能量,包括:
根据所述分子能量的各分项能量、每一所述团簇能量的各分项能量以及每一所述壳能量的各分项能量,利用第一预设公式计算得到所述中心分子与每一所述壳结构之间的相互作用能的各分项能量;
根据所述中心分子与每一所述壳结构之间的相互作用能的各分项能量,利用第二预设公式计算得到所述目标晶体结构的晶格能量的各分项能量;
根据所述晶格能量的各分项能量以及各分项能量的贡献系数,利用第三预设公式计算得到所述目标晶体结构的晶格能量。
8.如权利要求7所述的方法,其特征在于,所述第一预设公式为:
E壳n相互作用能,i=E团簇n,i–E分子,i–E壳n,i;
其中,所述n为团簇编号,所述n的取值为1~M,所述i为各分项能量的编号,所述E团簇n,i为第n个团簇的团簇能量的第i个分项能量,所述E分子,i为所述中心分子的分子能量的第i个分项能量,所述E壳n,i为第n个壳结构的壳能量的第i个分项能量,所述E壳n相互作用能,i为所述中心分子与所述第n个壳结构之间的相互作用能的第i个分项能量。
9.如权利要求8所述的方法,其特征在于,当所述M大于或等于3时,所述第二预设公式为:
E壳n相互作用能.i=E晶格,i+A*(Rn)-B;
其中,所述E晶格,i为所述目标晶体结构的晶格能量的第i个分项能量,所述Rn为构建所述第n个团簇时采用的截取半径,所述A和所述B为两个不同的衰减系数;
所述根据所述中心分子与每一所述壳结构之间的相互作用能的各分项能量,利用第二预设公式计算得到所述目标晶体结构的晶格能量的各分项能量,包括:
对所述中心分子与每一所述壳结构之间的相互作用能的各分项能量利用所述第二预设公式进行计算,得到多组所述E晶格,i、A和B;
对多组所述E晶格,i、A和B进行拟合,得到所述目标晶体结构的晶格能量的各分项能量。
10.如权利要求8所述的方法,其特征在于,当所述M为2时,所述第二预设公式为:
E晶格,i=[E壳1相互作用能,i(R1)3-E壳2相互作用能,i(R2)3]/[(R1)3-(R2)3];
其中,所述E晶格,i为所述目标晶体结构的晶格能量的第i个分项能量,所述E壳1相互作用能,i为所述中心分子与第1个壳结构之间的相互作用能的第i个分项能量,所述E壳2相互作用能,i为所述中心分子与第2个壳结构之间的相互作用能的第i个分项能量,所述R1为构建第1个团簇时采用的截取半径,所述R2为构建第2个团簇时采用的截取半径。
11.如权利要求8所述的方法,其特征在于,当所述M为1时,所述n为1,所述第二预设公式为:
E晶格,i=E壳1相互作用能,i;
其中,所述E晶格,i为所述目标晶体结构的晶格能量的第i个分项能量,所述E壳1相互作用能,i为所述中心分子与壳结构之间的相互作用能的第i个分项能量。
12.如权利要求7所述的方法,其特征在于,所述第三预设公式为:
E晶格=sum(kiE晶格,i);
其中,所述E晶格为所述目标晶体结构的晶格能量,所述E晶格,i为所述目标晶体结构的晶格能量的第i个分项能量,所述ki为所述晶格能量的第i个分项能量的贡献系数。
13.如权利要求7所述的方法,其特征在于,所述晶格能量的各分项能量的贡献系数的计算方式包括:
获取多个参考晶体结构以及每一所述参考晶体结构的参考晶格能量;
分别计算每一所述参考晶体结构的晶格能量的各分项能量;
设定所述晶格能量的各分项能量的贡献系数;
根据每一所述参考晶体结构的晶格能量的各分项能量以及设定的贡献系数,得到每一所述参考晶体结构的预测晶格能量的各分项能量;
利用每一所述参考晶体结构的参考晶格能量的各分项能量和预测晶格能量的各分项能量,对设定的贡献系数进行拟合,得到拟合后的各分项能量的贡献系数。
14.如权利要求1-13任一所述的方法,其特征在于,所述根据所述分子能量和所述晶格能量,计算得到所述目标晶体结构的晶体总能量,包括:
对所述分子能量进行能量校正,得到校正后的分子能量;
利用所述校正后的分子能量和所述晶格能量,计算得到所述目标晶体结构的晶体总能量。
15.一种分子晶体能量比较方法,其特征在于,包括:
获取待比较的至少两个晶体结构;
利用如权利要求1-14任一项所述的方法对每一所述晶体结构进行晶体能量计算,得到每一所述晶体结构的晶体总能量;
根据每一所述晶体结构的晶体总能量,确定所述至少两个晶体结构的晶体能量大小关系。
16.一种分子晶体能量计算装置,其特征在于,包括:
获取模块,用于获取目标晶体结构,并从所述目标晶体结构中确定中心分子、M个团簇和M个壳结构,所述M为大于或等于1的整数;
第一计算模块,用于采用量子化学方法分别计算所述中心分子的分子能量、每一所述团簇的团簇能量和每一所述壳结构的壳能量;
第二计算模块,用于根据所述分子能量、所述团簇能量和所述壳能量,计算得到所述目标晶体结构的晶格能量;
第三计算模块,用于根据所述分子能量和所述晶格能量,计算得到所述目标晶体结构的晶体总能量。
17.一种分子晶体能量比较装置,其特征在于,包括:
获取模块,用于获取待比较的至少两个晶体结构;
计算模块,用于利用如权利要求16所述的装置对每一所述晶体结构进行晶体能量计算,得到每一所述晶体结构的晶体总能量;
确定模块,用于根据每一所述晶体结构的晶体总能量,确定所述至少两个晶体结构的晶体能量大小关系。
18.一种电子设备,其特征在于,包括:
处理器;以及
存储器,其上存储有可执行代码,当所述可执行代码被所述处理器执行时,使所述处理器执行如权利要求1-15中任一项所述的方法。
19.一种计算机可读存储介质,其上存储有可执行代码,当所述可执行代码被电子设备的处理器执行时,使所述处理器执行如权利要求1-15中任一项所述的方法。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111600787.1A CN114464263A (zh) | 2021-12-24 | 2021-12-24 | 一种分子晶体能量计算方法、装置及存储介质 |
PCT/CN2021/143749 WO2023115639A1 (zh) | 2021-12-24 | 2021-12-31 | 一种分子晶体能量计算方法、装置及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111600787.1A CN114464263A (zh) | 2021-12-24 | 2021-12-24 | 一种分子晶体能量计算方法、装置及存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN114464263A true CN114464263A (zh) | 2022-05-10 |
Family
ID=81407339
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202111600787.1A Pending CN114464263A (zh) | 2021-12-24 | 2021-12-24 | 一种分子晶体能量计算方法、装置及存储介质 |
Country Status (2)
Country | Link |
---|---|
CN (1) | CN114464263A (zh) |
WO (1) | WO2023115639A1 (zh) |
Family Cites Families (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP2270698A1 (en) * | 2006-12-11 | 2011-01-05 | Avant-Garde Materials Simulation Sarl | Tailor-made force fields for crystal structure prediction |
CN108959842B (zh) * | 2018-05-04 | 2021-07-02 | 深圳晶泰科技有限公司 | 用于有机分子晶体结构预测中高精度能量排位方法 |
CN112086132A (zh) * | 2020-08-18 | 2020-12-15 | 深圳晶泰科技有限公司 | 有机分子晶体构建方法及系统 |
CN112216355B (zh) * | 2020-10-22 | 2024-01-26 | 哈尔滨理工大学 | 一种基于机器学习的多组分晶体构型能预测方法 |
CN113807526B (zh) * | 2021-09-26 | 2024-03-29 | 深圳市腾讯计算机系统有限公司 | 量子体系的本征态获取方法、装置、设备及存储介质 |
-
2021
- 2021-12-24 CN CN202111600787.1A patent/CN114464263A/zh active Pending
- 2021-12-31 WO PCT/CN2021/143749 patent/WO2023115639A1/zh unknown
Also Published As
Publication number | Publication date |
---|---|
WO2023115639A1 (zh) | 2023-06-29 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Lenselink et al. | Beyond the hype: deep neural networks outperform established methods using a ChEMBL bioactivity benchmark set | |
Wang et al. | Analysis of deep learning methods for blind protein contact prediction in CASP12 | |
Kappel et al. | Accelerated cryo-EM-guided determination of three-dimensional RNA-only structures | |
US10432639B1 (en) | Security management for graph analytics | |
US20200066371A1 (en) | Methods and systems for 3d structure estimation | |
Millán et al. | Assessing the utility of CASP14 models for molecular replacement | |
Vitale et al. | Automated high-throughput Wannierisation | |
JP7417074B2 (ja) | 最適化装置、最適化方法及び最適化装置の制御プログラム | |
Deffrennes et al. | A machine learning–based classification approach for phase diagram prediction | |
Kim et al. | Tools for the cryo-EM gold rush: going from the cryo-EM map to the atomistic model | |
US11651134B2 (en) | Method of certifying safety levels of semiconductor memories in integrated circuits | |
US20230360734A1 (en) | Training protein structure prediction neural networks using reduced multiple sequence alignments | |
CN114464263A (zh) | 一种分子晶体能量计算方法、装置及存储介质 | |
CN116888672A (zh) | 从掩蔽蛋白表示预测完整蛋白表示 | |
WO2017013726A1 (ja) | 酸解離定数の計算方法、及び計算装置、並びにプログラム | |
Pontes et al. | The suitability of the spr-mp method to evaluate the reliability of logic circuits | |
Dhingra et al. | FARe: Fault-Aware GNN Training on ReRAM-based PIM Accelerators | |
US11868846B1 (en) | Quantum computing simulation using comparative rejection sampling | |
Reyes et al. | FairPRS: adjusting for admixed populations in polygenic risk scores using invariant risk minimization | |
Jung et al. | Multiple program/multiple data molecular dynamics method with multiple time step integrator for large biological systems | |
CN115629845B (zh) | Io数据的产生方法、装置、计算机设备和存储介质 | |
US11755431B2 (en) | Identification of optimal bit apportionments for digital functions subject to soft errors | |
CN113192093B (zh) | 基于双流网络结构的快速显著性目标检测方法 | |
WO2023033898A1 (en) | Optimal bit apportionments for digital functions subject to soft errors | |
Bogdanova et al. | ProBAN: Neural network algorithm for predicting binding affinity in protein–protein complexes |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |