CN117678025A - 探索方法、探索系统、程序、预测模型构建方法及预测模型构建装置 - Google Patents
探索方法、探索系统、程序、预测模型构建方法及预测模型构建装置 Download PDFInfo
- Publication number
- CN117678025A CN117678025A CN202280051390.8A CN202280051390A CN117678025A CN 117678025 A CN117678025 A CN 117678025A CN 202280051390 A CN202280051390 A CN 202280051390A CN 117678025 A CN117678025 A CN 117678025A
- Authority
- CN
- China
- Prior art keywords
- energy
- initial
- prediction model
- atomic arrangement
- structures
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims description 77
- 238000010276 construction Methods 0.000 title claims description 12
- 239000000463 material Substances 0.000 claims abstract description 76
- 239000000203 mixture Substances 0.000 claims abstract description 69
- 238000005457 optimization Methods 0.000 claims abstract description 64
- 238000004364 calculation method Methods 0.000 claims description 82
- 238000010801 machine learning Methods 0.000 claims description 45
- 125000004429 atom Chemical group 0.000 description 90
- 238000010586 diagram Methods 0.000 description 41
- 238000012795 verification Methods 0.000 description 33
- 239000000126 substance Substances 0.000 description 22
- 238000013528 artificial neural network Methods 0.000 description 16
- 238000004590 computer program Methods 0.000 description 14
- 229910052744 lithium Inorganic materials 0.000 description 14
- 239000000470 constituent Substances 0.000 description 11
- 238000012545 processing Methods 0.000 description 11
- PXHVJJICTQNCMI-UHFFFAOYSA-N nickel Substances [Ni] PXHVJJICTQNCMI-UHFFFAOYSA-N 0.000 description 10
- 239000011572 manganese Substances 0.000 description 9
- 239000013078 crystal Substances 0.000 description 6
- 239000000284 extract Substances 0.000 description 6
- 239000007774 positive electrode material Substances 0.000 description 5
- 239000013077 target material Substances 0.000 description 5
- HBBGRARXTFLTSG-UHFFFAOYSA-N Lithium ion Chemical compound [Li+] HBBGRARXTFLTSG-UHFFFAOYSA-N 0.000 description 4
- QVGXLLKOCUKJST-UHFFFAOYSA-N atomic oxygen Chemical group [O] QVGXLLKOCUKJST-UHFFFAOYSA-N 0.000 description 4
- 230000006870 function Effects 0.000 description 4
- 229910001416 lithium ion Inorganic materials 0.000 description 4
- 125000004430 oxygen atom Chemical group O* 0.000 description 4
- 238000000926 separation method Methods 0.000 description 4
- WHXSMMKQMYFTQS-UHFFFAOYSA-N Lithium Chemical group [Li] WHXSMMKQMYFTQS-UHFFFAOYSA-N 0.000 description 3
- 238000011156 evaluation Methods 0.000 description 3
- 230000012447 hatching Effects 0.000 description 3
- 239000004065 semiconductor Substances 0.000 description 3
- 238000004088 simulation Methods 0.000 description 3
- 238000003775 Density Functional Theory Methods 0.000 description 2
- 238000004891 communication Methods 0.000 description 2
- 239000007773 negative electrode material Substances 0.000 description 2
- 229910052760 oxygen Inorganic materials 0.000 description 2
- 239000001301 oxygen Substances 0.000 description 2
- PWHULOQIROXLJO-UHFFFAOYSA-N Manganese Chemical group [Mn] PWHULOQIROXLJO-UHFFFAOYSA-N 0.000 description 1
- 102100021164 Vasodilator-stimulated phosphoprotein Human genes 0.000 description 1
- 238000013527 convolutional neural network Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000018109 developmental process Effects 0.000 description 1
- 239000012769 display material Substances 0.000 description 1
- 239000003792 electrolyte Substances 0.000 description 1
- 238000004880 explosion Methods 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 230000010354 integration Effects 0.000 description 1
- 229910052748 manganese Inorganic materials 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000003062 neural network model Methods 0.000 description 1
- 229910052759 nickel Inorganic materials 0.000 description 1
- 238000005381 potential energy Methods 0.000 description 1
- 239000012925 reference material Substances 0.000 description 1
- 238000012216 screening Methods 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
- 238000012549 training Methods 0.000 description 1
- 108010054220 vasodilator-stimulated phosphoprotein Proteins 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N5/00—Computing arrangements using knowledge-based models
- G06N5/02—Knowledge representation; Symbolic representation
- G06N5/022—Knowledge engineering; Knowledge acquisition
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16C—COMPUTATIONAL CHEMISTRY; CHEMOINFORMATICS; COMPUTATIONAL MATERIALS SCIENCE
- G16C20/00—Chemoinformatics, i.e. ICT specially adapted for the handling of physicochemical or structural data of chemical particles, elements, compounds or mixtures
- G16C20/70—Machine learning, data mining or chemometrics
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16C—COMPUTATIONAL CHEMISTRY; CHEMOINFORMATICS; COMPUTATIONAL MATERIALS SCIENCE
- G16C20/00—Chemoinformatics, i.e. ICT specially adapted for the handling of physicochemical or structural data of chemical particles, elements, compounds or mixtures
- G16C20/30—Prediction of properties of chemical compounds, compositions or mixtures
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16C—COMPUTATIONAL CHEMISTRY; CHEMOINFORMATICS; COMPUTATIONAL MATERIALS SCIENCE
- G16C60/00—Computational materials science, i.e. ICT specially adapted for investigating the physical or chemical properties of materials or phenomena associated with their design, synthesis, processing, characterisation or utilisation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/042—Knowledge-based neural networks; Logical representations of neural networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/0464—Convolutional networks [CNN, ConvNet]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
- G06N3/09—Supervised learning
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Computing Systems (AREA)
- Life Sciences & Earth Sciences (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- General Engineering & Computer Science (AREA)
- Evolutionary Computation (AREA)
- Artificial Intelligence (AREA)
- Data Mining & Analysis (AREA)
- Software Systems (AREA)
- Crystallography & Structural Chemistry (AREA)
- Chemical & Material Sciences (AREA)
- Mathematical Physics (AREA)
- Physics & Mathematics (AREA)
- Computational Linguistics (AREA)
- General Physics & Mathematics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Medical Informatics (AREA)
- General Health & Medical Sciences (AREA)
- Databases & Information Systems (AREA)
- Health & Medical Sciences (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
计算机执行下述步骤:取得作为通过材料所包含的原子脱离而脱离后的材料的组成能够采取的三维空间中的原子配置的结构的多个初始结构的第1步骤(S102);对一部分初始结构实施结构最佳化,算出与被结构最佳化了的原子配置的结构对应的第1能量的第2步骤(S103);通过对其它初始结构使用预测模型,来预测与对其它初始结构实施了结构最佳化的情况下的原子配置的结构对应的第2能量的第3步骤(S105);基于第1能量和第2能量,提取显示极小值的第3能量的第4步骤(S106);以及输出第3能量、作为与第3能量对应的原子配置的结构的第1结构、或上述第3能量和上述第1结构的第5步骤(S107)。
Description
技术领域
本公开涉及用于探索关于原子脱离后的材料的组成的原子配置的稳定结构的探索方法等。
背景技术
以往,开发了通过第一原理计算而求出稳定的原子配置结构的结构最佳化的技术(例如,参照非专利文献1)。
在非专利文献2中,公开了对原子配置结构的输入,使用机器学习而推定能量等特性值的方法。
现有技术文献
非专利文献
非专利文献1:Jensen,F.(2007).Introduction to computationalchemistry.John wiley&sons,383-389.
非专利文献2:Chen,C.,Ye,W.,Zuo,Y.,Zheng,C.,&Ong,S.P.(2019).Graphnetworks as a universal machine learning framework for molecules andcrystals.Chemistry of Materials,31(9),3564-3572.
发明内容
本公开提供可以有效率地探索关于原子脱离后的材料的组成的原子配置的稳定结构的探索方法等。
本公开的一方案涉及的探索方法为用于探索关于材料的组成的三维空间中的原子配置的稳定结构的探索方法,计算机执行下述步骤:取得作为通过上述材料所包含的原子脱离而脱离后的材料的组成能够采取的上述三维空间中的原子配置的结构的多个初始结构的第1步骤;对多个上述初始结构之中的一部分初始结构实施结构最佳化,算出与被结构最佳化了的原子配置的结构对应的第1能量的第2步骤;通过对多个上述初始结构之中的其它初始结构使用预测模型,来预测与对上述其它初始结构实施了结构最佳化的情况下的原子配置的结构对应的第2能量的第3步骤;基于上述第1能量和上述第2能量,提取显示极小值的第3能量的第4步骤;以及输出上述第3能量、作为与上述第3能量对应的原子配置的结构的第1结构、或上述第3能量和上述第1结构的第5步骤,上述预测模型以将任意的原子配置的结构作为输入、且将与对该结构实施了结构最佳化的情况下的结构对应的能量作为上述第2能量而输出的方式进行了机器学习。
另外,该包括的或具体的方案可以通过装置、系统、集成电路、计算机程序或计算机可读取的记录介质而实现,可以通过装置、系统、方法、集成电路、计算机程序和计算机可读取的记录介质的任意组合而实现。计算机可读取的记录介质包含例如CD-ROM(CompactDisc-Read Only Memory,光盘只读存储器)等非易失性的记录介质。
根据本公开,可以有效率地探索关于原子脱离后的材料的组成的原子配置的稳定结构。
附图说明
图1为显示包含实施方式1涉及的探索系统的整体构成的框图。
图2为显示实施方式1涉及的被输入到输入部的输入结构的一例的图。
图3为显示实施方式1涉及的生成部生成初始结构的过程的一例的图。
图4为显示实施方式1涉及的生成部生成初始结构的过程的一例的图。
图5为显示实施方式1涉及的生成部生成初始结构的过程的一例的图。
图6为显示实施方式1涉及的被存储在结构存储部的数据的一例的图。
图7为实施方式1涉及的采用算出部算出第1能量的过程的一例的图。
图8为显示实施方式1涉及的被存储在算出结果存储部的数据的一例的图。
图9为显示实施方式1涉及的采用学习部使预测模型进行机器学习的过程的一例的图。
图10为显示实施方式1涉及的采用预测部预测第2能量的过程的一例的图。
图11为显示实施方式1涉及的通过比较部而生成了的数据的一例的图。
图12为显示实施方式1涉及的预测部的预测精度的评价例的图。
图13为显示实施方式1涉及的验证了预测部的预测精度的结果的图。
图14为显示实施方式1涉及的验证了预测部的预测精度与学习用数据的比率的相关性的结果的图。
图15为显示实施方式1涉及的探索系统的动作例的流程图。
图16为显示包含实施方式2涉及的探索系统的整体构成的框图。
图17为显示实施方式2涉及的被存储在算出结果存储部的数据的一例的图。
图18为显示实施方式2涉及的采用学习部使预测模型进行机器学习的过程的一例的图。
图19为显示实施方式2涉及的验证了预测部的预测精度的结果的图。
图20为显示实施方式2涉及的验证了预测部的预测精度与学习用数据集的比率的相关性的结果的图。
图21为显示实施方式2涉及的探索系统的动作例的流程图。
图22为显示包含实施方式3涉及的探索系统的整体构成的框图。
图23为显示实施方式3涉及的通过比较部而生成了的数据的一例的图。
图24为显示实施方式3涉及的探索系统的动作例的流程图。
图25为显示包含实施方式4涉及的探索系统的整体构成的框图。
图26为显示实施方式4涉及的探索系统的动作例的流程图。
具体实施方式
(本公开的认识)
在材料开发中,为了通过模拟而算出热力学特性或安全性等性质,需要求出物质各自中的热力学稳定的原子配置结构,即稳定结构。这里,稳定的原子配置结构可以通过结构最佳化而求出。因此,结构最佳化作为用于物质的解析或开发新物质的工具而被利用。在非专利文献1中,公开了采用第一原理计算的结构最佳化的方法。
然而,锂离子电池具有正极活性物质和负极活性物质,通过锂离子在它们之间移动而进行充电或放电。在充电时,正极活性物质所包含的锂离子脱离,脱离了的锂离子向负极活性物质移动。这里,通过将正极活性物质的原子配置结构模型化,考虑Li(锂)原子在1个1个依次脱离了的状态下的稳定的原子配置结构,从而可以模拟充电的过程。
例如,可以由Li原子脱离后的稳定的原子配置结构的能量的计算值,算出电极电压。进一步通过计算与O(氧)原子脱离了的物质的稳定的原子配置结构的能量差,从而可以算出表示O原子脱离的发生容易性的氧脱离能量。如果O原子从正极活性物质脱离,则有与电解质结合而发生放热反应的可能性,因此氧脱离能量成为电池的安全性的指标。即,由电池所具有的物质所包含的元素脱离后的稳定的原子配置结构,可以算出电池的电特性、安全性。
这里,例如即使Li原子脱离前的物质为已知的物质,也可以说Li原子脱离后的物质为未知的新物质。进而,为了求出未知的新物质中的热力学稳定的原子配置结构,进行对该新物质能够采取的成为候选的原子配置结构的结构最佳化。成为候选的原子配置结构通过将已知的物质的原子配置结构所包含的原子、这里为Li原子进行部分除去而获得。因此,根据将哪个Li原子除去而获得多个候选结构。进而,关于多个候选结构各自,进行1次以上结构最佳化,算出被结构最佳化了的候选结构的能量、即总能量。进而,与所算出的能量之中的成为最小的能量对应的原子配置结构,即被结构最佳化了的候选结构被判断为该新物质中的热力学最稳定的原子配置结构。
这里,如果正极活性物质、即已知物质所包含的Li原子的数目增加,则能够脱离的Li原子的数目也增加。其结果,候选结构的数目变得非常大,可能发生所谓的组合爆炸。在这样的情况下,如果关于全部候选结构执行结构最佳化,并且,执行算出能量的处理,则运算需要庞大的时间,因此有进行这些运算不现实这样的课题。
另一方面,近年来,提出了通过图神经网络,进行对图结构的输入的回归或分类的方法。在该方法中,通过对由表示节点群与节点间的连接关系的边缘群构成的图结构的输入,进行卷积等运算从而学习与输出的对应关系。
其中,在非专利文献2中,提出了在关于材料的组成的原子配置结构中,将原子转换为节点,将键合转换为边缘,从原子配置结构预测能量等特性值的图神经网络模型。显示出通过该方法,可以构建从公开数据库所包含的原子配置结构以高精度预测能量等材料特性的模型。
另外,非专利文献1为公开结构最佳化的基本技术的现有技术文献,不是关于通过机器学习而使预测模型学习的公开。非专利文献2不过是公开了从原子配置结构预测材料特性的方法,不是关于探索稳定的原子配置结构的公开。
本申请的发明人等着眼于通过图神经网络而将原子配置结构与能量的关系相对应。进而,根据本申请的发明人等的研究,发现了可以由多个存在的原子脱离后的材料的组成能够采取的成为候选的原子配置结构、比以往有效率地探索热力学稳定的原子配置结构的技术。由此,明确了可以减少运算成本、并且可以精度良好地探索稳定的原子配置结构。
即,本公开的一方案涉及的探索方法是用于探索关于材料的组成的三维空间中的原子配置的稳定结构的探索方法,计算机执行下述步骤:取得作为通过上述材料所包含的原子脱离而脱离后的材料的组成能够采取的上述三维空间中的原子配置的结构的多个初始结构的第1步骤;对多个上述初始结构之中的一部分初始结构实施结构最佳化,算出与被结构最佳化了的原子配置的结构对应的第1能量的第2步骤;通过对多个上述初始结构之中的其它初始结构使用预测模型,来预测与对上述其它初始结构实施了结构最佳化的情况下的原子配置的结构对应的第2能量的第3步骤;基于上述第1能量和上述第2能量,提取显示极小值的第3能量的第4步骤;以及输出上述第3能量、作为与上述第3能量对应的原子配置的结构的第1结构、或上述第3能量和上述第1结构的第5步骤,上述预测模型以将任意的原子配置的结构作为输入、将与对该结构实施了结构最佳化的情况下的结构对应的能量作为上述第2能量而输出的方式进行了机器学习。
例如,在上述材料中,包含x个能够脱离的上述原子(x为2以上的整数),在上述第1步骤中,关于脱离了z个(z为1≤z≤x-1的整数)上述原子的体系,可以生成Cz x个多个上述初始结构。
在上述第1步骤中,在取得了n个(n为2以上的整数)上述初始结构的情况下,上述第2步骤中的上述一部分初始结构为m个(m为1≤m<n的整数)上述初始结构,上述第3步骤中的上述其它初始结构可以为(n―m)个上述初始结构。
由此,可以有效率地探索关于原子脱离后的材料的组成的原子配置的稳定结构,易于减少运算成本。
上述第3能量可以为上述第1能量和上述第2能量的最小值。
由此,可以有效率地探索关于原子脱离后的材料的组成的原子配置的最稳定的结构。
上述预测模型可以为使用包含上述初始结构作为输入数据、并且包含与该初始结构对应的上述第1能量作为正解数据的第1学习用数据集而进行了机器学习的模型。
由此,易于精度良好地预测与对被输入了的初始结构实施了结构最佳化的情况下的结构对应的能量。
上述预测模型可以为进一步使用包含上述被结构最佳化了的原子配置的结构作为输入数据、并且包含与该结构对应的上述第1能量作为正解数据的第2学习用数据集而进行了机器学习的模型。
由此,易于进一步精度良好地预测与在对被输入了的初始结构实施了结构最佳化的情况下的结构对应的能量。
上述第2步骤中的上述一部分初始结构的数目可以为多个上述初始结构的数目的90%以下。
由此,易于抑制运算成本,同时有效率地探索关于原子脱离后的材料的组成的原子配置的稳定结构。
本公开的一方案涉及的探索系统是用于探索关于材料的组成的三维空间中的原子配置的稳定结构的探索系统,其具备:生成作为通过上述材料所包含的原子脱离而脱离后的材料的组成能够采取的上述三维空间中的原子配置的结构的多个初始结构的生成部;对多个上述初始结构之中的一部分初始结构实施结构最佳化,算出与被结构最佳化了的原子配置的结构对应的第1能量的算出部;通过对多个上述初始结构之中的其它初始结构使用预测模型,来预测与对上述其它初始结构实施了结构最佳化的情况下的原子配置的结构对应的第2能量的预测部;以及输出上述第1能量和上述第2能量的输出部,上述预测模型以将任意的原子配置的结构作为输入、并且将与对该结构实施了结构最佳化的情况下的结构对应的能量作为上述第2能量而输出的方式进行了机器学习。
由此,可以有效率地探索关于原子脱离后的材料的组成的原子配置的稳定结构,易于减少运算成本。
上述输出部可以输出基于上述第1能量和上述第2能量而提取的显示极小值的第3能量、作为与上述第3能量对应的原子配置的结构的第1结构、或上述第3能量和上述第1结构。
由此,可以有效率地探索关于原子脱离后的材料的组成的原子配置的最稳定的结构。
本公开的一方案涉及的程序为用于探索关于材料的组成的三维空间中的原子配置的稳定结构的程序,使计算机执行下述步骤:取得作为通过上述材料所包含的原子脱离而脱离后的材料的组成能够采取的上述三维空间中的原子配置的结构的多个初始结构的第1步骤;对多个上述初始结构之中的一部分初始结构实施结构最佳化,算出与被结构最佳化了的原子配置的结构对应的第1能量的第2步骤;通过对多个上述初始结构之中的其它初始结构使用预测模型,来预测与对上述其它初始结构实施了结构最佳化的情况下的原子配置的结构对应的第2能量的第3步骤;以及输出上述第1能量和上述第2能量的第6步骤,上述预测模型以将任意的原子配置的结构作为输入、并且将与对该结构实施了结构最佳化的情况下的结构对应的能量作为上述第2能量而输出的方式进行机器学习。例如,使上述计算机进一步执行基于上述第1能量和上述第2能量而提取显示极小值的第3能量的第4步骤,在上述第6步骤中,可以进一步输出上述第3能量、作为与上述第3能量对应的原子配置的结构的第1结构、或上述第3能量和上述第1结构。
由此,可以有效率地探索关于原子脱离后的材料的组成的原子配置的稳定结构,易于减少运算成本。
本公开的一方案涉及的预测模型构建方法是,计算机执行下述步骤:取得作为通过材料所包含的原子脱离而脱离后的材料的组成能够采取的三维空间中的原子配置的结构的初始结构的第1步骤;以及使用包含上述初始结构作为输入数据、并且包含与对该初始结构实施结构最佳化而获得的原子配置的结构对应的能量作为正解数据的学习用数据集,以对任意的原子配置的结构的输入而输出与该结构被结构最佳化了的情况下的结构对应的能量的方式进行机器学习的第7步骤。
由此,可以构建能够有效率地探索关于原子脱离后的材料的组成的原子配置的稳定结构,易于减少运算成本的预测模型。
本公开的一方案涉及的预测模型构建装置具备:生成作为通过材料所包含的原子脱离而脱离后的材料的组成能够采取的三维空间中的原子配置的结构的初始结构的生成部;以及使用包含上述初始结构作为输入数据、并且包含与对该初始结构实施结构最佳化而获得的原子配置的结构对应的能量作为正解数据的学习用数据集,以对任意的原子配置的结构的输入而输出与该结构被结构最佳化了的情况下的结构对应的能量的方式进行机器学习的学习部。
由此,可以构建能够有效率地探索关于原子脱离后的材料的组成的原子配置的稳定结构、易于减少运算成本的预测模型。
本公开的一方案涉及的探索方法是用于使用通过上述预测模型构建装置而进行了机器学习的预测模型,来探索上述关于材料的组成的上述三维空间中的原子配置的稳定结构的探索方法,计算机执行下述步骤:取得多个上述初始结构的第1步骤;通过对多个上述初始结构各自使用上述预测模型,来预测与对该初始结构实施了结构最佳化的情况下的原子配置的结构对应的能量的第8步骤;以及从被预测的多个上述能量提取显示极小值的能量的第9步骤。
由此,可以有效率地探索关于原子脱离后的材料的组成的原子配置的稳定结构,且易于减少运算成本。
本公开的一方案涉及的探索方法是用于使用通过上述预测模型构建装置而进行了机器学习的预测模型,来探索上述关于材料的组成的上述三维空间中的原子配置的稳定结构的探索方法,计算机执行下述步骤:取得多个上述初始结构的第1步骤;对多个上述初始结构之中的一部分初始结构实施结构最佳化,算出与被结构最佳化了的原子配置的结构对应的第1能量的第2步骤;通过对上述一部分初始结构之中的至少1个初始结构使用上述预测模型,来预测与对该初始结构实施了结构最佳化的情况下的原子配置的结构对应的第2能量的第10步骤;通过将上述第1能量与上述第2能量进行比较,来验证上述预测模型的预测精度的第11步骤。
由此,通过验证预测模型的预测精度,从而易于实现具有充分的预测精度的预测模型。
在上述第11步骤中的结果满足规定的条件的情况下,上述计算机可以进一步执行下述步骤:通过对多个上述初始结构之中的其它初始结构使用上述预测模型,来预测与对上述其它初始结构实施了结构最佳化的情况下的原子配置的结构对应的上述第2能量的第12步骤;以及基于上述第1能量和上述第2能量,提取显示极小值的第3能量的第13步骤。
由此,通过使用预测精度较高的预测模型,从而易于进一步有效率地探索关于原子脱离后的材料的组成的原子配置的稳定结构。
也可以将本公开的探索方法或预测模型构建方法所包含的特征性处理作为使计算机执行的计算机程序而实现。进而,可以使这样的计算机程序经由CD-ROM等计算机可读取的非临时性记录介质或因特网等通信网络进行流通是不言而喻的。
以下,参照附图对实施方式具体地说明。
另外,以下说明的实施方式都显示本公开的包括的或具体的例子。以下实施方式中显示的数值、形状、构成要素、步骤、步骤的顺序等为一例,不限定本公开的主旨。关于以下实施方式中的构成要素之中的、显示最上位概念的独立权利要求中未记载的构成要素,作为任意的构成要素而被说明。在全部实施方式中,也可以将各内容组合。各图为示意图,不一定被严格地图示。在各图中,关于相同的构成构件附上相同符号。
本公开的实施方式涉及的探索系统可以以1个计算机包含全部构成要素的方式构成,也可以作为将多个构成要素分别分散于多个计算机的系统而构成。
(实施方式1)
(实施方式1:构成的说明)
以下,使用附图对本公开的实施方式1涉及的探索系统100(探索方法、或程序)详细地说明。实施方式1涉及的探索系统100(探索方法、或程序)为用于探索关于材料的组成的三维空间中的原子配置的稳定结构的系统(方法、或程序)。这里所谓的“稳定结构”,是作用于原子配置的结构(即,晶体结构)所包含的各原子的力成为阈值以下那样的结构,并且,是与结构对应的能量(总能量)成为最小的结构。另外,关于阈值,虽然用户能够适当设定,但可以为接近于零的值。原因是如果作用于各原子的力越接近于零,则结构在热力学上越稳定。
这里,实施方式1涉及的探索系统100(探索方法或程序)除了探索上述那样的稳定结构而对用户输出的方案以外,还能够包含输出为了用户探索上述那样的稳定结构而需要的数据的方案。即,探索稳定结构的过程可以不仅仅由探索系统100(探索方法或程序)完成。
图1为显示包含实施方式1涉及的探索系统100的整体构成的框图。探索系统100例如作为个人计算机或服务器等计算机而被构成。如图1所示那样,探索系统100具备生成部102、算出部103、学习部104、预测部105、比较部106、和输出部107。作为探索系统100的周边的构成,有输入部101、结构存储部108、算出结果存储部109、和预测模型存储部110。另外,探索系统100的周边的构成可以被包含于探索系统100的构成要素。探索系统100中的生成部102和学习部104也为预测模型构建装置的构成要素。
以下,对图1所示的各构成要素的详细内容进行描述。
(输入部101)
输入部101为接收用户的输入的输入接口,并且通过用户的输入而取得与探索对象的材料所具有的组成有关的信息,输出到生成部102。与组成有关的信息例如为关于探索对象的材料所具有的组成的三维空间中的原子配置的结构。以下,将该结构也称为“输入结构”。输入部101例如包含键盘、触摸传感器、触摸板或鼠标等而被构成。
图2为显示实施方式1涉及的被输入到输入部101的输入结构的一例的图。在图2所示的例子中,探索对象的材料所具有的组成以组成式能够表示为“Li12Mn6Ni6O24”。即,在该情况下,显示探索对象的材料所具有的组成为由Li(锂)原子12个、Mn(锰)原子6个、Ni(镍)原子6个、O(氧)原子24个构成的组成。
如图2的(a)所示那样,输入结构包含例如在晶体学信息通用数据格式(Crystallographic Information File:CIF)中被记述了的信息。然而,信息的记述形式不限定于CIF的数据格式,只要是组成式、晶体结构、和晶格矢量这样的采用第一原理计算等的结构最佳化的运算能够实施的记述形式,就可以为任何记述形式。
在CIF中,记述显示材料的组成的组成式、单位晶格矢量的长度、原子彼此相交的角度、和单位晶格中的原子配置等。在图2的(a)中,显示出关于材料“Li12Mn6Ni6O24”的组成的原子配置。在原子配置中,记述了各原子(例如如果为Li原子,则为“Li0”~[Li11]的共计12个原子)的原子坐标(x坐标、y坐标、z坐标)等。另外,“Li0”的“0”等数字不过是为了区别相同种类的元素而被附上的。
如图2的(b)所示那样,输入结构包含例如晶体结构的单位晶格,即原子配置。在图2的(b)中,最小的球体表示O原子,未施加剖面线的球体表示Li原子,为与Li原子同等程度的大小的球体且施加了剖面线的球体表示Ni原子,被涂抹得黑的球体表示Mn原子。这些表达方式在后述图5和图9中也同样。
(生成部102)
生成部102通过对从输入部101取得了的输入结构执行原子的除去、即原子脱离处理,从而生成脱离后的结构能够采取的多个初始结构。这里,原子从输入结构的除去通过从CIF删除记述了作为除去对象的原子的行来执行。在实施方式1中,脱离的原子为Li原子。即,生成部102(在第1步骤中)取得作为通过材料所包含的原子脱离而脱离后的材料的组成能够采取的三维空间中的原子配置的结构的多个初始结构。这里所谓“初始结构”为1个以上原子从作为探索对象的材料的组成脱离后的组成,并且为能够成为原子配置的稳定结构的候选的结构。
图3~图5分别为显示实施方式1涉及的生成部102生成初始结构的过程的一例的图。图3的(a)表示输入结构的CIF,图3的(b)表示1个Li原子从输入结构脱离后的结构的CIF,图3的(c)表示2个Li原子从输入结构脱离后的结构的CIF。在图3的(b)所示的例子中,生成部102通过从输入结构除去“Li4”,从而生成了1个Li原子脱离了的情况下的初始结构。在图3的(c)所示的例子中,生成部102通过从输入结构除去“Li2”、“Li6”,从而生成Li原子脱离了2个的情况下的初始结构。
图4显示2个Li原子从输入结构脱离了的情况下的初始结构的一例。图4的(a)所示的初始结构为通过生成部102从输入结构除去“Li2”、“Li6”而生成了的结构。图4的(b)所示的初始结构为生成部102通过从输入结构除去“Li5”、“Li6”而生成了的结构。图4的(c)所示的初始结构为通过生成部102从输入结构除去“Li0”、“Li4”而生成了的结构。
这样,生成部102根据从输入结构脱离了的Li原子的数目而生成多个初始结构。例如,位于图5的最左的立体构型表示1个Li原子从输入结构脱离了的情况下的初始结构的一例,在该情况下,生成部102生成作为从12个Li原子脱离1个Li原子的组合的数目的个初始结构。例如,位于从图5的左起第2的立体构型表示2个Li原子从输入结构脱离了的情况下的初始结构的一例,在该情况下,生成部102生成作为从12个Li原子脱离2个Li原子的组合的数目的/>个初始结构。例如,位于图5的最右的立体构型表示8个Li原子从输入结构脱离了的情况下的初始结构的一例,在该情况下,生成部102生成作为从12个Li原子脱离8个Li原子的组合的数目的/>个初始结构。
与作为探索对象的材料的式子对应的结构中,包含以相同元素符号表示的原子x个,z个原子能够从该x个原子脱离。x为2以上的整数,z为满足1≤z≤x-1的整数。关于脱离了z个该原子的体系,生成部102(在第1步骤中)生成个多个初始结构。即,生成部102生成的初始结构的数目为/>个。这样,在实施方式1中,生成部102对每个体系都生成多个初始结构。这里所谓“体系”,是指根据从输入结构脱离了的原子的数目而区分的、结构的集合。生成部102对(x-1)个体系每个都生成多个初始结构。
以下例示上述内容。在与探索对象的材料的式子“Li12Mn6Ni6O24”对应的结构中,包含以元素符号Li表示的原子x=12个,z个原子能够从该x=12个原子脱离。x为2以上的整数,z为满足1≤z≤11的整数。生成部102(在第1步骤中)关于1个Li原子脱离了的体系而生成个初始结构,···,关于11个Li原子脱离了的体系而生成/>个初始结构。生成部102生成的初始结构的数目为/>个。体系的数目为11。
生成部102将每个体系都生成了的多个初始结构输出到结构存储部108。另外,关于生成了的多个初始结构,可以将生成了的全部初始结构输出到结构存储部108,从对称性的观点考虑,将同等的结构使用现有的程序等进行筛选,可以仅输出被挑选出的初始结构。
结构存储部108例如由硬磁盘驱动器、或非易失性的半导体存储器等记录介质构成。后述的算出结果存储部109、和预测模型存储部110也为同样的构成。结构存储部108存储通过生成部102而相对于每个体系都生成了的多个初始结构。这里,各初始结构的数据以组成式、晶体结构、和晶格矢量这样采用第一原理计算等的结构最佳化的运算能够实施的记述形式存储。图6为显示实施方式1涉及的被存储在结构存储部108的数据的一例的图。在图6中,左列表示为了区别各初始结构而被分配了的初始结构ID(Identifier),右列表示初始结构的原子配置。
(算出部103)
如图7所示那样,算出部103从结构存储部108取得初始结构的一部分,对取得了的初始结构执行结构最佳化。算出部103执行算出与通过反复进行结构最佳化而获得的最终结构对应的能量(第1能量)的处理。图7为显示实施方式1涉及的采用算出部103算出第1能量的过程的一例的图。
即,算出部103(在第2步骤中)对多个初始结构之中的一部分初始结构实施结构最佳化,算出与被结构最佳化了的原子配置的结构对应的第1能量。这里所谓“第1能量”,既有显示与通过反复进行结构最佳化而获得的最终结构对应的能量的情况,也有显示与还未达到最终结构的中间结构对应的能量的情况。在实施方式中,算出部103例如使用VASP(维也纳从头计算模拟包,Vienna Ab initio Simulation Package)等第一原理计算包,执行结构最佳化和算出与最终结构对应的第1能量的处理。本公开中的“能量”可以是指“势能”。
这里,所谓“最终结构”,是通过对初始结构实施结构最佳化而获得的结构,并且是作用于结构所包含的各原子的力成为阈值以下那样的结构。所谓“中间结构”,是通过对初始结构实施结构最佳化而获得的结构,并且是作用于结构所包含的至少1个以上原子的力高于阈值的结构,即还未达到最终结构的结构。
算出部103在结构最佳化中,算出作用于处理对象的结构所包含的各原子的力F,探索在各原子中算出了的力F的大小成为阈值以下的结构(即,最终结构)。阈值如已经描述地那样,可以为接近于零的值。具体而言,算出部103在通过实施结构最佳化而获得的结构中,在作用于至少1个以上原子的力F的大小高于阈值的情况下,沿施加力F的方向移动各原子,以力F变小的方式调整各原子的位置。算出部103将算出上述各原子的力F的处理、和调整各原子的位置的处理作为1次的结构最佳化并将其反复进行,获得了在全部原子中力F的大小成为阈值以下的结构(即,最终结构)的情况下,结束结构最佳化。进而,算出部103算出与所得的最终结构对应的能量、即最终能量。
这里,在基于密度泛函理论(Density Functional Theory:DFT)的第一原理计算中,为了算出作用于各原子的力F,需要例如数十秒~数分钟左右的时间。在初始结构达到最终结构之前,需要执行例如数次~数十次左右调整各原子的位置的处理。因此,算出部103为了关于1个初始结构从初始结构获得最终结构,需要将需要数十秒~数分钟左右的时间的结构最佳化反复数次~数十次左右,作为整体而需要数十分钟~数小时左右的时间。
算出部103将初始结构、对该初始结构反复实施结构最佳化而获得的最终结构、和算出了的与最终结构对应的最终能量相对于每个体系都输出到算出结果存储部109。
算出结果存储部109相对于每个体系都存储通过算出部103而被算出了的最终能量、与对应的初始结构的组。图8为显示实施方式1涉及的被存储在算出结果存储部109的数据的一例的图。在图8中,左列表示初始结构ID,正中的列表示初始结构的原子配置,右列表示与通过对初始结构实施结构最佳化而获得的最终结构对应的最终能量。这样,算出结果存储部109只要至少存储初始结构、与最终结构的最终能量的组即可。在实施方式1中,算出结果存储部109进一步存储最终结构的原子配置。
(学习部104)
学习部104从算出结果存储部109取得初始结构、和最终结构的最终能量,使用取得了的初始结构和最终能量而使预测模型学习。这里,预测模型所学习的输入输出的组作为一例,输入为初始结构,输出为最终能量。
即,学习部104(在第7步骤中)使用学习用数据集,以对任意的原子配置的结构(这里,初始结构)的输入而输出与该结构被结构最佳化了的情况下的结构(这里,最终结构)对应的能量的方式使预测模型进行机器学习。学习用数据集包含初始结构作为输入数据、且包含与对该初始结构实施结构最佳化而获得的原子配置的结构(这里,最终结构)对应的能量作为正解数据。
在实施方式中,预测模型由以图结构作为输入的图神经网络构成。图神经网络例如为CGCNN(晶体图卷积神经网络,Crystal Graph Convolutional Neural Network)、或MEGNet(材质图网络,Material Graph Network)等。在实施方式中,预测模型由MEGNet构成。MEGNet为不仅以节点(节点/顶点)和边缘(枝/边)作为特征量,而且以表示作为对象的系统整体的特征的全局状态量进一步作为特征量的图神经网络。
图9为显示实施方式1涉及的采用学习部104使预测模型进行机器学习的过程的一例的图。学习部104首先将图9的(a)所示那样的初始结构的各原子的原子坐标和种类转换为图9的(b)所示那样的图结构。在图结构中,节点与初始结构的各原子对应,边缘与初始结构的各原子间的键合对应。接下来,学习部104将转换了的图结构输入到图9的(c)所示那样的图神经网络。接下来,学习部104将从图神经网络输出的图9的(d)所示的最终能量的预测值、与作为正解数据的最终能量进行比较。进而,学习部104如果从图神经网络输出的最终能量的预测值与作为正解数据的最终能量背离,则更新图神经网络的权重。这样地操作,学习部104使用多个学习用数据集,通过教师指导学习而使预测模型机器学习。
学习部104将机器学习完成了的预测模型,即学习完的模型输出到预测部105和预测模型存储部110。该机器学习完成了的预测模型以将任意的原子配置的结构(这里,初始结构)作为输入、并且将与对该结构实施了结构最佳化的情况下的结构(这里,最终结构)对应的能量作为后述第2能量而输出的方式进行了机器学习。该预测模型为使用包含初始结构作为输入数据、并且包含与该初始结构对应的第1能量(这里,最终能量)作为正解数据的第1学习用数据集而进行了机器学习的模型。
预测模型存储部110关于通过学习部104而进行了机器学习的预测模型,存储图神经网络的结构和权重。
(预测部105)
预测部105从结构存储部108取得未算出最终能量的初始结构。进而,预测部105通过向从学习部104取得了的预测模型,即学习完的预测模型输入该初始结构,来预测该初始结构的最终能量。
这里所谓的“未算出最终能量的初始结构”,是指多个初始结构之中的不是通过算出部103算出了能量的一部分初始结构的结构,为其它初始结构。即,预测部105(在第3步骤中)通过对多个初始结构之中的其它初始结构使用预测模型,来预测与对其它初始结构实施了结构最佳化的情况下的原子配置的结构对应的第2能量。这里,第2能量为与对其它初始结构实施了结构最佳化的情况下的最终结构对应的最终能量的预测值。
图10为显示实施方式1涉及的采用预测部105预测第2能量的过程的一例的图。预测部105将初始结构转换为图结构,将转换了的初始结构输入到预测模型。在图10中,省略了将初始结构转换为图结构的过程的图示。由此,预测模型输出与对被输入的初始结构实施了结构最佳化的情况下的最终结构对应的最终能量的预测值,即第2能量。
即,在非专利文献2所公开那样的预测模型中,输出与输入了的初始结构对应的能量的预测值,与此相对,在实施方式1涉及的预测模型中,输出与对输入的初始结构实施了结构最佳化的情况下的结构,即中间结构或最终结构对应的能量的预测值。进而,虽然也与预测模型的预测精度有关,但预测模型输出的能量的预测值相当于与算出部103实际上对初始结构实施结构最佳化而获得的结构对应的能量。
因此,在实施方式1中,通过使用预测模型,从而即使不对初始结构执行数次~数十次结构最佳化,也能够取得与被结构最佳化了的结构(例如,中间结构或最终结构)对应的能量。因此,在实施方式1中,可以某种程度上省略关于结构最佳化的运算,因此能够减少运算成本。
预测部105将初始结构、和与该初始结构对应的最终能量的预测值相对于每个体系都输出到比较部106。
(比较部106)
比较部106从预测部105取得初始结构和最终能量的预测值的组。比较部106从算出结果存储部109取得最终结构和最终能量的组。进而,比较部106生成将初始结构和最终能量的预测值的组、与最终结构和最终能量的组排列而得的列表。
图11为显示实施方式1涉及的通过比较部106而生成了的数据的一例的图。在图11中,左列表示初始结构或最终结构的原子配置,正中的列表示与最终结构对应的最终能量,右列表示与初始结构对应的最终能量的预测值。比较部106基于列表将最终能量和最终能量的预测值以规定的顺序重新排序。在实施方式1中,比较部106从能量最小的值起依次将最终能量和最终能量的预测值重新排序。这样的最终能量和最终能量的预测值的重新排序相当于从最终能量和最终能量的预测值提取最小的值,换言之为极小值或最小值的处理。
即,比较部106(在第4步骤中)基于第1能量和第2能量,提取显示极小值的第3能量。第1能量为从算出结果存储部109取得了的最终能量,第2能量为从预测部105取得了的最终能量的预测值。这里,极小值为第1能量和第2能量之中的最小值。即,第3能量为第1能量和第2能量的最小值。
比较部106如上述那样将最终能量和最终能量的预测值重新排序了的列表相对于每个体系都输出到输出部107。
(输出部107)
输出部107将比较部106输出了的列表所包含的初始结构和最终能量的预测值、以及最终结构和最终能量按照上述规定的顺序,即从能量最小的结构起依次显示于显示器。即,输出部107(在第5步骤中)输出第3能量、作为与第3能量对应的原子配置的结构的第1结构、或第3能量和第1结构。
另外,输出部107可以仅将第3能量和与第3能量对应的原子配置的结构显示于显示器。输出部107也可以将通过比较部106将最终能量和最终能量的预测值重新排序前的列表显示于显示器。即,输出部107(在第6步骤中)可以输出第1能量和第2能量。在该情况下,不需要采用比较部106进行的上述提取处理(第4步骤)。无论如何,输出部107将上述输出结果利用显示器以相对于每个体系都可以区别的形态显示。向显示器的显示可以相对于每个体系依次进行,也可以关于全部体系一并进行。
(实施方式1:预测精度的验证)
以下,对实施方式1涉及的预测部105的预测精度的验证进行说明。该验证以关于1个以上Li原子从具有组成Li12Mn6Ni6O24的物质脱离了的脱离后的物质的组成,查明相对于每个体系预测部105是否都可以预测稳定结构作为目的。
首先,在验证中,关于脱离后的物质的组成,准备了初始结构与最终能量的组共计4070组。即,关于共计4070个初始结构各自,实施结构最佳化而获得最终结构,算出了与所得的最终结构对应的最终能量。进而,将共计4070组之中的、作为整体的10%的407组设为验证用数据(测试数据),将作为剩下的90%的3663组设为学习用数据(训练数据)。
关于学习用数据,通过作为包含初始结构作为输入数据、并且包含最终能量作为正解数据的学习用数据集而使用,从而进行了预测模型的机器学习。进而,使用进行了机器学习的预测模型,预测了验证用数据的最终能量。即,通过将验证用数据所包含的初始结构输入到进行了机器学习的预测模型,从而取得了与从预测模型被输出的该初始结构对应的最终能量的预测值。
这里,作为预测精度的评价指标,相对于每个体系都考虑实际上对多个初始结构各自实施结构最佳化而获得的多个最终结构之中的被认为最稳定的原子配置的结构在预测模型中被预测为第几稳定的结构。由此,可以评价是否能够进行使用了该预测模型的筛选。
图12为显示实施方式1涉及的预测部105的预测精度的评价例的图。在图12中,从最左列起依次表示初始结构、与初始结构对应的最终能量的正解值、与初始结构对应的最终能量的预测值、正解值的位次、和预测值的位次。这里所谓“最终能量的正解值”,为与对初始结构实际上实施结构最佳化而获得的最终结构对应的最终能量。这里所谓“最终能量的预测值”,为通过将初始结构输入到预测模型,从而从预测模型输出的最终能量的预测值。这里所谓“位次”,是将最终能量的正解值或最终能量的预测值最小的最终结构设为1位的情况下的位次。
在图12所示的例子中,实际上实施结构最佳化而获得的被认为最稳定的原子配置的结构在预测部105中被预测为第2稳定的原子配置的结构。
图13为显示实施方式1涉及的验证了预测部105的预测精度的结果的图。在图13中,左列表示Li原子脱离数,换言之表示体系,右列表示位次。这里所谓“位次”的左侧的数字显示出体系中的验证用数据之中的被认为实际上最稳定的原子配置的结构在预测部105中被预测为第几稳定的结构。“位次”的右侧的数字表示体系中的验证用数据的数目。该表达方式在后述图14、图19、和图20中也同样。
这里,验证用数据的数越多,则越担心采用预测部105的预测精度的降低。然而,例如关于5个Li原子脱离了的体系,79组验证用数据之中的被认为实际上最稳定的原子配置的结构在预测部105中被预测为第1稳定的结构。例如关于7个Li原子脱离了的体系,79组验证用数据之中的被认为实际上最稳定的原子配置的结构在预测部105中被预测为第17稳定的结构。
如上述那样,由这些结果可知,预测部105关于任一体系,都可以将被认为实际上最稳定的原子配置的结构预测为以关于该体系的验证用数据整体的25%以内的位次稳定的结构。即,可知即使验证用数据的数变多,采用预测部105的预测精度也几乎不降低。这里,预测部105关于任一体系,都可以将被认为实际上最稳定的原子配置的结构预测为以关于该体系的验证用数据整体的10%以内、进一步为5%以内的位次稳定的结构。
图14为显示实施方式1涉及的验证了预测部105的预测精度与学习用数据的比率的相关性的结果的图。具体而言,图14为显示相对于每种LI原子从具有组成Li14Mn5Ni5O24的物质脱离了的数目,即相对于每个体系,一边变更学习用数据的比率一边验证了预测部105的预测精度的情况下的结果的图。这里所谓“学习用数据的比率”,是体系中的学习用数据的数目相对于学习用数据和验证用数据整体的数目的比例。
如图14所示那样,即使减少学习用数据的比率,预测部105的预测精度的降低也几乎不出现。例如,在使学习用数据的比率为40%的情况下,在4个Li原子脱离了的体系中,297组验证用数据之中的被认为实际上最稳定的原子配置的结构在预测部105中被预测为第2稳定的结构。同样地,在使学习用数据的比率为40%的情况下,在6个Li原子脱离了的体系中,554组验证用数据之中的被认为实际上最稳定的原子配置的结构在预测部105中被预测为第60稳定的结构。
(实施方式1:动作的说明)
接下来,对探索系统100的动作进行说明。
(流程图)
图15为显示实施方式1涉及的探索系统100的动作例的流程图。
(步骤S101)
输入部101通过用户的输入而取得输入结构,将所取得的输入结构输出到生成部102。
(步骤S102)
生成部102对通过步骤S101而取得了的输入结构执行脱离处理。由此,生成部102相对于每个体系都生成多个初始结构,输出到结构存储部108。
(步骤S103)
算出部103对通过步骤S102生成了的多个初始结构之中的一部分初始结构执行结构最佳化,算出与通过实施结构最佳化而获得的最终结构对应的最终能量。进而,算出部103相对于每个体系都将算出结果输出到算出结果存储部109。这里,在生成部102(第1步骤)中取得了n个(n为2以上的整数)初始结构的情况下,算出部103(第2步骤)中的一部分初始结构为m个(m为1<m<n的整数)初始结构。这里,“m”为“n”的90%以下的数。“m”可以为“n”的40%以上且90%以下的数。即,算出部103(第2步骤)中的一部分初始结构的数目为多个初始结构的数目的90%以下。
(步骤S104)
学习部104将通过步骤S103而算出的最终能量与初始结构的组作为学习用数据集,进行由图神经网络构成的预测模型的机器学习。进而,学习部104将机器学习后的预测模型输出到预测部105和预测模型存储部110。这里,学习用数据集的数目与一部分初始结构的数目相同,为m个。
(步骤S105)
预测部105从结构存储部108取得未算出最终能量的初始结构,即多个初始结构之中的其它初始结构。进而,预测部105通过在步骤S104中进行了机器学习的预测模型,而算出与其它初始结构对应的最终能量的预测值。这里,其它初始结构的数目为从多个初始结构除去了一部分初始结构而得的数目。即,预测部105(第3步骤)中的其它初始结构为(n-m)个初始结构。
另外,在实施方式1中,预测模型为通过步骤S104而进行了机器学习的预测模型,但也可以为从预测模型存储部110取得了的预先学习完的其它预测模型。
(步骤S106)
比较部106相对于每个体系都生成将通过步骤S103而算出了的最终能量、与通过步骤S105而算出了的最终能量的预测值从能量最小的值起依次重新排序了的列表,将生成了的列表输出到输出部107。即,比较部106相对于每个体系都从最终能量和最终能量的预测值提取显示最小值的能量。
(步骤S107)
输出部107通过将通过步骤S106而生成了的列表所包含的初始结构和最终能量的预测值、以及最终结构和最终能量从能量最小的结构起依次显示于显示器而输出。
这样,在实施方式1中,通过不对全部初始结构实施结构最佳化,而仅对一部分初始结构实施结构最佳化,对剩下的其它初始结构使用预测模型,从而省略了关于结构最佳化的运算。因此,在实施方式1中,与对全部初始结构实施了结构最佳化的情况下同样地,能够探索新物质中的被认为热力学最稳定的原子配置的结构,并且,能够某种程度上省略探索所需要的运算。即,在实施方式1中,与对全部初始结构实施结构最佳化的情况进行比较,可以减少运算成本,可以有效率地探索关于原子脱离后的材料的组成的原子配置的稳定结构。
(实施方式2)
以下,使用附图对本公开的实施方式2涉及的探索系统200(探索方法、或程序)详细地说明。实施方式2涉及的探索系统200在使预测模型进行机器学习时,在不仅使用初始结构而且使用中间结构和最终结构方面,与实施方式1涉及的探索系统100不同。另外,在本实施方式中,对与实施方式1相同的构成要素附上相同的符号,省去说明。
图16为显示包含实施方式2涉及的探索系统200的整体构成的框图。如图16所示那样,探索系统200具备生成部102、算出部203、学习部204、预测部105、比较部106、和输出部107。作为探索系统200的周边的构成,有输入部101、结构存储部108、算出结果存储部209、和预测模型存储部210。另外,探索系统200的周边的构成可以被包含于探索系统200的构成要素。探索系统200中的生成部102和学习部204也为预测模型构建装置的构成要素。
以下,对图16所示的各构成要素的详细内容进行描述。另外,关于除算出结果存储部209、预测模型存储部210、算出部203、和学习部204以外的各构成要素,由于与实施方式1相同,因此省略说明。
(算出部203)
算出部203从结构存储部108取得初始结构的一部份,对取得了的初始结构执行结构最佳化。算出部103执行算出与通过反复进行结构最佳化而获得的最终结构对应的能量(第1能量)的处理。
算出部203将初始结构、通过对该初始结构反复执行结构最佳化而获得的最终结构、和算出了的与最终结构对应的最终能量相对于每个体系都输出到算出结果存储部209。进而,在实施方式2中,算出部203将每次对该初始结构实施结构最佳化而获得的中间结构都输出到算出结果存储部209。
算出结果存储部209相对于每个体系都存储通过算出部203而算出了的最终能量、对应的初始结构、对应的中间结构、以及对应的最终结构的组。图17为显示实施方式2涉及的被存储在算出结果存储部209的数据的一例的图。在图17中,左列表示初始结构ID,正中的列表示每次实施结构实施化而获得的中间结构的原子配置和最终结构的原子配置,右列表示与最终结构对应的最终能量。另外,在图17中,省略了初始结构的原子配置的图示。
(学习部204)
学习部204从算出结果存储部209取得初始结构、中间结构、最终结构、和最终结构的最终能量,使用它们而学习预测模型。
图18为显示实施方式2涉及的采用学习部204使预测模型进行机器学习的过程的一例的图。如图18所示那样,在实施方式2中,学习用数据集所包含的输入数据不仅包含初始结构,而且进一步包含每次实施结构最佳化而获得的中间结构和最终结构。
即,在实施方式2中,学习部204不仅使用包含初始结构作为输入数据、并且包含最终能量作为正解数据的第1学习用数据集,而且进一步使用包含中间结构或最终结构作为输入数据、并且包含最终能量作为正解数据的第2学习用数据集,使预测模型进行机器学习。因此,在实施方式2中,预测模型为除了第1学习用数据集以外,进一步使用包含被结构最佳化了的原子配置的结构、即中间结构或最终结构作为输入数据,并且包含与该结构对应的第1能量、即最终能量作为正解数据的第2学习用数据集而进行了机器学习的模型。另外,采用学习部204的预测模型的机器学习的处理的详细内容由于与实施方式1同样,因此省略说明。
学习部204将机器学习完成了的预测模型,即学习完的模型输出到预测部105和预测模型存储部210。
预测模型存储部210关于通过学习部204而进行了机器学习的预测模型,存储图神经网络的结构和权重。
(实施方式2:预测精度的验证)
以下,对实施方式2涉及的预测部105的预测精度的验证进行说明。该验证与实施方式1中的验证同样地,以关于1个以上Li原子从具有组成Li12Mn6Ni6O24的物质脱离了的脱离后的物质的组成,查明相对于每个体系预测部105是否都可以预测稳定结构作为目的。
验证的内容由于基本上为与实施方式1中的验证为相同的内容,因此关于相同内容省略说明。实施方式2中的验证在预测模型的机器学习所使用的学习用数据集不仅包含上述第1学习用数据集,而且进一步包含上述第2学习用数据集方面,与实施方式1中的验证不同。
图19为显示实施方式2涉及的验证了预测部105的预测精度的结果的图。在图19中,关于各列表示什么,由于与实施方式1的图13同样,因此这里省略说明。
这里,验证用数据的数目越多,则越担心采用预测部105的预测精度的降低。然而,例如关于3个Li原子脱离了的体系,22组验证用数据之中的被认为实际上最稳定的原子配置的结构在预测部105中被预测为第2稳定的结构。例如关于6个Li原子脱离了的体系,92组验证用数据之中的被认为实际上最稳定的原子配置的结构在预测部105中被预测为第1稳定的结构。
如上述那样,由这些结果可知,预测部105关于任一体系,都可以将被认为实际上最稳定的原子配置的结构预测为关于该体系的验证用数据整体的第1或第2稳定的结构。即,可知即使验证用数据的数目变多,采用预测部105的预测精度也几乎不降低。
图20为显示实施方式2涉及的验证了预测部105的预测精度与学习用数据的比率的相关性的结果的图。具体而言,图20为显示相对于每种LI原子从具有组成Li14Mn5Ni5O24的物质脱离了的数目,即相对于每个体系,都一边变更学习用数据的比率一边验证了预测部105的预测精度的情况下的结果的图。在图20中,关于各列表示什么,由于与实施方式1的图14同样,因此这里省略说明。
如图20所示那样,即使减少学习用数据的比率,预测部105的预测精度的降低也几乎不出现。例如,在使学习用数据的比率为10%的情况下,在6个Li原子脱离了的体系中,831组验证用数据之中的被认为实际上最稳定的原子配置的结构在预测部105中被预测为第42稳定的结构。与此相对,在实施方式1中,在使学习用数据的比率为10%的情况下,在6个Li原子脱离了的体系中,831组验证用数据之中的被认为实际上最稳定的原子配置的结构在预测部105中被预测为第684稳定。即,在实施方式2中,通过进一步使用包含被结构最佳化了的原子配置的结构,即中间结构或最终结构作为输入数据的学习用数据集而使预测模型进行机器学习,从而可以认为即使在学习用数据的比率低的情况下,也能够进行高精度的预测。
(实施方式2:动作的说明)
接下来,对探索系统200的动作进行说明。
(流程图)
图21为显示实施方式2涉及的探索系统200的动作例的流程图。步骤S201~S203、和步骤S205~S207的处理由于分别与图15所示的步骤S101~S103、和S105~S107的处理相同,因此省略说明。即,除步骤S204以外,与实施方式1涉及的探索系统100的处理的整体流程相同。
(步骤S204)
学习部204将通过步骤S203而算出了的最终能量与初始结构的组、和该最终能量与被结构最佳化了的结构的组作为学习用数据集,进行由图神经网络构成的预测模型的机器学习。这里所谓“被结构最佳化了的结构”,是中间结构或最终结构。进而,学习部204将机器学习后的预测模型输出到预测部105和预测模型存储部210。
这样,在实施方式2中,进一步使用包含被结构最佳化了的原子配置的结构,即中间结构或最终结构作为输入数据的学习用数据集而使预测模型进行机器学习。因此,在实施方式2中,与实施方式1进行比较,易于进一步精度良好地预测与对被输入的初始结构实施了结构最佳化的情况下的结构对应的能量。
(实施方式3)
以下,使用附图对本公开的实施方式3涉及的探索系统300(探索方法、或程序)详细地说明。实施方式3涉及的探索系统300在预测与对初始结构实施了结构最佳化的情况下的原子配置的结构对应的第2能量时,使用预先进行了机器学习的关于已知结构的预测模型方面,与实施方式1涉及的探索系统100或实施方式2涉及的探索系统200不同。另外,在本实施方式中,对与实施方式1或实施方式2相同的构成要素附上相同的符号,省去说明。
图22为显示包含实施方式3涉及的探索系统300的整体构成的框图。如图22所示那样,探索系统300具备生成部102、预测部305、比较部306、和输出部107,不具备学习部104或学习部204。作为探索系统300的周边的构成,有输入部101、结构存储部108、和预测模型存储部310。另外、探索系统300的周边的构成可以被包含于探索系统300的构成要素。
以下,对图22所示的各构成要素的详细内容进行描述。另外,关于除预测模型存储部310、预测部305、和比较部306以外的各构成要素,由于与实施方式1相同,因此省略说明。
(预测模型存储部310)
预测模型存储部310关于预先进行了机器学习的学习完的预测模型,存储图神经网络的结构和权重。这里被采用的预测模型例如为与关于与原子脱离后的材料的组成类似的已知的组成的已知结构有关的预测模型、或通用地被学习的预测模型。这里所谓“类似”,是指例如原子脱离后的材料的组成和已知材料的组成各自所包含的元素仅一部分不同。所谓“类似”,是指已知材料的组成包含原子脱离后的材料的组成所包含的至少1种元素。
在实施方式3中,预测模型为前者的预测模型,即关于已知结构的预测模型。该预测模型例如使用包含已知结构作为输入数据、并且包含与对该已知结构实施结构最佳化而获得的最终结构对应的最终能量作为正解数据的学习用数据集而预先进行机器学习。
(预测部305)
预测部305从结构存储部108取得初始结构。进而,预测部305通过向从预测模型存储部310取得了的学习完的预测模型输入该初始结构,来预测该初始结构的最终能量。在实施方式3中,预测部305关于全部初始结构各自使用预测模型而预测最终能量。即,预测部305(在第8步骤中)通过对多个初始结构各自使用预测模型,来预测与对该初始结构实施了结构最佳化的情况下的原子配置的结构对应的能量。这里所谓“能量”,是与对初始结构实施了结构最佳化的情况下的最终结构对应的最终能量的预测值。
预测部305将初始结构、和与该初始结构对应的最终能量的预测值相对于每个体系都输出到比较部306。
(比较部306)
比较部306从预测部305取得初始结构和最终能量的预测值的组。进而,比较部306生成将初始结构和最终能量的预测值的组排列了的列表。
图23为显示实施方式3涉及的通过比较部306而生成了的数据的一例的图。在图23中,左列表示初始结构的原子配置,右列表示与初始结构对应的最终能量的预测值。比较部306基于列表将最终能量的预测值以规定的顺序重新排序。在实施方式3中,比较部306从能量最小的值起依次将最终能量的预测值重新排序。这样的最终能量的预测值的重新排序相当于从最终能量的预测值提取最小的值,换言之为极小值或最小值的处理。
即,比较部306(在第9步骤中)从所预测的多个能量提取显示极小值的能量。这里所谓“能量”,为与对初始结构实施了结构最佳化的情况下的最终结构对应的最终能量的预测值。这里,极小值为能量之中的最小值。
比较部306如上述那样将最终能量的预测值重新排序了的列表相对于每个体系都输出到输出部107。
(实施方式3:动作的说明)
接下来,对探索系统300的动作进行说明。
(流程图)
图24为显示实施方式3涉及的探索系统300的处理的动作例的流程图。步骤S301、S302的处理由于分别与图15所示的步骤S101、S102的处理相同,因此省略说明。
(步骤S303)
探索系统300取得预先机器学习完、并且与关于原子脱离后的材料的组成类似的组成的已知结构有关的预测模型,输出到预测模型存储部310。
(步骤S304)
预测部305从结构存储部108取得初始结构。进而,预测部305通过在步骤S303中被取得的预测模型,而算出与初始结构对应的最终能量的预测值。
(步骤S305)
比较部306相对于每个体系都生成将通过步骤S304而算出了的最终能量的预测值从能量最小的值起依次重新排序了的列表,将生成了的列表输出到输出部107。即,比较部306从最终能量的预测值相对于每个体系都提取显示最小值的能量。
(步骤S306)
输出部107通过将通过步骤S305而生成了的列表所包含的初始结构和最终能量的预测值从能量最小的结构起依次显示于显示器来输出。
这样,在实施方式3中,由于对全部初始结构使用预先进行了机器学习的预测模型,因此不进行关于结构最佳化的运算就可以。因此,在实施方式3中,与实施方式1或实施方式2同样地,能够探索新物质中的被认为热力学最稳定的原子配置的结构,并且,能够大幅省略探索所需要的运算。即,在实施方式3中,与对一部分初始结构实施结构最佳化的情况进行比较,可以减少运算成本,可以有效率地探索关于材料的组成的原子配置的稳定结构。
(实施方式4)
以下,使用附图对本公开的实施方式4涉及的探索系统400(探索方法、或程序)详细地说明。实施方式4涉及的探索系统400在使用预先进行了机器学习的与已知结构有关的预测模型,并且验证是否再学习预测模型方面,与实施方式3涉及的探索系统300不同。另外,在本实施方式中,对与实施方式1、实施方式2、或实施方式3相同的构成要素附上相同的符号,省去说明。
图25为显示包含实施方式4涉及的探索系统400的整体构成的框图。如图25所示那样,探索系统400具备生成部102、算出部103、学习部404、预测部405、比较部106、和输出部107。作为探索系统400的周边的构成,有输入部101、结构存储部108、算出结果存储部109、和预测模型存储部310。另外,探索系统400的周边的构成可以被包含于探索系统400的构成要素。
以下,对图25所示的各构成要素的详细内容进行描述。另外,关于除学习部404和预测部405以外的各构成要素,由于与实施方式1或实施方式3相同,因此省略说明。
(学习部404)
在预测部405中被判定为预测模型的预测精度不满足条件的情况下,学习部404再学习预测模型。具体而言,学习部404从算出结果存储部109取得初始结构和最终结构的最终能量,使用它们再学习从预测模型存储部310取得了的预测模型。这里,预测模型的再学习所使用的学习用数据集包含初始结构作为输入数据、并且包含最终能量作为正解数据。
学习部404将再学习完成了的预测模型输出到预测部405和预测模型存储部310。
预测模型存储部310关于通过学习部404而进行了再学习的预测模型,存储图神经网络的结构和权重。即,在预测模型存储部310中,已经被存储的预测模型被更新为进行了再学习的预测模型。
(预测部405)
预测部405从算出结果存储部109取得初始结构和最终结构的最终能量。预测部405从预测模型存储部310取得预测模型。这里预测部405取得的预测模型为通过学习部404再学习前的预测模型。预测部405通过向取得了的预测模型输入该初始结构,来预测该初始结构的最终能量。进而,预测部405通过将最终能量的预测值、与从算出结果存储部109取得了的最终能量进行比较,从而验证预测模型的预测精度。具体而言,作为一例,预测部405如果最终能量与最终能量的预测值的均方根误差(Root Mean Squared Error:RMSE)低于一定的值,则判定为预测模型的预测精度充分,即满足预测精度的条件。另一方面,预测部405如果上述RMSE高于一定的值,则判定为预测模型的预测精度不充分,即不满足预测精度的条件。预测部405可以基于例如将被认为实际上最稳定的原子配置的结构预测为以一定的位次内稳定的结构,来判定满足预测精度的条件。另外,预测模型的预测精度的验证方法不限定于上述方法,也可以为其它方法。
即,预测部405(在第10步骤中)通过对一部分初始结构之中的至少1种初始结构使用预测模型,来预测与对该初始结构实施了结构最佳化的情况下的原子配置的结构对应的第2能量。这里,第2能量为与对至少1种初始结构实施了结构最佳化的情况下的最终结构对应的最终能量的预测值。预测部405(在第11步骤中)通过将第1能量与第2能量进行比较而验证预测模型的预测精度。这里,第1能量为与至少1种初始结构对应的最终结构的最终能量。
在满足预测模型的预测精度的条件的情况下,或通过学习部404而再学习了预测模型的情况下,预测部405从结构存储部108取得未算出最终能量的初始结构。这里所谓“未算出最终能量的初始结构”,是多个初始结构之中的除一部分初始结构以外的结构,即其它初始结构。进而,预测部405通过在预测模型输入该初始结构,来预测该初始结构的最终能量。
即,在预测部405(第11步骤)中的结果满足规定的条件的情况下,即在满足预测精度的条件的情况下,预测部405(在第12步骤中)通过对多个初始结构之中的其它初始结构使用预测模型,来预测与对其它初始结构实施了结构最佳化的情况下的原子配置的结构对应的第2能量。这里,第2能量为与对其它初始结构实施了结构最佳化的情况下的最终结构对应的最终能量的预测值。
预测部405将初始结构、和与该初始结构对应的最终能量的预测值相对于每个体系都输出到比较部106。
(实施方式4:动作的说明)
接下来,对探索系统400的动作进行说明。
(流程图)
图26为显示实施方式4涉及的探索系统400的处理的动作例的流程图。步骤S401~S403的处理由于分别与图24所示的步骤S301~S303的处理相同,因此省略说明。
(步骤S404)
算出部103对通过步骤S403而生成了的多个初始结构之中的一部分初始结构执行结构最佳化,算出与通过实施结构最佳化而获得的最终结构对应的最终能量。进而,算出部103将算出结果相对于每个体系都输出到算出结果存储部109。
(步骤S405)
预测部405从算出结果存储部109取得初始结构,即一部分初始结构。进而,预测部405利用在步骤S403中取得了的预测模型,而算出与一部分初始结构对应的最终能量的预测值。
(步骤S406)
预测部405通过将通过步骤S405而算出了的最终能量的预测值、与通过步骤S404而算出了的最终能量进行比较,从而验证预测模型的预测精度。在预测结果满足预测精度的条件的情况下(步骤S406:是(Yes)),处理进入到步骤S408。另一方面,在预测结果不满足预测精度的条件的情况下(步骤S406:否(No)),处理进入到步骤S407。
(步骤S407)
学习部404以通过步骤S404而算出了的最终能量与初始结构的组作为学习用数据集,进行由图神经网络构成的预测模型的再学习。进而,学习部404将再学习后的预测模型输出到预测部405和预测模型存储部310。另外,在预测模型的再学习时,可以进一步使用与上述一部分初始结构不同的初始结构与最终能量的组作为学习用数据集。在该情况下,需要在算出部103另行算出与该其它初始结构对应的最终能量。
(步骤S408)
预测部405从结构存储部108取得未算出最终能量的初始结构,即多个初始结构之中的其它初始结构。进而,预测部405通过预测模型而算出与其它初始结构对应的最终能量的预测值。这里,关于预测模型,在步骤S406中预测结果满足预测精度的条件的情况下,采用通过S403而取得了的预测模型。另一方面,在步骤S406中预测结果不满足预测精度的条件的情况下,采用通过步骤S407而进行了再学习的预测模型。
(步骤S409)
比较部106相对于每个体系都生成将通过步骤S404而算出了的最终能量、和通过步骤S408而算出了的最终能量的预测值从能量最小的值起依次重新排序了的列表,将生成了的列表输出到输出部107。即,比较部106从最终能量和最终能量的预测值提取显示最小值的能量。换言之,比较部106(在第13步骤中)基于第1能量和第2能量,提取显示极小值的第3能量。这里,第1能量为从算出结果存储部109取得了的最终能量,第2能量为从预测部405取得了的最终能量的预测值。第3能量为第1能量和第2能量的最小值。
(步骤S410)
输出部107通过将通过步骤S409而生成了的列表所包含的初始结构和最终能量的预测值从能量最小的结构起依次显示于显示器来输出。
这样,在实施方式4中,使用预先进行了机器学习的预测模型,同时验证了该预测模型的预测精度。因此,在实施方式4中,易于实现具有充分的预测精度的预测模型。在实施方式4中,通过使用满足了预测精度的条件的预测模型,即预测精度较高的预测模型,从而易于进一步有效率地探索关于材料的组成的原子配置的稳定结构。
(变形例)
在上述各实施方式中,极小值为第1能量和第2能量之中的最小值,但不限定于此。另外,第1能量为通过算出部103而算出了的最终能量,第2能量为通过预测部105、306、406而被预测了的最终能量的预测值。例如,假定第1能量和第2能量之中的最小的值为第2能量的最小值,并且第2小的值为第1能量的最小值,这些值接近。例如,2个值的差为第2能量的最小值的10000分的1以内。在该情况下,极小值不是第2能量的最小值,而可以为第1能量的最小值。原因是可以认为与被预测了的值相比,实际上算出的值精度良好。
在上述各实施方式中,从探索对象的材料脱离的原子为Li原子,但不限定于此。例如,从探索对象的材料脱离的原子可以为O原子,也可以为其它原子。
在上述各实施方式中,探索系统100~400虽然通过生成部102生成多个初始结构从而取得了多个初始结构,但不限于此。例如,探索系统100~400可以取得通过其它系统而生成了的多个初始结构。在该情况下,不需要生成部102。即,在取得步骤中,可以通过生成多个初始结构来取得,也可以取得通过其它系统而生成了的多个初始结构。
在上述各实施方式中,各构成要素由专用的硬件构成、或可以通过执行适于各构成要素的软件程序来实现。各构成要素可以通过CPU(中央处理器,Central ProcessingUnit)或处理器等程序执行部读出硬磁盘或半导体存储器等记录介质所记录的软件程序而执行来实现。
另外,以下那样的情况也包含于本公开。
(1)上述至少1个系统具体为由微处理器、ROM、RAM、硬磁盘单元、显示器单元、键盘、鼠标等构成的计算机系统。在该RAM或硬磁盘单元中存储有计算机程序。通过微处理器按照计算机程序而动作,从而上述至少1个系统实现其功能。这里计算机程序是为了实现规定的功能,多个显示对计算机的指令的命令码组合而构成的。
(2)构成上述至少1个系统的构成要素的一部分或全部可以由1个系统LSI(LargeScale Integration:大规模集成电路)构成。系统LSI为将多个构成部集成在1个芯片上而制造的超多功能LSI,具体而言为包含微处理器、ROM、RAM等而构成的计算机系统。在上述RAM中存储有计算机程序。微处理器通过按照计算机程序而动作,从而系统LSI实现其功能。
(3)构成上述至少1个系统的构成要素的一部分或全部可以由能够装卸于该装置的IC卡或单独的模块构成。IC卡或模块为由微处理器、ROM、RAM等构成的计算机系统。IC卡或模块可以包含上述超多功能LSI。微处理器通过按照计算机程序而动作,从而IC卡或模块实现其功能。该IC卡或该模块可以具有防篡改性。
(4)本公开可以为上述所示的方法。此外,可以为通过计算机来实现这些方法的计算机程序,也可以为由计算机程序构成的数字信号。
本公开可以为将计算机程序或数字信号记录于计算机可读取的记录介质例如软磁盘、硬磁盘、CD(Compact Disc)-ROM、DVD、DVD-ROM、DVD-RAM、BD(Blu-ray(注册商标)Disc)、半导体存储器等的物质。也可以为被记录于这些记录介质的数字信号。
本公开可以为将计算机程序或数字信号经由以电信线路、无线或有线通信线路、因特网为代表的网络、数据广播等进行传输的公开。
通过将程序或数字信号记录于记录介质进行移送,或通过将程序或数字信号经由网络等进行移送,从而可以通过独立的其它计算机系统来实施。
产业可利用性
本公开即使不对全部原子配置结构的候选进行计算也能够进行稳定的原子配置结构的探索,在不能准备大规模的计算资源的状况下,探索新的材料的稳定的原子配置结构的情况下是有用的。
符号的说明
100、200、300、400探索系统
101 输入部
102 生成部
103、203 算出部
104、204、404学习部
105、305、405预测部
106、306 比较部
107 输出部
108 结构存储部
109、209 算出结果存储部
110、210、310预测模型存储部。
Claims (16)
1.一种探索方法,是用于探索关于材料的组成的三维空间中的原子配置的稳定结构的探索方法,
计算机执行下述步骤:
第1步骤,取得作为通过所述材料所包含的原子脱离而脱离后的材料的组成能够采取的所述三维空间中的原子配置的结构的多个初始结构;
第2步骤,对多个所述初始结构之中的一部分初始结构实施结构最佳化,算出与被结构最佳化了的原子配置的结构对应的第1能量;
第3步骤,通过对多个所述初始结构之中的其它初始结构使用预测模型,来预测与对所述其它初始结构实施了结构最佳化的情况下的原子配置的结构对应的第2能量;
第4步骤,基于所述第1能量和所述第2能量,提取显示极小值的第3能量;以及
第5步骤,输出所述第3能量、作为与所述第3能量对应的原子配置的结构的第1结构、或所述第3能量和所述第1结构,
所述预测模型以将任意的原子配置的结构作为输入、并且将与对该结构实施了结构最佳化的情况下的结构对应的能量作为所述第2能量而输出的方式进行了机器学习。
2.根据权利要求1所述的探索方法,在所述材料中,包含x个能够脱离的所述原子,其中x为2以上的整数,
在所述第1步骤中,关于脱离了z个所述原子的体系,生成Cz x个多个所述初始结构,其中z为1≤z≤x-1的整数。
3.根据权利要求1或2所述的探索方法,在所述第1步骤中,在取得了n个所述初始结构的情况下,其中n为2以上的整数,
所述第2步骤中的所述一部分初始结构为m个所述初始结构,其中m为1≤m<n的整数,
所述第3步骤中的所述其它初始结构为(n―m)个所述初始结构。
4.根据权利要求1~3中任一项所述的探索方法,所述第3能量为所述第1能量和所述第2能量的最小值。
5.根据权利要求1~4中任一项所述的探索方法,所述预测模型为使用包含所述初始结构作为输入数据、并且包含与该初始结构对应的所述第1能量作为正解数据的第1学习用数据集而进行了机器学习的模型。
6.根据权利要求5所述的探索方法,所述预测模型为进一步使用包含所述被结构最佳化了的原子配置的结构作为输入数据、并且包含与该结构对应的所述第1能量作为正解数据的第2学习用数据集而进行了机器学习的模型。
7.根据权利要求1~6中任一项所述的探索方法,所述第2步骤中的所述一部分初始结构的数目为多个所述初始结构的数目的90%以下。
8.一种探索系统,是用于探索关于材料的组成的三维空间中的原子配置的稳定结构的探索系统,其具备:
生成部,生成作为通过所述材料所包含的原子脱离而脱离后的材料的组成能够采取的所述三维空间中的原子配置的结构的多个初始结构;
算出部,对多个所述初始结构之中的一部分初始结构实施结构最佳化,算出与被结构最佳化了的原子配置的结构对应的第1能量;
预测部,通过对多个所述初始结构之中的其它初始结构使用预测模型,来预测与对所述其它初始结构实施了结构最佳化的情况下的原子配置的结构对应的第2能量;以及
输出部,输出所述第1能量和所述第2能量,
所述预测模型以将任意的原子配置的结构作为输入、并且将与对该结构实施了结构最佳化的情况下的结构对应的能量作为所述第2能量而输出的方式进行了机器学习。
9.根据权利要求8所述的探索系统,所述输出部输出基于所述第1能量和所述第2能量而被提取的显示极小值的第3能量、作为与所述第3能量对应的原子配置的结构的第1结构、或所述第3能量和所述第1结构。
10.一种程序,是用于探索关于材料的组成的三维空间中的原子配置的稳定结构的程序,使计算机执行下述步骤:
第1步骤,取得作为通过所述材料所包含的原子脱离而脱离后的材料的组成能够采取的所述三维空间中的原子配置的结构的多个初始结构;
第2步骤,对多个所述初始结构之中的一部分初始结构实施结构最佳化,算出与被结构最佳化了的原子配置的结构对应的第1能量;
第3步骤,通过对多个所述初始结构之中的其它初始结构使用预测模型,来预测与对所述其它初始结构实施了结构最佳化的情况下的原子配置的结构对应的第2能量;以及
第6步骤,输出所述第1能量和所述第2能量,
所述预测模型以将任意的原子配置的结构作为输入、并且将与对该结构实施了结构最佳化的情况下的结构对应的能量作为所述第2能量而输出的方式进行了机器学习。
11.根据权利要求10所述的程序,使所述计算机进一步执行基于所述第1能量和所述第2能量而提取显示极小值的第3能量的第4步骤,
在所述第6步骤中,进一步输出所述第3能量、作为与所述第3能量对应的原子配置的结构的第1结构、或所述第3能量和所述第1结构。
12.一种预测模型构建方法,计算机执行下述步骤:
第1步骤,取得作为通过材料所包含的原子脱离而脱离后的材料的组成能够采取的三维空间中的原子配置的结构的初始结构;以及
第7步骤,使用包含所述初始结构作为输入数据、并且包含与对该初始结构实施结构最佳化而获得的原子配置的结构对应的能量作为正解数据的学习用数据集,以对任意的原子配置的结构的输入而输出与该结构被结构最佳化了的情况下的结构对应的能量的方式进行机器学习。
13.一种预测模型构建装置,其具备:
生成部,生成作为通过材料所包含的原子脱离而脱离后的材料的组成能够采取的三维空间中的原子配置的结构的初始结构;以及
学习部,使用包含所述初始结构作为输入数据、并且包含与对该初始结构实施结构最佳化而获得的原子配置的结构对应的能量作为正解数据的学习用数据集,以对任意的原子配置的结构的输入而输出与该结构被结构最佳化了的情况下的结构对应的能量的方式进行机器学习。
14.一种探索方法,是用于使用通过权利要求13所述的预测模型构建装置而进行了机器学习的预测模型,来探索所述关于材料的组成的所述三维空间中的原子配置的稳定结构的探索方法,
计算机执行下述步骤:
第1步骤,取得多个所述初始结构;
第8步骤,通过对多个所述初始结构各自使用所述预测模型,来预测与对该初始结构实施了结构最佳化的情况下的原子配置的结构对应的能量;以及
第9步骤,从所预测的多个所述能量提取显示极小值的能量。
15.一种探索方法,是用于使用通过权利要求13所述的预测模型构建装置而进行了机器学习的预测模型,来探索所述关于材料的组成的所述三维空间中的原子配置的稳定结构的探索方法,
计算机执行下述步骤:
第1步骤,取得多个所述初始结构;
第2步骤,对多个所述初始结构之中的一部分初始结构实施结构最佳化,算出与被结构最佳化了的原子配置的结构对应的第1能量;
第10步骤,通过对所述一部分初始结构之中的至少1个初始结构使用所述预测模型,来预测与对该初始结构实施了结构最佳化的情况下的原子配置的结构对应的第2能量;以及
第11步骤,通过将所述第1能量与所述第2能量进行比较,来验证所述预测模型的预测精度。
16.根据权利要求15所述的探索方法,在所述第11步骤中的结果满足规定的条件的情况下,
所述计算机进一步执行下述步骤:
第12步骤,通过对多个所述初始结构之中的其它初始结构使用所述预测模型,来预测所述与对其它初始结构实施了结构最佳化的情况下的原子配置的结构对应的所述第2能量;以及
第13步骤,基于所述第1能量和所述第2能量,提取显示极小值的第3能量。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2021-122633 | 2021-07-27 | ||
JP2021122633 | 2021-07-27 | ||
PCT/JP2022/027344 WO2023008173A1 (ja) | 2021-07-27 | 2022-07-12 | 探索方法、探索システム、プログラム、予測モデル構築方法、及び予測モデル構築装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN117678025A true CN117678025A (zh) | 2024-03-08 |
Family
ID=85086780
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202280051390.8A Pending CN117678025A (zh) | 2021-07-27 | 2022-07-12 | 探索方法、探索系统、程序、预测模型构建方法及预测模型构建装置 |
Country Status (4)
Country | Link |
---|---|
US (1) | US20240144046A1 (zh) |
JP (1) | JPWO2023008173A1 (zh) |
CN (1) | CN117678025A (zh) |
WO (1) | WO2023008173A1 (zh) |
Family Cites Families (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP7116186B2 (ja) * | 2018-09-14 | 2022-08-09 | 富士フイルム株式会社 | 化合物探索方法、化合物探索プログラム、記録媒体、及び化合物探索装置 |
JP2020166706A (ja) * | 2019-03-29 | 2020-10-08 | 株式会社クロスアビリティ | 結晶形予測装置、結晶形予測方法、ニューラルネットワークの製造方法、及びプログラム |
-
2022
- 2022-07-12 WO PCT/JP2022/027344 patent/WO2023008173A1/ja active Application Filing
- 2022-07-12 CN CN202280051390.8A patent/CN117678025A/zh active Pending
- 2022-07-12 JP JP2023538412A patent/JPWO2023008173A1/ja active Pending
-
2024
- 2024-01-10 US US18/408,658 patent/US20240144046A1/en active Pending
Also Published As
Publication number | Publication date |
---|---|
JPWO2023008173A1 (zh) | 2023-02-02 |
WO2023008173A1 (ja) | 2023-02-02 |
US20240144046A1 (en) | 2024-05-02 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109657805A (zh) | 超参数确定方法、装置、电子设备及计算机可读介质 | |
EP3739494A2 (en) | Method, apparatus, system, and program for optimizing solid electrolytes for li-ion batteries using bayesian optimization | |
US8635174B2 (en) | Information processing apparatus, observation value prediction method, and program | |
CN110568359A (zh) | 一种锂电池剩余寿命预测方法 | |
US20240311651A1 (en) | Method and apparatus for searching for neural network ensemble model, and electronic device | |
CN117434429B (zh) | 芯片的稳定性测试方法及相关装置 | |
CN109670255B (zh) | 一种时序参数聚类的典型仿真条件推荐方法 | |
CN114814592A (zh) | 锂电池健康状态估计与剩余使用寿命预测方法及设备 | |
CN109344969B (zh) | 神经网络系统及其训练方法以及计算机可读介质 | |
US20240144045A1 (en) | Search method, search system, recording medium, prediction model construction method, and prediction model construction device | |
CN105260371A (zh) | 一种特征选择方法及装置 | |
CN112232526A (zh) | 一种基于集成策略的地质灾害易发性评价方法及系统 | |
JP2021033544A (ja) | 学習データの精練方法及び計算機システム | |
CN115391561A (zh) | 图网络数据集的处理方法、装置、电子设备、程序及介质 | |
CN115936802A (zh) | 基于用户画像和序列建模的个性化营销方法、装置、设备和存储介质 | |
CN111538767A (zh) | 数据处理方法、装置、设备及存储介质 | |
Saraswathi et al. | Fast learning optimized prediction methodology (FLOPRED) for protein secondary structure prediction | |
CN117678025A (zh) | 探索方法、探索系统、程序、预测模型构建方法及预测模型构建装置 | |
CN105260626B (zh) | 蛋白质结构空间构象的全信息预测方法 | |
JP7487155B2 (ja) | 情報処理装置、プログラム、及び、情報処理方法 | |
CN116256639A (zh) | 车辆电池荷电状态的估计方法、装置及电子装置 | |
CN113010687B (zh) | 一种习题标签预测方法、装置、存储介质以及计算机设备 | |
CN114968824A (zh) | 一种基于链式多路径覆盖的测试方法与系统 | |
CN114741697A (zh) | 恶意代码分类方法、装置、电子设备和介质 | |
CN114706751A (zh) | 一种基于改进smote的软件缺陷预测方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |