CN117716431A - 探索方法、探索系统、程序、预测模型构建方法及预测模型构建装置 - Google Patents

探索方法、探索系统、程序、预测模型构建方法及预测模型构建装置 Download PDF

Info

Publication number
CN117716431A
CN117716431A CN202280051365.XA CN202280051365A CN117716431A CN 117716431 A CN117716431 A CN 117716431A CN 202280051365 A CN202280051365 A CN 202280051365A CN 117716431 A CN117716431 A CN 117716431A
Authority
CN
China
Prior art keywords
energy
initial
prediction model
atomic arrangement
unit
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202280051365.XA
Other languages
English (en)
Inventor
网井圭
大越昌树
藤井干也
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Intellectual Property Management Co Ltd
Original Assignee
Panasonic Intellectual Property Management Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Panasonic Intellectual Property Management Co Ltd filed Critical Panasonic Intellectual Property Management Co Ltd
Publication of CN117716431A publication Critical patent/CN117716431A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N5/00Computing arrangements using knowledge-based models
    • G06N5/02Knowledge representation; Symbolic representation
    • G06N5/022Knowledge engineering; Knowledge acquisition
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N7/00Computing arrangements based on specific mathematical models
    • G06N7/01Probabilistic graphical models, e.g. probabilistic networks
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16CCOMPUTATIONAL CHEMISTRY; CHEMOINFORMATICS; COMPUTATIONAL MATERIALS SCIENCE
    • G16C20/00Chemoinformatics, i.e. ICT specially adapted for the handling of physicochemical or structural data of chemical particles, elements, compounds or mixtures
    • G16C20/70Machine learning, data mining or chemometrics
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16CCOMPUTATIONAL CHEMISTRY; CHEMOINFORMATICS; COMPUTATIONAL MATERIALS SCIENCE
    • G16C60/00Computational materials science, i.e. ICT specially adapted for investigating the physical or chemical properties of materials or phenomena associated with their design, synthesis, processing, characterisation or utilisation
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02PCLIMATE CHANGE MITIGATION TECHNOLOGIES IN THE PRODUCTION OR PROCESSING OF GOODS
    • Y02P90/00Enabling technologies with a potential contribution to greenhouse gas [GHG] emissions mitigation
    • Y02P90/30Computing systems specially adapted for manufacturing

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Computing Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Software Systems (AREA)
  • Artificial Intelligence (AREA)
  • Data Mining & Analysis (AREA)
  • Evolutionary Computation (AREA)
  • General Physics & Mathematics (AREA)
  • Mathematical Physics (AREA)
  • Computational Linguistics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Medical Informatics (AREA)
  • Health & Medical Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Probability & Statistics with Applications (AREA)
  • Crystallography & Structural Chemistry (AREA)
  • Chemical & Material Sciences (AREA)
  • Databases & Information Systems (AREA)
  • Algebra (AREA)
  • Computational Mathematics (AREA)
  • Mathematical Analysis (AREA)
  • Mathematical Optimization (AREA)
  • Pure & Applied Mathematics (AREA)
  • Biomedical Technology (AREA)
  • Biophysics (AREA)
  • Molecular Biology (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

计算机执行下述步骤:取得作为材料的组成能够采取的三维空间中的原子配置的结构的多个初始结构的第1步骤(S103);对一部分初始结构实施结构最佳化,算出与被结构最佳化了的原子配置的结构对应的第1能量的第2步骤(S104);通过对其它初始结构使用预测模型,来预测与对其它初始结构实施了结构最佳化的情况下的原子配置的结构对应的第2能量的第3步骤(S106);基于第1能量和第2能量,提取显示极小值的第3能量的第4步骤(S107);以及输出第3能量、作为与第3能量对应的原子配置的结构的第1结构、或第3能量和第1结构的第5步骤(S108)。

Description

探索方法、探索系统、程序、预测模型构建方法及预测模型构 建装置
技术领域
本公开涉及用于探索关于材料的组成的原子配置的稳定结构的探索方法等。
背景技术
以往,开发了通过第一原理计算而求出稳定的原子配置结构的结构最佳化的技术(例如,参照非专利文献1)。
在非专利文献2中,公开了对原子配置结构的输入,使用机器学习而推定能量等特性值的方法。
现有技术文献
非专利文献
非专利文献1:Jensen,F.(2007).Introduction to computationalchemistry.John wiley&sons,383-389.
非专利文献2:Chen,C.,Ye,W.,Zuo,Y.,Zheng,C.,&Ong,S.P.(2019).Graphnetworks as a universal machine learning framework for molecules andcrystals.Chemistry of Materials,31(9),3564-3572.
发明内容
本公开提供可以有效率地探索关于材料的组成的原子配置的稳定结构的探索方法等。
本公开的一方案涉及的探索方法为用于探索关于材料的组成的三维空间中的原子配置的稳定结构的探索方法,计算机执行下述步骤:取得作为上述材料的组成能够采取的上述三维空间中的原子配置的结构的多个初始结构的第1步骤;对多个上述初始结构之中的一部分初始结构实施结构最佳化,算出与被结构最佳化了的原子配置的结构对应的第1能量的第2步骤;通过对多个上述初始结构之中的其它初始结构使用预测模型,来预测与对上述其它初始结构实施了结构最佳化的情况下的原子配置的结构对应的第2能量的第3步骤;基于上述第1能量和上述第2能量,提取显示极小值的第3能量的第4步骤;以及输出上述第3能量、作为与上述第3能量对应的原子配置的结构的第1结构、或上述第3能量和上述第1结构的第5步骤,上述预测模型以将任意的原子配置的结构作为输入、且将与对该结构实施了结构最佳化的情况下的结构对应的能量作为上述第2能量而输出的方式进行了机器学习。
另外,该包括的或具体的方案可以通过装置、系统、集成电路、计算机程序或计算机可读取的记录介质而实现,可以通过装置、系统、方法、集成电路、计算机程序和计算机可读取的记录介质的任意组合而实现。计算机可读取的记录介质包含例如CD-ROM(CompactDisc-Read Only Memory,光盘只读存储器)等非易失性的记录介质。
根据本公开,可以有效率地探索关于材料的组成的原子配置的稳定结构。
附图说明
图1为显示包含实施方式1涉及的探索系统的整体构成的框图。
图2为显示实施方式1涉及的被存储在材料数据库的数据的一例的图。
图3为显示实施方式1涉及的生成部生成初始结构的过程的一例的图。
图4为显示实施方式1涉及的生成部生成初始结构的过程的一例的图。
图5为显示实施方式1涉及的生成部生成初始结构的过程的一例的图。
图6为显示实施方式1涉及的生成部生成了的多个初始结构的一例的图。
图7A为显示实施方式1涉及的生成部生成了的初始结构的立体构型的一例的图。
图7B为显示实施方式1涉及的生成部生成了的初始结构的立体构型的另一例的图。
图8为显示实施方式1涉及的被存储在结构存储部的数据的一例的图。
图9为显示实施方式1涉及的采用算出部算出第1能量的过程的一例的图。
图10为显示实施方式1涉及的被存储在算出结果存储部的数据的一例的图。
图11为显示实施方式1涉及的采用学习部使预测模型进行机器学习的过程的一例的图。
图12为显示实施方式1涉及的采用预测部预测第2能量的过程的一例的图。
图13为显示实施方式1涉及的通过比较部而生成了的数据的一例的图。
图14为显示实施方式1涉及的预测部的预测精度的评价例的图。
图15为显示实施方式1涉及的验证了预测部的预测精度的结果的图。
图16为显示实施方式1涉及的验证了预测部的预测精度与学习用数据的比率的相关性的结果的图。
图17为显示实施方式1涉及的探索系统的动作例的流程图。
图18为显示包含实施方式2涉及的探索系统的整体构成的框图。
图19为显示实施方式2涉及的被存储在算出结果存储部的数据的一例的图。
图20为显示实施方式2涉及的采用学习部来使预测模型进行机器学习的过程的一例的图。
图21为显示实施方式2涉及的验证了预测部的预测精度的结果的图。
图22为显示实施方式2涉及的验证了预测部的预测精度与学习用数据集的比率的相关性的结果的图。
图23为显示实施方式2涉及的探索系统的动作例的流程图。
图24为显示包含实施方式3涉及的探索系统的整体构成的框图。
图25为显示实施方式3涉及的通过比较部而生成了的数据的一例的图。
图26为显示实施方式3涉及的探索系统的动作例的流程图。
图27为显示包含实施方式4涉及的探索系统的整体构成的框图。
图28为显示实施方式4涉及的探索系统的动作例的流程图。
具体实施方式
(本公开的认识)
在材料开发中,为了通过模拟而算出热力学特性或安全性等性质,需要求出物质各自中的热力学稳定的原子配置结构,即稳定结构。这里,稳定的原子配置结构可以通过结构最佳化而求出。因此,结构最佳化作为用于物质的解析或开发新物质的工具而被利用。在非专利文献1中,公开了采用第一原理计算的结构最佳化的方法。
为了求出未知的新物质中的热力学稳定的原子配置结构,进行对该新物质能够采取的成为候选的原子配置结构的结构最佳化。成为候选的原子配置结构通过将已知的物质的原子配置结构所包含的原子进行部分置换而获得。因此,根据置换哪个原子而获得多个候选结构。进而,关于多个候选结构各自,进行1次以上结构最佳化,算出被结构最佳化了的候选结构的能量、即总能量。进而,与所算出的能量之中的成为最小的能量对应的原子配置结构,即被结构最佳化了的候选结构被判断为该新物质中的热力学最稳定的原子配置结构。
这里,如果构成未知的新物质的原子数目增加,则能够置换的原子的数目也增加。其结果,候选结构的数目变得非常大,可能发生所谓的组合爆炸。在这样的情况下,如果关于全部候选结构执行结构最佳化,并且,执行算出能量的处理,则运算需要庞大的时间,因此有进行这些运算不现实这样的课题。
另一方面,近年来,提出了通过图神经网络进行对图结构的输入的回归或分类的方法。在该方法中,通过对由表示节点群与节点间的连接关系的边缘群构成的图结构的输入,进行卷积等运算从而学习与输出的对应关系。
其中,在非专利文献2中,提出了在关于材料的组成的原子配置结构中,将原子转换为节点,将键合转换为边缘,从原子配置结构预测能量等特性值的图神经网络模型。显示出通过该方法,可以构建从公开数据库所包含的原子配置结构以高精度预测能量等材料特性的模型。
另外,非专利文献1为公开结构最佳化的基本技术的现有技术文献,不是关于通过机器学习而使预测模型学习的公开。非专利文献2不过是公开了从原子配置结构预测材料特性的方法,不是关于探索稳定的原子配置结构的公开。
本申请的发明人等着眼于通过图神经网络而将原子配置结构与能量的关系相对应。进而,根据本申请的发明人等的研究,发现了可以由多个存在的材料的组成能够采取的成为候选的原子配置结构、比以往有效率地探索热力学稳定的原子配置结构的技术。由此,明确了可以减少运算成本、并且可以精度良好地探索稳定的原子配置结构。
即,本公开的一方案涉及的探索方法是用于探索关于材料的组成的三维空间中的原子配置的稳定结构的探索方法,计算机执行下述步骤:取得作为上述材料的组成能够采取的上述三维空间中的原子配置的结构的多个初始结构的第1步骤;对多个上述初始结构之中的一部分初始结构实施结构最佳化,算出与被结构最佳化了的原子配置的结构对应的第1能量的第2步骤;通过对多个上述初始结构之中的其它初始结构使用预测模型,来预测与对上述其它初始结构实施了结构最佳化的情况下的原子配置的结构对应的第2能量的第3步骤;基于上述第1能量和上述第2能量,提取显示极小值的第3能量的第4步骤;以及输出上述第3能量、作为与上述第3能量对应的原子配置的结构的第1结构、或上述第3能量和上述第1结构的第5步骤,上述预测模型以将任意的原子配置的结构作为输入、将与对该结构实施了结构最佳化的情况下的结构对应的能量作为上述第2能量而输出的方式进行了机器学习。
例如,在上述第1步骤中,在取得了n个(n为2以上的整数)上述初始结构的情况下,上述第2步骤中的上述一部分初始结构为m个(m为1≤m<n的整数)上述初始结构,上述第3步骤中的上述其它初始结构可以为(n―m)个上述初始结构。
由此,可以有效率地探索关于材料的组成的原子配置的稳定结构,易于减少运算成本。
上述第3能量可以为上述第1能量和上述第2能量的最小值。
由此,可以有效率地探索关于材料的组成的原子配置的最稳定的结构。
在上述第1步骤中,可以取得作为与上述材料的组成类似的已知材料的三维空间中的原子配置的结构的已知结构,基于上述已知结构,生成多个上述初始结构。例如,上述已知材料含有至少1种与上述材料的组成所含有的元素不同种类的元素,上述第1步骤可以包含将上述不同种类的元素置换为与上述材料的组成所含有的元素相同种类的元素的过程。例如,上述第1步骤可以包含将上述已知结构沿至少1维方向扩展的过程。
由此,通过使用已知结构,从而易于通过比较简易的处理而生成多个初始结构。
上述预测模型可以为使用包含上述初始结构作为输入数据、包含与该初始结构对应的上述第1能量作为正解数据的第1学习用数据集而进行了机器学习的模型。
由此,易于精度良好地预测与对被输入了的初始结构实施了结构最佳化的情况下的结构对应的能量。
上述预测模型可以为进一步使用包含上述被结构最佳化了的原子配置的结构作为输入数据、包含与该结构对应的上述第1能量作为正解数据的第2学习用数据集而进行了机器学习的模型。
由此,易于进一步精度良好地预测与在对被输入了的初始结构实施了结构最佳化的情况下的结构对应的能量。
上述第2步骤中的上述一部分初始结构的数目可以为多个上述初始结构的数目的90%以下。
由此,易于抑制运算成本,同时有效率地探索关于材料的组成的原子配置的稳定结构。
本公开的一方案涉及的探索系统为用于探索关于材料的组成的三维空间中的原子配置的稳定结构的探索系统,其具备:生成作为上述材料的组成能够采取的上述三维空间中的原子配置的结构的多个初始结构的生成部;对多个上述初始结构之中的一部分初始结构实施结构最佳化,算出与被结构最佳化了的原子配置的结构对应的第1能量的算出部;通过对多个上述初始结构之中的其它初始结构使用预测模型,来预测与对上述其它初始结构实施了结构最佳化的情况下的原子配置的结构对应的第2能量的预测部;以及输出上述第1能量和上述第2能量的输出部,上述预测模型以将任意的原子配置的结构作为输入、将与对该结构实施了结构最佳化的情况下的结构对应的能量作为上述第2能量而输出的方式进行了机器学习。
由此,可以有效率地探索关于材料的组成的原子配置的稳定结构,易于减少运算成本。
上述输出部可以输出基于上述第1能量和上述第2能量而被提取出的显示极小值的第3能量、作为与上述第3能量对应的原子配置的第1结构、或上述第3能量和上述第1结构。
由此,可以有效率地探索关于材料的组成的原子配置的最稳定的结构。
本公开的一方案涉及的程序为用于探索关于材料的组成的三维空间中的原子配置的稳定结构的程序,使计算机执行下述步骤:取得作为上述材料的组成能够采取的上述三维空间中的原子配置的结构的多个初始结构的第1步骤;对多个上述初始结构之中的一部分初始结构实施结构最佳化,算出与被结构最佳化了的原子配置的结构对应的第1能量的第2步骤;通过对多个上述初始结构之中的其它初始结构使用预测模型,来预测与对上述其它初始结构实施了结构最佳化的情况下的原子配置的结构对应的第2能量的第3步骤;以及输出上述第1能量和上述第2能量的第6步骤,上述预测模型以将任意的原子配置的结构作为输入、将与对该结构实施了结构最佳化的情况下的结构对应的能量作为上述第2能量而输出的方式进行机器学习。例如,使上述计算机进一步执行基于上述第1能量和上述第2能量而提取显示极小值的第3能量的第4步骤,在上述第6步骤中,可以进一步输出上述第3能量、作为与上述第3能量对应的原子配置的结构的第1结构、或上述第3能量和上述第1结构。
由此,可以有效率地探索关于材料的组成的原子配置的稳定结构,易于减少运算成本。
本公开的一方案涉及的预测模型构建方法是,计算机执行下述步骤:取得作为材料的组成能够采取的三维空间中的原子配置的结构的初始结构的第1步骤;以及使用包含上述初始结构作为输入数据、包含与对该初始结构实施结构最佳化而获得的原子配置的结构对应的能量作为正解数据的学习用数据集,以对任意的原子配置的结构的输入而输出与该结构被结构最佳化了的情况下的结构对应的能量的方式进行机器学习的第7步骤。
由此,可以构建能够有效率地探索关于材料的组成的原子配置的稳定结构,且易于减少运算成本的预测模型。
本公开的一方案涉及的预测模型构建装置具备:生成作为材料的组成能够采取的三维空间中的原子配置的结构的初始结构的生成部;以及使用包含上述初始结构作为输入数据、包含与对该初始结构实施结构最佳化而获得的原子配置的结构对应的能量作为正解数据的学习用数据集,以对任意的原子配置的结构的输入而输出与该结构被结构最佳化了的情况下的结构对应的能量的方式进行机器学习的学习部。
由此,可以构建能够有效率地探索关于材料的组成的原子配置的稳定结构,且易于减少运算成本的预测模型。
本公开的一方案涉及的探索方法是用于使用通过上述预测模型构建装置而进行了机器学习的预测模型,来探索上述关于材料的组成的上述三维空间中的原子配置的稳定结构的探索方法,计算机执行下述步骤:取得多个上述初始结构的第1步骤;通过对多个上述初始结构各自使用上述预测模型,来预测与对该初始结构实施了结构最佳化的情况下的原子配置的结构对应的能量的第8步骤;以及从被预测了的多个上述能量提取显示极小值的能量的第9步骤。
由此,可以有效率地探索关于材料的组成的原子配置的稳定结构,且易于减少运算成本。
本公开的一方案涉及的探索方法是用于使用通过上述预测模型构建装置而进行了机器学习的预测模型,来探索上述关于材料的组成的上述三维空间中的原子配置的稳定结构的探索方法,计算机执行下述步骤:取得多个上述初始结构的第1步骤;对多个上述初始结构之中的一部分初始结构实施结构最佳化,算出与被结构最佳化了的原子配置的结构对应的第1能量的第2步骤;通过对上述一部分初始结构之中的至少1个初始结构使用上述预测模型,来预测与对该初始结构实施了结构最佳化的情况下的原子配置的结构对应的第2能量的第10步骤;通过将上述第1能量与上述第2能量进行比较,来验证上述预测模型的预测精度的第11步骤。
由此,通过验证预测模型的预测精度,从而易于实现具有充分的预测精度的预测模型。
在上述第11步骤中的结果满足规定的条件的情况下,上述计算机可以进一步执行下述步骤:通过对多个上述初始结构之中的其它初始结构使用上述预测模型,来预测与对上述其它初始结构实施了结构最佳化的情况下的原子配置的结构对应的上述第2能量的第12步骤;以及基于上述第1能量和上述第2能量,提取显示极小值的第3能量的第13步骤。
由此,通过使用预测精度较高的预测模型,从而易于进一步有效率地探索关于材料的组成的原子配置的稳定结构。
也可以将本公开的探索方法或预测模型构建方法所包含的特征性处理作为使计算机执行的计算机程序而实现。进而,可以使这样的计算机程序经由CD-ROM等计算机可读取的非临时性记录介质或因特网等通信网络进行流通是不言而喻的。
以下,参照附图对实施方式具体地说明。
另外,以下说明的实施方式都显示本公开的包括的或具体的例子。以下实施方式中显示的数值、形状、构成要素、步骤、步骤的顺序等为一例,不限定本公开的主旨。关于以下实施方式中的构成要素之中的、显示最上位概念的独立权利要求中未记载的构成要素,作为任意的构成要素而被说明。在全部实施方式中,也可以将各内容组合。各图为示意图,不一定被严格地图示。在各图中,关于相同的构成构件附上相同符号。
本公开的实施方式涉及的探索系统可以以1个计算机包含全部构成要素的方式构成,也可以作为将多个构成要素分别分散于多个计算机的系统而构成。
(实施方式1)
(实施方式1:构成的说明)
以下,使用附图对本公开的实施方式1涉及的探索系统100(探索方法、或程序)详细地说明。实施方式1涉及的探索系统100(探索方法、或程序)为用于探索关于材料的组成的三维空间中的原子配置的稳定结构的系统(方法、或程序)。这里所谓的“稳定结构”,是作用于原子配置的结构(即,晶体结构)所包含的各原子的力成为阈值以下那样的结构,并且,是与结构对应的能量(总能量)成为最小的结构。另外,关于阈值,虽然用户能够适当设定,但可以为接近于零的值。原因是如果作用于各原子的力越接近于零,则结构在热力学上越稳定。
这里,实施方式1涉及的探索系统100(探索方法或程序)除了探索上述那样的稳定结构而对用户输出的方案以外,还能够包含输出为了用户探索上述那样的稳定结构而需要的数据的方案。即,探索稳定结构的过程可以不由探索系统100(探索方法或程序)完成。
图1为显示包含实施方式1涉及的探索系统100的整体构成的框图。探索系统100例如作为个人计算机或服务器等计算机而被构成。如图1所示那样,探索系统100具备取得部102、生成部103、算出部104、学习部105、预测部106、比较部107、和输出部108。作为探索系统100的周边的构成,有输入部101、材料数据库(DB)109、结构存储部110、算出结果存储部111、和预测模型存储部112。另外,探索系统100的周边的构成可以被包含于探索系统100的构成要素。探索系统100中的生成部103和学习部105也为预测模型构建装置的构成要素。
以下,对图1所示的各构成要素的详细内容进行描述。
(输入部101)
输入部101为接收用户的输入的输入接口,并且通过用户的输入而取得与探索对象的材料所具有的组成有关的信息,输出到取得部102。与组成有关的信息例如为以字符串形式表示的组成式信息。组成式信息作为一例能够被表现为“Li12Mn6Ni6O24”。即,在该情况下,显示探索对象的材料所具有的组成为由Li(锂)原子12个、Mn(锰)原子6个、Ni(镍)原子6个、O(氧)原子24个构成的组成。输入部101例如包含键盘、触摸传感器、触摸板或鼠标等而被构成。
(取得部102)
取得部102从输入部101取得组成式信息,从材料数据库109取得与该组成式信息所包含的探索对象的材料的组成类似的已知材料的原子配置的结构。这里所谓“类似”,是指例如探索对象的材料的组成和已知材料的组成的各自所包含的元素仅一部分不同。所谓“类似”,是指已知材料的组成包含探索对象的材料的组成所包含的至少1种元素。所谓“类似”,是指通过将已知材料的原子配置的结构进行扩展处理和置换处理,从而能够构成探索对象的材料的组成。
材料数据库109预先存储包含1种以上材料各自的组成和结构等的已知材料数据。材料数据库109例如由硬磁盘驱动器、或非易失性的半导体存储器等记录介质构成。另外,材料数据库109可以为例如MaterialsProject等公开数据库。后述的结构存储部110、算出结果存储部111、和预测模型存储部112也为同样的构成。已知材料数据包含例如在晶体学信息通用数据格式(Crystallographic Information File:CIF)中被记述了的信息。然而,信息的记述形式不限定于CIF的数据格式,只要是组成式、晶体结构、和晶格矢量这样的采用第一原理计算等的结构最佳化的运算能够实施的记述形式,就可以为任何记述形式。
图2为显示实施方式1涉及的被存储在材料数据库109的数据的一例的图。在本公开的材料数据库109中,存储有以被称为CIF的形式记述了的数据。在CIF中,记述显示材料的组成的组成式、单位晶格矢量的长度、原子彼此相交的角度、和单位晶格中的原子配置等。对于图2所示的例子,显示出与材料“Li4C2O6”、材料“Li6Ni6O12”有关的原子配置信息。在图2中,左列表示显示材料的组成的组成式,右列表示关于材料的组成的原子配置。在原子配置中,记述了各原子(例如如果为Li原子,则为“Li0”~[Li3]的共计4个原子)的原子坐标(x坐标、y坐标、z坐标)等。另外,“Li0”的“0”等数字不过是为了区别相同种类的元素而被附上的。
取得部102将从输入部101取得了的组成式信息、和从材料数据库109取得了的已知材料数据输出到生成部103。
(生成部103)
生成部103对从取得部102取得了的已知材料的原子配置的结构(已知结构)执行扩展处理和置换处理。由此,生成部103生成表示相同地从取得部102取得了的组成式信息所包含的探索对象的材料的组成的多个初始结构。即,生成部103(在第1步骤中)取得作为材料的组成能够采取的三维空间中的原子配置的结构的多个初始结构。这里所谓“初始结构”,是与探索对象的材料的组成相同的组成,并且为关于探索对象的材料的组成的原子配置的任意的结构。即,初始结构的至少一部分与稳定结构不同。进一步说,生成部103(在第1步骤中)取得作为与材料的组成类似的已知材料的三维空间中的原子配置的结构的已知结构,基于已知结构而生成多个初始结构。
图3~图5分别为显示实施方式1涉及的生成部103生成初始结构的过程的一例的图。在图3~图5各自中,(a)表示初始结构的CIF,(b)表示通过该初始结构的CIF而表示的晶体结构的单位晶格,即原子配置。这里,作为一例,已知材料的组成式为Li6Mn6O12,探索对象的材料的组成式为Li12Mn6Ni6O24。在图3~图5各自的(b)中,最小的球体表示O原子,未施加剖面线的球体表示Li原子,为与Li原子同等程度大小的球体且施加了剖面线的球体表示Ni原子,被涂抹得黑的球体表示Mn原子。这些表达方式在后述图7A、图7B、和图11中也同样。
图3表示关于已知结构的CIF和原子配置。生成部103首先通过将已知结构扩展从而生成Li12Ni12O24的配置结构。这里所谓“扩展”,是指将扩展对象的结构(这里为已知结构)以沿三维方向(x方向、y方向、z方向)的至少任一方向重复的方式进行复制。即,生成部103(第1步骤)包含将已知结构沿至少1维方向扩展的过程。
图4表示关于将已知结构扩展了的结构的CIF和原子配置。图4的(b)所示的结构为将图3的(b)所示的结构重复了2次的结构。如图4所示那样,通过已知结构被扩展,从而各原子的数目与探索对象的材料的组成所包含的各原子的数目变为相同。例如,如果为Li原子,则在已知结构中为“Li0”~“Li5”共计6个,与此相对,在扩展后的结构中变为“Li0”~“Li11”共计12个,与探索对象的材料的组成中的Li原子的数目变为相同。
接下来,生成部103将被扩展了的结构(Li12Ni12O24)的Ni原子12个之中的6个Ni原子置换为Mn原子。即,已知材料的组成含有至少1种与探索对象的材料的组成所含有的元素不同种类的元素。进而,生成部103(取得步骤)包含将不同种类的元素置换为与探索对象的材料的组成所含有的元素相同种类的元素的过程。
图5表示关于置换后的结构的CIF和原子配置。在图5中,被扩展了的结构中的共计12个Ni原子之中的6个“Ni18”~“Ni23”被置换为6个“Mn18”~“Mn23”。如图5所示那样,通过被扩展了的结构所包含的一部分元素被置换,从而置换后的结构所包含的各元素与探索对象的材料的组成所包含的各元素变为相同。
这里,如图6、图7A、和图7B所示那样,置换后的结构根据将哪个Ni原子置换为Mn原子而被认为有多个。图6为显示实施方式1涉及的生成部103生成了的多个初始结构的一例的图。图7A为显示实施方式1涉及的生成部103生成了的初始结构的立体构型的一例的图,图7B为显示实施方式1涉及的生成部103生成了的初始结构的立体构型的另一例的图。
图6的(a)表示将“Ni18”~“Ni23”置换为“Mn18”~“Mn23”的情况下的结构。图6的(b)表示将“Ni12”~“Ni17”置换为“Mn12”~“Mn17”的情况下的结构。图6的(c)表示将“Ni13”、“Ni15”、“Ni17”、“Ni19”、“Ni21”、“Ni23”置换为“Mn13”、“Mn15”、“Mn17”、“Mn19”、“Mn21”、“Mn23”的情况下的结构。在实施方式中,生成部103生成Li12Mn6Ni6O24能够采取的从12个Ni原子之中选择6个而置换为Mn原子的组合的数目,即12C6=924个初始结构。
生成部103将生成了的多个初始结构输出到结构存储部110。另外,关于生成了的多个初始结构,可以将生成了的全部初始结构输出到结构存储部110,从对称性的观点考虑,可以将同等的结构使用现有的程序等进行筛选,仅输出被挑选出的初始结构。
结构存储部110存储在生成部103被生成了的多个初始结构。这里,各初始结构的数据与材料数据库109同样地,以组成式、晶体结构、和晶格矢量这样的采用第一原理计算等的结构最佳化的运算能够实施的记述形式被存储。图8为显示实施方式1涉及的被存储在结构存储部110的数据的一例的图。在图8中,左列表示为了区别各初始结构而被分配的初始结构ID(Identifier),右列表示初始结构的原子配置。
(算出部104)
如图9所示那样,算出部104从结构存储部110取得初始结构的一部分,对取得了的初始结构执行结构最佳化。算出部104执行算出与通过反复进行结构最佳化而获得的最终结构对应的能量(第1能量)的处理。图9为显示实施方式1涉及的采用算出部104算出第1能量的过程的一例的图。
即,算出部104(在第2步骤中)对多个初始结构之中的一部分初始结构实施结构最佳化,算出与被结构最佳化了的原子配置的结构对应的第1能量。这里所谓“第1能量”,既有显示与通过反复进行结构最佳化而获得的最终结构对应的能量的情况,也有显示与还未达到最终结构的中间结构对应的能量的情况。在实施方式中,算出部104例如使用VASP(维也纳从头计算模拟包,Vienna Ab initio Simulation Package)等第一原理计算包,执行结构最佳化和算出与最终结构对应的第1能量的处理。本公开中的“能量”可以是指“势能”。
这里,所谓“最终结构”,是通过对初始结构实施结构最佳化而获得的结构,并且是作用于结构所包含的各原子的力成为阈值以下那样的结构。所谓“中间结构”,是通过对初始结构实施结构最佳化而获得的结构,并且是作用于结构所包含的至少1个以上原子的力高于阈值的结构,即还未达到最终结构的结构。
算出部104在结构最佳化中,算出作用于处理对象的结构所包含的各原子的力F,探索在各原子中算出了的力F的大小成为阈值以下的结构(即,最终结构)。阈值如已经描述地那样,可以为接近于零的值。具体而言,算出部104在通过实施结构最佳化而获得的结构中,在作用于至少1个以上原子的力F的大小高于阈值的情况下,沿施加力F的方向移动各原子,以力F变小的方式调整各原子的位置。算出部104将算出上述各原子的力F的处理、和调整各原子的位置的处理作为1次的结构最佳化并将其反复进行,获得了在全部原子中力F的大小成为阈值以下的结构(即,最终结构)的情况下,结束结构最佳化。进而,算出部104算出与所得的最终结构对应的能量、即最终能量。
这里,在基于密度泛函理论(Density Functional Theory:DFT)的第一原理计算中,为了算出作用于各原子的力F,需要例如数十秒~数分钟左右的时间。在初始结构达到最终结构之前,需要执行例如数次~数十次左右调整各原子的位置的处理。因此,算出部104为了关于1个初始结构从初始结构获得最终结构,需要将需要数十秒~数分钟左右的时间的结构最佳化反复数次~数十次左右,作为整体而需要数十分钟~数小时左右的时间。
算出部104将通过初始结构、对该初始结构反复实施结构最佳化而获得的最终结构、和算出了的与最终结构对应的最终能量输出到算出结果存储部111。
算出结果存储部111存储在算出部104被算出了的最终能量、和对应的初始结构的组。图10为显示实施方式1涉及的被存储在算出结果存储部111的数据的一例的图。在图10中,左列表示初始结构ID,正中的列表示初始结构的原子配置,右列表示与通过对初始结构实施结构最佳化而获得的最终结构对应的最终能量。这样,算出结果存储部111只要至少存储初始结构、与最终结构的最终能量的组即可。在实施方式1中,算出结果存储部111进一步存储最终结构的原子配置。
(学习部105)
学习部105从算出结果存储部111取得初始结构、和最终结构的最终能量,使用取得了的初始结构和最终能量而学习预测模型。这里,关于预测模型中学习的输入输出的组,作为一例,输入为初始结构,输出为最终能量。
即,学习部105(在第7步骤中)使用学习用数据集,以对任意的原子配置的结构(这里,初始结构)的输入而输出与该结构被结构最佳化了的情况下的结构(这里,最终结构)对应的能量的方式使预测模型进行机器学习。学习用数据集包含初始结构作为输入数据、且包含与对该初始结构实施结构最佳化而获得的原子配置的结构(这里,最终结构)对应的能量作为正解数据。
在实施方式中,预测模型由以图结构作为输入的图神经网络构成。图神经网络例如为CGCNN(晶体图卷积神经网络,Crystal Graph Convolutional Neural Network)、或MEGNet(材质图网络,Material Graph Network)等。在实施方式中,预测模型由MEGNet构成。MEGNet为不仅以节点(节点/顶点)和边缘(枝/边)作为特征量,而且以表示作为对象的系统整体的特征的全局状态量进一步作为特征量的图神经网络。
图11为显示实施方式1涉及的采用学习部105使预测模型进行机器学习的过程的一例的图。学习部105首先将图11的(a)所示那样的初始结构的各原子的原子坐标和种类转换为图11的(b)所示那样的图结构。在图结构中,节点与初始结构的各原子对应,边缘与初始结构的各原子间的键对应。接下来,学习部105将转换了的图结构输入到图11的(c)所示那样的图神经网络。接下来,学习部105将从图神经网络被输出的图11的(d)所示的最终能量的预测值、与作为正解数据的最终能量进行比较。进而,学习部105如果从图神经网络被输出的最终能量的预测值与作为正解数据的最终能量背离,则更新图神经网络的权重。这样地操作,学习部105使用多个学习用数据集,通过教师指导学习而使预测模型进行机器学习。
学习部105将机器学习完成了的预测模型,即学习完的模型输出到预测部106和预测模型存储部112。该机器学习完成了的预测模型以将任意的原子配置的结构(这里,初始结构)作为输入、将与对该结构实施了结构最佳化的情况下的结构(这里,最终结构)对应的能量作为后述第2能量而输出的方式进行了机器学习。该预测模型为使用包含初始结构作为输入数据、包含与该初始结构对应的第1能量(这里,最终能量)作为正解数据的第1学习用数据集而进行了机器学习的模型。
预测模型存储部112关于在学习部105进行了机器学习的预测模型,存储图神经网络的结构和权重。
(预测部106)
预测部106从结构存储部110取得未算出最终能量的初始结构。进而,预测部106通过在从学习部105取得了的预测模型,即学习完的预测模型输入该初始结构,来预测该初始结构的最终能量。
这里所谓“未算出最终能量的初始结构”,是指多个初始结构之中的不是在算出部104算出了能量的一部分初始结构的结构,为其它初始结构。即,预测部106(在第3步骤中)通过对多个初始结构之中的其它初始结构使用预测模型,来预测与对其它初始结构实施了结构最佳化的情况下的原子配置的结构对应的第2能量。这里,第2能量为与对其它初始结构实施了结构最佳化的情况下的最终结构对应的最终能量的预测值。
图12为显示实施方式1涉及的采用预测部106预测第2能量的过程的一例的图。预测部106将初始结构转换为图结构,将转换了的初始结构输入到预测模型。在图12中,省略了将初始结构转换为图结构的过程的图示。由此,预测模型输出与对被输入的初始结构实施了结构最佳化的情况下的最终结构对应的最终能量的预测值,即第2能量。
即,在非专利文献2所公开那样的预测模型中,输出与输入了的初始结构对应的能量的预测值,与此相对,在实施方式1涉及的预测模型中,输出与对输入了的初始结构实施了结构最佳化的情况下的结构,即中间结构或最终结构对应的能量的预测值。进而,虽然也与预测模型的预测精度有关,但预测模型输出的能量的预测值相当于与算出部104实际上对初始结构实施结构最佳化而获得的结构对应的能量。
因此,在实施方式1中,通过使用预测模型,从而即使不对初始结构执行数次~数十次结构最佳化,也能够取得与被结构最佳化了的结构(例如,中间结构或最终结构)对应的能量。因此,在实施方式1中,可以某种程度上省略关于结构最佳化的运算,因此能够减少运算成本。
预测部106将初始结构、和与该初始结构对应的最终能量的预测值输出到比较部107。
(比较部107)
比较部107从预测部106取得初始结构和最终能量的预测值的组。比较部107从算出结果存储部111取得最终结构和最终能量的组。进而,比较部107将初始结构和最终能量的预测值的组、与最终结构和最终能量的组排列而生成列表。
图13为显示实施方式1涉及的通过比较部107而生成了的数据的一例的图。在图13中,左列表示初始结构或最终结构的原子配置,正中的列表示与最终结构对应的最终能量,右列表示与初始结构对应的最终能量的预测值。比较部107基于列表将最终能量和最终能量的预测值以规定的顺序重新排序。在实施方式1中,比较部107从能量最小的值起依次将最终能量和最终能量的预测值重新排序。这样的最终能量和最终能量的预测值的重新排序相当于从最终能量和最终能量的预测值提取最小的值,换言之为极小值或最小值的处理。
即,比较部107(在第4步骤中)基于第1能量和第2能量,提取显示极小值的第3能量。第1能量为从算出结果存储部111取得了的最终能量,第2能量为从预测部106取得了的最终能量的预测值。这里,极小值为第1能量和第2能量之中的最小值。即,第3能量为第1能量和第2能量的最小值。
比较部107将如上述那样将最终能量和最终能量的预测值重新排序了的列表输出到输出部108。
(输出部108)
输出部108将比较部107输出了的列表所包含的初始结构和最终能量的预测值、以及最终结构和最终能量按照上述规定的顺序,即从能量最小的结构起依次显示于显示器。即,输出部108(在第5步骤中)输出第3能量、作为与第3能量对应的原子配置的结构的第1结构、或第3能量和第1结构。
另外,输出部108可以仅将第3能量和与第3能量对应的原子配置的结构显示于显示器。输出部108也可以将通过比较部107将最终能量和最终能量的预测值重新排序前的列表显示于显示器。即,输出部108(在第6步骤中)可以输出第1能量和第2能量。在该情况下,不需要采用比较部107的上述提取处理(第4步骤)。
(实施方式1:预测精度的验证)
以下,对实施方式1涉及的预测部106的预测精度的验证进行说明。该验证以关于具有由包含Li原子和Mn原子,进一步包含Ni原子或O原子之中的至少1种元素的48个原子构成的21种组成的物质各自,查明预测部106是否可以预测稳定结构作为目的。
首先,在验证中,关于上述具有21种组成的物质,准备了共计1086组初始结构与最终能量的组。即,关于共计1086个初始结构各自,实施结构最佳化而获得最终结构,算出了与所得的最终结构对应的最终能量。进而,将共计1086组之中的、作为整体的30%的328组设为验证用数据(测试数据),将作为剩下的70%的758组设为学习用数据(训练数据)。
关于学习用数据,通过作为包含初始结构作为输入数据、包含最终能量作为正解数据的学习用数据集而使用,从而进行了预测模型的机器学习。进而,使用进行了机器学习的预测模型,预测了验证用数据的最终能量。即,通过将验证用数据所包含的初始结构输入到进行了机器学习的预测模型,从而取得了与从预测模型被输出的该初始结构对应的最终能量的预测值。
这里,作为预测精度的评价指标,考虑实际上对多个初始结构各自实施结构最佳化而获得的多个最终结构之中的被认为最稳定的原子配置的结构在预测模型中被预测为第几稳定的结构。由此,可以评价是否能够进行使用了该预测模型的筛选。
图14为显示实施方式1涉及的预测部106的预测精度的评价例的图。在图14中,从最左列起依次表示初始结构、与初始结构对应的最终能量的正解值、与初始结构对应的最终能量的预测值、正解值的位次、和预测值的位次。这里所谓“最终能量的正解值”,为与对初始结构实际上实施结构最佳化而获得的最终结构对应的最终能量。这里所谓“最终能量的预测值”,为通过将初始结构输入到预测模型,从而从预测模型输出的最终能量的预测值。这里所谓“位次”,是将最终能量的正解值或最终能量的预测值最小的最终结构作为1位的情况下的位次。
在图14所示的例子中,实际上实施结构最佳化而获得的被认为最稳定的原子配置的结构在预测部106中被预测为第2稳定的原子配置的结构。
图15为显示实施方式1涉及的验证了预测部106的预测精度的结果的图。在图15中,从最左列起依次表示物质的组成式、关于该物质的学习用数据的数目、关于该物质的验证用数据的数目、和位次。这里所谓“位次”,表示关于该物质的验证用数据之中的被认为实际上最稳定的原子配置的结构在预测部106被预测为第几稳定的结构。
这里,验证用数据的数目越多,则越担心采用预测部106的预测精度的降低。然而,例如关于Li14Mn5Ni5O24,52组验证用数据之中的被认为实际上最稳定的原子配置的结构在预测部106中被预测为第3稳定的结构。例如关于Li15Mn5Ni4O24,78组验证用数据之中的被认为实际上最稳定的原子配置的结构在预测部106中被预测为第10稳定的结构。
如上述那样,由这些结果可知,预测部106关于具有任意组成的物质,都可以将被认为实际上最稳定的原子配置的结构预测为以关于该物质的验证用数据整体的20%以内的位次稳定的结构。即,可知即使验证用数据的数目变多,采用预测部106的预测精度也几乎不降低。这里,预测部106可以关于具有任意组成的物质,都可以将被认为实际上最稳定的原子配置的结构预测为以关于该物质的验证用数据整体的17%以内、进一步13%以内的位次稳定的结构。
图16为显示实施方式1涉及的验证了预测部106的预测精度与学习用数据的比率的相关性的结果的图。具体而言,图16为显示关于具有组成Li14Mn5Ni5O24的物质,一边变更学习用数据的比率一边验证了预测部106的预测精度的情况下的结果的图。这里所谓“学习用数据的比率”,是关于具有组成Li14Mn5Ni5O24的物质的学习用数据的数目相对于学习用数据和验证用数据整体的数目的比例,其以百分率表示。在图16中,从最左列起依次表示关于该物质的学习用数据的比率、关于该物质的学习用数据的数目、关于该物质的验证用数据的数目、位次、和关于全部物质的学习用数据的合计数。这里所谓“位次”,表示关于该物质的验证用数据之中的被认为实际上最稳定的原子配置的结构在预测部106中被预测为第几稳定的结构。
如图16所示那样,即使减少学习用数据的比率,预测部106的预测精度的降低也几乎未出现。进而,在使学习用数据的比率为5%的情况下,137组验证用数据之中的被认为实际上最稳定的原子配置的结构也在预测部106中被预测为第3稳定的结构。
(实施方式1:动作的说明)
接下来,对探索系统100的动作进行说明。
(流程图)
图17为显示实施方式1涉及的探索系统100的动作例的流程图。
(步骤S101)
输入部101通过用户的输入而取得组成式信息,将取得了的组成式信息输出到取得部102。
(步骤S102)
取得部102从材料数据库109取得与组成式信息所包含的探索对象的材料的组成类似的已知材料的原子配置的结构,将取得了的类似的已知结构输出到生成部103。
(步骤S103)
生成部103对通过步骤S102而被取得了的已知结构的原子配置的结构执行扩展处理和置换处理。由此,生成部103生成表示上述组成式信息所包含的探索对象的材料的组成的多个初始结构,输出到结构存储部110。
(步骤S104)
算出部104对通过步骤S103而生成了的多个初始结构之中的一部分初始结构执行结构最佳化,算出与通过实施结构最佳化而获得的最终结构对应的最终能量。进而,算出部104将算出结果输出到算出结果存储部111。这里,在生成部103(第1步骤)中,在取得了n个(n为2以上的整数)初始结构的情况下,算出部104(第2步骤)中的一部分初始结构为m个(m为1<m<n的整数)初始结构。这里,“m”为“n”的90%以下的数。“m”可以为“n”的1%以上且90%以下的数。即,算出部104(第2步骤)中的一部分初始结构的数目为多个初始结构的数目的90%以下。
(步骤S105)
学习部105将通过步骤S104而算出了的最终能量与初始结构的组作为学习用数据集,进行由图神经网络构成的预测模型的机器学习。进而,学习部105将机器学习后的预测模型输出到预测部106和预测模型存储部112。这里,学习用数据集的数目与一部分初始结构的数目相同,为m个。
(步骤S106)
预测部106从结构存储部110取得未算出最终能量的初始结构,即多个初始结构之中的其它初始结构。进而,预测部106通过在步骤S105中进行了机器学习的预测模型,而算出与其它初始结构对应的最终能量的预测值。这里,其它初始结构的数为从多个初始结构除去了一部分初始结构而得的数。即,预测部106(第3步骤)中的其它初始结构为(n-m)个初始结构。
另外,在实施方式1中,预测模型为通过步骤S105而进行了机器学习的预测模型,但也可以为从预测模型存储部112取得的预先学习完的其它预测模型。
(步骤S107)
比较部107生成将通过步骤S105而算出了的最终能量、与通过步骤S106而被算出了的最终能量的预测值从能量最小的值起依次重新排序了的列表,将生成了的列表输出到输出部108。即,比较部107从最终能量和最终能量的预测值提取显示最小值的能量。
(步骤S108)
输出部108通过将在步骤S107中生成了的列表所包含的初始结构和最终能量的预测值、以及最终结构和最终能量从能量最小的结构起依次显示于显示器而输出。
这样,在实施方式1中,通过不对全部初始结构实施结构最佳化,而仅对一部分初始结构实施结构最佳化,对剩下的其它初始结构使用预测模型,从而省略了关于结构最佳化的运算。因此,在实施方式1中,与对全部初始结构实施了结构最佳化的情况下同样地,能够探索新物质中的被认为热力学最稳定的原子配置的结构,并且,能够某种程度上省略探索所需要的运算。即,在实施方式1中,与对全部初始结构实施结构最佳化的情况进行比较,可以减少运算成本,可以有效率地探索关于材料的组成的原子配置的稳定结构。
(实施方式2)
以下,使用附图对本公开的实施方式2涉及的探索系统200(探索方法、或程序)详细地说明。实施方式2涉及的探索系统200在使预测模型进行机器学习时,在不仅使用初始结构而且使用中间结构和最终结构方面,与实施方式1涉及的探索系统100不同。另外,在本实施方式中,对与实施方式1相同的构成要素附上相同的符号,省去说明。
图18为显示实施方式2涉及的包含探索系统200的整体构成的框图。如图18所示那样,探索系统200具备取得部102、生成部103、算出部204、学习部205、预测部106、比较部107、和输出部108。作为探索系统200的周边的构成,有输入部101、材料数据库(DB)109、结构存储部110、算出结果存储部211、和预测模型存储部212。另外,探索系统200的周边的构成可以被包含于探索系统200的构成要素。探索系统200中的生成部103和学习部205也为预测模型构建装置的构成要素。
以下,对图18所示的各构成要素的详细内容进行描述。另外,关于除算出结果存储部211、预测模型存储部212、算出部204、和学习部205以外的各构成要素,由于与实施方式1相同,因此省略说明。
(算出部204)
算出部204从结构存储部110取得初始结构的一部分,对取得了的初始结构执行结构最佳化。算出部104执行算出与通过反复进行结构最佳化而获得的最终结构对应的能量(第1能量)的处理。
算出部204将初始结构、通过对该初始结构反复执行结构最佳化而获得的最终结构、和算出了的与最终结构对应的最终能量输出到算出结果存储部211。进而,在实施方式2中,算出部204将每次对该初始结构实施结构最佳化而获得的中间结构都输出到算出结果存储部211。
算出结果存储部211存储通过算出部204算出了的最终能量、对应的初始结构、对应的中间结构、和对应的最终结构的组。图19为显示实施方式2涉及的被存储在算出结果存储部211中的数据的一例的图。在图19中,左列表示初始结构ID,正中的列表示每次实施结构实施化而获得的中间结构的原子配置和最终结构的原子配置,右列表示与最终结构对应的最终能量。另外,在图19中,省略了初始结构的原子配置的图示。
(学习部205)
学习部205从算出结果存储部211取得初始结构、中间结构、最终结构、和最终结构的最终能量,使用它们而学习预测模型。
图20为显示实施方式2涉及的采用学习部205使预测模型进行机器学习的过程的一例的图。如图20所示那样,在实施方式2中,学习用数据集所包含的输入数据不仅包含初始结构,而且进一步包含每次实施结构最佳化而获得的中间结构和最终结构。
即,在实施方式2中,学习部205不仅使用包含初始结构作为输入数据、且包含最终能量作为正解数据的第1学习用数据集,而且进一步使用包含中间结构或最终结构作为输入数据、且包含最终能量作为正解数据的第2学习用数据集,使预测模型进行机器学习。因此,在实施方式2中,预测模型为除了第1学习用数据集以外,进一步使用包含被结构最佳化了的原子配置的结构,即中间结构或最终结构作为输入数据,且包含与该结构对应的第1能量、即最终能量作为正解数据的第2学习用数据集而进行了机器学习的模型。另外,采用学习部205的预测模型的机器学习的处理的详细内容由于与实施方式1同样,因此省略说明。
学习部205将机器学习完成了的预测模型,即学习完的模型输出到预测部106和预测模型存储部212。
预测模型存储部212关于通过学习部205而进行了机器学习的预测模型,存储图神经网络的结构和权重。
(实施方式2:预测精度的验证)
以下,对实施方式2涉及的预测部106的预测精度的验证进行说明。该验证与实施方式1中的验证同样地,以关于具有由包含Li原子和Mn原子,进一步包含Ni原子或O原子之中的至少1种元素的48个原子构成的21种组成的物质各自,查明预测部106是否可以预测稳定结构作为目的。
验证的内容由于基本上为与实施方式1中的验证相同的内容,因此关于相同的内容省略说明。实施方式2中的验证在预测模型的机器学习所使用的学习用数据集不仅包含上述第1学习用数据集,而且进一步包含上述第2学习用数据集方面,与实施方式1中的验证不同。
图21为显示实施方式2涉及的验证了预测部106的预测精度的结果的图。在图21中,关于各列表示什么,与实施方式1的图15同样,因此这里省略说明。
这里,验证用数据的数目越多,则越担心采用预测部106的预测精度的降低。然而,例如关于Li14Mn5Ni5O24,52组验证用数据之中的被认为实际上最稳定的原子配置的结构在预测部106中被预测为第5稳定的结构。例如关于Li15Mn5Ni4O24,78组验证用数据之中被认为实际上最稳定的原子配置的结构在预测部106中也被预测为第10稳定的结构。
如上述那样,由这些结果可知,预测部106关于具有任意组成的物质,都可以将被认为实际上最稳定的原子配置的结构预测为以关于该物质的验证用数据整体的20%以内的位次稳定的结构。即,可知即使验证用数据的数变多,采用预测部106的预测精度也几乎不降低。这里,预测部106可以关于具有任意组成的物质,都可以将被认为实际上最稳定的原子配置的结构预测为以关于该物质的验证用数据整体的17%以内、进一步13%以内的位次稳定的结构。
图22为显示实施方式2涉及的验证了预测部106的预测精度与学习用数据的比率的相关性的结果的图。具体而言,图22为显示关于具有组成Li14Mn5Ni5O24的物质,一边变更学习用数据的比率一边验证了预测部106的预测精度的情况下的结果的图。在图22中,关于各列表示什么,与实施方式1的图16同样,因此这里省略说明。
如图22所示那样,即使减少学习用数据的比率,预测部106的预测精度的降低也几乎不出现。进而,在实施方式2中,在使学习用数据的比率为1%的情况下,147组验证用数据之中的被认为实际上最稳定的原子配置的结构在预测部106中被预测为第3稳定的结构。与此相对,在实施方式1中,在学习用数据的比率为1%的情况下,被认为实际上最稳定的原子配置的结构在预测部106中被预测为第12稳定。即,在实施方式2中,通过进一步使用包含被结构最佳化了的原子配置的结构,即中间结构或最终结构作为输入数据的学习用数据集而使预测模型进行机器学习,从而可以认为即使在学习用数据的比率低的情况下,也能够进行高精度的预测。
(实施方式2:动作的说明)
接下来,对探索系统200的动作进行说明。
(流程图)
图23为显示实施方式2涉及的探索系统200的动作例的流程图。步骤S201~S204、和步骤S206~S208的处理由于分别与图17所示的步骤S101~S104、和S106~S108的处理相同,因此省略说明。即,除步骤S205以外,与实施方式1涉及的探索系统100的处理的整体流程相同。
(步骤S205)
学习部205将通过步骤S204算出了的最终能量与初始结构的组、和该最终能量与被结构最佳化了的结构的组作为学习用数据集,进行由图神经网络构成的预测模型的机器学习。这里所谓“被结构最佳化了的结构”,是中间结构或最终结构。进而,学习部205将机器学习后的预测模型输出到预测部106和预测模型存储部212。
这样,在实施方式2中,进一步使用包含被结构最佳化了的原子配置的结构,即中间结构或最终结构作为输入数据的学习用数据集而使预测模型进行机器学习。因此,在实施方式2中,与实施方式1进行比较,易于进一步精度良好地预测与对被输入的初始结构实施了结构最佳化的情况下的结构对应的能量。
(实施方式3)
以下,使用附图对本公开的实施方式3涉及的探索系统300(探索方法、或程序)详细地说明。实施方式3涉及的探索系统300在预测与对初始结构实施了结构最佳化的情况下的原子配置的结构对应的第2能量时,使用预先进行了机器学习的关于已知结构的预测模型方面,与实施方式1涉及的探索系统100或实施方式2涉及的探索系统200不同。另外,在本实施方式中,对与实施方式1或实施方式2相同的构成要素附上相同的符号,省去说明。
图24为显示实施方式3涉及的包含探索系统300的整体构成的框图。如图24所示那样,探索系统300具备取得部102、生成部103、预测部306、比较部307、和输出部108,不具备学习部105或学习部205。作为探索系统300的周边的构成,有输入部101、材料数据库(DB)109、结构存储部110、和预测模型存储部312。另外,探索系统300的周边的构成可以被包含于探索系统300的构成要素。
以下,对图24所示的各构成要素的详细内容进行描述。另外,关于除预测模型存储部312、预测部306、和比较部307以外的各构成要素,由于与实施方式1相同,因此省略说明。
(预测模型存储部312)
预测模型存储部312关于预先进行了机器学习的学习完的预测模型,存储图神经网络的结构和权重。这里被采用的预测模型例如为关于与探索对象的材料的组成类似的已知材料的已知结构的预测模型、或通用地被学习了的预测模型。在实施方式3中,预测模型为前者的预测模型,即关于已知结构的预测模型。该预测模型例如使用包含已知结构作为输入数据,且包含与对该已知结构实施结构最佳化而获得的最终结构对应的最终能量作为正解数据的学习用数据集而预先进行机器学习。
(预测部306)
预测部306从结构存储部110取得初始结构。进而,预测部306通过在从预测模型存储部312取得了的学习完的预测模型中输入该初始结构,来预测该初始结构的最终能量。在实施方式3中,预测部306关于全部初始结构各自,使用预测模型而预测最终能量。即,预测部306(在第8步骤中)通过对多个初始结构各自使用预测模型,来预测与对该初始结构实施了结构最佳化的情况下的原子配置的结构对应的能量。这里所谓“能量”,是与对初始结构实施了结构最佳化的情况下的最终结构对应的最终能量的预测值。
预测部306将初始结构、和与该初始结构对应的最终能量的预测值输出到比较部307。
(比较部307)
比较部307从预测部306取得初始结构和最终能量的预测值的组。进而,比较部307生成将初始结构和最终能量的预测值的组排列而得的列表。
图25为显示实施方式3涉及的通过比较部307而生成了的数据的一例的图。在图25中,左列表示初始结构的原子配置,右列表示与初始结构对应的最终能量的预测值。比较部307基于列表将最终能量的预测值以规定的顺序重新排序。在实施方式3中,比较部307从能量最小的值起依次将最终能量的预测值重新排序。这样的最终能量的预测值的重新排序相当于从最终能量的预测值提取最小的值,换言之为极小值或最小值的处理。
即,比较部307(在第9步骤中)从被预测了的多个能量提取显示极小值的能量。这里所谓“能量”,为与对初始结构实施了结构最佳化的情况下的最终结构对应的最终能量的预测值。这里,极小值为能量之中的最小值。
比较部307如上述那样将最终能量的预测值重新排序了的列表输出到输出部108。
(实施方式3:动作的说明)
接下来,对探索系统300的动作进行说明。
(流程图)
图26为显示实施方式3涉及的探索系统300的处理的动作例的流程图。步骤S301~S303的处理由于分别与图17所示的步骤S101~S103的处理相同,因此省略说明。
(步骤S304)
探索系统300取得预先机器学习完、并且关于与探索对象的材料的组成类似的已知材料的已知结构的预测模型,输出到预测模型存储部312。
(步骤S305)
预测部306从结构存储部110取得初始结构。进而,预测部306通过利用步骤S304而取得了的预测模型,算出与初始结构对应的最终能量的预测值。
(步骤S306)
比较部307生成将通过步骤S305算出了的最终能量的预测值从能量最小的值起依次重新排序了的列表,将生成了的列表输出到输出部108。即,比较部307从最终能量的预测值提取显示最小值的能量。
(步骤S307)
输出部108通过将利用步骤S306而生成了的列表所包含的初始结构和最终能量的预测值从能量最小的结构起依次显示于显示器来输出。
这样,在实施方式3中,由于对全部初始结构,使用预先进行了机器学习的预测模型,因此不进行关于结构最佳化的运算就可以。因此,在实施方式3中,与实施方式1或实施方式2同样地,能够探索新物质中的被认为热力学最稳定的原子配置的结构,并且,能够大幅省略探索所需要的运算。即,在实施方式3中,与对一部分初始结构实施结构最佳化的情况进行比较,可以减少运算成本,可以有效率地探索关于材料的组成的原子配置的稳定结构。
(实施方式4)
以下,使用附图对本公开的实施方式4涉及的探索系统400(探索方法、或程序)详细地说明。实施方式4涉及的探索系统400在使用预先进行了机器学习的关于已知结构的预测模型,并且,验证是否再学习预测模型方面,与实施方式3涉及的探索系统300不同。另外,在本实施方式中,对与实施方式1、实施方式2、或实施方式3相同的构成要素附上相同的符号,省去说明。
图27为显示实施方式4涉及的包含探索系统400的整体构成的框图。如图27所示那样,探索系统400具备取得部102、生成部103、算出部104、学习部405、预测部406、比较部107、和输出部108。作为探索系统400的周边的构成,有输入部101、材料数据库(DB)109、结构存储部110、算出结果存储部111、和预测模型存储部312。另外,探索系统400的周边的构成可以被包含于探索系统400的构成要素。
以下,对图27所示的各构成要素的详细内容进行描述。另外,关于除学习部405和预测部406以外的各构成要素,由于与实施方式1或实施方式3相同,因此省略说明。
(学习部405)
在预测部406中被判定为预测模型的预测精度不满足条件的情况下,学习部405再学习预测模型。具体而言,学习部405从算出结果存储部111取得初始结构和最终结构的最终能量,使用它们再学习从预测模型存储部312取得了的预测模型。这里,预测模型的再学习所使用的学习用数据集包含初始结构作为输入数据,且包含最终能量作为正解数据。
学习部405将再学习完成了的预测模型输出到预测部406和预测模型存储部312。
预测模型存储部312关于通过学习部405再学习了的预测模型,存储图神经网络的结构和权重。即,在预测模型存储部312中,已经被存储的预测模型被更新为进行了再学习的预测模型。
(预测部406)
预测部406从算出结果存储部111取得初始结构和最终结构的最终能量。预测部406从预测模型存储部312取得预测模型。这里预测部406取得的预测模型为通过学习部405再学习前的预测模型。预测部406通过向取得了的预测模型输入该初始结构,来预测该初始结构的最终能量。进而,预测部406通过将最终能量的预测值、与从算出结果存储部111取得了的最终能量进行比较,从而验证预测模型的预测精度。具体而言,关于预测部406,作为一例,如果最终能量与最终能量的预测值的均方根误差(Root Mean Squared Error:RMSE)低于一定的值,则判定为预测模型的预测精度充分,即满足预测精度的条件。另一方面,预测部406如果上述RMSE高于一定的值,则判定为预测模型的预测精度不充分,即不满足预测精度的条件。预测部406可以基于例如将被认为实际上最稳定的原子配置的结构预测为在一定的位次内稳定的结构,来判定满足预测精度的条件。另外,预测模型的预测精度的验证方法不限定于上述方法,也可以为其它方法。
即,预测部406(在第10步骤中)通过对一部分初始结构之中的至少1种初始结构使用预测模型,来预测与对该初始结构实施了结构最佳化的情况下的原子配置的结构对应的第2能量。这里,第2能量为与对至少1种初始结构实施了结构最佳化的情况下的最终结构对应的最终能量的预测值。预测部406(在第11步骤中)通过将第1能量与第2能量进行比较而验证预测模型的预测精度。这里,第1能量为与至少1种初始结构对应的最终结构的最终能量。
在满足预测模型的预测精度的条件的情况下,或通过学习部405而再学习了预测模型的情况下,预测部406从结构存储部110取得未算出最终能量的初始结构。这里所谓“未算出最终能量的初始结构”,是多个初始结构之中的除一部分初始结构以外的结构,即其它初始结构。进而,预测部406通过在预测模型输入该初始结构,来预测该初始结构的最终能量。
即,在预测部406(第11步骤)中的结果满足规定的条件的情况下,即在满足预测精度的条件的情况下,预测部406(在第12步骤中)通过对多个初始结构之中的其它初始结构使用预测模型,来预测与对其它初始结构实施了结构最佳化的情况下的原子配置的结构对应的第2能量。这里,第2能量为与对其它初始结构实施了结构最佳化的情况下的最终结构对应的最终能量的预测值。预测部406将初始结构、和与该初始结构对应的最终能量的预测值输出到比较部107。
(实施方式4:动作的说明)
接下来,对探索系统400的动作进行说明。
(流程图)
图28为显示实施方式4涉及的探索系统400的处理的动作例的流程图。步骤S401~S404的处理由于分别与图26所示的步骤S301~S304的处理相同,因此省略说明。
(步骤S405)
算出部104算出与通过对在步骤S403中生成了的多个初始结构之中的一部分初始结构执行结构最佳化,实施结构最佳化从而获得的最终结构对应的最终能量。进而,算出部104将算出结果输出到算出结果存储部111。
(步骤S406)
预测部406从算出结果存储部111取得初始结构,即一部分初始结构。进而,预测部406利用通过步骤S404取得了的预测模型,而算出与一部分初始结构对应的最终能量的预测值。
(步骤S407)
预测部406通过将在步骤S406中算出了的最终能量的预测值、与在步骤S405中算出的最终能量进行比较,从而验证预测模型的预测精度。在预测结果满足预测精度的条件的情况下(步骤S407:Yes),处理进入到步骤S409。另一方面,在预测结果不满足预测精度的条件的情况下(步骤S407:No),处理进入到步骤S408。
(步骤S408)
学习部405以通过步骤S405算出的最终能量与初始结构的组作为学习用数据集,进行由图神经网络构成的预测模型的再学习。进而,学习部405将再学习后的预测模型输出到预测部406和预测模型存储部312。另外,在预测模型的再学习时,可以进一步将与上述一部分初始结构不同的初始结构与最终能量的组作为学习用数据集使用。在该情况下,需要在算出部104另行算出与该其它初始结构对应的最终能量。
(步骤S409)
预测部406从结构存储部110取得未算出最终能量的初始结构,即多个初始结构之中的其它初始结构。进而,预测部406通过预测模型而算出与其它初始结构对应的最终能量的预测值。这里,关于预测模型,在通过步骤S407而预测结果满足预测精度的条件的情况下,采用通过S404而取得了的预测模型。另一方面,在通过步骤S407而预测结果不满足预测精度的条件的情况下,采用通过步骤S408而进行了再学习的预测模型。
(步骤S410)
比较部107生成将通过步骤S405算出了的最终能量、和通过步骤S409算出了的最终能量的预测值从能量最小的值起依次重新排序了的列表,将生成了的列表输出到输出部108。即,比较部107从最终能量和最终能量的预测值提取显示最小值的能量。换言之,比较部107(在第13步骤中)基于第1能量和第2能量,提取显示极小值的第3能量。这里,第1能量为从算出结果存储部111取得了的最终能量,第2能量为从预测部406取得了的最终能量的预测值。第3能量为第1能量和第2能量的最小值。
(步骤S411)
输出部108通过将通过步骤S410生成了的列表所包含的初始结构和最终能量的预测值从能量最小的结构起依次显示于显示器来输出。
这样,在实施方式4中,使用预先进行了机器学习的预测模型,同时验证了该预测模型的预测精度。因此,在实施方式4中,易于实现具有充分的预测精度的预测模型。在实施方式4中,通过使用满足了预测精度的条件的预测模型,即预测精度较高的预测模型,从而易于进一步有效率地探索关于材料的组成的原子配置的稳定结构。
(变形例)
在上述各实施方式中,极小值为第1能量和第2能量之中的最小值,但不限定于此。另外,第1能量为通过算出部104算出了的最终能量,第2能量为通过预测部106、306、406而被预测了的最终能量的预测值。例如,假定第1能量和第2能量之中的最小的值为第2能量的最小值,并且第2小的值为第1能量的最小值,这些值接近。例如,2个值的差为第2能量的最小值的10000分之1以内。在该情况下,极小值不是第2能量的最小值,而可以为第1能量的最小值。原因是可以认为与被预测了的值相比,实际上算出的值的精度良好。
在上述各实施方式中,探索系统100~400虽然通过生成部103生成多个初始结构从而取得了多个初始结构,但不限于此。例如,探索系统100~400可以在取得部102取得通过其它系统而生成了的多个初始结构。在该情况下,不需要生成部103。即,在取得步骤中,可以通过生成多个初始结构来取得,也可以取得通过其它系统生成了的多个初始结构。
在上述各实施方式中,各构成要素由专用的硬件构成、或可以通过执行适于各构成要素的软件程序来实现。各构成要素可以通过CPU(中央处理器,Central ProcessingUnit)或处理器等程序执行部读出硬磁盘或半导体存储器等记录介质所记录的软件程序而执行来实现。
另外,以下那样的情况也包含于本公开。
(1)上述至少1个系统具体为由微处理器、ROM、RAM、硬磁盘单元、显示器单元、键盘、鼠标等构成的计算机系统。在该RAM或硬磁盘单元中存储有计算机程序。通过微处理器按照计算机程序而动作,从而上述至少1个系统实现其功能。这里计算机程序是为了实现规定的功能,多个显示对计算机的指令的命令码组合而构成的。
(2)构成上述至少1个系统的构成要素的一部分或全部可以由1个系统LSI(LargeScale Integration:大规模集成电路)构成。系统LSI为将多个构成部集成在1个芯片上而制造的超多功能LSI,具体而言为包含微处理器、ROM、RAM等而构成的计算机系统。在上述RAM中存储有计算机程序。微处理器通过按照计算机程序而动作,从而系统LSI实现其功能。
(3)构成上述至少1个系统的构成要素的一部分或全部可以由能够装卸于该装置的IC卡或单独的模块构成。IC卡或模块为由微处理器、ROM、RAM等构成的计算机系统。IC卡或模块可以包含上述超多功能LSI。微处理器通过按照计算机程序而动作,从而IC卡或模块实现其功能。该IC卡或该模块可以具有防篡改性。
(4)本公开可以为上述所示的方法。可以为通过计算机来实现这些方法的计算机程序,也可以为由计算机程序构成的数字信号。
本公开可以为将计算机程序或数字信号记录于计算机可读取的记录介质例如软磁盘、硬磁盘、CD(Compact Disc)-ROM、DVD、DVD-ROM、DVD-RAM、BD(Blu-ray(注册商标)Disc)、半导体存储器等的物质。也可以为被记录于这些记录介质的数字信号。
本公开可以为将计算机程序或数字信号经由以电信线路、无线或有线通信线路、因特网为代表的网络、数据广播等进行传输的公开。
通过将程序或数字信号记录于记录介质进行移送,或通过将程序或数字信号经由网络等进行移送,从而可以通过独立的其它计算机系统来实施。
产业可利用性
本公开即使不对全部原子配置结构的候选进行计算也能够进行稳定的原子配置结构的探索,在不能准备大规模的计算资源的状况下,探索新的材料的稳定的原子配置结构的情况下是有用的。
符号的说明
100、200、300、400 探索系统
101 输入部
102 取得部
103 生成部
104、204 算出部
105、205、405 学习部
106、306、406 预测部
107、307 比较部
108 输出部
109 材料DB
110 结构存储部
111、211 算出结果存储部
112、212、312 预测模型存储部。

Claims (18)

1.一种探索方法,是用于探索关于材料的组成的三维空间中的原子配置的稳定结构的探索方法,
计算机执行下述步骤:
第1步骤,取得作为所述材料的组成能够采取的所述三维空间中的原子配置的结构的多个初始结构;
第2步骤,对多个所述初始结构之中的一部分初始结构实施结构最佳化,算出与被结构最佳化了的原子配置的结构对应的第1能量;
第3步骤,通过对多个所述初始结构之中的其它初始结构使用预测模型,来预测与对所述其它初始结构实施了结构最佳化的情况下的原子配置的结构对应的第2能量;
第4步骤,基于所述第1能量和所述第2能量,提取显示极小值的第3能量;以及
第5步骤,输出所述第3能量、作为与所述第3能量对应的原子配置的结构的第1结构、或所述第3能量和所述第1结构,
所述预测模型以将任意的原子配置的结构作为输入、并且将与对该结构实施了结构最佳化的情况下的结构对应的能量作为所述第2能量而输出的方式进行了机器学习。
2.根据权利要求1所述的探索方法,在所述第1步骤中,在取得了n个所述初始结构的情况下,其中n为2以上的整数,
所述第2步骤中的所述一部分初始结构为m个所述初始结构,其中m为1≤m<n的整数,
所述第3步骤中的所述其它初始结构为(n―m)个所述初始结构。
3.根据权利要求1或2所述的探索方法,所述第3能量为所述第1能量和所述第2能量的最小值。
4.根据权利要求1~3中任一项所述的探索方法,在所述第1步骤中,取得作为与所述材料的组成类似的已知材料的三维空间中的原子配置的结构的已知结构,基于所述已知结构,生成多个所述初始结构。
5.根据权利要求4所述的探索方法,所述已知材料含有至少1种与所述材料的组成所含有的元素不同种类的元素,
所述第1步骤包含将所述不同种类的元素置换为与所述材料的组成所含有的元素相同种类的元素的过程。
6.根据权利要求4或5所述的探索方法,所述第1步骤包含将所述已知结构沿至少一维方向扩展的过程。
7.根据权利要求1~6中任一项所述的探索方法,所述预测模型为使用包含所述初始结构作为输入数据、并且包含与该初始结构对应的所述第1能量作为正解数据的第1学习用数据集而进行了机器学习的模型。
8.根据权利要求7所述的探索方法,所述预测模型为进一步使用包含所述被结构最佳化了的原子配置的结构作为输入数据、并且包含与该结构对应的所述第1能量作为正解数据的第2学习用数据集而进行了机器学习的模型。
9.根据权利要求1~8中任一项所述的探索方法,所述第2步骤中的所述一部分初始结构的数目为多个所述初始结构的数目的90%以下。
10.一种探索系统,是用于探索关于材料的组成的三维空间中的原子配置的稳定结构的探索系统,其具备:
生成部,生成作为所述材料的组成能够采取的所述三维空间中的原子配置的结构的多个初始结构;
算出部,对多个所述初始结构之中的一部分初始结构实施结构最佳化,算出与被结构最佳化了的原子配置的结构对应的第1能量;
预测部,通过对多个所述初始结构之中的其它初始结构使用预测模型,来预测与对所述其它初始结构实施了结构最佳化的情况下的原子配置的结构对应的第2能量;以及
输出部,输出所述第1能量和所述第2能量,
所述预测模型以将任意的原子配置的结构作为输入、并且将与对该结构实施了结构最佳化的情况下的结构对应的能量作为所述第2能量而输出的方式进行了机器学习。
11.根据权利要求10所述的探索系统,所述输出部输出基于所述第1能量和所述第2能量而被提取的显示极小值的第3能量、作为与所述第3能量对应的原子配置的结构的第1结构、或所述第3能量和所述第1结构。
12.一种程序,是用于探索关于材料的组成的三维空间中的原子配置的稳定结构的程序,使计算机执行下述步骤:
第1步骤,取得作为所述材料的组成能够采取的所述三维空间中的原子配置的结构的多个初始结构;
第2步骤,对多个所述初始结构之中的一部分初始结构实施结构最佳化,算出与被结构最佳化了的原子配置的结构对应的第1能量;
第3步骤,通过对多个所述初始结构之中的其它初始结构使用预测模型,来预测与对所述其它初始结构实施了结构最佳化的情况下的原子配置的结构对应的第2能量;以及
第6步骤,输出所述第1能量和所述第2能量,
所述预测模型以将任意的原子配置的结构作为输入、并且将与对该结构实施了结构最佳化的情况下的结构对应的能量作为所述第2能量而输出的方式进行了机器学习。
13.根据权利要求12所述的程序,使所述计算机进一步执行基于所述第1能量和所述第2能量而提取显示极小值的第3能量的第4步骤,
在所述第6步骤中,进一步输出所述第3能量、作为与所述第3能量对应的原子配置的结构的第1结构、或所述第3能量和所述第1结构。
14.一种预测模型构建方法,计算机执行下述步骤:
第1步骤,取得作为材料的组成能够采取的三维空间中的原子配置的结构的初始结构;以及
第7步骤,使用包含所述初始结构作为输入数据、并且包含与对该初始结构实施结构最佳化而获得的原子配置的结构对应的能量作为正解数据的学习用数据集,以对任意的原子配置的结构的输入而输出与该结构被结构最佳化了的情况下的结构对应的能量的方式进行机器学习。
15.一种预测模型构建装置,其具备:
生成部,生成作为材料的组成能够采取的三维空间中的原子配置的结构的初始结构;以及
学习部,使用包含所述初始结构作为输入数据、并且包含与对该初始结构实施结构最佳化而获得的原子配置的结构对应的能量作为正解数据的学习用数据集,以对任意的原子配置的结构的输入而输出与该结构被结构最佳化了的情况下的结构对应的能量的方式进行机器学习。
16.一种探索方法,是用于使用通过权利要求15所述的预测模型构建装置而进行了机器学习的预测模型,来探索关于所述材料的组成的所述三维空间中的原子配置的稳定结构的探索方法,
计算机执行下述步骤:
第1步骤,取得多个所述初始结构;
第8步骤,通过对多个所述初始结构各自使用所述预测模型,来预测与对该初始结构实施了结构最佳化的情况下的原子配置的结构对应的能量;以及
第9步骤,从所预测的多个所述能量提取显示极小值的能量。
17.一种探索方法,是用于使用通过权利要求15所述的预测模型构建装置而进行了机器学习的预测模型,来探索所述关于材料的组成的所述三维空间中的原子配置的稳定结构的探索方法,
计算机执行下述步骤:
第1步骤,取得多个所述初始结构;
第2步骤,对多个所述初始结构之中的一部分初始结构实施结构最佳化,算出与被结构最佳化了的原子配置的结构对应的第1能量;
第10步骤,通过对所述一部分初始结构之中的至少1个初始结构使用所述预测模型,来预测与对该初始结构实施了结构最佳化的情况下的原子配置的结构对应的第2能量;以及
第11步骤,通过将所述第1能量与所述第2能量进行比较,来验证所述预测模型的预测精度。
18.根据权利要求17所述的探索方法,在所述第11步骤中的结果满足规定的条件的情况下,
所述计算机进一步执行下述步骤:
第12步骤,通过对多个所述初始结构之中的其它初始结构使用所述预测模型,来预测与对所述其它初始结构实施了结构最佳化的情况下的原子配置的结构对应的所述第2能量;以及
第13步骤,基于所述第1能量和所述第2能量,提取显示极小值的第3能量。
CN202280051365.XA 2021-07-27 2022-07-12 探索方法、探索系统、程序、预测模型构建方法及预测模型构建装置 Pending CN117716431A (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
JP2021-122609 2021-07-27
JP2021122609 2021-07-27
PCT/JP2022/027343 WO2023008172A1 (ja) 2021-07-27 2022-07-12 探索方法、探索システム、プログラム、予測モデル構築方法、及び予測モデル構築装置

Publications (1)

Publication Number Publication Date
CN117716431A true CN117716431A (zh) 2024-03-15

Family

ID=85086776

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202280051365.XA Pending CN117716431A (zh) 2021-07-27 2022-07-12 探索方法、探索系统、程序、预测模型构建方法及预测模型构建装置

Country Status (4)

Country Link
US (1) US20240144045A1 (zh)
JP (1) JPWO2023008172A1 (zh)
CN (1) CN117716431A (zh)
WO (1) WO2023008172A1 (zh)

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP3852114A4 (en) * 2018-09-14 2021-11-10 FUJIFILM Corporation LINK SEARCH METHOD, LINK SEARCH PROGRAM, RECORDING MEDIUM AND LINK SEARCH DEVICE
JP2020166706A (ja) * 2019-03-29 2020-10-08 株式会社クロスアビリティ 結晶形予測装置、結晶形予測方法、ニューラルネットワークの製造方法、及びプログラム

Also Published As

Publication number Publication date
US20240144045A1 (en) 2024-05-02
JPWO2023008172A1 (zh) 2023-02-02
WO2023008172A1 (ja) 2023-02-02

Similar Documents

Publication Publication Date Title
CN109657805A (zh) 超参数确定方法、装置、电子设备及计算机可读介质
KR102523472B1 (ko) 신규 물질의 구조 생성 방법 및 장치
CN112189211B (zh) 材料描述符生成方法、生成装置及生成程序、预测模型构建方法、构建装置及构建程序
CN109670255B (zh) 一种时序参数聚类的典型仿真条件推荐方法
JP6862914B2 (ja) 解析プログラム、解析方法および解析装置
CN113094533B (zh) 一种基于混合粒度匹配的图文跨模态检索方法
CN115270705B (zh) 一种设计规则违例预测方法、装置、设备及存储介质
US20200090076A1 (en) Non-transitory computer-readable recording medium, prediction method, and learning device
JP4773903B2 (ja) 統計的タイミング解析の悲観的誤差を評価する方法
CN117716431A (zh) 探索方法、探索系统、程序、预测模型构建方法及预测模型构建装置
US20120317526A1 (en) Verification method, computer-readable recording medium, and design verification apparatus
Saraogi et al. CNN Based design rule checker for VLSI layouts
CN117678025A (zh) 探索方法、探索系统、程序、预测模型构建方法及预测模型构建装置
EP4227864A1 (en) Evaluation method, evaluation device, and evaluation program
US20210365605A1 (en) Optimization device, optimization method, and non-transitory computer-readable storage medium for storing optimization program
CN114741697A (zh) 恶意代码分类方法、装置、电子设备和介质
CN114706751A (zh) 一种基于改进smote的软件缺陷预测方法
CN107678734B (zh) 基于遗传算法的cpu基准测试程序集构造方法
CN104951667A (zh) 一种用于分析蛋白质序列的性质的方法和装置
CN116610484B (zh) 一种模型训练方法、故障预测方法、系统、设备以及介质
EP4250180A1 (en) Method and apparatus for generating neural network
KR102705537B1 (ko) 합성곱 신경망과 강건 최적화를 이용한 유정 위치 결정 방법 및 장치
WO2021250752A1 (ja) 学習方法、学習装置及びプログラム
JP7125575B2 (ja) 情報処理装置、情報処理方法、情報処理プログラム、及び情報処理システム
CN110147804A (zh) 一种不平衡数据处理方法、终端及计算机可读存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination