WO2023008173A1

WO2023008173A1 - 探索方法、探索システム、プログラム、予測モデル構築方法、及び予測モデル構築装置

Info

Publication number: WO2023008173A1
Application number: PCT/JP2022/027344
Authority: WO
Inventors: 圭網井; 昌樹大越; 幹也藤井
Original assignee: パナソニックＩｐマネジメント株式会社
Priority date: 2021-07-27
Filing date: 2022-07-12
Publication date: 2023-02-02
Also published as: CN117678025A; US20240144046A1; JPWO2023008173A1

Abstract

コンピュータが、材料に含まれる原子の脱離による脱離後の材料の組成がとり得る３次元空間における原子配置の構造である複数の初期構造を取得する第１ステップ（Ｓ１０２）と、一部の初期構造に対して構造最適化を実施し、構造最適化された原子配置の構造に対応する第１エネルギーを算出する第２ステップ（Ｓ１０３）と、他の初期構造に対して予測モデルを用いることにより、他の初期構造に対して構造最適化が実施された場合の原子配置の構造に対応する第２エネルギーを予測する第３ステップ（Ｓ１０５）と、第１エネルギー及び第２エネルギーに基づいて、極小値を示す第３エネルギーを抽出する第４ステップ（Ｓ１０６）と、第３エネルギー、第３エネルギーに対応する原子配置の構造である第１構造、または、前記第３エネルギー及び前記第１構造を出力する第５ステップ（Ｓ１０７）と、を実行する。

Description

探索方法、探索システム、プログラム、予測モデル構築方法、及び予測モデル構築装置

　本開示は、原子の脱離後の材料の組成についての原子配置の安定構造を探索するための探索方法等に関する。

　従来、第一原理計算により安定な原子配置構造を求める構造最適化の技術が開発されている（例えば、非特許文献１参照）。

　非特許文献２には、原子配置構造の入力に対して、機械学習を用いてエネルギー等の特性値を推定する方法が開示されている。

Ｊｅｎｓｅｎ，　Ｆ．　（２００７）．　Ｉｎｔｒｏｄｕｃｔｉｏｎ　ｔｏ　ｃｏｍｐｕｔａｔｉｏｎａｌ　ｃｈｅｍｉｓｔｒｙ．　Ｊｏｈｎ　ｗｉｌｅｙ　＆　ｓｏｎｓ，３８３－３８９．Ｃｈｅｎ，　Ｃ．，　Ｙｅ，　Ｗ．，　Ｚｕｏ，　Ｙ．，　Ｚｈｅｎｇ，　Ｃ．，　＆　Ｏｎｇ，　Ｓ．　Ｐ．　（２０１９）．　Ｇｒａｐｈ　ｎｅｔｗｏｒｋｓ　ａｓ　ａ　ｕｎｉｖｅｒｓａｌ　ｍａｃｈｉｎｅ　ｌｅａｒｎｉｎｇ　ｆｒａｍｅｗｏｒｋ　ｆｏｒ　ｍｏｌｅｃｕｌｅｓ　ａｎｄ　ｃｒｙｓｔａｌｓ．　Ｃｈｅｍｉｓｔｒｙ　ｏｆ　Ｍａｔｅｒｉａｌｓ，　３１（９），　３５６４－３５７２．

　本開示は、原子の脱離後の材料の組成についての原子配置の安定構造を効率的に探索することができる探索方法等を提供する。

　本開示の一態様に係る探索方法は、材料の組成についての３次元空間における原子配置の安定構造を探索するための探索方法であって、コンピュータが、前記材料に含まれる原子の脱離によって脱離後の材料の組成がとり得る前記３次元空間における原子配置の構造である複数の初期構造を取得する第１ステップと、複数の前記初期構造のうちの一部の初期構造に対して構造最適化を実施し、構造最適化された原子配置の構造に対応する第１エネルギーを算出する第２ステップと、複数の前記初期構造のうちの他の初期構造に対して予測モデルを用いることにより、前記他の初期構造に対して構造最適化が実施された場合の原子配置の構造に対応する第２エネルギーを予測する第３ステップと、前記第１エネルギー及び前記第２エネルギーに基づいて、極小値を示す第３エネルギーを抽出する第４ステップと、前記第３エネルギー、前記第３エネルギーに対応する原子配置の構造である第１構造、または、前記第３エネルギー及び前記第１構造を出力する第５ステップと、を実行し、前記予測モデルは、任意の原子配置の構造を入力として、当該構造に対して構造最適化が実施された場合の構造に対応するエネルギーを前記第２エネルギーとして出力するように機械学習されている。

　なお、この包括的または具体的な態様は、装置、システム、集積回路、コンピュータプログラムまたはコンピュータ読み取り可能な記録媒体で実現されてもよく、装置、システム、方法、集積回路、コンピュータプログラムおよびコンピュータ読み取り可能な記録媒体の任意な組み合わせで実現されてもよい。コンピュータ読み取り可能な記録媒体は、例えばＣＤ－ＲＯＭ（Ｃｏｍｐａｃｔ　Ｄｉｓｃ－Ｒｅａｄ　Ｏｎｌｙ　Ｍｅｍｏｒｙ）等の不揮発性の記録媒体を含む。

　本開示によれば、原子の脱離後の材料の組成についての原子配置の安定構造を効率的に探索することができる。

図１は、実施の形態１に係る探索システムを含む全体構成を示すブロック図である。図２は、実施の形態１に係る入力部に入力される入力構造の一例を示す図である。図３は、実施の形態１に係る生成部が初期構造を生成する過程の一例を示す図である。図４は、実施の形態１に係る生成部が初期構造を生成する過程の一例を示す図である。図５は、実施の形態１に係る生成部が初期構造を生成する過程の一例を示す図である。図６は、実施の形態１に係る構造記憶部に記憶されているデータの一例を示す図である。図７は、実施の形態１に係る算出部による第１エネルギーを算出する過程の一例を示す図である。図８は、実施の形態１に係る算出結果記憶部に記憶されているデータの一例を示す図である。図９は、実施の形態１に係る学習部による予測モデルを機械学習する過程の一例を示す図である。図１０は、実施の形態１に係る予測部による第２エネルギーを予測する過程の一例を示す図である。図１１は、実施の形態１に係る比較部により生成されたデータの一例を示す図である。図１２は、実施の形態１に係る予測部の予測精度の評価例を示す図である。図１３は、実施の形態１に係る予測部の予測精度を検証した結果を示す図である。図１４は、実施の形態１に係る予測部の予測精度と学習用データの比率との相関を検証した結果を示す図である。図１５は、実施の形態１に係る探索システムの動作例を示すフローチャートである。図１６は、実施の形態２に係る探索システムを含む全体構成を示すブロック図である。図１７は、実施の形態２に係る算出結果記憶部に記憶されているデータの一例を示す図である。図１８は、実施の形態２に係る学習部による予測モデルを機械学習する過程の一例を示す図である。図１９は、実施の形態２に係る予測部の予測精度を検証した結果を示す図である。図２０は、実施の形態２に係る予測部の予測精度と学習用データセットの比率との相関を検証した結果を示す図である。図２１は、実施の形態２に係る探索システムの動作例を示すフローチャートである。図２２は、実施の形態３に係る探索システムを含む全体構成を示すブロック図である。図２３は、実施の形態３に係る比較部により生成されたデータの一例を示す図である。図２４は、実施の形態３に係る探索システムの動作例を示すフローチャートである。図２５は、実施の形態４に係る探索システムを含む全体構成を示すブロック図である。図２６は、実施の形態４に係る探索システムの動作例を示すフローチャートである。

　（本開示に至った知見）
　材料開発において、シミュレーションにより熱力学特性又は安全性等の性質を算出するためには、物質それぞれにおける熱力学的に安定な原子配置構造、つまり安定構造を求める必要がある。ここで、安定な原子配置構造は、構造最適化によって求めることができる。そのため、構造最適化は、物質の解析又は新規物質を開発するためのツールとして利用されている。非特許文献１には、第一原理計算による構造最適化の方法が開示されている。

　ところで、リチウムイオン電池は、正極活物質と負極活物質とを有しており、これらの間をリチウムイオンが移動することで充電又は放電を行う。充電の際には、正極活物質に含まれるリチウムイオンが脱離し、脱離したリチウムイオンが負極活物質へ移動する。ここで、正極活物質の原子配置構造をモデル化し、Ｌｉ（リチウム）原子が１個ずつ順に脱離した状態での安定な原子配置構造を考えることで、充電の過程をシミュレートすることができる。

　例えば、Ｌｉ原子の脱離後における安定な原子配置構造のエネルギーの計算値から、電極電圧が算出できる。更にＯ（酸素）原子が脱離した物質の安定な原子配置構造とのエネルギー差を計算することで、Ｏ原子の脱離の起こりやすさを示す酸素脱離エネルギーを算出できる。正極活物質からＯ原子が脱離すると、電解質と結び付いて発熱反応を起こす可能性があるため、酸素脱離エネルギーは電池の安全性の指標となる。つまり、電池が有する物質に含まれる元素の脱離後における安定な原子配置構造から、電池の電気特性や安全性を算出することができる。

　ここで、例えばＬｉ原子が脱離する前の物質が既知の物質であったとしても、Ｌｉ原子が脱離した後の物質は未知の新規物質である、と言える。そして、未知である新規物質における熱力学的に安定な原子配置構造を求めるためには、当該新規物質がとり得る候補となる原子配置構造に対する構造最適化を行う。候補となる原子配置構造は、既知の物質の原子配置構造に含まれる原子、ここではＬｉ原子を一部除去することにより得られる。このため、どのＬｉ原子を除去するかにより複数の候補構造が得られる。そして、複数の候補構造の各々について、１回以上の構造最適化を行い、構造最適化された候補構造のエネルギー、つまり全エネルギーを算出する。そして、算出されたエネルギーのうち最小となるエネルギーに対応する原子配置構造、つまり構造最適化された候補構造が、当該新規物質における熱力学的に最も安定な原子配置構造であると判断される。

　ここで、正極活物質、つまり既知物質に含まれるＬｉ原子の数が増えると、脱離し得るＬｉ原子の数も増える。その結果、候補構造の数が非常に大きくなる、いわゆる組み合わせ爆発が起こり得る。このような場合は、全ての候補構造について構造最適化を実行し、かつ、エネルギーを算出する処理を実行すると、演算に膨大な時間が必要となるため、これらの演算を行うことは現実的ではない、という課題がある。

　一方、近年、グラフニューラルネットワークによって、グラフ構造の入力に対する回帰又は分類を行う手法が提案されている。この手法では、ノード群とノード間の連結関係を表すエッジ群で構成されるグラフ構造の入力に対し、畳み込み等の演算を行うことによって出力との対応関係を学習させる。

　なかでも、非特許文献２には、材料の組成についての原子配置構造において、原子をノードに、結合をエッジにそれぞれ変換し、原子配置構造からエネルギー等の特性値を予測するグラフニューラルネットワークモデルが提案されている。この手法により、公開データベースに含まれた原子配置構造から高い精度でエネルギー等の材料特性を予測するモデルを構築できることが示されている。

　なお、非特許文献１は、構造最適化の基本的な技術を開示する先行技術文献であり、機械学習で予測モデルを学習させることに関する開示はない。非特許文献２は、原子配置構造から材料特性を予測する手法が開示されているに過ぎず、安定な原子配置構造を探索することに関する開示はない。

　本願の発明者らは、原子配置構造とエネルギーとの関係をグラフニューラルネットワークにより対応付けられることに着目した。そして、本願の発明者らの検討によれば、複数通り存在する原子の脱離後の材料の組成がとり得る候補となる原子配置構造から、従来に比べて熱力学的に安定な原子配置構造を効率的に探索することができる技術を見出した。これにより、演算コストを削減でき、かつ、精度良く、安定な原子配置構造を探索することができることが明らかになった。

　すなわち、本開示の一態様に係る探索方法は、材料の組成についての３次元空間における原子配置の安定構造を探索するための探索方法であって、コンピュータが、前記材料に含まれる原子の脱離によって脱離後の材料の組成がとり得る前記３次元空間における原子配置の構造である複数の初期構造を取得する第１ステップと、複数の前記初期構造のうちの一部の初期構造に対して構造最適化を実施し、構造最適化された原子配置の構造に対応する第１エネルギーを算出する第２ステップと、複数の前記初期構造のうちの他の初期構造に対して予測モデルを用いることにより、前記他の初期構造に対して構造最適化が実施された場合の原子配置の構造に対応する第２エネルギーを予測する第３ステップと、前記第１エネルギー及び前記第２エネルギーに基づいて、極小値を示す第３エネルギーを抽出する第４ステップと、前記第３エネルギー、前記第３エネルギーに対応する原子配置の構造である第１構造、または、前記第３エネルギー及び前記第１構造を出力する第５ステップと、を実行し、前記予測モデルは、任意の原子配置の構造を入力として、当該構造に対して構造最適化が実施された場合の構造に対応するエネルギーを前記第２エネルギーとして出力するように機械学習されている。

　例えば、前記材料には、脱離し得る前記原子がｘ個（ｘは２以上の整数）含まれており、前記第１ステップでは、前記原子がｚ個（ｚは１≦ｚ≦ｘ－１の整数）脱離した系について、_ｘＣ_ｚ個の複数の前記初期構造を生成してもよい。

　前記第１ステップにおいて、ｎ個（ｎは２以上の整数）の前記初期構造を取得した場合に、前記第２ステップにおける前記一部の初期構造は、ｍ個（ｍは１≦ｍ＜ｎの整数）の前記初期構造であり、前記第３ステップにおける前記他の初期構造は、（ｎ―ｍ）個の前記初期構造であってもよい。

　これにより、原子の脱離後の材料の組成についての原子配置の安定構造を効率的に探索することができ、演算コストを削減しやすい。

　前記第３エネルギーは、前記第１エネルギー及び前記第２エネルギーの最小値であってもよい。

　これにより、原子の脱離後の材料の組成についての原子配置の最も安定した構造を効率的に探索することができる。

　前記予測モデルは、前記初期構造を入力データ、当該初期構造に対応する前記第１エネルギーを正解データとして含む第１学習用データセットを用いて機械学習されたモデルであってもよい。

　これにより、入力された初期構造に対して構造最適化が実施された場合の構造に対応するエネルギーを精度良く予測しやすい。

　前記予測モデルは、更に、前記構造最適化された原子配置の構造を入力データ、当該構造に対応する前記第１エネルギーを正解データとして含む第２学習用データセットを用いて機械学習されたモデルであってもよい。

　これにより、入力された初期構造に対して構造最適化が実施された場合の構造に対応するエネルギーを、更に精度良く予測しやすい。

　前記第２ステップにおける前記一部の初期構造の数は、複数の前記初期構造の数の９０％以下であってもよい。

　これにより、演算コストを抑制しつつ、原子の脱離後の材料の組成についての原子配置の安定構造を効率的に探索しやすい。

　本開示の一態様に係る探索システムは、材料の組成についての３次元空間における原子配置の安定構造を探索するための探索システムであって、前記材料に含まれる原子の脱離による脱離後の材料の組成がとり得る前記３次元空間における原子配置の構造である複数の初期構造を生成する生成部と、複数の前記初期構造のうちの一部の初期構造に対して構造最適化を実施し、構造最適化された原子配置の構造に対応する第１エネルギーを算出する算出部と、複数の前記初期構造のうちの他の初期構造に対して予測モデルを用いることにより、前記他の初期構造に対して構造最適化が実施された場合の原子配置の構造対応する第２エネルギーを予測する予測部と、前記第１エネルギー及び前記第２エネルギーを出力する出力部と、を備え、前記予測モデルは、任意の原子配置の構造を入力として、当該構造に対して構造最適化が実施された場合の構造に対応するエネルギーを前記第２エネルギーとして出力するように機械学習されている。

　前記出力部は、前記第１エネルギー及び前記第２エネルギーに基づいて抽出された、極小値を示す第３エネルギー、前記第３エネルギーに対応する原子配置の構造である第１構造、または、前記第３エネルギー及び前記第１構造を出力してもよい。

　本開示の一態様に係るプログラムは、材料の組成についての３次元空間における原子配置の安定構造を探索するためのプログラムであって、前記材料に含まれる原子の脱離による脱離後の材料の組成がとり得る前記３次元空間における原子配置の構造である複数の初期構造を取得する第１ステップと、複数の前記初期構造のうちの一部の初期構造に対して構造最適化を実施し、構造最適化された原子配置の構造に対応する第１エネルギーを算出する第２ステップと、複数の前記初期構造のうちの他の初期構造に対して予測モデルを用いることにより、前記他の初期構造に対して構造最適化が実施された場合の原子配置の構造に対応する第２エネルギーを予測する第３ステップと、前記第１エネルギー及び前記第２エネルギーを出力する第６ステップと、をコンピュータに実行させ、前記予測モデルは、任意の原子配置の構造を入力として、当該構造に対して構造最適化が実施された場合の構造に対応するエネルギーを前記第２エネルギーとして出力するように機械学習されている。例えば、前記第１エネルギー及び前記第２エネルギーに基づいて、極小値を示す第３エネルギーを抽出する第４ステップを前記コンピュータに更に実行させ、前記第６ステップでは、前記第３エネルギー、前記第３エネルギーに対応する原子配置の構造である第１構造、または、前記第３エネルギー及び前記第１構造を更に出力してもよい。

　本開示の一態様に係る予測モデル構築方法は、コンピュータが、材料に含まれる原子の脱離による脱離後の材料の組成がとり得る３次元空間における原子配置の構造である初期構造を取得する第１ステップと、前記初期構造を入力データ、当該初期構造に対して構造最適化を実施して得られた原子配置の構造に対応するエネルギーを正解データとして含む学習用データセットを用いて、任意の原子配置の構造の入力に対して当該構造が構造最適化された場合の構造に対応するエネルギーを出力するように機械学習させる第７ステップと、を実行する。

　これにより、原子の脱離後の材料の組成についての原子配置の安定構造を効率的に探索することができ、演算コストを削減しやすい予測モデルを構築することができる。

　本開示の一態様に係る予測モデル構築装置は、材料に含まれる原子の脱離による脱離後の材料の組成がとり得る３次元空間における原子配置の構造である初期構造を生成する生成部と、前記初期構造を入力データ、当該初期構造に対して構造最適化を実施して得られた原子配置の構造に対応するエネルギーを正解データとして含む学習用データセットを用いて、任意の原子配置の構造の入力に対して当該構造が構造最適化された場合の構造に対応するエネルギーを出力するように機械学習させる学習部と、を備える。

　本開示の一態様に係る探索方法は、上記の予測モデル構築装置により機械学習された予測モデルを用いて、前記材料の組成についての前記３次元空間における原子配置の安定構造を探索するための探索方法であって、コンピュータが、複数の前記初期構造を取得する第１ステップと、複数の前記初期構造それぞれに対して前記予測モデルを用いることにより、当該初期構造に対して構造最適化が実施された場合の原子配置の構造に対応するエネルギーを予測する第８ステップと、予測された複数の前記エネルギーから、極小値を示すエネルギーを抽出する第９ステップと、を実行する。

　本開示の一態様に係る探索方法は、上記の予測モデル構築装置により機械学習された予測モデルを用いて、前記材料の組成についての前記３次元空間における原子配置の安定構造を探索するための探索方法であって、コンピュータが、複数の前記初期構造を取得する第１ステップと、複数の前記初期構造のうちの一部の初期構造に対して構造最適化を実施し、構造最適化された原子配置の構造に対応する第１エネルギーを算出する第２ステップと、前記一部の初期構造のうちの少なくとも１つの初期構造に対して前記予測モデルを用いることにより、当該初期構造に対して構造最適化が実施された場合の原子配置の構造に対応する第２エネルギーを予測する第１０ステップと、
　前記第１エネルギーと前記第２エネルギーとを比較することで前記予測モデルの予測精度を検証する第１１ステップと、を実行する。

　これにより、予測モデルの予測精度を検証することで、十分な予測精度を有する予測モデルを実現しやすくなる。

　前記第１１ステップにおける結果が所定の条件を満たす場合に、前記コンピュータが、複数の前記初期構造のうちの他の初期構造に対して前記予測モデルを用いることにより、前記他の初期構造に対して構造最適化が実施された場合の原子配置の構造に対応する前記第２エネルギーを予測する第１２ステップと、前記第１エネルギー及び前記第２エネルギーに基づいて、極小値を示す第３エネルギーを抽出する第１３ステップと、を更に実行してもよい。

　これにより、比較的予測精度の高い予測モデルを用いることで、原子の脱離後の材料の組成についての原子配置の安定構造を更に効率的に探索しやすい。

　本開示の探索方法又は予測モデル構築方法に含まれる特徴的な処理をコンピュータに実行させるコンピュータプログラムとして実現することもできる。そして、このようなコンピュータプログラムを、ＣＤ－ＲＯＭ等のコンピュータ読取可能な非一時的な記録媒体又はインターネット等の通信ネットワークを介して流通させることができるのは、言うまでもない。

　以下、実施の形態について、図面を参照しながら具体的に説明する。

　なお、以下で説明する実施の形態は、いずれも本開示の包括的又は具体的な例を示すものである。以下の実施の形態で示される数値、形状、構成要素、ステップ、ステップの順序等は、一例であり、本開示を限定する主旨ではない。、以下の実施の形態における構成要素のうち、最上位概念を示す独立請求項に記載されていない構成要素については、任意の構成要素として説明される。全ての実施の形態において、各々の内容を組み合わせることもできる。各図は、模式図であり、必ずしも厳密に図示されたものではない。各図において、同じ構成部材については同じ符号を付している。

　本開示の実施の形態に係る探索システムは、全ての構成要素を１つのコンピュータが含むように構成してもよいし、複数の構成要素をそれぞれ複数のコンピュータに分散したシステムとして構成してもよい。

　（実施の形態１）
　（実施の形態１：構成の説明）
　以下、本開示の実施の形態１に係る探索システム１００（探索方法、又はプログラム）について、図面を用いて詳細に説明する。実施の形態１に係る探索システム１００（探索方法、又はプログラム）は、材料の組成についての３次元空間における原子配置の安定構造を探索するためのシステム（方法、又はプログラム）である。ここでいう「安定構造」とは、原子配置の構造（つまり、結晶構造）に含まれる各原子に作用する力が閾値以下となるような構造であって、かつ、構造に対応するエネルギー（全エネルギー）が最小となる構造である。なお、閾値は、ユーザが適宜設定可能であるが、零に近似した値であってもよい。各原子に作用する力が零に近ければ近い程、構造が熱力学的に安定するからである。

　ここで、実施の形態１に係る探索システム１００（探索方法又はプログラム）は、上記のような安定構造を探索してユーザに対して出力する態様の他、上記のような安定構造をユーザが探索するために必要なデータを出力する態様を含み得る。つまり、安定構造を探索する過程は、探索システム１００（探索方法又はプログラム）のみで完結していなくてもよい。

　図１は、実施の形態１に係る探索システム１００を含む全体構成を示すブロック図である。探索システム１００は、例えばパーソナルコンピュータ又はサーバ等のコンピュータとして構成されている。図１に示すように、探索システム１００は、生成部１０２と、算出部１０３と、学習部１０４と、予測部１０５と、比較部１０６と、出力部１０７と、を備えている。探索システム１００の周辺の構成として、入力部１０１と、構造記憶部１０８と、算出結果記憶部１０９と、予測モデル記憶部１１０と、がある。なお、探索システム１００の周辺の構成は、探索システム１００の構成要素に含まれていてもよい。探索システム１００における生成部１０２及び学習部１０４は、予測モデル構築装置の構成要素でもある。

　以下、図１に示した各構成要素の詳細について述べる。

　（入力部１０１）
　入力部１０１は、ユーザの入力を受け付ける入力インタフェースであって、探索対象の材料が有する組成に関する情報をユーザの入力によって取得し、生成部１０２に出力する。組成に関する情報は、例えば、探索対象の材料が有する組成についての３次元空間における原子配置の構造である。以下、当該構造を「入力構造」とも言う。入力部１０１は、例えばキーボード、タッチセンサ、タッチパッド又はマウス等を含んで構成される。

　図２は、実施の形態１に係る入力部１０１に入力される入力構造の一例を示す図である。図２に示す例では、探索対象の材料が有する組成は、組成式で「Ｌｉ_１２Ｍｎ_６Ｎｉ_６Ｏ_２４」と表現され得る。すなわち、この場合、探索対象の材料が有する組成が、Ｌｉ（リチウム）原子１２個、Ｍｎ（マンガン）原子６個、Ｎｉ（ニッケル）原子６個、Ｏ（酸素）原子２４個からなる組成であることを示す。

　図２の（ａ）に示すように、入力構造は、例えば、結晶学情報共通データフォーマット（Crystallographic Information File：ＣＩＦ）で記述された情報を含む。ただし、情報の記述形式は、ＣＩＦのデータフォーマットに限定されず、組成式、結晶構造、及び格子ベクトルといった第一原理計算等による構造最適化の演算が実施可能な記述形式であれば、どのような記述形式であってもよい。

　ＣＩＦでは、材料の組成を示す組成式、単位格子ベクトルの長さ、原子同士が交わる角度、及び単位格子中の原子配置等が記述される。図２の（ａ）には、材料「Ｌｉ_１２Ｍｎ_６Ｎｉ_６Ｏ_２４」の組成についての原子配置が示されている。原子配置においては、各原子（例えばＬｉ原子であれば、「Ｌｉ０」～［Ｌｉ１１］の計１２個の原子）の原子座標（ｘ座標、ｙ座標、ｚ座標）等が記述されている。なお、「Ｌｉ０」の「０」等の数字は、同種の元素を区別するために付されているに過ぎない。

　図２の（ｂ）に示すように、入力構造は、例えば、結晶構造の単位格子、つまり原子配置を含んでいる。図２の（ｂ）において、最も小さい球体がＯ原子、ハッチングの施されていない球体がＬｉ原子、Ｌｉ原子と同程度の大きさの球体でハッチングの施されている球体がＮｉ原子、黒く塗りつぶされた球体がＭｎ原子を表している。これらの表現は、後述する図５及び図９においても同様である。

　（生成部１０２）
　生成部１０２は、入力部１０１から取得した入力構造に対して原子の除去、つまり原子の脱離処理を実行することにより、脱離後の構造がとり得る複数の初期構造を生成する。ここでは、入力構造からの原子の除去は、ＣＩＦから除去対象の原子を記述した行を削除することで実行される。実施の形態１では、脱離する原子はＬｉ原子である。つまり、生成部１０２は（第１ステップでは）、材料に含まれる原子の脱離による脱離後の材料の組成がとり得る３次元空間における原子配置の構造である複数の初期構造を取得する。ここでいう「初期構造」は、探索対象の材料の組成から１以上の原子が脱離した後の組成であって、原子配置の安定構造となり得る候補の構造である。

　図３～図５は、それぞれ実施の形態１に係る生成部１０２が初期構造を生成する過程の一例を示す図である。図３の（ａ）は入力構造のＣＩＦを表しており、図３の（ｂ）は入力構造からＬｉ原子が１個脱離した後の構造のＣＩＦを表しており、図３の（ｃ）は入力構造からＬｉ原子が２個脱離した後の構造のＣＩＦを表している。図３の（ｂ）に示す例では、生成部１０２は、入力構造から「Ｌｉ４」を除去することにより、Ｌｉ原子が１個脱離した場合の初期構造を生成している。図３の（ｃ）に示す例では、生成部１０２は、入力構造から「Ｌｉ２」、「Ｌｉ６」を除去することにより、Ｌｉ原子が２個脱離した場合の初期構造を生成している。

　図４は、入力構造からＬｉ原子が２個脱離した場合の初期構造の一例を示している。図４の（ａ）が示す初期構造は、生成部１０２が入力構造から「Ｌｉ２」、「Ｌｉ６」を除去することにより生成された構造である。図４の（ｂ）が示す初期構造は、生成部１０２が入力構造から「Ｌｉ５」、「Ｌｉ６」を除去することにより生成された構造である。図４の（ｃ）が示す初期構造は、生成部１０２が入力構造から「Ｌｉ０」、「Ｌｉ４」を除去することにより生成された構造である。

　このように、生成部１０２は、入力構造から脱離したＬｉ原子の数に応じて、複数の初期構造を生成する。例えば、図５の最も左に位置する立体配置は、入力構造からＬｉ原子が１個脱離した場合の初期構造の一例を表しているが、この場合、生成部１０２は、１２個のＬｉ原子から１個のＬｉ原子を脱離する組み合わせの数である_１２Ｃ_１＝１２個の初期構造を生成する。例えば、図５の左から２番目に位置する立体配置は、入力構造からＬｉ原子が２個脱離した場合の初期構造の一例を表しているが、この場合、生成部１０２は、１２個のＬｉ原子から２個のＬｉ原子を脱離する組み合わせの数である_１２Ｃ_２＝６６個の初期構造を生成する。例えば、図５の最も右に位置する立体配置は、入力構造からＬｉ原子が８個脱離した場合の初期構造の一例を表しているが、この場合、生成部１０２は、１２個のＬｉ原子から８個のＬｉ原子を脱離する組み合わせの数である_１２Ｃ_８＝４９５個の初期構造を生成する。

　探索対象の材料の式に対応する構造には、同一の元素記号で表現される原子がｘ個含まれ、当該ｘ個の原子からｚ個の原子が離脱し得る。ｘは２以上の整数、ｚは１≦ｚ≦ｘ－１を満たす整数である。生成部１０２は（第１ステップでは）、当該原子がｚ個脱離した系について、_ｘＣ_ｚ個の複数の初期構造を生成する。つまり、生成部１０２が生成する初期構造の数は、（_１２Ｃ_１＋・・・＋_１２Ｃ_ｚ）個である。このように、実施の形態１では、生成部１０２は、系ごとに複数の初期構造を生成する。ここでいう「系」とは、入力構造から脱離した原子の数により区分けされた、構造の集合をいう。生成部１０２は、（ｘ－１）個の系ごとに複数の初期構造を生成する。

　上記内容を以下に例示する。探索対象の材料の式「Ｌｉ_１２Ｍｎ_６Ｎｉ_６Ｏ_２４」に対応する構造には、元素記号Ｌｉで表現される原子がｘ＝１２個含まれ、当該ｘ＝１２個の原子からｚ個の原子が離脱し得る。ｘは２以上の整数、ｚは１≦ｚ≦１１を満たす整数である。生成部１０２は（第１ステップでは）、原子Ｌｉが１個離脱した系について_１２Ｃ_１個の初期構造を生成し、・・・、Ｌｉ原子が１１個離脱した系について_１２Ｃ_１１個の初期構造を生成する。生成部１０２が生成する初期構造の数は、（_１２Ｃ_１＋・・・＋_１２Ｃ_１１）個である。系の数は１１である。

　生成部１０２は、系ごとに生成した複数の初期構造を、構造記憶部１０８に出力する。なお、生成した複数の初期構造については、生成した全ての初期構造を構造記憶部１０８に出力してもよいし、対称性の観点から同等の構造を既存のプログラム等を用いてスクリーニングを行い、選別された初期構造のみを出力してもよい。

　構造記憶部１０８は、例えばハードディスクドライブ、又は不揮発性の半導体メモリ等の記録媒体で構成されている。後述する算出結果記憶部１０９、及び予測モデル記憶部１１０も同様の構成である。構造記憶部１０８は、生成部１０２で系ごとに生成された複数の初期構造を記憶する。ここで、各初期構造のデータは、組成式、結晶構造、及び格子ベクトルといった第一原理計算等による構造最適化の演算が実施可能な記述形式で記憶される。図６は、実施の形態１に係る構造記憶部１０８に記憶されているデータの一例を示す図である。図６においては、左列が各初期構造を区別するために割り当てられた初期構造ＩＤ（Identifier）を、右列が初期構造の原子配置を表している。

　（算出部１０３）
　算出部１０３は、図７に示すように、構造記憶部１０８から初期構造の一部を取得し、取得した初期構造に対して構造最適化を実行する。算出部１０３は、構造最適化を繰り返すことにより得られた最終構造に対応するエネルギー（第１エネルギー）を算出する処理を実行する。図７は、実施の形態１に係る算出部１０３による第１エネルギーを算出する過程の一例を示す図である。

　つまり、算出部１０３は（第２ステップでは）、複数の初期構造のうちの一部の初期構造に対して構造最適化を実施し、構造最適化された原子配置の構造に対応する第１エネルギーを算出する。ここでいう「第１エネルギー」は、構造最適化を繰り返すことで得られる最終構造に対応するエネルギーを示す場合もあれば、未だ最終構造に到達していない中間構造に対応するエネルギーを示す場合もある。実施の形態では、算出部１０３は、例えばＶＡＳＰ（Vienna Ab initio Simulation Package）等の第一原理計算パッケージを用いて、構造最適化及び最終構造に対応する第１エネルギーを算出する処理を実行する。本開示における「エネルギー」は「ポテンシャルエネルギー」を意味してもよい。

　ここで、「最終構造」とは、初期構造に対して構造最適化を実施することにより得られる構造であって、構造に含まれる各原子に作用する力が閾値以下となるような構造である。「中間構造」とは、初期構造に対して構造最適化を実施することにより得られる構造であって、構造に含まれる少なくとも１以上の原子に作用する力が閾値を上回っている構造、つまり未だ最終構造に到達していない構造である。

　算出部１０３は、構造最適化においては、処理対象の構造に含まれる各原子に働く力Ｆを算出し、各原子において算出した力Ｆの大きさが閾値以下となる構造（つまり、最終構造）を探索する。閾値は、既に述べたように、零に近似した値であってもよい。具体的には、算出部１０３は、構造最適化を実施することで得られた構造において、少なくとも１以上の原子に働く力Ｆの大きさが閾値を上回っている場合、力Ｆがかかっている向きに各原子を動かし、力Ｆが小さくなるように各原子の位置を調整する。算出部１０３は、上述の各原子の力Ｆを算出する処理、及び各原子の位置を調整する処理を１回分の構造最適化としてこれを繰り返し、全ての原子において力Ｆの大きさが閾値以下となる構造（つまり、最終構造）が得られた場合に、構造最適化を終了する。そして、算出部１０３は、得られた最終構造に対応するエネルギー、つまり、最終エネルギーを算出する。

　ここで、密度汎関数理論（Density Functional Theory：ＤＦＴ）に基づく第一原理計算では、各原子に働く力Ｆを算出するためには、例えば数十秒～数分程度の時間を要する。初期構造が最終構造に到達するまでには、例えば数回～数十回程度、各原子の位置を調整する処理を実行する必要がある。したがって、算出部１０３は、１つの初期構造について、初期構造から最終構造を得るためには、数十秒～数分程度の時間を要する構造最適化を、数回～数十回程度繰り返す必要があり、全体として数十分～数時間程度の時間を要する。

　算出部１０３は、初期構造、当該初期構造に対して構造最適化を繰り返し実施することで得られた最終構造、及び算出した最終構造に対応する最終エネルギーを系ごとに算出結果記憶部１０９に出力する。

　算出結果記憶部１０９は、算出部１０３で算出された最終エネルギーと、対応する初期構造との組を系ごとに記憶する。図８は、実施の形態１に係る算出結果記憶部１０９に記憶されているデータの一例を示す図である。図８においては、左列が初期構造ＩＤを、真ん中の列が初期構造の原子配置を、右列が初期構造に対して構造最適化を実施することで得られた最終構造に対応する最終エネルギーを表している。このように、算出結果記憶部１０９は、初期構造と、最終構造の最終エネルギーとの組を少なくとも記憶していればよい。実施の形態１では、算出結果記憶部１０９は、最終構造の原子配置を更に記憶している。

　（学習部１０４）
　学習部１０４は、算出結果記憶部１０９から初期構造と、最終構造の最終エネルギーとを取得し、取得した初期構造及び最終エネルギーを用いて予測モデルを学習させる。ここで、予測モデルに学習する入出力の組は、一例として入力が初期構造、出力が最終エネルギーである。

　つまり、学習部１０４は（第７ステップでは）、学習用データセットを用いて、任意の原子配置の構造（ここでは、初期構造）の入力に対して当該構造が構造最適化された場合の構造（ここでは、最終構造）に対応するエネルギーを出力するように予測モデルを機械学習させる。学習用データセットは、初期構造を入力データ、当該初期構造に対して構造最適化を実施して得られた原子配置の構造（ここでは、最終構造）に対応するエネルギーを正解データとして含む。

　実施の形態では、予測モデルは、グラフ構造を入力とするグラフニューラルネットワークにより構成されている。グラフニューラルネットワークは、例えばＣＧＣＮＮ（Crystal Graph Convolutional Neural Network）、又はＭＥＧＮｅｔ（Material Graph Network）等である。実施の形態では、予測モデルは、ＭＥＧＮｅｔにより構成されている。ＭＥＧＮｅｔは、ノード（節点・頂点）及びエッジ（枝・辺）を特徴量とするだけでなく、対象とする系全体の特徴を表すグローバル状態量を更に特徴量とするグラフニューラルネットワークである。

　図９は、実施の形態１に係る学習部１０４による予測モデルを機械学習する過程の一例を示す図である。学習部１０４は、まず、図９の（ａ）に示すような初期構造の各原子の原子座標及び種類を、図９の（ｂ）に示すようなグラフ構造に変換する。グラフ構造においては、ノードが初期構造の各原子に対応し、エッジが初期構造の各原子間の結合に対応している。次に、学習部１０４は、変換したグラフ構造を図９の（ｃ）に示すようなグラフニューラルネットワークに入力する。次に、学習部１０４は、グラフニューラルネットワークから出力される図９の（ｄ）に示す最終エネルギーの予測値と、正解データとしての最終エネルギーとを比較する。そして、学習部１０４は、グラフニューラルネットワークから出力される最終エネルギーの予測値が、正解データとしての最終エネルギーと乖離していれば、グラフニューラルネットワークの重みを更新する。このようにして、学習部１０４は、複数の学習用データセットを用いて、教師あり学習により予測モデルを機械学習させる。

　学習部１０４は、機械学習が完了した予測モデル、つまり学習済みモデルを予測部１０５及び予測モデル記憶部１１０に出力する。この機械学習が完了した予測モデルは、任意の原子配置の構造（ここでは、初期構造）を入力として、当該構造に対して構造最適化が実施された場合の構造（ここでは、最終構造）に対応するエネルギーを、後述する第２エネルギーとして出力するように機械学習されている。この予測モデルは、初期構造を入力データ、当該初期構造に対応する第１エネルギー（ここでは、最終エネルギー）を正解データとして含む第１学習用データセットを用いて機械学習されたモデルである。

　予測モデル記憶部１１０は、学習部１０４で機械学習された予測モデルについて、グラフニューラルネットワークの構造及び重みを記憶する。

　（予測部１０５）
　予測部１０５は、構造記憶部１０８から最終エネルギーを未算出の初期構造を取得する。そして、予測部１０５は、学習部１０４から取得した予測モデル、つまり学習済みの予測モデルに当該初期構造を入力することで、当該初期構造の最終エネルギーを予測する。

　ここでいう「最終エネルギーを未算出の初期構造」とは、複数の初期構造のうちの算出部１０３でエネルギーを算出された一部の初期構造ではない構造であって、他の初期構造のことをいう。つまり、予測部１０５は（第３ステップでは）、複数の初期構造のうちの他の初期構造に対して予測モデルを用いることにより、他の初期構造に対して構造最適化が実施された場合の原子配置の構造に対応する第２エネルギーを予測する。ここでは、第２エネルギーは、他の初期構造に対して構造最適化が実施された場合の最終構造に対応する最終エネルギーの予測値である。

　図１０は、実施の形態１に係る予測部１０５による第２エネルギーを予測する過程の一例を示す図である。予測部１０５は、初期構造をグラフ構造に変換し、変換した初期構造を予測モデルに入力する。図１０では、初期構造をグラフ構造に変換する過程の図示を省略している。これにより、予測モデルは、入力された初期構造に対して構造最適化が実施された場合の最終構造に対応する最終エネルギーの予測値、つまり第２エネルギーを出力する。

　つまり、非特許文献２に開示されているような予測モデルでは、入力した初期構造に対応するエネルギーの予測値を出力するのに対して、実施の形態１に係る予測モデルでは、入力した初期構造に対して構造最適化が実施された場合の構造、つまり中間構造又は最終構造に対応するエネルギーの予測値を出力する。そして、予測モデルの予測精度にも依るが、予測モデルが出力するエネルギーの予測値は、算出部１０３が実際に初期構造に対して構造最適化を実施して得られる構造に対応するエネルギーに相当する。

　このため、実施の形態１では、予測モデルを用いることにより、初期構造に対して数回～数十回に及び構造最適化を実行せずとも、構造最適化された構造（例えば、中間構造又は最終構造）に対応するエネルギーを取得することが可能である。したがって、実施の形態１では、構造最適化についての演算をある程度省略することができるので、演算コストを削減することが可能である。

　予測部１０５は、初期構造と、当該初期構造に対応する最終エネルギーの予測値とを系ごとに比較部１０６に出力する。

　（比較部１０６）
　比較部１０６は、予測部１０５から初期構造及び最終エネルギーの予測値の組を取得する。比較部１０６は、算出結果記憶部１０９から最終構造及び最終エネルギーの組を取得する。そして、比較部１０６は、初期構造及び最終エネルギーの予測値の組と、最終構造及び最終エネルギーの組とを並べたリストを生成する。

　図１１は、実施の形態１に係る比較部１０６により生成されたデータの一例を示す図である。図１１においては、左列が初期構造又は最終構造の原子配置を、真ん中の列が最終構造に対応する最終エネルギーを、右列が初期構造に対応する最終エネルギーの予測値を表している。比較部１０６は、リストに基づいて、最終エネルギー及び最終エネルギーの予測値を所定の順番で並べ替える。実施の形態１では、比較部１０６は、最もエネルギーの小さい値から順番に最終エネルギー及び最終エネルギーの予測値を並べ替える。このような最終エネルギー及び最終エネルギーの予測値の並べ替えは、最終エネルギー及び最終エネルギーの予測値から最も小さい値、言い換えれば極小値又は最小値を抽出する処理に相当する。

　つまり、比較部１０６は（第４ステップでは）、第１エネルギー及び第２エネルギーに基づいて、極小値を示す第３エネルギーを抽出する。第１エネルギーは算出結果記憶部１０９から取得した最終エネルギー、第２エネルギーは予測部１０５から取得した最終エネルギーの予測値である。ここでは、極小値は、第１エネルギー及び第２エネルギーのうちの最小値である。つまり、第３エネルギーは、第１エネルギー及び第２エネルギーの最小値である。

　比較部１０６は、上述のように最終エネルギー及び最終エネルギーの予測値を並べ替えたリストを系ごとに出力部１０７に出力する。

　（出力部１０７）
　出力部１０７は、比較部１０６が出力したリストに含まれる初期構造及び最終エネルギーの予測値、並びに最終構造及び最終エネルギーを、上記の所定の順番に従って、つまり最もエネルギーの小さい構造から順番にディスプレイに表示する。つまり、出力部１０７は（第５ステップでは）、第３エネルギー、第３エネルギーに対応する原子配置の構造である第１構造、または、第３エネルギー及び第１構造を出力する。

　なお、出力部１０７は、第３エネルギー及び第３エネルギーに対応する原子配置の構造のみをディスプレイに表示してもよい。出力部１０７は、比較部１０６により最終エネルギー及び最終エネルギーの予測値を並び替えられる前のリストをディスプレイに表示してもよい。つまり、出力部１０７は（第６ステップでは）、第１エネルギー及び第２エネルギーを出力してもよい。この場合、比較部１０６による上述の抽出処理（第４ステップ）は不要である。いずれにせよ、出力部１０７は、上記の出力結果を、ディスプレイにて系ごとに区別できる態様で表示する。ディスプレイへの表示は、系ごとに順番に行ってもよいし、全ての系について一括して行ってもよい。

　（実施の形態１：予測精度の検証）
　以下、実施の形態１に係る予測部１０５の予測精度の検証について説明する。この検証は、組成Ｌｉ_１２Ｍｎ_６Ｎｉ_６Ｏ_２４を有する物質から１個以上のＬｉ原子が脱離した脱離後の物質の組成について、系ごとに予測部１０５が安定構造を予測できるか否かを確かめることを目的とする。

　まず、検証においては、脱離後の物質の組成に関して、初期構造と最終エネルギーとの組を計４０７０組準備した。つまり、計４０７０個の初期構造それぞれについて、構造最適化を実施して最終構造を得て、得られた最終構造に対応する最終エネルギーを算出した。そして、計４０７０組のうち、全体の１０％である４０７組を検証用データ（Ｔｅｓｔデータ）とし、残りの９０％である３６６３組を学習用データ（Ｔｒａｉｎデータ）とした。

　学習用データについては、初期構造を入力データ、最終エネルギーを正解データとして含む学習用データセットとして用いることで、予測モデルの機械学習を行った。そして、機械学習させた予測モデルを用いて、検証用データの最終エネルギーを予測した。つまり、検証用データに含まれる初期構造を、機械学習させた予測モデルに入力することにより、予測モデルから出力される当該初期構造に対応する最終エネルギーの予測値を取得した。

　ここで、予測精度の評価指標として、系ごとに、実際に複数の初期構造の各々に対して構造最適化を実施して得られた複数の最終構造のうち最も安定と考えられる原子配置の構造が、予測モデルでは何番目に安定な構造と予測されるかを考えた。これにより、当該予測モデルを用いたスクリーニングが可能であるか否かを評価することができる。

　図１２は、実施の形態１に係る予測部１０５の予測精度の評価例を示す図である。図１２においては、最も左の列から順に、初期構造、初期構造に対応する最終エネルギーの正解値、初期構造に対応する最終エネルギーの予測値、正解値の順位、及び予測値の順位を表している。ここでいう「最終エネルギーの正解値」とは、初期構造に対して実際に構造最適化を実施して得られた最終構造に対応する最終エネルギーである。ここでいう「最終エネルギーの予測値」とは、初期構造を予測モデルに入力することで、予測モデルから出力される最終エネルギーの予測値である。ここでいう「順位」とは、最終エネルギーの正解値又は最終エネルギーの予測値が最も小さい最終構造を１位とした場合の順位である。

　図１２に示す例では、実際に構造最適化を実施して得られた最も安定と考えられる原子配置の構造が、予測部１０５では２番目に安定な原子配置の構造であると予測されたことになる。

　図１３は、実施の形態１に係る予測部１０５の予測精度を検証した結果を示す図である。図１３においては、左列がＬｉ原子の脱離数、言い換えれば系を、右列が順位を表している。ここでいう「順位」の左側の数字は、系における検証用データのうち実際に最も安定と考えられる原子配置の構造が、予測部１０５では何番目に安定な構造であると予測されたかを示す。「順位」の右側の数字は、系における検証用データの数を表している。この表現は、後述する図１４、図１９、及び図２０においても同様である。

　ここで、検証用データの数が多いほど、予測部１０５による予測精度の低下が懸念される。しかしながら、例えばＬｉ原子が５個脱離した系については、７９組の検証用データのうち実際に最も安定と考えられる原子配置の構造が、予測部１０５では１番目に安定な構造であると予測された。例えばＬｉ原子が７個脱離した系についても、７９組の検証用データのうち実際に最も安定と考えられる原子配置の構造が、予測部１０５では１７番目に安定な構造であると予測された。

　上述のように、これらの結果から、予測部１０５は、いずれの系についても、実際に最も安定と考えられる原子配置の構造を、当該系についての検証用データ全体の２５％以内の順位で安定な構造であると予測できていることがわかる。つまり、検証用データの数が多くなっても、予測部１０５による予測精度が殆ど低下していないことがわかる。ここでは、予測部１０５は、いずれの系についても、実際に最も安定と考えられる原子配置の構造を、当該系についての検証用データ全体の１０％以内、更には５％以内の順位で安定な構造であると予測できてもよい。

　図１４は、実施の形態１に係る予測部１０５の予測精度と学習用データの比率との相関を検証した結果を示す図である。具体的には、図１４は、組成Ｌｉ_１４Ｍｎ_５Ｎｉ_５Ｏ_２４を有する物質からのＬＩ原子の脱離した数ごと、つまり系ごとに、学習用データの比率を変更しながら予測部１０５の予測精度を検証した場合の結果を示す図である。ここでいう「学習用データの比率」は、系における学習用データ及び検証用データ全体の数に対する学習用データの数の割合である。

　図１４に示すように、学習用データの比率を減らしても、予測部１０５の予測精度の低下は殆ど見受けられなかった。例えば、学習用データの比率を４０％にした場合に、Ｌｉ原子が４個脱離した系においては２９７組ある検証用データのうち実際に最も安定と考えられる原子配置の構造が、予測部１０５では２番目に安定な構造であると予測された。同様に、学習用データの比率を４０％にした場合に、Ｌｉ原子が６個脱離した系においては５５４組ある検証用データのうち実際に最も安定と考えられる原子配置の構造が、予測部１０５では６０番目に安定な構造であると予測された。

　（実施の形態１：動作の説明）
　次に、探索システム１００の動作について説明する。

　（フローチャート）
　図１５は、実施の形態１に係る探索システム１００の動作例を示すフローチャートである。

　（ステップＳ１０１）
　入力部１０１は、入力構造をユーザの入力によって取得し、取得した入力構造を生成部１０２に出力する。

　（ステップＳ１０２）
　生成部１０２は、ステップＳ１０１で取得された入力構造に対して脱離処理を実行する。これにより、生成部１０２は、系ごとに複数の初期構造を生成し、構造記憶部１０８に出力する。

　（ステップＳ１０３）
　算出部１０３は、ステップＳ１０２で生成された複数の初期構造のうち一部の初期構造に対して構造最適化を実行し、構造最適化を実施することで得られた最終構造に対応する最終エネルギーを算出する。そして、算出部１０３は、系ごとに算出結果を算出結果記憶部１０９に出力する。ここでは、生成部１０２（第１ステップ）においてｎ個（ｎは２以上の整数）の初期構造を取得した場合に、算出部１０３（第２ステップ）における一部の初期構造は、ｍ個（ｍは１＜ｍ＜ｎの整数）の初期構造である。ここでは、“ｍ”は、“ｎ”の９０％以下の数である。“ｍ”は“ｎ”の４０％以上９０％以下の数であってもよい。つまり、算出部１０３（第２ステップ）における一部の初期構造の数は、複数の初期構造の数の９０％以下である。

　（ステップＳ１０４）
　学習部１０４は、ステップＳ１０３で算出された最終エネルギーと初期構造との組を学習用データセットとして、グラフニューラルネットワークにより構成される予測モデルの機械学習を行う。そして、学習部１０４は、機械学習後の予測モデルを予測部１０５及び予測モデル記憶部１１０に出力する。ここでは、学習用データセットの数は、一部の初期構造の数と同じであり、ｍ個である。

　（ステップＳ１０５）
　予測部１０５は、構造記憶部１０８から最終エネルギーが算出されていない初期構造、つまり複数の初期構造のうちの他の初期構造を取得する。そして、予測部１０５は、ステップＳ１０４で機械学習された予測モデルにより、他の初期構造に対応する最終エネルギーの予測値を算出する。ここで、他の初期構造の数は、複数の初期構造から一部の初期構造を除いた数である。つまり、予測部１０５（第３ステップ）における他の初期構造は、（ｎ－ｍ）個の初期構造である。

　なお、実施の形態１では、予測モデルはステップＳ１０４で機械学習した予測モデルであるが、予測モデル記憶部１１０から取得した事前に学習済みの他の予測モデルであってもよい。

　（ステップＳ１０６）
　比較部１０６は、ステップＳ１０３で算出された最終エネルギーと、ステップＳ１０５で算出された最終エネルギーの予測値とを、最もエネルギーの小さい値から順番に並び替えたリストを系ごとに生成し、生成したリストを出力部１０７に出力する。つまり、比較部１０６は、最終エネルギー及び最終エネルギーの予測値から最小値を示すエネルギーを系ごとに抽出する。

　（ステップＳ１０７）
　出力部１０７は、ステップＳ１０６で生成されたリストに含まれる初期構造及び最終エネルギーの予測値、並びに最終構造及び最終エネルギーを、最もエネルギーの小さい構造から順番にディスプレイに表示することで出力する。

　このように、実施の形態１では、全ての初期構造に対して構造最適化を実施するのではなく、一部の初期構造に対してのみ構造最適化を実施し、残りの他の初期構造に対しては予測モデルを用いることにより、構造最適化についての演算を省略している。このため、実施の形態１では、全ての初期構造に対して構造最適化を実施した場合と同様に、新規物質における熱力学的に最も安定と考えられる原子配置の構造を探索することが可能であり、かつ、探索に要する演算をある程度省略することが可能である。つまり、実施の形態１では、全ての初期構造に対して構造最適化を実施する場合と比較して、演算コストを削減することができ、原子の脱離後の材料の組成についての原子配置の安定構造を効率的に探索することができる。

　（実施の形態２）
　以下、本開示の実施の形態２に係る探索システム２００（探索方法、又はプログラム）について、図面を用いて詳細に説明する。実施の形態２に係る探索システム２００は、予測モデルを機械学習させる際に、初期構造だけではなく中間構造及び最終構造を使用する点で、実施の形態１に係る探索システム１００と相違する。なお、本実施の形態において、実施の形態１と同一の構成要素には同一の符号を付し、説明を省く。

　図１６は、実施の形態２に係る探索システム２００を含む全体構成を示すブロック図である。図１６に示すように、探索システム２００は、生成部１０２と、算出部２０３と、学習部２０４と、予測部１０５と、比較部１０６と、出力部１０７と、を備えている。探索システム２００の周辺の構成として、入力部１０１と、構造記憶部１０８と、算出結果記憶部２０９と、予測モデル記憶部２１０と、がある。なお、探索システム２００の周辺の構成は、探索システム２００の構成要素に含まれていてもよい。探索システム２００における生成部１０２及び学習部２０４は、予測モデル構築装置の構成要素でもある。

　以下、図１６に示した各構成要素の詳細について述べる。なお、算出結果記憶部２０９、予測モデル記憶部２１０、算出部２０３、及び学習部２０４以外の各構成要素については、実施の形態１と同じであるため、説明を省略する。

　（算出部２０３）
　算出部２０３は、構造記憶部１０８から初期構造の一部を取得し、取得した初期構造に対して構造最適化を実行する。算出部１０３は、構造最適化を繰り返すことにより得られた最終構造に対応するエネルギー（第１エネルギー）を算出する処理を実行する。

　算出部２０３は、初期構造、当該初期構造に対して構造最適化を繰り返し実行することで得られた最終構造、及び算出した最終構造に対応する最終エネルギーを系ごとに算出結果記憶部２０９に出力する。そして、実施の形態２では、算出部２０３は、当該初期構造に対して構造最適化を実施するごとに得られる中間構造も算出結果記憶部２０９に出力する。

　算出結果記憶部２０９は、算出部２０３で算出された最終エネルギーと、対応する初期構造と、対応する中間構造と、対応する最終構造との組を系ごとに記憶する。図１７は、実施の形態２に係る算出結果記憶部２０９に記憶されているデータの一例を示す図である。図１７においては、左列が初期構造ＩＤを、真ん中の列が構造実施化を実施するごとに得られる中間構造の原子配置及び最終構造の原子配置を、右列が最終構造に対応する最終エネルギーを表している。なお、図１７では、初期構造の原子配置の図示を省略している。

　（学習部２０４）
　学習部２０４は、算出結果記憶部２０９から初期構造、中間構造、最終構造、及び最終構造の最終エネルギーを取得し、これらを用いて予測モデルを学習する。

　図１８は、実施の形態２に係る学習部２０４による予測モデルを機械学習する過程の一例を示す図である。図１８に示すように、実施の形態２では、学習用データセットに含まれる入力データは、初期構造のみならず、構造最適化を実施するごとに得られる中間構造及び最終構造を更に含んでいる。

　つまり、実施の形態２では、学習部２０４は、初期構造を入力データ、最終エネルギーを正解データとして含む第１学習用データセットのみならず、中間構造又は最終構造を入力データ、最終エネルギーを正解データとして含む第２学習用データセットを更に用いて、予測モデルを機械学習させている。このため、実施の形態２では、予測モデルは、第１学習用データセットの他に、更に、構造最適化された原子配置の構造、つまり中間構造又は最終構造を入力データ、当該構造に対応する第１エネルギー、つまり最終エネルギーを正解データとして含む第２学習用データセットを用いて機械学習されたモデルである。なお、学習部２０４による予測モデルの機械学習の処理の詳細は、実施の形態１と同様であるため、説明を省略する。

　学習部２０４は、機械学習が完了した予測モデル、つまり学習済みモデルを予測部１０５及び予測モデル記憶部２１０に出力する。

　予測モデル記憶部２１０は、学習部２０４で機械学習された予測モデルについて、グラフニューラルネットワークの構造及び重みを記憶する。

　（実施の形態２：予測精度の検証）
　以下、実施の形態２に係る予測部１０５の予測精度の検証について説明する。この検証は、実施の形態１での検証と同様に、組成Ｌｉ_１２Ｍｎ_６Ｎｉ_６Ｏ_２４を有する物質から１個以上のＬｉ原子が脱離した脱離後の物質の組成について、系ごとに予測部１０５が安定構造を予測できるか否かを確かめることを目的とする。

　検証の内容は、基本的に実施の形態１での検証と同じ内容であるため、同じ内容については説明を省略する。実施の形態２での検証は、予測モデルの機械学習に用いる学習用データセットが、上述の第１学習用データセットのみならず、上述の第２学習用データセットを更に含んでいる点で、実施の形態１での検証と相違する。

　図１９は、実施の形態２に係る予測部１０５の予測精度を検証した結果を示す図である。図１９において、各列が何を表しているかについては、実施の形態１の図１３と同様であるため、ここでは説明を省略する。

　ここで、検証用データの数が多いほど、予測部１０５による予測精度の低下が懸念される。しかしながら、例えばＬｉ原子が３個脱離した系については、２２組の検証用データのうち実際に最も安定と考えられる原子配置の構造が、予測部１０５では２番目に安定な構造であると予測された。例えばＬｉ原子が６個脱離した系についても、９２組の検証用データのうち実際に最も安定と考えられる原子配置の構造が、予測部１０５では１番目に安定な構造であると予測された。

　上述のように、これらの結果から、予測部１０５は、いずれの系についても、実際に最も安定と考えられる原子配置の構造を、当該系についての検証用データ全体の１番目又は2番目に安定な構造であると予測できていることがわかる。つまり、検証用データの数が多くなっても、予測部１０５による予測精度が殆ど低下していないことがわかる。

　図２０は、実施の形態２に係る予測部１０５の予測精度と学習用データの比率との相関を検証した結果を示す図である。具体的には、図２０は、組成Ｌｉ_１４Ｍｎ_５Ｎｉ_５Ｏ_２４を有する物質からのＬＩ原子の脱離した数ごと、つまり系ごとに、学習用データの比率を変更しながら予測部１０５の予測精度を検証した場合の結果を示す図である。図２０において、各列が何を表しているかについては、実施の形態１の図１４と同様であるため、ここでは説明を省略する。

　図２０に示すように、学習用データの比率を減らしても、予測部１０５の予測精度の低下は殆ど見受けられなかった。例えば、学習用データの比率を１０％にした場合に、Ｌｉ原子が６個脱離した系においては８３１組ある検証用データのうち実際に最も安定と考えられる原子配置の構造が、予測部１０５では４２番目に安定な構造であると予測された。これに対して、実施の形態１では、学習用データの比率を１０％にした場合に、Ｌｉ原子が６個脱離した系においては８３１組ある検証用データのうち実際に最も安定と考えられる原子配置の構造が、予測部１０５では６８４番目に安定であると予測された。すなわち、実施の形態２では、構造最適化された原子配置の構造、つまり中間構造又は最終構造を入力データとして含む学習用データセットを更に用いて予測モデルを機械学習させることにより、学習用データの比率が低い場合であっても、高い精度での予測が可能であると考えられる。

　（実施の形態２：動作の説明）
　次に、探索システム２００の動作について説明する。

　（フローチャート）
　図２１は、実施の形態２に係る探索システム２００の動作例を示すフローチャートである。ステップＳ２０１～Ｓ２０３、及びステップＳ２０５～Ｓ２０７の処理は、それぞれ図１５に示すステップＳ１０１～Ｓ１０３、及びＳ１０５～Ｓ１０７の処理と同じであるため、説明を省略する。すなわち、ステップＳ２０４以外は、実施の形態１に係る探索システム１００の処理の全体的な流れと同じである。

　（ステップＳ２０４）
　学習部２０４は、ステップＳ２０３で算出された最終エネルギーと初期構造との組、及び当該最終エネルギーと構造最適化された構造との組を学習用データセットとして、グラフニューラルネットワークにより構成される予測モデルの機械学習を行う。ここでいう「構造最適化された構造」とは、中間構造又は最終構造である。そして、学習部２０４は、機械学習後の予測モデルを予測部１０５及び予測モデル記憶部２１０に出力する。

　このように、実施の形態２では、構造最適化された原子配置の構造、つまり中間構造又は最終構造を入力データとして含む学習用データセットを更に用いて予測モデルを機械学習させている。このため、実施の形態２では、実施の形態１と比較して、入力された初期構造に対して構造最適化が実施された場合の構造に対応するエネルギーを、更に精度良く予測しやすい。

　（実施の形態３）
　以下、本開示の実施の形態３に係る探索システム３００（探索方法、又はプログラム）について、図面を用いて詳細に説明する。実施の形態３に係る探索システム３００は、初期構造に対して構造最適化が実施された場合の原子配置の構造に対応する第２エネルギーを予測する際に、予め機械学習された既知構造に関する予測モデルを用いる点で、実施の形態１に係る探索システム１００又は実施の形態２に係る探索システム２００と相違する。なお、本実施の形態において、実施の形態１又は実施の形態２と同一の構成要素には同一の符号を付し、説明を省く。

　図２２は、実施の形態３に係る探索システム３００を含む全体構成を示すブロック図である。図２２に示すように、探索システム３００は、生成部１０２と、予測部３０５と、比較部３０６と、出力部１０７と、を備えており、学習部１０４又は学習部２０４を備えていない。探索システム３００の周辺の構成として、入力部１０１と、構造記憶部１０８と、予測モデル記憶部３１０と、がある。なお、探索システム３００の周辺の構成は、探索システム３００の構成要素に含まれていてもよい。

　以下、図２２に示した各構成要素の詳細について述べる。なお、予測モデル記憶部３１０、予測部３０５、及び比較部３０６以外の各構成要素については、実施の形態１と同じであるため、説明を省略する。

　（予測モデル記憶部３１０）
　予測モデル記憶部３１０は、予め機械学習された学習済みの予測モデルについて、グラフニューラルネットワークの構造及び重みを記憶する。ここで採用される予測モデルは、例えば、原子の脱離後の材料の組成と類似する既知の組成についての既知構造に関する予測モデル、又は汎用的に学習された予測モデルである。ここでいう「類似」とは、例えば原子の脱離後の材料の組成及び既知材料の組成の各々に含まれる元素が一部のみ異なっていることをいう。「類似」とは、既知材料の組成が、原子の脱離後の材料の組成に含まれる少なくとも１つの元素を含むことをいう。

　実施の形態３では、予測モデルは、前者の予測モデル、つまり既知構造に関する予測モデルである。この予測モデルは、例えば、既知構造を入力データ、当該既知構造に対して構造最適化を実施して得られた最終構造に対応する最終エネルギーを正解データとして含む学習用データセットを用いて、予め機械学習される。

　（予測部３０５）
　予測部３０５は、構造記憶部１０８から初期構造を取得する。そして、予測部３０５は、予測モデル記憶部３１０から取得した学習済みの予測モデルに当該初期構造を入力することで、当該初期構造の最終エネルギーを予測する。実施の形態３では、予測部３０５は、全ての初期構造の各々について、予測モデルを用いて最終エネルギーを予測する。つまり、予測部３０５は（第８ステップでは）、複数の初期構造それぞれに対して予測モデルを用いることにより、当該初期構造に対して構造最適化が実施された場合の原子配置の構造に対応するエネルギーを予測する。ここでいう「エネルギー」は、初期構造に対して構造最適化が実施された場合の最終構造に対応する最終エネルギーの予測値である。

　予測部３０５は、初期構造と、当該初期構造に対応する最終エネルギーの予測値とを系ごとに比較部３０６に出力する。

　（比較部３０６）
　比較部３０６は、予測部３０５から初期構造及び最終エネルギーの予測値の組を取得する。そして、比較部３０６は、初期構造及び最終エネルギーの予測値の組を並べたリストを生成する。

　図２３は、実施の形態３に係る比較部３０６により生成されたデータの一例を示す図である。図２３においては、左列が初期構造の原子配置を、右列が初期構造に対応する最終エネルギーの予測値を表している。比較部３０６は、リストに基づいて、最終エネルギーの予測値を所定の順番で並べ替える。実施の形態３では、比較部３０６は、最もエネルギーの小さい値から順番に最終エネルギーの予測値を並べ替える。このような最終エネルギーの予測値の並べ替えは、最終エネルギーの予測値から最も小さい値、言い換えれば極小値又は最小値を抽出する処理に相当する。

　つまり、比較部３０６は（第９ステップでは）、予測された複数のエネルギーから、極小値を示すエネルギーを抽出する。ここでいう「エネルギー」は、初期構造に対して構造最適化が実施された場合の最終構造に対応する最終エネルギーの予測値である。ここでは、極小値は、エネルギーのうちの最小値である。

　比較部３０６は、上述のように最終エネルギーの予測値を並べ替えたリストを系ごとに出力部１０７に出力する。

　（実施の形態３：動作の説明）
　次に、探索システム３００の動作について説明する。

　（フローチャート）
　図２４は、実施の形態３に係る探索システム３００の処理の動作例を示すフローチャートである。ステップＳ３０１，Ｓ３０２の処理は、それぞれ図１５に示すステップＳ１０１，Ｓ１０２の処理と同じであるため、説明を省略する。

　（ステップＳ３０３）
　探索システム３００は、予め機械学習済みであって、原子の脱離後の材料の組成と類似の組成についての既知構造に関する予測モデルを取得し、予測モデル記憶部３１０に出力する。

　（ステップＳ３０４）
　予測部３０５は、構造記憶部１０８から初期構造を取得する。そして、予測部３０５は、ステップＳ３０３で取得された予測モデルにより、初期構造に対応する最終エネルギーの予測値を算出する。

　（ステップＳ３０５）
　比較部３０６は、ステップＳ３０４で算出された最終エネルギーの予測値を、最もエネルギーの小さい値から順番に並び替えたリストを系ごとに生成し、生成したリストを出力部１０７に出力する。つまり、比較部３０６は、最終エネルギーの予測値から最小値を示すエネルギーを系ごとに抽出する。

　（ステップＳ３０６）
　出力部１０７は、ステップＳ３０５で生成されたリストに含まれる初期構造及び最終エネルギーの予測値を、最もエネルギーの小さい構造から順番にディスプレイに表示することで出力する。

　このように、実施の形態３では、全ての初期構造に対して、予め機械学習させた予測モデルを用いているため、構造最適化についての演算をしなくて済む。このため、実施の形態３では、実施の形態１又は実施の形態２と同様に、新規物質における熱力学的に最も安定と考えられる原子配置の構造を探索することが可能であり、かつ、探索に要する演算を大幅に省略することが可能である。つまり、実施の形態３では、一部の初期構造に対して構造最適化を実施する場合と比較して、演算コストを削減することができ、材料の組成についての原子配置の安定構造を効率的に探索することができる。

　（実施の形態４）
　以下、本開示の実施の形態４に係る探索システム４００（探索方法、又はプログラム）について、図面を用いて詳細に説明する。実施の形態４に係る探索システム４００は、予め機械学習された既知構造に関する予測モデルを用いており、かつ、予測モデルを再学習するか否かを検証する点で、実施の形態３に係る探索システム３００と相違する。なお、本実施の形態において、実施の形態１、実施の形態２、又は実施の形態３と同一の構成要素には同一の符号を付し、説明を省く。

　図２５は、実施の形態４に係る探索システム４００を含む全体構成を示すブロック図である。図２５に示すように、探索システム４００は、生成部１０２と、算出部１０３と、学習部４０４と、予測部４０５と、比較部１０６と、出力部１０７と、を備えている。探索システム４００の周辺の構成として、入力部１０１と、構造記憶部１０８と、算出結果記憶部１０９と、予測モデル記憶部３１０と、がある。なお、探索システム４００の周辺の構成は、探索システム４００の構成要素に含まれていてもよい。

　以下、図２５に示した各構成要素の詳細について述べる。なお、学習部４０４及び予測部４０５以外の各構成要素については、実施の形態１又は実施の形態３と同じであるため、説明を省略する。

　（学習部４０４）
　学習部４０４は、予測部４０５において予測モデルの予測精度が条件を満たしていないと判定された場合に、予測モデルを再学習する。具体的には、学習部４０４は、算出結果記憶部１０９から初期構造及び最終構造の最終エネルギーを取得し、これらを用いて予測モデル記憶部３１０から取得した予測モデルを再学習する。ここで、予測モデルの再学習に用いる学習用データセットは、初期構造を入力データ、最終エネルギーを正解データとして含む。

　学習部４０４は、再学習が完了した予測モデルを予測部４０５及び予測モデル記憶部３１０に出力する。

　予測モデル記憶部３１０は、学習部４０４で再学習された予測モデルについて、グラフニューラルネットワークの構造及び重みを記憶する。つまり、予測モデル記憶部３１０では、既に記憶されている予測モデルが、再学習された予測モデルに更新される。

　（予測部４０５）
　予測部４０５は、算出結果記憶部１０９から初期構造及び最終構造の最終エネルギーを取得する。予測部４０５は、予測モデル記憶部３１０から予測モデルを取得する。ここで予測部４０５が取得する予測モデルは、学習部４０４により再学習される前の予測モデルである。予測部４０５は、取得した予測モデルに当該初期構造を入力することで、当該初期構造の最終エネルギーを予測する。そして、予測部４０５は、最終エネルギーの予測値と、算出結果記憶部１０９から取得した最終エネルギーとを比較することにより、予測モデルの予測精度を検証する。具体的には、予測部４０５は、一例として、最終エネルギーと最終エネルギーの予測値との二乗平均平方根誤差（Root Mean Squared Error：ＲＭＳＥ）が一定の値を下回っていれば、予測モデルの予測精度が十分である、つまり予測精度の条件を満たしている、と判定する。一方、予測部４０５は、上記のＲＭＳＥが一定の値を上回っていれば、予測モデルの予測精度が不十分である、つまり予測精度の条件を満たしていない、と判定する。予測部４０５は、例えば実際に最も安定と考えられる原子配置の構造を、一定の順位内で安定な構造と予測されていることをもって、予測精度の条件を満たしていると判定してもよい。なお、予測モデルの予測精度の検証手法は、上記の手法に限定されず、他の手法であってもよい。

　つまり、予測部４０５は（第１０ステップでは）、一部の初期構造のうちの少なくとも１つの初期構造に対して予測モデルを用いることにより、当該初期構造に対して構造最適化が実施された場合の原子配置の構造に対応する第２エネルギーを予測する。ここでは、第２エネルギーは、少なくとも１つの初期構造に対して構造最適化が実施された場合の最終構造に対応する最終エネルギーの予測値である。予測部４０５は（第１１ステップでは）、第１エネルギーと第２エネルギーとを比較することで予測モデルの予測精度を検証する。ここでは、第１エネルギーは、少なくとも１つの初期構造に対応する最終構造の最終エネルギーである。

　予測モデルの予測精度の条件を満たしている場合、又は学習部４０４により予測モデルが再学習された場合、予測部４０５は、構造記憶部１０８から最終エネルギーを未算出の初期構造を取得する。ここでいう「最終エネルギーを未算出の初期構造」とは、複数の初期構造のうちの一部の初期構造を除いた構造、つまり他の初期構造である。そして、予測部４０５は、予測モデルに当該初期構造を入力することで、当該初期構造の最終エネルギーを予測する。

　つまり、予測部４０５（第１１ステップ）における結果が所定の条件を満たす場合、つまり予測精度の条件を満たす場合、予測部４０５は（第１２ステップでは）、複数の初期構造のうちの他の初期構造に対して予測モデルを用いることにより、他の初期構造に対して構造最適化が実施された場合の原子配置の構造に対応する第２エネルギーを予測する。ここでは、第２エネルギーは、他の初期構造に対して構造最適化が実施された場合の最終構造に対応する最終エネルギーの予測値である。

　予測部４０５は、初期構造と、当該初期構造に対応する最終エネルギーの予測値とを系ごとに比較部１０６に出力する。

　（実施の形態４：動作の説明）
　次に、探索システム４００の動作について説明する。

　（フローチャート）
　図２６は、実施の形態４に係る探索システム４００の処理の動作例を示すフローチャートである。ステップＳ４０１～Ｓ４０３の処理は、それぞれ図２４に示すステップＳ３０１～Ｓ３０３の処理と同じであるため、説明を省略する。

　（ステップＳ４０４）
　算出部１０３は、ステップＳ４０３で生成された複数の初期構造のうち一部の初期構造に対して構造最適化を実行し、構造最適化を実施することで得られた最終構造に対応する最終エネルギーを算出する。そして、算出部１０３は、算出結果を系ごとに算出結果記憶部１０９に出力する。

　（ステップＳ４０５）
　予測部４０５は、算出結果記憶部１０９から初期構造、つまり一部の初期構造を取得する。そして、予測部４０５は、ステップＳ４０３で取得された予測モデルにより、一部の初期構造に対応する最終エネルギーの予測値を算出する。

　（ステップＳ４０６）
　予測部４０５は、ステップＳ４０５で算出された最終エネルギーの予測値と、ステップＳ４０４で算出された最終エネルギーとを比較することで、予測モデルの予測精度を検証する。予測結果が予測精度の条件を満たしている場合（ステップＳ４０６：Ｙｅｓ）、処理はステップＳ４０８に進む。一方、予測結果が予測精度の条件を満たしていない場合（ステップＳ４０６：Ｎｏ）、処理はステップＳ４０７に進む。

　（ステップＳ４０７）
　学習部４０４は、ステップＳ４０４で算出された最終エネルギーと初期構造との組を学習用データセットとして、グラフニューラルネットワークにより構成される予測モデルの再学習を行う。そして、学習部４０４は、再学習後の予測モデルを予測部４０５及び予測モデル記憶部３１０に出力する。なお、予測モデルの再学習にあたっては、上記一部の初期構造とは別の初期構造と最終エネルギーとの組を、学習用データセットとして更に用いてもよい。この場合、当該別の初期構造に対応する最終エネルギーを、算出部１０３で別途算出する必要がある。

　（ステップＳ４０８）
　予測部４０５は、構造記憶部１０８から最終エネルギーが算出されていない初期構造、つまり複数の初期構造のうちの他の初期構造を取得する。そして、予測部４０５は、予測モデルにより、他の初期構造に対応する最終エネルギーの予測値を算出する。ここで、予測モデルについては、ステップＳ４０６で予測結果が予測精度の条件を満たした場合には、Ｓ４０３で取得した予測モデルが採用される。一方、ステップＳ４０６で予測結果が予測精度の条件を満たしていない場合には、ステップＳ４０７で再学習された予測モデルが採用される。

　（ステップＳ４０９）
　比較部１０６は、ステップＳ４０４で算出された最終エネルギーと、ステップＳ４０８で算出された最終エネルギーの予測値とを、最もエネルギーの小さい値から順番に並び替えたリストを系ごとに生成し、生成したリストを出力部１０７に出力する。つまり、比較部１０６は、最終エネルギー及び最終エネルギーの予測値から最小値を示すエネルギーを抽出する。言い換えれば、比較部１０６は（第１３ステップでは）、第１エネルギー及び第２エネルギーに基づいて、極小値を示す第３エネルギーを抽出する。ここでは、第１エネルギーは算出結果記憶部１０９から取得した最終エネルギー、第２エネルギーは予測部４０５から取得した最終エネルギーの予測値である。第３エネルギーは、第１エネルギー及び第２エネルギーの最小値である。

　（ステップＳ４１０）
　出力部１０７は、ステップＳ４０９で生成されたリストに含まれる初期構造及び最終エネルギーの予測値を、最もエネルギーの小さい構造から順番にディスプレイに表示することで出力する。

　このように、実施の形態４では、予め機械学習させた予測モデルを用いつつ、当該予測モデルの予測精度を検証している。このため、実施の形態４では、十分な予測精度を有する予測モデルを実現しやすくなる。実施の形態４では、予測精度の条件を満たした予測モデル、つまり比較的予測精度の高い予測モデルを用いることで、材料の組成についての原子配置の安定構造を更に効率的に探索しやすい。

　（変形例）
　上記各実施の形態では、極小値は、第１エネルギー及び第２エネルギーのうちの最小値であるが、これに限られない。なお、第１エネルギーは、算出部１０３で算出された最終エネルギーであり、第２エネルギーは、予測部１０５、３０６，４０６で予測された最終エネルギーの予測値である。例えば、第１エネルギー及び第２エネルギーのうち最も小さい値が第２エネルギーの最小値であって、２番目に小さい値が第１エネルギーの最小値であり、これらの値が近似している、と仮定する。例えば、２つの値の差が第２エネルギーの最小値の１００００分の１以内とする。この場合、極小値は、第２エネルギーの最小値ではなく、第１エネルギーの最小値であってもよい。予測された値よりも、実際に算出した値の方が精度が良いと考えられるからである。

　上記各実施の形態では、探索対象の材料から脱離する原子はＬｉ原子であるが、これに限られない。例えば、探索対象の材料から脱離する原子はＯ原子であってもよいし、他の原子であってもよい。

　上記各実施の形態では、探索システム１００～４００は、生成部１０２が複数の初期構造を生成することにより複数の初期構造を取得しているが、これに限られない。例えば、探索システム１００～４００は、他のシステムで生成された複数の初期構造を取得してもよい。この場合、生成部１０２は不要である。つまり、取得ステップでは、複数の初期構造を生成することで取得してもよいし、他のシステムで生成された複数の初期構造を取得してもよい。

　上記各実施の形態において、各構成要素は、専用のハードウェアで構成されるか、各構成要素に適したソフトウェアプログラムを実行することによって実現されてもよい。各構成要素は、ＣＰＵ（Central Processing Unit）又はプロセッサ等のプログラム実行部が、ハードディスク又は半導体メモリ等の記録媒体に記録されたソフトウェアプログラムを読み出して実行することによって実現されてもよい。

　なお、以下のような場合も本開示に含まれる。

　（１）上記の少なくとも１つのシステムは、具体的には、マイクロプロセッサ、ＲＯＭ、ＲＡＭ、ハードディスクユニット、ディスプレイユニット、キーボード、マウスなどから構成されるコンピュータシステムである。そのＲＡＭ又はハードディスクユニットには、コンピュータプログラムが記憶されている。マイクロプロセッサが、コンピュータプログラムにしたがって動作することにより、上記の少なくとも１つのシステムは、その機能を達成する。ここでコンピュータプログラムは、所定の機能を達成するために、コンピュータに対する指令を示す命令コードが複数個組み合わされて構成されたものである。

　（２）上記の少なくとも１つのシステムを構成する構成要素の一部又は全部は、１個のシステムＬＳＩ（Large Scale Integration：大規模集積回路）から構成されているとしてもよい。システムＬＳＩは、複数の構成部を１個のチップ上に集積して製造された超多機能ＬＳＩであり、具体的には、マイクロプロセッサ、ＲＯＭ、ＲＡＭなどを含んで構成されるコンピュータシステムである。上記ＲＡＭには、コンピュータプログラムが記憶されている。マイクロプロセッサが、コンピュータプログラムにしたがって動作することにより、システムＬＳＩは、その機能を達成する。

　（３）上記の少なくとも１つのシステムを構成する構成要素の一部又は全部は、その装置に脱着可能なＩＣカード又は単体のモジュールから構成されているとしてもよい。ＩＣカード又はモジュールは、マイクロプロセッサ、ＲＯＭ、ＲＡＭなどから構成されるコンピュータシステムである。ＩＣカード又はモジュールは、上記の超多機能ＬＳＩを含むとしてもよい。マイクロプロセッサが、コンピュータプログラムにしたがって動作することにより、ＩＣカード又はモジュールは、その機能を達成する。このＩＣカード又はこのモジュールは、耐タンパ性を有するとしてもよい。

　（４）本開示は、上記に示す方法であるとしてもよい。また、これらの方法をコンピュータにより実現するコンピュータプログラムであるとしてもよいし、コンピュータプログラムからなるデジタル信号であるとしてもよい。

　本開示は、コンピュータプログラム又はデジタル信号をコンピュータ読み取り可能な記録媒体、例えば、フレキシブルディスク、ハードディスク、ＣＤ（Compact Disc）－ＲＯＭ、ＤＶＤ、ＤＶＤ－ＲＯＭ、ＤＶＤ－ＲＡＭ、ＢＤ（Blu-ray（登録商標） Disc）、半導体メモリなどに記録したものとしてもよい。これらの記録媒体に記録されているデジタル信号であるとしてもよい。

　本開示は、コンピュータプログラム又はデジタル信号を、電気通信回線、無線又は有線通信回線、インターネットを代表とするネットワーク、データ放送等を経由して伝送するものとしてもよい。

　プログラム又はデジタル信号を記録媒体に記録して移送することにより、又はプログラム又はデジタル信号をネットワーク等を経由して移送することにより、独立した他のコンピュータシステムにより実施するとしてもよい。

　本開示は、全ての原子配置構造の候補に対して計算を行わなくても安定な原子配置構造の探索が可能であり、大規模な計算資源が用意できない状況で、新規材料の安定な原子配置構造を探索する場合に有用である。

　１００，２００，３００，４００　探索システム
　１０１　入力部
　１０２　生成部
　１０３，２０３　算出部
　１０４，２０４，４０４　学習部
　１０５，３０５，４０５　予測部
　１０６，３０６　比較部
　１０７　出力部
　１０８　構造記憶部
　１０９，２０９　算出結果記憶部
　１１０，２１０，３１０　予測モデル記憶部

Claims

　材料の組成についての３次元空間における原子配置の安定構造を探索するための探索方法であって、
　コンピュータが、
　前記材料に含まれる原子の脱離によって脱離後の材料の組成がとり得る前記３次元空間における原子配置の構造である複数の初期構造を取得する第１ステップと、
　複数の前記初期構造のうちの一部の初期構造に対して構造最適化を実施し、構造最適化された原子配置の構造に対応する第１エネルギーを算出する第２ステップと、
　複数の前記初期構造のうちの他の初期構造に対して予測モデルを用いることにより、前記他の初期構造に対して構造最適化が実施された場合の原子配置の構造に対応する第２エネルギーを予測する第３ステップと、
　前記第１エネルギー及び前記第２エネルギーに基づいて、極小値を示す第３エネルギーを抽出する第４ステップと、
　前記第３エネルギー、前記第３エネルギーに対応する原子配置の構造である第１構造、または、前記第３エネルギー及び前記第１構造を出力する第５ステップと、を実行し、
　前記予測モデルは、任意の原子配置の構造を入力として、当該構造に対して構造最適化が実施された場合の構造に対応するエネルギーを前記第２エネルギーとして出力するように機械学習されている、
　探索方法。
　前記材料には、脱離し得る前記原子がｘ個（ｘは２以上の整数）含まれており、
　前記第１ステップでは、前記原子がｚ個（ｚは１≦ｚ≦ｘ－１の整数）脱離した系について、_ｘＣ_ｚ個の複数の前記初期構造を生成する、
　請求項１に記載の探索方法。
　前記第１ステップにおいて、ｎ個（ｎは２以上の整数）の前記初期構造を取得した場合に、
　前記第２ステップにおける前記一部の初期構造は、ｍ個（ｍは１≦ｍ＜ｎの整数）の前記初期構造であり、
　前記第３ステップにおける前記他の初期構造は、（ｎ―ｍ）個の前記初期構造である、
　請求項１又は２に記載の探索方法。
　前記第３エネルギーは、前記第１エネルギー及び前記第２エネルギーの最小値である、
　請求項１～３のいずれか一項に記載の探索方法。
　前記予測モデルは、
　前記初期構造を入力データ、当該初期構造に対応する前記第１エネルギーを正解データとして含む第１学習用データセットを用いて機械学習されたモデルである、
　請求項１～４のいずれか一項に記載の探索方法。
　前記予測モデルは、
　更に、前記構造最適化された原子配置の構造を入力データ、当該構造に対応する前記第１エネルギーを正解データとして含む第２学習用データセットを用いて機械学習されたモデルである、
　請求項５に記載の探索方法。
　前記第２ステップにおける前記一部の初期構造の数は、複数の前記初期構造の数の９０％以下である、
　請求項１～６のいずれか一項に記載の探索方法。
　材料の組成についての３次元空間における原子配置の安定構造を探索するための探索システムであって、
　前記材料に含まれる原子の脱離による脱離後の材料の組成がとり得る前記３次元空間における原子配置の構造である複数の初期構造を生成する生成部と、
　複数の前記初期構造のうちの一部の初期構造に対して構造最適化を実施し、構造最適化された原子配置の構造に対応する第１エネルギーを算出する算出部と、
　複数の前記初期構造のうちの他の初期構造に対して予測モデルを用いることにより、前記他の初期構造に対して構造最適化が実施された場合の原子配置の構造対応する第２エネルギーを予測する予測部と、
　前記第１エネルギー及び前記第２エネルギーを出力する出力部と、を備え、
　前記予測モデルは、任意の原子配置の構造を入力として、当該構造に対して構造最適化が実施された場合の構造に対応するエネルギーを前記第２エネルギーとして出力するように機械学習されている、
　探索システム。
　前記出力部は、前記第１エネルギー及び前記第２エネルギーに基づいて抽出された、極小値を示す第３エネルギー、前記第３エネルギーに対応する原子配置の構造である第１構造、または、前記第３エネルギー及び前記第１構造を出力する、
　請求項８に記載の探索システム。
　材料の組成についての３次元空間における原子配置の安定構造を探索するためのプログラムであって、
　前記材料に含まれる原子の脱離による脱離後の材料の組成がとり得る前記３次元空間における原子配置の構造である複数の初期構造を取得する第１ステップと、
　複数の前記初期構造のうちの一部の初期構造に対して構造最適化を実施し、構造最適化された原子配置の構造に対応する第１エネルギーを算出する第２ステップと、
　複数の前記初期構造のうちの他の初期構造に対して予測モデルを用いることにより、前記他の初期構造に対して構造最適化が実施された場合の原子配置の構造に対応する第２エネルギーを予測する第３ステップと、
　前記第１エネルギー及び前記第２エネルギーを出力する第６ステップと、をコンピュータに実行させ、
　前記予測モデルは、任意の原子配置の構造を入力として、当該構造に対して構造最適化が実施された場合の構造に対応するエネルギーを前記第２エネルギーとして出力するように機械学習されている、
　プログラム。
　前記第１エネルギー及び前記第２エネルギーに基づいて、極小値を示す第３エネルギーを抽出する第４ステップを前記コンピュータに更に実行させ、
　前記第６ステップでは、前記第３エネルギー、前記第３エネルギーに対応する原子配置の構造である第１構造、または、前記第３エネルギー及び前記第１構造を更に出力する、
　請求項１０に記載のプログラム。
　コンピュータが、
　材料に含まれる原子の脱離による脱離後の材料の組成がとり得る３次元空間における原子配置の構造である初期構造を取得する第１ステップと、
　前記初期構造を入力データ、当該初期構造に対して構造最適化を実施して得られた原子配置の構造に対応するエネルギーを正解データとして含む学習用データセットを用いて、任意の原子配置の構造の入力に対して当該構造が構造最適化された場合の構造に対応するエネルギーを出力するように機械学習させる第７ステップと、を実行する、
　予測モデル構築方法。
　材料に含まれる原子の脱離による脱離後の材料の組成がとり得る３次元空間における原子配置の構造である初期構造を生成する生成部と、
　前記初期構造を入力データ、当該初期構造に対して構造最適化を実施して得られた原子配置の構造に対応するエネルギーを正解データとして含む学習用データセットを用いて、任意の原子配置の構造の入力に対して当該構造が構造最適化された場合の構造に対応するエネルギーを出力するように機械学習させる学習部と、を備える、
　予測モデル構築装置。
　請求項１３に記載の予測モデル構築装置により機械学習された予測モデルを用いて、前記材料の組成についての前記３次元空間における原子配置の安定構造を探索するための探索方法であって、
　コンピュータが、
　複数の前記初期構造を取得する第１ステップと、
　複数の前記初期構造それぞれに対して前記予測モデルを用いることにより、当該初期構造に対して構造最適化が実施された場合の原子配置の構造に対応するエネルギーを予測する第８ステップと、
　予測された複数の前記エネルギーから、極小値を示すエネルギーを抽出する第９ステップと、を実行する、
　探索方法。
　請求項１３に記載の予測モデル構築装置により機械学習された予測モデルを用いて、前記材料の組成についての前記３次元空間における原子配置の安定構造を探索するための探索方法であって、
　コンピュータが、
　複数の前記初期構造を取得する第１ステップと、
　複数の前記初期構造のうちの一部の初期構造に対して構造最適化を実施し、構造最適化された原子配置の構造に対応する第１エネルギーを算出する第２ステップと、
　前記一部の初期構造のうちの少なくとも１つの初期構造に対して前記予測モデルを用いることにより、当該初期構造に対して構造最適化が実施された場合の原子配置の構造に対応する第２エネルギーを予測する第１０ステップと、
　前記第１エネルギーと前記第２エネルギーとを比較することで前記予測モデルの予測精度を検証する第１１ステップと、を実行する、
　探索方法。
　前記第１１ステップにおける結果が所定の条件を満たす場合に、
　前記コンピュータが、
　複数の前記初期構造のうちの他の初期構造に対して前記予測モデルを用いることにより、前記他の初期構造に対して構造最適化が実施された場合の原子配置の構造に対応する前記第２エネルギーを予測する第１２ステップと、
　前記第１エネルギー及び前記第２エネルギーに基づいて、極小値を示す第３エネルギーを抽出する第１３ステップと、を更に実行する、
　請求項１５に記載の探索方法。