JP7207128B2 - 予測システム、予測方法、および予測プログラム - Google Patents

予測システム、予測方法、および予測プログラム Download PDF

Info

Publication number
JP7207128B2
JP7207128B2 JP2019080140A JP2019080140A JP7207128B2 JP 7207128 B2 JP7207128 B2 JP 7207128B2 JP 2019080140 A JP2019080140 A JP 2019080140A JP 2019080140 A JP2019080140 A JP 2019080140A JP 7207128 B2 JP7207128 B2 JP 7207128B2
Authority
JP
Japan
Prior art keywords
composition
input data
prediction
inorganic compound
prediction system
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2019080140A
Other languages
English (en)
Other versions
JP2020177508A (ja
Inventor
俊宏 井口
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
TDK Corp
Original Assignee
TDK Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by TDK Corp filed Critical TDK Corp
Priority to JP2019080140A priority Critical patent/JP7207128B2/ja
Publication of JP2020177508A publication Critical patent/JP2020177508A/ja
Application granted granted Critical
Publication of JP7207128B2 publication Critical patent/JP7207128B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Description

本開示の一側面は予測システム、予測方法、および予測プログラムに関する。
従来から、所望の特性を有する無機化合物をコンピュータシステムによって探索する試みが為されている。例えば、特許文献1には、遺伝的アルゴリズムを使用して、無機材料の結晶構造の生成、結晶構造の突然変異操作、結晶構造の交叉操作、結晶構造の構造緩和計算、目的関数の予測値の計算、目的関数の予測値に基づく結晶構造の選択と淘汰、第一原理計算による結晶構造の目的関数値の観測、前記目的関数値の観測結果に基づく回帰モデルの更新、および材料創成処理の終了判定の各処理を制御する遺伝的アルゴリズム制御部を備える材料創成装置が記載されている。
特開2018-10428号公報
世の中に存在するかまたは存在し得る無機化合物の数は非常に膨大である。無機化合物の特性を精度良く予測できれば、その膨大な候補の中から所望の無機化合物を特定することが可能になる。そのため、無機化合物の特性を精度良く予測することが望まれている。
本開示の一側面に係る予測システムは、少なくとも一つのプロセッサを備える。少なくとも一つのプロセッサは、無機化合物の組成を示す組成データを取得し、組成データで示される組成を周期表と関連付けることで、該組成に対応する行列を示す入力データを生成し、入力データを機械学習モデルに入力することで、無機化合物の特性の予測値を出力する。
このような側面においては、無機化合物の組成そのものだけではなく周期表も考慮されて無機化合物の特性が予測されるので、無機化合物の特性を精度良く予測することが可能になる。
本開示の一側面によれば、無機化合物の特性を精度良く予測することができる。
実施形態に係る予測システムの利用の一例を示す図である。 実施形態に係る予測システムの機能構成の一例を示す図である。 実施形態に係る予測システムで用いられるコンピュータのハードウェア構成の一例を示す図である。 学習済みモデルの生成の一例を示すフローチャートである。 入力データの生成の一例を示す図である。 学習済みモデルを用いた特性値の予測の一例を示すフローチャートである。 最適な組成の予測のための学習済みモデルの利用の一例を示すフローチャートである。 最適な組成の予測の一例を示すフローチャートである。
以下、添付図面を参照しながら本開示での実施形態を詳細に説明する。なお、図面の説明において同一または同等の要素には同一の符号を付し、重複する説明を省略する。
[システムの概要]
実施形態に係る予測システム10は無機化合物の特性を予測するコンピュータシステムである。無機化合物の特性とは、無機化合物が持つ特有の性質のことをいう。無機化合物の特性の例として比誘電率が挙げられる。しかし、予測システム10によって予測される特性はこれに限定されず、予測システム10は無機化合物の任意の特性を予測することができる。本開示では、無機化合物の特性を示す値を「特性値」といい、予測システム10によって予測される特性値を「予測特性値」という。
予測システム10は特性値を予測するために機械学習を利用する。機械学習とは、与えられた情報に基づいて反復的に学習することで法則またはルールを自律的に見つけ出す手法である。機械学習の具体的な手法は限定されない。例えば、予測システム10は、ニューラルネットワークを含んで構成される計算モデルである機械学習モデルを用いた機械学習を実行してもよい。ニューラルネットワークとは、人間の脳神経系の仕組みを模した情報処理のモデルのことをいう。より具体的な例として、予測システム10は、畳み込み層およびプーリング層を含んで構成される畳み込みニューラルネットワークを用いた機械学習を実行してもよい。畳み込みニューラルネットワークは、多層構造のニューラルネットワークを用いる深層学習の一種である。例えば、予測システム10は、畳み込みニューラルネットワークの代表例であるLeNet-5およびAlexNetのいずれかを用いてもよいし、これらとは異なる種類の畳み込みニューラルネットワークを用いてもよい。LeNet-5およびAlexNetは一般には画像の分類に用いられるので、無機化合物の特性を予測するためにそのニューラルネットワークの構造を変形してもよい。例えば、畳み込みおよびプーリングでのカーネルサイズを小さくし(例えば、カーネルサイズを2×2に設定する)、フィルタ数を少なくし、出力層をsoftmax関数から一つのノードに変更して回帰を出力するように、その構造を変形してもよい。
予測システム10は、学習を繰り返すことで機械学習モデルを訓練させ、この機械学習モデルを学習済みモデルとして取得することができる。これは学習フェーズに相当する。学習済みモデルは、無機化合物の特性を予測するために最適であると予測される機械学習モデルであり、“現実に最適である機械学習モデル”とは限らないことに留意されたい。予測システム10は、学習済みモデルを用いて入力データを処理することで、無機化合物の特性を示す予測値、すなわち予測特性値を出力することもできる。これは予測フェーズまたは運用フェーズに相当する。予測システム10は、その予測特性値に基づいて、最適であると予測される無機化合物の組成(これを「最適な組成」ともいう。)を出力してもよい。無機化合物の組成とは、無機化合物を構成する元素の組合せのことをいい、組成式で表すことができる。本開示では、無機化合物の組成を単に「組成」ともいう。予測システム10により予測される組成は、“現実に最適である無機化合物の組成”とは限らないことに留意されたい。予測された組成が実際に最適であるか否かは、実際に無機化合物を作製して特性値を測定することで判断することができる。
学習済みモデルはコンピュータシステム間で移植可能である。したがって、或るコンピュータシステムで生成された学習済みモデルを、別のコンピュータシステムで用いることができる。もちろん、一つのコンピュータシステムが学習済みモデルの生成および利用の双方を実行してもよい。すなわち、予測システム10は、学習フェーズおよび予測フェーズの双方を実行してもよいし、学習フェーズおよび予測フェーズのいずれか一方を実行しなくてもよい。
学習フェーズでは、予測システム10は個々の無機化合物についての組成および特性値を示す化合物データを利用する。予測システム10はその化合物データに基づいて入力データを生成し、その入力データを用いた機械学習を実行することで学習済みモデルを生成する。予測フェーズでは、予測システム10はその学習済みモデルに、特性値を予測したい組成を示す入力データを与えることで該組成の予測特性値を得る。予測システム10は複数の組成から得られる複数の予測特性値に基づいて最適な無機化合物の組成を予測してもよい。最適な無機化合物の組成を予測する場合には、予測システム10は機械学習に加えて最適化アルゴリズムを利用する。最適化アルゴリズムの例として遺伝的アルゴリズム(Genetic Algorithms,GA)、差分進化(Differential Evolution,DE)、粒子群最適化(Particle Swarm Optimization,PSO)、および分布推定アルゴリズム(Estimationof Distribution Algorithm,EDA)が挙げられる。しかし、予測システム10によって利用される最適化アルゴリズムはこれらに限定されない。
上述したように、予測された組成が実際に最適であるか否かは実験を通して検証することができる。その検証結果は、無機化合物の組成および特性値を示す新たな化合物データとして用いることができる。その検証結果を示す化合物データは、機械学習モデルの予測精度を上げるために用いることができる。このように、予測システム10を用いることで、(1)化合物データに基づく学習済みモデルの生成、(2)その学習済みモデルと最適化アルゴズムとを用いた組成の予測、(3)その予測結果に基づく実験、および(4)化合物データへの実験結果の反映とから成る循環的な処理が可能になる。図1は、そのような予測システム10の循環的な利用の一例を示す図である。ユーザは、予測システム10を用いてこのようなサイクルを繰り返しながら所望の無機化合物を効率的に探索することができる。
[システムの構成]
図2は実施形態に係る予測システム10の機能構成の一例を示す図である。一例では、予測システム10は機能要素として学習部11、予測部12、入力データ生成部13、および登録部14を備える。学習部11は、組成から特性値を予測するための学習済みモデル30を生成する機能要素である。学習部11は、化合物データをデータベース20から取得し、その化合物データに基づいて入力データを生成し、その入力データを用いて機械学習を実行する。予測部12はその学習済みモデル30を用いた予測を実行する機能要素である。予測部12は、学習済みモデル30を用いて組成から予測特性値を算出してもよいし、最適化アルゴリズムをさらに用いて最適な組成を予測してもよい。入力データ生成部13は機械学習モデルまたは学習済みモデル30に入力されるデータ、すなわち、入力データを生成する機能要素である。登録部14は化合物データをデータベース20に格納する機能要素である。例えば、登録部14は、最適な組成を示す情報に基づいて作製された無機化合物と、該無機化合物の特性の測定値とを示す化合物データをデータベース20に格納する。登録部14はユーザによって入力された化合物データを受け付けて格納してもよいし、他のコンピュータシステムから化合物データを受信して格納してもよい。
予測システム10は、化合物データを記憶するデータベース20にアクセスすることができる。データベース20は機械学習モデルを学習させるために用いられ得る。データベース20は任意の方針で用意されてよい。例えば、データベース20は予測システム10の一構成要素であってもよいし、予測システム10とは別のコンピュータシステム内に構築されてもよい。予測システム10とデータベース20とは通信ネットワークを介して接続されてもよい。あるいは、一つのコンピュータ内に予測システム10およびデータベース20の双方が構築されてもよい。
データベース20に記憶される化合物データの個々のデータレコードは、無機化合物の組成と特性値との組合せを示す。化合物データの準備方法は限定されない。例えば、化合物データは人手による入力作業によってデータベース20に蓄積されてもよい。あるいは、化合物データは予測システム10または他のコンピュータシステムによって自動的に収集されてデータベース20に蓄積されてもよい。
図3は実施形態に係る予測システム10を構成するコンピュータ100の一般的なハードウェア構成の一例を示す図である。例えば、コンピュータ100はプロセッサ101、主記憶部102、補助記憶部103、通信制御部104、入力装置105、および出力装置106を備える。プロセッサ101はオペレーティングシステムおよびアプリケーション・プログラムを実行する。主記憶部102は例えばROMおよびRAMで構成される。補助記憶部103は例えばハードディスクまたはフラッシュメモリで構成され、一般に主記憶部102よりも大量のデータを記憶する。通信制御部104は例えばネットワークカードまたは無線通信モジュールで構成される。入力装置105は例えばキーボード、マウス、タッチパネルなどで構成される。出力装置106は例えばモニタおよびスピーカで構成される。
予測システム10の各機能要素は、補助記憶部103に予め記憶される予測プログラム110により実現される。具体的には、各機能要素は、プロセッサ101または主記憶部102の上に予測プログラム110を読み込ませてその予測プログラム110を実行させることで実現される。プロセッサ101はその予測プログラム110に従って、通信制御部104、入力装置105、または出力装置106を動作させ、主記憶部102または補助記憶部103におけるデータの読み出しおよび書き込みを行う。処理に必要なデータまたはデータベースは主記憶部102または補助記憶部103内に格納される。
予測プログラム110は、例えば、CD-ROM、DVD-ROM、半導体メモリなどの有形の記録媒体に固定的に記録された上で提供されてもよい。あるいは、予測プログラム110は、搬送波に重畳されたデータ信号として通信ネットワークを介して提供されてもよい。
予測システム10は1台のコンピュータ100で構成されてもよいし、複数台のコンピュータ100で構成されてもよい。複数台のコンピュータ100を用いる場合には、これらのコンピュータ100がインターネットやイントラネットなどの通信ネットワークを介して接続されることで、論理的に一つの予測システム10が構築される。
[システムの動作]
図4を参照しながら、学習済みモデル30の生成について説明する。図4は学習済みモデル30の生成の一例を処理フローS1として示すフローチャートである。処理フローS1は学習フェーズに相当し、且つ本開示に係る予測方法の一例である。
ステップS11では、学習部11が化合物データの最初のデータレコードをデータベース20から取得する。このデータレコードは、無機化合物の組成を示す組成データの一例である。
ステップS12では、入力データ生成部13がそのデータレコードで示される組成を周期表と関連付けることで入力データを生成する。周期表は、周期律に基づいて元素を配列した表である。入力データ生成部13は、その周期表に対応する行列を生成し、無機化合物の構成に対応する数値を各成分に設定する。そして、入力データ生成部13はこのように各成分が設定された行列を示す入力データを生成する。本開示では、行列の成分を「行列成分」ともいう。
図5は、入力データの生成の一例を示す図である。本実施形態では、入力データ生成部13は周期表に対応する行列として7×32行列を生成する。より具体的には、入力データ生成部13は、第1周期から第7周期を行で示し、1族から18族までを列で示し、ランタノイドおよびアクチノイドを2族と3族との間に挿入することで、7×32行列を生成する。ルテチウム(Lu)およびローレンシウム(Lr)は3族と同じ列に配置される。この7×32行列の各成分は周期表上の元素に対応する。ここで、7×32行列は一例であり、周期表に対応する行列の構成(すなわち、行数および列数)は任意の方針で定められてよいことに留意されたい。
続いて、入力データ生成部13は、無機化合物の組成に対応する数値を設定する。より具体的には、入力データ生成部13は、組成を構成する元素に対応する行列成分に、該元素の比率に対応する数値を設定する。一例では、この比率は、組成における元素の個数の比率(本開示ではこれを「個数比」という。)でもよい。入力データ生成部13は、組成から所与の元素を除き、該組成の残りの元素に基づいて比率を算出してもよい。例えば、入力データ生成部13は、組成を構成する元素のうち酸素以外のものについて比率を求めてもよい。
図5は、チタン酸バリウム(BaTiO)に対応する行列を示す。図5の例では、入力データ生成部13は、チタン酸バリウムの組成式から非金属元素である酸素(O)を除いた構成“BaTi”について元素の個数比を算出する。バリウム(Ba)およびチタン(Ti)の個数比は1:1である。したがって、入力データ生成部13は、バリウムおよびチタンのそれぞれに対応する行列成分に50(これは50%を意味する。)を設定し、周期表上の残りの元素に対応する行列成分に0を設定する。入力データ生成部13は、周期表上の元素に対応しない行列成分(周期表上では元素が存在しない部分に対応する行列成分)には負数を設定してもよい。例えば、入力データ生成部13は、周期表の元素に対応しない行列成分のそれぞれに-1を設定してもよい。あるいは、入力データ生成部13は、7×32個の行列成分の総和を0またはほぼ0にするための負数を設定してもよい。図5の例では、元素に対応しない行列成分の個数は106であるので、入力データ生成部13はその行列成分に-0.94(≒-100/106)を設定する。生成される7×32行列は無機化合物の組成と周期表との関連を表現する。あるいは、入力データ生成部13は、周期表の元素に対応しない行列成分のそれぞれに0を設定してもよい。
図5の例では行列成分に百分率が設定されるが、個数比などの比率は小数で設定されてもよい。チタン酸バリウム(BaTiO)から酸素(O)を除いた構成“BaTi”の個数比を小数で表す場合には、入力データ生成部13は、バリウムおよびチタンのそれぞれに対応する行列成分に0.5を設定し、元素に対応しない行列成分に-0.0094を設定してもよい。
ステップS13では、学習部11が生成された入力データを用いて機械学習を実行する。学習部11は7×32行列を示す入力データを機械学習モデルに入力し、その機械学習モデルから出力される予測特性値を得る。そして、学習部11はその予測特性値と、データレコードで示される特性値(すなわち、正解)との誤差に基づいて、バックプロパゲーション(誤差逆伝播法)などの手法を用いて機械学習モデル内のパラメータを更新する。機械学習モデル内の更新されるパラメータの例としてニューラルネットワークの重みが挙げられる。しかし、更新されるパラメータはこれに限定されない。
一例では、入力データから(連続的な)数値を予測する回帰問題を解くことができる機械学習モデルを用いることができる。上述したように、機械学習の具体的な手法は限定されず、機械学習モデルの種類も限定されない。本実施形態では、入力データは7×32行列を示し、したがって、2次元状に数値が配列された構造を有する。このような入力データの構造は、2次元状にピクセルが配列された画像データに似たものであるといえる。したがって、画像解析においてよく用いられる畳み込みニューラルネットワークを機械学習モデルとして用いることで、入力データを精度良く処理することが期待できる。
ステップS14では、学習部11が学習を終了させるか否かを判定する。学習部11は、機械学習の終了条件が満たされた場合には学習を終了させ、該終了条件が満たされない場合には機械学習を継続する。終了条件は任意に設定されてよい。例えば、終了条件は誤差に基づいて設定されてもよいし、処理するデータレコードの個数、すなわち学習の回数に基づいて設定されてもよい。あるいは、予測システム10はデータベース20内のデータレコードの一部を検証用データとして用いて機械学習モデルの性能を評価し、その評価が所与の基準を満たす場合に機械学習を終了してもよい。
学習を続ける場合には(ステップS14においてNO)、ステップS15において学習部11が化合物データの次のデータレコードをデータベース20から取得し、そのデータレコードについてステップS12以降の処理を実行する。学習を終了させる場合には(ステップS14においてYES)、ステップS16において学習部11が学習済みモデル30を取得する。このように、学習フェーズでは、予測システム10は化合物データの複数のデータレコードを順次用いて機械学習を実行することで学習済みモデル30を生成する。
図6を参照しながら、学習済みモデル30を用いた特性値の予測について説明する。図6は学習済みモデル30による特性値の予測の一例を処理フローS2として示すフローチャートである。処理フローS2は予測フェーズに相当し、且つ本開示に係る予測方法の一例である。
ステップS21では、予測部12は無機化合物の組成を示すデータ(組成データ)を取得する。組成データの取得方法は限定されない。例えば、予測部12は所与のデータベースにアクセスして組成データを読み込んでもよいし、ユーザによって入力された組成データを取得してもよいし、予測システム10内での演算によって生成された組成データを用いてもよい。
ステップS22では、入力データ生成部13がその組成データで示される組成を周期表と関連付けることで入力データを生成する。この処理はステップS12と同じである。本実施形態では、その入力データは7×32行列を示す。
ステップS23では、予測部12がその入力データを学習済みモデル30に入力し、学習済みモデル30によって得られる予測特性値を出力する。予測特性値の出力方法は限定されない。例えば、予測部12は予測特性値を、モニタ上に表示してもよいし、所定のデータベースに格納してもよいし、他のコンピュータシステムに送信してもよい。あるいは、予測システム10はその予測特性値を用いてさらなる処理を実行してもよい。
図7および図8を参照しながら、最適な組成の予測について説明する。図7は、その予測のための学習済みモデル30の利用の一例を処理フローS3として示すフローチャートである。図8は最適な組成の予測の一例を処理フローS4として示すフローチャートである。処理フローS3,S4のいずれも、予測フェーズを含み、且つ本開示に係る予測方法の一例である。
処理フローS3について説明する。ステップS31では、予測部12が所与の変換式に媒介変数t(ただし、i=1~n-1)を代入して、組成を示すn個の元素の比率X~Xを算出する。一例では、この比率X~Xは元素の個数比でもよい。n個の元素の比率X~Xは無機化合物の組成を示す。組成を構成する元素の候補数である値nは何ら限定されず、2以上であればいくつでもよい。例えば、値nは注目する元素の個数であり得る。n個の元素の比率X~Xの和は1(すなわち100%)であり、且つ個々の比率X(ただし、i=1~n)は0以上1以下である。これらの制約を満たす変換式を決めるために、n次元ユークリッド空間において原点を中心とする半径1のn次元球面を考える。xが直交座標であれば、そのn次元球面の座標(x,…,x)はn-1個の偏角座標θ~θn-1を用いて以下の式(1-1),(1-2),(1-3)で計算できる。
Figure 0007207128000001

Figure 0007207128000002

Figure 0007207128000003
Σx =1であり、且つ、0≦x ≦1である。X=x とすることで、ΣX=1、且つ、0≦X≦1という上記の制約が得られる。θ=πt/2とすることで、以下の変換式(2-1),(2-2),(2-3)が得られる。ただし、0≦t≦1である。
Figure 0007207128000004

Figure 0007207128000005

Figure 0007207128000006
変換式(2-1),(2-2),(2-3)は無機化合物の組成を自動的に生成するための式であるといえる。変換式(2-1),(2-2),(2-3)も、n次元ユークリッド空間において原点を中心とする半径1のn次元球面上の座標を示す。予測部12は変換式(2-1),(2-2),(2-3)に媒介変数t(ただし、i=1~n-1)を代入してn個の元素の比率X~Xを算出する。本開示では、一つの組成を生成するために用いられるn-1個の媒介変数tの組合せを「媒介変数セット」ともいう。比率X~Xを示すデータは組成データの一例である。
変換式は上記の例に限定されない。例えば、予測部12は、媒介変数t(ただし、i=1~n)をX=t/Σtという変換式に代入することによって、n個の元素の比率X~Xを算出してもよい。
ステップS32では、入力データ生成部13が算出された比率X~Xで示される組成を周期表と関連付けることで入力データを生成する。この処理はステップS12と同じである。本実施形態では、その入力データは7×32行列を示す。比率X~Xで示される組成は、最適な組成の候補であるということができ、本開示では「候補組成」ともいう。
ステップS33では、予測部12がその入力データを学習済みモデル30に入力し、学習済みモデル30によって得られる予測特性値を出力する。この予測特性値は最適な組成を予測するために用いられる。
処理フローS4について説明する。ステップS41では、予測部12が複数の媒介変数セットのそれぞれをランダムに設定する。すなわち、予測部12はそれぞれの媒介変数セットにおいて、n-1個の媒介変数tをランダムに設定する。
ステップS42では、予測部12が、設定された複数の媒介変数セットのそれぞれから予測特性値を算出する。ステップS42では個々の媒介変数セットについて処理フローS3が実行され、これにより、それぞれの媒介変数セットについて予測特性値が得られる。入力データ生成部13は変換式(2-1),(2-2),(2-3)によって得られる組成を周期表と関連付けることで、7×32行列を示す入力データを生成する。
ステップS41,S42によって、媒介変数セットと予測特性値との複数の組合せが得られる。一つの媒介変数セットを一つの個体として考えた場合には、複数の媒介変数セットは個体群として見ることができる。予測部12は最適化アルゴリズムを用いて複数の媒介変数セットを更新(変化)させる処理を繰り返すことで、最適な組成を予測する。言い換えると、予測部12は個体群を複数の世代にわたって進化させることで、個体を解に近づける。ステップS41,S42は、その繰返し処理のための初期設定であるともいえるし、1世代目の処理であるともいえる。
ステップS43では、予測部12が最適化アルゴリズムを用いて複数の媒介変数セットのそれぞれを更新する。上述したように、例えば予測部12は遺伝的アルゴリズム、差分進化、粒子群最適化、および分布推定アルゴリズムのいずれかを用いて複数の媒介変数セットのそれぞれを更新してもよい。本実施形態では、一例として粒子群最適化について説明する。
粒子群最適化とは、鳥または魚の群れにおいて各個体が情報交換を行いながら動き回る様子をモデル化した最適化アルゴリズムのことをいう。粒子群最適化では、解は、解空間における個体(これを「粒子」という。)の位置によって表現される。個々の粒子は位置および速度を有する。粒子はその解空間内を移動しながら良い解を探索する。粒子は、過去に発見した良い解を記憶するとともに、他の粒子(例えば近傍の粒子)と良い解に関する情報を交換(共有)する。粒子はこれらの情報に基づいて、より良い位置に近づくように位置および速度を更新する。このような一連の操作の繰り返しによって解空間が探索されて、これにより最良解(より詳しくいうと、最良であると推定される解)が得られる。初期設定(1世代目の処理)では粒子の位置および速度はランダムに設定される。
繰返し処理で実現される探索(2世代目以降の処理)では、その位置および速度が以下の式(3),(4)によって更新される。世代を変数tで表し、個々の粒子を変数iで識別し、世代tにおける粒子iの位置および速度をそれぞれx 、v と表す。
Figure 0007207128000007

Figure 0007207128000008

ここで、w,c,cは重みであり、r,rは区間[0,1]の一様乱数である。pbest は世代tまでの時点における粒子iの最良解を表し、gbestは世代tまでの時点における全粒子の中での最適解を示す。ここで、最良解とは、最も高い評価値に対応する位置ベクトルである。gbestは、粒子iの近傍の領域内での最良解であるlbestに置き換えられてもよい。
個々の粒子iについて、新たに得られた解x t+1の評価値がpbest の評価値よりも高い場合にはpbest がその新たな解によって更新される。同様に、gbest(またはlbest)よりも評価値が高い解x t+1が見つかった場合には、gbest(またはlbest)がその新たな解によって更新される。
ステップS43では、予測部12は粒子群最適化などの最適化アルゴリズムを応用して、複数の媒介変数セットのそれぞれを更新する。この更新によって、それぞれの媒介変数セットにおいてt(i=1~n-1)の少なくとも一部が変更される。予測特性値は評価値として用いられ得る。粒子群最適化が用いられる場合には、媒介変数セットの更新は、一般に提供されている粒子群最適化のパッケージまたは関数(例えば、R言語で動作するpsoパッケージのpsoptim関数)を利用することで実現されてもよい。
ステップS44では、予測部12が、更新された複数の媒介変数セットのそれぞれから予測特性値を算出する。ステップS44では個々の媒介変数セットについて処理フローS3が実行され、これにより、それぞれの媒介変数セットについて予測特性値が得られる。入力データ生成部13は変換式(2-1),(2-2),(2-3)によって得られる組成を周期表と関連付けることで、7×32行列を示す入力データを生成する。
ステップS45で示されるように、ステップS43,S44で示される探索(2世代目以降の処理)は繰り返し実行され得る。探索の終了条件は任意に設定されてよく、例えば繰り返し回数によって規定されてもよい。探索を続ける場合には(ステップS45においてNO)、ステップS43およびS44の処理が再び実行される。探索に関して、媒介変数セットの個数(すなわち、個体または粒子の個数)、および繰り返し回数は限定されず、任意に設定されてよい。例えば、媒介変数セットの個数および繰り返し回数はいずれも、10のオーダーでもよいし100のオーダーでもよい。
探索を終了する場合には(ステップS45においてYES)、処理はステップS46に進む。ステップS46では、予測部12が、最適な予測特性値に対応する媒介変数セット(言い換えると、最も評価値が高い媒介変数セット)を特定する。
ステップS47では、予測部12が、特定された媒介変数セットを所与の変換式に代入してn個の元素の比率X~Xを算出する。これはステップS31と同じ処理である。具体的には、予測部12は変換式(2-1),(2-2),(2-3)を用いてその比率X~Xを算出する。
ステップS48では、予測部12が、算出された比率で示される組成を出力する。組成の情報の出力方法は限定されない。例えば、予測部12は組成の情報を、モニタ上に表示してもよいし、所定のデータベースに格納してもよいし、他のコンピュータシステムに送信してもよい。組成の表現方法も任意であり、例えば、組成は組成式で表現されてもよいし、元素および比率の1以上のペアで表現されてもよい。いずれにしても、ユーザはその組成の情報に基づいて無機化合物を作製して特性値を測定することで予測結果を検証することができる。この検証を通じて、好適なまたは新しい材料の発見も期待できる。
[効果]
以上説明したように、本開示の一側面に係る予測システムは、少なくとも一つのプロセッサを備える。少なくとも一つのプロセッサは、無機化合物の組成を示す組成データを取得し、組成データで示される組成を周期表と関連付けることで、該組成に対応する行列を示す入力データを生成し、入力データを機械学習モデルに入力することで、無機化合物の特性の予測値を出力する。
本開示の一側面に係る予測方法は、少なくとも一つのプロセッサを備える予測システムにより実行される。この予測方法は、無機化合物の組成を示す組成データを取得するステップと、組成データで示される組成を周期表と関連付けることで、該組成に対応する行列を示す入力データを生成するステップと、入力データを機械学習モデルに入力することで、無機化合物の特性の予測値を出力するステップとを含む。
本開示の一側面に係る予測プログラムは、無機化合物の組成を示す組成データを取得するステップと、組成データで示される組成を周期表と関連付けることで、該組成に対応する行列を示す入力データを生成するステップと、入力データを機械学習モデルに入力することで、無機化合物の特性の予測値を出力するステップとをコンピュータに実行させる。
このような側面においては、無機化合物の組成そのものだけではなく周期表も考慮されて無機化合物の特性が予測されるので、無機化合物の特性を精度良く予測することが可能になる。周期表は個々の元素を物理的または化学的性質に配列した表である。その配列を機械学習モデルの入力データに反映させることで、無機化合物の特性を予測する際にその物理的または化学的性質が考慮されるので、無機化合物の特性の予測精度の向上が期待できる。
他の側面に係る予測システムでは、少なくとも一つのプロセッサが、組成を構成する元素に対応する行列成分に、該元素の比率に対応する数値を設定し、周期表上の残りの元素に対応する行列成分に0を設定し、周期表上の元素に対応しない行列成分に負数もしくは0を設定することで、入力データを生成してもよい。組成を構成する元素に関する情報をこのように周期表と関連付けることで、無機化合物の特性を精度良く予測することが可能になる。
他の側面に係る予測システムでは、少なくとも一つのプロセッサが、複数の媒介変数の組合せである媒介変数セットを所与の変換式に代入することで、組成を示す複数の元素の比率を算出し、算出された複数の元素の比率で示される組成を周期表と関連付けることで、入力データを生成してもよい。この一連の処理により、任意の無機化合物の組成について特性を予測することができる。
他の側面に係る予測システムでは、変換式が、n次元ユークリッド空間において原点を中心とする半径1のn次元球面上の座標を示す式であってもよい。この式を用いることで、ゼロによる割り算を確実に回避しつつ、任意の無機化合物の組成について特性を予測することができる。
他の側面に係る予測システムでは、少なくとも一つのプロセッサが、複数の媒介変数セットのそれぞれについて予測値を出力するサブステップと、最適化アルゴリズムを用いて、複数の予測値に基づいて複数の媒介変数セットのそれぞれを更新するサブステップとの繰り返しを含む探索を実行するステップと、探索に基づいて、最適な予測値に対応する媒介変数セットを特定するステップと、特定された媒介変数セットを変換式に代入することで最適な組成を予測するステップと、最適な組成を示す情報を出力するステップとを実行してもよい。予測値を出力するサブステップでは、複数の媒介変数セットのそれぞれについて、変換式に該媒介変数セットを代入することで、候補組成を示す複数の元素の比率を算出し、候補組成を周期表と関連付けることで入力データを生成し、入力データを機械学習モデルに入力することで予測値を出力してもよい。最適化アルゴリズムと機械学習とを組み合わせたこのような探索によって、最適な特性を持つと期待できる無機化合物の組成を効率的に予測することが可能になる。
他の側面に係る予測システムでは、少なくとも一つのプロセッサが、最適な組成を示す情報に基づいて作製された無機化合物と、該無機化合物の特性の測定値とを示す化合物データを、機械学習モデルを学習させるために用いられるデータベースに格納してもよい。最適であると予想される無機化合物の特性を実際に検証して、その検証結果を示す化合物データをデータベースに登録することで、その化合物データを教師データとして機械学習のために用いることが可能になる。したがって、化合物データを用いた機械学習、組成の予測、実験、化合物データの登録というサイクルを繰り返しながら所望の無機化合物を効率的に探索することが可能になる。
他の側面に係る予測システムでは、特性が比誘電率であってもよい。この場合には、無機化合物の比誘電率を精度良く予測することが可能になり、ひいては好適な誘電体材料を得ることが期待できる。
[変形例]
以上、本開示での実施形態に基づいて詳細に説明した。しかし、本開示は上記実施形態に限定されるものではない。本開示は、その要旨を逸脱しない範囲で様々な変形が可能である。
予測システムの機能構成は上記実施形態に限定されない。上述したように、予測システムは学習フェーズおよび予測フェーズのいずれか一方を実行しなくてもよいので、学習部11および予測部12のうちのいずれか一方に相当する機能要素を備えなくてもよい。したがって、予測システムは処理フローS1,S2のいずれか一方を実行しなくてもよい。処理フローS3,S4はいずれも予測システムの必須の処理ではなく、したがって省略可能である。予測システム10は登録部14を備えなくてもよい。
本開示において、「少なくとも一つのプロセッサが、第1の処理を実行し、第2の処理を実行し、…第nの処理を実行する。」との表現、またはこれに対応する表現は、第1の処理から第nの処理までのn個の処理の実行主体(すなわちプロセッサ)が途中で変わる場合を含む概念を示す。すなわち、この表現は、n個の処理のすべてが同じプロセッサで実行される場合と、n個の処理においてプロセッサが任意の方針で変わる場合との双方を含む概念を示す。
少なくとも一つのプロセッサにより実行される方法の処理手順は上記実施形態での例に限定されない。例えば、上述したステップの一部が省略されてもよいし、別の順序で各ステップが実行されてもよい。また、上述したステップのうちの任意の2以上のステップが組み合わされてもよいし、ステップの一部が修正または削除されてもよい。あるいは、上記の各ステップに加えて他のステップが実行されてもよい。
予測システム内で二つの数値の大小関係を比較する際には、「以上」および「よりも大きい」という二つの基準のどちらを用いてもよく、「以下」および「未満」という二つの基準のうちのどちらを用いてもよい。このような基準の選択は、二つの数値の大小関係を比較する処理についての技術的意義を変更するものではない。
10…予測システム、11…学習部、12…予測部、13…入力データ生成部、14…登録部、20…データベース、30…学習済みモデル(機械学習モデル)、110…予測プログラム。

Claims (9)

  1. 少なくとも一つのプロセッサを備え、
    前記少なくとも一つのプロセッサが、
    無機化合物の組成を示す組成データを取得し、
    前記組成データで示される前記組成を周期表と関連付けることで、該組成に対応する行列を示す入力データを生成し、
    前記入力データを機械学習モデルに入力することで、前記無機化合物の特性の予測値を出力する、
    予測システム。
  2. 前記少なくとも一つのプロセッサが、前記組成を構成する元素に対応する行列成分に、該元素の比率に対応する数値を設定し、前記周期表上の残りの元素に対応する行列成分に0を設定し、前記周期表上の元素に対応しない行列成分に負数もしくは0を設定することで、前記入力データを生成する、
    請求項1に記載の予測システム。
  3. 前記少なくとも一つのプロセッサが、
    複数の媒介変数の組合せである媒介変数セットを所与の変換式に代入することで、前記組成を示す複数の元素の比率を算出し、
    前記算出された複数の元素の比率で示される前記組成を前記周期表と関連付けることで、前記入力データを生成する、
    請求項1または2に記載の予測システム。
  4. 前記変換式が、n次元ユークリッド空間において原点を中心とする半径1のn次元球面上の座標を示す式である、
    請求項3に記載の予測システム。
  5. 前記少なくとも一つのプロセッサが、
    複数の前記媒介変数セットのそれぞれについて前記予測値を出力するサブステップと、最適化アルゴリズムを用いて、複数の前記予測値に基づいて前記複数の媒介変数セットのそれぞれを更新するサブステップとの繰り返しを含む探索を実行するステップと、
    前記探索に基づいて、最適な前記予測値に対応する前記媒介変数セットを特定するステップと、
    前記特定された媒介変数セットを前記変換式に代入することで最適な組成を予測するステップと、
    前記最適な組成を示す情報を出力するステップと
    を実行し、
    前記予測値を出力するサブステップでは、複数の前記媒介変数セットのそれぞれについて、
    前記変換式に該媒介変数セットを代入することで、候補組成を示す複数の元素の比率を算出し、
    前記候補組成を前記周期表と関連付けることで前記入力データを生成し、
    前記入力データを前記機械学習モデルに入力することで前記予測値を出力する、
    請求項3または4に記載の予測システム。
  6. 前記少なくとも一つのプロセッサが、前記最適な組成を示す情報に基づいて作製された無機化合物と、該無機化合物の前記特性の測定値とを示す化合物データを、前記機械学習モデルを学習させるために用いられるデータベースに格納する、
    請求項5に記載の予測システム。
  7. 前記特性が比誘電率である、
    請求項1~6のいずれか一項に記載の予測システム。
  8. 少なくとも一つのプロセッサを備える予測システムにより実行される予測方法であって、
    無機化合物の組成を示す組成データを取得するステップと、
    前記組成データで示される前記組成を周期表と関連付けることで、該組成に対応する行列を示す入力データを生成するステップと、
    前記入力データを機械学習モデルに入力することで、前記無機化合物の特性の予測値を出力するステップと
    を含む予測方法。
  9. 無機化合物の組成を示す組成データを取得するステップと、
    前記組成データで示される前記組成を周期表と関連付けることで、該組成に対応する行列を示す入力データを生成するステップと、
    前記入力データを機械学習モデルに入力することで、前記無機化合物の特性の予測値を出力するステップと
    をコンピュータに実行させる予測プログラム。
JP2019080140A 2019-04-19 2019-04-19 予測システム、予測方法、および予測プログラム Active JP7207128B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2019080140A JP7207128B2 (ja) 2019-04-19 2019-04-19 予測システム、予測方法、および予測プログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2019080140A JP7207128B2 (ja) 2019-04-19 2019-04-19 予測システム、予測方法、および予測プログラム

Publications (2)

Publication Number Publication Date
JP2020177508A JP2020177508A (ja) 2020-10-29
JP7207128B2 true JP7207128B2 (ja) 2023-01-18

Family

ID=72936294

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2019080140A Active JP7207128B2 (ja) 2019-04-19 2019-04-19 予測システム、予測方法、および予測プログラム

Country Status (1)

Country Link
JP (1) JP7207128B2 (ja)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP7463996B2 (ja) * 2021-03-26 2024-04-09 横河電機株式会社 装置、方法およびプログラム

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2006017742A1 (en) 2004-08-03 2006-02-16 E.I. Dupont De Nemours And Company Method and apparatus for predicting properties of a chemical mixture

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH1055348A (ja) * 1996-08-08 1998-02-24 Bridgestone Corp 多成分系材料最適化解析装置および方法

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2006017742A1 (en) 2004-08-03 2006-02-16 E.I. Dupont De Nemours And Company Method and apparatus for predicting properties of a chemical mixture

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
世古敦人 ほか,行列およびテンソル分解を用いた新規無機化合物の推薦システム,日本金属学会秋期講演大会(2017)講演概要集,日本,公益社団法人日本金属学会,2017年08月23日
松本要 ほか,高Tc物質予測のための機械学習モデリング,第66回応用物理学会春季学術講演会 講演予稿集,日本,公益社団法人応用物理学会,2019年02月25日,09-074
篠原航平 ほか,化学組成の事前知識を用いた推薦システムによる新規化合物の予測,日本金属学会春期講演大会(2018)講演概要集,日本,公益社団法人日本金属学会,2018年03月05日

Also Published As

Publication number Publication date
JP2020177508A (ja) 2020-10-29

Similar Documents

Publication Publication Date Title
Liu et al. Progressive neural architecture search
Liu et al. Automating feature subspace exploration via multi-agent reinforcement learning
Li et al. Development and investigation of efficient artificial bee colony algorithm for numerical function optimization
JP4934058B2 (ja) 共クラスタリング装置、共クラスタリング方法、共クラスタリングプログラム、および、そのプログラムを記録した記録媒体
Wang et al. A heuristic method for learning Bayesian networks using discrete particle swarm optimization
JP7287397B2 (ja) 情報処理方法、情報処理装置及び情報処理プログラム
Naik et al. Genetic algorithm-aided dynamic fuzzy rule interpolation
Chen et al. $ d $ d-Simplexed: Adaptive Delaunay Triangulation for Performance Modeling and Prediction on Big Data Analytics
Pan et al. Identifying protein complexes from protein-protein interaction networks based on fuzzy clustering and GO semantic information
CN114639483A (zh) 一种基于图神经网络的电子病历检索方法及装置
Park et al. Granular neural networks and their development through context-based clustering and adjustable dimensionality of receptive fields
CN114707641A (zh) 双视角图神经网络模型的训练方法、装置、设备及介质
CN110059251B (zh) 基于多关系隐式反馈置信度的协同过滤推荐方法
JP7207128B2 (ja) 予測システム、予測方法、および予測プログラム
WO2023158333A1 (en) Large-scale architecture search in graph neural networks via synthetic data
CN111292062B (zh) 基于网络嵌入的众包垃圾工人检测方法、系统及存储介质
CN117273060A (zh) 一种基于影响函数的数据优化方法
CN116467466A (zh) 基于知识图谱的编码推荐方法、装置、设备及介质
US20210248480A1 (en) Relating complex data
CN114821248A (zh) 面向点云理解的数据主动筛选标注方法和装置
Vijay Detection of plant diseases in tomato leaves: with focus on providing explainability and evaluating user trust
Li et al. GraphPNAS: Learning Distribution of Good Neural Architectures via Deep Graph Generative Models
CN116151329B (zh) 基于反事实图学习的学生知识状态追踪方法及系统
Shajoonnezhad et al. A stochastic variance-reduced coordinate descent algorithm for learning sparse Bayesian network from discrete high-dimensional data
CN110942149B (zh) 一种基于信息变化率及条件互信息的特征变量选择方法

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20211122

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20221109

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20221206

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20221219

R150 Certificate of patent or registration of utility model

Ref document number: 7207128

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150