WO2022113945A1

WO2022113945A1 - 情報処理システム、情報処理方法、および情報処理プログラム

Info

Publication number: WO2022113945A1
Application number: PCT/JP2021/042833
Authority: WO
Inventors: 恭平花岡
Original assignee: 昭和電工マテリアルズ株式会社
Priority date: 2020-11-27
Filing date: 2021-11-22
Publication date: 2022-06-02
Also published as: CN116745850A; EP4243026A1; KR20230110584A; US20240047018A1; EP4243026A4; JPWO2022113945A1

Abstract

一実施形態に係る情報処理システムは、少なくとも一つのプロセッサを備える。少なくとも一つのプロセッサは、複数の成分オブジェクトのそれぞれについての数値表現および複合比を取得し、複数の数値表現に基づいて機械学習を実行して、複数の成分オブジェクトに対応する複数の回帰パラメータを算出し、複数の回帰パラメータによって定義される回帰モデルに複数の複合比を適用して、複数の成分オブジェクトを複合させることで得られる複合オブジェクトの特性を示す予測値を算出する。

Description

情報処理システム、情報処理方法、および情報処理プログラム

　本開示の一側面は情報処理システム、情報処理方法、および情報処理プログラムに関する。

　複数の成分オブジェクトを複合させることで得られる複合オブジェクトを、機械学習を用いて解析する手法が用いられている。例えば、特許文献１には、生体高分子の立体構造と化合物の立体構造との結合性を予測する方法が記載されている。この方法は、生体高分子の立体構造と化合物の立体構造とに基づいて生体高分子と化合物との複合体の予測立体構造を生成するステップと、その予測立体構造を、相互作用パターンとの照合結果を表す予測立体構造ベクトルへ変換するステップと、機械学習アルゴリズムを用いてその予測立体構造ベクトルを判別することによって生体高分子の立体構造と化合物の立体構造との結合性を予測するステップとを含む。

特開２０１９－２８８７９号公報

　成分オブジェクトが多様であったり多数存在したりする場合には、これらの成分オブジェクトについて十分な量のデータを用意することができず、その結果、複合オブジェクトの解析の精度が、期待する水準に達しない可能性がある。そこで、成分オブジェクトについて十分な量のデータを用意できない場合にも複合オブジェクトの解析の精度を上げるための仕組みが望まれている。

　本開示の一側面に係る情報処理システムは、少なくとも一つのプロセッサを備える。少なくとも一つのプロセッサは、複数の成分オブジェクトのそれぞれについての数値表現および複合比を取得し、複数の数値表現に基づいて機械学習を実行して、複数の成分オブジェクトに対応する複数の回帰パラメータを算出し、複数の回帰パラメータによって定義される回帰モデルに複数の複合比を適用して、複数の成分オブジェクトを複合させることで得られる複合オブジェクトの特性を示す予測値を算出する。

　本開示の一側面に係る情報処理方法は、少なくとも一つのプロセッサを備える情報処理システムにより実行される。この情報処理方法は、複数の成分オブジェクトのそれぞれについての数値表現および複合比を取得するステップと、複数の数値表現に基づいて機械学習を実行して、複数の成分オブジェクトに対応する複数の回帰パラメータを算出するステップと、複数の回帰パラメータによって定義される回帰モデルに複数の複合比を適用して、複数の成分オブジェクトを複合させることで得られる複合オブジェクトの特性を示す予測値を算出するステップとを含む。

　本開示の一側面に係る情報処理プログラムは、複数の成分オブジェクトのそれぞれについての数値表現および複合比を取得するステップと、複数の数値表現に基づいて機械学習を実行して、複数の成分オブジェクトに対応する複数の回帰パラメータを算出するステップと、複数の回帰パラメータによって定義される回帰モデルに複数の複合比を適用して、複数の成分オブジェクトを複合させることで得られる複合オブジェクトの特性を示す予測値を算出するステップとをコンピュータに実行させる。

　このような側面においては、各成分オブジェクトのデータに基づいて機械学習が実行されて、複数の成分オブジェクトに対応する複数の回帰パラメータが算出される。そして、その回帰パラメータによって定義される回帰モデルに複合比が適用されて、複合オブジェクトの特性が予測される。機械学習および回帰モデルを用いることで、成分オブジェクトについて十分な量のデータを用意できない場合にも複合オブジェクトの解析の精度を上げることが可能になる。

　本開示の一側面によれば、成分オブジェクトについて十分な量のデータを用意できない場合にも複合オブジェクトの解析の精度を上げることができる。

実施形態に係る情報処理システムを構成するコンピュータのハードウェア構成の一例を示す図である。実施形態に係る情報処理システムの機能構成の一例を示す図である。実施形態に係る情報処理システムの動作の一例を示すフローチャートである。回帰パラメータを算出する手順の一例を示す図である。回帰パラメータを算出する手順の別の例を示す図である。

　以下、添付図面を参照しながら本開示での実施形態を詳細に説明する。図面の説明において同一または同等の要素には同一の符号を付し、重複する説明を省略する。

　［システムの概要］
　実施形態に係る情報処理システム１０は、複数の成分オブジェクトを所与の複合比で複合させることで得られる複合オブジェクトに関する解析を実行するコンピュータシステムである。成分オブジェクトとは、複合オブジェクトを生成するために用いられる有体物または無体物をいう。複合オブジェクトは有体物または無体物であり得る。有体物の例として任意の物質または物体が挙げられる。無体物の例としてデータおよび情報が挙げられる。「複数の成分オブジェクトを複合させる」とは、複数の成分オブジェクトを一つのオブジェクト、すなわち複合オブジェクトにする処理をいう。複合させる手法は限定させず、例えば、配合、調合、合成、結合、混合、合併、組合せ、化合、または合体でもよいし、他の手法でもよい。複合オブジェクトに関する解析とは、複合オブジェクトの何らかの特性を示すデータを得るための処理をいう。

　複数の成分オブジェクトは任意の複数種類の材料でよく、この場合には、複合オブジェクトはそれらの材料によって生成される多成分物質である。材料とは多成分物質を生成するために用いられる任意の構成要素である。例えば、複数の材料は任意の複数種類の分子または原子でもよく、この場合には、複合オブジェクトは、それらの分子または原子を任意の手法で複合することにより得られる多成分物質である。例えば、材料はポリマーまたはモノマーでもよく、これに対応して、多成分物質はポリマーアロイでもよい。材料はモノマーでもよく、これに対応して、多成分物質はポリマーでもよい。材料は薬物、すなわち、薬理作用を有する化学物質でもよく、これに対応して、多成分物質は薬剤でもよい。

　情報処理システム１０は複合オブジェクトに関する解析のために機械学習を実行する。機械学習とは、与えられた情報に基づいて学習して法則またはルールを自律的に見つけ出す手法である。機械学習の具体的な手法は限定されない。例えば、情報処理システム１０は、ニューラルネットワークを含んで構成される計算モデルである機械学習モデルを用いた機械学習を実行してもよい。ニューラルネットワークとは、人間の脳神経系の仕組みを模した情報処理のモデルのことをいう。より具体的な例として、情報処理システム１０は、グラフニューラルネットワーク（ＧＮＮ）、畳み込みニューラルネットワーク（ＣＮＮ）、再帰型ニューラルネットワーク（ＲＮＮ）、アテンションＲＮＮ（Ａｔｔｅｎｔｉｏｎ　ＲＮＮ）、およびマルチヘッド・アテンション（Ｍｕｌｔｉ－Ｈｅａｄ　Ａｔｔｅｎｔｉｏｎ）のうちの少なくとも一つを用いて機械学習を実行してもよい。

　［システムの構成］
　情報処理システム１０は１台以上のコンピュータで構成される。複数台のコンピュータを用いる場合には、これらのコンピュータがインターネット、イントラネット等の通信ネットワークを介して接続されることで、論理的に一つの情報処理システム１０が構築される。

　図１は、情報処理システム１０を構成するコンピュータ１００の一般的なハードウェア構成の一例を示す図である。例えば、コンピュータ１００は、オペレーティングシステム、アプリケーション・プログラム等を実行する、ＣＰＵ等のプロセッサ１０１と、ＲＯＭおよびＲＡＭで構成される主記憶部１０２と、ハードディスク、フラッシュメモリ等で構成される補助記憶部１０３と、ネットワークカードまたは無線通信モジュールで構成される通信制御部１０４と、キーボード、マウス等の入力装置１０５と、モニタ等の出力装置１０６とを備える。

　情報処理システム１０の各機能要素は、プロセッサ１０１または主記憶部１０２の上に予め定められたプログラムを読み込ませてプロセッサ１０１にそのプログラムを実行させることで実現される。プロセッサ１０１はそのプログラムに従って、通信制御部１０４、入力装置１０５、または出力装置１０６を動作させ、主記憶部１０２または補助記憶部１０３におけるデータの読み出しおよび書き込みを行う。処理に必要なデータまたはデータベースは主記憶部１０２または補助記憶部１０３内に格納される。

　図２は情報処理システム１０の機能構成の一例を示す図である。情報処理システム１０は機能要素として取得部１１、算出部１２、および予測部１３を備える。

　取得部１１は複数の成分オブジェクトに関するデータを取得する機能要素である。具体的には、取得部１１は複数の成分オブジェクトのそれぞれについて数値表現および複合比を取得する。成分オブジェクトの数値表現とは、成分オブジェクトの任意の属性を複数の数値を用いて表現したデータをいう。成分オブジェクトの属性とは、成分オブジェクトが備える性質または特徴をいう。数値表現は様々な手法で可視化されてよく、例えば、数字、英字、テキスト、分子グラフ、ベクトル、画像、時系列データ等の手法によって可視化されてもよいし、これらの手法のうちの任意の２以上の組合せによって可視化されてもよい。数値表現を構成する個々の数値は、十進法で表されてもよいし、二進法、十六進法等の他の表記法によって表されてもよい。成分オブジェクトの複合比とは、複数の成分オブジェクトの間の割合をいう。複合比の具体的な種類、単位、および表現方法は限定されず、成分オブジェクトまたは複合オブジェクトに応じて任意に定められてよい。例えば複合比は百分率等の比率によって表されてもよいし、ヒストグラムによって表されてもよいし、個々の成分オブジェクトの絶対量で表されてもよい。

　算出部１２は、複合オブジェクトの特性を予測するための回帰モデルの回帰パラメータを算出する機能要素である。具体的には、算出部１２は、複数の成分オブジェクトに対応する複数の数値表現に基づいて機械学習を実行して回帰パラメータを算出する。回帰モデルとは、１以上の説明変数ｘの値が与えられた場合に１以上の目的変数ｙの値を求めるための式をいう。回帰モデルは線形回帰モデルでもよいし非線形回帰モデルでもよい。回帰モデルの例としてシェッフェ多項式（Ｓｃｈｅｆｆｅ　ｐｏｌｙｎｏｍｉａｌ）が挙げられる。しかし、回帰モデルは他のパラメトリックモデルでもよい。回帰パラメータは、回帰モデルに含まれる数値である。

　予測部１３は、複合オブジェクトの特性を予測し、その予測値を出力する機能要素である。複合オブジェクトの特性とは、複合オブジェクトが持つ特有の性質のことをいう。具体的には、予測部１３は、算出された回帰パラメータによって定義される回帰モデルに複合比を適用して予測値を算出する。言い換えると、予測部１３はその回帰モデルに複数の複合比を代入して予測値を算出する。

　一例では、算出部１２および予測部１３の組合せが一つの機械学習モデルによって実現される。あるいは、算出部１２が機械学習モデルによって実現され、予測部１３が機械学習モデルを用いないアルゴリズムによって実現されてもよい。

　一例では、本実施形態で用いられる少なくとも一つの機械学習モデルのそれぞれは、推定精度が最も高いと期待される学習済みモデルであり、したがって「最良の機械学習モデル」ということができる。しかし、この学習済みモデルは“現実に最良である”とは限らないことに留意されたい。学習済みモデルは、入力ベクトルとラベルとの多数の組合せを含む教師データを所与のコンピュータが処理することで生成される。所与のコンピュータは、入力ベクトルを機械学習モデルに入力して出力値を算出し、その出力値と教師データで示されるラベルとの誤差を求める。出力値は例えば予測値である。出力値とラベルとの誤差は、推定結果と正解との差であるといえる。コンピュータはその誤差に基づいて機械学習モデル内の所与のパラメータを更新する。コンピュータはこのような学習を繰り返すことで学習済みモデルを生成する。学習済みモデルを生成するコンピュータは限定されず、例えば情報処理システム１０でもよいし別のコンピュータシステムでもよい。学習済みモデルを生成する処理は学習フェーズということができ、その学習済みモデルを利用する処理は運用フェーズということができる。

　一例では、本実施形態で用いられる機械学習モデルの全体は、入力の順序に依存しない関数によって記述されてもよい。この仕組みにより、機械学習において複数のベクトルの並び順の影響を排除することができる。

　［システムの動作］
　図３を参照しながら、情報処理システム１０の動作を説明するとともに本実施形態に係る情報処理方法について説明する。図３は情報処理システム１０の動作の一例を処理フローＳ１として示すフローチャートである。処理フローＳ１は運用フェーズに相当する。

　ステップＳ１１では、取得部１１が、複数の成分オブジェクトのそれぞれについて数値表現および複合比を取得する。一例として、二つの成分オブジェクトＥａ，Ｅｂに関する情報が入力されるとするならば、取得部１１は例えば、成分オブジェクトＥａの数値表現｛１，１，２，３，４，３，３，５，６，７，５，４｝と、成分オブジェクトＥｂの数値表現｛１，１，５，６，４，３，３，５，１，７，０，０｝と、成分オブジェクトＥａ，Ｅｂの複合比｛０．７、０．３｝とを取得する。この例では、それぞれの数値表現はベクトルで示されている。複合比｛０．７、０．３｝は、成分オブジェクトＥａ，Ｅｂを７：３の割合で用いて複合オブジェクトを得ることを意味する。

　取得部１１は複数の成分オブジェクトのそれぞれのデータを任意の手法で取得してよい。例えば、取得部１１は所与のデータベースにアクセスしてデータを読み出してもよいし、他のコンピュータまたはコンピュータシステムからデータを受信してもよいし、情報処理システム１０のユーザにより入力されたデータを受け付けてもよい。あるいは、取得部１１はこれらのような手法のうちの任意の２以上によってデータを取得してもよい。

　ステップＳ１２では、算出部１２が複数の成分オブジェクトのそれぞれについて、数値表現に基づいて特徴ベクトルを算出する。特徴ベクトルとは、成分オブジェクトの特徴を示すベクトルのことをいう。成分オブジェクトの特徴とは、該成分オブジェクトを他のオブジェクトと異ならせる任意の要素のことをいう。ベクトルとは、ｎ個の数値を有するｎ次元の量のことをいい、１次元の配列として表現することができる。

　ステップＳ１３では、算出部１２が、算出された複数の特徴ベクトルに基づいて、複数の成分オブジェクトに対応する複数の回帰パラメータを算出する。

　ステップＳ１４では、予測部１３が、算出された複数の回帰パラメータによって定義される回帰モデルを用いて、複合オブジェクトの特性を示す予測値を算出する。回帰パラメータによって定義される回帰モデルとは、要するに、特定の具体的な数値が回帰パラメータとして決定された回帰モデルである。予測部１３は回帰モデルに複数の複合比を適用して予測値を算出する。

　ステップＳ１５では、予測部１３がその予測値を出力する。予測値の出力方法は限定されない。例えば、予測部１３は予測値を、所与のデータベースに格納してもよいし、他のコンピュータまたはコンピュータシステムに向けて送信してもよいし、表示装置上に表示してもよい。あるいは、予測部１３は情報処理システム１０での後続処理のために予測値を他の機能要素に出力してもよい。

　図４および図５を参照しながら、回帰モデルに関する処理についてより詳細に説明する。図４および図５はいずれも、回帰パラメータを算出する手順の例を示す図である。いずれの例でも、成分オブジェクトは、ポリスチレン、ポリアクリル酸、およびポリメタアクリル酸ブチルという３種類の材料（ポリマー）を示す。これらの材料のそれぞれについて、任意の形式の数値表現が用意されてよい。

　材料の配合に関する問題では上記のシェッフェ多項式がよく用いられる。そこで、図４および図５の例では回帰モデルがシェッフェ多項式であるとする。

　図４の例について説明する。ステップＳ１２の一部であるステップＳ１２１では、算出部１２は、ベクトルの特徴を計算するための埋込み関数（ｅｍｂｅｄｄｉｎｇ　ｆｕｎｃｔｉｏｎ）用の機械学習モデルによって、複数の成分オブジェクトのそれぞれについて数値表現から特徴ベクトルＺを算出する。この機械学習モデルは学習済みモデルである。埋込み関数では入力ベクトルと出力ベクトルとは１対１の関係にある。この例では、入力ベクトルは数値表現であり、出力ベクトルは特徴ベクトルＺである。算出部１２は、複数の成分オブジェクトに対応する複数の数値表現を埋込み関数用のモデルに入力して、該複数の成分オブジェクトのそれぞれの特徴ベクトルＺを算出する。一例では、算出部１２は、複数の成分オブジェクトのそれぞれについて、該成分オブジェクトに対応する数値表現を埋込み関数用のモデルに入力して該成分オブジェクトの特徴ベクトルＺを算出する。一例では、埋込み関数用のモデルは、非定型データである数値表現から、固定長ベクトルである特徴ベクトルＺを生成してもよい。非定型データとは、固定長ベクトルによって表現されないデータをいう。図４の例では、算出部１２はポリスチレンに対応する特徴ベクトルＺ_１と、ポリアクリル酸に対応する特徴ベクトルＺ_２と、ポリメタアクリル酸ブチルに対応する特徴ベクトルＺ_３とを算出する。

　埋込み関数用の機械学習モデルは限定されず、成分オブジェクトおよび複合オブジェクトの種類等の要因を考慮して任意の方針で決められてよい。例えば、算出部１２はグラフニューラルネットワーク（ＧＮＮ）、畳み込みニューラルネットワーク（ＣＮＮ）、または再帰型ニューラルネットワーク（ＲＮＮ）を用いて埋込み関数を実行してもよい。

　ステップＳ１２の一部であるステップＳ１２２では、算出部１２は、複数のベクトルを相互に作用させるための相互作用関数（ｉｎｔｅｒａｃｔｉｏｎ　ｆｕｎｃｔｉｏｎ）用の機械学習モデルによって、複数の成分オブジェクトについて特徴ベクトルＺから別の特徴ベクトルＭを算出する。この機械学習モデルは学習済みモデルである。相互作用関数では入力ベクトルと出力ベクトルとは１対１の関係にある。この例では、入力ベクトルは特徴ベクトルＺであり、出力ベクトルは特徴ベクトルＭである。一例では、算出部１２は、複数の成分オブジェクトに対応する複数の特徴ベクトルＺの集合を相互作用関数用のモデルに入力して、該複数の成分オブジェクトのそれぞれについて特徴ベクトルＭを算出する。図４の例では、算出部１２はポリスチレンに対応する特徴ベクトルＭ_１と、ポリアクリル酸に対応する特徴ベクトルＭ_２と、ポリメタアクリル酸ブチルに対応する特徴ベクトルＭ_３とを算出する。

　相互作用関数用の機械学習モデルは限定されず、成分オブジェクトおよび複合オブジェクトの種類等の要因を考慮して任意の方針で決められてよい。例えば、算出部１２はアテンションＲＮＮ（Ａｔｔｅｎｔｉｏｎ　ＲＮＮ）、またはマルチヘッド・アテンション（Ｍｕｌｔｉ－Ｈｅａｄ　Ａｔｔｅｎｔｉｏｎ）を用いて相互作用関数用の機械学習を実行してもよい。別の例では、算出部１２は学習パラメータを含まない相互作用関数によって特徴ベクトルＭを算出してもよい。

　図４に示すステップＳ１３では、算出部１２は複数の成分オブジェクトのそれぞれについて特徴ベクトルＭから線形回帰モデルの１次項の回帰パラメータａを算出する。一例では、算出部１２は機械学習モデルによって回帰パラメータを算出する。この機械学習モデルは学習済みモデルである。１次項の回帰パラメータを算出する関数では、入力ベクトルと出力値とは１対１の関係にある。この例では、入力ベクトルは特徴ベクトルＭであり、出力値は回帰パラメータａである。一例では、算出部１２は、複数の成分オブジェクトに対応する複数の特徴ベクトルＭの集合を機械学習モデルに入力して、該複数の成分オブジェクトのそれぞれについて回帰パラメータａを算出する。図４の例では、算出部１２はポリスチレンに対応する回帰パラメータａ_１と、ポリアクリル酸に対応する回帰パラメータａ_２と、ポリメタアクリル酸ブチルに対応する回帰パラメータａ_３とを算出する。

　回帰パラメータを算出するための機械学習モデルは限定されず、成分オブジェクトおよび複合オブジェクトの種類等の要因を考慮して任意の方針で決められてよい。例えば、算出部１２は全結合ニューラルネットワーク（ＦＣＮＮ）を用いて回帰パラメータを算出してもよい。

　図４に示すステップＳ１４では、予測部１３は３個の回帰パラメータａ_１，ａ_２，ａ_３によって定義される下記のシェッフェ多項式（１）によって予測値Ｅを算出する。回帰パラメータａは式（１）の１次項の回帰係数であるともいえる。予測値Ｅは、ポリスチレン、ポリアクリル酸、およびポリメタアクリル酸ブチルから得られる多成分物質（ポリマーアロイ）の特性を示す。式（１）における変数ｒは複合比を意味する。ポリスチレン、ポリアクリル酸、およびポリメタアクリル酸ブチルの複合比はそれぞれｒ_１，ｒ_２，ｒ_３と表される。

　図５の例について説明する。図５の例では、ステップＳ１２１およびステップＳ１２２を含むステップＳ１２は図４の例と同じであり、ステップＳ１３，Ｓ１４は図４の例と異なる。

　図５に示すステップＳ１３では、算出部１２は複数の成分オブジェクトのそれぞれについて特徴ベクトルＭから線形回帰モデルの回帰パラメータを算出する。具体的には、算出部１２は１次項の回帰パラメータａおよび２次項の回帰パラメータｂを算出する。一例では、算出部１２はＦＣＮＮなどの機械学習によって回帰パラメータを算出する。機械学習モデルは線形回帰モデルの１次項および２次項のそれぞれについて用意される。

　図４の例と同様に、１次項の回帰パラメータを算出する関数では、入力ベクトルと出力値とは１対１の関係にある。この例では、入力ベクトルは特徴ベクトルＭであり、出力値は回帰パラメータａである。一例では、算出部１２は、複数の成分オブジェクトに対応する複数の特徴ベクトルＭの集合を機械学習モデルに入力して、該複数の成分オブジェクトのそれぞれについて回帰パラメータａを算出する。図５の例でも、算出部１２はポリスチレンに対応する回帰パラメータａ_１と、ポリアクリル酸に対応する回帰パラメータａ_２と、ポリメタアクリル酸ブチルに対応する回帰パラメータａ_３とを算出する。

　２次項の回帰パラメータを算出する関数では、個々の入力ベクトルは、二つの特徴ベクトルを合成することで得られる。この関数は、二つのベクトルから一つの回帰パラメータを算出する関数である。この例では、二つの特徴ベクトルＭが合成される。図５の例では、算出部１２は二つの特徴ベクトルＭ_１，Ｍ_２を合成して第１の入力ベクトルを生成し、二つの特徴ベクトルＭ_１，Ｍ_３を合成して第２の入力ベクトルを生成し、二つの特徴ベクトルＭ_２，Ｍ_３を合成して第３の入力ベクトルを生成する。したがって、第１の入力ベクトルはポリスチレンおよびポリアクリル酸に対応し、第２の入力ベクトルはポリスチレンおよびポリメタアクリル酸ブチルに対応し、第３の入力ベクトルはポリアクリル酸およびポリメタアクリル酸ブチルに対応する。２次項の回帰パラメータを算出する関数でも、入力ベクトルと出力値とは１対１の関係にある。この例では、入力ベクトルは二つの特徴ベクトルＭの合成であり、出力値は回帰パラメータｂである。一例では、算出部１２は入力ベクトルのすべての組合せを機械学習モデルに入力して、それぞれの組合せについて回帰パラメータｂを算出する。図５の例では、算出部１２はポリスチレンおよびポリアクリル酸の組合せに対応する回帰パラメータｂ_１２と、ポリスチレンおよびポリメタアクリル酸ブチルの組合せに対応する回帰パラメータｂ_１３と、ポリアクリル酸およびポリメタアクリル酸ブチルの組合せに対応する回帰パラメータｂ_２３とを算出する。

　図５に示すステップＳ１４では、予測部１３は６個の回帰パラメータａ_１，ａ_２，ａ_３，ｂ_１２，ｂ_１３，ｂ_２３によって定義される下記のシェッフェ多項式（２）によって予測値Ｅを算出する。式（２）において、回帰パラメータａは１次項の回帰係数であるともいえ、回帰パラメータｂは２次項の回帰係数であるともいえる。式（２）における変数ｒの意味は、式（１）と同じく複合比である。

　図４および図５では３個の成分オブジェクトを示すが、当然ながら成分オブジェクトの個数は限定されず、情報処理システム１０は任意の個数の成分オブジェクトを処理してよい。

　情報処理システム１０は、３次以上の項または他のパラメータを含む回帰モデルについても同様に、関連するすべての成分オブジェクトの特徴ベクトルに基づいて個々の回帰パラメータを出力すればよい。線形回帰の切片のように特定の説明変数に依存しない回帰パラメータを算出する場合には、情報処理システム１０は、すべての成分オブジェクトの特徴ベクトルに基づいて一つの回帰パラメータを出力してよい。

　図４および図５の例では算出部１２が埋込み関数および相互作用関数の双方を実行するが、この二つの関数の一方が省略されてもよい。例えば、算出部１２は埋込み関数用の機械学習モデルによって得られる特徴ベクトルＺから回帰パラメータを算出してもよい。いずれにしても、算出部１２は機械学習を実行して回帰パラメータを算出する。

　一例では、埋込み関数用の機械学習モデルと、相互作用関数用の機械学習モデルと、回帰パラメータ用の機械学習モデルと、回帰モデルとは一つのニューラルネットワークによって構築されてもよいし、複数のニューラルネットワークの集合によって構築されてもよい。あるいは、埋込み関数用の機械学習モデルと、相互作用関数用の機械学習モデルと、回帰パラメータ用の機械学習モデルとは一つのニューラルネットワークによって構築されてもよいし、複数のニューラルネットワークの集合によって構築されてもよい。

　［プログラム］
　コンピュータまたはコンピュータシステムを情報処理システム１０として機能させるための情報処理プログラムは、該コンピュータシステムを取得部１１、算出部１２、および予測部１３として機能させるためのプログラムコードを含む。この情報処理プログラムは、ＣＤ－ＲＯＭ、ＤＶＤ－ＲＯＭ、半導体メモリ等の有形の記録媒体に非一時的に記録された上で提供されてもよい。あるいは、情報処理プログラムは、搬送波に重畳されたデータ信号として通信ネットワークを介して提供されてもよい。提供された情報処理プログラムは例えば補助記憶部１０３に記憶される。プロセッサ１０１が補助記憶部１０３からその情報処理プログラムを読み出して実行することで、上記の各機能要素が実現する。

　［効果］
　以上説明したように、本開示の一側面に係る情報処理システムは、少なくとも一つのプロセッサを備える。少なくとも一つのプロセッサは、複数の成分オブジェクトのそれぞれについての数値表現および複合比を取得し、複数の数値表現に基づいて機械学習を実行して、複数の成分オブジェクトに対応する複数の回帰パラメータを算出し、複数の回帰パラメータによって定義される回帰モデルに複数の複合比を適用して、複数の成分オブジェクトを複合させることで得られる複合オブジェクトの特性を示す予測値を算出する。

　いったん回帰パラメータが得られれば、複合比を変更して複合オブジェクトの特性を回帰モデルによって瞬時に再計算することができる。すなわち、算出された回帰パラメータを再利用することができる。機械学習によって回帰パラメータを推定する手法を採用することで、複合比を変更しながら複合オブジェクトの特性を探索する処理を高速に実行することが可能になる。

　他の側面に係る情報処理システムでは、少なくとも一つのプロセッサが、複数の数値表現を第１機械学習モデルに入力して、複数の成分オブジェクトに対応する複数の特徴ベクトルを算出し、複数の特徴ベクトルを第２機械学習モデルに入力して複数の回帰パラメータを算出してもよい。この一連の手順によって、成分オブジェクトについて十分な量のデータを用意できない場合にも、複合オブジェクトの解析の精度をさらに上げることが可能になる。

　他の側面に係る情報処理システムでは、第１機械学習モデルが、埋込み関数用の機械学習モデルと、相互作用関数用の機械学習モデルとを含んでもよい。少なくとも一つのプロセッサは、複数の数値表現を埋込み関数用の機械学習モデルに入力して、複数の成分オブジェクトに対応する複数の第１特徴ベクトルを算出し、複数の第１特徴ベクトルを相互作用関数用の機械学習モデルに入力して、複数の成分オブジェクトに対応する複数の第２特徴ベクトルを算出し、複数の第２特徴ベクトルを第２機械学習モデルに入力して複数の回帰パラメータを算出してもよい。第１機械学習モデルをこのように構成することで、成分オブジェクトについて十分な量のデータを用意できない場合にも複合オブジェクトの解析の精度をさらに上げることが可能になる。

　他の側面に係る情報処理システムでは、埋込み関数用の機械学習モデルが、非定型データである数値表現から、固定長ベクトルである第１特徴ベクトルを生成する機械学習モデルであってもよい。この機械学習モデルを用いることで、固定長ベクトルによって表現できない数値表現から特徴ベクトルを得ることができる。

　他の側面に係る情報処理システムでは、回帰モデルがシェッフェ多項式であってもよい。少なくとも一つのプロセッサが、複数の回帰パラメータとして、シェッフェ多項式の１次項の複数の回帰係数を算出してもよい。配合に関する問題でよく扱われるシェッフェ多項式を用いることで、複数の成分オブジェクトを配合することによって得られる複合オブジェクトを精度良く解析することができる。加えて、１次項の回帰係数によって、成分オブジェクトの単独の影響度が考慮された予測値を算出できる。

　他の側面に係る情報処理システムでは、少なくとも一つのプロセッサが、複数の回帰パラメータとして、シェッフェ多項式の２次項の複数の回帰係数を更に算出してもよい。この場合には、２次項の回帰係数によって、二つの成分オブジェクトの合成の影響度が更に考慮された予測値を算出できる。

　他の側面に係る情報処理システムでは、成分オブジェクトが材料であり、複合オブジェクトが多成分物質であってもよい。この場合には、材料について十分な量のデータを用意できない場合にも多成分物質の解析の精度を上げることが可能になる。

　他の側面に係る情報処理システムでは、材料がポリマーまたはモノマーであり、多成分物質がポリマーアロイであってもよい。この場合には、ポリマーまたはモノマーについて十分な量のデータを用意できない場合にもポリマーアロイの解析の精度を上げることが可能になる。ポリマーまたはモノマーは非常に多様であり、これに対応して、ポリマーアロイの種類も膨大である。このようなポリマー、モノマー、およびポリマーアロイについては、一般に、取り得る組合せの一部についてしか実験を行うことができず、したがって十分な量のデータを得られないことが多い。本側面によれば、このようにデータが不十分である場合でも精度よくポリマーアロイを解析することが可能になる。

　［変形例］
　以上、本発明をその実施形態に基づいて詳細に説明した。しかし、本発明は上記実施形態に限定されるものではない。本発明は、その要旨を逸脱しない範囲で様々な変形が可能である。

　少なくとも一つのプロセッサにより実行される情報処理方法の処理手順は上記実施形態での例に限定されない。例えば、上述したステップまたは処理の一部が省略されてもよいし、別の順序で各ステップが実行されてもよい。また、上述したステップのうちの任意の２以上のステップが組み合わされてもよいし、ステップの一部が修正または削除されてもよい。あるいは、上記の各ステップに加えて他のステップが実行されてもよい。

　情報処理システム内で二つの数値の大小関係を比較する際には、「以上」および「よりも大きい」という二つの基準のどちらを用いてもよく、「以下」および「未満」の二つの基準のうちのどちらを用いてもよい。このような基準の選択は、二つの数値の大小関係を比較する処理についての技術的意義を変更するものではない。

　本開示において、「少なくとも一つのプロセッサが、第１の処理を実行し、第２の処理を実行し、…第ｎの処理を実行する。」との表現、またはこれに対応する表現は、第１の処理から第ｎの処理までのｎ個の処理を実行するプロセッサが途中で変わる場合を含む概念を示す。すなわち、この表現は、ｎ個の処理のすべてが同じプロセッサで実行される場合と、ｎ個の処理においてプロセッサが任意の方針で変わる場合との双方を含む概念を示す。

　１０…情報処理システム、１１…取得部、１２…算出部、１３…予測部。

Claims

　少なくとも一つのプロセッサを備え、
　前記少なくとも一つのプロセッサが、
　　複数の成分オブジェクトのそれぞれについての数値表現および複合比を取得し、
　　複数の前記数値表現に基づいて機械学習を実行して、前記複数の成分オブジェクトに対応する複数の回帰パラメータを算出し、
　　前記複数の回帰パラメータによって定義される回帰モデルに複数の前記複合比を適用して、前記複数の成分オブジェクトを複合させることで得られる複合オブジェクトの特性を示す予測値を算出する、
情報処理システム。
　前記少なくとも一つのプロセッサが、
　　前記複数の数値表現を第１機械学習モデルに入力して、前記複数の成分オブジェクトに対応する複数の特徴ベクトルを算出し、
　　前記複数の特徴ベクトルを第２機械学習モデルに入力して前記複数の回帰パラメータを算出する、
請求項１に記載の情報処理システム。
　前記第１機械学習モデルが、埋込み関数用の機械学習モデルと、相互作用関数用の機械学習モデルとを含み、
　前記少なくとも一つのプロセッサが、
　　前記複数の数値表現を前記埋込み関数用の機械学習モデルに入力して、前記複数の成分オブジェクトに対応する複数の第１特徴ベクトルを算出し、
　　前記複数の第１特徴ベクトルを前記相互作用関数用の機械学習モデルに入力して、前記複数の成分オブジェクトに対応する複数の第２特徴ベクトルを算出し、
　　前記複数の第２特徴ベクトルを前記第２機械学習モデルに入力して前記複数の回帰パラメータを算出する、
請求項２に記載の情報処理システム。
　前記埋込み関数用の機械学習モデルが、非定型データである前記数値表現から、固定長ベクトルである前記第１特徴ベクトルを生成する機械学習モデルである、
請求項３に記載の情報処理システム。
　前記回帰モデルがシェッフェ多項式であり、
　前記少なくとも一つのプロセッサが、前記複数の回帰パラメータとして、前記シェッフェ多項式の１次項の複数の回帰係数を算出する、
請求項１～４のいずれか一項に記載の情報処理システム。
　前記少なくとも一つのプロセッサが、前記複数の回帰パラメータとして、前記シェッフェ多項式の２次項の複数の回帰係数を更に算出する、
請求項５に記載の情報処理システム。
　前記成分オブジェクトが材料であり、前記複合オブジェクトが多成分物質である、
請求項１～６のいずれか一項に記載の情報処理システム。
　前記材料がポリマーまたはモノマーであり、前記多成分物質がポリマーアロイである、
請求項７に記載の情報処理システム。
　少なくとも一つのプロセッサを備える情報処理システムにより実行される情報処理方法であって、
　複数の成分オブジェクトのそれぞれについての数値表現および複合比を取得するステップと、
　複数の前記数値表現に基づいて機械学習を実行して、前記複数の成分オブジェクトに対応する複数の回帰パラメータを算出するステップと、
　前記複数の回帰パラメータによって定義される回帰モデルに複数の前記複合比を適用して、前記複数の成分オブジェクトを複合させることで得られる複合オブジェクトの特性を示す予測値を算出するステップと、
を含む情報処理方法。
　複数の成分オブジェクトのそれぞれについての数値表現および複合比を取得するステップと、
　複数の前記数値表現に基づいて機械学習を実行して、前記複数の成分オブジェクトに対応する複数の回帰パラメータを算出するステップと、
　前記複数の回帰パラメータによって定義される回帰モデルに複数の前記複合比を適用して、前記複数の成分オブジェクトを複合させることで得られる複合オブジェクトの特性を示す予測値を算出するステップと、
をコンピュータに実行させる情報処理プログラム。