JP7509153B2

JP7509153B2 - 情報処理システム、情報処理方法、および情報処理プログラム

Info

Publication number: JP7509153B2
Application number: JP2021556104A
Authority: JP
Inventors: 恭平花岡
Original assignee: Hitachi Chemical Co Ltd; Showa Denko Materials Co Ltd; Resonac Corp
Current assignee: Resonac Corp
Priority date: 2019-11-11
Filing date: 2020-11-10
Publication date: 2024-07-02
Anticipated expiration: 2040-11-10

Description

本開示の一側面は情報処理システム、情報処理方法、および情報処理プログラムに関する。

複数の成分オブジェクトを複合させることで得られる複合オブジェクトを、機械学習を用いて解析する手法が用いられている。例えば、特許文献１には、生体高分子の立体構造と化合物の立体構造との結合性を予測する方法が記載されている。この方法は、生体高分子の立体構造と化合物の立体構造とに基づいて生体高分子と化合物との複合体の予測立体構造を生成するステップと、その予測立体構造を、相互作用パターンとの照合結果を表す予測立体構造ベクトルへ変換するステップと、機械学習アルゴリズムを用いてその予測立体構造ベクトルを判別することによって生体高分子の立体構造と化合物の立体構造との結合性を予測するステップとを含む。

特開２０１９－２８８７９号公報

成分オブジェクトが多様であったり多数存在したりする場合には、これらの成分オブジェクトについて十分な量のデータを用意することができず、その結果、複合オブジェクトの解析の精度が、期待する水準に達しない可能性がある。そこで、成分オブジェクトについて十分な量のデータを用意できない場合にも複合オブジェクトの解析の精度を上げるための仕組みが望まれている。

本開示の一側面に係る情報処理システムは少なくとも一つのプロセッサを備える。少なくとも一つのプロセッサは、複数の成分オブジェクトのそれぞれについて数値表現および複合比を取得し、複数の参照オブジェクトのそれぞれについて数値表現を取得し、複数の成分オブジェクトに対応する複数の数値表現と、複数の参照オブジェクトに対応する複数の数値表現とを第１機械学習モデルに入力することで、該複数の成分オブジェクトのそれぞれの成分特徴ベクトルと、該複数の参照オブジェクトのそれぞれの参照特徴ベクトルとを算出し、複数の成分特徴ベクトルおよび複数の参照特徴ベクトルを第２機械学習モデルに入力することで、該複数の成分オブジェクトのそれぞれについて、該複数の参照オブジェクトのそれぞれとの関連度を示す確率ベクトルを算出し、複数の確率ベクトルおよび複数の複合比に基づいて、複数の成分オブジェクトを複合させることで得られる複合オブジェクトについて、複数の参照オブジェクトのそれぞれとの関連度を示す複合特徴ベクトルを算出し、複合特徴ベクトルを出力する。

このような側面においては、複合比を考慮する前に、複合オブジェクトを構成する各成分オブジェクトの特徴が個々の参照オブジェクトとの関連度を用いて顕在化される。したがって、成分オブジェクトについて十分な量のデータを用意できない場合にも複合オブジェクトの解析の精度を上げることが可能になる。

本開示の一側面によれば、成分オブジェクトについて十分な量のデータを用意できない場合にも複合オブジェクトの解析の精度を上げることができる。

実施形態に係る情報処理システムを構成するコンピュータのハードウェア構成の一例を示す図である。実施形態に係る情報処理システムの機能構成の一例を示す図である。実施形態に係る情報処理システムの動作の一例を示すフローチャートである。実施形態に係る情報処理システムの動作をデータの具体例を用いて説明する図である。

以下、添付図面を参照しながら本開示での実施形態を詳細に説明する。なお、図面の説明において同一または同等の要素には同一の符号を付し、重複する説明を省略する。

［システムの概要］
実施形態に係る情報処理システム１０は、複数の成分オブジェクトを所与の複合比で複合させることで得られる複合オブジェクトに関する解析を実行するコンピュータシステムである。成分オブジェクトとは、複合オブジェクトを生成するために用いられる有体物または無体物のことをいう。複合オブジェクトは有体物または無体物であり得る。有体物の例として任意の物質または物体が挙げられる。無体物の例としてデータおよび情報が挙げられる。「複数の成分オブジェクトを複合させる」とは、複数の成分オブジェクトを一つのオブジェクト、すなわち複合オブジェクトにする処理のことをいう。複合させる手法は限定させず、例えば、配合、調合、合成、結合、混合、合併、組合せ、化合、または合体でもよいし、他の手法でもよい。複合オブジェクトに関する解析とは、複合オブジェクトの何らかの特徴を示すデータを得るための処理のことをいう。

複数の成分オブジェクトは任意の複数種類の材料でもよく、この場合には、複合オブジェクトはそれらの材料によって生成される多成分物質である。材料とは多成分物質を生成するために用いられる任意の構成要素である。例えば、複数の材料は任意の複数種類の分子または原子材料でもよく、この場合には、複合オブジェクトは、それらの分子または原子を任意の手法で複合することにより得られる多成分物質である。例えば、材料はポリマーでもよく、これに対応して、多成分物質はポリマーアロイでもよい。材料はモノマーでもよく、これに対応して、多成分物質はポリマーでもよい。材料は薬物、すなわち、薬理作用を有する化学物質でもよく、これに対応して、多成分物質は薬剤でもよい。

情報処理システム１０は複合オブジェクトに関する解析のために機械学習を実行する。機械学習とは、与えられた情報に基づいて学習することで法則またはルールを自律的に見つけ出す手法である。機械学習の具体的な手法は限定されない。例えば、情報処理システム１０は、ニューラルネットワークを含んで構成される計算モデルである機械学習モデルを用いた機械学習を実行してもよい。ニューラルネットワークとは、人間の脳神経系の仕組みを模した情報処理のモデルのことをいう。より具体的な例として、情報処理システム１０は、グラフニューラルネットワーク（ＧＮＮ）、畳み込みニューラルネットワーク（ＣＮＮ）、再帰型ニューラルネットワーク（ＲＮＮ）、アテンションＲＮＮ（ＡｔｔｅｎｔｉｏｎＲＮＮ）、およびマルチヘッド・アテンション（Ｍｕｌｔｉ－ＨｅａｄＡｔｔｅｎｔｉｏｎ）のうちの少なくとも一つを用いて機械学習を実行してもよい。

［システムの構成］
情報処理システム１０は１台以上のコンピュータで構成される。複数台のコンピュータを用いる場合には、これらのコンピュータがインターネット、イントラネット等の通信ネットワークを介して接続されることで、論理的に一つの情報処理システム１０が構築される。

図１は、情報処理システム１０を構成するコンピュータ１００の一般的なハードウェア構成の一例を示す図である。例えば、コンピュータ１００は、オペレーティングシステム、アプリケーション・プログラム等を実行するプロセッサ（例えばＣＰＵ）１０１と、ＲＯＭおよびＲＡＭで構成される主記憶部１０２と、ハードディスク、フラッシュメモリ等で構成される補助記憶部１０３と、ネットワークカードまたは無線通信モジュールで構成される通信制御部１０４と、キーボード、マウス等の入力装置１０５と、モニタ等の出力装置１０６とを備える。

情報処理システム１０の各機能要素は、プロセッサ１０１または主記憶部１０２の上に予め定められたプログラムを読み込ませてプロセッサ１０１にそのプログラムを実行させることで実現される。プロセッサ１０１はそのプログラムに従って、通信制御部１０４、入力装置１０５、または出力装置１０６を動作させ、主記憶部１０２または補助記憶部１０３におけるデータの読み出しおよび書き込みを行う。処理に必要なデータまたはデータベースは主記憶部１０２または補助記憶部１０３内に格納される。

図２は情報処理システム１０の機能構成の一例を示す図である。情報処理システム１０は機能要素として取得部１１、第１学習部１２、第２学習部１３、比率適用部１４、および予測部１５を備える。

取得部１１は複数の成分オブジェクトに関するデータと、複数の参照オブジェクトに関するデータとを取得する機能要素である。参照オブジェクトとは、成分オブジェクトに対応して設定される有体物または無体物のことをいい、より具体的には、成分オブジェクトと同じ種類またはカテゴリに属するオブジェクトのことをいう。したがって、複数の参照オブジェクトは任意の複数種類の材料でもよく、例えば、ポリマー、モノマー、または薬物であり得る。

取得部１１は複数の成分オブジェクトのそれぞれについて数値表現および複合比を取得する。さらに、取得部１１は複数の参照オブジェクトのそれぞれについて数値表現を取得する。成分オブジェクト（または参照オブジェクト）の数値表現とは、成分オブジェクト（または参照オブジェクト）の任意の属性を複数の数値を用いて表現したデータのことをいう。成分オブジェクト（または参照オブジェクト）の属性とは、成分オブジェクト（または参照オブジェクト）が備える性質または特徴のことをいう。本開示では、成分オブジェクトの数値表現を「成分数値表現」ともいい、参照オブジェクトの数値表現を「参照数値表現」ともいう。数値表現は様々な手法で可視化されてよく、例えば、数字、英字、テキスト、分子グラフ、ベクトル、画像、時系列データなどの手法によって可視化されてもよいし、これらの手法のうちの任意の２以上の組合せによって可視化されてもよい。数値表現を構成する個々の数値は、十進法で表されてもよいし、二進法、十六進法などの他の表記法によって表されてもよい。成分オブジェクトの複合比とは、複数の成分オブジェクトの間の割合のことをいう。複合比の具体的な種類、単位、および表現方法は限定されず、成分オブジェクトまたは複合オブジェクトに応じて任意に定められてよい。例えば複合比は百分率などの比率、またはヒストグラムによって表されてもよいし、個々の成分オブジェクトの絶対量で表されてもよい。

成分オブジェクトの個数と参照オブジェクトの個数とは同じでもよいし異なってもよい。成分オブジェクトの個数は参照オブジェクトの個数より多くてもよいし少なくてもよい。

第１学習部１２は、第１機械学習モデルを用いた第１機械学習によって、複数の成分オブジェクトおよび複数の参照オブジェクトのそれぞれについて、該オブジェクトの特徴を示すベクトルを算出する機能要素である。成分オブジェクトの特徴を示すベクトルを成分特徴ベクトルといい、参照オブジェクトの特徴を示すベクトルを参照特徴ベクトルという。成分オブジェクト（または参照オブジェクト）の特徴とは、該成分オブジェクト（または該参照オブジェクト）を他のオブジェクトと異ならせる任意の要素のことをいう。ベクトルとは、ｎ個の数値を有するｎ次元の量のことをいい、１次元の配列として表現することができる。

第２学習部１３は、第２機械学習モデルを用いた第２機械学習によって、複数の成分オブジェクトのそれぞれについて、複数の参照オブジェクトのそれぞれとの関連度を示す確率ベクトルを算出する機能要素である。確率ベクトルとは、成分オブジェクトがそれぞれの参照オブジェクトとどのくらい関連するかを示すベクトルであり、言い換えると、成分オブジェクトがそれぞれの参照オブジェクトに帰属する度合いを示すベクトルである。関連度とは、成分オブジェクトと参照オブジェクトとの間の関連の強さを示す指標であり、言い換えると、成分オブジェクトが参照オブジェクトに帰属する度合いを示す指標である。

比率適用部１４は、複数の成分オブジェクトに対応する複数の確率ベクトルと各成分オブジェクトの複合比とに基づいて、複合オブジェクトの特徴を示す複合特徴ベクトルを算出する機能要素である。複合オブジェクトの特徴とは、該複合オブジェクトを他のオブジェクトと異ならせる任意の要素のことをいう。具体的には、複合特徴ベクトルは、複数の参照オブジェクトのそれぞれとの関連度を示す。

予測部１５は、複合オブジェクトの特性を予測し、その予測値を出力する機能要素である。複合オブジェクトの特性とは、複合オブジェクトが持つ特有の性質のことをいう。

一例では、第１および第２の機械学習モデルはいずれも、推定精度が最も高いと期待される学習済みモデルであり、したがって「最良の機械学習モデル」ということができる。しかし、この学習済みモデルは“現実に最良である”とは限らないことに留意されたい。学習済みモデルは、入力ベクトルとラベルとの多数の組合せを含む教師データを所与のコンピュータが処理することで生成される。所与のコンピュータは、入力ベクトルを機械学習モデルに入力することで出力ベクトルを算出し、算出された出力ベクトルから得られる予測値と、教師データで示されるラベルとの誤差（すなわち、推定結果と正解との差）を求める。そして、コンピュータはその誤差に基づいて機械学習モデル内の所与のパラメータを更新する。コンピュータはこのような学習を繰り返すことで学習済みモデルを生成する。学習済みモデルを生成するコンピュータは限定されず、例えば情報処理システム１０でもよいし別のコンピュータシステムでもよい。学習済みモデルを生成する処理は学習フェーズということができ、その学習済みモデルを利用する処理は運用フェーズということができる。

［データ］
上述したように、それぞれの成分オブジェクトおよびそれぞれの参照オブジェクトが材料であり、複合オブジェクトが多成分物質であってもよい。この場合には、成分数値表現および参照数値表現は、材料の化学構造を示す数値を含んでもよいし、材料の化学構造の構成繰返し単位（ＣＲＵ）を示す数値を含んでもよい。複合比は配合比または混合比でもよい。複合オブジェクト（多成分物質）の特性の予測値は、多成分物質のガラス転移温度（Ｔｇ）および弾性率のうちの少なくとも一つを示してもよい。

［システムの動作］
図３および図４を参照しながら、情報処理システム１０の動作を説明するとともに本実施形態に係る情報処理方法について説明する。図３は情報処理システム１０の動作の一例を処理フローＳ１として示すフローチャートである。図４は、情報処理システム１０の動作をデータの具体例を用いて示す図である。

ステップＳ１１では、取得部１１が、複数の成分オブジェクトのそれぞれについて数値表現（成分数値表現）および複合比を取得する。図４では複数の成分オブジェクトの例として二つの成分オブジェクトＥａ，Ｅｂを示す。成分オブジェクトＥａの数値表現は｛１，１，２，３，４，３，３，５，６，７，５，４｝であり、成分オブジェクトＥｂの数値表現は｛１，１，５，６，４，３，３，５，１，７，０，０｝である。成分オブジェクトＥａ，Ｅｂの複合比はそれぞれ０．７、０．３であり、したがって、これは、成分オブジェクトＥａ，Ｅｂを７：３の割合で用いて複合オブジェクトを得ることを意味する。

ステップＳ１２では、取得部１１が、複数の参照オブジェクトのそれぞれについて数値表現（参照数値表現）を取得する。図４では複数の参照オブジェクトの例として二つの参照オブジェクトＲａ，Ｒｂを示す。参照オブジェクトＲａの数値表現は｛１，２，５，１，４，１，３，１，１，１，０，０｝であり、参照オブジェクトＲｂの数値表現は｛１，２，０，０，４，１，３，１，０，１，０，０｝である。

図４の例では成分オブジェクトの個数と参照オブジェクトの個数とが同じであるが、上述したように両者の個数は異なってもよい。また、図４の例では成分オブジェクトと参照オブジェクトとの間で数値表現の次元数が同じであるが、両者の次元数が異なってもよい。

取得部１１は複数の成分オブジェクトおよび複数の参照オブジェクトのデータを任意の手法で取得してよい。例えば、取得部１１は所与のデータベースにアクセスすることでデータを読み出してもよいし、他のコンピュータまたはコンピュータシステムからデータを受信してもよいし、情報処理システム１０のユーザにより入力されたデータを受け付けてもよい。あるいは、取得部１１はこれらのような手法のうちの任意の２以上によってデータを取得してもよい。

ステップＳ１３では、第１学習部１２が第１機械学習によって、各成分オブジェクトの成分特徴ベクトルと、各参照オブジェクトの参照特徴ベクトルとを算出する。

第１学習部１２は、複数の成分オブジェクトに対応する複数の数値表現（成分数値表現）を第１機械学習モデルに入力することで、該複数の成分オブジェクトのそれぞれの成分特徴ベクトルを算出する。一例では、第１学習部１２は、複数の成分オブジェクトのそれぞれについて、該成分オブジェクトに対応する数値表現を第１機械学習モデルに入力することで該成分オブジェクトの成分特徴ベクトルを算出する。

さらに、第１学習部１２は、複数の参照オブジェクトに対応する複数の数値表現（参照数値表現）を第１機械学習モデルに入力することで、該複数の参照オブジェクトのそれぞれの参照特徴ベクトルを算出する。一例では、第１学習部１２は、複数の参照オブジェクトのそれぞれについて、該参照オブジェクトに対応する数値表現を第１機械学習モデルに入力することで該参照オブジェクトの参照特徴ベクトルを算出する。

第１機械学習モデルは限定されず、成分オブジェクトおよび参照オブジェクトの種類などの要因を考慮して任意の方針で決められてよい。例えば、第１学習部１２はグラフニューラルネットワーク（ＧＮＮ）、畳み込みニューラルネットワーク（ＣＮＮ）、または再帰型ニューラルネットワーク（ＲＮＮ）を用いて第１機械学習を実行してもよい。

成分オブジェクトに対応する数値表現が入力される第１機械学習モデルと、参照オブジェクトに対応する数値表現が入力される第１機械学習モデルとは、同じでもよいし相異なってもよい。本開示では、「複数の成分オブジェクトに対応する複数の数値表現と、複数の参照オブジェクトに対応する複数の数値表現とを第１機械学習モデルに入力する」とは、成分オブジェクトのための第１機械学習モデルと、参照オブジェクトのための第１機械学習モデルとが同じ場合と相異なる場合との双方を含む概念であることに留意されたい。

図４の例では、第１学習部１２は成分オブジェクトＥａの数値表現｛１，１，２，３，４，３，３，５，６，７，５，４｝を第１機械学習モデルに入力することで成分特徴ベクトル｛１，１，４，１，３，１｝を算出する。また、第１学習部１２は成分オブジェクトＥｂの数値表現｛１，１，５，６，４，３，３，５，１，７，０，０｝を第１機械学習モデルに入力することで成分特徴ベクトル｛３，３，１，１，０，０｝を算出する。第１学習部１２は参照オブジェクトＲａの数値表現｛１，２，５，１，４，１，３，１，１，１，０，０｝を第１機械学習モデルに入力することで参照特徴ベクトル｛１，４，２，１，１，０｝を算出する。また、第１学習部１２は参照オブジェクトＲｂの数値表現｛１，２，０，０，４，１，３，１，０，１，０，０｝を第１機械学習モデルに入力することで参照特徴ベクトル｛２，１，０，１，０，０｝を算出する。図４の例では成分特徴ベクトルと参照特徴ベクトルとの間で次元数が同じであるが、両者の次元数が異なってもよい。

ステップＳ１４では、第２学習部１３が第２機械学習によって、複数の成分特徴ベクトルおよび複数の参照特徴ベクトルから、複数の成分オブジェクトのそれぞれの確率ベクトルを算出する。一例では、第２学習部１３は、複数の成分オブジェクトのそれぞれについて、該成分オブジェクトに対応する成分特徴ベクトルと、複数の参照特徴ベクトルの集合との組合せを第２機械学習モデルに入力することで、該成分オブジェクトの確率ベクトルを算出する。個々の成分オブジェクトの確率ベクトルは、複数の参照オブジェクトに対応する複数の数値（ベクトル成分）で構成される。確率ベクトルの次元数は参照オブジェクトの個数と一致する。第２機械学習モデルは限定されず、成分オブジェクトおよび参照オブジェクトの種類などの要因を考慮して任意の方針で決められてよい。例えば、第２機械学習モデルは、集合の要素の組合せの影響を考慮できる学習モデルでもよいし、その影響を考慮できない学習モデルでもよい。前者の例として、アテンションＲＮＮ（ＡｔｔｅｎｔｉｏｎＲＮＮ）またはマルチヘッド・アテンション（Ｍｕｌｔｉ－ＨｅａｄＡｔｔｅｎｔｉｏｎ）が挙げられる。

図４の例では、第２学習部１３は成分オブジェクトＥａの成分特徴ベクトル｛１，１，４，１，３，１｝と、参照オブジェクトＲａの参照特徴ベクトル｛１，４，２，１，１，０｝と、参照オブジェクトＲｂの参照特徴ベクトル｛２，１，０，１，０，０｝とを第２機械学習モデルに入力することで、成分オブジェクトＥａの確率ベクトル｛０．４，０．６｝を算出する。この確率ベクトルは、成分オブジェクトＥａと参照オブジェクトＲａとの関連度が０．４であり、成分オブジェクトＥａと参照オブジェクトＲｂとの関連度が０．６であることを示す。

さらに、第２学習部１３は成分オブジェクトＥｂの成分特徴ベクトル｛３，３，１，１，０，０｝と、参照オブジェクトＲａの参照特徴ベクトルと、参照オブジェクトＲｂの参照特徴ベクトルとを第２機械学習モデルに入力することで、成分オブジェクトＥｂの確率ベクトル｛０．２，０．８｝を算出する。この確率ベクトルは、成分オブジェクトＥａと参照オブジェクトＲａとの関連度が０．２であり、成分オブジェクトＥａと参照オブジェクトＲｂとの関連度が０．８であることを示す。

ステップＳ１５では、比率適用部１４が複数の確率ベクトルおよび複数の複合比から複合特徴ベクトルを生成する。複合特徴ベクトルは、複数の参照オブジェクトに対応する複数の数値（ベクトル成分）で構成される。複合特徴ベクトルの構成および算出方法はいずれも限定されない。一例では、複合特徴ベクトルの次元数は参照オブジェクトの個数と一致する。すなわち、複合特徴ベクトルは確率ベクトルと同じ構造を有する。

成分オブジェクトの個数をｍとし、参照オブジェクトの個数をｎとする。また、個々の成分オブジェクトの確率ベクトルをＶｐ_１，Ｖｐ_２，…，Ｖｐ_ｍで表すとする。個々の確率ベクトルはｎ次元である。また、個々の成分オブジェクトの複合比をｒ_１，ｒ_２，…，ｒ_ｍとする。これらの前提において、一例では、比率適用部１４はｎ次元の複合特徴ベクトルＶｃを下記の式（１）によって算出する。
Ｖｃ＝ｒ_１×Ｖｐ_１＋ｒ_２×Ｖｐ_２＋…＋ｒ_ｍ×Ｖｐ_ｍ …（１）

図４の例では、比率適用部１４は以下の計算により複合特徴ベクトルＶｃを｛０．３４，０．６６｝と算出する。
Ｖｃ＝０．７×｛０．４，０．６｝＋０．３×｛０．２，０．８｝＝｛０．２８，０．４２｝＋｛０．０６，０．２４｝＝｛０．３４，０．６６｝

ステップＳ１６では、比率適用部１４が複合特徴ベクトルを出力する。本実施形態では、比率適用部１４は情報処理システム１０での後続処理のために複合特徴ベクトルを予測部１５に出力する。しかし、複合特徴ベクトルの出力方法はこれに限定されず、任意の方針で設計されてよい。例えば、比率適用部１４は複合特徴ベクトルを、所与のデータベースに格納してもよいし、他のコンピュータまたはコンピュータシステムに向けて送信してもよいし、表示装置上に表示してもよい。

ステップＳ１７では、予測部１５が複合特徴ベクトルから複合オブジェクトの特性の予測値を算出する。予測方法は限定されず、任意の方針で設計されてよい。例えば、予測部１５は第３機械学習によって複合特徴ベクトルから予測値を算出してもよい。具体的には、予測部１５は、複合特徴ベクトルを第３機械学習モデルに入力することで予測値を算出する。第３機械学習モデルは限定されず、複合オブジェクトの種類などの要因を考慮して任意の方針で決められてよい。例えば、予測部１５は回帰問題または分類問題を解く任意のニューラルネットワークを用いて第３機械学習を実行してもよい。典型的には、回帰問題の予測値は数値で表され、分類問題の予測値はカテゴリを示す。予測部１５は機械学習以外の手法を用いて予測値を算出してもよい。

ステップＳ１８では、予測部１５がその予測値を出力する。予測値の出力方法は限定されない。例えば、予測部１５は予測値を、所与のデータベースに格納してもよいし、他のコンピュータまたはコンピュータシステムに向けて送信してもよいし、表示装置上に表示してもよい。あるいは、予測部１５は情報処理システム１０での後続処理のために予測値を他の機能要素に出力してもよい。

［プログラム］
コンピュータまたはコンピュータシステムを情報処理システム１０として機能させるための情報処理プログラムは、該コンピュータシステムを取得部１１、第１学習部１２、第２学習部１３、比率適用部１４、および予測部１５として機能させるためのプログラムコードを含む。この情報処理プログラムは、ＣＤ－ＲＯＭ、ＤＶＤ－ＲＯＭ、半導体メモリ等の有形の記録媒体に固定的に記録された上で提供されてもよい。あるいは、情報処理プログラムは、搬送波に重畳されたデータ信号として通信ネットワークを介して提供されてもよい。提供された情報処理プログラムは例えば補助記憶部１０３に記憶される。プロセッサ１０１が補助記憶部１０３からその情報処理プログラムを読み出して実行することで、上記の各機能要素が実現する。

［効果］
以上説明したように、本開示の一側面に係る情報処理システムは少なくとも一つのプロセッサを備える。少なくとも一つのプロセッサは、複数の成分オブジェクトのそれぞれについて数値表現および複合比を取得し、複数の参照オブジェクトのそれぞれについて数値表現を取得し、複数の成分オブジェクトに対応する複数の数値表現と、複数の参照オブジェクトに対応する複数の数値表現とを第１機械学習モデルに入力することで、該複数の成分オブジェクトのそれぞれの成分特徴ベクトルと、該複数の参照オブジェクトのそれぞれの参照特徴ベクトルとを算出し、複数の成分特徴ベクトルおよび複数の参照特徴ベクトルを第２機械学習モデルに入力することで、該複数の成分オブジェクトのそれぞれについて、該複数の参照オブジェクトのそれぞれとの関連度を示す確率ベクトルを算出し、複数の確率ベクトルおよび複数の複合比に基づいて、複数の成分オブジェクトを複合させることで得られる複合オブジェクトについて、複数の参照オブジェクトのそれぞれとの関連度を示す複合特徴ベクトルを算出し、複合特徴ベクトルを出力する。

本発明の一側面に係る情報処理方法は、少なくとも一つのプロセッサを備える情報処理システムにより実行される。情報処理方法は、複数の成分オブジェクトのそれぞれについて数値表現および複合比を取得するステップと、複数の参照オブジェクトのそれぞれについて数値表現を取得するステップと、複数の成分オブジェクトに対応する複数の数値表現と、複数の参照オブジェクトに対応する複数の数値表現とを第１機械学習モデルに入力することで、該複数の成分オブジェクトのそれぞれの成分特徴ベクトルと、該複数の参照オブジェクトのそれぞれの参照特徴ベクトルとを算出するステップと、複数の成分特徴ベクトルおよび複数の参照特徴ベクトルを第２機械学習モデルに入力することで、該複数の成分オブジェクトのそれぞれについて、該複数の参照オブジェクトのそれぞれとの関連度を示す確率ベクトルを算出するステップと、複数の確率ベクトルおよび複数の複合比に基づいて、複数の成分オブジェクトを複合させることで得られる複合オブジェクトについて、複数の参照オブジェクトのそれぞれとの関連度を示す複合特徴ベクトルを算出するステップと、複合特徴ベクトルを出力するステップとを含む。

本発明の一側面に係る情報処理プログラムは、複数の成分オブジェクトのそれぞれについて数値表現および複合比を取得するステップと、複数の参照オブジェクトのそれぞれについて数値表現を取得するステップと、複数の成分オブジェクトに対応する複数の数値表現と、複数の参照オブジェクトに対応する複数の数値表現とを第１機械学習モデルに入力することで、該複数の成分オブジェクトのそれぞれの成分特徴ベクトルと、該複数の参照オブジェクトのそれぞれの参照特徴ベクトルとを算出するステップと、複数の成分特徴ベクトルおよび複数の参照特徴ベクトルを第２機械学習モデルに入力することで、該複数の成分オブジェクトのそれぞれについて、該複数の参照オブジェクトのそれぞれとの関連度を示す確率ベクトルを算出するステップと、複数の確率ベクトルおよび複数の複合比に基づいて、複数の成分オブジェクトを複合させることで得られる複合オブジェクトについて、複数の参照オブジェクトのそれぞれとの関連度を示す複合特徴ベクトルを算出するステップと、複合特徴ベクトルを出力するステップとをコンピュータに実行させる。

他の側面に係る情報処理システムでは、複数の成分オブジェクトの個数をｍとし、複数の参照オブジェクトの個数をｎとし、複数の確率ベクトルのそれぞれがｎ次元であり、複数の確率ベクトルをＶｐ_１，Ｖｐ_２，…，Ｖｐ_ｍとし、複数の複合比をｒ_１，ｒ_２，…，ｒ_ｍとし、複合特徴ベクトルをＶｃとして、少なくとも一つのプロセッサが複合特徴ベクトルを下記式（１）によって算出してもよい。
Ｖｃ＝ｒ_１×Ｖｐ_１＋ｒ_２×Ｖｐ_２＋…＋ｒ_ｍ×Ｖｐ_ｍ …（１）
この場合には、精度が高いと推定される複合特徴ベクトルを簡単な演算によって得ることができる。

他の側面に係る情報処理システムでは、少なくとも一つのプロセッサが、複合特徴ベクトルを第３機械学習モデルに入力することで、複合オブジェクトの特性の予測値を算出し、予測値を出力してもよい。この処理によって、複合オブジェクトの特性を精度良く算出することが可能になる。

他の側面に係る情報処理システムでは、成分オブジェクトが材料であり、複合オブジェクトが多成分物質であってもよい。この場合には、複合比を考慮する前に、多成分物質を構成する各材料の特徴が顕在化される。したがって、材料について十分な量のデータを用意できない場合にも多成分物質の解析の精度を上げることが可能になる。

他の側面に係る情報処理システムでは、材料がポリマーであり、多成分物質がポリマーアロイであってもよい。この場合には、複合比を考慮する前に、ポリマーアロイを構成する各ポリマーの特徴が顕在化される。したがって、ポリマーについて十分な量のデータを用意できない場合にもポリマーアロイの解析の精度を上げることが可能になる。ポリマーアロイは非常に多様であり、これに対応して、ポリマーの種類も膨大である。このようなポリマーおよびポリマーアロイについては、一般に、取り得る組合せの一部についてしか実験を行うことができず、したがって十分な量のデータを得られないことが多い。本側面によれば、このようにデータが不十分である場合でも精度よくポリマーアロイを解析することが可能になる。

［変形例］
以上、本発明をその実施形態に基づいて詳細に説明した。しかし、本発明は上記実施形態に限定されるものではない。本発明は、その要旨を逸脱しない範囲で様々な変形が可能である。

上記実施形態では情報処理システム１０が予測部１５を備えるが、この機能要素は省略可能である。すなわち、複合オブジェクトの特性を予測する処理は情報処理システムとは異なるコンピュータシステムによって実行されてもよい。

予測部は、複合特徴ベクトルに加えて参照特徴ベクトルなどの他の情報を用いて予測を実行してもよい。あるいは、予測部は複合特徴ベクトルに基づくデータを用いて予測を実行してもよく、例えば、複合特徴ベクトルによる参照特徴ベクトルの重み付き平均を用いて予測を実行してもよい。

少なくとも一つのプロセッサにより実行される情報処理方法の処理手順は上記実施形態での例に限定されない。例えば、上述したステップ（処理）の一部が省略されてもよいし、別の順序で各ステップが実行されてもよい。また、上述したステップのうちの任意の２以上のステップが組み合わされてもよいし、ステップの一部が修正または削除されてもよい。あるいは、上記の各ステップに加えて他のステップが実行されてもよい。例えばステップＳ１７，Ｓ１８の処理が省略されてもよい。

情報処理システム内で二つの数値の大小関係を比較する際には、「以上」および「よりも大きい」という二つの基準のどちらを用いてもよく、「以下」および「未満」の二つの基準のうちのどちらを用いてもよい。このような基準の選択は、二つの数値の大小関係を比較する処理についての技術的意義を変更するものではない。

本開示において、「少なくとも一つのプロセッサが、第１の処理を実行し、第２の処理を実行し、…第ｎの処理を実行する。」との表現、またはこれに対応する表現は、第１の処理から第ｎの処理までのｎ個の処理の実行主体（すなわちプロセッサ）が途中で変わる場合を含む概念を示す。すなわち、この表現は、ｎ個の処理のすべてが同じプロセッサで実行される場合と、ｎ個の処理においてプロセッサが任意の方針で変わる場合との双方を含む概念を示す。

１０…情報処理システム、１１…取得部、１２…第１学習部、１３…第２学習部、１４…比率適用部、１５…予測部。

Claims

少なくとも一つのプロセッサを備え、
前記少なくとも一つのプロセッサが、
複数の成分オブジェクトのそれぞれについて数値表現および複合比を取得し、
複数の参照オブジェクトのそれぞれについて数値表現を取得し、
前記複数の成分オブジェクトに対応する複数の前記数値表現と、前記複数の参照オブジェクトに対応する複数の前記数値表現とを第１機械学習モデルに入力することで、該複数の成分オブジェクトのそれぞれの成分特徴ベクトルと、該複数の参照オブジェクトのそれぞれの参照特徴ベクトルとを算出し、
複数の前記成分特徴ベクトルおよび複数の前記参照特徴ベクトルを第２機械学習モデルに入力することで、該複数の成分オブジェクトのそれぞれについて、該複数の参照オブジェクトのそれぞれとの関連度を示す確率ベクトルを算出し、
複数の前記確率ベクトルおよび複数の前記複合比に基づいて、前記複数の成分オブジェクトを複合させることで得られる複合オブジェクトについて、前記複数の参照オブジェクトのそれぞれとの関連度を示す複合特徴ベクトルを算出し、
前記複合特徴ベクトルを出力する、
情報処理システム。
前記複数の成分オブジェクトの個数をｍとし、前記複数の参照オブジェクトの個数をｎとし、前記複数の確率ベクトルのそれぞれがｎ次元であり、前記複数の確率ベクトルをＶｐ_１，Ｖｐ_２，…，Ｖｐ_ｍとし、前記複数の複合比をｒ_１，ｒ_２，…，ｒ_ｍとし、前記複合特徴ベクトルをＶｃとして、前記少なくとも一つのプロセッサが前記複合特徴ベクトルを下記式（１）
Ｖｃ＝ｒ_１×Ｖｐ_１＋ｒ_２×Ｖｐ_２＋…＋ｒ_ｍ×Ｖｐ_ｍ …（１）
によって算出する、
請求項１に記載の情報処理システム。
前記少なくとも一つのプロセッサが、
前記複合特徴ベクトルを第３機械学習モデルに入力することで、前記複合オブジェクトの特性の予測値を算出し、
前記予測値を出力する、
請求項１または２に記載の情報処理システム。
前記成分オブジェクトが材料であり、前記複合オブジェクトが多成分物質である、
請求項１～３のいずれか一項に記載の情報処理システム。
前記材料がポリマーであり、前記多成分物質がポリマーアロイである、
請求項４に記載の情報処理システム。
少なくとも一つのプロセッサを備える情報処理システムにより実行される情報処理方法であって、
複数の成分オブジェクトのそれぞれについて数値表現および複合比を取得するステップと、
複数の参照オブジェクトのそれぞれについて数値表現を取得するステップと、
前記複数の成分オブジェクトに対応する複数の前記数値表現と、前記複数の参照オブジェクトに対応する複数の前記数値表現とを第１機械学習モデルに入力することで、該複数の成分オブジェクトのそれぞれの成分特徴ベクトルと、該複数の参照オブジェクトのそれぞれの参照特徴ベクトルとを算出するステップと、
複数の前記成分特徴ベクトルおよび複数の前記参照特徴ベクトルを第２機械学習モデルに入力することで、該複数の成分オブジェクトのそれぞれについて、該複数の参照オブジェクトのそれぞれとの関連度を示す確率ベクトルを算出するステップと、
複数の前記確率ベクトルおよび複数の前記複合比に基づいて、前記複数の成分オブジェクトを複合させることで得られる複合オブジェクトについて、前記複数の参照オブジェクトのそれぞれとの関連度を示す複合特徴ベクトルを算出するステップと、
前記複合特徴ベクトルを出力するステップと
を含む情報処理方法。
複数の成分オブジェクトのそれぞれについて数値表現および複合比を取得するステップと、
複数の参照オブジェクトのそれぞれについて数値表現を取得するステップと、
前記複数の成分オブジェクトに対応する複数の前記数値表現と、前記複数の参照オブジェクトに対応する複数の前記数値表現とを第１機械学習モデルに入力することで、該複数の成分オブジェクトのそれぞれの成分特徴ベクトルと、該複数の参照オブジェクトのそれぞれの参照特徴ベクトルとを算出するステップと、
複数の前記成分特徴ベクトルおよび複数の前記参照特徴ベクトルを第２機械学習モデルに入力することで、該複数の成分オブジェクトのそれぞれについて、該複数の参照オブジェクトのそれぞれとの関連度を示す確率ベクトルを算出するステップと、
複数の前記確率ベクトルおよび複数の前記複合比に基づいて、前記複数の成分オブジェクトを複合させることで得られる複合オブジェクトについて、前記複数の参照オブジェクトのそれぞれとの関連度を示す複合特徴ベクトルを算出するステップと、
前記複合特徴ベクトルを出力するステップと
をコンピュータに実行させる情報処理プログラム。