JP7509153B2 - 情報処理システム、情報処理方法、および情報処理プログラム - Google Patents
情報処理システム、情報処理方法、および情報処理プログラムInfo
- Publication number
- JP7509153B2 JP7509153B2 JP2021556104A JP2021556104A JP7509153B2 JP 7509153 B2 JP7509153 B2 JP 7509153B2 JP 2021556104 A JP2021556104 A JP 2021556104A JP 2021556104 A JP2021556104 A JP 2021556104A JP 7509153 B2 JP7509153 B2 JP 7509153B2
- Authority
- JP
- Japan
- Prior art keywords
- component
- objects
- composite
- feature vector
- information processing
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 230000010365 information processing Effects 0.000 title claims description 57
- 238000003672 processing method Methods 0.000 title claims description 7
- 239000013598 vector Substances 0.000 claims description 142
- 239000002131 composite material Substances 0.000 claims description 109
- 238000010801 machine learning Methods 0.000 claims description 59
- 239000000126 substance Substances 0.000 claims description 19
- 239000000463 material Substances 0.000 claims description 18
- 229920000642 polymer Polymers 0.000 claims description 17
- 239000000956 alloy Substances 0.000 claims description 8
- 229910045601 alloy Inorganic materials 0.000 claims description 8
- 238000000034 method Methods 0.000 description 32
- 230000008569 process Effects 0.000 description 15
- 230000014509 gene expression Effects 0.000 description 11
- 238000004458 analytical method Methods 0.000 description 10
- 238000012545 processing Methods 0.000 description 8
- 238000013528 artificial neural network Methods 0.000 description 7
- 150000001875 compounds Chemical class 0.000 description 6
- 238000010586 diagram Methods 0.000 description 6
- 238000004891 communication Methods 0.000 description 5
- 238000013329 compounding Methods 0.000 description 5
- 229920001222 biopolymer Polymers 0.000 description 4
- 238000013527 convolutional neural network Methods 0.000 description 4
- 238000004364 calculation method Methods 0.000 description 3
- 239000003814 drug Substances 0.000 description 3
- 238000002156 mixing Methods 0.000 description 3
- 239000000203 mixture Substances 0.000 description 3
- 229940079593 drug Drugs 0.000 description 2
- 230000006870 function Effects 0.000 description 2
- 230000007246 mechanism Effects 0.000 description 2
- 239000000178 monomer Substances 0.000 description 2
- 230000000306 recurrent effect Effects 0.000 description 2
- 238000012549 training Methods 0.000 description 2
- 230000015572 biosynthetic process Effects 0.000 description 1
- 210000000133 brain stem Anatomy 0.000 description 1
- 238000004422 calculation algorithm Methods 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000005094 computer simulation Methods 0.000 description 1
- 239000000470 constituent Substances 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000002474 experimental method Methods 0.000 description 1
- 230000009477 glass transition Effects 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 210000000653 nervous system Anatomy 0.000 description 1
- 230000000144 pharmacologic effect Effects 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 238000003786 synthesis reaction Methods 0.000 description 1
Description
本開示の一側面は情報処理システム、情報処理方法、および情報処理プログラムに関する。
複数の成分オブジェクトを複合させることで得られる複合オブジェクトを、機械学習を用いて解析する手法が用いられている。例えば、特許文献1には、生体高分子の立体構造と化合物の立体構造との結合性を予測する方法が記載されている。この方法は、生体高分子の立体構造と化合物の立体構造とに基づいて生体高分子と化合物との複合体の予測立体構造を生成するステップと、その予測立体構造を、相互作用パターンとの照合結果を表す予測立体構造ベクトルへ変換するステップと、機械学習アルゴリズムを用いてその予測立体構造ベクトルを判別することによって生体高分子の立体構造と化合物の立体構造との結合性を予測するステップとを含む。
成分オブジェクトが多様であったり多数存在したりする場合には、これらの成分オブジェクトについて十分な量のデータを用意することができず、その結果、複合オブジェクトの解析の精度が、期待する水準に達しない可能性がある。そこで、成分オブジェクトについて十分な量のデータを用意できない場合にも複合オブジェクトの解析の精度を上げるための仕組みが望まれている。
本開示の一側面に係る情報処理システムは少なくとも一つのプロセッサを備える。少なくとも一つのプロセッサは、複数の成分オブジェクトのそれぞれについて数値表現および複合比を取得し、複数の参照オブジェクトのそれぞれについて数値表現を取得し、複数の成分オブジェクトに対応する複数の数値表現と、複数の参照オブジェクトに対応する複数の数値表現とを第1機械学習モデルに入力することで、該複数の成分オブジェクトのそれぞれの成分特徴ベクトルと、該複数の参照オブジェクトのそれぞれの参照特徴ベクトルとを算出し、複数の成分特徴ベクトルおよび複数の参照特徴ベクトルを第2機械学習モデルに入力することで、該複数の成分オブジェクトのそれぞれについて、該複数の参照オブジェクトのそれぞれとの関連度を示す確率ベクトルを算出し、複数の確率ベクトルおよび複数の複合比に基づいて、複数の成分オブジェクトを複合させることで得られる複合オブジェクトについて、複数の参照オブジェクトのそれぞれとの関連度を示す複合特徴ベクトルを算出し、複合特徴ベクトルを出力する。
このような側面においては、複合比を考慮する前に、複合オブジェクトを構成する各成分オブジェクトの特徴が個々の参照オブジェクトとの関連度を用いて顕在化される。したがって、成分オブジェクトについて十分な量のデータを用意できない場合にも複合オブジェクトの解析の精度を上げることが可能になる。
本開示の一側面によれば、成分オブジェクトについて十分な量のデータを用意できない場合にも複合オブジェクトの解析の精度を上げることができる。
以下、添付図面を参照しながら本開示での実施形態を詳細に説明する。なお、図面の説明において同一または同等の要素には同一の符号を付し、重複する説明を省略する。
[システムの概要]
実施形態に係る情報処理システム10は、複数の成分オブジェクトを所与の複合比で複合させることで得られる複合オブジェクトに関する解析を実行するコンピュータシステムである。成分オブジェクトとは、複合オブジェクトを生成するために用いられる有体物または無体物のことをいう。複合オブジェクトは有体物または無体物であり得る。有体物の例として任意の物質または物体が挙げられる。無体物の例としてデータおよび情報が挙げられる。「複数の成分オブジェクトを複合させる」とは、複数の成分オブジェクトを一つのオブジェクト、すなわち複合オブジェクトにする処理のことをいう。複合させる手法は限定させず、例えば、配合、調合、合成、結合、混合、合併、組合せ、化合、または合体でもよいし、他の手法でもよい。複合オブジェクトに関する解析とは、複合オブジェクトの何らかの特徴を示すデータを得るための処理のことをいう。
実施形態に係る情報処理システム10は、複数の成分オブジェクトを所与の複合比で複合させることで得られる複合オブジェクトに関する解析を実行するコンピュータシステムである。成分オブジェクトとは、複合オブジェクトを生成するために用いられる有体物または無体物のことをいう。複合オブジェクトは有体物または無体物であり得る。有体物の例として任意の物質または物体が挙げられる。無体物の例としてデータおよび情報が挙げられる。「複数の成分オブジェクトを複合させる」とは、複数の成分オブジェクトを一つのオブジェクト、すなわち複合オブジェクトにする処理のことをいう。複合させる手法は限定させず、例えば、配合、調合、合成、結合、混合、合併、組合せ、化合、または合体でもよいし、他の手法でもよい。複合オブジェクトに関する解析とは、複合オブジェクトの何らかの特徴を示すデータを得るための処理のことをいう。
複数の成分オブジェクトは任意の複数種類の材料でもよく、この場合には、複合オブジェクトはそれらの材料によって生成される多成分物質である。材料とは多成分物質を生成するために用いられる任意の構成要素である。例えば、複数の材料は任意の複数種類の分子または原子材料でもよく、この場合には、複合オブジェクトは、それらの分子または原子を任意の手法で複合することにより得られる多成分物質である。例えば、材料はポリマーでもよく、これに対応して、多成分物質はポリマーアロイでもよい。材料はモノマーでもよく、これに対応して、多成分物質はポリマーでもよい。材料は薬物、すなわち、薬理作用を有する化学物質でもよく、これに対応して、多成分物質は薬剤でもよい。
情報処理システム10は複合オブジェクトに関する解析のために機械学習を実行する。機械学習とは、与えられた情報に基づいて学習することで法則またはルールを自律的に見つけ出す手法である。機械学習の具体的な手法は限定されない。例えば、情報処理システム10は、ニューラルネットワークを含んで構成される計算モデルである機械学習モデルを用いた機械学習を実行してもよい。ニューラルネットワークとは、人間の脳神経系の仕組みを模した情報処理のモデルのことをいう。より具体的な例として、情報処理システム10は、グラフニューラルネットワーク(GNN)、畳み込みニューラルネットワーク(CNN)、再帰型ニューラルネットワーク(RNN)、アテンションRNN(Attention RNN)、およびマルチヘッド・アテンション(Multi-Head Attention)のうちの少なくとも一つを用いて機械学習を実行してもよい。
[システムの構成]
情報処理システム10は1台以上のコンピュータで構成される。複数台のコンピュータを用いる場合には、これらのコンピュータがインターネット、イントラネット等の通信ネットワークを介して接続されることで、論理的に一つの情報処理システム10が構築される。
情報処理システム10は1台以上のコンピュータで構成される。複数台のコンピュータを用いる場合には、これらのコンピュータがインターネット、イントラネット等の通信ネットワークを介して接続されることで、論理的に一つの情報処理システム10が構築される。
図1は、情報処理システム10を構成するコンピュータ100の一般的なハードウェア構成の一例を示す図である。例えば、コンピュータ100は、オペレーティングシステム、アプリケーション・プログラム等を実行するプロセッサ(例えばCPU)101と、ROMおよびRAMで構成される主記憶部102と、ハードディスク、フラッシュメモリ等で構成される補助記憶部103と、ネットワークカードまたは無線通信モジュールで構成される通信制御部104と、キーボード、マウス等の入力装置105と、モニタ等の出力装置106とを備える。
情報処理システム10の各機能要素は、プロセッサ101または主記憶部102の上に予め定められたプログラムを読み込ませてプロセッサ101にそのプログラムを実行させることで実現される。プロセッサ101はそのプログラムに従って、通信制御部104、入力装置105、または出力装置106を動作させ、主記憶部102または補助記憶部103におけるデータの読み出しおよび書き込みを行う。処理に必要なデータまたはデータベースは主記憶部102または補助記憶部103内に格納される。
図2は情報処理システム10の機能構成の一例を示す図である。情報処理システム10は機能要素として取得部11、第1学習部12、第2学習部13、比率適用部14、および予測部15を備える。
取得部11は複数の成分オブジェクトに関するデータと、複数の参照オブジェクトに関するデータとを取得する機能要素である。参照オブジェクトとは、成分オブジェクトに対応して設定される有体物または無体物のことをいい、より具体的には、成分オブジェクトと同じ種類またはカテゴリに属するオブジェクトのことをいう。したがって、複数の参照オブジェクトは任意の複数種類の材料でもよく、例えば、ポリマー、モノマー、または薬物であり得る。
取得部11は複数の成分オブジェクトのそれぞれについて数値表現および複合比を取得する。さらに、取得部11は複数の参照オブジェクトのそれぞれについて数値表現を取得する。成分オブジェクト(または参照オブジェクト)の数値表現とは、成分オブジェクト(または参照オブジェクト)の任意の属性を複数の数値を用いて表現したデータのことをいう。成分オブジェクト(または参照オブジェクト)の属性とは、成分オブジェクト(または参照オブジェクト)が備える性質または特徴のことをいう。本開示では、成分オブジェクトの数値表現を「成分数値表現」ともいい、参照オブジェクトの数値表現を「参照数値表現」ともいう。数値表現は様々な手法で可視化されてよく、例えば、数字、英字、テキスト、分子グラフ、ベクトル、画像、時系列データなどの手法によって可視化されてもよいし、これらの手法のうちの任意の2以上の組合せによって可視化されてもよい。数値表現を構成する個々の数値は、十進法で表されてもよいし、二進法、十六進法などの他の表記法によって表されてもよい。成分オブジェクトの複合比とは、複数の成分オブジェクトの間の割合のことをいう。複合比の具体的な種類、単位、および表現方法は限定されず、成分オブジェクトまたは複合オブジェクトに応じて任意に定められてよい。例えば複合比は百分率などの比率、またはヒストグラムによって表されてもよいし、個々の成分オブジェクトの絶対量で表されてもよい。
成分オブジェクトの個数と参照オブジェクトの個数とは同じでもよいし異なってもよい。成分オブジェクトの個数は参照オブジェクトの個数より多くてもよいし少なくてもよい。
第1学習部12は、第1機械学習モデルを用いた第1機械学習によって、複数の成分オブジェクトおよび複数の参照オブジェクトのそれぞれについて、該オブジェクトの特徴を示すベクトルを算出する機能要素である。成分オブジェクトの特徴を示すベクトルを成分特徴ベクトルといい、参照オブジェクトの特徴を示すベクトルを参照特徴ベクトルという。成分オブジェクト(または参照オブジェクト)の特徴とは、該成分オブジェクト(または該参照オブジェクト)を他のオブジェクトと異ならせる任意の要素のことをいう。ベクトルとは、n個の数値を有するn次元の量のことをいい、1次元の配列として表現することができる。
第2学習部13は、第2機械学習モデルを用いた第2機械学習によって、複数の成分オブジェクトのそれぞれについて、複数の参照オブジェクトのそれぞれとの関連度を示す確率ベクトルを算出する機能要素である。確率ベクトルとは、成分オブジェクトがそれぞれの参照オブジェクトとどのくらい関連するかを示すベクトルであり、言い換えると、成分オブジェクトがそれぞれの参照オブジェクトに帰属する度合いを示すベクトルである。関連度とは、成分オブジェクトと参照オブジェクトとの間の関連の強さを示す指標であり、言い換えると、成分オブジェクトが参照オブジェクトに帰属する度合いを示す指標である。
比率適用部14は、複数の成分オブジェクトに対応する複数の確率ベクトルと各成分オブジェクトの複合比とに基づいて、複合オブジェクトの特徴を示す複合特徴ベクトルを算出する機能要素である。複合オブジェクトの特徴とは、該複合オブジェクトを他のオブジェクトと異ならせる任意の要素のことをいう。具体的には、複合特徴ベクトルは、複数の参照オブジェクトのそれぞれとの関連度を示す。
予測部15は、複合オブジェクトの特性を予測し、その予測値を出力する機能要素である。複合オブジェクトの特性とは、複合オブジェクトが持つ特有の性質のことをいう。
一例では、第1および第2の機械学習モデルはいずれも、推定精度が最も高いと期待される学習済みモデルであり、したがって「最良の機械学習モデル」ということができる。しかし、この学習済みモデルは“現実に最良である”とは限らないことに留意されたい。学習済みモデルは、入力ベクトルとラベルとの多数の組合せを含む教師データを所与のコンピュータが処理することで生成される。所与のコンピュータは、入力ベクトルを機械学習モデルに入力することで出力ベクトルを算出し、算出された出力ベクトルから得られる予測値と、教師データで示されるラベルとの誤差(すなわち、推定結果と正解との差)を求める。そして、コンピュータはその誤差に基づいて機械学習モデル内の所与のパラメータを更新する。コンピュータはこのような学習を繰り返すことで学習済みモデルを生成する。学習済みモデルを生成するコンピュータは限定されず、例えば情報処理システム10でもよいし別のコンピュータシステムでもよい。学習済みモデルを生成する処理は学習フェーズということができ、その学習済みモデルを利用する処理は運用フェーズということができる。
[データ]
上述したように、それぞれの成分オブジェクトおよびそれぞれの参照オブジェクトが材料であり、複合オブジェクトが多成分物質であってもよい。この場合には、成分数値表現および参照数値表現は、材料の化学構造を示す数値を含んでもよいし、材料の化学構造の構成繰返し単位(CRU)を示す数値を含んでもよい。複合比は配合比または混合比でもよい。複合オブジェクト(多成分物質)の特性の予測値は、多成分物質のガラス転移温度(Tg)および弾性率のうちの少なくとも一つを示してもよい。
上述したように、それぞれの成分オブジェクトおよびそれぞれの参照オブジェクトが材料であり、複合オブジェクトが多成分物質であってもよい。この場合には、成分数値表現および参照数値表現は、材料の化学構造を示す数値を含んでもよいし、材料の化学構造の構成繰返し単位(CRU)を示す数値を含んでもよい。複合比は配合比または混合比でもよい。複合オブジェクト(多成分物質)の特性の予測値は、多成分物質のガラス転移温度(Tg)および弾性率のうちの少なくとも一つを示してもよい。
[システムの動作]
図3および図4を参照しながら、情報処理システム10の動作を説明するとともに本実施形態に係る情報処理方法について説明する。図3は情報処理システム10の動作の一例を処理フローS1として示すフローチャートである。図4は、情報処理システム10の動作をデータの具体例を用いて示す図である。
図3および図4を参照しながら、情報処理システム10の動作を説明するとともに本実施形態に係る情報処理方法について説明する。図3は情報処理システム10の動作の一例を処理フローS1として示すフローチャートである。図4は、情報処理システム10の動作をデータの具体例を用いて示す図である。
ステップS11では、取得部11が、複数の成分オブジェクトのそれぞれについて数値表現(成分数値表現)および複合比を取得する。図4では複数の成分オブジェクトの例として二つの成分オブジェクトEa,Ebを示す。成分オブジェクトEaの数値表現は{1,1,2,3,4,3,3,5,6,7,5,4}であり、成分オブジェクトEbの数値表現は{1,1,5,6,4,3,3,5,1,7,0,0}である。成分オブジェクトEa,Ebの複合比はそれぞれ0.7、0.3であり、したがって、これは、成分オブジェクトEa,Ebを7:3の割合で用いて複合オブジェクトを得ることを意味する。
ステップS12では、取得部11が、複数の参照オブジェクトのそれぞれについて数値表現(参照数値表現)を取得する。図4では複数の参照オブジェクトの例として二つの参照オブジェクトRa,Rbを示す。参照オブジェクトRaの数値表現は{1,2,5,1,4,1,3,1,1,1,0,0}であり、参照オブジェクトRbの数値表現は{1,2,0,0,4,1,3,1,0,1,0,0}である。
図4の例では成分オブジェクトの個数と参照オブジェクトの個数とが同じであるが、上述したように両者の個数は異なってもよい。また、図4の例では成分オブジェクトと参照オブジェクトとの間で数値表現の次元数が同じであるが、両者の次元数が異なってもよい。
取得部11は複数の成分オブジェクトおよび複数の参照オブジェクトのデータを任意の手法で取得してよい。例えば、取得部11は所与のデータベースにアクセスすることでデータを読み出してもよいし、他のコンピュータまたはコンピュータシステムからデータを受信してもよいし、情報処理システム10のユーザにより入力されたデータを受け付けてもよい。あるいは、取得部11はこれらのような手法のうちの任意の2以上によってデータを取得してもよい。
ステップS13では、第1学習部12が第1機械学習によって、各成分オブジェクトの成分特徴ベクトルと、各参照オブジェクトの参照特徴ベクトルとを算出する。
第1学習部12は、複数の成分オブジェクトに対応する複数の数値表現(成分数値表現)を第1機械学習モデルに入力することで、該複数の成分オブジェクトのそれぞれの成分特徴ベクトルを算出する。一例では、第1学習部12は、複数の成分オブジェクトのそれぞれについて、該成分オブジェクトに対応する数値表現を第1機械学習モデルに入力することで該成分オブジェクトの成分特徴ベクトルを算出する。
さらに、第1学習部12は、複数の参照オブジェクトに対応する複数の数値表現(参照数値表現)を第1機械学習モデルに入力することで、該複数の参照オブジェクトのそれぞれの参照特徴ベクトルを算出する。一例では、第1学習部12は、複数の参照オブジェクトのそれぞれについて、該参照オブジェクトに対応する数値表現を第1機械学習モデルに入力することで該参照オブジェクトの参照特徴ベクトルを算出する。
第1機械学習モデルは限定されず、成分オブジェクトおよび参照オブジェクトの種類などの要因を考慮して任意の方針で決められてよい。例えば、第1学習部12はグラフニューラルネットワーク(GNN)、畳み込みニューラルネットワーク(CNN)、または再帰型ニューラルネットワーク(RNN)を用いて第1機械学習を実行してもよい。
成分オブジェクトに対応する数値表現が入力される第1機械学習モデルと、参照オブジェクトに対応する数値表現が入力される第1機械学習モデルとは、同じでもよいし相異なってもよい。本開示では、「複数の成分オブジェクトに対応する複数の数値表現と、複数の参照オブジェクトに対応する複数の数値表現とを第1機械学習モデルに入力する」とは、成分オブジェクトのための第1機械学習モデルと、参照オブジェクトのための第1機械学習モデルとが同じ場合と相異なる場合との双方を含む概念であることに留意されたい。
図4の例では、第1学習部12は成分オブジェクトEaの数値表現{1,1,2,3,4,3,3,5,6,7,5,4}を第1機械学習モデルに入力することで成分特徴ベクトル{1,1,4,1,3,1}を算出する。また、第1学習部12は成分オブジェクトEbの数値表現{1,1,5,6,4,3,3,5,1,7,0,0}を第1機械学習モデルに入力することで成分特徴ベクトル{3,3,1,1,0,0}を算出する。第1学習部12は参照オブジェクトRaの数値表現{1,2,5,1,4,1,3,1,1,1,0,0}を第1機械学習モデルに入力することで参照特徴ベクトル{1,4,2,1,1,0}を算出する。また、第1学習部12は参照オブジェクトRbの数値表現{1,2,0,0,4,1,3,1,0,1,0,0}を第1機械学習モデルに入力することで参照特徴ベクトル{2,1,0,1,0,0}を算出する。図4の例では成分特徴ベクトルと参照特徴ベクトルとの間で次元数が同じであるが、両者の次元数が異なってもよい。
ステップS14では、第2学習部13が第2機械学習によって、複数の成分特徴ベクトルおよび複数の参照特徴ベクトルから、複数の成分オブジェクトのそれぞれの確率ベクトルを算出する。一例では、第2学習部13は、複数の成分オブジェクトのそれぞれについて、該成分オブジェクトに対応する成分特徴ベクトルと、複数の参照特徴ベクトルの集合との組合せを第2機械学習モデルに入力することで、該成分オブジェクトの確率ベクトルを算出する。個々の成分オブジェクトの確率ベクトルは、複数の参照オブジェクトに対応する複数の数値(ベクトル成分)で構成される。確率ベクトルの次元数は参照オブジェクトの個数と一致する。第2機械学習モデルは限定されず、成分オブジェクトおよび参照オブジェクトの種類などの要因を考慮して任意の方針で決められてよい。例えば、第2機械学習モデルは、集合の要素の組合せの影響を考慮できる学習モデルでもよいし、その影響を考慮できない学習モデルでもよい。前者の例として、アテンションRNN(Attention RNN)またはマルチヘッド・アテンション(Multi-Head Attention)が挙げられる。
図4の例では、第2学習部13は成分オブジェクトEaの成分特徴ベクトル{1,1,4,1,3,1}と、参照オブジェクトRaの参照特徴ベクトル{1,4,2,1,1,0}と、参照オブジェクトRbの参照特徴ベクトル{2,1,0,1,0,0}とを第2機械学習モデルに入力することで、成分オブジェクトEaの確率ベクトル{0.4,0.6}を算出する。この確率ベクトルは、成分オブジェクトEaと参照オブジェクトRaとの関連度が0.4であり、成分オブジェクトEaと参照オブジェクトRbとの関連度が0.6であることを示す。
さらに、第2学習部13は成分オブジェクトEbの成分特徴ベクトル{3,3,1,1,0,0}と、参照オブジェクトRaの参照特徴ベクトルと、参照オブジェクトRbの参照特徴ベクトルとを第2機械学習モデルに入力することで、成分オブジェクトEbの確率ベクトル{0.2,0.8}を算出する。この確率ベクトルは、成分オブジェクトEaと参照オブジェクトRaとの関連度が0.2であり、成分オブジェクトEaと参照オブジェクトRbとの関連度が0.8であることを示す。
ステップS15では、比率適用部14が複数の確率ベクトルおよび複数の複合比から複合特徴ベクトルを生成する。複合特徴ベクトルは、複数の参照オブジェクトに対応する複数の数値(ベクトル成分)で構成される。複合特徴ベクトルの構成および算出方法はいずれも限定されない。一例では、複合特徴ベクトルの次元数は参照オブジェクトの個数と一致する。すなわち、複合特徴ベクトルは確率ベクトルと同じ構造を有する。
成分オブジェクトの個数をmとし、参照オブジェクトの個数をnとする。また、個々の成分オブジェクトの確率ベクトルをVp1,Vp2,…,Vpmで表すとする。個々の確率ベクトルはn次元である。また、個々の成分オブジェクトの複合比をr1,r2,…,rmとする。これらの前提において、一例では、比率適用部14はn次元の複合特徴ベクトルVcを下記の式(1)によって算出する。
Vc=r1×Vp1+r2×Vp2+…+rm×Vpm …(1)
Vc=r1×Vp1+r2×Vp2+…+rm×Vpm …(1)
図4の例では、比率適用部14は以下の計算により複合特徴ベクトルVcを{0.34,0.66}と算出する。
Vc=0.7×{0.4,0.6}+0.3×{0.2,0.8}={0.28,0.42}+{0.06,0.24}={0.34,0.66}
Vc=0.7×{0.4,0.6}+0.3×{0.2,0.8}={0.28,0.42}+{0.06,0.24}={0.34,0.66}
ステップS16では、比率適用部14が複合特徴ベクトルを出力する。本実施形態では、比率適用部14は情報処理システム10での後続処理のために複合特徴ベクトルを予測部15に出力する。しかし、複合特徴ベクトルの出力方法はこれに限定されず、任意の方針で設計されてよい。例えば、比率適用部14は複合特徴ベクトルを、所与のデータベースに格納してもよいし、他のコンピュータまたはコンピュータシステムに向けて送信してもよいし、表示装置上に表示してもよい。
ステップS17では、予測部15が複合特徴ベクトルから複合オブジェクトの特性の予測値を算出する。予測方法は限定されず、任意の方針で設計されてよい。例えば、予測部15は第3機械学習によって複合特徴ベクトルから予測値を算出してもよい。具体的には、予測部15は、複合特徴ベクトルを第3機械学習モデルに入力することで予測値を算出する。第3機械学習モデルは限定されず、複合オブジェクトの種類などの要因を考慮して任意の方針で決められてよい。例えば、予測部15は回帰問題または分類問題を解く任意のニューラルネットワークを用いて第3機械学習を実行してもよい。典型的には、回帰問題の予測値は数値で表され、分類問題の予測値はカテゴリを示す。予測部15は機械学習以外の手法を用いて予測値を算出してもよい。
ステップS18では、予測部15がその予測値を出力する。予測値の出力方法は限定されない。例えば、予測部15は予測値を、所与のデータベースに格納してもよいし、他のコンピュータまたはコンピュータシステムに向けて送信してもよいし、表示装置上に表示してもよい。あるいは、予測部15は情報処理システム10での後続処理のために予測値を他の機能要素に出力してもよい。
[プログラム]
コンピュータまたはコンピュータシステムを情報処理システム10として機能させるための情報処理プログラムは、該コンピュータシステムを取得部11、第1学習部12、第2学習部13、比率適用部14、および予測部15として機能させるためのプログラムコードを含む。この情報処理プログラムは、CD-ROM、DVD-ROM、半導体メモリ等の有形の記録媒体に固定的に記録された上で提供されてもよい。あるいは、情報処理プログラムは、搬送波に重畳されたデータ信号として通信ネットワークを介して提供されてもよい。提供された情報処理プログラムは例えば補助記憶部103に記憶される。プロセッサ101が補助記憶部103からその情報処理プログラムを読み出して実行することで、上記の各機能要素が実現する。
コンピュータまたはコンピュータシステムを情報処理システム10として機能させるための情報処理プログラムは、該コンピュータシステムを取得部11、第1学習部12、第2学習部13、比率適用部14、および予測部15として機能させるためのプログラムコードを含む。この情報処理プログラムは、CD-ROM、DVD-ROM、半導体メモリ等の有形の記録媒体に固定的に記録された上で提供されてもよい。あるいは、情報処理プログラムは、搬送波に重畳されたデータ信号として通信ネットワークを介して提供されてもよい。提供された情報処理プログラムは例えば補助記憶部103に記憶される。プロセッサ101が補助記憶部103からその情報処理プログラムを読み出して実行することで、上記の各機能要素が実現する。
[効果]
以上説明したように、本開示の一側面に係る情報処理システムは少なくとも一つのプロセッサを備える。少なくとも一つのプロセッサは、複数の成分オブジェクトのそれぞれについて数値表現および複合比を取得し、複数の参照オブジェクトのそれぞれについて数値表現を取得し、複数の成分オブジェクトに対応する複数の数値表現と、複数の参照オブジェクトに対応する複数の数値表現とを第1機械学習モデルに入力することで、該複数の成分オブジェクトのそれぞれの成分特徴ベクトルと、該複数の参照オブジェクトのそれぞれの参照特徴ベクトルとを算出し、複数の成分特徴ベクトルおよび複数の参照特徴ベクトルを第2機械学習モデルに入力することで、該複数の成分オブジェクトのそれぞれについて、該複数の参照オブジェクトのそれぞれとの関連度を示す確率ベクトルを算出し、複数の確率ベクトルおよび複数の複合比に基づいて、複数の成分オブジェクトを複合させることで得られる複合オブジェクトについて、複数の参照オブジェクトのそれぞれとの関連度を示す複合特徴ベクトルを算出し、複合特徴ベクトルを出力する。
以上説明したように、本開示の一側面に係る情報処理システムは少なくとも一つのプロセッサを備える。少なくとも一つのプロセッサは、複数の成分オブジェクトのそれぞれについて数値表現および複合比を取得し、複数の参照オブジェクトのそれぞれについて数値表現を取得し、複数の成分オブジェクトに対応する複数の数値表現と、複数の参照オブジェクトに対応する複数の数値表現とを第1機械学習モデルに入力することで、該複数の成分オブジェクトのそれぞれの成分特徴ベクトルと、該複数の参照オブジェクトのそれぞれの参照特徴ベクトルとを算出し、複数の成分特徴ベクトルおよび複数の参照特徴ベクトルを第2機械学習モデルに入力することで、該複数の成分オブジェクトのそれぞれについて、該複数の参照オブジェクトのそれぞれとの関連度を示す確率ベクトルを算出し、複数の確率ベクトルおよび複数の複合比に基づいて、複数の成分オブジェクトを複合させることで得られる複合オブジェクトについて、複数の参照オブジェクトのそれぞれとの関連度を示す複合特徴ベクトルを算出し、複合特徴ベクトルを出力する。
本発明の一側面に係る情報処理方法は、少なくとも一つのプロセッサを備える情報処理システムにより実行される。情報処理方法は、複数の成分オブジェクトのそれぞれについて数値表現および複合比を取得するステップと、複数の参照オブジェクトのそれぞれについて数値表現を取得するステップと、複数の成分オブジェクトに対応する複数の数値表現と、複数の参照オブジェクトに対応する複数の数値表現とを第1機械学習モデルに入力することで、該複数の成分オブジェクトのそれぞれの成分特徴ベクトルと、該複数の参照オブジェクトのそれぞれの参照特徴ベクトルとを算出するステップと、複数の成分特徴ベクトルおよび複数の参照特徴ベクトルを第2機械学習モデルに入力することで、該複数の成分オブジェクトのそれぞれについて、該複数の参照オブジェクトのそれぞれとの関連度を示す確率ベクトルを算出するステップと、複数の確率ベクトルおよび複数の複合比に基づいて、複数の成分オブジェクトを複合させることで得られる複合オブジェクトについて、複数の参照オブジェクトのそれぞれとの関連度を示す複合特徴ベクトルを算出するステップと、複合特徴ベクトルを出力するステップとを含む。
本発明の一側面に係る情報処理プログラムは、複数の成分オブジェクトのそれぞれについて数値表現および複合比を取得するステップと、複数の参照オブジェクトのそれぞれについて数値表現を取得するステップと、複数の成分オブジェクトに対応する複数の数値表現と、複数の参照オブジェクトに対応する複数の数値表現とを第1機械学習モデルに入力することで、該複数の成分オブジェクトのそれぞれの成分特徴ベクトルと、該複数の参照オブジェクトのそれぞれの参照特徴ベクトルとを算出するステップと、複数の成分特徴ベクトルおよび複数の参照特徴ベクトルを第2機械学習モデルに入力することで、該複数の成分オブジェクトのそれぞれについて、該複数の参照オブジェクトのそれぞれとの関連度を示す確率ベクトルを算出するステップと、複数の確率ベクトルおよび複数の複合比に基づいて、複数の成分オブジェクトを複合させることで得られる複合オブジェクトについて、複数の参照オブジェクトのそれぞれとの関連度を示す複合特徴ベクトルを算出するステップと、複合特徴ベクトルを出力するステップとをコンピュータに実行させる。
このような側面においては、複合比を考慮する前に、複合オブジェクトを構成する各成分オブジェクトの特徴が個々の参照オブジェクトとの関連度を用いて顕在化される。したがって、成分オブジェクトについて十分な量のデータを用意できない場合にも複合オブジェクトの解析の精度を上げることが可能になる。
他の側面に係る情報処理システムでは、複数の成分オブジェクトの個数をmとし、複数の参照オブジェクトの個数をnとし、複数の確率ベクトルのそれぞれがn次元であり、複数の確率ベクトルをVp1,Vp2,…,Vpmとし、複数の複合比をr1,r2,…,rmとし、複合特徴ベクトルをVcとして、少なくとも一つのプロセッサが複合特徴ベクトルを下記式(1)によって算出してもよい。
Vc=r1×Vp1+r2×Vp2+…+rm×Vpm …(1)
この場合には、精度が高いと推定される複合特徴ベクトルを簡単な演算によって得ることができる。
Vc=r1×Vp1+r2×Vp2+…+rm×Vpm …(1)
この場合には、精度が高いと推定される複合特徴ベクトルを簡単な演算によって得ることができる。
他の側面に係る情報処理システムでは、少なくとも一つのプロセッサが、複合特徴ベクトルを第3機械学習モデルに入力することで、複合オブジェクトの特性の予測値を算出し、予測値を出力してもよい。この処理によって、複合オブジェクトの特性を精度良く算出することが可能になる。
他の側面に係る情報処理システムでは、成分オブジェクトが材料であり、複合オブジェクトが多成分物質であってもよい。この場合には、複合比を考慮する前に、多成分物質を構成する各材料の特徴が顕在化される。したがって、材料について十分な量のデータを用意できない場合にも多成分物質の解析の精度を上げることが可能になる。
他の側面に係る情報処理システムでは、材料がポリマーであり、多成分物質がポリマーアロイであってもよい。この場合には、複合比を考慮する前に、ポリマーアロイを構成する各ポリマーの特徴が顕在化される。したがって、ポリマーについて十分な量のデータを用意できない場合にもポリマーアロイの解析の精度を上げることが可能になる。ポリマーアロイは非常に多様であり、これに対応して、ポリマーの種類も膨大である。このようなポリマーおよびポリマーアロイについては、一般に、取り得る組合せの一部についてしか実験を行うことができず、したがって十分な量のデータを得られないことが多い。本側面によれば、このようにデータが不十分である場合でも精度よくポリマーアロイを解析することが可能になる。
[変形例]
以上、本発明をその実施形態に基づいて詳細に説明した。しかし、本発明は上記実施形態に限定されるものではない。本発明は、その要旨を逸脱しない範囲で様々な変形が可能である。
以上、本発明をその実施形態に基づいて詳細に説明した。しかし、本発明は上記実施形態に限定されるものではない。本発明は、その要旨を逸脱しない範囲で様々な変形が可能である。
上記実施形態では情報処理システム10が予測部15を備えるが、この機能要素は省略可能である。すなわち、複合オブジェクトの特性を予測する処理は情報処理システムとは異なるコンピュータシステムによって実行されてもよい。
予測部は、複合特徴ベクトルに加えて参照特徴ベクトルなどの他の情報を用いて予測を実行してもよい。あるいは、予測部は複合特徴ベクトルに基づくデータを用いて予測を実行してもよく、例えば、複合特徴ベクトルによる参照特徴ベクトルの重み付き平均を用いて予測を実行してもよい。
少なくとも一つのプロセッサにより実行される情報処理方法の処理手順は上記実施形態での例に限定されない。例えば、上述したステップ(処理)の一部が省略されてもよいし、別の順序で各ステップが実行されてもよい。また、上述したステップのうちの任意の2以上のステップが組み合わされてもよいし、ステップの一部が修正または削除されてもよい。あるいは、上記の各ステップに加えて他のステップが実行されてもよい。例えばステップS17,S18の処理が省略されてもよい。
情報処理システム内で二つの数値の大小関係を比較する際には、「以上」および「よりも大きい」という二つの基準のどちらを用いてもよく、「以下」および「未満」の二つの基準のうちのどちらを用いてもよい。このような基準の選択は、二つの数値の大小関係を比較する処理についての技術的意義を変更するものではない。
本開示において、「少なくとも一つのプロセッサが、第1の処理を実行し、第2の処理を実行し、…第nの処理を実行する。」との表現、またはこれに対応する表現は、第1の処理から第nの処理までのn個の処理の実行主体(すなわちプロセッサ)が途中で変わる場合を含む概念を示す。すなわち、この表現は、n個の処理のすべてが同じプロセッサで実行される場合と、n個の処理においてプロセッサが任意の方針で変わる場合との双方を含む概念を示す。
10…情報処理システム、11…取得部、12…第1学習部、13…第2学習部、14…比率適用部、15…予測部。
Claims (7)
- 少なくとも一つのプロセッサを備え、
前記少なくとも一つのプロセッサが、
複数の成分オブジェクトのそれぞれについて数値表現および複合比を取得し、
複数の参照オブジェクトのそれぞれについて数値表現を取得し、
前記複数の成分オブジェクトに対応する複数の前記数値表現と、前記複数の参照オブジェクトに対応する複数の前記数値表現とを第1機械学習モデルに入力することで、該複数の成分オブジェクトのそれぞれの成分特徴ベクトルと、該複数の参照オブジェクトのそれぞれの参照特徴ベクトルとを算出し、
複数の前記成分特徴ベクトルおよび複数の前記参照特徴ベクトルを第2機械学習モデルに入力することで、該複数の成分オブジェクトのそれぞれについて、該複数の参照オブジェクトのそれぞれとの関連度を示す確率ベクトルを算出し、
複数の前記確率ベクトルおよび複数の前記複合比に基づいて、前記複数の成分オブジェクトを複合させることで得られる複合オブジェクトについて、前記複数の参照オブジェクトのそれぞれとの関連度を示す複合特徴ベクトルを算出し、
前記複合特徴ベクトルを出力する、
情報処理システム。 - 前記複数の成分オブジェクトの個数をmとし、前記複数の参照オブジェクトの個数をnとし、前記複数の確率ベクトルのそれぞれがn次元であり、前記複数の確率ベクトルをVp1,Vp2,…,Vpmとし、前記複数の複合比をr1,r2,…,rmとし、前記複合特徴ベクトルをVcとして、前記少なくとも一つのプロセッサが前記複合特徴ベクトルを下記式(1)
Vc=r1×Vp1+r2×Vp2+…+rm×Vpm …(1)
によって算出する、
請求項1に記載の情報処理システム。 - 前記少なくとも一つのプロセッサが、
前記複合特徴ベクトルを第3機械学習モデルに入力することで、前記複合オブジェクトの特性の予測値を算出し、
前記予測値を出力する、
請求項1または2に記載の情報処理システム。 - 前記成分オブジェクトが材料であり、前記複合オブジェクトが多成分物質である、
請求項1~3のいずれか一項に記載の情報処理システム。 - 前記材料がポリマーであり、前記多成分物質がポリマーアロイである、
請求項4に記載の情報処理システム。 - 少なくとも一つのプロセッサを備える情報処理システムにより実行される情報処理方法であって、
複数の成分オブジェクトのそれぞれについて数値表現および複合比を取得するステップと、
複数の参照オブジェクトのそれぞれについて数値表現を取得するステップと、
前記複数の成分オブジェクトに対応する複数の前記数値表現と、前記複数の参照オブジェクトに対応する複数の前記数値表現とを第1機械学習モデルに入力することで、該複数の成分オブジェクトのそれぞれの成分特徴ベクトルと、該複数の参照オブジェクトのそれぞれの参照特徴ベクトルとを算出するステップと、
複数の前記成分特徴ベクトルおよび複数の前記参照特徴ベクトルを第2機械学習モデルに入力することで、該複数の成分オブジェクトのそれぞれについて、該複数の参照オブジェクトのそれぞれとの関連度を示す確率ベクトルを算出するステップと、
複数の前記確率ベクトルおよび複数の前記複合比に基づいて、前記複数の成分オブジェクトを複合させることで得られる複合オブジェクトについて、前記複数の参照オブジェクトのそれぞれとの関連度を示す複合特徴ベクトルを算出するステップと、
前記複合特徴ベクトルを出力するステップと
を含む情報処理方法。 - 複数の成分オブジェクトのそれぞれについて数値表現および複合比を取得するステップと、
複数の参照オブジェクトのそれぞれについて数値表現を取得するステップと、
前記複数の成分オブジェクトに対応する複数の前記数値表現と、前記複数の参照オブジェクトに対応する複数の前記数値表現とを第1機械学習モデルに入力することで、該複数の成分オブジェクトのそれぞれの成分特徴ベクトルと、該複数の参照オブジェクトのそれぞれの参照特徴ベクトルとを算出するステップと、
複数の前記成分特徴ベクトルおよび複数の前記参照特徴ベクトルを第2機械学習モデルに入力することで、該複数の成分オブジェクトのそれぞれについて、該複数の参照オブジェクトのそれぞれとの関連度を示す確率ベクトルを算出するステップと、
複数の前記確率ベクトルおよび複数の前記複合比に基づいて、前記複数の成分オブジェクトを複合させることで得られる複合オブジェクトについて、前記複数の参照オブジェクトのそれぞれとの関連度を示す複合特徴ベクトルを算出するステップと、
前記複合特徴ベクトルを出力するステップと
をコンピュータに実行させる情報処理プログラム。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2019204089 | 2019-11-11 | ||
JP2019204089 | 2019-11-11 | ||
PCT/JP2020/041905 WO2021095725A1 (ja) | 2019-11-11 | 2020-11-10 | 情報処理システム、情報処理方法、および情報処理プログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JPWO2021095725A1 JPWO2021095725A1 (ja) | 2021-05-20 |
JP7509153B2 true JP7509153B2 (ja) | 2024-07-02 |
Family
ID=
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2003058582A (ja) | 2001-08-21 | 2003-02-28 | Bridgestone Corp | 設計・配合のシミュレーションシステム |
JP2004086892A (ja) | 2002-08-02 | 2004-03-18 | Japan Science & Technology Agency | 成分配合設計方法、成分配合設計プログラム及びそのプログラムを記録した記録媒体 |
WO2019198644A1 (ja) | 2018-04-11 | 2019-10-17 | 富士フイルム株式会社 | 推定装置、推定方法、及び推定プログラム |
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2003058582A (ja) | 2001-08-21 | 2003-02-28 | Bridgestone Corp | 設計・配合のシミュレーションシステム |
JP2004086892A (ja) | 2002-08-02 | 2004-03-18 | Japan Science & Technology Agency | 成分配合設計方法、成分配合設計プログラム及びそのプログラムを記録した記録媒体 |
WO2019198644A1 (ja) | 2018-04-11 | 2019-10-17 | 富士フイルム株式会社 | 推定装置、推定方法、及び推定プログラム |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Greener et al. | A guide to machine learning for biologists | |
WO2021095722A1 (ja) | 情報処理システム、情報処理方法、および情報処理プログラム | |
Wang et al. | Ensemble learning of coarse-grained molecular dynamics force fields with a kernel approach | |
US7668826B2 (en) | Predicting apparatus, predicting method, and computer product | |
Hernadez et al. | Synthetic tabular data evaluation in the health domain covering resemblance, utility, and privacy dimensions | |
US11501240B2 (en) | Systems and methods for process design including inheritance | |
CN112086144A (zh) | 分子生成方法、装置、电子设备及存储介质 | |
A Shepherd et al. | How well does your phylogenetic model fit your data? | |
CN115423037A (zh) | 一种基于大数据的用户分类方法及系统 | |
Buch et al. | A systematic review and evaluation of statistical methods for group variable selection | |
Chakraborty et al. | BAMBI: An R package for fitting bivariate angular mixture models | |
Perales-González et al. | Global negative correlation learning: A unified framework for global optimization of ensemble models | |
US20230273771A1 (en) | Secret decision tree test apparatus, secret decision tree test system, secret decision tree test method, and program | |
JP7509153B2 (ja) | 情報処理システム、情報処理方法、および情報処理プログラム | |
JP7509152B2 (ja) | 情報処理システム、情報処理方法、および情報処理プログラム | |
WO2021095725A1 (ja) | 情報処理システム、情報処理方法、および情報処理プログラム | |
CN111445969A (zh) | 一种弹性适应噪音的销售预测的方法及系统 | |
Gonzalez Ginestet et al. | Stacked inverse probability of censoring weighted bagging: A case study in the InfCareHIV Register | |
KR20240000515A (ko) | 특성 예측 시스템, 특성 예측 방법, 및 특성 예측 프로그램 | |
WO2022113945A1 (ja) | 情報処理システム、情報処理方法、および情報処理プログラム | |
US20230060812A1 (en) | Information processing system, information processing method, and storage medium | |
Feng et al. | Bayesian logistic regression for online recalibration and revision of risk prediction models with performance guarantees | |
JP7302229B2 (ja) | データ管理システム、データ管理方法、およびデータ管理プログラム | |
Wang et al. | Convformer: Revisiting transformer for sequential user modeling | |
Nazari et al. | Autogan: An automated human-out-of-the-loop approach for training generative adversarial networks |