JP7509152B2 - 情報処理システム、情報処理方法、および情報処理プログラム - Google Patents
情報処理システム、情報処理方法、および情報処理プログラムInfo
- Publication number
- JP7509152B2 JP7509152B2 JP2021556102A JP2021556102A JP7509152B2 JP 7509152 B2 JP7509152 B2 JP 7509152B2 JP 2021556102 A JP2021556102 A JP 2021556102A JP 2021556102 A JP2021556102 A JP 2021556102A JP 7509152 B2 JP7509152 B2 JP 7509152B2
- Authority
- JP
- Japan
- Prior art keywords
- composite
- feature vector
- component
- information processing
- component objects
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 230000010365 information processing Effects 0.000 title claims description 57
- 238000003672 processing method Methods 0.000 title claims description 7
- 239000002131 composite material Substances 0.000 claims description 103
- 239000013598 vector Substances 0.000 claims description 97
- 238000010801 machine learning Methods 0.000 claims description 49
- 239000000126 substance Substances 0.000 claims description 19
- 239000000463 material Substances 0.000 claims description 17
- 229920000642 polymer Polymers 0.000 claims description 16
- 239000000956 alloy Substances 0.000 claims description 8
- 229910045601 alloy Inorganic materials 0.000 claims description 8
- 238000000034 method Methods 0.000 description 35
- 230000008569 process Effects 0.000 description 16
- 150000001875 compounds Chemical class 0.000 description 15
- 230000014509 gene expression Effects 0.000 description 14
- 238000004458 analytical method Methods 0.000 description 10
- 238000012545 processing Methods 0.000 description 8
- 238000013528 artificial neural network Methods 0.000 description 7
- 238000010586 diagram Methods 0.000 description 6
- 238000004891 communication Methods 0.000 description 5
- 238000013329 compounding Methods 0.000 description 5
- 229920001222 biopolymer Polymers 0.000 description 4
- 238000013527 convolutional neural network Methods 0.000 description 4
- 238000002156 mixing Methods 0.000 description 3
- 239000003814 drug Substances 0.000 description 2
- 230000006870 function Effects 0.000 description 2
- 230000007246 mechanism Effects 0.000 description 2
- 239000000203 mixture Substances 0.000 description 2
- 230000000306 recurrent effect Effects 0.000 description 2
- 238000012549 training Methods 0.000 description 2
- 230000015572 biosynthetic process Effects 0.000 description 1
- 210000000133 brain stem Anatomy 0.000 description 1
- 238000004422 calculation algorithm Methods 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000005094 computer simulation Methods 0.000 description 1
- 239000000470 constituent Substances 0.000 description 1
- 229940079593 drug Drugs 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000002474 experimental method Methods 0.000 description 1
- 230000009477 glass transition Effects 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 239000000178 monomer Substances 0.000 description 1
- 210000000653 nervous system Anatomy 0.000 description 1
- 230000000144 pharmacologic effect Effects 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 238000003786 synthesis reaction Methods 0.000 description 1
Description
本開示の一側面は情報処理システム、情報処理方法、および情報処理プログラムに関する。
複数の成分オブジェクトを複合させることで得られる複合オブジェクトを、機械学習を用いて解析する手法が用いられている。例えば、特許文献1には、生体高分子の立体構造と化合物の立体構造との結合性を予測する方法が記載されている。この方法は、生体高分子の立体構造と化合物の立体構造とに基づいて生体高分子と化合物との複合体の予測立体構造を生成するステップと、その予測立体構造を、相互作用パターンとの照合結果を表す予測立体構造ベクトルへ変換するステップと、機械学習アルゴリズムを用いてその予測立体構造ベクトルを判別することによって生体高分子の立体構造と化合物の立体構造との結合性を予測するステップとを含む。
成分オブジェクトが多様であったり多数存在したりする場合には、これらの成分オブジェクトについて十分な量のデータを用意することができず、その結果、複合オブジェクトの解析の精度が、期待する水準に達しない可能性がある。そこで、成分オブジェクトについて十分な量のデータを用意できない場合にも複合オブジェクトの解析の精度を上げるための仕組みが望まれている。
本開示の一側面に係る情報処理システムは少なくとも一つのプロセッサを備える。少なくとも一つのプロセッサは、複数の成分オブジェクトのそれぞれについて数値表現および複合比を取得し、複数の成分オブジェクトに対応する複数の数値表現を第1機械学習モデルに入力することで、該複数の成分オブジェクトのそれぞれの第1特徴ベクトルを算出し、複数の成分オブジェクトのそれぞれについて第1特徴ベクトルに複合比を適用することで、該複数の成分オブジェクトのそれぞれの第2特徴ベクトルを算出し、複数の成分オブジェクトに対応する複数の第2特徴ベクトルを第2機械学習モデルに入力することで、複数の成分オブジェクトを複合させることで得られる複合オブジェクトの特徴を示す複合特徴ベクトルを算出し、複合特徴ベクトルを出力する。
このような側面においては、複合比を考慮する前に、複合オブジェクトを構成する各成分オブジェクトの特徴が顕在化される。したがって、成分オブジェクトについて十分な量のデータを用意できない場合にも複合オブジェクトの解析の精度を上げることが可能になる。
本開示の一側面によれば、成分オブジェクトについて十分な量のデータを用意できない場合にも複合オブジェクトの解析の精度を上げることができる。
以下、添付図面を参照しながら本開示での実施形態を詳細に説明する。なお、図面の説明において同一または同等の要素には同一の符号を付し、重複する説明を省略する。
[システムの概要]
実施形態に係る情報処理システム10は、複数の成分オブジェクトを所与の複合比で複合させることで得られる複合オブジェクトに関する解析を実行するコンピュータシステムである。成分オブジェクトとは、複合オブジェクトを生成するために用いられる有体物または無体物のことをいう。複合オブジェクトは有体物または無体物であり得る。有体物の例として任意の物質または物体が挙げられる。無体物の例としてデータおよび情報が挙げられる。「複数の成分オブジェクトを複合させる」とは、複数の成分オブジェクトを一つのオブジェクト、すなわち複合オブジェクトにする処理のことをいう。複合させる手法は限定させず、例えば、配合、調合、合成、結合、混合、合併、組合せ、化合、または合体でもよいし、他の手法でもよい。複合オブジェクトに関する解析とは、複合オブジェクトの何らかの特徴を示すデータを得るための処理のことをいう。
実施形態に係る情報処理システム10は、複数の成分オブジェクトを所与の複合比で複合させることで得られる複合オブジェクトに関する解析を実行するコンピュータシステムである。成分オブジェクトとは、複合オブジェクトを生成するために用いられる有体物または無体物のことをいう。複合オブジェクトは有体物または無体物であり得る。有体物の例として任意の物質または物体が挙げられる。無体物の例としてデータおよび情報が挙げられる。「複数の成分オブジェクトを複合させる」とは、複数の成分オブジェクトを一つのオブジェクト、すなわち複合オブジェクトにする処理のことをいう。複合させる手法は限定させず、例えば、配合、調合、合成、結合、混合、合併、組合せ、化合、または合体でもよいし、他の手法でもよい。複合オブジェクトに関する解析とは、複合オブジェクトの何らかの特徴を示すデータを得るための処理のことをいう。
複数の成分オブジェクトは任意の複数種類の材料でもよく、この場合には、複合オブジェクトはそれらの材料によって生成される多成分物質である。材料とは多成分物質を生成するために用いられる任意の構成要素である。例えば、複数の材料は任意の複数種類の分子または原子でもよく、この場合には、複合オブジェクトは、それらの分子または原子を任意の手法で複合することにより得られる多成分物質である。例えば、材料はポリマーでもよく、これに対応して、多成分物質はポリマーアロイでもよい。材料はモノマーでもよく、これに対応して、多成分物質はポリマーでもよい。材料は薬物、すなわち、薬理作用を有する化学物質でもよく、これに対応して、多成分物質は薬剤でもよい。
情報処理システム10は複合オブジェクトに関する解析のために機械学習を実行する。機械学習とは、与えられた情報に基づいて学習することで法則またはルールを自律的に見つけ出す手法である。機械学習の具体的な手法は限定されない。例えば、情報処理システム10は、ニューラルネットワークを含んで構成される計算モデルである機械学習モデルを用いた機械学習を実行してもよい。ニューラルネットワークとは、人間の脳神経系の仕組みを模した情報処理のモデルのことをいう。より具体的な例として、情報処理システム10は、グラフニューラルネットワーク(GNN)、畳み込みニューラルネットワーク(CNN)、再帰型ニューラルネットワーク(RNN)、アテンションRNN(Attention RNN)、およびマルチヘッド・アテンション(Multi-Head Attention)のうちの少なくとも一つを用いて機械学習を実行してもよい。
[システムの構成]
情報処理システム10は1台以上のコンピュータで構成される。複数台のコンピュータを用いる場合には、これらのコンピュータがインターネット、イントラネット等の通信ネットワークを介して接続されることで、論理的に一つの情報処理システム10が構築される。
情報処理システム10は1台以上のコンピュータで構成される。複数台のコンピュータを用いる場合には、これらのコンピュータがインターネット、イントラネット等の通信ネットワークを介して接続されることで、論理的に一つの情報処理システム10が構築される。
図1は、情報処理システム10を構成するコンピュータ100の一般的なハードウェア構成の一例を示す図である。例えば、コンピュータ100は、オペレーティングシステム、アプリケーション・プログラム等を実行するプロセッサ(例えばCPU)101と、ROMおよびRAMで構成される主記憶部102と、ハードディスク、フラッシュメモリ等で構成される補助記憶部103と、ネットワークカードまたは無線通信モジュールで構成される通信制御部104と、キーボード、マウス等の入力装置105と、モニタ等の出力装置106とを備える。
情報処理システム10の各機能要素は、プロセッサ101または主記憶部102の上に予め定められたプログラムを読み込ませてプロセッサ101にそのプログラムを実行させることで実現される。プロセッサ101はそのプログラムに従って、通信制御部104、入力装置105、または出力装置106を動作させ、主記憶部102または補助記憶部103におけるデータの読み出しおよび書き込みを行う。処理に必要なデータまたはデータベースは主記憶部102または補助記憶部103内に格納される。
図2は情報処理システム10の機能構成の一例を示す図である。情報処理システム10は機能要素として取得部11、第1学習部12、比率適用部13、第2学習部14、および予測部15を備える。
取得部11は複数の成分オブジェクトに関するデータを取得する機能要素である。具体的には、取得部11は複数の成分オブジェクトのそれぞれについて数値表現および複合比を取得する。成分オブジェクトの数値表現とは、成分オブジェクトの任意の属性を複数の数値を用いて表現したデータのことをいう。成分オブジェクトの属性とは、成分オブジェクトが備える性質または特徴のことをいう。数値表現は様々な手法で可視化されてよく、例えば、数字、英字、テキスト、分子グラフ、ベクトル、画像、時系列データなどの手法によって可視化されてもよいし、これらの手法のうちの任意の2以上の組合せによって可視化されてもよい。数値表現を構成する個々の数値は、十進法で表されてもよいし、二進法、十六進法などの他の表記法によって表されてもよい。成分オブジェクトの複合比とは、複数の成分オブジェクトの間の割合のことをいう。複合比の具体的な種類、単位、および表現方法は限定されず、成分オブジェクトまたは複合オブジェクトに応じて任意に定められてよい。例えば複合比は百分率などの比率、またはヒストグラムによって表されてもよいし、個々の成分オブジェクトの絶対量で表されてもよい。
第1学習部12は、第1機械学習モデルを用いた第1機械学習によって、複数の成分オブジェクトのそれぞれについて、該成分オブジェクトの特徴を示すベクトルである第1特徴ベクトルを算出する機能要素である。成分オブジェクトの特徴とは、該成分オブジェクトを他のオブジェクトと異ならせる任意の要素のことをいう。ベクトルとは、n個の数値を有するn次元の量のことをいい、1次元の配列として表現することができる。
比率適用部13は、複数の成分オブジェクトのそれぞれについて第1ベクトルに複合比を適用することで、複数の成分オブジェクトのそれぞれの第2特徴ベクトルを算出する機能要素である。
第2学習部14は、第2機械学習モデルを用いた第2機械学習によって、複合オブジェクトの特徴を示すベクトルである複合特徴ベクトルを算出する機能要素である。複合オブジェクトの特徴とは、該複合オブジェクトを他のオブジェクトと異ならせる任意の要素のことをいう。
予測部15は、複合オブジェクトの特性を予測し、その予測値を出力する機能要素である。複合オブジェクトの特性とは、複合オブジェクトが持つ特有の性質のことをいう。
一例では、第1および第2の機械学習モデルはいずれも、推定精度が最も高いと期待される学習済みモデルであり、したがって「最良の機械学習モデル」ということができる。しかし、この学習済みモデルは“現実に最良である”とは限らないことに留意されたい。学習済みモデルは、入力ベクトルとラベルとの多数の組合せを含む教師データを所与のコンピュータが処理することで生成される。所与のコンピュータは、入力ベクトルを機械学習モデルに入力することで出力ベクトルを算出し、算出された出力ベクトルから得られる予測値と、教師データで示されるラベルとの誤差(すなわち、推定結果と正解との差)を求める。そして、コンピュータはその誤差に基づいて機械学習モデル内の所与のパラメータを更新する。コンピュータはこのような学習を繰り返すことで学習済みモデルを生成する。学習済みモデルを生成するコンピュータは限定されず、例えば情報処理システム10でもよいし別のコンピュータシステムでもよい。学習済みモデルを生成する処理は学習フェーズということができ、その学習済みモデルを利用する処理は運用フェーズということができる。
[データ]
上述したように、それぞれの成分オブジェクトが材料であり、複合オブジェクトが多成分物質であってもよい。この場合には、成分オブジェクト(材料)の数値表現は材料の化学構造を示す数値を含んでもよいし、材料の化学構造の構成繰返し単位(CRU)を示す数値を含んでもよい。複合比は配合比または混合比でもよい。複合オブジェクト(多成分物質)の特性の予測値は、多成分物質のガラス転移温度(Tg)および弾性率のうちの少なくとも一つを示してもよい。
上述したように、それぞれの成分オブジェクトが材料であり、複合オブジェクトが多成分物質であってもよい。この場合には、成分オブジェクト(材料)の数値表現は材料の化学構造を示す数値を含んでもよいし、材料の化学構造の構成繰返し単位(CRU)を示す数値を含んでもよい。複合比は配合比または混合比でもよい。複合オブジェクト(多成分物質)の特性の予測値は、多成分物質のガラス転移温度(Tg)および弾性率のうちの少なくとも一つを示してもよい。
[システムの動作]
図3および図4を参照しながら、情報処理システム10の動作を説明するとともに本実施形態に係る情報処理方法について説明する。図3は情報処理システム10の動作の一例を処理フローS1として示すフローチャートである。図4は、情報処理システム10の動作をデータの具体例を用いて示す図である。
図3および図4を参照しながら、情報処理システム10の動作を説明するとともに本実施形態に係る情報処理方法について説明する。図3は情報処理システム10の動作の一例を処理フローS1として示すフローチャートである。図4は、情報処理システム10の動作をデータの具体例を用いて示す図である。
ステップS11では、取得部11が、複数の成分オブジェクトのそれぞれについて数値表現および複合比を取得する。図4では複数の成分オブジェクトの例として二つの成分オブジェクトEa,Ebを示す。成分オブジェクトEaの数値表現は{1,1,2,3,4,3,3,5,6,7,5,4}であり、成分オブジェクトEbの数値表現は{1,1,5,6,4,3,3,5,1,7,0,0}である。成分オブジェクトEa,Ebの複合比はそれぞれ0.7、0.3であり、したがって、これは、成分オブジェクトEa,Ebを7:3の割合で用いて複合オブジェクトを得ることを意味する。
取得部11は複数の成分オブジェクトのそれぞれのデータを任意の手法で取得してよい。例えば、取得部11は所与のデータベースにアクセスすることでデータを読み出してもよいし、他のコンピュータまたはコンピュータシステムからデータを受信してもよいし、情報処理システム10のユーザにより入力されたデータを受け付けてもよい。あるいは、取得部11はこれらのような手法のうちの任意の2以上によってデータを取得してもよい。
ステップS12では、第1学習部12が第1機械学習によって、複数の成分オブジェクトのそれぞれについて数値表現から第1特徴ベクトルを算出する。具体的には、第1学習部12は、複数の成分オブジェクトに対応する複数の数値表現を第1機械学習モデルに入力することで、該複数の成分オブジェクトのそれぞれの第1特徴ベクトルを算出する。一例では、第1学習部12は、複数の成分オブジェクトのそれぞれについて、該成分オブジェクトに対応する数値表現を第1機械学習モデルに入力することで該成分オブジェクトの第1特徴ベクトルを算出する。第1機械学習モデルは限定されず、成分オブジェクトおよび複合オブジェクトの種類などの要因を考慮して任意の方針で決められてよい。例えば、第1学習部12はグラフニューラルネットワーク(GNN)、畳み込みニューラルネットワーク(CNN)、または再帰型ニューラルネットワーク(RNN)を用いて第1機械学習を実行してもよい。
図4の例では、第1学習部12は成分オブジェクトEaの数値表現{1,1,2,3,4,3,3,5,6,7,5,4}を第1機械学習モデルに入力することで第1特徴ベクトル{1,1,4,1,3,1}を算出する。また、第1学習部12は成分オブジェクトEbの数値表現{1,1,5,6,4,3,3,5,1,7,0,0}を第1機械学習モデルに入力することで第1特徴ベクトル{3,3,1,1,0,0}を算出する。
ステップS13では、比率適用部13が、複数の成分オブジェクトのそれぞれについて、第1特徴ベクトルに複合比を適用することで第2特徴ベクトルを算出する。「第1特徴ベクトルに複合比を適用する」とは、複合比によって第1特徴ベクトルを変化させる処理のことをいう。その適用方法は限定されない。例えば、比率適用部13は、第1特徴ベクトルに複合比を追加の成分として連結することでその適用を実行してもよい。あるいは、比率適用部13は第1特徴ベクトルのそれぞれの成分に複合比を乗ずるかまたは足すことでその適用を実行してもよい。
図4の例では、比率適用部13は第1特徴ベクトルに複合比を成分として連結する。すなわち、比率適用部13は成分オブジェクトEaの第1特徴ベクトル{1,1,4,1,3,1}に複合比0.7を連結することで、第2特徴ベクトル{1,1,4,1,3,1,0.7}を算出する。また、比率適用部13は成分オブジェクトEbの第1特徴ベクトル{3,3,1,1,0,0}に複合比0.3を連結することで、第2特徴ベクトル{3,3,1,1,0,0,0.3}を算出する。
ステップS14では、第2学習部14が第2機械学習によって複数の第2特徴ベクトルから複合特徴ベクトルを算出する。一例では、第2学習部14は、複数の成分オブジェクトに対応する複数の第2特徴ベクトルの集合を第2機械学習モデルに入力することで複合特徴ベクトルを算出する。第2機械学習モデルは限定されず、成分オブジェクトおよび複合オブジェクトの種類などの要因を考慮して任意の方針で決められてよい。例えば、第2機械学習モデルは、集合の要素の組合せの影響を考慮できる学習モデルでもよいし、その影響を考慮できない学習モデルでもよい。前者の例として、アテンションRNN(Attention RNN)およびマルチヘッド・アテンション(Multi-Head Attention)が挙げられる。
図4の例では、第2学習部14は成分オブジェクトEaの第2特徴ベクトル{1,1,4,1,3,1,0.7}と成分オブジェクトEaの第2特徴ベクトル{3,3,1,1,0,0,0.3}とを第2機械学習モデルに入力することで複合特徴ベクトル{1,0,4,6,5,4}を算出する。
ステップS15では、第2学習部14が複合特徴ベクトルを出力する。本実施形態では、第2学習部14は情報処理システム10での後続処理のために複合特徴ベクトルを予測部15に出力する。しかし、複合特徴ベクトルの出力方法はこれに限定されず、任意の方針で設計されてよい。例えば、第2学習部14は複合特徴ベクトルを、所与のデータベースに格納してもよいし、他のコンピュータまたはコンピュータシステムに向けて送信してもよいし、表示装置上に表示してもよい。
ステップS16では、予測部15が複合特徴ベクトルから複合オブジェクトの特性の予測値を算出する。予測方法は限定されず、任意の方針で設計されてよい。例えば、予測部15は第3機械学習によって複合特徴ベクトルから予測値を算出してもよい。具体的には、予測部15は、複合特徴ベクトルを第3機械学習モデルに入力することで予測値を算出する。第3機械学習モデルは限定されず、複合オブジェクトの種類などの要因を考慮して任意の方針で決められてよい。例えば、予測部15は回帰問題または分類問題を解く任意のニューラルネットワークを用いて第3機械学習を実行してもよい。典型的には、回帰問題の予測値は数値で表され、分類問題の予測値はカテゴリを示す。予測部15は機械学習以外の手法を用いて予測値を算出してもよい。
ステップS17では、予測部15がその予測値を出力する。予測値の出力方法は限定されない。例えば、予測部15は予測値を、所与のデータベースに格納してもよいし、他のコンピュータまたはコンピュータシステムに向けて送信してもよいし、表示装置上に表示してもよい。あるいは、予測部15は情報処理システム10での後続処理のために予測値を他の機能要素に出力してもよい。
[プログラム]
コンピュータまたはコンピュータシステムを情報処理システム10として機能させるための情報処理プログラムは、該コンピュータシステムを取得部11、第1学習部12、比率適用部13、第2学習部14、および予測部15として機能させるためのプログラムコードを含む。この情報処理プログラムは、CD-ROM、DVD-ROM、半導体メモリ等の有形の記録媒体に固定的に記録された上で提供されてもよい。あるいは、情報処理プログラムは、搬送波に重畳されたデータ信号として通信ネットワークを介して提供されてもよい。提供された情報処理プログラムは例えば補助記憶部103に記憶される。プロセッサ101が補助記憶部103からその情報処理プログラムを読み出して実行することで、上記の各機能要素が実現する。
コンピュータまたはコンピュータシステムを情報処理システム10として機能させるための情報処理プログラムは、該コンピュータシステムを取得部11、第1学習部12、比率適用部13、第2学習部14、および予測部15として機能させるためのプログラムコードを含む。この情報処理プログラムは、CD-ROM、DVD-ROM、半導体メモリ等の有形の記録媒体に固定的に記録された上で提供されてもよい。あるいは、情報処理プログラムは、搬送波に重畳されたデータ信号として通信ネットワークを介して提供されてもよい。提供された情報処理プログラムは例えば補助記憶部103に記憶される。プロセッサ101が補助記憶部103からその情報処理プログラムを読み出して実行することで、上記の各機能要素が実現する。
[効果]
以上説明したように、本開示の一側面に係る情報処理システムは少なくとも一つのプロセッサを備える。少なくとも一つのプロセッサは、複数の成分オブジェクトのそれぞれについて数値表現および複合比を取得し、複数の成分オブジェクトに対応する複数の数値表現を第1機械学習モデルに入力することで、該複数の成分オブジェクトのそれぞれの第1特徴ベクトルを算出し、複数の成分オブジェクトのそれぞれについて第1特徴ベクトルに複合比を適用することで、該複数の成分オブジェクトのそれぞれの第2特徴ベクトルを算出し、複数の成分オブジェクトに対応する複数の第2特徴ベクトルを第2機械学習モデルに入力することで、複数の成分オブジェクトを複合させることで得られる複合オブジェクトの特徴を示す複合特徴ベクトルを算出し、複合特徴ベクトルを出力する。
以上説明したように、本開示の一側面に係る情報処理システムは少なくとも一つのプロセッサを備える。少なくとも一つのプロセッサは、複数の成分オブジェクトのそれぞれについて数値表現および複合比を取得し、複数の成分オブジェクトに対応する複数の数値表現を第1機械学習モデルに入力することで、該複数の成分オブジェクトのそれぞれの第1特徴ベクトルを算出し、複数の成分オブジェクトのそれぞれについて第1特徴ベクトルに複合比を適用することで、該複数の成分オブジェクトのそれぞれの第2特徴ベクトルを算出し、複数の成分オブジェクトに対応する複数の第2特徴ベクトルを第2機械学習モデルに入力することで、複数の成分オブジェクトを複合させることで得られる複合オブジェクトの特徴を示す複合特徴ベクトルを算出し、複合特徴ベクトルを出力する。
本発明の一側面に係る情報処理方法は、少なくとも一つのプロセッサを備える情報処理システムにより実行される。情報処理方法は、複数の成分オブジェクトのそれぞれについて数値表現および複合比を取得するステップと、前記複数の成分オブジェクトに対応する複数の前記数値表現を第1機械学習モデルに入力することで、該複数の成分オブジェクトのそれぞれの第1特徴ベクトルを算出するステップと、前記複数の成分オブジェクトのそれぞれについて前記第1特徴ベクトルに前記複合比を適用することで、該複数の成分オブジェクトのそれぞれの第2特徴ベクトルを算出するステップと、前記複数の成分オブジェクトに対応する複数の前記第2特徴ベクトルを第2機械学習モデルに入力することで、前記複数の成分オブジェクトを複合させることで得られる複合オブジェクトの特徴を示す複合特徴ベクトルを算出するステップと、前記複合特徴ベクトルを出力するステップとを含む。
本発明の一側面に係る情報処理プログラムは、複数の成分オブジェクトのそれぞれについて数値表現および複合比を取得するステップと、前記複数の成分オブジェクトに対応する複数の前記数値表現を第1機械学習モデルに入力することで、該複数の成分オブジェクトのそれぞれの第1特徴ベクトルを算出するステップと、前記複数の成分オブジェクトのそれぞれについて前記第1特徴ベクトルに前記複合比を適用することで、該複数の成分オブジェクトのそれぞれの第2特徴ベクトルを算出するステップと、前記複数の成分オブジェクトに対応する複数の前記第2特徴ベクトルを第2機械学習モデルに入力することで、前記複数の成分オブジェクトを複合させることで得られる複合オブジェクトの特徴を示す複合特徴ベクトルを算出するステップと、前記複合特徴ベクトルを出力するステップとをコンピュータに実行させる。
このような側面においては、複合比を考慮する前に、複合オブジェクトを構成する各成分オブジェクトの特徴が顕在化される。したがって、成分オブジェクトについて十分な量のデータを用意できない場合にも複合オブジェクトの解析の精度を上げることが可能になる。
他の側面に係る情報処理システムでは、少なくとも一つのプロセッサが、第1特徴ベクトルに複合比を連結することと、第1特徴ベクトルのそれぞれの成分に複合比を乗ずることと、第1特徴ベクトルのそれぞれの成分に複合比を足すこととのうちの一つによって、第1特徴ベクトルに複合比を適用してもよい。この場合には、簡単な演算によって第1特徴ベクトルに複合比を適用することができる。
他の側面に係る情報処理システムでは、少なくとも一つのプロセッサが、複合特徴ベクトルを第3機械学習モデルに入力することで、複合オブジェクトの特性の予測値を算出し、予測値を出力してもよい。この処理によって、複合オブジェクトの特性を精度良く算出することが可能になる。
他の側面に係る情報処理システムでは、成分オブジェクトが材料であり、複合オブジェクトが多成分物質であってもよい。この場合には、複合比を考慮する前に、多成分物質を構成する各材料の特徴が顕在化される。したがって、材料について十分な量のデータを用意できない場合にも多成分物質の解析の精度を上げることが可能になる。
他の側面に係る情報処理システムでは、材料がポリマーであり、多成分物質がポリマーアロイであってもよい。この場合には、複合比を考慮する前に、ポリマーアロイを構成する各ポリマーの特徴が顕在化される。したがって、ポリマーについて十分な量のデータを用意できない場合にもポリマーアロイの解析の精度を上げることが可能になる。ポリマーアロイは非常に多様であり、これに対応して、ポリマーの種類も膨大である。このようなポリマーおよびポリマーアロイについては、一般に、取り得る組合せの一部についてしか実験を行うことができず、したがって十分な量のデータを得られないことが多い。本側面によれば、このようにデータが不十分である場合でも精度よくポリマーアロイを解析することが可能になる。
[変形例]
以上、本発明をその実施形態に基づいて詳細に説明した。しかし、本発明は上記実施形態に限定されるものではない。本発明は、その要旨を逸脱しない範囲で様々な変形が可能である。
以上、本発明をその実施形態に基づいて詳細に説明した。しかし、本発明は上記実施形態に限定されるものではない。本発明は、その要旨を逸脱しない範囲で様々な変形が可能である。
上記実施形態では情報処理システム10が予測部15を備えるが、この機能要素は省略可能である。すなわち、複合オブジェクトの特性を予測する処理は情報処理システムとは異なるコンピュータシステムによって実行されてもよい。
少なくとも一つのプロセッサにより実行される情報処理方法の処理手順は上記実施形態での例に限定されない。例えば、上述したステップ(処理)の一部が省略されてもよいし、別の順序で各ステップが実行されてもよい。また、上述したステップのうちの任意の2以上のステップが組み合わされてもよいし、ステップの一部が修正または削除されてもよい。あるいは、上記の各ステップに加えて他のステップが実行されてもよい。例えばステップS16,S17の処理が省略されてもよい。
情報処理システム内で二つの数値の大小関係を比較する際には、「以上」および「よりも大きい」という二つの基準のどちらを用いてもよく、「以下」および「未満」の二つの基準のうちのどちらを用いてもよい。このような基準の選択は、二つの数値の大小関係を比較する処理についての技術的意義を変更するものではない。
本開示において、「少なくとも一つのプロセッサが、第1の処理を実行し、第2の処理を実行し、…第nの処理を実行する。」との表現、またはこれに対応する表現は、第1の処理から第nの処理までのn個の処理の実行主体(すなわちプロセッサ)が途中で変わる場合を含む概念を示す。すなわち、この表現は、n個の処理のすべてが同じプロセッサで実行される場合と、n個の処理においてプロセッサが任意の方針で変わる場合との双方を含む概念を示す。
10…情報処理システム、11…取得部、12…第1学習部、13…比率適用部、14…第2学習部、15…予測部。
Claims (7)
- 少なくとも一つのプロセッサを備え、
前記少なくとも一つのプロセッサが、
複数の成分オブジェクトのそれぞれについて数値表現および複合比を取得し、
前記複数の成分オブジェクトに対応する複数の前記数値表現を第1機械学習モデルに入力することで、該複数の成分オブジェクトのそれぞれの第1特徴ベクトルを算出し、
前記複数の成分オブジェクトのそれぞれについて前記第1特徴ベクトルに前記複合比を適用することで、該複数の成分オブジェクトのそれぞれの第2特徴ベクトルを算出し、
前記複数の成分オブジェクトに対応する複数の前記第2特徴ベクトルを第2機械学習モデルに入力することで、前記複数の成分オブジェクトを複合させることで得られる複合オブジェクトの特徴を示す複合特徴ベクトルを算出し、
前記複合特徴ベクトルを出力する、
情報処理システム。 - 前記少なくとも一つのプロセッサが、前記第1特徴ベクトルに前記複合比を連結することと、前記第1特徴ベクトルのそれぞれの成分に複合比を乗ずることと、前記第1特徴ベクトルのそれぞれの成分に複合比を足すこととのうちの一つによって、前記第1特徴ベクトルに前記複合比を適用する、
請求項1に記載の情報処理システム。 - 前記少なくとも一つのプロセッサが、
前記複合特徴ベクトルを第3機械学習モデルに入力することで、前記複合オブジェクトの特性の予測値を算出し、
前記予測値を出力する、
請求項1または2に記載の情報処理システム。 - 前記成分オブジェクトが材料であり、前記複合オブジェクトが多成分物質である、
請求項1~3のいずれか一項に記載の情報処理システム。 - 前記材料がポリマーであり、前記多成分物質がポリマーアロイである、
請求項4に記載の情報処理システム。 - 少なくとも一つのプロセッサを備える情報処理システムにより実行される情報処理方法であって、
複数の成分オブジェクトのそれぞれについて数値表現および複合比を取得するステップと、
前記複数の成分オブジェクトに対応する複数の前記数値表現を第1機械学習モデルに入力することで、該複数の成分オブジェクトのそれぞれの第1特徴ベクトルを算出するステップと、
前記複数の成分オブジェクトのそれぞれについて前記第1特徴ベクトルに前記複合比を適用することで、該複数の成分オブジェクトのそれぞれの第2特徴ベクトルを算出するステップと、
前記複数の成分オブジェクトに対応する複数の前記第2特徴ベクトルを第2機械学習モデルに入力することで、前記複数の成分オブジェクトを複合させることで得られる複合オブジェクトの特徴を示す複合特徴ベクトルを算出するステップと、
前記複合特徴ベクトルを出力するステップと
を含む情報処理方法。 - 複数の成分オブジェクトのそれぞれについて数値表現および複合比を取得するステップと、
前記複数の成分オブジェクトに対応する複数の前記数値表現を第1機械学習モデルに入力することで、該複数の成分オブジェクトのそれぞれの第1特徴ベクトルを算出するステップと、
前記複数の成分オブジェクトのそれぞれについて前記第1特徴ベクトルに前記複合比を適用することで、該複数の成分オブジェクトのそれぞれの第2特徴ベクトルを算出するステップと、
前記複数の成分オブジェクトに対応する複数の前記第2特徴ベクトルを第2機械学習モデルに入力することで、前記複数の成分オブジェクトを複合させることで得られる複合オブジェクトの特徴を示す複合特徴ベクトルを算出するステップと、
前記複合特徴ベクトルを出力するステップと
をコンピュータに実行させる情報処理プログラム。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2019204086 | 2019-11-11 | ||
JP2019204086 | 2019-11-11 | ||
PCT/JP2020/041902 WO2021095722A1 (ja) | 2019-11-11 | 2020-11-10 | 情報処理システム、情報処理方法、および情報処理プログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JPWO2021095722A1 JPWO2021095722A1 (ja) | 2021-05-20 |
JP7509152B2 true JP7509152B2 (ja) | 2024-07-02 |
Family
ID=
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2003058582A (ja) | 2001-08-21 | 2003-02-28 | Bridgestone Corp | 設計・配合のシミュレーションシステム |
JP2004086892A (ja) | 2002-08-02 | 2004-03-18 | Japan Science & Technology Agency | 成分配合設計方法、成分配合設計プログラム及びそのプログラムを記録した記録媒体 |
WO2019198644A1 (ja) | 2018-04-11 | 2019-10-17 | 富士フイルム株式会社 | 推定装置、推定方法、及び推定プログラム |
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2003058582A (ja) | 2001-08-21 | 2003-02-28 | Bridgestone Corp | 設計・配合のシミュレーションシステム |
JP2004086892A (ja) | 2002-08-02 | 2004-03-18 | Japan Science & Technology Agency | 成分配合設計方法、成分配合設計プログラム及びそのプログラムを記録した記録媒体 |
WO2019198644A1 (ja) | 2018-04-11 | 2019-10-17 | 富士フイルム株式会社 | 推定装置、推定方法、及び推定プログラム |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Greener et al. | A guide to machine learning for biologists | |
WO2021095722A1 (ja) | 情報処理システム、情報処理方法、および情報処理プログラム | |
Ksieniewicz et al. | Stream-learn—Open-source Python library for difficult data stream batch analysis | |
Chen et al. | Biological sequence modeling with convolutional kernel networks | |
Hernadez et al. | Synthetic tabular data evaluation in the health domain covering resemblance, utility, and privacy dimensions | |
CN112086144A (zh) | 分子生成方法、装置、电子设备及存储介质 | |
CN113853614A (zh) | 在量子特征空间中使用量子相似性矩阵的无监督聚类 | |
CN115423037A (zh) | 一种基于大数据的用户分类方法及系统 | |
Andreu et al. | Prediction of bioactive peptides using artificial neural networks | |
Chakraborty et al. | BAMBI: An R package for fitting bivariate angular mixture models | |
Buch et al. | A systematic review and evaluation of statistical methods for group variable selection | |
Esparcia-Alcázar et al. | Evolving rules for action selection in automated testing via genetic programming-A first approach | |
US20230273771A1 (en) | Secret decision tree test apparatus, secret decision tree test system, secret decision tree test method, and program | |
JP7509152B2 (ja) | 情報処理システム、情報処理方法、および情報処理プログラム | |
JP7509153B2 (ja) | 情報処理システム、情報処理方法、および情報処理プログラム | |
Lupo Pasini et al. | Fast and accurate predictions of total energy for solid solution alloys with graph convolutional neural networks | |
WO2021095725A1 (ja) | 情報処理システム、情報処理方法、および情報処理プログラム | |
Gonzalez Ginestet et al. | Stacked inverse probability of censoring weighted bagging: A case study in the InfCareHIV Register | |
US20240047018A1 (en) | Information processing system, information processing method, and storage medium | |
US20230060812A1 (en) | Information processing system, information processing method, and storage medium | |
KR20240000515A (ko) | 특성 예측 시스템, 특성 예측 방법, 및 특성 예측 프로그램 | |
Xavier et al. | Genome assembly using reinforcement learning | |
WO2022225008A1 (ja) | 特性予測システム、特性予測方法、及び特性予測プログラム | |
Fontana et al. | Morphoscanner2. 0: A new python module for analysis of molecular dynamics simulations | |
JP7339924B2 (ja) | 材料の特性値を推定するシステム |