JP7359394B2

JP7359394B2 - 情報処理装置および機械学習方法

Info

Publication number: JP7359394B2
Application number: JP2020038785A
Authority: JP
Inventors: 敦史橋本; 祥孝牛久; 信介森; 太一西村
Original assignee: Omron Corp; Kyoto University
Current assignee: Omron Corp; Kyoto University
Priority date: 2020-03-06
Filing date: 2020-03-06
Publication date: 2023-10-11
Anticipated expiration: 2040-03-06
Also published as: EP4116881A1; JP2021140551A; WO2021177056A1; US20230013870A1; EP4116881A4; CN115136150A

Description

本開示は、情報処理装置、および機械学習方法に関する。

従来、入力データに含まれる要素間の関係をグラフ構造として抽出し、当該グラフ構造を中間表現として後処理を行う構成が知られている。たとえば、非特許文献１には、ＲＥＩＮＦＯＲＣＥ（REward Increment Nonnegative Factor Offset Reinforcement Characteristic Eligibility）アルゴリズムによって構文木を生成し、当該構文木により構造化されたデータを中間表現としてＶＡＥ（Variational Autoencoder）による再構成を行う構成が開示されている。

Pengcheng Yin, Chunting Zhou, Junxian He, Graham Neubig, "StructVAE: Tree-structured Latent Variable Models for Semi-supervised Semantic Parsing" (https://www.aclweb.org/anthology/P18-1070/), in Proceedings of the 56th Annual Meeting of the Association for Computational Linguistics (Volume 1: Long Papers), pp. 754-765. Eric Jang, Shixiang Gu, Ben Poole, "Categorical Reparameterization with Gumbel-Softmax", https://openreview.net/forum?id=rkE3y85ee, ICLR (International Conference on Learning Representations) 2017. Jianlong Chang, Xinbang Zhang, Yiwen Guo, Gaofeng Meng, Shiming Xiang, Chunhong Pan, "Differentiable Architecture Search with Ensemble Gumbel-Softmax", https://arxiv.org/abs/1905.01786. Kai Sheng Tai, Richard Socher, Christopher D. Manning, "Improved Semantic Representations From Tree-Structured Long Short-Term Memory Networks", https://www.aclweb.org/anthology/P15-1150/, in Proceedings of the 53rd Annual Meeting of the Association for Computational Linguistics and the 7th International Joint Conference on Natural Language Processing (Volume 1: Long Papers), pp. 1556-1566.

非特許文献１において用いられるＲＥＩＮＦＯＲＣＥアルゴリズムを含む強化学習においては、最適化対象のモデル（エージェント）が試行錯誤を繰り返しながらパラメータの最適化を進めるため、モデルの出力に対する正解の特定が困難な場合がある。そのため、強化学習には、モデルからの出力と正解との誤差を規定する損失関数を微分して、連鎖律に基づいてモデルの出力層から入力層に向かって当該誤差を伝播させるバックプロパゲーションを用いる機械学習よりもモデルの精度を向上させることが難しい場合があることが知られている。非特許文献１に開示されている構成には機械学習によって形成される学習済みモデルの精度に改善の余地がある。

本開示は上記のような課題を解決するためになされたものであり、その目的は、入力データからグラフ構造を中間表現として抽出するモデルの精度を向上させることである。

本開示の一例に係る情報処理装置は、入力データに含まれる要素間の相関関係を表すグラフ構造を入力データから抽出し、グラフ構造から出力データを生成する。情報処理装置は、エンコード部と、サンプリング部と、デコード部と、学習部とを備える。エンコード部は、入力データからグラフ構造に含まれる複数の頂点の各々の特徴量を抽出し、当該頂点に相関関係を表す辺が接続されている尤度を算出する。サンプリング部は、尤度に対するＧｕｍｂｅｌ－Ｓｏｆｔｍａｘ関数の変換結果に基づいて、グラフ構造を決定する。デコード部は、グラフ構造、および複数の頂点の各々の特徴量を受けて出力データを生成する。学習部は、出力データと正解データとの誤差を含む損失関数を最小化対象とするバックプロパゲーションによって、デコード部およびエンコード部を最適化する。

この開示によれば、サンプリング部によるグラフ構造の決定処理によっても損失関数は微分可能となるため、出力データと正解データとの誤差をデコード部の出力層からエンコード部の入力層までバックプロパゲーションによって逆伝播させることが可能になる。その結果、デコード部およびエンコード部の最適化を、デコード部の出力層からエンコード部の入力までエンドツーエンドに行うことができるため、中間表現としてのグラフ構造の精度および出力データの精度を向上させることができる。

上述の開示において、情報処理装置は、出力データからグラフ構造を再構成する再構成部をさらに備えてもよい。損失関数は、再構成部からの出力と正解グラフ構造との誤差を含んでもよい。

この開示によれば、再構成部によって再構成されたグラフ構造と正解グラフ構造との間に同一性が維持されるように機械学習が行われることにより、エンコード部によるロスレス圧縮（可逆圧縮）が促進される。その結果、中間表現としてのグラフ構造の精度および出力データの精度を構成１よりもさらに向上させることができる。

上述の開示において、サンプリング部からグラフ構造を受けて、入力データに対する推論結果を出力する推論部をさらに備えてもよい。学習部は、デコード部およびエンコード部に対しては教師なし学習を行い、推論部に対しては教師あり学習を行ってもよい。

この開示によれば、エンコード部によるロスレス圧縮が促進されるとともに、推論部に対する教師あり学習によって推論部の推論精度を向上させることができる。

上述の開示において、入力データは、第１データおよび第２データを含んでもよい。第１データのモダリティは、第２データのモダリティとは異なってもよい。エンコード部は、第１エンコーダと、第２エンコーダとを含んでもよい。第１エンコーダは、第１データの特徴量を抽出してもよい。第２エンコーダは、第２データの特徴量を抽出してもよい。

この開示によれば、多様な入力データからグラフ構造を抽出することができる。
上述の開示において、出力データのモダリティは、入力データのモダリティとは異なってもよい。

この開示によれば、グラフ構造から多様なデータを生成することができる。
本開示の他の例に係る機械学習方法は、入力データに含まれる要素間の相関関係を表すグラフ構造を入力データから抽出し、グラフ構造から出力データを生成するモデルに対して、記憶部に保存された機械学習プログラムを実行するプロセッサによって行われる。機械学習方法は、入力データからグラフ構造に含まれる複数の頂点の各々の特徴量を抽出し、当該頂点に相関関係を表す辺が接続されている尤度を算出するステップと、尤度に対するＧｕｍｂｅｌ－Ｓｏｆｔｍａｘ関数の変換結果に基づいて、グラフ構造を決定するステップと、グラフ構造、および複数の頂点の各々の特徴量を受けて出力データを生成するステップと、出力データと正解データとの誤差を含む損失関数を最小化対象とするバックプロパゲーションによって、モデルを最適化するステップとを含む。

この開示によれば、グラフ構造を決定するステップによっても損失関数は微分可能となるため、出力データと正解データとの誤差をモデルの出力層からモデルの入力層までバックプロパゲーションによって逆伝播させることが可能になる。その結果、モデルの最適化を、モデルの出力層からモデルの入力層までエンドツーエンドに行うことができるため、中間表現としてのグラフ構造の精度および出力データの精度を向上させることができる。

本開示に係る情報処理装置および機械学習方法によれば、入力データからグラフ構造を中間表現として抽出するモデルの精度を向上させることができる。

実施の形態１に係る情報処理装置の構成を示すブロック図である。図１の入力データおよびエンコード部の具体的な構成を説明するためのブロック図である。図２の第１エンコーダから出力される隣接行列の模式図である。図２の第２エンコーダから出力される隣接行列の模式図である。図１のツリー構造を示す図である。図５のツリー構造を表現する隣接行列を示す図である。図１のデコード部および出力データの具体的な構成を示すブロック図である。情報処理装置において行われる機械学習方法の流れを示すフローチャートである。実施の形態１の変形例に係る情報処理装置の構成を示すブロック図である。図９の再構成部の具体的な構成を示すブロック図である。実施の形態２に係る情報処理装置の構成を示すブロック図である。入力データから抽出される、複数のユーザと複数の企業との間の２部グラフ構造の一例を示す図である。図１２に示される２部グラフ構造を表現する行列を示す図である。実施の形態３に係る管理システムの構成例を示す模式図である。図１４の管理システムを構成するＰＬＣのハードウェア構成の一例を示す模式図である。図１４の収集解析サーバ装置の機能構成を示すブロック図である。図１４の収集解析サーバ装置のハードウェア構成を示すブロック図である。品質データおよび基準品質データの誤差とともに可視化されたグラフ構造の一例を示す図である。実施の形態に係る情報処理装置に対応するロボットによるルートプランニングを説明するための図である。図１９のロボットによって抽出される有向グラフ構造を示す図である。図２０の有向グラフ構造に対応する行列表現を示す図である。

以下、実施の形態について図面を参照しながら詳細に説明する。なお、図中同一または相当部分には同一符号を付してその説明は原則として繰り返さない。

＜適用例＞
［実施の形態１］
図１は、実施の形態１に係る情報処理装置１の構成を示すブロック図である。図１に示されるように、情報処理装置１は、エンコード部１００と、サンプリング部１３０と、デコード部１４０と、学習部１５０とを備える。情報処理装置１は、入力データ１０に含まれる要素間の相関関係を表すグラフ構造を入力データ１０から抽出し、当該グラフ構造から出力データ２０を生成する。実施の形態１では、調理の手順の画像列データおよび食材列データを含む入力データから、料理の手順列データを含む出力データを生成する場合について説明する。

図２は、図１の入力データ１０およびエンコード部１００の具体的な構成を説明するためのブロック図である。図２に示されるように、入力データ１０は、画像列データ１１（第１データ）と、食材列データ１２（第２データ）とを含む。画像列データ１１のモダリティは、画像である。食材列データ１２のモダリティは、文字列である。画像列データ１１のモダリティは、食材列データ１２のモダリティとは異なる。なお、モダリティとは、データの形式、種類、あるいは型を含む。

画像列データ１１は、画像Ｉｍ_１～Ｉｍ_Ｍを含む。画像Ｉｍ_１～Ｉｍ_Ｍの各々は、調理の各手順の画像を表し、画像Ｉｍ_１～Ｉｍ_Ｍの順に調理が行われる。すなわち、画像Ｉｍ_１～Ｉｍ_Ｍは、この順に順序付けられている。食材列データ１２は、文字列Ｔｘ_１～Ｔｘ_Ｎを含む。文字列Ｔｘ_１～Ｔｘ_Ｎの各々は、食材名を表す。調理の過程において、文字列Ｔｘ_１～Ｔｘ_Ｎの順に使用される。すなわち、文字列Ｔｘ_１～Ｔｘ_Ｎは、この順に順序付けられている。図２においては、手順数Ｍが４であり、食材数Ｎが４である場合が示されている。文字列Ｔｘ_１～Ｔｘ_４は、「トマト」，「かぼちゃ」，「マヨネーズ」，「ケチャップ」をそれぞれ表す。なお、手順数Ｍは４に限定されず、３以下であってもよいし、５以上であってもよい。食材数Ｎも同様である。また、手順数Ｍと食材数Ｎとは異なっていてもよい。

エンコード部１００は、エンコーダ１１０（第１エンコーダ）と、エンコーダ１２０（第２エンコーダ）とを含む。エンコーダ１１０は、学習済みの画像エンコーダ１１１と、ｂｉＬＳＴＭ（bidirectional Long Short-Term Memory）１１２，１１３と、行列推定器１１４とを含む。エンコーダ１２０は、分散表現器１２１と、ＬＳＴＭ１２２と、ｂｉＬＳＴＭ１２３と、行列推定器１２４とを含む。分散表現器１２１は、たとえばｗｏｒｄ２ｖｅｃを含む。

画像エンコーダ１１１は、画像列データ１１に含まれる画像Ｉｍ_ｋの特徴ベクトルｖ_ｋを抽出し、ベクトル表現Ｖ＝（ｖ_１，ｖ_２，…，ｖ_ｋ，…，ｖ_Ｍ）（特徴量）を出力する。ｂｉＬＳＴＭ１１２は、ベクトル表現Ｖを受けて、ベクトル表現Θ＝（θ_１，θ_２，…，θ_ｋ，…θ_Ｍ）（特徴量）を出力する。特徴ベクトルθ_１～θ_Ｍは、特徴ベクトルｖ_１～ｖ_Ｍにそれぞれ対応する。ｂｉＬＳＴＭ１１３は、ベクトル表現Ｖを受けて、ベクトル表現Φ＝（φ_１，φ_２，…，φ_ｋ，…，φ_Ｍ）（特徴量）を出力する。特徴ベクトルφ_１～φ_Ｍは、特徴ベクトルｖ_１～ｖ_Ｍにそれぞれ対応する。なお、インデックスｋは自然数である。

行列推定器１１４は、ベクトル表現Θ，Φを受けて、画像Ｉｍ_１～Ｉｍ_Ｍの隣接関係を推定し、隣接行列Ｙとして出力する。画像Ｉｍ_１～Ｉｍ_Ｍの隣接関係の推定とは、画像Ｉｍ_１～Ｉｍ_Ｍの各々をグラフ構造の頂点として、２つの頂点間に辺が存在する尤度を算出することを意味する。隣接行列Ｙの成分Ｙ_ｉ，ｊは以下の式（１）で表される。

エンコーダ１２０においては、ベクトル表現Θ，Φからベクトル表現Ω＝（ω_１，ω_２，…，ω_ｋ，…，ω_Ｍ）（特徴量）が算出され、ベクトル表現Ωが行列推定器１２４に入力される。特徴ベクトルω_ｋの各次元の成分は、特徴ベクトルθ_ｋ，φ_ｋの当該次元の成分のうち、大きい方の成分である。

分散表現器１２１は、食材列データ１２に含まれる文字列Ｔｘ_ｋの分散表現を出力する。ＬＳＴＭ１２２は、文字列Ｔｘ_ｋの分散表現を特徴ベクトルｇ_ｋに変換し、ベクトル表現Ｇ＝（ｇ_１，ｇ_２，…，ｇ_ｋ，…，ｇ_Ｎ）を出力する。ｂｉＬＳＴＭ１２３は、ベクトル表現Ｇを受けて、ベクトル表現Γ＝（γ_１，γ_２，…，γ_ｋ，…，γ_Ｎ）（特徴量）を出力する。特徴ベクトルγ_１～γ_Ｎは、特徴ベクトルｇ_１～ｇ_Ｎにそれぞれ対応する。

行列推定器１２４は、ベクトル表現Ω，Γを受けて、画像Ｉｍ_１～Ｉｍ_Ｍおよび文字列Ｔｘ_１～Ｔｘ_Ｎの隣接関係を推定し、当該隣接関係を隣接行列Ｘとして出力する。画像Ｉｍ_１～Ｉｍ_Ｍおよび文字列Ｔｘ_１～Ｔｘ_Ｎの隣接関係の推定とは、文字列Ｔｘ_１～Ｔｘ_Ｎの各々をグラフ構造の頂点として、文字列Ｔｘ_１～Ｔｘ_Ｎの各々に対応する頂点と画像Ｉｍ１～Ｉｍ４の各々に対応する頂点との間に辺が存在する尤度を算出することを意味する。隣接行列Ｘの成分Ｘ_ｉ，ｊは以下の式（２）で表される。

図３は、図２の隣接行列Ｙの模式図である。図３において各成分に付されているハッチングが濃いほど、当該成分の尤度が大きい。図３においては、行に含まれる頂点から列に含まれる頂点に向かう辺が存在するかの尤度が当該行および列によって特定される隣接行列の成分である。すなわち、隣接行列Ｙは、有向グラフ構造を表現している。列に含まれる頂点から行に含まれる頂点に向かう辺が存在するかの尤度が当該行および列によって特定される隣接行列の成分であってもよい。

有向グラフ構造を表す隣接行列Ｙは、必要に応じて無向グラフ構造を表す隣接行列Ｔに変換されてもよい。隣接行列Ｙの変換にあたっては、隣接行列Ｔの転置行列が隣接行列Ｔに等しくなるように、たとえば隣接行列Ｙの各成分と当該成分の行と列とを逆にした成分との平均値を当該２つの成分に対応する隣接行列Ｔの成分にすることができる。

図４は、図２の隣接行列Ｘの模式図である。ハッチングの濃さと尤度との関係は図３と同様である。図４においては、行に含まれる頂点と列に含まれる頂点との間に辺が存在するかの尤度が当該行および列によって特定される隣接行列の成分である。隣接行列Ｘは、無向グラフ構造を表現している。

再び図２を参照して、サンプリング部１３０は、隣接行列Ｘ，Ｙを受けて、文字列Ｔｘ_１～Ｔｘ_Ｎの各々に対応する頂点をリーフノードとし、画像列データ１１における最後の画像に対応する頂点をルートノードとし、他の画像に対応する頂点をノードとするツリー構造Ｔｒ（グラフ構造）を出力する。サンプリング部１３０は、Ｇｕｍｂｅｌ－Ｓｏｆｔｍａｘ関数（非特許文献２参照）を用いて、隣接行列Ｘ，Ｙの各成分の尤度を当該成分に対応する２つの頂点間に辺が存在する確率に変換する（再パラメータ化トリック）。サンプリング部１３０は、再パラメータ化トリックにより、隣接行列Ｘ，Ｙを隣接行列Ａ，Ｂにそれぞれ変換する。成分Ａ_ｉ，ｊ，Ｂ_ｉ，ｊは、以下の式（３），（４）のようにそれぞれ表される。

式（３），（４）において、δ_ｉ，ｋ，ε_ｉ，ｋは、Ｇｕｍｂｅｌ（０，１）分布からサンプリングされたノイズである。τはＧｕｍｂｅｌ－Ｓｏｆｔｍａｘ関数の温度パラメータである。サンプリング部１３０は、隣接行列Ａ，Ｂを用いてノード間の枝（辺）の有無を決定し、ツリー構造Ｔｒを決定する。

図５は、図１のツリー構造Ｔｒを示す図である。図５において、ノードＮｄ_１～Ｎｄ_４は、画像Ｉｍ_１～Ｉｍ_４にそれぞれ対応する。ノードＮｄ_４は、ルートノードである。リーフノードＬｆ_１～Ｌｆ_４は、文字列Ｔｘ_１～Ｔｘ_４にそれぞれ対応する。

図５に示されるように、リーフノードＬｆ_１とノードＮｄ_１とは枝Ｂｒ_１によって接続されている。リーフノードＬｆ_２とノードＮｄ_２とは、枝Ｂｒ_２によって接続されている。リーフノードＬｆ_３とルートノードＮｄ_４とは、枝Ｂｒ_３によって接続されている。リーフノードＬｆ_４とルートノードＮｄ_４とは、枝Ｂｒ_４によって接続されている。ノードＮｄ_１とＮｄ_３とは、ノードＮｄ_１からＮｄ_３に向かう枝Ｂｒ_５によって接続されている。ノードＮｄ_２とＮｄ_３とは、ノードＮｄ_２からＮｄ_３に向かう枝Ｂｒ_６によって接続されている。ノードＮｄ_３とルートノードＮｄ_４とは、ノードＮｄ_３からルートノードＮｄ_４に向かう枝Ｂｒ_７によって接続されている。

ツリー構造Ｔｒは、画像Ｉｍ_１に示される手順の結果および画像Ｉｍ_２に示される手順の結果が、画像Ｉｍ_３に示される手順において使用され、画像Ｉｍ_３に示される手順の結果が画像Ｉｍ_４に示される手順において使用されることを示す。また、ツリー構造Ｔｒは、文字列Ｔｘ_１の食材が画像Ｉｍ_１に示される手順において使用され、文字列Ｔｘ_２の食材が画像Ｉｍ_２に示される手順において使用され、文字列Ｔｘ_３，Ｔｘ_４の各々の食材が画像Ｉｍ_４に示される手順において使用されることを示す。

図６は、図５のツリー構造Ｔｒを表現する隣接行列Ｘ１，Ｙ１を示す図である。隣接行列Ｘ１，Ｙ１は、それぞれ隣接行列Ａ，Ｂを介して、サンプリング部１３０によって決定される。たとえば、サンプリング部１３０は、隣接行列Ａ，Ｂの各行における最大値に対応する成分を１とし、それ以外の成分を０とし、各行をワンホット表現として隣接行列Ｘ１，Ｙ１を決定する。入力データから抽出されるグラフ構造に含まれる頂点からの出辺の最大数または当該頂点への入辺の最大数が決定している場合には、ＥｎｓｅｍｂｌｅＧｕｍｂｅｌ－Ｓｏｆｔｍａｘ（非特許文献３参照）により、各行または各列が２個以上のワンホット表現の重ね合わせとして表現されてもよい。なお、グラフ構造の決定にあたっては、隣接行列Ｘ，Ｙの各成分の尤度に対するＧｕｍｂｅｌ－Ｓｏｆｔｍａｘ関数を用いた再パラメータ化トリックの変換結果以外にも、抽出されるグラフ構造の特性も考慮され得る。たとえば、料理の手順を示すツリー構造Ｔｒにおいて或るノードから当該ノードへの辺（セルフループ）は許容されないため、隣接行列Ｙ１の対角成分は０となる。また、ルートノードより階層が上のノードはツリー構造Ｔｒには存在しないため、隣接行列Ｙ１においてルートノードに対応する第４行の各成分は０となる。

有向グラフ構造を表す隣接行列Ｙ１は、必要に応じて無向グラフ構造を表す隣接行列Ｔ１に変換されてもよい。隣接行列Ｙ１の変換にあたっては、隣接行列Ｔ１の転置行列が隣接行列Ｔ１に等しくなるように、たとえば隣接行列Ｙ１の各成分と当該成分の行と列とを逆にした成分とのうちの最大値、最小値、またはいずれかがランダムに選択された値を当該２つの成分に対応する隣接行列Ｔ１の成分にすることができる。

図７は、図１のデコード部１４０および出力データ２０の具体的な構成を示すブロック図である。図７に示されるように、デコード部１４０は、ＬＳＴＭ１４１と、エンコーダデコーダモデル１４２と、サンプリング部１４３とを含む。ＬＳＴＭ１４１は、Ｔｒｅｅ－ＬＳＴＭ（非特許文献４参照）を含み、たとえばＣｈｉｌｄ－ｓｕｍＬＳＴＭを含む。ＬＳＴＭ１４１は、ツリー構造Ｔｒにおける画像列データ１１のｋ番目の手順に対応する特徴量をＣｈｉｌｄ－ｓｕｍＬＳＴＭのｋ番目の隠れ層から特徴ベクトルｈ_ｋとして得て、ベクトル表現Ｈ＝（ｈ_１，ｈ_２，…，ｈ_ｋ，…，ｈ_Ｍ）を出力する。エンコーダデコーダモデル１４２は、ＬＳＴＭ１４１からベクトル表現Ｈを受けるとともに、図２の画像エンコーダ１１１からベクトル表現Ｖを受ける。エンコーダデコーダモデル１４２は、ペア（ｈ_ｋ，ｖ_ｋ）を文字列Ｓｔ_ｋに変換し、手順列データである文字列Ｓｔ_１～Ｓｔ_Ｍを含む出力データ２０を出力する。出力データ２０のモダリティは、文字列であり、入力データ１０に含まれる画像列データ１１のモダリティとは異なる。文字列Ｓｔ_１は、「トマトを一口大の大きさに切る。」を表す。文字列Ｓｔ_２は、「かぼちゃをフライパンで炒める。」を表す。文字列Ｓｔ_３は、「かぼちゃをトマトの上に乗せる。」を表す。文字列Ｓｔ_４は、「ケチャップとマヨネーズをかける。」を表す。出力データ２０は、文字列Ｓｔ_１～Ｓｔ_Ｍの順に調理が行われることを表す。すなわち、文字列Ｓｔ_１～Ｓｔ_Ｍは、この順に順序付けられている。なお、エンコーダデコーダモデル１４２においては、Ｇｕｍｂｅｌ－Ｓｏｆｔｍａｘ関数を用いて単語が出力される。

次に、図１の情報処理装置１において行われる機械学習処理について説明する。学習部１５０は、以下の式（５）のように表される損失関数Ｌ１を最小化対象とするバックプロパゲーションによって、デコード部１４０およびエンコード部１００の最適化を行う。

損失関数Ｌ_１は、上記において説明されたエンコード部１００からデコード部１４０までの処理を行う過程で生じる全体の誤差を、損失関数Ｌ_ＴとＬ_Ｐとの和として規定する。損失関数Ｌ_Ｔは、エンコード部１００から出力される隣接行列Ｘ，Ｙと予め用意された正解行列（正解グラフ構造）との交差エントロピー誤差を規定する。損失関数Ｌ_Ｐは、デコード部１４０から出力される出力データと予め用意された正解データとの交差エントロピー誤差を規定する。再パラメータ化トリックにより、サンプリング部１３０によるグラフ構造の決定処理によっても損失関数Ｌ１は微分可能となるため、出力データ２０と正解データとの誤差をデコード部１４０の出力層からエンコード部１００の入力層までバックプロパゲーションによって逆伝播させることが可能になる。その結果、デコード部１４０およびエンコード部１００の最適化を、デコード部１４０の出力層からエンコード部１００の入力層までエンドツーエンドに行うことができるため、中間表現としてのグラフ構造の精度および出力データの精度を向上させることができる。

図８は、情報処理装置１において行われる機械学習方法の流れを示すフローチャートである。図８に示されるように、Ｓ１１においてエンコード部１００は、入力データ１０に含まれる要素（頂点）の特徴量を抽出し、処理をＳ１２に進める。Ｓ１２においてエンコード部１００は、２つの頂点のコサイン類似度を用いて、当該２つの頂点間に辺が存在する尤度を算出する。当該尤度の算出にあたっては、コサイン類似度以外の類似度または距離が用いられてもよい。Ｓ１３においてサンプリング部１３０は、Ｇｕｍｂｅｌ－Ｓｏｆｔｍａｘ関数を用いる再パラメータ化トリックを行って、グラフ構造を決定する。Ｓ１４においてデコード部１４０は、サンプリング部１３０からのグラフ構造およびエンコード部１００からの各頂点の特徴量から出力データを生成する。Ｓ１５において学習部１５０は、損失関数Ｌ_１を最小化対象とするバックプロパゲーションにより、デコード部１４０およびエンコード部１００の各々に含まれるパラメータを最適化し、機械学習方法を終了する。当該パラメータには、デコード部１４０およびエンコード部１００に含まれるニューラルネットワークの重みおよびバイアスが含まれる。

以上、実施の形態１に係る情報処理装置および機械学習方法によれば、入力データからグラフ構造を中間表現として抽出するモデルの精度を向上させることができる。

［実施の形態１の変形例］
実施の形態１の変形例においては、出力データから隣接行列を再構成する場合について説明する。再構成された隣接行列とエンコード部から出力される隣接行列との間に同一性が維持されるように機械学習が行われることにより、エンコード部によるロスレス圧縮が促進される。その結果、中間表現としてのグラフ構造の精度および出力データの精度を実施の形態１よりもさらに向上させることができる。

図９は、実施の形態１の変形例に係る情報処理装置１Ａの構成を示すブロック図である。情報処理装置１Ａの構成は、図１の情報処理装置１の構成に再構成部１６０が追加されているとともに、学習部１５０が１５０Ａに置き換えられた構成である。これら以外は同様であるため説明を繰り返さない。図９に示されるように、再構成部１６０は、出力データ２０を受けるとともに、エンコード部１００からベクトル表現Γ，Ωを受ける。

図１０は、図９の再構成部１６０の具体的な構成を示すブロック図である。図１０に示されるように、ｂｉＬＳＴＭ１６１，１６２と、行列推定器１６３とを含む。ｂｉＬＳＴＭ１６１は、出力データ２０を受けて、文字列Ｓｔ_１～Ｓｔ_Ｍの各々に対して、最初の隠れ層と最後の隠れ層とを結合することによって得られる特徴ベクトを出力する。ｂｉＬＳＴＭ１６２は、ｂｉＬＳＴＭ１６１から文字列Ｓｔ_１～Ｓｔ_Ｍの各々の特徴ベクトルを受けて、文字列Ｓｔ_１～Ｓｔ_Ｍの順序が反映されたベクトル表現Λ＝（λ_１，λ_２，…，λ_ｋ，…，λ_Ｍ）（特徴量）を出力する。特徴ベクトルλ_１～λ_Ｍは、文字列Ｓｔ_１～Ｓｔ_Ｍにそれぞれ対応する。

行列推定器１６３は、ベクトル表現Γ，Ω，Λを受けて、文字列Ｔｘ_１～Ｔｘ_Ｍおよび文字列Ｓｔ_１～Ｓｔ_Ｍの隣接関係を隣接行列Ｃとして推定するとともに、画像Ｉｍ_１～Ｉｍ_Ｍおよび文字列Ｓｔ_１～Ｓｔ_Ｍの隣接関係を隣接行列Ｄとして推定する。隣接行列Ｃ，Ｄは、それぞれ以下の式（６），（７）のように表される。

入力データに含まれるツリー構造が出力データ２０に正確に反映されている場合、画像列データ１１における画像Ｉｍ_１～Ｉｍ_Ｍは、出力データ２０における文字列Ｓｔ_１～Ｓｔ_Ｍに対応する。そのため、隣接行列Ｃ，Ｄは、エンコード部１００によって算出される隣接行列Ｘ，Ｙとそれぞれ同一性が認められる必要がある。そこで、実施の形態１の変形例においては、エンコード部１００から出力される隣接行列Ｘ，Ｙの誤差の算出に用いられた正解行列と、隣接行列Ｃ，Ｄとの誤差を規定する損失関数Ｌ_Ｒを損失関数Ｌ１に加える。実施の形態１の変形例における全体の誤差を規定する損失関数Ｌ２は、以下の式（８）のように表される。損失関数Ｌ２の係数αはハイパーパラメータである。なお、損失関数Ｌ_Ｒは、隣接行列Ｃ，Ｄと隣接行列Ｘ，Ｙ（正解データ）との誤差を規定する損失関数であってもよい。

学習部１５０Ａは、損失関数Ｌ２を最小化対象とするバックプロパゲーションにより、再構成部１６０、デコード部１４０、およびエンコード部１００の各々に含まれるパラメータを最適化する。

出力データ２０の精度に関して、比較例、実施の形態１、および実施の形態１の変形例の比較を以下の表１に示す。表１においては、ＧＬＡＣＮｅｔ（GLocal Attention Cascading Networks）を比較例としている。また、表１において、自動評価尺度であるＢＬＥＵ(BiLingual Evaluation Understudy)１，ＢＬＥＵ４，ＲＯＵＧＥ－Ｌ（Recall-Oriented Understudy for Gisiting Evaluation Longest common subsequence），ＣＩＤＥｒ（Consensus-based Image Description Evaluation）－Ｄ，ＭＥＴＥＯＲ（Metric for Evaluation of Translation with Explicit ORdering）の各々のスコアが示されている。

表１に示されているように、各自動評価尺度において、実施の形態１の性能は、比較例の性能を上回っている。また、実施の形態１の変形例の性能は、実施の形態１の性能を上回っている。

以上、実施の形態１の変形例に係る情報処理装置および機械学習方法によれば、入力データからグラフ構造を中間表現として抽出するモデルの精度を実施の形態１よりもさらに向上させることができる。

［実施の形態２］
実施の形態１においては、入力データからグラフ構造としてツリー構造が抽出される構成について説明した。入力データから抽出されるグラフ構造はツリー構造に限定されず、たとえばＮ部グラフ構造（Ｎは２以上の自然数）であってもよい。実施の形態２においては、Ｎ部グラフ構造の一例として、入力データから２部グラフ構造が抽出される構成について説明する。

図１１は、実施の形態２に係る情報処理装置２の構成を示すブロック図である。図１１に示されように、情報処理装置２は、エンコード部２００と、サンプリング部２３０と、デコード部２４０と、学習部２５０と、推論部２７０とを備える。エンコード部２００、サンプリング部２３０、デコード部２４０、および学習部２５０は、ＶＡＥ（Variational Autoencoder）を形成している。

エンコード部２００は、入力データ１０Ｂに含まれるグラフ構造の複数の頂点の各々の特徴量を抽出する。エンコード部２００は、当該複数の頂点を、共通の頂点を有さない２つの部分集合Ｓｂ_１，Ｓｂ_２に分割する。エンコード部２００は、部分集合Ｓｂ_１に含まれる頂点と部分集合Ｓｂ_２に含まれる頂点との間に辺が存在する尤度を算出し、当該尤度を成分とする隣接行列をサンプリング部２３０に出力する。すなわち、エンコード部２００は、部分集合Ｓｂ_１とＳｂ_２との間において２部グラフマッチングを行う。

サンプリング部２３０は、エンコード部２００からの隣接行列に対してＧｕｍｂｅｌ－Ｓｏｆｔｍａｘ関数を用いた再パラメータ化トリックを行い、２部グラフ構造Ｂｐを決定して、２部グラフ構造Ｂｐおよび２部グラフ構造Ｂｐに含まれる複数の頂点の各々の特徴量をデコード部２４０および推論部２７０に出力する。デコード部２４０は、２部グラフ構造Ｂｐおよび当該特徴量から出力データ２０Ｂを再生する。推論部２７０は、２部グラフ構造Ｂｐおよび当該特徴量に基づいて推論を行い、推論結果を出力する。推論部２７０は、たとえばＧＮＮ（Graph Neural Network）を含む。

学習部２５０は、バックプロパゲーションによって、推論部２７０、デコード部２４０、エンコード部２００を最適化する。バックプロパゲーションにおける最小化対象の損失関数は、出力データ２０Ｂと入力データ１０Ｂ（正解データ）との誤差、および推論部２７０の推論結果と学習データセットに含まれる正解データとの誤差を含む。すなわち、学習部２５０は、推論部２７０、デコード部２４０、エンコード部２００に対して半教師あり学習を行う。具体的には、学習部２５０は、デコード部２４０およびエンコード部２００に対しては教師なし学習を行い、推論部２７０に対しては教師あり学習を行う。

情報処理装置２の主目的は、推論部２７０による推論結果の出力である。エンコード部２００、サンプリング部２３０、デコード部２４０、および学習部２５０によって形成されるＶＡＥの最適化は、入力データ１０Ｂから２部グラフ構造へのロスレス圧縮を実現するためのサブタスクとして位置付けられる。

以下では、検索システムに対するユーザの検索操作の履歴を入力データ１０Ｂとする場合について説明する。図１２は、入力データ１０Ｂから抽出される、複数のユーザと複数の企業との間の２部グラフ構造Ｂｐの一例を示す図である。図１２においては、ユーザＵｓ_１，Ｕｓ_２，Ｕｓ_３，Ｕｓ_４と企業Ｃｍ_１，Ｃｍ_２，Ｃｍ_３，Ｃｍ_４，Ｃｍ_５との間の相関関係が示されている。図１２に示されるように、ユーザＵｓ_１と企業Ｃｍ_２とが辺Ｒｓ_１によって接続されている。ユーザＵｓ_２と企業Ｃｍ_４とが辺Ｒｓ_２によって接続されている。ユーザＵｓ_３と企業Ｃｍ_３とが辺Ｒｓ_３によって接続されている。ユーザＵｓ_４と企業Ｃｍ_５とが辺Ｒｓ_４によって接続されている。図１３は、図１２に示される２部グラフ構造Ｂｐを表現する行列を示す図である。図１１の推論部２７０は、２部グラフ構造Ｂｐを受けて、各ユーザのニーズにマッチする企業を推論し、当該企業を当該ユーザに推奨する。

以上、実施の形態２に係る情報処理装置および機械学習方法によれば、入力データからグラフ構造を中間表現として抽出するモデルの精度を向上させることができる。

［実施の形態３］
実施の形態３においては、製造設備に含まれる複数の工程における複数のセンサの検出値の時系列データに基づいて複数のセンサをグラフ構造として構造化し、製品に発生した不具合がどの工程において発生したかを特定する構成について説明する。

図１４は、実施の形態３に係る管理システム３０００の構成例を示す模式図である。図１４を参照して、管理システム３０００は、複数の工程を含む製造設備３０に関連付けられており、製造設備３０によって製造される製品の品質を管理するための機能を提供する。図１４においては、ワークを運搬するためのコンベア３０７に沿って、５つの連続する工程Ｐｒ_１，Ｐｒ_２，Ｐｒ_３，Ｐｒ_４，Ｐｒ_５が示されている。ワークは、工程Ｐｒ_１～Ｐｒ_５の順に通過する。工程Ｐｒ_１～Ｐｒ_５の各々には、当該工程の状態を検出するためのセンサが設置されている。工程Ｐｒ_１～Ｐｒ_５においては、制御装置の一例であるＰＬＣ（Programmable Logic Controller）３０１，３０２，３０３，３０４，３０５によって、工程Ｐｒ_１～Ｐｒ_５がそれぞれ制御されるとともに監視される。

ＰＬＣ３０１～３０５は、ローカルネットワーク３０６を介してデータ通信可能に接続されている。ＰＬＣ３０１～３０５は、ローカルネットワーク３０６上の中継サーバ装置３０８に対して、制御対象の工程に関する状態情報を所定期間毎またはイベント毎に送信する。当該状態情報には、当該工程に設けられたセンサによって複数のサンプリングタイムにおいてそれぞれ検出された複数の検出値の時系列データ（センサ時系列データ）が含まれる。

中継サーバ装置３０８は、ＰＬＣ３０１～３０５の各々から状態情報をインターネットを介して収集解析サーバ装置３（情報処理装置）へ転送する。中継サーバ装置３０８は、状態情報に対して必要な前処理を実施してもよい。

収集解析サーバ装置３は、中継サーバ装置３０８から受信した状態情報を収集し、収集した情報を解析する。収集解析サーバ装置３は、予め定められた条件が満たされたとき、または、端末装置３０９から要求を受信したときに、分析結果をインターネットを介して端末装置３０９へ出力する。

図１４には、典型例として、単一の製造設備３０に設置された複数の工程の各々にＰＬＣが設けられ、それぞれのＰＬＣが同一のローカルネットワーク３０６を介して中継サーバ装置３０８に接続されている構成について例示したがこれに限らない。たとえば、中継サーバ装置３０８を配置することなく、複数のＰＬＣが収集解析サーバ装置３と直接的に接続されている構成を採用してもよい。この場合には、それぞれのＰＬＣが収集解析サーバ装置３に必要な情報をそれぞれ送信することになる。

あるいは、複数の中継サーバ装置３０８を設けてもよい。この場合には、一部のＰＬＣからの状態情報をある中継サーバ装置３０８が収集解析サーバ装置３へ転送し、残りのＰＬＣからの状態情報を別の中継サーバ装置３０８が収集解析サーバ装置３へ転送するようにしてもよい。

次に、ＰＬＣのハードウェア構成例について説明する。図１５は、図１４の管理システム３０００を構成するＰＬＣ３０１～３０５のハードウェア構成の一例を示す模式図である。図１５を参照して、ＰＬＣ３０１～３０５の各々は、演算ユニット３１０と、１または複数の機能ユニット３２０とを含む。演算ユニット３１０は、予め格納されたユーザプログラムなどを実行する演算装置であり、機能ユニット３２０からフィールド信号（制御対象の設備の状態を示す情報など）を取得し、機能ユニット３２０を通じて、必要な制御信号を出力する。

演算ユニット３１０は、ユーザプログラムなどを実行するプロセッサ３１２と、ユーザプログラム、オペレーティングシステム（ＯＳ：Operating System）、および各種データなどを格納するメモリ３１６と、内部バス３２６を介したデータの遣り取りを制御するバスコントローラ３１４と、通信インターフェイス３１８とを含む。メモリ３１６は、ＤＲＡＭ（Dynamic Random Access Memory）などの揮発性記憶装置と、フラッシュメモリなどの不揮発性記憶装置とを組み合わせて構成してもよい。プロセッサ３１２は、ＰＬＣ３０１～３０５の各々に対応する工程に設置されたセンサ３１５から検出値を取得する。当該検出値は、たとえば、電流値、電圧値、電力値、温度、湿度、または振動値を含む。複数のセンサ３１５が、１つの工程に設けられてもよい。

通信インターフェイス３１８は、データを遣り取りする対象の装置に応じて、１つまたは複数の通信ポートが設けられてもよい。たとえば、ローカルネットワーク３０６（図１４参照）に接続するためのイーサネット（登録商標）に従う通信ポート、パーソナルコンピュータなどと接続するためのＵＳＢ（Universal Serial Bus）に従う通信ポート、またはシリアル回線・パラレル回線をサポートする通信ポートなどが実装されてもよい。

機能ユニット３２０は、制御対象の設備との間で各種情報を遣り取りするためのＩＯ（Input Output）機能を提供してもよい。具体的には、デジタル信号を受け取るＤＩ（Digital Input）、デジタル信号を出力するＤＯ（Digital Output）、アナログ信号を受け取るＡＩ（Analog Input）、およびアナログ信号を出力するＡＯ（Analog Output）などの機能が実装されてもよい。さらに、ＰＩＤ（Proportional Integral Derivative）制御、またはモーション制御などの特殊機能が実装されてもよい。

たとえば、ＩＯ機能を提供する機能ユニット３２０の各々は、ＩＯモジュール３２２と、内部バス３２６とを介して演算ユニット３１０との間のデータの遣り取りを制御するためのバスコントローラ３２４とを含む。ＩＯモジュール３２２の各々は、制御対象の工程からの状態情報を取得し、当該状態情報を演算ユニット３１０を通じて中継サーバ装置３０８および収集解析サーバ装置３へ送出する。

管理システム３０００においては、何らかの通信手段を用いて、内部情報を外部装置へ出力するためのインターフェイスを有するＰＬＣであれば、どのようなものを採用してもよい。ＰＬＣのハードウェア構成は、図１５に示される構成に限定されず、任意の構成を採用することができる。現実的には、図１４に示される製造設備３０に配置される複数のＰＬＣの間では、メーカおよび機種が統一されていないことが想定される。管理システム３０００において、中継サーバ装置３０８は、このようなＰＬＣのメーカおよび機種の相違を吸収する。

図１６は、図１４の収集解析サーバ装置３の機能構成を示すブロック図である。図１６に示されるように、収集解析サーバ装置３は、エンコード部３００と、サンプリング部３３０と、デコード部３４０と、品質検査部３７０（推論部）とを備える。入力データ１０Ｃは、ＰＬＣ３０１～３０５からのセンサ時系列データを含む。エンコード部３００、サンプリング部３３０、デコード部３４０、および学習部３５０は、ＶＡＥ（Variational Autoencoder）を形成している。

エンコード部３００は、エンコーダモデルＭｃを含む。エンコーダモデルＭｃは、入力データ１０Ｃに含まれるセンサ間の相関関係を表すグラフ構造を入力データ１０Ｃから抽出する。エンコード部３００は、センサ時系列データから当該グラフ構造の頂点である複数のセンサの各々の特徴量を抽出する。エンコード部３００は、複数の頂点に含まれる２つの頂点の間に辺が存在する尤度を算出し、当該尤度を成分とする隣接行列をサンプリング部３３０に出力する。

サンプリング部３３０は、エンコード部３００からの隣接行列に対してＧｕｍｂｅｌ－Ｓｏｆｔｍａｘ関数を用いた再パラメータ化トリックを行い、グラフ構造Ｇｓを決定して、グラフ構造Ｇｓおよびグラフ構造Ｇｓの複数の頂点の各々の特徴量をデコード部３４０および品質検査部３７０に出力する。

デコード部３４０は、デコーダモデルＭｄを含む。デコーダモデルＭｄは、グラフ構造Ｇｓおよび当該特徴量から出力データ２０Ｃを再生する。

品質検査部３７０は、品質検査モデルＭｍを含む。品質検査モデルＭｍは、グラフ構造Ｇｓおよび当該特徴量に基づいて製品の品質を表す品質データを算出する。品質検査部３７０は、たとえばＧＮＮを含む。品質検査部３７０は、当該品質データと基準品質データとの誤差をグラフ構造Ｇｓにおいて可視化する。基準品質データとは、正常な製品に対応する標準的な品質データである。品質データと基準品質データとの誤差が大きいほど、当該品質データに含まれる不具合の程度が大きい。当該誤差のグラフ構造Ｇｓにおける可視化の方法としては、たとえばＧｒａｄＣＡＭ（Gradient-weighted Class Activation Mapping）を用いた当該誤差のヒートマップ化を挙げることができる。

学習部３５０は、バックプロパゲーションによって、品質検査モデルＭｍ、デコーダモデルＭｄ、およびエンコーダモデルＭｃの各々に含まれるニューラルネットワークのパラメータを最適化する。当該パラメータには、当該ニューラルネットワークの重みおよびバイアスが含まれる。バックプロパゲーションにおける最小化対象の損失関数は、出力データ２０Ｃと入力データ１０Ｃ（正解データ）との誤差、および品質検査部３７０の検査結果と学習データセットに含まれる正解品質データとの誤差を含む。すなわち、学習部３５０は、品質検査部３７０、デコード部３４０、エンコード部３００に対して半教師あり学習を行う。具体的には、学習部３５０は、デコード部３４０およびエンコード部３００に対しては教師なし学習を行い、品質検査部３７０に対しては教師あり学習を行う。

収集解析サーバ装置３の主目的は、品質検査部３７０による検査結果の出力である。エンコード部３００、サンプリング部３３０、デコード部３４０、および学習部３５０によって形成されるＶＡＥの最適化は、入力データ１０Ｃからグラフ構造へのロスレス圧縮を実現するためのサブタスクとして位置付けられる。

図１７は、図１４の収集解析サーバ装置３のハードウェア構成を示すブロック図である。図１７に示されるように、収集解析サーバ装置３は、演算処理部であるプロセッサ３１と、記憶部としてのメインメモリ３２およびハードディスク３３と、入力インターフェイス３４と、表示コントローラ３５と、通信インターフェイス３６と、データリーダ／ライタ３８とを含む。これらの各部は、バス３９を介して、互いにデータ通信可能に接続される。

プロセッサ３１は、ＣＰＵ（Central Processing Unit）を含む。プロセッサ３１は、ＧＰＵ（Graphics Processing Unit）をさらに含んでもよい。プロセッサ３１は、ハードディスク３３に格納されたプログラム（コード）をメインメモリ３２に展開して、これらを所定順序で実行することで、各種の演算を実施する。

メインメモリ３２は、典型的には、ＤＲＡＭ（Dynamic Random Access Memory）などの揮発性の記憶装置である。メインメモリ３２は、ハードディスク３３から読み出されたプログラムを保持する。

入力インターフェイス３４は、プロセッサ３１と入力部３６１との間のデータ伝送を仲介する。入力部３６１は、たとえば、マウス、キーボード、またはタッチパネルを含む。すなわち、入力インターフェイス３４は、ユーザが入力部３６１を操作することで与えられる操作指令を受付ける。

表示コントローラ３５は、表示装置の典型例であるディスプレイ３６２と接続され、プロセッサ３１における画像処理の結果などをユーザに通知する。すなわち、表示コントローラ３５は、ディスプレイ３６２に接続され、ディスプレイ３６２での表示を制御する。ディスプレイ３６２は、たとえば液晶ディスプレイ、有機ＥＬ（Electro Luminescence）ディスプレイ、またはその他の表示装置である。

通信インターフェイス３６は、プロセッサ３１と他の外部装置との間のインターネットを介するデータ伝送を仲介する。通信インターフェイス３６は、典型的には、イーサネット（登録商標）、またはＵＳＢ（Universal Serial Bus）を含む。

データリーダ／ライタ３８は、プロセッサ３１と記録媒体であるメモリカード３６３との間のデータ伝送を仲介する。メモリカード３６３には、たとえば、収集解析サーバ装置３において実行されるプログラムが格納されている。データリーダ／ライタ３８は、メモリカード３６３からプログラムを読み出す。なお、メモリカード３６３は、ＣＦ（Compact Flash）、ＳＤ（Secure Digital）などの汎用的な半導体記憶デバイスや、フレキシブルディスク（Flexible Disk）などの磁気記憶媒体や、ＣＤ－ＲＯＭ（Compact Disk Read Only Memory）などの光学記憶媒体等からなる。なお、収集解析サーバ装置３には、必要に応じて、プリンタなどの他の出力装置が接続されてもよい。

ハードディスク３３は、不揮発性の磁気記憶装置である。ハードディスク３３には、学習データセットＤｓ、品質検査モデルＭｍ、エンコーダモデルＭｃ、デコーダモデルＭｄ、機械学習プログラムＰｇ１、および品質検査プログラムＰｇ２が保存されている。ハードディスク３３には、各種設定値などが格納されてもよい。なお、ハードディスク３３に加えて、あるいは、ハードディスク３３に代えて、フラッシュメモリなどの半導体記憶装置を採用してもよい。

学習データセットＤｓは、複数の学習データを含む。複数の学習データの各々は、製品が通過した複数の工程の各々のセンサによる検出値の時系列データ、および当該製品の品質に対応する正解品質データの組み合わせである。

機械学習プログラムＰｇ１において、学習データセットＤｓ、エンコーダモデルＭｃ、デコーダモデルＭｄ、および品質検査モデルＭｍが参照される。機械学習プログラムＰｇ１を実行するプロセッサ３１によって、図１６のエンコード部３００、サンプリング部３３０、デコード部３４０、学習部３５０、および品質検査部３７０が実現される。プロセッサ３１は、機械学習プログラムＰｇ１を実行することによって、エンコーダモデルＭｃ、デコーダモデルＭｄ、および品質検査モデルＭｍの各々を学習済みに適合する。

品質検査プログラムＰｇ２において、エンコーダモデルＭｃおよび品質検査モデルＭｍが参照される。プロセッサ３１は、品質検査プログラムＰｇ２を実行することによって、製品に対応するセンサ時系列データから当該製品の品質データを算出し、当該品質データと基準品質データとの誤差をグラフ構造Ｇｓにおいて可視化する。当該誤差のグラフ構造Ｇｓにおいて可視化された当該誤差は、ディスプレイ３６２および端末装置３０９に出力される。

図１８は、品質データおよび基準品質データの誤差とともに可視化されたグラフ構造Ｇｓの一例を示す図である。図１８において、頂点Ｓｎ_１～Ｓｎ_５は、図１４の工程Ｐｒ_１～Ｐｒ_５のそれぞれに設けられたセンサに対応する。ハッチングが濃い頂点ほど、当該頂点に対応するセンサの検出値が正常値から乖離していることを示す。

図１８に示されるように、頂点Ｓｎ_３は、Ｓｎ_１，Ｓｎ_２，Ｓｎ_４に接続されている。頂点Ｓｎ_５は、頂点Ｓｎ_２に接続されている。頂点Ｓｎ_２が最も濃く、頂点Ｓｎ_１，Ｓｎ_４が最も薄い。頂点Ｓｎ_２とＳｎ_３とを接続する辺および頂点Ｓｎ_２とＳｎ_５とを接続する辺は、他の辺よりも太く強調されている。誤差が可視化されたグラフ構造Ｇｓは、複数のセンサの検出値の相関関係を表しているとともに、製品に含まれる不具合（品質データと基準品質データとの誤差）に寄与しているセンサの検出値を示している。図１８において、製品に含まれる不具合に最も寄与しているセンサの検出値は、頂点Ｓｎ_２に対応する工程Ｐｒ_２に設けられたセンサの検出値である。そのため、工程Ｐｒ_２に不具合が発生している可能性が高い。また、グラフ構造Ｇｓにおいて頂点Ｓｎ_２に接続されている頂点Ｓｎ_３，Ｓｎ_５にそれぞれ対応する工程Ｐｒ_３，Ｐｒ_５においても、工程Ｐｒ_２に次いで不具合が発生している可能性がある。頂点Ｓｎ_１，Ｓｎ_４にそれぞれ対応する工程Ｐｒ_１，Ｐｒ_４においては、不具合が発生している可能性が最も低い。誤差が可視化されたグラフ構造Ｇｓによれば、複数の工程を経て完成された製品に含まれる不具合の発生原因となる工程を容易に特定することができる。

以上、実施の形態３に係る情報処理装置および機械学習方法によれば、入力データからグラフ構造を中間表現として抽出するモデルの精度を向上させることができる。

［実施の形態に係る情報処理装置および機械学習方法の他の適用例］
実施の形態に係る情報処理装置および機械学習方法は、人流予測に基づくルートプランニングに適用可能である。図１９は、実施の形態に係る情報処理装置に対応するロボットＲｂによるルートプランニングを説明するための図である。図１９に示されるように、ロボットＲｂの視野には、通行人Ｐｓ１，Ｐｓ２，Ｐｓ３が含まれている。通行人Ｐｓ１は、通行人Ｐｓ２を見ている。通行人Ｐｓ２は、通行人Ｐｓ３を見ている。通行人Ｐｓ３は、通行人Ｐｓ２を見ている。ロボットＲｂは、時系列データである視野動画に含まれる通行人Ｐｓ１～Ｐｓ３の各々の姿勢、視線方向、および通行人Ｐｓ１～Ｐｓ３の相対位置関係等に基づいて通行人Ｐｓ１～Ｐｓ３の各々を頂点とする有向グラフ構造を抽出する。

図２０は、図１９のロボットＲｂによって抽出される有向グラフ構造Ｐｆを示す図である。図１９において頂点Ｖｘ_１，Ｖｘ_２，Ｖｘ_３は、図１９の通行人Ｐｓ_１，Ｐｓ_２，Ｐｓ_３にそれぞれ対応する。図２０に示されるように、頂点Ｖｘ_１と頂点Ｖｘ_２とは、頂点Ｖｘ_１からＶｘ_２に向かう辺Ｅｇ_１によって接続されている。頂点Ｖｘ_２と頂点Ｖｘ_３とは、頂点Ｖｘ_２からＶｘ_３に向かう辺Ｅｇ_２および頂点Ｖｘ_３からＶｘ_２に向かう辺Ｅｇ_３によって接続されている。

図２１は、図２０の有向グラフ構造Ｐｆに対応する行列表現を示す図である。ロボットＲｂは、図２１に示される有向グラフ構造Ｐｆを推論部に入力して、通行人Ｐｓ_１～Ｐｓ_３に対する人流予測を行い、通行人Ｐｓ_１～Ｐｓ_３を回避可能な図１９のルートＲｔを計画する。当該推論部は、たとえばＳｏｃｉａｌＧＡＮ（Generative Adversarial Network）を含む。

実施の形態に係る情報処理装置および機械学習方法は、交通渋滞の予測にも適用可能である。交通渋滞の予測に当たっては、道路によって接続されている複数の地点における時刻毎の交通量を時系列の入力データとして、当該入力データから各時刻における複数の地点の各々を頂点とし、異なる時刻に亘る２地点間の交通量の関係性を辺とするグラフ構造が抽出される。すなわち、時刻毎の複数の地点を頂点集合の部分集合とするＮ部グラフマッチングの結果として入力データからグラフ構造が抽出される。情報処理装置は、当該グラフ構造に基づいて、特定時刻における各地点の交通渋滞を予測する。

実施の形態に係る情報処理装置および機械学習方法は、マテリアルズ・インフォマティクス（ＭＩ：Materials Informatics）にも適用可能である。マテリアルズ・インフォマティクスへの適用例においては、入力データから抽出されたグラフ構造の頂点および辺を分子構造の原子および結合に対応させて、当該分子構造の物性が推定される。

＜付記＞
上述したような実施の形態は、以下のような技術思想を含む。

（構成１）
入力データ（１０，１０Ｂ，１０Ｃ）に含まれる要素間の相関関係を表すグラフ構造（Ｔｒ，Ｂｐ，Ｇｓ，Ｐｆ）を前記入力データ（１０，１０Ｂ，１０Ｃ）から抽出し、前記グラフ構造（Ｔｒ，Ｂｐ，Ｇｓ，Ｐｆ）から出力データ（２０，２０Ｂ，２０Ｃ）を生成する情報処理装置（１，１Ａ，２，３）であって、
前記入力データ（１０，１０Ｂ，１０Ｃ）から前記グラフ構造（Ｔｒ，Ｂｐ，Ｇｓ，Ｐｆ）に含まれる複数の頂点（Ｌｆ_１～Ｌｆ_４，Ｎｄ_１～Ｎｄ_４，Ｕｓ_１～Ｕｓ_４，Ｃｍ_１～Ｃｍ_５，Ｓｎ_１～Ｓｎ_５，Ｖｘ_１～Ｖｘ_３）の各々の特徴量（Θ，Φ，Ω，Γ）を抽出し、当該頂点に前記相関関係を表す辺（Ｂｒ_１～Ｂｒ_７，Ｒｓ_１～Ｒｓ_４，Ｅｇ_１～Ｅｇ_３）が接続されている尤度を算出するエンコード部（１００，２００，３００）と、
前記尤度に対するＧｕｍｂｅｌ－Ｓｏｆｔｍａｘ関数の変換結果に基づいて、前記グラフ構造（Ｔｒ，Ｂｐ，Ｇｓ，Ｐｆ）を決定するサンプリング部（１３０，２３０，３３０）と、
前記グラフ構造（Ｔｒ，Ｂｐ，Ｇｓ，Ｐｆ）、および前記特徴量（Θ，Φ，Ω，Γ）を受けて前記出力データ（２０，２０Ｂ，２０Ｃ）を生成するデコード部（１４０，２４０，３４０）と、
前記出力データ（２０，２０Ｂ，２０Ｃ）と正解データとの誤差（Ｌ_Ｐ）を含む損失関数を最小化対象とするバックプロパゲーションによって、前記デコード部（１４０，２４０，３４０）および前記エンコード部（１００，２００，３００）を最適化する学習部（１５０，２５０，３５０）とを備える、情報処理装置（１，１Ａ，２，３）。

（構成２）
前記出力データ（１０）から前記グラフ構造（Ｔｒ）を再構成する再構成部（１６０）をさらに備え、
前記損失関数は、前記再構成部（１６０）からの出力と正解グラフ構造との誤差（Ｌ_Ｒ）を含む、構成１に記載の情報処理装置（１Ａ）。

（構成３）
前記サンプリング部（２３０，３３０）から前記グラフ構造（Ｂｐ，Ｇｓ）を受けて、前記入力データ（１０Ｂ，１０Ｃ）に対する推論結果を出力する推論部（２７０，３７０）をさらに備え、
前記学習部（２５０，３５０）は、前記デコード部（２４０，３４０）および前記エンコード部（１００，２００）に対しては教師なし学習を行い、前記推論部（２７０，３７０）に対しては教師あり学習を行う、構成１または２に記載の情報処理装置（２，３）。

（構成４）
前記入力データ（１０）は、第１データ（１１）および第２データ（１２）を含み、
前記第１データ（１１）のモダリティは、前記第２データ（１２）のモダリティとは異なり、
前記エンコード部（１００）は、
前記第１データ（１１）の特徴量（Θ，Φ）を抽出する第１エンコーダ（１１０）と、
前記第２データ（１２）の特徴量（Γ）を抽出する第２エンコーダ（１２０）とを含む、構成１～３のいずれかに記載の情報処理装置（１，１Ａ）。

（構成５）
前記出力データ（２０）のモダリティは、前記入力データ（１０）のモダリティとは異なる、構成１～４のいずれかに記載の情報処理装置（１，１Ａ）。

（構成６）
入力データ（１０，１０Ｂ，１０Ｃ）に含まれる要素間の相関関係を表すグラフ構造（Ｔｒ，Ｂｐ，Ｇｓ，Ｐｆ）を前記入力データ（１０，１０Ｂ，１０Ｃ）から抽出し、前記グラフ構造（Ｔｒ，Ｂｐ，Ｇｓ，Ｐｆ）から出力データ（２０，２０Ｂ，２０Ｃ）を生成するモデル（Ｍｃ，Ｍｄ）に対して、記憶部（３３）に保存された機械学習プログラム（Ｐｇ１）を実行するプロセッサ（３１）によって行われる機械学習方法であって、
前記入力データ（１０，１０Ｂ，１０Ｃ）から前記グラフ構造（Ｔｒ，Ｂｐ，Ｇｓ，Ｐｆ）に含まれる複数の頂点（Ｌｆ_１～Ｌｆ_４，Ｎｄ_１～Ｎｄ_４，Ｕｓ_１～Ｕｓ_４，Ｃｍ_１～Ｃｍ_５，Ｓｎ_１～Ｓｎ_５，Ｖｘ_１～Ｖｘ_３）の各々の特徴量（Θ，Φ，Ω，Γ）を抽出し、当該頂点に前記相関関係を表す辺（Ｂｒ_１～Ｂｒ_７，Ｒｓ_１～Ｒｓ_４，Ｅｇ_１～Ｅｇ_３）が接続されている尤度を算出するステップ（Ｓ１１，Ｓ１２）と、
前記尤度に対するＧｕｍｂｅｌ－Ｓｏｆｔｍａｘ関数の変換結果に基づいて、前記グラフ構造（Ｔｒ，Ｂｐ，Ｇｓ，Ｐｆ）を決定するステップ（Ｓ１３）と、
前記グラフ構造（Ｔｒ，Ｂｐ，Ｇｓ，Ｐｆ）、および前記特徴量（Θ，Φ，Ω，Γ）を受けて前記出力データ（２０，２０Ｂ，２０Ｃ）を生成するステップ（Ｓ１４）と、
前記出力データ（２０，２０Ｂ，２０Ｃ）と正解データとの誤差（Ｌ_Ｐ）を含む損失関数を最小化対象とするバックプロパゲーションによって、前記モデル（Ｍｃ，Ｍｄ）を最適化するステップ（Ｓ１５）とを含む、機械学習方法。

今回開示された各実施の形態は、矛盾しない範囲で適宜組み合わされて実施されることも予定されている。今回開示された実施の形態はすべての点で例示であって制限的なものではないと考えられるべきである。本発明の範囲は上記した説明ではなくて特許請求の範囲によって示され、特許請求の範囲と均等の意味および範囲内でのすべての変更が含まれることが意図される。

１，１Ａ，２情報処理装置、３収集解析サーバ装置、１０，１０Ｂ，１０Ｃ入力データ、１１画像列データ、１２食材列データ、２０，２０Ｂ，２０Ｃ出力データ、３０製造設備、３１，３１２プロセッサ、３２メインメモリ、３３ハードディスク、３４入力インターフェイス、３５表示コントローラ、３６，３１８通信インターフェイス、３８データリーダ／ライタ、３９バス、１００，２００，３００エンコード部、１１０，１２０エンコーダ、１１１画像エンコーダ、１１４，１２４，１６３行列推定器、１２１分散表現器、１３０，１４３，２３０，３３０サンプリング部、１４０，２４０，３４０デコード部、１４２エンコーダデコーダモデル、１５０，１５０Ａ，２５０，３５０学習部、１６０再構成部、２７０推論部、３０６ローカルネットワーク、３０７コンベア、３０８中継サーバ装置、３０９端末装置、３１０演算ユニット、３１４，３２４バスコントローラ、３１５センサ、３１６メモリ、３２０機能ユニット、３２２モジュール、３２６内部バス、３６１入力部、３６２ディスプレイ、３６３メモリカード、３７０品質検査部、３０００管理システム、Ｂｐ２部グラフ構造、Ｂｒ_１～Ｂｒ_７枝、Ｃｍ_１～Ｃｍ_５企業、Ｄｓ学習データセット、Ｅｇ_１～Ｅｇ_３，Ｒｓ_１～Ｒｓ_４辺、Ｇｓグラフ構造、Ｉｍ_１～Ｉｍ_４画像、Ｌ_Ｐ，Ｌ_Ｒ，Ｌ_Ｔ損失関数、Ｌｆ_１～Ｌｆ_４リーフノード、Ｍｃエンコーダモデル、Ｍｄデコーダモデル、Ｍｍ品質検査モデル、Ｎｄ_１～Ｎｄ_４ノード、Ｐｆ有向グラフ構造、Ｐｇ１機械学習プログラム、Ｐｇ２品質検査プログラム、Ｐｒ_１～Ｐｒ_５工程、Ｐｓ_１～Ｐｓ_３通行人、Ｒｂロボット、Ｒｔルート、Ｓｂ_１，Ｓｂ_２部分集合、Ｓｎ_１～Ｓｎ_５，Ｖｘ_１～Ｖｘ_３頂点、Ｓｔ_１～Ｓｔ_４，Ｔｘ_１～Ｔｘ_４文字列、Ｔｒツリー構造、Ｕｓ_１～Ｕｓ_４ユーザ。

Claims

入力データに含まれる要素間の相関関係を表すグラフ構造を前記入力データから抽出し、前記グラフ構造から出力データを生成する情報処理装置であって、
前記入力データから前記グラフ構造に含まれる複数の頂点の各々の特徴量を抽出し、当該頂点に前記相関関係を表す辺が接続されている尤度を算出するエンコード部と、
前記尤度に対するＧｕｍｂｅｌ－Ｓｏｆｔｍａｘ関数の変換結果に基づいて、前記グラフ構造を決定するサンプリング部と、
前記グラフ構造、および前記特徴量を受けて前記出力データを生成するデコード部と、
前記出力データと正解データとの誤差を含む損失関数を最小化対象とするバックプロパゲーションによって、前記デコード部および前記エンコード部を最適化する学習部とを備える、情報処理装置。
前記出力データから前記グラフ構造を再構成する再構成部をさらに備え、
前記損失関数は、前記再構成部からの出力と正解グラフ構造との誤差を含む、請求項１に記載の情報処理装置。
前記サンプリング部から前記グラフ構造を受けて、前記入力データに対する推論結果を出力する推論部をさらに備え、
前記学習部は、前記デコード部および前記エンコード部に対しては教師なし学習を行い、前記推論部に対しては教師あり学習を行う、請求項１または２に記載の情報処理装置。
前記入力データは、第１データおよび第２データを含み、
前記第１データのモダリティは、前記第２データのモダリティとは異なり、
前記エンコード部は、
前記第１データの特徴量を抽出する第１エンコーダと、
前記第２データの特徴量を抽出する第２エンコーダとを含む、請求項１～３のいずれか１項に記載の情報処理装置。
前記出力データのモダリティは、前記入力データのモダリティとは異なる、請求項１～４のいずれか１項に記載の情報処理装置。
入力データに含まれる要素間の相関関係を表すグラフ構造を前記入力データから抽出し、前記グラフ構造から出力データを生成するモデルに対して、記憶部に保存された機械学習プログラムを実行するプロセッサによって行われる機械学習方法であって、
前記入力データから前記グラフ構造に含まれる複数の頂点の各々の特徴量を抽出し、当該頂点に前記相関関係を表す辺が接続されている尤度を算出するステップと、
前記尤度に対するＧｕｍｂｅｌ－Ｓｏｆｔｍａｘ関数の変換結果に基づいて、前記グラフ構造を決定するステップと、
前記グラフ構造、および前記特徴量を受けて前記出力データを生成するステップと、
前記出力データと正解データとの誤差を含む損失関数を最小化対象とするバックプロパゲーションによって、前記モデルを最適化するステップとを含む、機械学習方法。