JP2020166442A

JP2020166442A - 情報処理装置、算出方法および算出プログラム

Info

Publication number: JP2020166442A
Application number: JP2019064979A
Authority: JP
Inventors: 和輝小山; Kazuki Koyama; 知範泉谷; Tomonori Izumitani; 恵介切通; Keisuke Kiritoshi
Original assignee: NTT Communications Corp
Current assignee: NTT Communications Corp
Priority date: 2019-03-28
Filing date: 2019-03-28
Publication date: 2020-10-08

Abstract

【課題】どの時間点までの時系列データが重要であるかを容易に把握すること。【解決手段】情報処理装置１０は、処理対象に関する時系列データを取得し、取得された時系列データから所定の時間幅の時系列データを切り出すことによって得られる、時間幅がそれぞれ異なる複数の時系列データをそれぞれグループとして設定し、グループごとに、時系列データを入力値として利用するモデルの出力値に対する重要度に関するスコアを算出する。【選択図】図１

Description

本発明は、情報処理装置、算出方法および算出プログラムに関する。

従来、工場、プラント等のセンサ等の時系列データ（プロセスデータ）を用いた異常の予測に関連する技術として、過去に収集したプロセスデータに基づいて未来の予測や異常の検知など目的の出力を推定する方法が提案されている。

このような方法において、例えば、数値計算の過程で、解析者が事前に設定した説明変数のグループ情報に基づいて適当な制約を設けることで、推定解に対して本質的でない説明変数をグループ単位で比較して削ぎ落とす統計的推定手法（Group Lasso）が知られている。

このような説明変数を事前に設定されたグループ情報に基づいて比較して、グループ単位でスパースな解（本質的でないパラメータの推定解を０とした解）を得る手法を用いることで、解析者の事前情報を計算モデルに組み込むことができる。現実のセンサデータにはノイズが少なからず含まれるが、このように事前情報を組み込むことで推定解のノイズ頑強性の向上が期待できる。

R. Tibshirani, "Regression Shrinkage and Selection via the Lasso." Journal of the Royal Statistical Society. Series B (Methodological), Vol. 58, No. 1, pp. 267-288, 1996. M. Yuan and Y. Lin. "Model selection and estimation in regression with grouped variables." Journal of the Royal Statistical Society: Series B (Statistical Methodology), Vol. 68, pp. 49-67, 2006. N. Shervashidze and F. Bach. "Learning the structure for structured sparsity." IEEE Transactions for Signal Processing, Vol. 63, No. 18, pp. 4894-4902, 2015.

しかしながら、従来の手法では、どの時間点までの時系列データが重要であるかを容易に把握することができないという課題があった。例えば、上述したような従来の手法において、個々のセンサの時間遅れを考慮したグループの様々な組み合わせのうち、どのグループが重要であるかを知ることは容易でない。シンプルな解決策としては、全ての考えうるグループ情報を個々に入力して、出力された予測値を比較することが考えられるが、このような手法は計算量に組合せ爆発の危険性を含んでいるので、現実的な時間で実行可能とは言い難い。

上述した課題を解決し、目的を達成するために、本発明の情報処理装置は、処理対象に関する時系列データを取得する取得部と、前記取得部によって取得された時系列データから所定の時間幅の時系列データを切り出すことによって得られる、時間幅がそれぞれ異なる複数の時系列データをそれぞれグループとして設定し、前記グループごとに、前記時系列データを入力値として利用するモデルの出力値に対する重要度に関するスコアを算出する算出部とを有することを特徴とする。

また、本発明の算出方法は、情報処理装置によって実行される算出方法であって、処理対象に関する時系列データを取得する取得工程と、前記取得工程によって取得された時系列データから所定の時間幅の時系列データを切り出すことによって得られる、時間幅がそれぞれ異なる複数の時系列データをそれぞれグループとして設定し、前記グループごとに、前記時系列データを入力値として利用するモデルの出力値に対する重要度に関するスコアを算出する算出工程とを含んだことを特徴とする。

また、本発明の算出プログラムは、処理対象に関する時系列データを取得する取得ステップと、前記取得ステップによって取得された時系列データから所定の時間幅の時系列データを切り出すことによって得られる、時間幅がそれぞれ異なる複数の時系列データをそれぞれグループとして設定し、前記グループごとに、前記時系列データを入力値として利用するモデルの出力値に対する重要度に関するスコアを算出する算出ステップとをコンピュータに実行させることを特徴とする。

本発明によれば、どの時間点までの時系列データが重要であるかを容易に把握することができるという効果を奏する。

図１は、第１の実施形態に係る情報処理装置の構成例を示すブロック図である。図２は、情報処理装置によって実行される異常予測処理の概要を説明する図である。図３は、説明変数とパラメータとノイズから目的変数を計算する処理を説明する図である。図４は、計算モデルに入力する時系列データのグループ情報について説明する図である。図５は、個々のプロセスデータについて、各グループの不適切度からどの時間の分析窓までが重要かを評価する場合について説明する図である。図６は、プロセスデータ全体を俯瞰することで、プロセスデータの目的関数に対する影響を評価する場合について説明する図である。図７は、各説明変数における各グループの不適切度を示すグラフの表示例について説明する図である。図８は、各プロセスデータにおける各グループの不適切度を示すヒートマップを例示する図である。図９は、パラメータの推定解と真の値との誤差を表示する処理を説明する図である。図１０は、パラメータの推定解の誤差と従来のGroup Lassoの誤差とを比較して表示する処理を説明する図である。図１１は、第１の実施形態に係る情報処理装置における算出処理の流れの一例を示すフローチャートである。図１２は、第１の実施形態と従来手法との推定解の算出方法の違いを説明する図である。図１３は、算出プログラムを実行するコンピュータを示す図である。

以下に、本願に係る情報処理装置、算出方法および算出プログラムの実施の形態を図面に基づいて詳細に説明する。なお、この実施の形態により本願に係る情報処理装置、算出方法および算出プログラムが限定されるものではない。

［第１の実施形態］
以下の実施の形態では、第１の実施形態に係る情報処理装置１０の構成、情報処理装置１０の処理の流れを順に説明し、最後に第１の実施形態による効果を説明する。

［情報処理装置の構成］
まず、図１を用いて、情報処理装置１０の構成を説明する。図１は、第１の実施形態に係る情報処理装置の構成例を示すブロック図である。情報処理装置１０は、例えば、工場やプラントなどの監視対象設備に設置されるセンサによって取得された複数のデータを収集し、収集された複数のデータを入力として、監視対象設備の異常を予測するための学習済モデル（計算モデル）を用いて、監視対象設備の異常度であるフレーム異常評価値を出力値として出力する。

例えば、情報処理装置１０は、センサデータ等の多変量時系列データ（プロセスデータ）が与えられたときに、時間方向に一定の幅Ｍｍａｘを持つ分析窓でプロセスデータを切り取り、この切り取った分析窓からＮステップ後の特定のセンサ等の値を効果的に予測する。ここで情報処理装置１０は、時間方向に一定の幅で切り取ったデータを用いて説明変数を作ることで、時系列データの時間遅れを考慮した推定を行う。

また、情報処理装置１０は、各センサの時系列データについて、それぞれ異なる時間幅の時系列データごとに、出力値に対する重要度に関するスコアを算出する。ここで重要度とは、各入力が出力に対してどれだけ寄与したかを示すものとする。なお、以下の説明では、不適切度（非重要度）を算出する場合を例に説明する。不適切度（非重要度）とは、絶対値が大きいほど、その入力は出力に対する影響度が低く、絶対値が小さいほど、その入力は出力に対する影響度が高いことを意味する。

ここで、図２を用いて、情報処理装置１０によって実行される異常予測処理の概要を説明する図である。図２は、情報処理装置によって実行される異常予測処理の概要を説明する図である。

図２では、プラント内の反応炉や装置などにセンサや運転用の信号などを収集するデバイスが取り付けられ、一定時間毎にデータを収集していることを図示している。そして、図２では、プロセスデータを項目（プロセス）ごとにプロットしたものを図示しており、情報処理装置１０は、分析窓（網掛けされた部分）のデータを切り出し、一定時間後の特定の項目（１つまたは複数）を予測する。

例えば、情報処理装置１０は、プロセスデータから切り出された分析窓内の数値に基づき、監視対象設備の異常度合いを評価するための予測値を算出する。図２の下部には、情報処理装置１０により一定時間ごとに算出される予測値をプロットしたものを図示している。プラントなどに導入する場合は、このプロットを用いて将来の状態を予測すること、あるいは予測値が予め設定した値域を外れた場合にアラームを発する異常検知などへの活用が期待される。

図１に示すように、この情報処理装置１０は、通信処理部１１、制御部１２および記憶部１３を有する。以下に情報処理装置１０が有する各部の処理を説明する。

通信処理部１１は、接続される装置との間でやり取りする各種情報に関する通信を制御する。また、記憶部１３は、制御部１２による各種処理に必要なデータおよびプログラムを格納し、プロセスデータ記憶部１３ａ、グループ情報記憶部１３ｂおよび重要度情報記憶部１３ｃを有する。例えば、記憶部１３は、ＲＡＭ（Random Access Memory）、フラッシュメモリ（Flash Memory）等の半導体メモリ素子等の記憶装置である。

プロセスデータ記憶部１３ａは、取得部１２ａによって取得されたプロセスデータを記憶する。例えば、プロセスデータ記憶部１３ａには、プロセスデータとして、少なくとも、所定の時間幅のフレーム分の最新のプロセスデータが格納されている。

グループ情報記憶部１３ｂは、学習済モデル（計算モデル）に入力する時系列データのグループ情報を記憶する。例えば、グループ情報記憶部１３ｂは、説明変数（センサ）ごとに、時系列データからそれぞれ異なる時間幅の時系列データを切り出してグループを設定するためのグループ情報を記憶する。なお、グループ情報の具体例については、後に図４を用いて説明する。

重要度情報記憶部１３ｃは、算出部１２ｄによって算出された重要度に関するスコアを記憶する。例えば、重要度情報記憶部１３ｃは、算出部１２ｄによって算出された各センサについての各グループの不適切度を記憶する。

制御部１２は、各種の処理手順などを規定したプログラムおよび所要データを格納するための内部メモリを有し、これらによって種々の処理を実行する。例えば、制御部１２は、取得部１２ａ、前処理部１２ｂ、予測部１２ｃ、算出部１２ｄおよび出力部１２ｅを有する。ここで、制御部１２は、例えば、ＣＰＵ（Central Processing Unit）やＭＰＵ（Micro Processing Unit）、ＧＰＵ（Graphical Processing Unit）などの電子回路やＡＳＩＣ（Application Specific Integrated Circuit）やＦＰＧＡ（Field Programmable Gate Array）などの集積回路である。

取得部１２ａは、監視対象設備に関する時系列データを取得する。例えば、取得部１２ａは、工場やプラントなどの監視対象設備に設置されるセンサから多変量時系列の数値データを定期的（例えば、１分ごと）に受信し、プロセスデータ記憶部１３ａに格納する。ここでセンサが取得するデータとは、例えば、監視対象設備である工場、プラント内の装置や反応炉についての温度や圧力、音、振動等の各種データである。なお、センサによって取得された時系列のデータを、以下では適宜プロセスデータと記載する。また、取得部１２ａが取得するデータはセンサが取得したデータに限定されるものではなく、例えば、人的に入力された数値データ等でもよい。

前処理部１２ｂは、取得部１２ａによって取得された時系列データに所定の前処理を行って、時系列データを加工する。例えば、前処理部１２ｂは、所定幅のプロセスデータを切り出し、切り出した幅のプロセスデータに含まれる各値について、センサごとに代表値（平均値）を算出するようにしてもよい。なお、前処理部１２ｂの処理は省略してもよい。

予測部１２ｃは、取得部１２ａによって取得された時系列データを入力として、監視対象設備の状態を予測するための学習済モデルを用いて、所定の出力値を出力する。例えば、予測部１２ｃは、前処理部１２ｂによって時系列データが加工された場合には、加工された時系列データを学習済モデルに入力し、予め設定された一定時間後の監視対象設備の状態を予測する。ここで、予測部１２ｃは、例えば、取得部１２ａによって取得された各センサの時系列データを入力として、後述する算出部１２ｄがもとめた最適なグループ情報を加味した計算モデルを用いて、監視対象設備の状態を予測する。なお、予測部１２ｃが使用する計算モデルはどのようなモデルであってもよく、また、予測する手法もどのような手法であってもよい。

以下では、予測部１２ｃが予測したい予測値を「目的変数」、目的変数を算出するためのセンサの時系列データの値を「説明変数」として説明する。ここで、図３の例を用いて、説明変数とパラメータとノイズから目的変数を計算する処理を説明する。図３は、説明変数とパラメータの推定解とノイズから目的変数を計算する処理を説明する図である。図３に例示するように、予測部１２ｃは、説明変数をある一定の時間幅Ｍｍａｘをもつ分析窓で切り取り、この分析窓内のデータから時間遅れを考慮して抽出された複数の値を用いて、Ｎステップ後の目的変数を予測する。図３に例示するように、例えば、予測部１２ｃは、説明変数の各要素に、対応する要素のパラメータの推定解を乗じた値の和をとり、所定のノイズを加算することで目的変数を計算する。なお、説明変数から目的変数を計算する手法はどのような手法であってもよく、これに限定されるものではない。

算出部１２ｄは、取得部１２ａによって取得された時系列データから所定の時間幅の時系列データを切り出すことによって得られる、それぞれ異なる時間幅の時系列データをそれぞれグループとして設定し、グループごとに、時系列データを入力値として利用するモデルの出力値に対する重要度に関するスコアを算出する。例えば、算出部１２ｄは、取得部１２ａによって取得された各センサの時系列データについて、グループ情報記憶部１３ｂに記憶されたグループ情報に従って、それぞれ異なる時間幅の時系列データをそれぞれグループとして設定し、それぞれ異なる時間幅の時系列データごとに、出力値に対する不適切度（非重要度）を算出する。また、算出部１２ｄは、算出した不適切度を基に、所望のパラメータの推定解や最適解のグループ情報を推定するようにしてもよい。

また、算出部１２ｄは、例えば、時間幅が異なる時系列データとして、出力値の予測時点に最も近い時点までの第一の時間幅の時系列データと、出力値の予測時点に最も近い時点までの第一の時間幅よりも長い第二の時間幅の時系列データとを少なくとも含み、第一の時間幅の時系列データおよび第二の時間幅の時系列データごとに、出力値に対する重要度に関するスコアを算出する。

ここで、図４を用いて、計算モデルに入力する時系列データのグループ情報について説明する。図４は、計算モデルに入力する時系列データのグループ情報について説明する図である。計算モデルに入力する時系列データのグループ情報の構造である。

グループ情報は、個々の説明変数に対して、Ｇ１〜Ｇ？のグループで構成される。例えば、図４に例示されるように、これは目的変数に時間的に近い方が影響が強いという時系列解析における仮説に基づいて、例えば説明変数Ｃ１４にはＧ１：目的変数に最近傍の説明変数のみ、Ｇ２：目的変数に最近傍〜２番目までの説明変数、Ｇ３：目的変数に最近傍〜３番目までの説明変数、・・・といったように順次オーバーラッピングするような構造を持ったグループ情報を与えて各グループの不適切度を算出する。これを注目したい説明変数、あるいは全ての説明変数（図４の例ではＣ１１、Ｃ１２、Ｃ１３、Ｃ１５）について同様に与えて推定を行う。なお、グループ情報は、図４に例示したものに限定されるものではない。

このように事前に設定したグループ情報を入力することで、次のような２つの解釈を同時に得ることが可能である。例えば、図５に例示するように、個々のプロセスデータに注目した結果で、説明変数Ｃ１４ではグループＧ３の不適切度が小さい、つまりＣ１４はＧ３のグループが最も重要であると解釈することができる。すなわち、説明変数Ｃ１４については、目的変数に最近傍〜３番目までの時点の情報が説明に影響しており、言い換えれば時間幅４番目以降の情報はあまり影響が少ないことが読み取れる。本実施形態の手法では、このような情報を、注目する他の説明変数（例えばここではＣ１１、Ｃ１２、Ｃ１３、Ｃ１５）についても、組合せ爆発を回避して一括して入手することができる。

さらに図６に例示するように、ある説明変数に関するグループが、全て不適切と推定された場合、当該説明変数は全体的に目的変数の説明に寄与しないと考えることができる。例えばＣ１５に属する全てのグループの不適切度が発散、つまりこれらのグループは全て不適切と推定された場合、他のＣ１３やＣ１４などと比較してＣ１５はどの時間遅れも削ぎ落とされると考えることができ、実際得られる推定解もＣ１５に属する説明変数は全て０に縮退した、スパースな推定解を得ることができる。

このように、情報処理装置１０は、全体的にセンサごとの重要度を比較することと、個々のセンサ内でどの時間点の分析窓までが重要かという２点を、同時に俯瞰的に比較、評価することでき、解析者が容易に解釈可能な推定結果を得ることができる。

出力部１２ｅは、算出部１２ｄによって算出された重要度に関するスコアを用いて、画像データを生成して画像データ出力する。例えば、出力部１２ｅは、算出部１２ｄによって算出された各グループの不適切度を重要度情報記憶部１３ｃから読み出し、棒グラフやヒートマップの画像を作成して出力する。また、出力部１２ｅは、予測部１２ｃによって予測された予測結果を出力するようにしてもよい。なお、出力部１２ｅは、情報処理装置１０が有する画面等に出力して表示してもよいし、情報処理装置１０と接続する端末装置に出力して、端末装置の画面に表示するようにしてもよい。

図７は、各説明変数における各グループの不適切度を示すグラフの表示例について説明する図である。図７に例示するように、出力部１２ｅは、説明変数Ｃ１１〜Ｃ１５について、各グループの不適切度を示す棒グラフを表示する。図７の例では、説明変数Ｃ１１について、「−４〜０［ｓｔｅｐ］」のグループの不適切度が最も低いことから、目的変数に時間的に近い４ステップ分の時系列データが正しい、つまり、目的変数への影響が強いと解釈することができる。これは、目的変数に時間的に近い方が影響が強いという時系列解析における仮説に基づいている。また、図７の例では、説明変数Ｃ１５について、全てのグループの不適切度が高いことから、説明変数Ｃ１５全体的に目的変数に寄与していないと考えることができる。

図８は、各プロセスデータにおける各グループの不適切度を示すヒートマップを例示する図である。図８に例示するように、出力部１２ｅは、説明変数Ｃ１１〜Ｃ１５について、各グループの不適切度の高低を濃淡で表現するヒートマップを出力するようにしてもよい。このように、出力部１２ｅが、上述した出力結果を表示することで、個々のセンサの時間遅れを考慮したグループの様々な組み合わせのうち、どのグループが重要であるかを容易に把握することが可能である。情報処理装置１０では、このような出力結果を基に、例えば、前述の予測部１２ｃに適用するグループ情報を自動または手動により最適化し、最適化されたグループ情報を適用した学習済みモデルで予測処理を行うことが可能である。例えば、不適切なグループに属するパラメータは学習済みモデル内では０に縮退し予測推定に加味しないようにする。上述の図７の例を挙げて説明すると、説明変数Ｃ１５がすべて不適切であった場合には、Ｃ１５に属するパラメータは全て（限りなく）０と推定する。また、図７に例示するように、説明変数Ｃ１２について「−５〜０［ｓｔｅｐ］」が最も適切である場合には、説明変数Ｃ１２に属するパラメータは−１［ｓｔｅｐ］、−２［ｓｔｅｐ］・・・−５［ｓｔｅｐ］は非０の値を推定し、それ以降の−６［ｓｔｅｐ］は（限りなく）０と推定する。このように、情報処理装置１０では、最適なグループ情報を用いた予測処理を行うことができるので、計算量の組み合わせ爆発を抑制し、現実的な時間で実行可能とすることが可能である。また、情報処理装置１０は、このような学習済みモデルを用いれば、得られたグループ情報の重要度を加味した目的変数の予測が可能であり、より精度の良い予測が可能である。

なお、出力部１２ｅは、各グループの不適切度に関する画面データだけでなく、その他のデータを出力するようにしてもよい。例えば、出力部１２ｅは、図９に例示するように、各グループの推定解と今回用いたパラメータとの差分の絶対値（absolute value：ａｂｓ）を誤差として求め、絶対値の高低を表現するヒートマップを出力するようにしてもよい。つまり、今回用いたパラメータとは、真の値であり、各グループの推定解と今回用いたパラメータとの差が大きいほど、誤差が大きく精度が落ちていると評価でき、各グループの推定解と今回用いたパラメータとの差が小さいほど、誤差が小さく精度が落ちていないと評価できる。

また、例えば、出力部１２ｅは、図１０に例示するように、本実施形態における各グループの推定解と今回用いたパラメータとの誤差と、従来のGroup Lassoと今回用いたパラメータとの誤差をそれぞれ求め、両者の誤差の大きさを比較し比較結果を基にヒートマップを作成して出力するようにしてもよい。例えば、出力部１２ｅは、本実施形態の方がより誤差が大きい場合には、赤色（図１０の例では、点線）で表示し、従来のGroup Lassoの方が誤差が大きい場合には、青色（図１０の例では、斜線）で表示し、誤差が大きいほど濃く、誤差が小さいほど薄くなるようなヒートマップを出力するようにしてもよい。これにより、例えば、パラメータ推定において、本実施形態と従来のGroup Lassoの制度の差を把握させることが可能である。つまり、ヒートマップにおいて、青の方が数、スケール共に大きければ、本実施形態の方が従来のGroup Lassoよりもパラメータ推定で優勢であることが分かる。

このように、情報処理装置１０は、重要度の平均値の時系列変化を動画として再生することで、重要度の遷移が明確に可視化されるだけでなく、細かく動くノイズの影響を低減することが可能である。

［情報処理装置の処理手順］
次に、図１１を用いて、第１の実施形態に係る情報処理装置１０による処理手順の例を説明する。図１１は、第１の実施形態に係る情報処理装置における算出処理の流れの一例を示すフローチャートである。

図１１に例示するように、情報処理装置１０は、センサ等が測定した測定データを計算モデルに入力し（ステップＳ１０１）、比較したい説明変数のグループ情報を計算モデルに入力する（ステップＳ１０２）。

そして、情報処理装置１０は、尤度が大きくなるように計算モデルのパラメータを更新し（ステップＳ１０３）、所定の終了条件を満たすか判定する（ステップＳ１０４）。この結果、情報処理装置１０は、所定の終了条件を満たしていないと判定した場合には（ステップＳ１０４否定）、ステップＳ１０３に戻り、所定の終了条件を満たすまで計算モデルのパラメータを更新する処理を繰り返す。

また、情報処理装置１０は、所定の終了条件を満たすと判定した場合には（ステップＳ１０４肯定）、説明変数の推定解とグループ毎の重要度に関する情報とを得る（ステップＳ１０５）。

［第１の実施形態の効果］
第１の実施形態に係る情報処理装置１０は、処理対象に関する時系列データを取得し、取得された時系列データから所定の時間幅の時系列データを切り出すことによって得られる、時間幅がそれぞれ異なる複数の時系列データをそれぞれグループとして設定し、グループごとに、時系列データを入力値として利用するモデルの出力値に対する重要度に関するスコアを算出する。このため、情報処理装置１０は、どの時間点までの時系列データが重要であるかを容易に把握することが可能である。例えば、個々のセンサの時間遅れを考慮したグループの様々な組み合わせのうち、どのグループが重要であるかを容易に把握することができる。

また、従来のGroup Lassoの統計的な性質として、ある説明変数が重複して複数のグループに属している場合、当該グループのうちどれか１つのグループが削ぎ落とされると、残りのグループが削ぎ落とされなくても、この説明変数は０と推定されてしまう。結果として、削ぎ落とされなかったグループ内に、上記のような推定解が０の説明変数と、通常の非０の説明変数が混在することになる。これは解析者の視点に立ってみると、グループ自体が削ぎ落とされなかったことで、このグループは重要と解釈できる一方で、そのグループ内でいくつかの推定解が欠けている状態であるため、解釈性の意味からも非常に不都合が多い。

第１の実施形態に係る情報処理装置１０では、Group Lassoに潜在変数とベイズ推定を組み込んだ手法を応用し、特に時系列データにおいて、時間の連続性や自己相関などを考慮したグループ情報の候補を一括して入力することで、従来の問題点を解決する。

ここで、図１２を用いて、最も想定されうる従来法であるGroup Lassoでは、本実施形態のようなグループ情報を入力してもうまく推定できないことを説明する。図１２は、第１の実施形態と従来手法との推定解の算出方法の違いを説明する図である。Group Lassoではグループ情報に重複がある場合、当該説明変数は各グループ内において同じ変数が組み込まれる。例えば、説明変数Ｃ２はグループＡ１にもグループＡ２にも重複して属しているが、いずれのグループ内においてもＣ２のまま組み込まれている。

これでは例えばグループＡ２が０に縮退するときに、Ａ２に属する全ての説明変数は０に縮退するので、当然Ｃ２も０に縮退してしまう。しかし、グループＡ１は重要なグループであると、つまりグループＡ１が０に縮退せず生き残ったときに、これではグループＡ１は生き残ったにも関わらず、その中の説明変数Ｃ２は０に縮退してしまったという、解釈困難な結果になる。

一方、本実施形態では通常のGroup Lassoに潜在変数とベイズ推定の枠組みを取り入れた手法を用いることで、この問題を回避している。この手法では通常のGroup Lassoとは異なり、各説明変数はグループごとに別々の複数の潜在変数が設定されており、最終的な推定解は関連する説明変数の総和で与えられる。例えばＣ２はグループＡ１においては「νＡ１，２」、グループＡ２においては「νＡ２，２」と別々の変数でグループ構造に組み込まれ、最終的な推定解はＣ２＝νＡ１，２＋νＡ２，２で与えられる。これにより、先ほどと同様の状況でグループＡ２が０に縮退したとしても、「νＡ２，２」が０に縮退するのみで、グループＡ１の「νＡ１，２」は非０の値で残ることになる。つまり、Ｃ２自体としては非０の値となり推定解として解釈可能な自然なものとなる。よって本実施形態のような重複のあるグループ情報を入力しても、適切な推定解を得ることができる。

本実施形態は、時系列データに内在する自己相関などを考慮した分析における精度の向上に効果を発揮する。例えば、分析窓を更に時間方向のフレームに分割する手法については、全体的にセンサごとの重要度を比較することと、個々のセンサ内でどの時間点の分析窓までが重要かという２点を、同時に俯瞰的に比較、評価でき、解析者が容易に解釈可能な推定結果を得ることができる。さらに、本実施形態のようなグループ情報の候補を入力することで、計算の組合せ爆発も回避することができ、上記のような俯瞰的な推定解を現実的な時間で得ることが可能である。

［システム構成等］
また、図示した各装置の各構成要素は機能概念的なものであり、必ずしも物理的に図示の如く構成されていることを要しない。すなわち、各装置の分散・統合の具体的形態は図示のものに限られず、その全部または一部を、各種の負荷や使用状況などに応じて、任意の単位で機能的または物理的に分散・統合して構成することができる。さらに、各装置にて行なわれる各処理機能は、その全部または任意の一部が、ＣＰＵやＧＰＵおよび当該ＣＰＵやＧＰＵにて解析実行されるプログラムにて実現され、あるいは、ワイヤードロジックによるハードウェアとして実現され得る。

また、本実施の形態において説明した各処理のうち、自動的におこなわれるものとして説明した処理の全部または一部を手動的におこなうこともでき、あるいは、手動的におこなわれるものとして説明した処理の全部または一部を公知の方法で自動的におこなうこともできる。この他、上記文書中や図面中で示した処理手順、制御手順、具体的名称、各種のデータやパラメータを含む情報については、特記する場合を除いて任意に変更することができる。

［プログラム］
また、上記実施形態において説明した情報処理装置が実行する処理をコンピュータが実行可能な言語で記述したプログラムを作成することもできる。例えば、実施形態に係る情報処理装置１０が実行する処理をコンピュータが実行可能な言語で記述した算出プログラムを作成することもできる。この場合、コンピュータが算出プログラムを実行することにより、上記実施形態と同様の効果を得ることができる。さらに、かかる算出プログラムをコンピュータ読み取り可能な記録媒体に記録して、この記録媒体に記録された算出プログラムをコンピュータに読み込ませて実行することにより上記実施形態と同様の処理を実現してもよい。

図１３は、算出プログラムを実行するコンピュータを示す図である。図１３に例示するように、コンピュータ１０００は、例えば、メモリ１０１０と、ＣＰＵ１０２０と、ハードディスクドライブインタフェース１０３０と、ディスクドライブインタフェース１０４０と、シリアルポートインタフェース１０５０と、ビデオアダプタ１０６０と、ネットワークインタフェース１０７０とを有し、これらの各部はバス１０８０によって接続される。

メモリ１０１０は、図１３に例示するように、ＲＯＭ（Read Only Memory）１０１１及びＲＡＭ１０１２を含む。ＲＯＭ１０１１は、例えば、ＢＩＯＳ（Basic Input Output System）等のブートプログラムを記憶する。ハードディスクドライブインタフェース１０３０は、図１３に例示するように、ハードディスクドライブ１０９０に接続される。ディスクドライブインタフェース１０４０は、図１３に例示するように、ディスクドライブ１１００に接続される。例えば磁気ディスクや光ディスク等の着脱可能な記憶媒体が、ディスクドライブ１１００に挿入される。シリアルポートインタフェース１０５０は、図１３に例示するように、例えばマウス１１１０、キーボード１１２０に接続される。ビデオアダプタ１０６０は、図１３に例示するように、例えばディスプレイ１１３０に接続される。

ここで、図１３に例示するように、ハードディスクドライブ１０９０は、例えば、ＯＳ１０９１、アプリケーションプログラム１０９２、プログラムモジュール１０９３、プログラムデータ１０９４を記憶する。すなわち、上記の、算出プログラムは、コンピュータ１０００によって実行される指令が記述されたプログラムモジュールとして、例えばハードディスクドライブ１０９０に記憶される。

また、上記実施形態で説明した各種データは、プログラムデータとして、例えばメモリ１０１０やハードディスクドライブ１０９０に記憶される。そして、ＣＰＵ１０２０が、メモリ１０１０やハードディスクドライブ１０９０に記憶されたプログラムモジュール１０９３やプログラムデータ１０９４を必要に応じてＲＡＭ１０１２に読み出し、各種処理手順を実行する。

なお、算出プログラムに係るプログラムモジュール１０９３やプログラムデータ１０９４は、ハードディスクドライブ１０９０に記憶される場合に限られず、例えば着脱可能な記憶媒体に記憶され、ディスクドライブ等を介してＣＰＵ１０２０によって読み出されてもよい。あるいは、算出プログラムに係るプログラムモジュール１０９３やプログラムデータ１０９４は、ネットワーク（ＬＡＮ（Local Area Network）、ＷＡＮ（Wide Area Network）等）を介して接続された他のコンピュータに記憶され、ネットワークインタフェース１０７０を介してＣＰＵ１０２０によって読み出されてもよい。

上記の実施形態やその変形は、本願が開示する技術に含まれると同様に、特許請求の範囲に記載された発明とその均等の範囲に含まれるものである。

１０情報処理装置
１１通信処理部
１２制御部
１２ａ取得部
１２ｂ前処理部
１２ｃ予測部
１２ｄ算出部
１２ｅ出力部
１３記憶部
１３ａプロセスデータ記憶部
１３ｂグループ情報記憶部
１３ｃ重要度情報記憶部

Claims

処理対象に関する時系列データを取得する取得部と、
前記取得部によって取得された時系列データから所定の時間幅の時系列データを切り出すことによって得られる、時間幅がそれぞれ異なる複数の時系列データをそれぞれグループとして設定し、前記グループごとに、前記時系列データを入力値として利用するモデルの出力値に対する重要度に関するスコアを算出する算出部と
を有することを特徴とする情報処理装置。
前記算出部は、前記時間幅が異なる時系列データとして、前記出力値の予測時点に最も近い時点までの第一の時間幅の時系列データと、前記出力値の予測時点に最も近い時点までの前記第一の時間幅よりも長い第二の時間幅の時系列データとを少なくとも含み、前記第一の時間幅の時系列データおよび前記第二の時間幅の時系列データをそれぞれグループとして設定し、前記グループごとに、前記出力値に対する重要度に関するスコアを算出することを特徴とする請求項１に記載の情報処理装置。
前記算出部によって算出された前記出力値に対する重要度に関するスコアを用いて、画像データを生成して画像データ出力する出力部をさらに有することを特徴とする請求項１に記載の情報処理装置。
前記取得部によって取得された時系列データを入力として、前記処理対象の状態を予測するための学習済モデルを用いて、所定の出力値を出力する予測部をさらに有することを特徴とする請求項１に記載の情報処理装置。
情報処理装置によって実行される算出方法であって、
処理対象に関する時系列データを取得する取得工程と、
前記取得工程によって取得された時系列データから所定の時間幅の時系列データを切り出すことによって得られる、時間幅がそれぞれ異なる複数の時系列データをそれぞれグループとして設定し、前記グループごとに、前記時系列データを入力値として利用するモデルの出力値に対する重要度に関するスコアを算出する算出工程と
を含んだことを特徴とする算出方法。
処理対象に関する時系列データを取得する取得ステップと、
前記取得ステップによって取得された時系列データから所定の時間幅の時系列データを切り出すことによって得られる、時間幅がそれぞれ異なる複数の時系列データをそれぞれグループとして設定し、前記グループごとに、前記時系列データを入力値として利用するモデルの出力値に対する重要度に関するスコアを算出する算出ステップと
をコンピュータに実行させることを特徴とする算出プログラム。