JP2020166442A - 情報処理装置、算出方法および算出プログラム - Google Patents

情報処理装置、算出方法および算出プログラム Download PDF

Info

Publication number
JP2020166442A
JP2020166442A JP2019064979A JP2019064979A JP2020166442A JP 2020166442 A JP2020166442 A JP 2020166442A JP 2019064979 A JP2019064979 A JP 2019064979A JP 2019064979 A JP2019064979 A JP 2019064979A JP 2020166442 A JP2020166442 A JP 2020166442A
Authority
JP
Japan
Prior art keywords
time
series data
calculation
information processing
group
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2019064979A
Other languages
English (en)
Inventor
和輝 小山
Kazuki Koyama
和輝 小山
知範 泉谷
Tomonori Izumitani
知範 泉谷
恵介 切通
Keisuke Kiritoshi
恵介 切通
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NTT Communications Corp
Original Assignee
NTT Communications Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NTT Communications Corp filed Critical NTT Communications Corp
Priority to JP2019064979A priority Critical patent/JP2020166442A/ja
Publication of JP2020166442A publication Critical patent/JP2020166442A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

【課題】どの時間点までの時系列データが重要であるかを容易に把握すること。【解決手段】情報処理装置10は、処理対象に関する時系列データを取得し、取得された時系列データから所定の時間幅の時系列データを切り出すことによって得られる、時間幅がそれぞれ異なる複数の時系列データをそれぞれグループとして設定し、グループごとに、時系列データを入力値として利用するモデルの出力値に対する重要度に関するスコアを算出する。【選択図】図1

Description

本発明は、情報処理装置、算出方法および算出プログラムに関する。
従来、工場、プラント等のセンサ等の時系列データ(プロセスデータ)を用いた異常の予測に関連する技術として、過去に収集したプロセスデータに基づいて未来の予測や異常の検知など目的の出力を推定する方法が提案されている。
このような方法において、例えば、数値計算の過程で、解析者が事前に設定した説明変数のグループ情報に基づいて適当な制約を設けることで、推定解に対して本質的でない説明変数をグループ単位で比較して削ぎ落とす統計的推定手法(Group Lasso)が知られている。
このような説明変数を事前に設定されたグループ情報に基づいて比較して、グループ単位でスパースな解(本質的でないパラメータの推定解を0とした解)を得る手法を用いることで、解析者の事前情報を計算モデルに組み込むことができる。現実のセンサデータにはノイズが少なからず含まれるが、このように事前情報を組み込むことで推定解のノイズ頑強性の向上が期待できる。
R. Tibshirani, "Regression Shrinkage and Selection via the Lasso." Journal of the Royal Statistical Society. Series B (Methodological), Vol. 58, No. 1, pp. 267-288, 1996. M. Yuan and Y. Lin. "Model selection and estimation in regression with grouped variables." Journal of the Royal Statistical Society: Series B (Statistical Methodology), Vol. 68, pp. 49-67, 2006. N. Shervashidze and F. Bach. "Learning the structure for structured sparsity." IEEE Transactions for Signal Processing, Vol. 63, No. 18, pp. 4894-4902, 2015.
しかしながら、従来の手法では、どの時間点までの時系列データが重要であるかを容易に把握することができないという課題があった。例えば、上述したような従来の手法において、個々のセンサの時間遅れを考慮したグループの様々な組み合わせのうち、どのグループが重要であるかを知ることは容易でない。シンプルな解決策としては、全ての考えうるグループ情報を個々に入力して、出力された予測値を比較することが考えられるが、このような手法は計算量に組合せ爆発の危険性を含んでいるので、現実的な時間で実行可能とは言い難い。
上述した課題を解決し、目的を達成するために、本発明の情報処理装置は、処理対象に関する時系列データを取得する取得部と、前記取得部によって取得された時系列データから所定の時間幅の時系列データを切り出すことによって得られる、時間幅がそれぞれ異なる複数の時系列データをそれぞれグループとして設定し、前記グループごとに、前記時系列データを入力値として利用するモデルの出力値に対する重要度に関するスコアを算出する算出部とを有することを特徴とする。
また、本発明の算出方法は、情報処理装置によって実行される算出方法であって、処理対象に関する時系列データを取得する取得工程と、前記取得工程によって取得された時系列データから所定の時間幅の時系列データを切り出すことによって得られる、時間幅がそれぞれ異なる複数の時系列データをそれぞれグループとして設定し、前記グループごとに、前記時系列データを入力値として利用するモデルの出力値に対する重要度に関するスコアを算出する算出工程とを含んだことを特徴とする。
また、本発明の算出プログラムは、処理対象に関する時系列データを取得する取得ステップと、前記取得ステップによって取得された時系列データから所定の時間幅の時系列データを切り出すことによって得られる、時間幅がそれぞれ異なる複数の時系列データをそれぞれグループとして設定し、前記グループごとに、前記時系列データを入力値として利用するモデルの出力値に対する重要度に関するスコアを算出する算出ステップとをコンピュータに実行させることを特徴とする。
本発明によれば、どの時間点までの時系列データが重要であるかを容易に把握することができるという効果を奏する。
図1は、第1の実施形態に係る情報処理装置の構成例を示すブロック図である。 図2は、情報処理装置によって実行される異常予測処理の概要を説明する図である。 図3は、説明変数とパラメータとノイズから目的変数を計算する処理を説明する図である。 図4は、計算モデルに入力する時系列データのグループ情報について説明する図である。 図5は、個々のプロセスデータについて、各グループの不適切度からどの時間の分析窓までが重要かを評価する場合について説明する図である。 図6は、プロセスデータ全体を俯瞰することで、プロセスデータの目的関数に対する影響を評価する場合について説明する図である。 図7は、各説明変数における各グループの不適切度を示すグラフの表示例について説明する図である。 図8は、各プロセスデータにおける各グループの不適切度を示すヒートマップを例示する図である。 図9は、パラメータの推定解と真の値との誤差を表示する処理を説明する図である。 図10は、パラメータの推定解の誤差と従来のGroup Lassoの誤差とを比較して表示する処理を説明する図である。 図11は、第1の実施形態に係る情報処理装置における算出処理の流れの一例を示すフローチャートである。 図12は、第1の実施形態と従来手法との推定解の算出方法の違いを説明する図である。 図13は、算出プログラムを実行するコンピュータを示す図である。
以下に、本願に係る情報処理装置、算出方法および算出プログラムの実施の形態を図面に基づいて詳細に説明する。なお、この実施の形態により本願に係る情報処理装置、算出方法および算出プログラムが限定されるものではない。
[第1の実施形態]
以下の実施の形態では、第1の実施形態に係る情報処理装置10の構成、情報処理装置10の処理の流れを順に説明し、最後に第1の実施形態による効果を説明する。
[情報処理装置の構成]
まず、図1を用いて、情報処理装置10の構成を説明する。図1は、第1の実施形態に係る情報処理装置の構成例を示すブロック図である。情報処理装置10は、例えば、工場やプラントなどの監視対象設備に設置されるセンサによって取得された複数のデータを収集し、収集された複数のデータを入力として、監視対象設備の異常を予測するための学習済モデル(計算モデル)を用いて、監視対象設備の異常度であるフレーム異常評価値を出力値として出力する。
例えば、情報処理装置10は、センサデータ等の多変量時系列データ(プロセスデータ)が与えられたときに、時間方向に一定の幅Mmaxを持つ分析窓でプロセスデータを切り取り、この切り取った分析窓からNステップ後の特定のセンサ等の値を効果的に予測する。ここで情報処理装置10は、時間方向に一定の幅で切り取ったデータを用いて説明変数を作ることで、時系列データの時間遅れを考慮した推定を行う。
また、情報処理装置10は、各センサの時系列データについて、それぞれ異なる時間幅の時系列データごとに、出力値に対する重要度に関するスコアを算出する。ここで重要度とは、各入力が出力に対してどれだけ寄与したかを示すものとする。なお、以下の説明では、不適切度(非重要度)を算出する場合を例に説明する。不適切度(非重要度)とは、絶対値が大きいほど、その入力は出力に対する影響度が低く、絶対値が小さいほど、その入力は出力に対する影響度が高いことを意味する。
ここで、図2を用いて、情報処理装置10によって実行される異常予測処理の概要を説明する図である。図2は、情報処理装置によって実行される異常予測処理の概要を説明する図である。
図2では、プラント内の反応炉や装置などにセンサや運転用の信号などを収集するデバイスが取り付けられ、一定時間毎にデータを収集していることを図示している。そして、図2では、プロセスデータを項目(プロセス)ごとにプロットしたものを図示しており、情報処理装置10は、分析窓(網掛けされた部分)のデータを切り出し、一定時間後の特定の項目(1つまたは複数)を予測する。
例えば、情報処理装置10は、プロセスデータから切り出された分析窓内の数値に基づき、監視対象設備の異常度合いを評価するための予測値を算出する。図2の下部には、情報処理装置10により一定時間ごとに算出される予測値をプロットしたものを図示している。プラントなどに導入する場合は、このプロットを用いて将来の状態を予測すること、あるいは予測値が予め設定した値域を外れた場合にアラームを発する異常検知などへの活用が期待される。
図1に示すように、この情報処理装置10は、通信処理部11、制御部12および記憶部13を有する。以下に情報処理装置10が有する各部の処理を説明する。
通信処理部11は、接続される装置との間でやり取りする各種情報に関する通信を制御する。また、記憶部13は、制御部12による各種処理に必要なデータおよびプログラムを格納し、プロセスデータ記憶部13a、グループ情報記憶部13bおよび重要度情報記憶部13cを有する。例えば、記憶部13は、RAM(Random Access Memory)、フラッシュメモリ(Flash Memory)等の半導体メモリ素子等の記憶装置である。
プロセスデータ記憶部13aは、取得部12aによって取得されたプロセスデータを記憶する。例えば、プロセスデータ記憶部13aには、プロセスデータとして、少なくとも、所定の時間幅のフレーム分の最新のプロセスデータが格納されている。
グループ情報記憶部13bは、学習済モデル(計算モデル)に入力する時系列データのグループ情報を記憶する。例えば、グループ情報記憶部13bは、説明変数(センサ)ごとに、時系列データからそれぞれ異なる時間幅の時系列データを切り出してグループを設定するためのグループ情報を記憶する。なお、グループ情報の具体例については、後に図4を用いて説明する。
重要度情報記憶部13cは、算出部12dによって算出された重要度に関するスコアを記憶する。例えば、重要度情報記憶部13cは、算出部12dによって算出された各センサについての各グループの不適切度を記憶する。
制御部12は、各種の処理手順などを規定したプログラムおよび所要データを格納するための内部メモリを有し、これらによって種々の処理を実行する。例えば、制御部12は、取得部12a、前処理部12b、予測部12c、算出部12dおよび出力部12eを有する。ここで、制御部12は、例えば、CPU(Central Processing Unit)やMPU(Micro Processing Unit)、GPU(Graphical Processing Unit)などの電子回路やASIC(Application Specific Integrated Circuit)やFPGA(Field Programmable Gate Array)などの集積回路である。
取得部12aは、監視対象設備に関する時系列データを取得する。例えば、取得部12aは、工場やプラントなどの監視対象設備に設置されるセンサから多変量時系列の数値データを定期的(例えば、1分ごと)に受信し、プロセスデータ記憶部13aに格納する。ここでセンサが取得するデータとは、例えば、監視対象設備である工場、プラント内の装置や反応炉についての温度や圧力、音、振動等の各種データである。なお、センサによって取得された時系列のデータを、以下では適宜プロセスデータと記載する。また、取得部12aが取得するデータはセンサが取得したデータに限定されるものではなく、例えば、人的に入力された数値データ等でもよい。
前処理部12bは、取得部12aによって取得された時系列データに所定の前処理を行って、時系列データを加工する。例えば、前処理部12bは、所定幅のプロセスデータを切り出し、切り出した幅のプロセスデータに含まれる各値について、センサごとに代表値(平均値)を算出するようにしてもよい。なお、前処理部12bの処理は省略してもよい。
予測部12cは、取得部12aによって取得された時系列データを入力として、監視対象設備の状態を予測するための学習済モデルを用いて、所定の出力値を出力する。例えば、予測部12cは、前処理部12bによって時系列データが加工された場合には、加工された時系列データを学習済モデルに入力し、予め設定された一定時間後の監視対象設備の状態を予測する。ここで、予測部12cは、例えば、取得部12aによって取得された各センサの時系列データを入力として、後述する算出部12dがもとめた最適なグループ情報を加味した計算モデルを用いて、監視対象設備の状態を予測する。なお、予測部12cが使用する計算モデルはどのようなモデルであってもよく、また、予測する手法もどのような手法であってもよい。
以下では、予測部12cが予測したい予測値を「目的変数」、目的変数を算出するためのセンサの時系列データの値を「説明変数」として説明する。ここで、図3の例を用いて、説明変数とパラメータとノイズから目的変数を計算する処理を説明する。図3は、説明変数とパラメータの推定解とノイズから目的変数を計算する処理を説明する図である。図3に例示するように、予測部12cは、説明変数をある一定の時間幅Mmaxをもつ分析窓で切り取り、この分析窓内のデータから時間遅れを考慮して抽出された複数の値を用いて、Nステップ後の目的変数を予測する。図3に例示するように、例えば、予測部12cは、説明変数の各要素に、対応する要素のパラメータの推定解を乗じた値の和をとり、所定のノイズを加算することで目的変数を計算する。なお、説明変数から目的変数を計算する手法はどのような手法であってもよく、これに限定されるものではない。
算出部12dは、取得部12aによって取得された時系列データから所定の時間幅の時系列データを切り出すことによって得られる、それぞれ異なる時間幅の時系列データをそれぞれグループとして設定し、グループごとに、時系列データを入力値として利用するモデルの出力値に対する重要度に関するスコアを算出する。例えば、算出部12dは、取得部12aによって取得された各センサの時系列データについて、グループ情報記憶部13bに記憶されたグループ情報に従って、それぞれ異なる時間幅の時系列データをそれぞれグループとして設定し、それぞれ異なる時間幅の時系列データごとに、出力値に対する不適切度(非重要度)を算出する。また、算出部12dは、算出した不適切度を基に、所望のパラメータの推定解や最適解のグループ情報を推定するようにしてもよい。
また、算出部12dは、例えば、時間幅が異なる時系列データとして、出力値の予測時点に最も近い時点までの第一の時間幅の時系列データと、出力値の予測時点に最も近い時点までの第一の時間幅よりも長い第二の時間幅の時系列データとを少なくとも含み、第一の時間幅の時系列データおよび第二の時間幅の時系列データごとに、出力値に対する重要度に関するスコアを算出する。
ここで、図4を用いて、計算モデルに入力する時系列データのグループ情報について説明する。図4は、計算モデルに入力する時系列データのグループ情報について説明する図である。計算モデルに入力する時系列データのグループ情報の構造である。
グループ情報は、個々の説明変数に対して、G1〜G?のグループで構成される。例えば、図4に例示されるように、これは目的変数に時間的に近い方が影響が強いという時系列解析における仮説に基づいて、例えば説明変数C14にはG1:目的変数に最近傍の説明変数のみ、G2:目的変数に最近傍〜2番目までの説明変数、G3:目的変数に最近傍〜3番目までの説明変数、・・・といったように順次オーバーラッピングするような構造を持ったグループ情報を与えて各グループの不適切度を算出する。これを注目したい説明変数、あるいは全ての説明変数(図4の例ではC11、C12、C13、C15)について同様に与えて推定を行う。なお、グループ情報は、図4に例示したものに限定されるものではない。
このように事前に設定したグループ情報を入力することで、次のような2つの解釈を同時に得ることが可能である。例えば、図5に例示するように、個々のプロセスデータに注目した結果で、説明変数C14ではグループG3の不適切度が小さい、つまりC14はG3のグループが最も重要であると解釈することができる。すなわち、説明変数C14については、目的変数に最近傍〜3番目までの時点の情報が説明に影響しており、言い換えれば時間幅4番目以降の情報はあまり影響が少ないことが読み取れる。本実施形態の手法では、このような情報を、注目する他の説明変数(例えばここではC11、C12、C13、C15)についても、組合せ爆発を回避して一括して入手することができる。
さらに図6に例示するように、ある説明変数に関するグループが、全て不適切と推定された場合、当該説明変数は全体的に目的変数の説明に寄与しないと考えることができる。例えばC15に属する全てのグループの不適切度が発散、つまりこれらのグループは全て不適切と推定された場合、他のC13やC14などと比較してC15はどの時間遅れも削ぎ落とされると考えることができ、実際得られる推定解もC15に属する説明変数は全て0に縮退した、スパースな推定解を得ることができる。
このように、情報処理装置10は、全体的にセンサごとの重要度を比較することと、個々のセンサ内でどの時間点の分析窓までが重要かという2点を、同時に俯瞰的に比較、評価することでき、解析者が容易に解釈可能な推定結果を得ることができる。
出力部12eは、算出部12dによって算出された重要度に関するスコアを用いて、画像データを生成して画像データ出力する。例えば、出力部12eは、算出部12dによって算出された各グループの不適切度を重要度情報記憶部13cから読み出し、棒グラフやヒートマップの画像を作成して出力する。また、出力部12eは、予測部12cによって予測された予測結果を出力するようにしてもよい。なお、出力部12eは、情報処理装置10が有する画面等に出力して表示してもよいし、情報処理装置10と接続する端末装置に出力して、端末装置の画面に表示するようにしてもよい。
図7は、各説明変数における各グループの不適切度を示すグラフの表示例について説明する図である。図7に例示するように、出力部12eは、説明変数C11〜C15について、各グループの不適切度を示す棒グラフを表示する。図7の例では、説明変数C11について、「−4〜0[step]」のグループの不適切度が最も低いことから、目的変数に時間的に近い4ステップ分の時系列データが正しい、つまり、目的変数への影響が強いと解釈することができる。これは、目的変数に時間的に近い方が影響が強いという時系列解析における仮説に基づいている。また、図7の例では、説明変数C15について、全てのグループの不適切度が高いことから、説明変数C15全体的に目的変数に寄与していないと考えることができる。
図8は、各プロセスデータにおける各グループの不適切度を示すヒートマップを例示する図である。図8に例示するように、出力部12eは、説明変数C11〜C15について、各グループの不適切度の高低を濃淡で表現するヒートマップを出力するようにしてもよい。このように、出力部12eが、上述した出力結果を表示することで、個々のセンサの時間遅れを考慮したグループの様々な組み合わせのうち、どのグループが重要であるかを容易に把握することが可能である。情報処理装置10では、このような出力結果を基に、例えば、前述の予測部12cに適用するグループ情報を自動または手動により最適化し、最適化されたグループ情報を適用した学習済みモデルで予測処理を行うことが可能である。例えば、不適切なグループに属するパラメータは学習済みモデル内では0に縮退し予測推定に加味しないようにする。上述の図7の例を挙げて説明すると、説明変数C15がすべて不適切であった場合には、C15に属するパラメータは全て(限りなく)0と推定する。また、図7に例示するように、説明変数C12について「−5〜0[step]」が最も適切である場合には、説明変数C12に属するパラメータは−1[step]、−2[step]・・・−5[step]は非0の値を推定し、それ以降の−6[step]は(限りなく)0と推定する。このように、情報処理装置10では、最適なグループ情報を用いた予測処理を行うことができるので、計算量の組み合わせ爆発を抑制し、現実的な時間で実行可能とすることが可能である。また、情報処理装置10は、このような学習済みモデルを用いれば、得られたグループ情報の重要度を加味した目的変数の予測が可能であり、より精度の良い予測が可能である。
なお、出力部12eは、各グループの不適切度に関する画面データだけでなく、その他のデータを出力するようにしてもよい。例えば、出力部12eは、図9に例示するように、各グループの推定解と今回用いたパラメータとの差分の絶対値(absolute value:abs)を誤差として求め、絶対値の高低を表現するヒートマップを出力するようにしてもよい。つまり、今回用いたパラメータとは、真の値であり、各グループの推定解と今回用いたパラメータとの差が大きいほど、誤差が大きく精度が落ちていると評価でき、各グループの推定解と今回用いたパラメータとの差が小さいほど、誤差が小さく精度が落ちていないと評価できる。
また、例えば、出力部12eは、図10に例示するように、本実施形態における各グループの推定解と今回用いたパラメータとの誤差と、従来のGroup Lassoと今回用いたパラメータとの誤差をそれぞれ求め、両者の誤差の大きさを比較し比較結果を基にヒートマップを作成して出力するようにしてもよい。例えば、出力部12eは、本実施形態の方がより誤差が大きい場合には、赤色(図10の例では、点線)で表示し、従来のGroup Lassoの方が誤差が大きい場合には、青色(図10の例では、斜線)で表示し、誤差が大きいほど濃く、誤差が小さいほど薄くなるようなヒートマップを出力するようにしてもよい。これにより、例えば、パラメータ推定において、本実施形態と従来のGroup Lassoの制度の差を把握させることが可能である。つまり、ヒートマップにおいて、青の方が数、スケール共に大きければ、本実施形態の方が従来のGroup Lassoよりもパラメータ推定で優勢であることが分かる。
このように、情報処理装置10は、重要度の平均値の時系列変化を動画として再生することで、重要度の遷移が明確に可視化されるだけでなく、細かく動くノイズの影響を低減することが可能である。
[情報処理装置の処理手順]
次に、図11を用いて、第1の実施形態に係る情報処理装置10による処理手順の例を説明する。図11は、第1の実施形態に係る情報処理装置における算出処理の流れの一例を示すフローチャートである。
図11に例示するように、情報処理装置10は、センサ等が測定した測定データを計算モデルに入力し(ステップS101)、比較したい説明変数のグループ情報を計算モデルに入力する(ステップS102)。
そして、情報処理装置10は、尤度が大きくなるように計算モデルのパラメータを更新し(ステップS103)、所定の終了条件を満たすか判定する(ステップS104)。この結果、情報処理装置10は、所定の終了条件を満たしていないと判定した場合には(ステップS104否定)、ステップS103に戻り、所定の終了条件を満たすまで計算モデルのパラメータを更新する処理を繰り返す。
また、情報処理装置10は、所定の終了条件を満たすと判定した場合には(ステップS104肯定)、説明変数の推定解とグループ毎の重要度に関する情報とを得る(ステップS105)。
[第1の実施形態の効果]
第1の実施形態に係る情報処理装置10は、処理対象に関する時系列データを取得し、取得された時系列データから所定の時間幅の時系列データを切り出すことによって得られる、時間幅がそれぞれ異なる複数の時系列データをそれぞれグループとして設定し、グループごとに、時系列データを入力値として利用するモデルの出力値に対する重要度に関するスコアを算出する。このため、情報処理装置10は、どの時間点までの時系列データが重要であるかを容易に把握することが可能である。例えば、個々のセンサの時間遅れを考慮したグループの様々な組み合わせのうち、どのグループが重要であるかを容易に把握することができる。
また、従来のGroup Lassoの統計的な性質として、ある説明変数が重複して複数のグループに属している場合、当該グループのうちどれか1つのグループが削ぎ落とされると、残りのグループが削ぎ落とされなくても、この説明変数は0と推定されてしまう。結果として、削ぎ落とされなかったグループ内に、上記のような推定解が0の説明変数と、通常の非0の説明変数が混在することになる。これは解析者の視点に立ってみると、グループ自体が削ぎ落とされなかったことで、このグループは重要と解釈できる一方で、そのグループ内でいくつかの推定解が欠けている状態であるため、解釈性の意味からも非常に不都合が多い。
第1の実施形態に係る情報処理装置10では、Group Lassoに潜在変数とベイズ推定を組み込んだ手法を応用し、特に時系列データにおいて、時間の連続性や自己相関などを考慮したグループ情報の候補を一括して入力することで、従来の問題点を解決する。
ここで、図12を用いて、最も想定されうる従来法であるGroup Lassoでは、本実施形態のようなグループ情報を入力してもうまく推定できないことを説明する。図12は、第1の実施形態と従来手法との推定解の算出方法の違いを説明する図である。Group Lassoではグループ情報に重複がある場合、当該説明変数は各グループ内において同じ変数が組み込まれる。例えば、説明変数C2はグループA1にもグループA2にも重複して属しているが、いずれのグループ内においてもC2のまま組み込まれている。
これでは例えばグループA2が0に縮退するときに、A2に属する全ての説明変数は0に縮退するので、当然C2も0に縮退してしまう。しかし、グループA1は重要なグループであると、つまりグループA1が0に縮退せず生き残ったときに、これではグループA1は生き残ったにも関わらず、その中の説明変数C2は0に縮退してしまったという、解釈困難な結果になる。
一方、本実施形態では通常のGroup Lassoに潜在変数とベイズ推定の枠組みを取り入れた手法を用いることで、この問題を回避している。この手法では通常のGroup Lassoとは異なり、各説明変数はグループごとに別々の複数の潜在変数が設定されており、最終的な推定解は関連する説明変数の総和で与えられる。例えばC2はグループA1においては「νA1,2」、グループA2においては「νA2,2」と別々の変数でグループ構造に組み込まれ、最終的な推定解はC2=νA1,2+νA2,2で与えられる。これにより、先ほどと同様の状況でグループA2が0に縮退したとしても、「νA2,2」が0に縮退するのみで、グループA1の「νA1,2」は非0の値で残ることになる。つまり、C2自体としては非0の値となり推定解として解釈可能な自然なものとなる。よって本実施形態のような重複のあるグループ情報を入力しても、適切な推定解を得ることができる。
本実施形態は、時系列データに内在する自己相関などを考慮した分析における精度の向上に効果を発揮する。例えば、分析窓を更に時間方向のフレームに分割する手法については、全体的にセンサごとの重要度を比較することと、個々のセンサ内でどの時間点の分析窓までが重要かという2点を、同時に俯瞰的に比較、評価でき、解析者が容易に解釈可能な推定結果を得ることができる。さらに、本実施形態のようなグループ情報の候補を入力することで、計算の組合せ爆発も回避することができ、上記のような俯瞰的な推定解を現実的な時間で得ることが可能である。
[システム構成等]
また、図示した各装置の各構成要素は機能概念的なものであり、必ずしも物理的に図示の如く構成されていることを要しない。すなわち、各装置の分散・統合の具体的形態は図示のものに限られず、その全部または一部を、各種の負荷や使用状況などに応じて、任意の単位で機能的または物理的に分散・統合して構成することができる。さらに、各装置にて行なわれる各処理機能は、その全部または任意の一部が、CPUやGPUおよび当該CPUやGPUにて解析実行されるプログラムにて実現され、あるいは、ワイヤードロジックによるハードウェアとして実現され得る。
また、本実施の形態において説明した各処理のうち、自動的におこなわれるものとして説明した処理の全部または一部を手動的におこなうこともでき、あるいは、手動的におこなわれるものとして説明した処理の全部または一部を公知の方法で自動的におこなうこともできる。この他、上記文書中や図面中で示した処理手順、制御手順、具体的名称、各種のデータやパラメータを含む情報については、特記する場合を除いて任意に変更することができる。
[プログラム]
また、上記実施形態において説明した情報処理装置が実行する処理をコンピュータが実行可能な言語で記述したプログラムを作成することもできる。例えば、実施形態に係る情報処理装置10が実行する処理をコンピュータが実行可能な言語で記述した算出プログラムを作成することもできる。この場合、コンピュータが算出プログラムを実行することにより、上記実施形態と同様の効果を得ることができる。さらに、かかる算出プログラムをコンピュータ読み取り可能な記録媒体に記録して、この記録媒体に記録された算出プログラムをコンピュータに読み込ませて実行することにより上記実施形態と同様の処理を実現してもよい。
図13は、算出プログラムを実行するコンピュータを示す図である。図13に例示するように、コンピュータ1000は、例えば、メモリ1010と、CPU1020と、ハードディスクドライブインタフェース1030と、ディスクドライブインタフェース1040と、シリアルポートインタフェース1050と、ビデオアダプタ1060と、ネットワークインタフェース1070とを有し、これらの各部はバス1080によって接続される。
メモリ1010は、図13に例示するように、ROM(Read Only Memory)1011及びRAM1012を含む。ROM1011は、例えば、BIOS(Basic Input Output System)等のブートプログラムを記憶する。ハードディスクドライブインタフェース1030は、図13に例示するように、ハードディスクドライブ1090に接続される。ディスクドライブインタフェース1040は、図13に例示するように、ディスクドライブ1100に接続される。例えば磁気ディスクや光ディスク等の着脱可能な記憶媒体が、ディスクドライブ1100に挿入される。シリアルポートインタフェース1050は、図13に例示するように、例えばマウス1110、キーボード1120に接続される。ビデオアダプタ1060は、図13に例示するように、例えばディスプレイ1130に接続される。
ここで、図13に例示するように、ハードディスクドライブ1090は、例えば、OS1091、アプリケーションプログラム1092、プログラムモジュール1093、プログラムデータ1094を記憶する。すなわち、上記の、算出プログラムは、コンピュータ1000によって実行される指令が記述されたプログラムモジュールとして、例えばハードディスクドライブ1090に記憶される。
また、上記実施形態で説明した各種データは、プログラムデータとして、例えばメモリ1010やハードディスクドライブ1090に記憶される。そして、CPU1020が、メモリ1010やハードディスクドライブ1090に記憶されたプログラムモジュール1093やプログラムデータ1094を必要に応じてRAM1012に読み出し、各種処理手順を実行する。
なお、算出プログラムに係るプログラムモジュール1093やプログラムデータ1094は、ハードディスクドライブ1090に記憶される場合に限られず、例えば着脱可能な記憶媒体に記憶され、ディスクドライブ等を介してCPU1020によって読み出されてもよい。あるいは、算出プログラムに係るプログラムモジュール1093やプログラムデータ1094は、ネットワーク(LAN(Local Area Network)、WAN(Wide Area Network)等)を介して接続された他のコンピュータに記憶され、ネットワークインタフェース1070を介してCPU1020によって読み出されてもよい。
上記の実施形態やその変形は、本願が開示する技術に含まれると同様に、特許請求の範囲に記載された発明とその均等の範囲に含まれるものである。
10 情報処理装置
11 通信処理部
12 制御部
12a 取得部
12b 前処理部
12c 予測部
12d 算出部
12e 出力部
13 記憶部
13a プロセスデータ記憶部
13b グループ情報記憶部
13c 重要度情報記憶部

Claims (6)

  1. 処理対象に関する時系列データを取得する取得部と、
    前記取得部によって取得された時系列データから所定の時間幅の時系列データを切り出すことによって得られる、時間幅がそれぞれ異なる複数の時系列データをそれぞれグループとして設定し、前記グループごとに、前記時系列データを入力値として利用するモデルの出力値に対する重要度に関するスコアを算出する算出部と
    を有することを特徴とする情報処理装置。
  2. 前記算出部は、前記時間幅が異なる時系列データとして、前記出力値の予測時点に最も近い時点までの第一の時間幅の時系列データと、前記出力値の予測時点に最も近い時点までの前記第一の時間幅よりも長い第二の時間幅の時系列データとを少なくとも含み、前記第一の時間幅の時系列データおよび前記第二の時間幅の時系列データをそれぞれグループとして設定し、前記グループごとに、前記出力値に対する重要度に関するスコアを算出することを特徴とする請求項1に記載の情報処理装置。
  3. 前記算出部によって算出された前記出力値に対する重要度に関するスコアを用いて、画像データを生成して画像データ出力する出力部をさらに有することを特徴とする請求項1に記載の情報処理装置。
  4. 前記取得部によって取得された時系列データを入力として、前記処理対象の状態を予測するための学習済モデルを用いて、所定の出力値を出力する予測部をさらに有することを特徴とする請求項1に記載の情報処理装置。
  5. 情報処理装置によって実行される算出方法であって、
    処理対象に関する時系列データを取得する取得工程と、
    前記取得工程によって取得された時系列データから所定の時間幅の時系列データを切り出すことによって得られる、時間幅がそれぞれ異なる複数の時系列データをそれぞれグループとして設定し、前記グループごとに、前記時系列データを入力値として利用するモデルの出力値に対する重要度に関するスコアを算出する算出工程と
    を含んだことを特徴とする算出方法。
  6. 処理対象に関する時系列データを取得する取得ステップと、
    前記取得ステップによって取得された時系列データから所定の時間幅の時系列データを切り出すことによって得られる、時間幅がそれぞれ異なる複数の時系列データをそれぞれグループとして設定し、前記グループごとに、前記時系列データを入力値として利用するモデルの出力値に対する重要度に関するスコアを算出する算出ステップと
    をコンピュータに実行させることを特徴とする算出プログラム。
JP2019064979A 2019-03-28 2019-03-28 情報処理装置、算出方法および算出プログラム Pending JP2020166442A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2019064979A JP2020166442A (ja) 2019-03-28 2019-03-28 情報処理装置、算出方法および算出プログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2019064979A JP2020166442A (ja) 2019-03-28 2019-03-28 情報処理装置、算出方法および算出プログラム

Publications (1)

Publication Number Publication Date
JP2020166442A true JP2020166442A (ja) 2020-10-08

Family

ID=72714470

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2019064979A Pending JP2020166442A (ja) 2019-03-28 2019-03-28 情報処理装置、算出方法および算出プログラム

Country Status (1)

Country Link
JP (1) JP2020166442A (ja)

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2013069568A1 (ja) * 2011-11-08 2013-05-16 インターナショナル・ビジネス・マシーンズ・コーポレーション 時系列データ分析方法、システム及びコンピュータ・プログラム
WO2017183066A1 (ja) * 2016-04-18 2017-10-26 株式会社日立製作所 ウインドウ評価方法および分析装置

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2013069568A1 (ja) * 2011-11-08 2013-05-16 インターナショナル・ビジネス・マシーンズ・コーポレーション 時系列データ分析方法、システム及びコンピュータ・プログラム
WO2017183066A1 (ja) * 2016-04-18 2017-10-26 株式会社日立製作所 ウインドウ評価方法および分析装置

Similar Documents

Publication Publication Date Title
JP7461440B2 (ja) 根本的原因分析を実行してプラントワイド操業での希少イベントの発生の予測モデルを構築するコンピュータシステムおよび方法
EP3809220B1 (en) Method and system for semi-supervised deep anomaly detection for large-scale industrial monitoring systems based on time-series data utilizing digital twin simulation data
EP4127401B1 (en) System and methods for developing and deploying oil well models to predict wax/hydrate buildups for oil well optimization
EP3795975A1 (en) Abnormality sensing apparatus, abnormality sensing method, and abnormality sensing program
JP2016031714A (ja) 重回帰分析装置および重回帰分析方法
KR102493719B1 (ko) 통합 공기질 예측 시스템
Jahani et al. Stochastic prognostics under multiple time-varying environmental factors
De Ketelaere et al. Statistical process monitoring of time-dependent data
CN112128950B (zh) 一种基于多种模型对比的机房温湿度预测方法及系统
US11449781B2 (en) Plant abnormality prediction system and method
JP2020166442A (ja) 情報処理装置、算出方法および算出プログラム
JP2010049392A (ja) Pidコントローラのチューニング装置、pidコントローラのチューニング用プログラムおよびpidコントローラのチューニング方法
JP7139625B2 (ja) 要因分析システム、要因分析方法およびプログラム
CN116340872A (zh) 一种基于重构和预测联合确定异常的方法
JP6871352B1 (ja) 学習装置、学習方法および学習プログラム
JP6889207B2 (ja) 学習装置、抽出装置、学習方法、抽出方法、学習プログラムおよび抽出プログラム
JP6995100B2 (ja) 情報処理装置、算出方法および算出プログラム
JP6910997B2 (ja) 情報処理装置、算出方法および算出プログラム
JP2021149590A (ja) 学習装置、学習方法及び学習プログラム
JP7392895B1 (ja) 運転支援装置、運転支援方法及びプログラム
CN117131465B (zh) 单管塔损伤识别方法、装置、电子设备及可读存储介质
Ilyasa et al. Application to Predict the New Student’ s Score Using TIME Series Algorithm
CN117828435A (zh) 数据段的分类方法
JP2023009625A (ja) 情報処理装置、情報処理方法及び情報処理プログラム
CN116194945A (zh) 信息处理装置、信息处理方法和信息处理程序

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20200218

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20210205

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20210216

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20210419

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20211012

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20211213

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20220510