JP2024034122A

JP2024034122A - 情報処理装置、情報処理方法およびプログラム

Info

Publication number: JP2024034122A
Application number: JP2022138164A
Authority: JP
Inventors: 謙斗小寺; Kento Kotera; 晃広山口; Akihiro Yamaguchi; 研植野; Ken Ueno
Original assignee: Toshiba Corp
Current assignee: Toshiba Corp
Priority date: 2022-08-31
Filing date: 2022-08-31
Publication date: 2024-03-13
Also published as: US20240070496A1

Abstract

【課題】時系列データに基づく状態の検知を、より高精度に実行する。【解決手段】情報処理装置は、類似度算出部と決定部とを備える。類似度算出部は、データ長が特定値である時系列データの各時刻での値の確率をそれぞれモデル化した複数の確率モデルと、診断対象とする対象時系列データに含まれる、データ長が特定値である複数の部分時系列データと、の間の第１類似度を算出する。決定部は、対象時系列データ内での部分時系列データの位置と、位置の部分時系列データとの間の第１類似度が他の前記確率モデルより大きい第１確率モデルと、第１確率モデルに対する第１類似度と、を含む複数のマッチング情報を決定する。【選択図】図３

Description

本発明の実施形態は、情報処理装置、情報処理方法およびプログラムに関する。

産業データおよび生体データなどの時系列データにおける異常などの状態を検知する技術では、単に状態（異常）を検知するだけでなく、状態（異常）の判断根拠を明らかにすることが求められている。異常の判断根拠を提示可能な異常検知技術として、正常時系列データに含まれる部分時系列パターンを学習し、異常診断時に、学習した部分時系列パターンに対する差異を検出して異常の判断根拠として提示する技術が知られている。

特許第６８７７２４５号公報国際公開第２０２２／０５４２５６号

本発明は、時系列データに基づく状態の検知を、より高精度に実行できる情報処理装置、情報処理方法およびプログラムを提供することを目的とする。

実施形態の情報処理装置は、類似度算出部と決定部とを備える。類似度算出部は、データ長が特定値である時系列データの各時刻での値の確率をそれぞれモデル化した複数の確率モデルと、診断対象とする対象時系列データに含まれる、データ長が特定値である複数の部分時系列データと、の間の第１類似度を算出する。決定部は、対象時系列データ内での部分時系列データの位置と、位置の部分時系列データとの間の第１類似度が他の前記確率モデルより大きい第１確率モデルと、第１確率モデルに対する第１類似度と、を含む複数のマッチング情報を決定する。

揺らぎを考慮しない場合の異常検知の例を説明するための図。揺らぎを考慮する場合の異常検知の例を説明するための図。第１の実施形態にかかる情報処理装置のブロック図。第１の実施形態における学習処理のフローチャート。第１の実施形態における診断処理のフローチャート。出力情報の一例を示す図。第２の実施形態にかかる情報処理装置のブロック図。第２の実施形態における学習処理のフローチャート。実施形態にかかる情報処理装置のハードウェア構成図。

以下に添付図面を参照して、この発明にかかる情報処理装置の好適な実施形態を詳細に説明する。以下では、時系列データの状態として異常を検知する場合を例に説明する。検知する状態は異常に限られず、どのような状態であってもよい。

異常検知の対象となる時系列データでは、正常時の時系列データであっても、揺らぎの大きい箇所と小さい箇所が存在しうる。従来の部分時系列を利用した異常検知技術では、揺らぎの大きさが異常度の算出時に反映されないため、揺らぎの大きい部分時系列との差異を過大評価し、揺らぎの小さい部分時系列との差異を過小評価する場合があった。

図１は、揺らぎを考慮しない場合の異常検知の例を説明するための図である。図１のグラフでは、点線のデータが、正常時の時系列データ（時間に対する検出値の変化を示すデータ）の例を示す。実線のデータが、診断の対象となる時系列データの例を示す。上のグラフは、全体的に両者の間に小さい差異が存在する例に相当する。下のグラフは、中央部に差異が大きい箇所が存在するが、その他の箇所ではほとんど両者の間に差異がない場合の例に相当する。

揺らぎを考慮しない場合、例えば、差異が大きい箇所を含む下のグラフの時系列データについて、異常が発生していると診断され、差異が小さい箇所のみを含む上のグラフの時系列データについて、異常が発生していないと診断される。しかし、例えば、中央部は揺らぎが大きい箇所に相当し、差異が大きくても異常と判断すべきではない場合がありうる。また、中央部以外は揺らぎが小さい箇所に相当し、差異が小さくても異常と判断すべき場合がありうる。

そこで、以下の実施形態では、時系列データの各時点での値の揺らぎを考慮して異常を診断可能とする。図２は、揺らぎを考慮する場合の異常検知の例を説明するための図である。

図２の線２０１ａ、２０１ｂは、それぞれ揺らぎの上限および下限を示すための線である。各時間について、線２０１ｂ上の当該時間での値を示す下限から、線２０１ａ上の当該時間での値を示す上限までの範囲の揺らぎが生じることを意味する。例えば揺らぎの範囲内の差異は異常と判断せず、揺らぎの範囲を超えた差異を異常と判断する場合、上のグラフは、初期の時間の箇所で揺らぎの範囲を超える差異があるため、異常と判断される。下のグラフは、いずれの時間も差異は揺らぎの範囲内であるため、異常と判断されない。

（第１の実施形態）
第１の実施形態にかかる情報処理装置は、診断の対象となる時系列データ（以下、対象時系列データ）に含まれる部分時系列の揺らぎを考慮して異常を検知する。例えば本実施形態の情報処理装置は、以下の機能を備える。
（Ｆ１）類似した時系列データ群の様々な部分時系列のパターンを確率モデル群として学習する機能
（Ｆ２）対象時系列データの部分時系列（部分時系列データ）と、確率モデルとの間の類似度を算出する機能
（Ｆ３）確率モデル群と対象時系列データ上の一定の範囲内の部分時系列データ群と間の類似度を参照し、類似度が他の確率モデルより大きい（例えば最大となる）位置における確率モデルと部分時系列データとを決定する機能
（Ｆ４）対象時系列データと確率モデル群との類似度に基づいて異常を検知する機能

対象時系列データは、単一の変数（単変量）の時系列データとする。例えば、対象時系列データは、ある装置の電流および圧力などの物理量を検出するセンサにより得られるセンサデータ、並びに、ＥＣＧ（ElectroCardioGram）およびＥＥＧ（ElectroEncephaloGram）などの生体信号データである。対象時系列データはこれらに限られず、どのような時系列データであってもよい。

センサデータは、センサの検出値そのものでもよいし、検出値の統計値（平均、最大、最小、標準偏差など）でもよいし、同種または異種の複数のセンサの検出値の演算値（例えば、電流と電圧とを乗算した電力）でもよい。

図３は、第１の実施形態にかかる情報処理装置１００の構成の一例を示すブロック図である。図３に示すように、情報処理装置１００は、受付部１０１と、学習部１０２と、類似度算出部１０３と、決定部１０４と、検知部１０５と、出力制御部１０６と、記憶部１２１と、を備えている。

情報処理装置１００は、学習フェーズおよび診断フェーズの２つの動作フェーズを備える。学習フェーズでは、類似する時系列データ群から、複数の代表的な部分時系列パターンを確率的にモデル化した複数の確率モデル（確率モデル群）が学習される。診断フェーズでは、学習された確率モデル群を用いて、対象時系列データに対する異常診断が行われる。

学習フェーズでは、主に、受付部１０１、学習部１０２、および、記憶部１２１が用いられる。診断フェーズでは、主に、受付部１０１、類似度算出部１０３、決定部１０４、検知部１０５、および、出力制御部１０６が用いられる。

受付部１０１は、情報処理装置１００で用いられる各種データの入力を受け付ける。例えば受付部１０１は、学習部１０２が学習に用いる学習データ、および、対象時系列データなどの入力を受け付ける。

学習部１０２は、学習データとして入力される複数の時系列データ（時系列データ群）を用いて、複数の確率モデルを学習する（上記（Ｆ１））。例えば学習部１０２は、複数の学習用の時系列データを用いて、複数の確率モデルを学習する。学習により、データ長が特定値Ｌである時系列データの各時刻での値の確率をそれぞれモデル化した確率モデルが得られる。例えば各確率モデルは、Ｌを次元数とする、平均および分散を用いて定められる多次元の確率分布モデルである。データ長は、時系列データの長さを表し、例えば、時系列データに含まれる要素の個数である。各要素が一定時間ごとに得られるような場合は、データ長は、時間の長さで表されてもよい。

記憶部１２１は、情報処理装置１００で用いられる各種データを記憶する。例えば記憶部１２１は、受付部１０１により受け付けられたデータ、および、学習部１０２により学習された確率モデルに関するデータを記憶する。

なお、記憶部１２１は、フラッシュメモリ、メモリカード、ＲＡＭ（Random Access Memory）、ＨＤＤ（Hard Disk Drive）、および、光ディスクなどの一般的に利用されているあらゆる記憶媒体により構成することができる。

類似度算出部１０３は、学習フェーズで得られた複数の確率モデルと、対象時系列データに含まれる複数の部分時系列データと、の間の類似度（第１類似度）を算出する（上記（Ｆ２））。例えば類似度算出部１０３は、複数の確率モデルのそれぞれと、対象時系列データに含まれるデータ長がＬである複数の部分時系列データと、の間の類似度を算出する。

決定部１０４は、部分時系列データと最も類似する確率モデルを照合（マッチング）する処理を、部分時系列データが対象時系列データ全体を覆う（カバーする）まで繰り返し実行する。決定部１０４は、照合の結果を示す情報として、対象時系列データ内での部分時系列データの位置と、当該位置の部分時系列データとの間の類似度が他の確率モデルより大きい確率モデル（第１確率モデル）と、第１確率モデルに対する類似度と、を含む複数のマッチング情報を決定して出力する。類似度が他の確率モデルより大きいとは、例えば、類似度が最大であることである。以下では、類似度が最大である場合を例に説明する。

例えば決定部１０４は、直前に設定された位置から特定値までの範囲に含まれる複数の位置をそれぞれ始点とする複数の部分時系列データのうち、複数の確率モデルのいずれかとの間の類似度が最大となる部分時系列データを求める。決定部１０４は、求めた部分時系列データと、求めた部分時系列データとの間の類似度が最大となる確率モデルと、最大となる類似度と、を含むマッチング情報を決定する。決定部１０４は、このような処理を、決定した部分時系列データが、対象時系列データ全体を覆うように複数回繰り返し実行し、複数のマッチング情報を出力する。

決定部１０４による処理は、事前に得られた様々なパターンの確率モデルのうち、対象時系列データに最も適合する複数の確率モデルを順次決定する処理であると解釈することができる（上記（Ｆ３））。

検知部１０５は、複数のマッチング情報に含まれる複数の類似度を用いて、対象時系列データの異常を検知する（上記（Ｆ４））。例えば検知部１０５は、複数の類似度の最小値が閾値より小さい場合に、対象時系列データに異常があることを検知する。

出力制御部１０６は、情報処理装置１００で用いられる各種データの出力を制御する。例えば出力制御部１０６は、検知部１０５による検知結果を出力する。出力制御部１０６は、時系列データが正常であると想定される正常範囲を含む出力情報を出力してもよい。正常範囲は、例えば、確率モデルの平均および分散を用いて求めることができる。

出力制御部１０６による出力方法はどのような方法であってもよいが、例えば、液晶ディスプレイなどの表示装置に表示する方法、プリンタなどの画像形成装置を用いて記録媒体に出力する方法、および、外部の装置（サーバ、他の情報処理装置など）にデータを送信する方法などを適用できる。

上記各部（受付部１０１、学習部１０２、類似度算出部１０３、決定部１０４、検知部１０５、および、出力制御部１０６）は、例えば、１または複数のプロセッサにより実現される。例えば上記各部は、ＣＰＵ（Central Processing Unit）などのプロセッサにプログラムを実行させること、すなわちソフトウェアにより実現してもよい。上記各部は、専用のＩＣ（Integrated Circuit）などのプロセッサ、すなわちハードウェアにより実現してもよい。上記各部は、ソフトウェアおよびハードウェアを併用して実現してもよい。複数のプロセッサを用いる場合、各プロセッサは、各部のうち１つを実現してもよいし、各部のうち２つ以上を実現してもよい。

上記各部は、物理的の異なる複数の装置に分散して備えられてもよい。例えば、学習フェーズで用いられる構成部（受付部１０１、学習部１０２、記憶部１２１など）と、診断フェーズで用いられる構成部（受付部１０１、類似度算出部１０３、決定部１０４、検知部１０５、出力制御部１０６、記憶部１２１など）と、を相互に異なる装置（２つのサーバなど）に備えるように構成してもよい。上記各部の一部または全部は、クラウド環境上に構築されるサーバに備えられてもよい。

次に、第１の実施形態にかかる情報処理装置１００による学習処理について説明する。学習処理は、学習フェーズで実行される処理である。図４は、第１の実施形態における学習処理の一例を示すフローチャートである。

受付部１０１は、外部装置などから、学習データの入力を受け付ける（ステップＳ１０１）。学習データは、例えば、類似した時系列データの集合である時系列データ群Ｘである。時系列データ群Ｘは、正常ラベルおよび異常ラベルといった教師情報を持たない。時系列データ群ＸにはＮ個の単変量の時系列データｘが含まれる。各時系列データｘはデータ長をＴとする。すなわち、各時系列データｘは、Ｔ個の点を含む。各時系列データｘの各要素をｘ_１，・・・，ｘ_Ｔと表す。

学習部１０２は、時系列データ群Ｘを受け取り、時系列データ群Ｘに含まれるデータ長Ｌの部分時系列データのパターンを確率的にモデル化した確率モデルＭをＫ個学習する（ステップＳ１０２）。Ｋは、例えば学習により求める確率モデルＭの個数として予め指定される。

以下では、個々の確率モデルをＭ_ｋ（ｋ＝１，・・・，Ｋ）と表す。確率モデルＭ_ｋは、部分時系列データのデータ長Ｌに等しい次元数を持つ多次元確率分布で表現される。本実施形態では平均をμ、共分散行列をΣとする正規分布を想定する。ただし、平均μおよび共分散行列Σの各次元は、部分時系列データの各データ点に対応する。各データ点すなわち各次元は独立であり、共分散行列Σは対角行列とする。言い換えると、確率モデルＭは、各次元（各データ点）が独立であり、共分散行列Σが対角行列であり、次元数がＬである多次元確率分布となるように学習される。

学習方法は、時系列データ群Ｘから上記のような確率モデルＭを学習できる方法であればどのような方法でもよい。例えば、学習部１０２は、ガウス混合モデルクラスタリングのような機械学習手法を用いてもよいし、ｋ平均（ｋ－ｍｅａｎｓ）法、統計的手法、おおよび、最適化手法を組み合わせた方法を用いてもよい。また、確率モデルは正規分布に限られず、指数分布などの他の確率分布が用いられてもよい。

学習部１０２は、学習したＫ個の確率モデルを記憶部１２１に記憶し（ステップＳ１０３）、学習処理を終了する。

次に、第１の実施形態にかかる情報処理装置１００による診断処理について説明する。診断処理は、診断フェーズで実行される処理である。図５は、第１の実施形態における診断処理の一例を示すフローチャートである。

受付部１０１は、外部装置などから、対象時系列データｘの入力を受け付ける（ステップＳ２０１）。対象時系列データｘは、学習データとして用いた時系列データ群Ｘと等しいデータ長Ｔの同種のデータである。

類似度算出部１０３は、マッチング範囲を設定する（ステップＳ２０２）。マッチング範囲とは、確率モデルとの類似度を算出する対象となる部分時系列データの始点が含まれる範囲として定められる一定の範囲を示す。マッチング範囲は、例えば、直前に設定された位置（マッチング位置）からデータ長Ｌまでの範囲として設定される。マッチング位置とは、直前の繰り返し処理で、複数の確率モデルのいずれかとの間の類似度が最大となる部分時系列データとして求められた部分時系列データの始点の位置を示す。なお、最初の繰り返し処理では、対象時系列データの先頭のみが、マッチング範囲として設定される。

本実施形態の繰り返し処理の流れは、例えば、特許文献１に記載されたフィッティング処理の流れと同様である。フィッティング処理では、時系列データの各時刻での値の確率をモデル化した確率モデルは用いられない点が、本実施形態とは異なる。

類似度算出部１０３は、対象時系列データｘに含まれる、マッチング範囲内を始点とする１個以上の部分時系列データと、確率モデル群に含まれる複数の確率モデルそれぞれと、の間の類似度を算出する（ステップＳ２０３）。

以下では、対象時系列データｘのｉ点目からｉ＋Ｌ－１点目までの部分時系列データをｘ_［i，_i＋L－1］＝［ｘ_ｉ，・・・，ｘ_ｉ＋L－1］と表す。また、ｘ_［i，_i＋L］と、ｋ番目（１≦ｋ≦Ｋ）の確率モデルＭ_ｋと、の間の類似度をＤ_ｉ，_ｋと表す。

最初の繰り返し処理では、類似度算出部１０３は、対象時系列データｘの１点目からＬ点目までの１個の部分時系列データｘ_［1，_L］＝［ｘ_１，・・・，ｘ_Ｌ］と、Ｋ個の確率モデルＭ_１，・・・，Ｍ_Ｋそれぞれとの間のＫ個の類似度（類似度群）Ｄ_１，１・・・，Ｄ_１，Ｋを算出する。

類似度は、部分時系列データと、確率モデルとが類似する度合いを示す情報であれば、どのような情報であってもよい。例えば類似度算出部１０３は、カルバックライブラー距離およびピアソン距離などの確率分布の距離に基づく値を類似度として算出してもよい。

類似度算出部１０３は、部分時系列データを確率モデルに拡張し、拡張した確率モデルと、複数の確率モデルＭ_ｋと、の間の距離に基づく値を類似度として算出してもよい。例えば、カルバックライブラー距離を用いる場合、類似度算出部１０３は、部分時系列データｘ_［1，_L］＝を、部分時系列データｘ_{［i，i＋L－1］}と共分散行列Σ_ｋとをパラメータとする、正規分布に従う確率分布Ｐ＝Ｎ（ｘ_{［i，i＋L－1］}，Σ_ｋ）に拡張する。類似度算出部１０３は、拡張した確率分布（確率モデルの一例）と、確率モデルＭ_ｋが示す確率分布Ｑ＝Ｎ（ｘ_{［i，i＋L－1］}，Σ_ｋ）との間のカルバックライブラー距離ＫＬ（Ｐ，Ｑ）を算出する。

カルバックライブラー距離は、その値が大きいほど類似度が小さいことを意味する。従って、類似度算出部１０３は、カルバックライブラー距離の逆数を求める演算、または、カルバックライブラー距離を負の値に変換してネイピア数を底とした指数関数に入力する演算などにより得られる値を、類似度として用いる。

類似度算出部１０３は、確率分布の距離を用いずに、対数尤度を用いる方法により、類似度を算出してもよい。例えば、平均μ、共分散行列Σをパラメータとする多変量正規分布の確率密度関数をｆ（ｘ｜μ，Σ）とすると、類似度算出部１０３は、部分時系列データｘ_{［i，i＋L－1］}とモデルＭ_Ｋとの間の類似度を、ｌｏｇｆ（ｘ_{［i，i＋L－1］}｜μ，Σ）として算出できる。

決定部１０４は、類似度が最大となる確率モデル、および、部分時系列データの位置（マッチング位置）を決定し、決定した位置を始点とする部分時系列データと、当該部分時系列データとの類似度が最大となる確率モデルと、最大となる類似度と、を含むマッチング情報を出力する（ステップＳ２０４）。例えば決定部１０４は、まず、算出された類似度群Ｄ_１，１・・・，Ｄ_１，Ｋのうち最大の類似度を選択する。類似度が最大となる確率モデルは、対象時系列データｘに最も近いモデルを表す。決定部１０４は、マッチング情報を、類似度算出部１０３および検知部１０５に出力する。なお、最初の繰り返し処理では、マッチング位置は１となる。

決定部１０４は、対象時系列データの最終位置まで処理したか否かを判定する（ステップＳ２０５）。例えば決定部１０４は、マッチング位置が、対象時系列データのＴ－Ｌ点目となった場合、最終位置まで処理したと判定する。この判定は、部分時系列データと最も類似する確率モデルを照合する処理を、部分時系列データが対象時系列データ全体を覆うまで処理したかを判定することに相当する。

対象時系列データの最終位置まで処理していない場合（ステップＳ２０５：Ｎｏ）、ステップＳ２０２に戻り、次のマッチング範囲を設定して処理が繰り返される。２回目以降の繰り返し処理は、例えば以下のように実行される。

類似度算出部１０３は、決定部１０４により直前に出力されたマッチング位置を参照し、マッチング範囲を設定する。直前に出力されたマッチング位置をｊとすると、ｊ＋１から、データ長Ｌを加えた位置までの範囲が、マッチング範囲として設定される（ステップＳ２０２）。

類似度算出部１０３は、マッチング範囲内のいずれかの点を始点（開始位置）とする、対象時系列データｘ内のＬ個の部分時系列データ群ｘ_{［j＋1，j＋L］}，・・・，ｘ_{［j＋L，j＋2L－1］}と、Ｋ個の確率モデル群Ｍ_１，・・・，Ｍ_Ｋとのすべての組み合わせについて、類似度を算出する（ステップＳ２０３）。この結果、Ｌ×Ｋ個の類似度が算出される。

ただし、ｊ＋２Ｌがｘの時系列長Ｔを超える場合は、類似度算出部１０３は、部分時系列データ群ｘ_{［j＋1，j＋1＋L］}，・・・，ｘ_{［Ｔ－L，Ｔ］}と、Ｋ個の確率モデル群Ｍ_１，・・・，Ｍ_Ｋとのすべての組み合わせについて類似度群を算出する。

決定部１０４は、算出された類似度群Ｄ_ｉ，ｋ（ｉ＝ｊ＋１，．．．，ｊ＋Ｌ，ｋ＝１，．．．，Ｋ）のうち最大の類似度を決定し、マッチング情報を出力する（ステップＳ２０４）。

ステップＳ２０５で、対象時系列データの最終位置まで処理したと判定された場合（ステップＳ２０５：Ｙｅｓ）、検知部１０５は、マッチング系列を参照し、対象時系列データに異常があるか否かを検知する（ステップＳ２０６）。マッチング系列は、例えば、これまで出力されたマッチング情報を順に並べた情報である。

例えば検知部１０５は、マッチング系列から異常度を算出する。異常度は、例えば、マッチング系列に含まれる複数の類似度（類似度列）に関する統計値でもよいし、複数の類似度に対して演算を行った値でもよい。統計値は、例えば、複数の類似度のうち最小値、複数の類似度のうち最大値、または、複数の類似度の平均値である。検知部１０５は、算出した異常度が、予め定められた閾値より小さい場合、異常と判定する。

出力制御部１０６は、異常の検知結果を出力する（ステップＳ２０７）。出力制御部１０６は、正常であるか異常であるかを示す判定結果のみを出力してもよいし、判定結果に加えてマッチング情報に基づく情報を出力してもよい。例えば複数の類似度のうち最小値を異常度として用いる場合、出力制御部１０６は、マッチング情報に含まれるマッチング位置のうち、最小値を取る類似度に対応するマッチング位置を異常箇所として出力する。

上記のように、出力制御部１０６は、正常範囲を含む出力情報を出力してもよい。例えば、確率モデルが正規分布である場合、出力制御部１０６は、確率モデルの平均値パラメータμに共分散行列Σの対角成分（σ² _１，・・・，σ² _Ｌ）のｐ倍（ｐは０より大きい実数）を減算した値を正常範囲の下限とし、平均値パラメータμに共分散行列Σの対角成分（σ² _１，・・・，σ² _Ｌ）のｐ倍を加算した値を正常範囲の上限として正常範囲を定める。出力制御部１０６は、対象時系列データｘにおいて、マッチング情報に含まれるマッチング位置を基準として正常範囲を出力する。このように、出力制御部１０６は、正常範囲を含む情報を、異常判定の根拠として出力することが可能となる。

図６は、出力される出力情報６００の一例を示す図である。図６に示すように、出力情報６００は、対象時系列データ６０１と、異常箇所を含むマッチング位置６０２と、正常範囲６１１とを含む。なお、対象時系列データ６０１は、右方向を時間とし、上方向を値とするデータである。正常範囲６１１は、対象時系列データ６０１の各時間の値を中心とし、上方向に取られた下限と、下方向に取られた下限と、で囲まれる範囲に相当する。

このように、第１の実施形態では、時系列データの各時点での揺らぎを考慮した確率モデルを用いて、診断対象となる対象時系列データの異常を検知する。これにより、時系列データに基づく異常検知をより高精度に実行できる。

（第２の実施形態）
第２の実施形態にかかる情報処理装置は、さらに、確率モデルの出現順序の特性を表す連鎖パターンをモデル化した連鎖モデルを考慮する。例えば本実施形態の情報処理装置は、連鎖モデルを学習する機能、および、連鎖モデルも考慮して類似度を算出する機能が追加される。

図７は、第２の実施形態にかかる情報処理装置１００－２の構成の一例を示すブロック図である。図７に示すように、情報処理装置１００－２は、受付部１０１と、学習部１０２－２と、類似度算出部１０３－２と、決定部１０４と、検知部１０５と、出力制御部１０６と、記憶部１２１－２と、を備えている。

第２の実施形態では、学習部１０２－２、類似度算出部１０３－２および記憶部１２１－２の機能が第１の実施形態と異なっている。その他の構成および機能は、第１の実施形態にかかる情報処理装置１００のブロック図である図３と同様であるので、同一符号を付し、ここでの説明は省略する。

学習部１０２－２は、連鎖モデルを学習する機能をさらに備える点が、第１の実施形態の学習部１０２と異なっている。例えば学習部１０２－２は、ある確率モデルＭＡの次に他の確率モデルＭＢが出現する確率を離散分布（例えばカテゴリカル分布）としてモデル化し、ベイズ推定によって学習する。連鎖モデルの学習方法はこれに限られず、確率モデルの出現順序のパターンをモデル化して学習する方法であれば、どのような方法であってもよい。

類似度算出部１０３－２は、類似度の算出時に、連鎖モデルとの類似度を考慮する点が、第１の実施形態の類似度算出部１０３と異なっている。連鎖モデルに対する類似度は、確率モデルとの間の類似度とは独立して算出される。例えば、部分時系列データと連鎖モデルとの類似度は、連鎖モデルに関する尤度である。

類似度算出部１０３－２は、例えば、以下のようにして、部分時系列データと、確率モデルとの間の類似度ＳＡ（第１類似度）を算出する。まず、類似度算出部１０３－２は、Ｌ個の部分時系列データ群に含まれる部分時系列データＤＡ（第１データ）それぞれについて、複数の確率モデルとの間の類似度ＳＢ（第２類似度）を算出する。また、類似度算出部１０３－２は、直前のマッチング情報から出力される確率モデルを参照し、連鎖モデルに対して複数の確率モデルがマッチングした場合の連鎖モデルに関する尤度を類似度ＳＣ（第３類似度）として算出する。例えば、直前にマッチングした確率モデルをＭ_ｋ１、算出対象とする確率モデルをＭ_ｋ２とすると、条件付き確率ｐ（Ｍ_ｋ２｜Ｍ_ｋ１）の値（またはその対数）が尤度として用いられる。なお、直前にマッチングした確率モデルがないループの最初の場合は、条件付けない確率ｐ（Ｍ_ｋ２）などが尤度として用いられる。そして類似度算出部１０３－２は、類似度ＳＢと類似度ＳＣとを用いた演算により類似度ＳＡを算出する。このときの演算はどのような演算であってもよいが、例えば、加算、重み付け加算、および、乗算などである。

記憶部１２１－２は、学習部１０２－２により学習された連鎖モデルに関するデータをさらに記憶する。

次に、第２の実施形態にかかる情報処理装置１００－２による学習処理について図８を用いて説明する。図８は、第２の実施形態における学習処理の一例を示すフローチャートである。

ステップＳ３０１は、第１の実施形態にかかる情報処理装置１００におけるステップＳ１０１と同様の処理なので、その説明を省略する。

学習部１０２－２は、まず、時系列データ群Ｘを用いて、第１の実施形態と同様の手順により、確率モデルＭをＫ個学習する。その後、学習部１０２－２は、確率モデルＭの出現順序の特性を表す連鎖パターンをモデル化した連鎖モデルを学習する（ステップＳ３０２）。学習部１０２－２は、当該複数の確率モデルの順序を示す情報と、を含む学習データを外部装置などから取得し、これらの学習データを用いて連鎖パターンを学習してもよい。

学習部１０２－２は、学習したＫ個の確率モデルと、学習した連鎖モデルと、を記憶部１２１－２に記憶し（ステップＳ３０３）、学習処理を終了する。

次に、第２の実施形態にかかる情報処理装置１００－２による診断処理について説明する。本実施形態では、類似度を算出するときに、連鎖モデルとの類似度を考慮する点が、第１の実施形態と異なっている。図５の診断処理では、ステップＳ２０３で類似度を算出する処理が変更される。ステップＳ２０３以外の処理の流れは、第１の実施形態と同様のであるため説明を省略する。

例えば類似度算出部１０３－２は、まず、対象時系列データｘに含まれる、マッチング範囲内を始点とする複数の部分時系列データそれぞれについて、確率モデル群に含まれる複数の確率モデルそれぞれと、の間の類似度ＳＢを算出する。類似度算出部１０３－２は、類似度ＳＢを算出した部分時系列データに対して連続して出現する複数の部分時系列データと、連鎖モデルとの間の類似度ＳＣを算出する。類似度算出部１０３－２は、類似度ＳＢと類似度ＳＣとの演算により、類似度ＳＡを算出する。

このように、第２の実施形態では、確率モデルの出現順序をモデル化した連鎖モデルも考慮して時系列データに基づく異常を検知することができる。

以上説明したとおり、第１から第２の実施形態によれば、時系列データに基づく状態の検知を、より高精度に実行できる。

次に、第１または第２の実施形態にかかる情報処理装置のハードウェア構成について図９を用いて説明する。図９は、第１または第２の実施形態にかかる情報処理装置のハードウェア構成例を示す説明図である。

第１または第２の実施形態にかかる情報処理装置は、ＣＰＵ（Central Processing Unit）５１などの制御装置と、ＲＯＭ（Read Only Memory）５２やＲＡＭ（Random Access Memory）５３などの記憶装置と、ネットワークに接続して通信を行う通信Ｉ／Ｆ５４と、各部を接続するバス６１を備えている。

第１または第２の実施形態にかかる情報処理装置で実行されるプログラムは、ＲＯＭ５２等に予め組み込まれて提供される。

第１または第２の実施形態にかかる情報処理装置で実行されるプログラムは、インストール可能な形式または実行可能な形式のファイルでＣＤ－ＲＯＭ（Compact Disk Read Only Memory）、フレキシブルディスク（ＦＤ）、ＣＤ－Ｒ（Compact Disk Recordable）、ＤＶＤ（Digital Versatile Disk）等のコンピュータで読み取り可能な記録媒体に記録してコンピュータプログラムプロダクトとして提供されるように構成してもよい。

さらに、第１または第２の実施形態にかかる情報処理装置で実行されるプログラムを、インターネット等のネットワークに接続されたコンピュータ上に格納し、ネットワーク経由でダウンロードさせることにより提供するように構成してもよい。また、第１または第２の実施形態にかかる情報処理装置で実行されるプログラムをインターネット等のネットワーク経由で提供または配布するように構成してもよい。

第１または第２の実施形態にかかる情報処理装置で実行されるプログラムは、コンピュータを上述した情報処理装置の各部として機能させうる。このコンピュータは、ＣＰＵ５１がコンピュータ読取可能な記憶媒体からプログラムを主記憶装置上に読み出して実行することができる。

本発明のいくつかの実施形態を説明したが、これらの実施形態は、例として提示したものであり、発明の範囲を限定することは意図していない。これら新規な実施形態は、その他の様々な形態で実施されることが可能であり、発明の要旨を逸脱しない範囲で、種々の省略、置き換え、変更を行うことができる。これら実施形態やその変形は、発明の範囲や要旨に含まれるとともに、特許請求の範囲に記載された発明とその均等の範囲に含まれる。

実施形態の構成例について以下に記載する。
（構成例１）
データ長が特定値である時系列データの各時刻での値の確率をそれぞれモデル化した複数の確率モデルと、診断対象とする対象時系列データに含まれる、データ長が前記特定値である複数の部分時系列データと、の間の第１類似度を算出する類似度算出部と、
前記対象時系列データ内での前記部分時系列データの位置と、前記位置の前記部分時系列データとの間の前記第１類似度が他の前記確率モデルより大きい第１確率モデルと、前記第１確率モデルに対する前記第１類似度と、を含む複数のマッチング情報を決定する決定部と、
を備える情報処理装置。
（構成例２）
複数の前記確率モデルのそれぞれは、前記特定値を次元数とし、平均および分散を用いて定められる多次元の確率分布モデルである、
構成例１に記載の情報処理装置。
（構成例３）
前記平均および前記分散を用いて、時系列データが正常であると想定される正常範囲を求め、前記正常範囲を含む出力情報を出力する出力制御部をさらに備える、
構成例２に記載の情報処理装置。
（構成例４）
前記類似度算出部は、前記部分時系列データを確率モデルに拡張し、拡張した確率モデルと、複数の前記確率モデルと、の間の距離に基づく値を前記第１類似度として算出する、
構成例１から３のいずれか１つに記載の情報処理装置。
（構成例５）
前記類似度算出部は、
複数の前記部分時系列データに含まれる第１データそれぞれについて、
複数の前記確率モデルとの間の第２類似度を算出し、
複数の前記確率モデルの出現順序のパターンをモデル化した連鎖モデルと、複数の前記部分時系列データのうち前記第１データを含む複数の前記部分時系列データと、の間の第３類似度を算出し、
前記第２類似度と前記第３類似度とを用いた演算により前記第１類似度を算出する、
構成例１から４のいずれか１つに記載の情報処理装置。
（構成例６）
複数の前記マッチング情報に含まれる複数の前記第１類似度を用いて、前記対象時系列データの状態を検知する検知部をさらに備える、
構成例１から５のいずれか１つに記載の情報処理装置。
（構成例７）
前記検知部は、複数の前記マッチング情報に含まれる複数の前記第１類似度の最小値が閾値より小さい場合に、前記対象時系列データに異常があることを検知する、
構成例６に記載の情報処理装置。
（構成例８）
複数の学習用の時系列データを用いて、複数の前記確率モデルを学習する学習部をさらに備える、
構成例１から７のいずれか１つに記載の情報処理装置。
（構成例９）
前記決定部は、直前に設定された前記位置から前記特定値までの範囲に含まれる複数の位置をそれぞれ始点とする複数の前記部分時系列データのうち、複数の前記確率モデルのいずれかとの間の前記第１類似度が最大となる前記部分時系列データを求め、求めた前記部分時系列データと、求めた前記部分時系列データとの間の前記第１類似度が最大となる前記確率モデルと、最大となる前記第１類似度と、を含む前記マッチング情報を決定する処理を複数回繰り返し実行し、複数の前記マッチング情報を出力する、
構成例１から８のいずれか１つに記載の情報処理装置。
（構成例１０）
前記第１確率モデルは、前記位置の前記部分時系列データとの間の前記第１類似度が最大の前記確率モデルである、
構成例１から９のいずれか１つに記載の情報処理装置。
（構成例１１）
情報処理装置で実行される情報処理方法であって、
データ長が特定値である時系列データの各時刻での値の確率をそれぞれモデル化した複数の確率モデルと、診断対象とする対象時系列データに含まれる、データ長が前記特定値である複数の部分時系列データと、の間の第１類似度を算出する類似度算出ステップと、
前記対象時系列データ内での前記部分時系列データの位置と、前記位置の前記部分時系列データとの間の前記第１類似度が他の前記確率モデルより大きい第１確率モデルと、前記第１確率モデルに対する前記第１類似度と、を含む複数のマッチング情報を決定する決定ステップと、
を含む情報処理方法。
（構成例１２）
コンピュータに、
データ長が特定値である時系列データの各時刻での値の確率をそれぞれモデル化した複数の確率モデルと、診断対象とする対象時系列データに含まれる、データ長が前記特定値である複数の部分時系列データと、の間の第１類似度を算出する類似度算出ステップと、
前記対象時系列データ内での前記部分時系列データの位置と、前記位置の前記部分時系列データとの間の前記第１類似度が他の前記確率モデルより大きい第１確率モデルと、前記第１確率モデルに対する前記第１類似度と、を含む複数のマッチング情報を決定する決定ステップと、
を実行させるためのプログラム。

１００、１００－２情報処理装置
１０１受付部
１０２、１０２－２学習部
１０３、１０３－２類似度算出部
１０４決定部
１０５検知部
１０６出力制御部
１２１、１２１－２記憶部

Claims

データ長が特定値である時系列データの各時刻での値の確率をそれぞれモデル化した複数の確率モデルと、診断対象とする対象時系列データに含まれる、データ長が前記特定値である複数の部分時系列データと、の間の第１類似度を算出する類似度算出部と、
前記対象時系列データ内での前記部分時系列データの位置と、前記位置の前記部分時系列データとの間の前記第１類似度が他の前記確率モデルより大きい第１確率モデルと、前記第１確率モデルに対する前記第１類似度と、を含む複数のマッチング情報を決定する決定部と、
を備える情報処理装置。
複数の前記確率モデルのそれぞれは、前記特定値を次元数とし、平均および分散を用いて定められる多次元の確率分布モデルである、
請求項１に記載の情報処理装置。
前記平均および前記分散を用いて、時系列データが正常であると想定される正常範囲を求め、前記正常範囲を含む出力情報を出力する出力制御部をさらに備える、
請求項２に記載の情報処理装置。
前記類似度算出部は、前記部分時系列データを確率モデルに拡張し、拡張した確率モデルと、複数の前記確率モデルと、の間の距離に基づく値を前記第１類似度として算出する、
請求項１に記載の情報処理装置。
前記類似度算出部は、
複数の前記部分時系列データに含まれる第１データそれぞれについて、
複数の前記確率モデルとの間の第２類似度を算出し、
複数の前記確率モデルの出現順序のパターンをモデル化した連鎖モデルと、複数の前記部分時系列データのうち前記第１データを含む複数の前記部分時系列データと、の間の第３類似度を算出し、
前記第２類似度と前記第３類似度とを用いた演算により前記第１類似度を算出する、
請求項１に記載の情報処理装置。
複数の前記マッチング情報に含まれる複数の前記第１類似度を用いて、前記対象時系列データの状態を検知する検知部をさらに備える、
請求項１に記載の情報処理装置。
前記検知部は、複数の前記マッチング情報に含まれる複数の前記第１類似度の最小値が閾値より小さい場合に、前記対象時系列データに異常があることを検知する、
請求項６に記載の情報処理装置。
複数の学習用の時系列データを用いて、複数の前記確率モデルを学習する学習部をさらに備える、
請求項１に記載の情報処理装置。
前記決定部は、直前に設定された前記位置から前記特定値までの範囲に含まれる複数の位置をそれぞれ始点とする複数の前記部分時系列データのうち、複数の前記確率モデルのいずれかとの間の前記第１類似度が最大となる前記部分時系列データを求め、求めた前記部分時系列データと、求めた前記部分時系列データとの間の前記第１類似度が最大となる前記確率モデルと、最大となる前記第１類似度と、を含む前記マッチング情報を決定する処理を複数回繰り返し実行し、複数の前記マッチング情報を出力する、
請求項１に記載の情報処理装置。
前記第１確率モデルは、前記位置の前記部分時系列データとの間の前記第１類似度が最大の前記確率モデルである、
請求項１に記載の情報処理装置。
情報処理装置で実行される情報処理方法であって、
データ長が特定値である時系列データの各時刻での値の確率をそれぞれモデル化した複数の確率モデルと、診断対象とする対象時系列データに含まれる、データ長が前記特定値である複数の部分時系列データと、の間の第１類似度を算出する類似度算出ステップと、
前記対象時系列データ内での前記部分時系列データの位置と、前記位置の前記部分時系列データとの間の前記第１類似度が他の前記確率モデルより大きい第１確率モデルと、前記第１確率モデルに対する前記第１類似度と、を含む複数のマッチング情報を決定する決定ステップと、
を含む情報処理方法。
コンピュータに、
データ長が特定値である時系列データの各時刻での値の確率をそれぞれモデル化した複数の確率モデルと、診断対象とする対象時系列データに含まれる、データ長が前記特定値である複数の部分時系列データと、の間の第１類似度を算出する類似度算出ステップと、
前記対象時系列データ内での前記部分時系列データの位置と、前記位置の前記部分時系列データとの間の前記第１類似度が他の前記確率モデルより大きい第１確率モデルと、前記第１確率モデルに対する前記第１類似度と、を含む複数のマッチング情報を決定する決定ステップと、
を実行させるためのプログラム。