JP2024034122A - 情報処理装置、情報処理方法およびプログラム - Google Patents

情報処理装置、情報処理方法およびプログラム Download PDF

Info

Publication number
JP2024034122A
JP2024034122A JP2022138164A JP2022138164A JP2024034122A JP 2024034122 A JP2024034122 A JP 2024034122A JP 2022138164 A JP2022138164 A JP 2022138164A JP 2022138164 A JP2022138164 A JP 2022138164A JP 2024034122 A JP2024034122 A JP 2024034122A
Authority
JP
Japan
Prior art keywords
series data
time series
similarity
probability
information processing
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2022138164A
Other languages
English (en)
Inventor
謙斗 小寺
Kento Kotera
晃広 山口
Akihiro Yamaguchi
研 植野
Ken Ueno
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Original Assignee
Toshiba Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp filed Critical Toshiba Corp
Priority to JP2022138164A priority Critical patent/JP2024034122A/ja
Priority to US18/174,190 priority patent/US20240070496A1/en
Publication of JP2024034122A publication Critical patent/JP2024034122A/ja
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N7/00Computing arrangements based on specific mathematical models
    • G06N7/01Probabilistic graphical models, e.g. probabilistic networks

Landscapes

  • Physics & Mathematics (AREA)
  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Artificial Intelligence (AREA)
  • Pure & Applied Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Evolutionary Computation (AREA)
  • Algebra (AREA)
  • Mathematical Analysis (AREA)
  • Mathematical Optimization (AREA)
  • Computational Mathematics (AREA)
  • Computing Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Probability & Statistics with Applications (AREA)
  • Debugging And Monitoring (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

【課題】時系列データに基づく状態の検知を、より高精度に実行する。【解決手段】情報処理装置は、類似度算出部と決定部とを備える。類似度算出部は、データ長が特定値である時系列データの各時刻での値の確率をそれぞれモデル化した複数の確率モデルと、診断対象とする対象時系列データに含まれる、データ長が特定値である複数の部分時系列データと、の間の第1類似度を算出する。決定部は、対象時系列データ内での部分時系列データの位置と、位置の部分時系列データとの間の第1類似度が他の前記確率モデルより大きい第1確率モデルと、第1確率モデルに対する第1類似度と、を含む複数のマッチング情報を決定する。【選択図】図3

Description

本発明の実施形態は、情報処理装置、情報処理方法およびプログラムに関する。
産業データおよび生体データなどの時系列データにおける異常などの状態を検知する技術では、単に状態(異常)を検知するだけでなく、状態(異常)の判断根拠を明らかにすることが求められている。異常の判断根拠を提示可能な異常検知技術として、正常時系列データに含まれる部分時系列パターンを学習し、異常診断時に、学習した部分時系列パターンに対する差異を検出して異常の判断根拠として提示する技術が知られている。
特許第6877245号公報 国際公開第2022/054256号
本発明は、時系列データに基づく状態の検知を、より高精度に実行できる情報処理装置、情報処理方法およびプログラムを提供することを目的とする。
実施形態の情報処理装置は、類似度算出部と決定部とを備える。類似度算出部は、データ長が特定値である時系列データの各時刻での値の確率をそれぞれモデル化した複数の確率モデルと、診断対象とする対象時系列データに含まれる、データ長が特定値である複数の部分時系列データと、の間の第1類似度を算出する。決定部は、対象時系列データ内での部分時系列データの位置と、位置の部分時系列データとの間の第1類似度が他の前記確率モデルより大きい第1確率モデルと、第1確率モデルに対する第1類似度と、を含む複数のマッチング情報を決定する。
揺らぎを考慮しない場合の異常検知の例を説明するための図。 揺らぎを考慮する場合の異常検知の例を説明するための図。 第1の実施形態にかかる情報処理装置のブロック図。 第1の実施形態における学習処理のフローチャート。 第1の実施形態における診断処理のフローチャート。 出力情報の一例を示す図。 第2の実施形態にかかる情報処理装置のブロック図。 第2の実施形態における学習処理のフローチャート。 実施形態にかかる情報処理装置のハードウェア構成図。
以下に添付図面を参照して、この発明にかかる情報処理装置の好適な実施形態を詳細に説明する。以下では、時系列データの状態として異常を検知する場合を例に説明する。検知する状態は異常に限られず、どのような状態であってもよい。
異常検知の対象となる時系列データでは、正常時の時系列データであっても、揺らぎの大きい箇所と小さい箇所が存在しうる。従来の部分時系列を利用した異常検知技術では、揺らぎの大きさが異常度の算出時に反映されないため、揺らぎの大きい部分時系列との差異を過大評価し、揺らぎの小さい部分時系列との差異を過小評価する場合があった。
図1は、揺らぎを考慮しない場合の異常検知の例を説明するための図である。図1のグラフでは、点線のデータが、正常時の時系列データ(時間に対する検出値の変化を示すデータ)の例を示す。実線のデータが、診断の対象となる時系列データの例を示す。上のグラフは、全体的に両者の間に小さい差異が存在する例に相当する。下のグラフは、中央部に差異が大きい箇所が存在するが、その他の箇所ではほとんど両者の間に差異がない場合の例に相当する。
揺らぎを考慮しない場合、例えば、差異が大きい箇所を含む下のグラフの時系列データについて、異常が発生していると診断され、差異が小さい箇所のみを含む上のグラフの時系列データについて、異常が発生していないと診断される。しかし、例えば、中央部は揺らぎが大きい箇所に相当し、差異が大きくても異常と判断すべきではない場合がありうる。また、中央部以外は揺らぎが小さい箇所に相当し、差異が小さくても異常と判断すべき場合がありうる。
そこで、以下の実施形態では、時系列データの各時点での値の揺らぎを考慮して異常を診断可能とする。図2は、揺らぎを考慮する場合の異常検知の例を説明するための図である。
図2の線201a、201bは、それぞれ揺らぎの上限および下限を示すための線である。各時間について、線201b上の当該時間での値を示す下限から、線201a上の当該時間での値を示す上限までの範囲の揺らぎが生じることを意味する。例えば揺らぎの範囲内の差異は異常と判断せず、揺らぎの範囲を超えた差異を異常と判断する場合、上のグラフは、初期の時間の箇所で揺らぎの範囲を超える差異があるため、異常と判断される。下のグラフは、いずれの時間も差異は揺らぎの範囲内であるため、異常と判断されない。
(第1の実施形態)
第1の実施形態にかかる情報処理装置は、診断の対象となる時系列データ(以下、対象時系列データ)に含まれる部分時系列の揺らぎを考慮して異常を検知する。例えば本実施形態の情報処理装置は、以下の機能を備える。
(F1)類似した時系列データ群の様々な部分時系列のパターンを確率モデル群として学習する機能
(F2)対象時系列データの部分時系列(部分時系列データ)と、確率モデルとの間の類似度を算出する機能
(F3)確率モデル群と対象時系列データ上の一定の範囲内の部分時系列データ群と間の類似度を参照し、類似度が他の確率モデルより大きい(例えば最大となる)位置における確率モデルと部分時系列データとを決定する機能
(F4)対象時系列データと確率モデル群との類似度に基づいて異常を検知する機能
対象時系列データは、単一の変数(単変量)の時系列データとする。例えば、対象時系列データは、ある装置の電流および圧力などの物理量を検出するセンサにより得られるセンサデータ、並びに、ECG(ElectroCardioGram)およびEEG(ElectroEncephaloGram)などの生体信号データである。対象時系列データはこれらに限られず、どのような時系列データであってもよい。
センサデータは、センサの検出値そのものでもよいし、検出値の統計値(平均、最大、最小、標準偏差など)でもよいし、同種または異種の複数のセンサの検出値の演算値(例えば、電流と電圧とを乗算した電力)でもよい。
図3は、第1の実施形態にかかる情報処理装置100の構成の一例を示すブロック図である。図3に示すように、情報処理装置100は、受付部101と、学習部102と、類似度算出部103と、決定部104と、検知部105と、出力制御部106と、記憶部121と、を備えている。
情報処理装置100は、学習フェーズおよび診断フェーズの2つの動作フェーズを備える。学習フェーズでは、類似する時系列データ群から、複数の代表的な部分時系列パターンを確率的にモデル化した複数の確率モデル(確率モデル群)が学習される。診断フェーズでは、学習された確率モデル群を用いて、対象時系列データに対する異常診断が行われる。
学習フェーズでは、主に、受付部101、学習部102、および、記憶部121が用いられる。診断フェーズでは、主に、受付部101、類似度算出部103、決定部104、検知部105、および、出力制御部106が用いられる。
受付部101は、情報処理装置100で用いられる各種データの入力を受け付ける。例えば受付部101は、学習部102が学習に用いる学習データ、および、対象時系列データなどの入力を受け付ける。
学習部102は、学習データとして入力される複数の時系列データ(時系列データ群)を用いて、複数の確率モデルを学習する(上記(F1))。例えば学習部102は、複数の学習用の時系列データを用いて、複数の確率モデルを学習する。学習により、データ長が特定値Lである時系列データの各時刻での値の確率をそれぞれモデル化した確率モデルが得られる。例えば各確率モデルは、Lを次元数とする、平均および分散を用いて定められる多次元の確率分布モデルである。データ長は、時系列データの長さを表し、例えば、時系列データに含まれる要素の個数である。各要素が一定時間ごとに得られるような場合は、データ長は、時間の長さで表されてもよい。
記憶部121は、情報処理装置100で用いられる各種データを記憶する。例えば記憶部121は、受付部101により受け付けられたデータ、および、学習部102により学習された確率モデルに関するデータを記憶する。
なお、記憶部121は、フラッシュメモリ、メモリカード、RAM(Random Access Memory)、HDD(Hard Disk Drive)、および、光ディスクなどの一般的に利用されているあらゆる記憶媒体により構成することができる。
類似度算出部103は、学習フェーズで得られた複数の確率モデルと、対象時系列データに含まれる複数の部分時系列データと、の間の類似度(第1類似度)を算出する(上記(F2))。例えば類似度算出部103は、複数の確率モデルのそれぞれと、対象時系列データに含まれるデータ長がLである複数の部分時系列データと、の間の類似度を算出する。
決定部104は、部分時系列データと最も類似する確率モデルを照合(マッチング)する処理を、部分時系列データが対象時系列データ全体を覆う(カバーする)まで繰り返し実行する。決定部104は、照合の結果を示す情報として、対象時系列データ内での部分時系列データの位置と、当該位置の部分時系列データとの間の類似度が他の確率モデルより大きい確率モデル(第1確率モデル)と、第1確率モデルに対する類似度と、を含む複数のマッチング情報を決定して出力する。類似度が他の確率モデルより大きいとは、例えば、類似度が最大であることである。以下では、類似度が最大である場合を例に説明する。
例えば決定部104は、直前に設定された位置から特定値までの範囲に含まれる複数の位置をそれぞれ始点とする複数の部分時系列データのうち、複数の確率モデルのいずれかとの間の類似度が最大となる部分時系列データを求める。決定部104は、求めた部分時系列データと、求めた部分時系列データとの間の類似度が最大となる確率モデルと、最大となる類似度と、を含むマッチング情報を決定する。決定部104は、このような処理を、決定した部分時系列データが、対象時系列データ全体を覆うように複数回繰り返し実行し、複数のマッチング情報を出力する。
決定部104による処理は、事前に得られた様々なパターンの確率モデルのうち、対象時系列データに最も適合する複数の確率モデルを順次決定する処理であると解釈することができる(上記(F3))。
検知部105は、複数のマッチング情報に含まれる複数の類似度を用いて、対象時系列データの異常を検知する(上記(F4))。例えば検知部105は、複数の類似度の最小値が閾値より小さい場合に、対象時系列データに異常があることを検知する。
出力制御部106は、情報処理装置100で用いられる各種データの出力を制御する。例えば出力制御部106は、検知部105による検知結果を出力する。出力制御部106は、時系列データが正常であると想定される正常範囲を含む出力情報を出力してもよい。正常範囲は、例えば、確率モデルの平均および分散を用いて求めることができる。
出力制御部106による出力方法はどのような方法であってもよいが、例えば、液晶ディスプレイなどの表示装置に表示する方法、プリンタなどの画像形成装置を用いて記録媒体に出力する方法、および、外部の装置(サーバ、他の情報処理装置など)にデータを送信する方法などを適用できる。
上記各部(受付部101、学習部102、類似度算出部103、決定部104、検知部105、および、出力制御部106)は、例えば、1または複数のプロセッサにより実現される。例えば上記各部は、CPU(Central Processing Unit)などのプロセッサにプログラムを実行させること、すなわちソフトウェアにより実現してもよい。上記各部は、専用のIC(Integrated Circuit)などのプロセッサ、すなわちハードウェアにより実現してもよい。上記各部は、ソフトウェアおよびハードウェアを併用して実現してもよい。複数のプロセッサを用いる場合、各プロセッサは、各部のうち1つを実現してもよいし、各部のうち2つ以上を実現してもよい。
上記各部は、物理的の異なる複数の装置に分散して備えられてもよい。例えば、学習フェーズで用いられる構成部(受付部101、学習部102、記憶部121など)と、診断フェーズで用いられる構成部(受付部101、類似度算出部103、決定部104、検知部105、出力制御部106、記憶部121など)と、を相互に異なる装置(2つのサーバなど)に備えるように構成してもよい。上記各部の一部または全部は、クラウド環境上に構築されるサーバに備えられてもよい。
次に、第1の実施形態にかかる情報処理装置100による学習処理について説明する。学習処理は、学習フェーズで実行される処理である。図4は、第1の実施形態における学習処理の一例を示すフローチャートである。
受付部101は、外部装置などから、学習データの入力を受け付ける(ステップS101)。学習データは、例えば、類似した時系列データの集合である時系列データ群Xである。時系列データ群Xは、正常ラベルおよび異常ラベルといった教師情報を持たない。時系列データ群XにはN個の単変量の時系列データxが含まれる。各時系列データxはデータ長をTとする。すなわち、各時系列データxは、T個の点を含む。各時系列データxの各要素をx,・・・,xと表す。
学習部102は、時系列データ群Xを受け取り、時系列データ群Xに含まれるデータ長Lの部分時系列データのパターンを確率的にモデル化した確率モデルMをK個学習する(ステップS102)。Kは、例えば学習により求める確率モデルMの個数として予め指定される。
以下では、個々の確率モデルをM(k=1,・・・,K)と表す。確率モデルMは、部分時系列データのデータ長Lに等しい次元数を持つ多次元確率分布で表現される。本実施形態では平均をμ、共分散行列をΣとする正規分布を想定する。ただし、平均μおよび共分散行列Σの各次元は、部分時系列データの各データ点に対応する。各データ点すなわち各次元は独立であり、共分散行列Σは対角行列とする。言い換えると、確率モデルMは、各次元(各データ点)が独立であり、共分散行列Σが対角行列であり、次元数がLである多次元確率分布となるように学習される。
学習方法は、時系列データ群Xから上記のような確率モデルMを学習できる方法であればどのような方法でもよい。例えば、学習部102は、ガウス混合モデルクラスタリングのような機械学習手法を用いてもよいし、k平均(k-means)法、統計的手法、おおよび、最適化手法を組み合わせた方法を用いてもよい。また、確率モデルは正規分布に限られず、指数分布などの他の確率分布が用いられてもよい。
学習部102は、学習したK個の確率モデルを記憶部121に記憶し(ステップS103)、学習処理を終了する。
次に、第1の実施形態にかかる情報処理装置100による診断処理について説明する。診断処理は、診断フェーズで実行される処理である。図5は、第1の実施形態における診断処理の一例を示すフローチャートである。
受付部101は、外部装置などから、対象時系列データxの入力を受け付ける(ステップS201)。対象時系列データxは、学習データとして用いた時系列データ群Xと等しいデータ長Tの同種のデータである。
類似度算出部103は、マッチング範囲を設定する(ステップS202)。マッチング範囲とは、確率モデルとの類似度を算出する対象となる部分時系列データの始点が含まれる範囲として定められる一定の範囲を示す。マッチング範囲は、例えば、直前に設定された位置(マッチング位置)からデータ長Lまでの範囲として設定される。マッチング位置とは、直前の繰り返し処理で、複数の確率モデルのいずれかとの間の類似度が最大となる部分時系列データとして求められた部分時系列データの始点の位置を示す。なお、最初の繰り返し処理では、対象時系列データの先頭のみが、マッチング範囲として設定される。
本実施形態の繰り返し処理の流れは、例えば、特許文献1に記載されたフィッティング処理の流れと同様である。フィッティング処理では、時系列データの各時刻での値の確率をモデル化した確率モデルは用いられない点が、本実施形態とは異なる。
類似度算出部103は、対象時系列データxに含まれる、マッチング範囲内を始点とする1個以上の部分時系列データと、確率モデル群に含まれる複数の確率モデルそれぞれと、の間の類似度を算出する(ステップS203)。
以下では、対象時系列データxのi点目からi+L-1点目までの部分時系列データをx[ii+L-1]=[x,・・・,xi+L-1]と表す。また、x[ii+L]と、k番目(1≦k≦K)の確率モデルMと、の間の類似度をDと表す。
最初の繰り返し処理では、類似度算出部103は、対象時系列データxの1点目からL点目までの1個の部分時系列データx[1L]=[x,・・・,x]と、K個の確率モデルM,・・・,Mそれぞれとの間のK個の類似度(類似度群)D1,1・・・,D1,Kを算出する。
類似度は、部分時系列データと、確率モデルとが類似する度合いを示す情報であれば、どのような情報であってもよい。例えば類似度算出部103は、カルバックライブラー距離およびピアソン距離などの確率分布の距離に基づく値を類似度として算出してもよい。
類似度算出部103は、部分時系列データを確率モデルに拡張し、拡張した確率モデルと、複数の確率モデルMと、の間の距離に基づく値を類似度として算出してもよい。例えば、カルバックライブラー距離を用いる場合、類似度算出部103は、部分時系列データx[1L]=を、部分時系列データx[i,i+L-1]と共分散行列Σとをパラメータとする、正規分布に従う確率分布P=N(x[i,i+L-1],Σ)に拡張する。類似度算出部103は、拡張した確率分布(確率モデルの一例)と、確率モデルMが示す確率分布Q=N(x[i,i+L-1],Σ)との間のカルバックライブラー距離KL(P,Q)を算出する。
カルバックライブラー距離は、その値が大きいほど類似度が小さいことを意味する。従って、類似度算出部103は、カルバックライブラー距離の逆数を求める演算、または、カルバックライブラー距離を負の値に変換してネイピア数を底とした指数関数に入力する演算などにより得られる値を、類似度として用いる。
類似度算出部103は、確率分布の距離を用いずに、対数尤度を用いる方法により、類似度を算出してもよい。例えば、平均μ、共分散行列Σをパラメータとする多変量正規分布の確率密度関数をf(x|μ,Σ)とすると、類似度算出部103は、部分時系列データx[i,i+L-1]とモデルMとの間の類似度を、logf(x[i,i+L-1]|μ,Σ)として算出できる。
決定部104は、類似度が最大となる確率モデル、および、部分時系列データの位置(マッチング位置)を決定し、決定した位置を始点とする部分時系列データと、当該部分時系列データとの類似度が最大となる確率モデルと、最大となる類似度と、を含むマッチング情報を出力する(ステップS204)。例えば決定部104は、まず、算出された類似度群D1,1・・・,D1,Kのうち最大の類似度を選択する。類似度が最大となる確率モデルは、対象時系列データxに最も近いモデルを表す。決定部104は、マッチング情報を、類似度算出部103および検知部105に出力する。なお、最初の繰り返し処理では、マッチング位置は1となる。
決定部104は、対象時系列データの最終位置まで処理したか否かを判定する(ステップS205)。例えば決定部104は、マッチング位置が、対象時系列データのT-L点目となった場合、最終位置まで処理したと判定する。この判定は、部分時系列データと最も類似する確率モデルを照合する処理を、部分時系列データが対象時系列データ全体を覆うまで処理したかを判定することに相当する。
対象時系列データの最終位置まで処理していない場合(ステップS205:No)、ステップS202に戻り、次のマッチング範囲を設定して処理が繰り返される。2回目以降の繰り返し処理は、例えば以下のように実行される。
類似度算出部103は、決定部104により直前に出力されたマッチング位置を参照し、マッチング範囲を設定する。直前に出力されたマッチング位置をjとすると、j+1から、データ長Lを加えた位置までの範囲が、マッチング範囲として設定される(ステップS202)。
類似度算出部103は、マッチング範囲内のいずれかの点を始点(開始位置)とする、対象時系列データx内のL個の部分時系列データ群x[j+1,j+L],・・・,x[j+L,j+2L-1]と、K個の確率モデル群M,・・・,Mとのすべての組み合わせについて、類似度を算出する(ステップS203)。この結果、L×K個の類似度が算出される。
ただし、j+2Lがxの時系列長Tを超える場合は、類似度算出部103は、部分時系列データ群x[j+1,j+1+L],・・・,x[T-L,T]と、K個の確率モデル群M,・・・,Mとのすべての組み合わせについて類似度群を算出する。
決定部104は、算出された類似度群Di,k(i=j+1,...,j+L,k=1,...,K)のうち最大の類似度を決定し、マッチング情報を出力する(ステップS204)。
ステップS205で、対象時系列データの最終位置まで処理したと判定された場合(ステップS205:Yes)、検知部105は、マッチング系列を参照し、対象時系列データに異常があるか否かを検知する(ステップS206)。マッチング系列は、例えば、これまで出力されたマッチング情報を順に並べた情報である。
例えば検知部105は、マッチング系列から異常度を算出する。異常度は、例えば、マッチング系列に含まれる複数の類似度(類似度列)に関する統計値でもよいし、複数の類似度に対して演算を行った値でもよい。統計値は、例えば、複数の類似度のうち最小値、複数の類似度のうち最大値、または、複数の類似度の平均値である。検知部105は、算出した異常度が、予め定められた閾値より小さい場合、異常と判定する。
出力制御部106は、異常の検知結果を出力する(ステップS207)。出力制御部106は、正常であるか異常であるかを示す判定結果のみを出力してもよいし、判定結果に加えてマッチング情報に基づく情報を出力してもよい。例えば複数の類似度のうち最小値を異常度として用いる場合、出力制御部106は、マッチング情報に含まれるマッチング位置のうち、最小値を取る類似度に対応するマッチング位置を異常箇所として出力する。
上記のように、出力制御部106は、正常範囲を含む出力情報を出力してもよい。例えば、確率モデルが正規分布である場合、出力制御部106は、確率モデルの平均値パラメータμに共分散行列Σの対角成分(σ2 ,・・・,σ2 )のp倍(pは0より大きい実数)を減算した値を正常範囲の下限とし、平均値パラメータμに共分散行列Σの対角成分(σ2 ,・・・,σ2 )のp倍を加算した値を正常範囲の上限として正常範囲を定める。出力制御部106は、対象時系列データxにおいて、マッチング情報に含まれるマッチング位置を基準として正常範囲を出力する。このように、出力制御部106は、正常範囲を含む情報を、異常判定の根拠として出力することが可能となる。
図6は、出力される出力情報600の一例を示す図である。図6に示すように、出力情報600は、対象時系列データ601と、異常箇所を含むマッチング位置602と、正常範囲611とを含む。なお、対象時系列データ601は、右方向を時間とし、上方向を値とするデータである。正常範囲611は、対象時系列データ601の各時間の値を中心とし、上方向に取られた下限と、下方向に取られた下限と、で囲まれる範囲に相当する。
このように、第1の実施形態では、時系列データの各時点での揺らぎを考慮した確率モデルを用いて、診断対象となる対象時系列データの異常を検知する。これにより、時系列データに基づく異常検知をより高精度に実行できる。
(第2の実施形態)
第2の実施形態にかかる情報処理装置は、さらに、確率モデルの出現順序の特性を表す連鎖パターンをモデル化した連鎖モデルを考慮する。例えば本実施形態の情報処理装置は、連鎖モデルを学習する機能、および、連鎖モデルも考慮して類似度を算出する機能が追加される。
図7は、第2の実施形態にかかる情報処理装置100-2の構成の一例を示すブロック図である。図7に示すように、情報処理装置100-2は、受付部101と、学習部102-2と、類似度算出部103-2と、決定部104と、検知部105と、出力制御部106と、記憶部121-2と、を備えている。
第2の実施形態では、学習部102-2、類似度算出部103-2および記憶部121-2の機能が第1の実施形態と異なっている。その他の構成および機能は、第1の実施形態にかかる情報処理装置100のブロック図である図3と同様であるので、同一符号を付し、ここでの説明は省略する。
学習部102-2は、連鎖モデルを学習する機能をさらに備える点が、第1の実施形態の学習部102と異なっている。例えば学習部102-2は、ある確率モデルMAの次に他の確率モデルMBが出現する確率を離散分布(例えばカテゴリカル分布)としてモデル化し、ベイズ推定によって学習する。連鎖モデルの学習方法はこれに限られず、確率モデルの出現順序のパターンをモデル化して学習する方法であれば、どのような方法であってもよい。
類似度算出部103-2は、類似度の算出時に、連鎖モデルとの類似度を考慮する点が、第1の実施形態の類似度算出部103と異なっている。連鎖モデルに対する類似度は、確率モデルとの間の類似度とは独立して算出される。例えば、部分時系列データと連鎖モデルとの類似度は、連鎖モデルに関する尤度である。
類似度算出部103-2は、例えば、以下のようにして、部分時系列データと、確率モデルとの間の類似度SA(第1類似度)を算出する。まず、類似度算出部103-2は、L個の部分時系列データ群に含まれる部分時系列データDA(第1データ)それぞれについて、複数の確率モデルとの間の類似度SB(第2類似度)を算出する。また、類似度算出部103-2は、直前のマッチング情報から出力される確率モデルを参照し、連鎖モデルに対して複数の確率モデルがマッチングした場合の連鎖モデルに関する尤度を類似度SC(第3類似度)として算出する。例えば、直前にマッチングした確率モデルをMk1、算出対象とする確率モデルをMk2とすると、条件付き確率p(Mk2|Mk1)の値(またはその対数)が尤度として用いられる。なお、直前にマッチングした確率モデルがないループの最初の場合は、条件付けない確率p(Mk2)などが尤度として用いられる。そして類似度算出部103-2は、類似度SBと類似度SCとを用いた演算により類似度SAを算出する。このときの演算はどのような演算であってもよいが、例えば、加算、重み付け加算、および、乗算などである。
記憶部121-2は、学習部102-2により学習された連鎖モデルに関するデータをさらに記憶する。
次に、第2の実施形態にかかる情報処理装置100-2による学習処理について図8を用いて説明する。図8は、第2の実施形態における学習処理の一例を示すフローチャートである。
ステップS301は、第1の実施形態にかかる情報処理装置100におけるステップS101と同様の処理なので、その説明を省略する。
学習部102-2は、まず、時系列データ群Xを用いて、第1の実施形態と同様の手順により、確率モデルMをK個学習する。その後、学習部102-2は、確率モデルMの出現順序の特性を表す連鎖パターンをモデル化した連鎖モデルを学習する(ステップS302)。学習部102-2は、当該複数の確率モデルの順序を示す情報と、を含む学習データを外部装置などから取得し、これらの学習データを用いて連鎖パターンを学習してもよい。
学習部102-2は、学習したK個の確率モデルと、学習した連鎖モデルと、を記憶部121-2に記憶し(ステップS303)、学習処理を終了する。
次に、第2の実施形態にかかる情報処理装置100-2による診断処理について説明する。本実施形態では、類似度を算出するときに、連鎖モデルとの類似度を考慮する点が、第1の実施形態と異なっている。図5の診断処理では、ステップS203で類似度を算出する処理が変更される。ステップS203以外の処理の流れは、第1の実施形態と同様のであるため説明を省略する。
例えば類似度算出部103-2は、まず、対象時系列データxに含まれる、マッチング範囲内を始点とする複数の部分時系列データそれぞれについて、確率モデル群に含まれる複数の確率モデルそれぞれと、の間の類似度SBを算出する。類似度算出部103-2は、類似度SBを算出した部分時系列データに対して連続して出現する複数の部分時系列データと、連鎖モデルとの間の類似度SCを算出する。類似度算出部103-2は、類似度SBと類似度SCとの演算により、類似度SAを算出する。
このように、第2の実施形態では、確率モデルの出現順序をモデル化した連鎖モデルも考慮して時系列データに基づく異常を検知することができる。
以上説明したとおり、第1から第2の実施形態によれば、時系列データに基づく状態の検知を、より高精度に実行できる。
次に、第1または第2の実施形態にかかる情報処理装置のハードウェア構成について図9を用いて説明する。図9は、第1または第2の実施形態にかかる情報処理装置のハードウェア構成例を示す説明図である。
第1または第2の実施形態にかかる情報処理装置は、CPU(Central Processing Unit)51などの制御装置と、ROM(Read Only Memory)52やRAM(Random Access Memory)53などの記憶装置と、ネットワークに接続して通信を行う通信I/F54と、各部を接続するバス61を備えている。
第1または第2の実施形態にかかる情報処理装置で実行されるプログラムは、ROM52等に予め組み込まれて提供される。
第1または第2の実施形態にかかる情報処理装置で実行されるプログラムは、インストール可能な形式または実行可能な形式のファイルでCD-ROM(Compact Disk Read Only Memory)、フレキシブルディスク(FD)、CD-R(Compact Disk Recordable)、DVD(Digital Versatile Disk)等のコンピュータで読み取り可能な記録媒体に記録してコンピュータプログラムプロダクトとして提供されるように構成してもよい。
さらに、第1または第2の実施形態にかかる情報処理装置で実行されるプログラムを、インターネット等のネットワークに接続されたコンピュータ上に格納し、ネットワーク経由でダウンロードさせることにより提供するように構成してもよい。また、第1または第2の実施形態にかかる情報処理装置で実行されるプログラムをインターネット等のネットワーク経由で提供または配布するように構成してもよい。
第1または第2の実施形態にかかる情報処理装置で実行されるプログラムは、コンピュータを上述した情報処理装置の各部として機能させうる。このコンピュータは、CPU51がコンピュータ読取可能な記憶媒体からプログラムを主記憶装置上に読み出して実行することができる。
本発明のいくつかの実施形態を説明したが、これらの実施形態は、例として提示したものであり、発明の範囲を限定することは意図していない。これら新規な実施形態は、その他の様々な形態で実施されることが可能であり、発明の要旨を逸脱しない範囲で、種々の省略、置き換え、変更を行うことができる。これら実施形態やその変形は、発明の範囲や要旨に含まれるとともに、特許請求の範囲に記載された発明とその均等の範囲に含まれる。
実施形態の構成例について以下に記載する。
(構成例1)
データ長が特定値である時系列データの各時刻での値の確率をそれぞれモデル化した複数の確率モデルと、診断対象とする対象時系列データに含まれる、データ長が前記特定値である複数の部分時系列データと、の間の第1類似度を算出する類似度算出部と、
前記対象時系列データ内での前記部分時系列データの位置と、前記位置の前記部分時系列データとの間の前記第1類似度が他の前記確率モデルより大きい第1確率モデルと、前記第1確率モデルに対する前記第1類似度と、を含む複数のマッチング情報を決定する決定部と、
を備える情報処理装置。
(構成例2)
複数の前記確率モデルのそれぞれは、前記特定値を次元数とし、平均および分散を用いて定められる多次元の確率分布モデルである、
構成例1に記載の情報処理装置。
(構成例3)
前記平均および前記分散を用いて、時系列データが正常であると想定される正常範囲を求め、前記正常範囲を含む出力情報を出力する出力制御部をさらに備える、
構成例2に記載の情報処理装置。
(構成例4)
前記類似度算出部は、前記部分時系列データを確率モデルに拡張し、拡張した確率モデルと、複数の前記確率モデルと、の間の距離に基づく値を前記第1類似度として算出する、
構成例1から3のいずれか1つに記載の情報処理装置。
(構成例5)
前記類似度算出部は、
複数の前記部分時系列データに含まれる第1データそれぞれについて、
複数の前記確率モデルとの間の第2類似度を算出し、
複数の前記確率モデルの出現順序のパターンをモデル化した連鎖モデルと、複数の前記部分時系列データのうち前記第1データを含む複数の前記部分時系列データと、の間の第3類似度を算出し、
前記第2類似度と前記第3類似度とを用いた演算により前記第1類似度を算出する、
構成例1から4のいずれか1つに記載の情報処理装置。
(構成例6)
複数の前記マッチング情報に含まれる複数の前記第1類似度を用いて、前記対象時系列データの状態を検知する検知部をさらに備える、
構成例1から5のいずれか1つに記載の情報処理装置。
(構成例7)
前記検知部は、複数の前記マッチング情報に含まれる複数の前記第1類似度の最小値が閾値より小さい場合に、前記対象時系列データに異常があることを検知する、
構成例6に記載の情報処理装置。
(構成例8)
複数の学習用の時系列データを用いて、複数の前記確率モデルを学習する学習部をさらに備える、
構成例1から7のいずれか1つに記載の情報処理装置。
(構成例9)
前記決定部は、直前に設定された前記位置から前記特定値までの範囲に含まれる複数の位置をそれぞれ始点とする複数の前記部分時系列データのうち、複数の前記確率モデルのいずれかとの間の前記第1類似度が最大となる前記部分時系列データを求め、求めた前記部分時系列データと、求めた前記部分時系列データとの間の前記第1類似度が最大となる前記確率モデルと、最大となる前記第1類似度と、を含む前記マッチング情報を決定する処理を複数回繰り返し実行し、複数の前記マッチング情報を出力する、
構成例1から8のいずれか1つに記載の情報処理装置。
(構成例10)
前記第1確率モデルは、前記位置の前記部分時系列データとの間の前記第1類似度が最大の前記確率モデルである、
構成例1から9のいずれか1つに記載の情報処理装置。
(構成例11)
情報処理装置で実行される情報処理方法であって、
データ長が特定値である時系列データの各時刻での値の確率をそれぞれモデル化した複数の確率モデルと、診断対象とする対象時系列データに含まれる、データ長が前記特定値である複数の部分時系列データと、の間の第1類似度を算出する類似度算出ステップと、
前記対象時系列データ内での前記部分時系列データの位置と、前記位置の前記部分時系列データとの間の前記第1類似度が他の前記確率モデルより大きい第1確率モデルと、前記第1確率モデルに対する前記第1類似度と、を含む複数のマッチング情報を決定する決定ステップと、
を含む情報処理方法。
(構成例12)
コンピュータに、
データ長が特定値である時系列データの各時刻での値の確率をそれぞれモデル化した複数の確率モデルと、診断対象とする対象時系列データに含まれる、データ長が前記特定値である複数の部分時系列データと、の間の第1類似度を算出する類似度算出ステップと、
前記対象時系列データ内での前記部分時系列データの位置と、前記位置の前記部分時系列データとの間の前記第1類似度が他の前記確率モデルより大きい第1確率モデルと、前記第1確率モデルに対する前記第1類似度と、を含む複数のマッチング情報を決定する決定ステップと、
を実行させるためのプログラム。
100、100-2 情報処理装置
101 受付部
102、102-2 学習部
103、103-2 類似度算出部
104 決定部
105 検知部
106 出力制御部
121、121-2 記憶部

Claims (12)

  1. データ長が特定値である時系列データの各時刻での値の確率をそれぞれモデル化した複数の確率モデルと、診断対象とする対象時系列データに含まれる、データ長が前記特定値である複数の部分時系列データと、の間の第1類似度を算出する類似度算出部と、
    前記対象時系列データ内での前記部分時系列データの位置と、前記位置の前記部分時系列データとの間の前記第1類似度が他の前記確率モデルより大きい第1確率モデルと、前記第1確率モデルに対する前記第1類似度と、を含む複数のマッチング情報を決定する決定部と、
    を備える情報処理装置。
  2. 複数の前記確率モデルのそれぞれは、前記特定値を次元数とし、平均および分散を用いて定められる多次元の確率分布モデルである、
    請求項1に記載の情報処理装置。
  3. 前記平均および前記分散を用いて、時系列データが正常であると想定される正常範囲を求め、前記正常範囲を含む出力情報を出力する出力制御部をさらに備える、
    請求項2に記載の情報処理装置。
  4. 前記類似度算出部は、前記部分時系列データを確率モデルに拡張し、拡張した確率モデルと、複数の前記確率モデルと、の間の距離に基づく値を前記第1類似度として算出する、
    請求項1に記載の情報処理装置。
  5. 前記類似度算出部は、
    複数の前記部分時系列データに含まれる第1データそれぞれについて、
    複数の前記確率モデルとの間の第2類似度を算出し、
    複数の前記確率モデルの出現順序のパターンをモデル化した連鎖モデルと、複数の前記部分時系列データのうち前記第1データを含む複数の前記部分時系列データと、の間の第3類似度を算出し、
    前記第2類似度と前記第3類似度とを用いた演算により前記第1類似度を算出する、
    請求項1に記載の情報処理装置。
  6. 複数の前記マッチング情報に含まれる複数の前記第1類似度を用いて、前記対象時系列データの状態を検知する検知部をさらに備える、
    請求項1に記載の情報処理装置。
  7. 前記検知部は、複数の前記マッチング情報に含まれる複数の前記第1類似度の最小値が閾値より小さい場合に、前記対象時系列データに異常があることを検知する、
    請求項6に記載の情報処理装置。
  8. 複数の学習用の時系列データを用いて、複数の前記確率モデルを学習する学習部をさらに備える、
    請求項1に記載の情報処理装置。
  9. 前記決定部は、直前に設定された前記位置から前記特定値までの範囲に含まれる複数の位置をそれぞれ始点とする複数の前記部分時系列データのうち、複数の前記確率モデルのいずれかとの間の前記第1類似度が最大となる前記部分時系列データを求め、求めた前記部分時系列データと、求めた前記部分時系列データとの間の前記第1類似度が最大となる前記確率モデルと、最大となる前記第1類似度と、を含む前記マッチング情報を決定する処理を複数回繰り返し実行し、複数の前記マッチング情報を出力する、
    請求項1に記載の情報処理装置。
  10. 前記第1確率モデルは、前記位置の前記部分時系列データとの間の前記第1類似度が最大の前記確率モデルである、
    請求項1に記載の情報処理装置。
  11. 情報処理装置で実行される情報処理方法であって、
    データ長が特定値である時系列データの各時刻での値の確率をそれぞれモデル化した複数の確率モデルと、診断対象とする対象時系列データに含まれる、データ長が前記特定値である複数の部分時系列データと、の間の第1類似度を算出する類似度算出ステップと、
    前記対象時系列データ内での前記部分時系列データの位置と、前記位置の前記部分時系列データとの間の前記第1類似度が他の前記確率モデルより大きい第1確率モデルと、前記第1確率モデルに対する前記第1類似度と、を含む複数のマッチング情報を決定する決定ステップと、
    を含む情報処理方法。
  12. コンピュータに、
    データ長が特定値である時系列データの各時刻での値の確率をそれぞれモデル化した複数の確率モデルと、診断対象とする対象時系列データに含まれる、データ長が前記特定値である複数の部分時系列データと、の間の第1類似度を算出する類似度算出ステップと、
    前記対象時系列データ内での前記部分時系列データの位置と、前記位置の前記部分時系列データとの間の前記第1類似度が他の前記確率モデルより大きい第1確率モデルと、前記第1確率モデルに対する前記第1類似度と、を含む複数のマッチング情報を決定する決定ステップと、
    を実行させるためのプログラム。
JP2022138164A 2022-08-31 2022-08-31 情報処理装置、情報処理方法およびプログラム Pending JP2024034122A (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2022138164A JP2024034122A (ja) 2022-08-31 2022-08-31 情報処理装置、情報処理方法およびプログラム
US18/174,190 US20240070496A1 (en) 2022-08-31 2023-02-24 Information processing device, information processing method, and computer program product

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2022138164A JP2024034122A (ja) 2022-08-31 2022-08-31 情報処理装置、情報処理方法およびプログラム

Publications (1)

Publication Number Publication Date
JP2024034122A true JP2024034122A (ja) 2024-03-13

Family

ID=89996433

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2022138164A Pending JP2024034122A (ja) 2022-08-31 2022-08-31 情報処理装置、情報処理方法およびプログラム

Country Status (2)

Country Link
US (1) US20240070496A1 (ja)
JP (1) JP2024034122A (ja)

Also Published As

Publication number Publication date
US20240070496A1 (en) 2024-02-29

Similar Documents

Publication Publication Date Title
US10430690B1 (en) Machine learning predictive labeling system
Li et al. Data-driven bearing fault identification using improved hidden Markov model and self-organizing map
US11087215B1 (en) Machine learning classification system
JP6972389B2 (ja) システム状態を解析及び修正するための時系列の検索
JP6679266B2 (ja) データ解析装置、データ解析方法及びプログラム
CN109241318B (zh) 图片推荐方法、装置、计算机设备及存储介质
JP6097517B2 (ja) 状態診断方法、および、状態診断装置
US11146580B2 (en) Script and command line exploitation detection
US10452961B2 (en) Learning temporal patterns from electronic health records
US11379685B2 (en) Machine learning classification system
US20230085991A1 (en) Anomaly detection and filtering of time-series data
CN111512322A (zh) 使用神经网络
CN111178548A (zh) 集成学习预测方法与系统
JP7268756B2 (ja) 劣化抑制プログラム、劣化抑制方法および情報処理装置
CN113056793A (zh) 基于监督学习的一致性诊断方法及其系统
JP6950504B2 (ja) 異常候補抽出プログラム、異常候補抽出方法および異常候補抽出装置
JPWO2019244203A1 (ja) 診断装置、診断方法及びプログラム
US20200081817A1 (en) Replacing stair-stepped values in time-series sensor signals with inferential values to facilitate prognostic-surveillance operations
JP5791555B2 (ja) 状態追跡装置、方法、及びプログラム
US11195084B1 (en) Neural network training system
CN116974268B (zh) 一种控制系统电路智能化监测预警方法
JP5017941B2 (ja) モデル作成装置および識別装置
CN110414562B (zh) X光片的分类方法、装置、终端及存储介质
JP2024034122A (ja) 情報処理装置、情報処理方法およびプログラム
CN112561073A (zh) 使用基于批次的主动学习方案训练机器学习模型