JP2018205994A - 時系列データ分析装置、時系列データ分析方法およびコンピュータプログラム - Google Patents

時系列データ分析装置、時系列データ分析方法およびコンピュータプログラム Download PDF

Info

Publication number
JP2018205994A
JP2018205994A JP2017109553A JP2017109553A JP2018205994A JP 2018205994 A JP2018205994 A JP 2018205994A JP 2017109553 A JP2017109553 A JP 2017109553A JP 2017109553 A JP2017109553 A JP 2017109553A JP 2018205994 A JP2018205994 A JP 2018205994A
Authority
JP
Japan
Prior art keywords
feature
series data
time series
waveform
time
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2017109553A
Other languages
English (en)
Other versions
JP6877245B2 (ja
Inventor
晃広 山口
Akihiro Yamaguchi
晃広 山口
西川 武一郎
Takeichiro Nishikawa
武一郎 西川
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Original Assignee
Toshiba Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp filed Critical Toshiba Corp
Priority to JP2017109553A priority Critical patent/JP6877245B2/ja
Priority to US15/916,951 priority patent/US20180349320A1/en
Publication of JP2018205994A publication Critical patent/JP2018205994A/ja
Application granted granted Critical
Publication of JP6877245B2 publication Critical patent/JP6877245B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • G06N20/10Machine learning using kernel methods, e.g. support vector machines [SVM]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F17/00Digital computing or data processing equipment or methods, specially adapted for specific functions
    • G06F17/10Complex mathematical operations
    • G06F17/11Complex mathematical operations for solving equations, e.g. nonlinear equations, general mathematical optimization problems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F17/00Digital computing or data processing equipment or methods, specially adapted for specific functions
    • G06F17/10Complex mathematical operations
    • G06F17/16Matrix or vector computation, e.g. matrix-matrix or matrix-vector multiplication, matrix factorization
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F17/00Digital computing or data processing equipment or methods, specially adapted for specific functions
    • G06F17/10Complex mathematical operations
    • G06F17/18Complex mathematical operations for evaluating statistical data, e.g. average values, frequency distributions, probability functions, regression analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • G06F18/2411Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on the proximity to a decision surface, e.g. support vector machines
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/243Classification techniques relating to the number of classes
    • G06F18/2433Single-class perspective, e.g. one-against-all classification; Novelty detection; Outlier detection
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2218/00Aspects of pattern recognition specially adapted for signal processing
    • G06F2218/08Feature extraction
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2218/00Aspects of pattern recognition specially adapted for signal processing
    • G06F2218/12Classification; Matching

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • General Physics & Mathematics (AREA)
  • Mathematical Physics (AREA)
  • General Engineering & Computer Science (AREA)
  • Software Systems (AREA)
  • Computational Mathematics (AREA)
  • Pure & Applied Mathematics (AREA)
  • Mathematical Optimization (AREA)
  • Mathematical Analysis (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Computation (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Biology (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Algebra (AREA)
  • Databases & Information Systems (AREA)
  • Computing Systems (AREA)
  • Operations Research (AREA)
  • Medical Informatics (AREA)
  • Probability & Statistics with Applications (AREA)
  • Testing And Monitoring For Control Systems (AREA)

Abstract

【課題】未知の異常の検知にも有効な特徴波形を、教師無し学習で生成する。【解決手段】本発明の実施形態としての時系列データ分析装置は、複数の時系列データに設定された複数の区間の部分時系列と、複数の特徴波形との距離とに基づいて、前記複数の特徴波形の特徴量を算出する特徴ベクトル計算部と、前記特徴量に基づき、前記特徴波形を更新する更新部と、を備える。【選択図】図1

Description

本発明の実施形態は、時系列データ分析装置、時系列データ分析方法およびコンピュータプログラムに関する。
センサデータ分析や経済時系列分析など様々なデータマイニングの分野において、時系列データにおける異常検知技術が重要になってきている。異常検知技術では、異常を検知するだけでなく、異常の原因を究明する技術も求められている。そのような技術として、異常検知および異常の原因の特定に有効な特徴波形であるshapeletsを発見するTime Series Shapelets法(TSS法)が、盛んに研究されている。
これまでのTSS法では、時系列データの中でshapeletsに最もマッチする部分時系列データを特定し、特定した部分時系列データとshapeletsとの距離のみを考慮する。このため、時系列データの中の他の箇所で異常波形が出現しても、これを検知することは難しい。また、TSS法の多くは、教師有りの識別学習であるため、未知の異常を発見することは難しい。
"Learning Time-Series Shapelets", KDD '14 Proceedings of the 20th ACM SIGKDD international conference on Knowledge discovery and data miningPages 392-401/Josif Grabocka et.al/
本発明の実施形態は、未知の異常の検知にも有効な特徴波形を、教師無し学習で生成することを目的とする。
本発明の実施形態としての時系列データ分析装置は、複数の時系列データに設定された複数の区間の部分時系列と、複数の特徴波形との距離とに基づいて、前記複数の特徴波形の特徴量を算出する特徴ベクトル計算部と、前記特徴量に基づき、前記特徴波形を更新する更新部と、を備える。
本発明の実施形態に係る時系列データ分析装置のブロック図。 時系列データ集合Tの例を示す図。 特徴波形集合Sの例を示す図。 特徴波形選択部の動作のフローチャートを示す図。 特徴波形選択部の動作の具体例を示す図。 信頼幅空間から特徴空間への変換例を示す図。 学習されたモデルパラメータにより表される識別境界を模式的に示す図。 学習フェーズの動作のフローチャートを示す図。 出力情報の例を示す図。 出力情報の他の例を示す図。 テストフェーズの動作のフローチャートを示す図。 本発明の実施形態に係る時系列データ分析装置のハードウェア構成を示す図。 複数のマッチング範囲を設定し、マッチング範囲ごとに複数の特徴波形を指定する例を示す図。 複数の時系列データを結合する例を示す図。 本発明の実施形態に係る時系列データ分析システムを示す図。
以下、図面を参照しながら、本発明の実施形態について説明する。
(第1実施形態)
図1は、本発明の実施形態に係る時系列データ分析装置を表すブロック図である。
図1の時系列データ分析装置は、学習用データ記憶部1、特徴波形選択部2、フィッティング結果記憶部3、特徴ベクトル算出部4、更新部5、更新終了判定部6、パラメータ記憶部7、テスト用データ記憶部8、異常検知部9、異常同定部10、および出力情報記憶部11を備える。
本時系列データ分析装置は、学習フェーズと、テストフェーズとを備える。学習フェーズでは、学習用の時系列データを用いて、1クラス(One−Class)識別器のモデルパラメータと、複数の特徴波形とを学習する。テストフェーズでは、学習フェーズで学習したモデルパラメータと複数の特徴波形とを用いて、テスト対象となる時系列データを評価する。これにより、当該テスト対象となる時系列データの分析対象装置に異常が発生したかを判断する。
学習フェーズでは、図1の構成要素のうち、学習用データ記憶部1、特徴波形選択部2、フィッティング結果記憶部3、特徴ベクトル算出部4、更新部5、更新終了判定部6、パラメータ記憶部7を用いる。テストフェーズでは、テスト用データ記憶部8、特徴波形選択部2、フィッティング結果記憶部3、特徴ベクトル算出部4、異常検知部9、異常同定部10、および出力情報記憶部11を用いる。
以下、学習フェーズとテストフェーズに分けて、本装置について説明する。
<学習フェーズ>
学習用データ記憶部1は、複数の分析対象装置から取得した学習用の時系列データを記憶する。学習用の時系列データは、教師無し時系列データである。つまり、時系列データは、正常状態にある分析対象装置から取得された時系列データ(正常時系列データ)である。学習用の時系列データには、正常または異常のラベルが付けられていない。本実施形態において、時系列データは、単一変数の時系列データを想定する。時系列データは、一例として、分析対象装置に設置されたセンサの検出値に基づく時系列データである。時系列データは、センサの検出値そのものでもよいし、検出値の統計値(平均、最大、最小、標準偏差など)でもよいし、複数のセンサの検出値の演算値(例えば電流と電圧とを乗算した電力)でもよい。以下の説明で、時系列データの集合をT、時系列データの個数をIとする。また、各時系列データの長さをQとする。すなわち、各時系列データは、Q個の点からなるデータである。
図2に、学習用データ記憶部1に格納されている時系列データ集合Tの例を示す。集合TにはI個の時系列データが含まれる。各時系列データの長さは同じQである。すなわち、各時系列データは、Q個の点を含む。図では、Q個の点を線でつないだ例が示される。個々の時系列データをTi(i=1,2,…,I)によって表している。任意の時系列データは時系列データiと表現する。本実施形態では、各時系列データの長さは同じQであるが、長さが異なる場合への拡張も可能である。
また、学習用データ記憶部1は、特徴波形の個数Kと、特徴波形の長さLを表す値を記憶している。Lは、時系列データの長さQよりも小さい値である。
ここで、特徴波形は、L個の点からなるデータである。特徴波形の集合をSとすると、SはK×Lの行列である。特徴波形は、Time Series Shapelets法(TSS法)でshapeletと呼ばれるものに相当する。後述するように、特徴波形は、学習フェーズの開始時に初期の形状が決定された後は、繰り返し更新されていく。
図3に、2つ(K=2)の特徴波形を含む特徴波形集合Sの例を示す。各特徴波形の長さはLである。各特徴波形をS、Sで表している。本実施形態では、各特徴波形の長さは同じLであるが、長さが異なる場合への拡張も可能である。
ここで、時系列データiと、特徴波形kとの距離の計算方法を述べる。時系列データiのオフセットをjとする。オフセットとは、時系列データの波形の開始位置(先頭)からの長さのことである。時系列データiのオフセットjにおける特徴波形kとの距離D(より詳細には、時系列データiにおけるオフセットjから長さLの区間の部分時系列と、特徴波形kとの距離D)は、以下のように計算される。ここではユークリッド距離を用いているが、これに限定されず、波形間の類似度を評価可能な距離であれば、どのような種類の距離でもよい。
Figure 2018205994
i,j+l−1は、時系列データ集合Tに含まれる時系列データiにおけるオフセットjの位置から数えてl−1番目の位置の値を表す。Sk,lは、特徴波形集合Sに含まれる特徴波形kの先頭から数えてl番目の位置の値を表す。つまり、式(1)で計算されるDi,k,jは、時系列データiにおけるオフセットjから長さLの区間の部分時系列(部分波形)と、特徴波形kとの間の平均距離に相当する。平均距離が小さいほど、部分時系列と特徴波形kとは類似している。
特徴波形選択部2は、長さLのK個の特徴波形を用いて、時系列データiに設定された複数の区間のそれぞれの部分時系列に最も距離が近い(最もフィットする)特徴波形を特定する。複数の区間は、時系列データiの全体をカバーするように設定される。具体的な動作としては、まず、特徴波形選択部2は、K個の複数の特徴波形から、部分時系列との距離が最も小さい(最もフィットする)特徴波形を選択することを、時系列データの先頭の長さLの区間に対して行う。次に、直前に設定した区間から一定範囲内で、部分時系列との距離が最も小さくなる区間と特徴波形とを特定する。一定の範囲とは、次の区間が、直前の区間と隙間が空かない範囲である。以降、同様の動作を繰り返し行う。これにより、複数の区間の設定と、各区間の部分時系列との距離が最も小さい特徴波形の選択とが行われる。区間の位置(本実施形態では区間の開始位置)をオフセットとして表すと、オフセットと特徴波形との組の集合が生成される。つまり、時系列iの全体に最もフィットするように、特徴波形とオフセットとの組の集合が生成される。このような処理を、フィッティング処理と呼ぶ。
1回目のフィッティング処理では、初期の特徴波形をK個作成し、これらを用いる。後述する更新部5で当該K個の特徴波形が更新された後は、特徴波形選択部2は、直前に更新されたK個の特徴波形を用いる。
初期の特徴波形を生成する処理は、長さLの任意の波形データを生成できる限り、どのような方法を用いてもよい。例えば、ランダムな波形データをK個生成してもよい。あるいは、関連技術と同様の方法で、時系列データ集合Tから得られる長さLの複数の部分時系列にk−means法を適用することによって、K個の波形データを生成してもよい。
図4は、特徴波形選択部2の動作のフローチャートを示す。
まず、ステップS101では、オフセットjを0にする。そして、各時系列データiに対して、時系列データiのオフセット0から長さLの区間の部分時系列との距離Dが最も近い特徴波形を、K個の特徴波形の中から1つ選択する。選択した特徴波形を、特徴波形kとする。この動作により、各時系列データiに対して、(i,k,0)の組が計算される。計算した(i,k,0)と、このとき得られた距離Dの値とを、フィッティング結果記憶部3に格納する。
次に、ステップS102を行う。前回選択したオフセット(現時点では0)をj’と記述する。j’+1から、min(j’+L,Q−L)までの範囲を対象として、時系列データiに最も距離Dが小さい(最もフィットする)、オフセットjと特徴波形kとの組を選択する。min(j’+L,Q−L)は、j’+LとQ−Lとのうちの小さい方を意味する。この動作により、各時系列データiに対して、(i,k,j)の組が得られる。計算した(i,k,j)と、このとき得られた距離Dの値とを、フィッティング結果記憶部3に格納する。
j=Q−Lになったかを判断し(ステップS103)、j=Q−Lでない間は(NO)、ステップS102の動作を繰り返す。j=Q−Lになった場合(YES)、繰り返しを終了する。j=Q−Lになったことは、時系列データの末尾まで処理が完了したことを意味する。すなわち、時系列データの末尾を含む長さLの区間の部分時系列に対する特徴波形が選択されたことを意味する。
図5を用いて、フィッティング処理の具体的な動作例を示す。図5(A)に示すように、、長さQ=10の時系列データiが存在する。長さL=4の2つの特徴波形0、1が存在する。
図5(B)に示すように、オフセットj=0で、時系列データiの先頭から長さ4の区間の部分時系列に対して、特徴波形0、1のそれぞれの距離を計算する。距離が小さい方の特徴波形は特徴波形0であったとする。従って、オフセットj=0に対して、特徴波形0が選択され、(i,0,0)が得られる。(i,0,0)は、フィッティング結果記憶部3に格納される。
次に、オフセット1(=j’+1)から、4(=j’+L)までの範囲の各オフセットを対象として、時系列データiに最もフィットするオフセットjと特徴波形kとの組を選択する。すなわち、オフセット1から始まる長さ4の区間、オフセット2から始まる長さ4の区間、オフセット3から始まる長さ4の区間、オフセット4から始まる長さ4の区間を対象として、これらの区間のうち最も時系列データiにフィットする区間と特徴波形kとの組を選択する。
まず、オフセット1で、時系列データiに最もフィットする(最も距離が小さい)オフセットjと特徴波形kとの組を選択する。同様に、オフセット2、3、4のそれぞれで、時系列データiに最もフィットするオフセットjと特徴波形kとの組を選択する。最も小さい距離が得られたときの組を最終的に選択する。本例ではオフセット4および特徴波形1の組が選択される。したがって、(i,1,4)が、フィッティング結果記憶部3に格納される。
次に、オフセット5(=j’+1)から、8(=j’+L)までの範囲の各オフセットを対象として、時系列データiに最もフィットするオフセットjと特徴波形kとの組を選択する。上記の同様に計算すると、オフセット6および特徴波形1の組が選択される。したがって、(i,1,6)が、フィッティング結果記憶部3に格納される。
jがQ−L=10−4=6に一致したため、フィッティング処理を終了する。
特徴ベクトル算出部4は、フィッティング処理で得られた(i,k,j)を利用して、各時系列データiに対して、各特徴波形との距離Dの最大値である信頼幅Mを計算する。時系列データiに対する特徴波形kの信頼幅Mi,kは、以下の式(2)に基づき計算される。
Figure 2018205994
nは、時系列データiに対して取得された複数のオフセットjについて、何番目のオフセットかを表す番号である。
Niは、時系列データiに対して取得された複数のオフセットjの個数から1を引いた値である。
Figure 2018205994
は、時系列データiに対して取得された複数のオフセットjのうち、n番目のオフセットjの値である。
時系列データiについて、特徴波形kの信頼幅Mi,kは、当該特徴波形kが選択された各オフセットでの距離Dのうち最も大きいもの(式(2)の下側)である。
時系列データiに対して一度も選択されなかった特徴波形kが存在する場合、その特徴波形kについて、時系列データiの開始位置から所定値(例えば1)ずつ増やした各オフセットでの距離を計算する。そして、計算した距離のうち、最も小さいものを信頼幅とする(式(3)の上側)。j=0,1,2,…,JのJは、最後のオフセットが何番目かを表す番号である。
ここでは、特徴波形kの信頼幅として、特徴波形kが選択された各オフセットでの部分時系列との距離Dの最大の距離を用いたが、これに限定されない。例えば、特徴波形kが選択された各オフセットでの部分時系列との距離Dの標準偏差または平均値などでもよい。
特徴ベクトル算出部4は、算出した信頼幅Mi,kに基づき、特徴量Xi,kを算出する。一例として、
Figure 2018205994
である。そして、k=1,2,…,Kの各特徴波形について特徴量を算出し、特徴ベクトルXi=(Xi,1、Xi,2、…、Xi,K)を生成する。信頼幅は正の実数のため、信頼幅が小さいほど、特徴量の空間(特徴空間)では、原点から離れる。逆に、信頼幅が大きいほど、特徴空間では、原点に近くなる。各特徴波形の信頼幅Mi,kを含む信頼幅ベクトルから、特徴ベクトルへの変換の例を図6に示す。図6の左側が信頼幅空間であり、横軸が信頼幅ベクトルの第1成分、縦軸が第2成分である。図6の右側が特徴空間であり、横軸が特徴ベクトルの第1成分、縦軸が第2成分である。いずれの空間も2次元である。
ここで
Figure 2018205994
を、時系列データiのn番目のオフセットjに対して選択された特徴波形kを表すものとする。このとき、
Figure 2018205994
を、以下の式(3)のように定義する。
Figure 2018205994
は、上述したフィッティング処理で時系列データiに対して取得された(k、j)を、後述する最適化処理の式に合わせて、nを用いた表現に書き換えたものである。
Figure 2018205994
式(3)において、Rk,0及びRk,1は、時系列データにおいて特徴波形kを選択可能な範囲(マッチング範囲)を規定する値である。Rk,0はマッチング範囲の始点、Rk,1はマッチング範囲の終点を表す。本実施形態では、特徴波形kは、時系列データの最初から最後の全範囲で選択可能であるため、マッチング範囲を規定するRk,0及びRk,1は、それぞれ0とQに設定される。後述する第2の実施形態のように、時系列データに複数のマッチング範囲を設定し、マッチング範囲毎に、複数の特徴波形を指定してもよい。
更新部5は、1クラス(One−Class)識別器をベースに用いて、教師無しの機械学習を行う。ここでは、1クラス識別器として、One−Class Support Vector Machine(OC−SVM)を想定する。更新部5は、OC−SVMのモデルパラメータの学習(更新)と、特徴波形の学習(更新)とを同時に行う。モデルパラメータは、特徴空間において、正常と異常を判別する識別境界を規定するパラメータに相当する。特徴空間は、Xi,k(k=1,2,…,K)を軸とするK次元の空間であり、特徴波形の個数Kが2であれば、Xi,1とXi,2を軸とする2次元の空間である(前述した図6の右側参照)。なお、“One−Class”は、正常状態の分析対象装置から取得された時系列データ(正常時系列データ)のみを用いることを意味する。OC−SVMは、正常データ集合から構成される線形または非線形の識別境界を学習するアルゴリズム、または当該識別境界に基づき判定を行う識別器である。
本実施形態において、OC−SVMによるモデルパラメータ(識別境界)の学習は、特徴波形の学習と同時に行われる。具体的には、これらの学習は、以下のような最適化問題として定式化される。Wがモデルパラメータを表している。この最適化問題を解くことで、モデルパラメータWと、特徴波形集合S(K×Lの行列)とを求める。
Figure 2018205994
線形の識別境界の場合、識別境界を表す式のパラメータ(重み)は有限個数(例えば2次元であれば、切片と傾きとの2つ)であるため、これらのパラメータをモデルパラメータWとして用いればよい。一方、識別境界が非線形の場合、識別境界を表す式のパラメータ(重み)は無限次元のベクトルとなるため、代わりに、識別境界のモデルパラメータWとして、サポートベクトル集合Svと、集合Svに属するサポートベクトルの寄与率の集合Saとを用いる。
ここで、サポートベクトルは,識別境界の決定に寄与する特徴ベクトルである。寄与率は,そのサポートベクトルが、識別境界の決定にどの程度寄与するかを表しており,寄与率の絶対値が大きいほど、その決定に大きく寄与する(寄与率が0の場合は,識別境界の決定に寄与せず、それに対応する特徴ベクトルはサポートベクトルではない)。SVMでは,カーネル(内積を拡張した関数)と、サポートベクトルとその寄与率とを用いて,非線形の識別境界を表現できる。
式(4)で用いられている記号について説明する。
・Xは、時系列データiに対する特徴ベクトルである。
・λ1とλ2とは、ハイパーパラメータであり、予め値が与えられる。
・l(W;φ(X))は、ヒンジロス関数である。損失関数として、ヒンジロス関数以外の関数を利用してもよい。
・〈X,Y〉は、XとYの内積を表し、有限次元でも、無限次元でも良い。
・φは、特徴空間上における写像を表す。
この最適化問題は、確率的勾配法を用いて効率的に計算することが可能である。最急降下法など、他の種類の勾配法を用いてもよい。最適化の対象である目的関数(式(4)の一番上の式)をFとしたとき、モデルパラメータWによる勾配∂F/∂Wと、特徴波形集合Sによる勾配∂F/∂Sとを計算する必要がある。それらの計算は、微分公式の連鎖律(chain rule)を用いて、以下のようにできる。
Figure 2018205994
∂F/∂Wは、OC−SVMのモデルパラメータW(識別境界)の勾配を求めていることに等しい。OC−SVMを確率的勾配法で効率的に計算する方法として、Pegasos(Primal Estimated sub−GrAdient SOlver for SVM)というアルゴリズムを用いてもよい。Wから、勾配∂F/∂W、またはこれに(学習率に応じた値など)を掛けた値を引くことで、Wを更新できる。
次に、∂F/∂Sの計算については、chain ruleで分解した各勾配を、以下のように計算することで、計算できる。
Figure 2018205994
式(7)は、
Figure 2018205994
であることから計算できる。式(8)は、∂M/∂Dを劣微分で計算することで求まる。Sから、勾配∂F/∂S、またはこれに係数(学習率に応じた値など)を掛けた値を引くことで、Sを更新できる。
解が収束されるように、∂F/∂Wおよび∂F/∂Sの計算と、WとSの更新とを繰り返し行う。
∂l(W;φ(X))/∂Xの計算は、OC−SVMが線形か非線形かで異なる。
[線形の場合]
劣微分を用いて、以下のように計算できる。
Figure 2018205994
[非線形の場合]
ガウシアンカーネルを想定して、カーネルトリックを用いて以下のように計算できる。
Figure 2018205994
更新部5は、上述した勾配法を用いた計算により特徴波形集合SおよびモデルパラメータWを更新すると、更新後の特徴波形集合S、および更新後のモデルパラメータWを、パラメータ記憶部7に格納する。
更新終了判定部6は、特徴波形集合およびモデルパラメータの更新を終了するか判定する。具体的には、更新終了判定部6は、更新終了条件が満たされたか判定する。更新終了条件は、例えば、更新回数により設定される。この場合、更新終了判定部6は、更新部5による更新回数が所定回数に達すると、更新を終了すると判定する。このように、更新終了条件を更新回数により設定することにより、学習に要する時間を所望の範囲内に設定することができる。
また、異常データが学習時に与えられた場合、更新終了条件は、更新されたモデルパラメータと、特徴ベクトルとを含む評価関数(後述)から求まる予測精度により設定されてもよい。この場合、更新終了判定部6は、学習用データ記憶部1から学習に使用していない複数の時系列データを取得し、更新部5が更新したモデルパラメータと、時系列データの特徴ベクトルとにより構成される評価関数により、正常または異常を予測する。更新終了判定部6は、予測結果の正解率が所定値以上の場合、更新を終了すると判定する。このように、更新終了条件を予測精度により設定することにより、得られる評価関数の精度を高くできる。
更新終了条件が満たされない場合は、特徴波形選択部2は、パラメータ記憶部7に記憶されている特徴波形集合Sを用いて、前述したフィッティング処理を再度行う。これにより、各時系列データiについて、特徴波形とオフセットとの組の集合を生成し、フィッティング結果記憶部3に格納する。特徴ベクトル算出部4は、フィッティング結果記憶部3に記憶された情報を用いて、各時系列データiについて、各特徴波形の特徴量を含む特徴ベクトルを計算する。更新部5は、パラメータ記憶部7におけるモデルパラメータW(直前に更新されたモデルパラメータW)と、計算した特徴ベクトルを用いて、目的関数の最適化処理を行う。これにより、特徴波形集合SおよびモデルパラメータWを再度更新する。更新終了判定部6は、更新集条件が満たされたかを判断する。更新終了条件が満たさない間は、特徴波形選択部2、特徴ベクトル算出部4および更新部5の一連の処理を繰り返す。更新終了判定部6は、更新終了条件が満たされたと判断した場合は、学習フェーズを終了する。
図7は、学習されたモデルパラメータにより表される識別境界を模式的に示す図である。図7(A)は、線形の識別境界の例、図7(B)が、非線形の識別境界の例を示す。いずれも特徴空間は、2次元である。図7(A)に示すように、線形の識別境界の場合、識別境界は直線によって表され、直線に対して、一方の側が正常領域、反対側が異常領域である。黒丸は特徴ベクトルを表す。学習時は、正常状態の分析対象装置の時系列データを用いるため、すべて正常領域に特徴ベクトルが配置されている。図7(B)に示すように、非線形の識別境界の場合、識別境界は、複雑な形状になっている。識別境界の内側が正常領域、外側が異常領域である。内側の正常領域にすべての特徴ベクトルが配置されている。
図8は、学習フェーズの動作のフローチャートである。
ステップS11において、特徴波形選択部2は、学習用データ記憶部1から時系列データiを読み出す。特徴波形選択部2は、長さLのK個の特徴波形を用いて、時系列データiに最もフィットするオフセットと特徴波形との組の集合を生成する。具体的には、図4のフローチャートの動作を行う。
ステップS12において、特徴ベクトル算出部4は、ステップS11で得られた(i,k,j)に基づき、時系列データiに対して、各特徴波形との距離Dの最大値である信頼幅Mを計算する。時系列データiに対する特徴波形kの信頼幅Mi,kは、前述した式(2)に基づき計算される。
ステップS13において、特徴ベクトル算出部4は、算出した信頼幅Mi,kに基づき、特徴量Xi,kを算出し、特徴ベクトルXi=(Xi,1、Xi,2、…、Xi,K)を生成する。
ステップS14において、更新部5は、時系列データiの特徴ベクトルに基づき、確率的勾配法等の勾配法により、OC−SVM等の1クラス識別器のモデルパラメータWと、K個の特徴波形集合Sとを更新する。具体的には、モデルパラメータWの勾配と特徴波形集合Sの勾配とを計算し、これらの勾配に基づいて、モデルパラメータWと特徴波形集合Sとを更新する。更新部5は、更新されたモデルパラメータWおよび特徴波形集合Sを、パラメータ記憶部7に上書きする。
ステップS15において、更新終了判定部6が、特徴波形集合SおよびモデルパラメータWの更新を終了するか判定する。具体的には、更新終了判定部6は、更新終了条件が満たされたか判定する。更新終了条件は、例えば、更新回数により設定されることができる。更新終了条件が満たされない間は(NO)、ステップS11〜S14を繰り返す。更新終了条件が満たされた場合は(YES)、学習フェーズを終了する。
<テストフェーズ>
テストフェーズでは、パラメータ記憶部7と、テスト用データ記憶部8と、特徴波形選択部2と、フィッティング結果記憶部3と、特徴ベクトル算出部4と、異常検知部9と、異常同定部10と、出力情報記憶部11とを用いる。
パラメータ記憶部7には、学習フェーズで最終的に得られた更新後の特徴波形集合SとモデルパラメータWとが記憶されている。ここではモデルパラメータWとして、サポートベクトルの集合Svと、寄与率の集合Saが記憶されている場合を想定する。更新後の特徴波形集合Sに含まれる各特徴波形は、本実施形態の第2の特徴波形に相当する。
テスト用データ記憶部8は、テスト対象となる時系列データを記憶している。この時系列データは、テスト対象となる分析対象装置に設置されたセンサの検出値に基づくものである。
特徴波形選択部2は、テスト用データ記憶部8からテスト対象の時系列データを読み出し、学習フェーズと同様の処理(図4のフローチャートを参照)により、時系列データに最もフィットするように、特徴波形とオフセットとの組の集合を生成する。このとき使用する特徴波形集合は、パラメータ記憶部7に記憶された特徴波形集合Sである。算出した特徴波形とオフセットとの組の集合を、フィッティング結果記憶部3に格納する。
特徴ベクトル算出部4は、テスト対象となる時系列データに対して、特徴波形集合Sに含まれる各特徴波形との距離Dの最大値である信頼幅Mを算出する。特徴ベクトル算出部4は、各特徴波形の信頼幅Mに基づき、各特徴波形の特徴量を計算し、これらの特徴量を要素とする特徴ベクトルXを算出する。これらの計算は、学習フェーズと同様の方法で行う。
異常検知部9は、識別境界のモデルパラメータ(Sa,Sv)と、入力変数Xとを含み、Yを出力とする評価式(モデル)を、以下のように生成する。Yに−1を掛けた“−Y”を異常度と定義する。ここでKはカーネル関数であり、SvはサポートベクトルS’vの集合である。SaはSvに属するサポートベクトルの寄与率S’aの集合である。異常検知部9は、特徴ベクトル算出部4で算出した特徴ベクトルXを入力変数Xとして、評価式を計算する。
Figure 2018205994
異常検知部9は、計算された異常度“−Y”が閾値以上であれば、分析対象装置に異常が発生したことを検知する。異常度“−Y”が閾値未満であれば、異常検知部9は、分析対象装置に異常は発生していないと判断する。閾値は、予め与えられている。
異常同定部10は、異常検知部9で異常が検知された場合に、検知された異常に関する出力情報を生成する。異常同定部10は、生成した出力情報を、出力情報記憶部11に格納する。
具体的には、異常同定部10は、時系列データにおいて異常波形を同定し、同定した異常波形を識別する情報を生成する。具体的な動作例を示す。特徴波形選択部2で算出した特徴波形とオフセットとの組に基づき、当該オフセットでの部分時系列と、特徴波形との距離を計算する。計算した距離を当該特徴波形の信頼幅Mと比較する。計算した距離が信頼幅Mより大きい部分時系列が存在する場合、その部分時系列を異常波形とする。ここで述べた以外の方法で異常波形を同定することも可能である。出力情報には、各特徴波形の信頼幅の情報や、異常の検知を通知するメッセージなど、別の情報を含めてもよい。
出力情報記憶部11に格納した出力情報は、液晶表示装置等の表示装置に表示して、異常検知作業の担当者または管理者等のユーザに視認させてもよい。または、通信ネットワークを介してユーザの端末に送信してもよい。ユーザは、出力情報に含まれる異常波形の情報を確認することで、どの検査対象装置で、いつ異常が発生したかを判断できる。また、ユーザは、異常波形をパターン分析等することで、異常の種類または原因を特定することもできる。
図9および図10に、出力情報の例を示す。
図9において、テスト対象となった時系列データ81と、学習により得られた2つの特徴波形82、83とが示されている。また特徴波形82、83が選択された区間の部分時系列に対して、各特徴波形の信頼幅に応じた情報が、一対の破線によって表される。一対の破線84は特徴波形82が選択された部分時系列を囲み、一対の破線85は特徴波形83が選択された部分時系列を囲んでいる。信頼幅Mが小さいほど(信頼性が高いほど)、一対の破線の幅は小さくなっている。ここでは、範囲86で囲まれた部分時系列が、異常波形と判断されている。
図10は、2次元の特徴空間に、テスト対象となった時系列データの特徴ベクトルを3つプロットした状態を表している。横軸は、特徴ベクトルXの第一成分、縦軸は第二成分を表す。第一成分が、1番目の特徴波形の特徴量、第2成分が、2番目の特徴波形の特徴量に対応する。図の中に、特徴ベクトルP1、P2、P3を表す点が表される。等高線の値は、Y(異常度“−Y”にマイナス1を掛けたもの)に相当する。閾値を設定することで、それが識別境界になる。例えば,閾値を0.9とすると,Yが0.9以上の場合(異常度“−Y”が−0.9以下の場合)に正常で、Yが0.9より小さい場合(異常度“−Y”が−0.9以上の場合)が異常となる識別境界が得られる。図の例では、特徴ベクトルP1については、Yが閾値0.9以上であるため、正常と判断する。特徴ベクトルP2についても、Yが0.9以上であるため、同様に正常と判断できる。一方、特徴ベクトルP3については、Yが0.9より小さいため、異常と判断できる。
図9と図10の出力情報の両方を表示してもよいし、いずれか一方のみを表示してもよい。
図11は、テストフェーズの動作のフローチャートである。
ステップS21において、特徴波形選択部2は、テスト用データ記憶部8からテスト対象の時系列データを読み出し、学習フェーズのステップS11と同様に、時系列データに最もフィットするように、特徴波形とオフセットの組の集合を算出する。このとき使用する特徴波形集合は、パラメータ記憶部7に記憶された特徴波形集合Sである。
ステップS22において、特徴ベクトル算出部4は、テスト対象となる時系列データに対して、特徴波形集合Sに含まれる各特徴波形との距離Dの最大値である信頼幅Mを算出する。
ステップS23において、特徴ベクトル算出部4は、各特徴波形の信頼幅Mに基づき、各特徴波形の特徴量を計算し、これらの特徴量を要素とする特徴ベクトルXを生成する。
ステップS24において、異常検知部9は、モデルパラメータと、入力変数Xとを含み、Yを出力とする評価式(式(11)参照)を計算する。入力変数Xには、ステップS23で生成された特徴ベクトルXを与える。評価式で計算されたYに−1を掛けて、異常度“−Y”を計算する。異常検知部9は、異常度“−Y”が閾値以上かを判断する(S25)。閾値未満である場合は(NO)、分析対象装置は正常であると判断し、テストフェーズを終了する。閾値以上である場合は(YES)、分析対象装置の異常を検知する。この場合、ステップS26に進む。
ステップS26において、異常同定部10は、異常検知部9で検知された異常に関する出力情報を生成する。異常同定部10は、生成した出力情報を表す信号を、表示装置に出力する。表示装置は、入力された信号に基づき、出力情報を表示する。出力情報は、例えば、時系列データにおいて同定された異常波形を識別する情報を含む。また、出力情報には、各特徴波形の信頼幅の情報や、異常の検知を通知するメッセージなど、別の情報を含んでもよい。
図12に、本実施形態に係る時系列データ分析装置のハードウェア構成を示す。本実施形態に係る時系列データ分析装置は、コンピュータ装置100により構成される。コンピュータ装置100は、CPU101と、入力インターフェース102と、表示装置103と、通信装置104と、主記憶装置105と、外部記憶装置106とを備え、これらはバス107により相互に接続されている。
CPU(中央演算装置)101は、主記憶装置105上で、コンピュータプログラムである分析プログラムを実行する。分析プログラムは、時系列データ分析装置の上述の各機能構成を実現するプログラムのことである。CPU101が、分析プログラムを実行することにより、各機能構成は実現される。
入力インターフェース102は、キーボード、マウス、及びタッチパネルなどの入力装置からの操作信号を、時系列データ分析装置に入力するための回路である。
表示装置103は、時系列データ分析装置から出力されるデータまたは情報を表示する。表示装置103は、例えば、LCD(液晶ディスプレイ)、CRT(ブラウン管)、及びPDP(プラズマディスプレイ)であるが、これに限られない。出力情報記憶部11に記憶されたデータまたは情報は、この表示装置103により表示することができる。
通信装置104は、時系列データ分析装置が外部装置と無線又は有線で通信するための回路である。学習用データまたはテスト用データなどのデータは、通信装置104を介して外部装置から入力することができる。外部装置から入力したデータを、学習用データ記憶部1またはテスト用データ記憶部8に格納することができる。
主記憶装置105は、分析プログラム、分析プログラムの実行に必要なデータ、及び分析プログラムの実行により生成されたデータなどを記憶する。分析プログラムは、主記憶装置105上で展開され、実行される。主記憶装置105は、例えば、RAM、DRAM、SRAMであるが、これに限られない。学習用データ記憶部1、テスト用データ記憶部8、フィッティング結果記憶部3、パラメータ記憶部7、出力情報記憶部11は、主記憶装置105上に構築されてもよい。
外部記憶装置106は、分析プログラム、分析プログラムの実行に必要なデータ、及び分析プログラムの実行により生成されたデータなどを記憶する。これらのプログラムやデータは、分析プログラムの実行の際に、主記憶装置105に読み出される。外部記憶装置106は、例えば、ハードディスク、光ディスク、フラッシュメモリ、及び磁気テープであるが、これに限られない。学習用データ記憶部1、テスト用データ記憶部8、フィッティング結果記憶部3、パラメータ記憶部7、出力情報記憶部11は、外部記憶装置106上に構築されてもよい。
なお、分析プログラムは、コンピュータ装置100に予めインストールされていてもよいし、CD−ROMなどの記憶媒体に記憶されていてもよい。また、分析プログラムは、インターネット上にアップロードされていてもよい。
本実施形態では、時系列データ分析装置が、学習フェーズと、テストフェーズとの両方を行う構成を備えていたが、いずれか一方のみを行う構成でもよい。つまり、学習フェーズを行う装置と、テストフェーズを行う装置を別々に構成してもよい。
以上、本実施形態によれば、OC−SVM等の1クラス識別器を用いて、モデルパラメータ(識別境界)を学習する。これにより、正常時の時系列データのみを用いて、モデルパラメータ(識別境界)と、特徴波形とを学習できる。また、カーネルトリックを用いて非線形な識別境界を学習できる。関連技術では、教師付き時系列データと、ロジスティック回帰を用いて、線形の識別境界を学習していた。これに対して、本実施形態では、教師付き時系列データは不要であるとともに、学習する識別境界も線形に限定されず、非線形な識別境界も学習可能である。
また、本実施形態では、時系列データにおける任意の箇所の異常波形を検知できる。関連技術では、特徴波形に最もマッチする部分時系列を時系列データにおいて特定し、特定した部分時系列と特徴波形との距離のみを考慮して、識別器の学習を行う。このため、特定した部分時系列以外に異常波形が発生した場合に、異常を検知できない。これに対して、本実施形態では、時系列データの全体をカバーするように設定された複数の区間の部分時系列に最もマッチする特徴波形を選択し、各区間の部分時系列と、選択した特徴波形との距離を考慮して、識別器の学習を行う。このため、時系列データの任意の箇所に異常波形が発生しても、異常を検知できる。
(第2の実施形態)
第1の実施形態では、学習フェーズにおいて、時系列データの全範囲に対して、共通の複数の特徴波形を用いたが、第2の実施形態では、時系列データに複数の範囲(マッチング範囲と呼ぶ)を設定し、マッチング範囲ごとに、複数の特徴波形を用意する。マッチング範囲の設定では、時系列データにマッチング範囲が設定されていない箇所が存在しても良い。複数のマッチング範囲の一部が互いに重複してもよい。学習フェーズでは、各マッチング範囲に対して用意された複数の特徴波形を使用する。マッチング範囲の設定、および複数の特徴波形の指定は、ユーザインタフェースを介して入力される指示に基づいて、特徴波形選択部2または別の処理部(特徴波形選択部2の前段に設ける前処理部など)が行えばよい。
前述した式(3)では、Rk,0及びRk,1が、特徴波形kについて、マッチング範囲を指定する値である。Rk,0及びRk,1をそれぞれ、マッチング範囲の始点および終点を示す値に設定すればよい。このようにして、各特徴波形がフィッティング処理で利用できる範囲を指定する。
図13は、本実施形態において複数のマッチング範囲を設定し、マッチング範囲ごとに複数の特徴波形を指定する例を示す。時系列データに対して、2つのマッチング範囲201、202を指定しており、一部が重複している。マッチング範囲201に対しては特徴波形1,2,3が設定されており、マッチング範囲202に対しては、特徴波形4,5が設定されている。学習フェーズにおいて、マッチング範囲201では、特徴波形1,2,3を特徴波形集合Sとし、マッチング範囲202では、特徴波形4,5を特徴波形集合Sとする。テストフェーズでは、マッチング範囲201では、更新された特徴波形1,2,3を用い、マッチング範囲202では、更新された特徴波形4,5を用いる。つまり、学習フェーズおよびテストフェーズのいずれにおいても、マッチング範囲201では、当該範囲201に属する区間の(オフセットでの)部分時系列との最小距離の特徴波形を、特徴波形1,2,3から選択する。マッチング範囲202では、当該範囲202に属する区間の(オフセットでの)部分時系列との最小距離の特徴波形を、特徴波形4,5から選択する。
本実施形態によれば、時系列データにおける複数のマッチング範囲ごとに、複数の特徴波形を指定することができる。
(第3の実施形態)
第1および第2の実施形態では、1つの変数からなる時系列データを想定したが、第3の実施形態では、複数の変数からなる多変数時系列データを対象とする。
本実施形態では、各変数の時系列データを時系列に結合して、単一の時系列データを生成する。生成した単一の時系列データに対して、第2の実施形態と同様の処理を適用する。
図14に、センサAに対応する変数Aの時系列データの末尾に、センサBに対応する変数Bの時系列データを結合する例を示す。
第2の実施形態に倣って、結合された時系列データのうち、変数Aの時系列データ部分にマッチング範囲301を設定し、変数Bの時系列データ部分にマッチング範囲302を設定する。マッチング範囲301では、特徴波形1,2を設定し、マッチング範囲302では、特徴波形3,4を設定する。学習フェーズにおいて、マッチング範囲301では、特徴波形1,2を特徴波形集合Sとし、マッチング範囲302では、特徴波形3,4を特徴波形集合Sとする。テストフェーズでは、マッチング範囲301では、更新された特徴波形1,2を用い、マッチング範囲302では、更新された特徴波形3,4を用いる。つまり、学習フェーズおよびテストフェーズのいずれにおいても、マッチング範囲301では、当該範囲301に属する区間の(オフセットでの)部分時系列との最小距離の特徴波形を、特徴波形1,2から選択する。マッチング範囲302では、当該範囲302に属する区間の(オフセットでの)部分時系列との最小距離の特徴波形を、特徴波形1,2から選択する。
本実施形態によれば、変数間の関係性を考慮して、多変数に対応する特徴波形を学習することができる。
(第4の実施形態)
第4の実施形態では、時系列データ分析装置が、通信ネットワークを介して、分析対象装置に接続された時系列データ分析システムの実施形態を示す。
図15に、本実施形態に係る時系列データ分析システムを示す。時系列データ分析装置401は、第1〜第3の実施形態のいずれかに係る時系列データ分析装置に相当する。時系列データ分析装置401は、通信ネットワーク402を介して、複数の分析対象装置403に接続されている。分析対象装置403には、物理量を検出するセンサが搭載されている。分析対象装置403は、センサの検出値に基づく時系列データを生成し、生成した時系列データを、通信ネットワーク402を介して、時系列データ分析装置401に送信する。時系列データ分析装置401は、学習フェーズ用に時系列データを収集する場合、各分析対象装置403が事前に正常状態にあることを確認しておく。時系列データ分析装置401は、正常状態にある分析対象装置403から受信した時系列データを、学習用データ記憶部に格納する。また、時系列データ分析装置401は、テストフェーズ用に時系列データを収集する場合は、受信した時系列データをテスト用データ記憶部8に格納し、テストフェーズを実行する。これにより、リアルタイムに分析対象装置403の異常有無をテストできる。
なお、本発明は上記各実施形態そのままに限定されるものではなく、実施段階ではその要旨を逸脱しない範囲で構成要素を変形して具体化できる。また、上記各実施形態に開示されている複数の構成要素を適宜組み合わせることによって種々の発明を形成できる。また例えば、各実施形態に示される全構成要素からいくつかの構成要素を削除した構成も考えられる。さらに、異なる実施形態に記載した構成要素を適宜組み合わせてもよい。
1:学習用データ記憶部
2:特徴波形選択部
3:フィッティング結果記憶部
4:特徴ベクトル算出部
5:更新部
6:更新終了判定部
7:パラメータ記憶部
8:テスト用データ記憶部
9:異常検知部
10:異常同定部
11:出力情報記憶部

Claims (14)

  1. 複数の時系列データに設定された複数の区間の部分時系列と、複数の特徴波形との距離とに基づいて、前記複数の特徴波形の特徴量を算出する特徴ベクトル算出部と、
    前記特徴量に基づき、前記特徴波形を更新する更新部と、
    を備えた時系列データ分析装置。
  2. 前記複数の区間の集合は、前記時系列データの全体をカバーする
    請求項1に記載の時系列データ分析装置。
  3. 直前に設定した区間から一定の範囲内で、部分時系列との距離が最も小さい位置の区間と前記特徴波形との組を特定することを繰り返すことにより、前記複数の区間の設定を行う特徴波形選択部
    を備えた請求項1または2に記載の時系列データ分析装置。
  4. 前記特徴ベクトル算出部は、前記特徴波形との距離が最も小さい前記部分時系列との距離のうち最大の距離に基づき、前記特徴波形の特徴量を算出する
    請求項1ないし3のいずれか一項に記載の時系列データ分析装置。
  5. 前記更新部は、前記特徴波形の勾配を計算し、前記勾配に基づいて、前記特徴波形を更新する
    請求項1ないし4のいずれか一項に記載の時系列データ分析装置。
  6. 前記更新部は、前記特徴量に基づき、1クラス識別器のモデルパラメータを勾配法により更新する
    請求項1ないし5のいずれか一項に記載の時系列データ分析装置。
  7. 前記1クラス識別器は、前記特徴量を表す入力変数と、前記モデルパラメータとを含む評価式である
    請求項6に記載の時系列データ分析装置。
  8. 前記1クラス識別器は、線形または非線形の1クラスSVMである
    請求項6または7に記載の時系列データ分析装置。
  9. 異常検知部をさらに備え、
    前記特徴ベクトル算出部は、テスト対象となる時系列データに設定された複数の区間の部分時系列と、前記更新された複数の特徴波形である複数の第2特徴波形との距離とに基づいて、前記第2特徴波形の特徴量を算出し、
    前記異常検知部は、前記モデルパラメータと、前記第2特徴波形の特徴量に基づいて、前記テスト対象となる時系列データに対して、異常の有無を判定する
    請求項6ないし8のいずれか一項に記載の時系列データ分析装置。
  10. 前記特徴ベクトル算出部は、前記距離が最も小さい前記部分時系列との距離のうち最大の距離に基づき、前記第2特徴波形の特徴量を算出し、
    前記テスト対象となる時系列データに対して前記異常を検知した場合に、前記テスト対象となる時系列データにおける各区間の部分時系列と、前記複数の第2特徴波形のうち前記部分時系列との距離が最も小さい前記第2特徴波形との距離を、前記第2特徴波形の前記最大の距離と比較し、前記距離が前記最大の距離より大きい前記部分時系列を異常波形とする異常同定部
    を備えた請求項9に記載の時系列データ分析装置。
  11. 前記時系列データに対して複数の範囲が設定されており、
    前記範囲ごとに、複数の特徴波形が指定されており、
    前記特徴ベクトル算出部は、前記複数の区間の部分時系列と、前記区間が属する前記範囲に指定された複数の特徴波形のうち最も距離が小さい特徴波形との距離に基づいて、前記特徴量を算出する
    請求項1ないし10のいずれか一項に記載の時系列データ分析装置。
  12. 前記時系列データは、各変数の時系列データが時間方向に結合されたものであり、
    前記時系列データにおいて各変数の時系列データに対応する範囲ごとに、前記複数の特徴波形が指定されている
    請求項11に記載の時系列データ分析装置。
  13. 複数の時系列データに設定された複数の区間の部分時系列と、複数の特徴波形との距離とに基づいて、前記複数の特徴波形の特徴量を算出する特徴ベクトル算出ステップと、
    前記特徴量に基づき、前記特徴波形を、更新する更新ステップと、
    を備えた時系列データ分析方法。
  14. 複数の時系列データに設定された複数の区間の部分時系列と、複数の特徴波形との距離とに基づいて、前記複数の特徴波形の特徴量を算出する特徴ベクトル算出ステップと、
    前記特徴量に基づき、前記特徴波形を更新する更新ステップと、
    をコンピュータに実行させるためのコンピュータプログラム。
JP2017109553A 2017-06-01 2017-06-01 情報処理装置、情報処理方法及びコンピュータプログラム Active JP6877245B2 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2017109553A JP6877245B2 (ja) 2017-06-01 2017-06-01 情報処理装置、情報処理方法及びコンピュータプログラム
US15/916,951 US20180349320A1 (en) 2017-06-01 2018-03-09 Time series data analysis device, time series data analysis method, and computer program

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2017109553A JP6877245B2 (ja) 2017-06-01 2017-06-01 情報処理装置、情報処理方法及びコンピュータプログラム

Publications (2)

Publication Number Publication Date
JP2018205994A true JP2018205994A (ja) 2018-12-27
JP6877245B2 JP6877245B2 (ja) 2021-05-26

Family

ID=64458734

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2017109553A Active JP6877245B2 (ja) 2017-06-01 2017-06-01 情報処理装置、情報処理方法及びコンピュータプログラム

Country Status (2)

Country Link
US (1) US20180349320A1 (ja)
JP (1) JP6877245B2 (ja)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2021039598A (ja) * 2019-09-04 2021-03-11 日本電信電話株式会社 学習装置、照合装置、学習方法、照合方法及びプログラム
KR20210114070A (ko) * 2019-03-18 2021-09-17 미쓰비시덴키 가부시키가이샤 이상 검지 장치 및 이상 검지 방법
JP2021149652A (ja) * 2020-03-19 2021-09-27 株式会社東芝 情報処理装置、情報処理方法及びプログラム
WO2022125047A1 (en) * 2020-12-09 2022-06-16 Turkcell Teknoloji Arastirma Ve Gelistirme Anonim Sirketi Classification and optimization system on time-series
JP7414678B2 (ja) 2020-09-15 2024-01-16 株式会社東芝 情報処理装置、情報処理方法、およびプログラム

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2020021587A1 (ja) * 2018-07-23 2020-01-30 三菱電機株式会社 時系列データ診断装置、追加学習方法およびプログラム
CN109858894A (zh) * 2019-01-16 2019-06-07 深圳壹账通智能科技有限公司 一种支付结果通知方法、装置、可读存储介质及服务器
JP7085513B2 (ja) * 2019-04-01 2022-06-16 株式会社東芝 情報処理装置、情報処理方法、及びコンピュータプログラム
CN110956206A (zh) * 2019-11-22 2020-04-03 珠海复旦创新研究院 时间序列状态识别方法、装置及设备
CN112463646B (zh) * 2021-01-25 2021-05-11 北京工业大数据创新中心有限公司 一种传感器异常检测方法及装置

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2013218725A (ja) * 2013-06-19 2013-10-24 Hitachi Ltd 異常検知方法及び異常検知システム
JP2014081767A (ja) * 2012-10-16 2014-05-08 Mitsubishi Aircraft Corp 状態診断方法、および、状態診断装置
JP2017062713A (ja) * 2015-09-25 2017-03-30 キヤノン株式会社 識別器作成装置、識別器作成方法、およびプログラム

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2014081767A (ja) * 2012-10-16 2014-05-08 Mitsubishi Aircraft Corp 状態診断方法、および、状態診断装置
JP2013218725A (ja) * 2013-06-19 2013-10-24 Hitachi Ltd 異常検知方法及び異常検知システム
JP2017062713A (ja) * 2015-09-25 2017-03-30 キヤノン株式会社 識別器作成装置、識別器作成方法、およびプログラム

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
JOSIF GRABOCKA ET.ALL: "Learning Time-Series Shapelets", KDD '14 PROCEEDINGS OF THE 20TH ACM SIGKDD INTERNATIONAL CONFERENCE ON KNOWLEDGE DISCOVERY AND DATA, vol. August,2014 (2014-08), JPN6020032528, 31 August 2014 (2014-08-31), pages 10, ISSN: 0004415240 *

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20210114070A (ko) * 2019-03-18 2021-09-17 미쓰비시덴키 가부시키가이샤 이상 검지 장치 및 이상 검지 방법
KR102408756B1 (ko) * 2019-03-18 2022-06-15 미쓰비시덴키 가부시키가이샤 이상 검지 장치 및 이상 검지 방법
JP2021039598A (ja) * 2019-09-04 2021-03-11 日本電信電話株式会社 学習装置、照合装置、学習方法、照合方法及びプログラム
JP7174382B2 (ja) 2019-09-04 2022-11-17 日本電信電話株式会社 学習装置、照合装置、学習方法、照合方法及びプログラム
JP2021149652A (ja) * 2020-03-19 2021-09-27 株式会社東芝 情報処理装置、情報処理方法及びプログラム
JP7132263B2 (ja) 2020-03-19 2022-09-06 株式会社東芝 情報処理装置、情報処理方法及びプログラム
US11803613B2 (en) 2020-03-19 2023-10-31 Kabushiki Kaisha Toshiba Information processing device, information processing method, and recording medium
JP7414678B2 (ja) 2020-09-15 2024-01-16 株式会社東芝 情報処理装置、情報処理方法、およびプログラム
WO2022125047A1 (en) * 2020-12-09 2022-06-16 Turkcell Teknoloji Arastirma Ve Gelistirme Anonim Sirketi Classification and optimization system on time-series

Also Published As

Publication number Publication date
US20180349320A1 (en) 2018-12-06
JP6877245B2 (ja) 2021-05-26

Similar Documents

Publication Publication Date Title
JP6877245B2 (ja) 情報処理装置、情報処理方法及びコンピュータプログラム
EP3462267B1 (en) Anomaly diagnosis method and anomaly diagnosis apparatus
US11720821B2 (en) Automated and customized post-production release review of a model
JP7085513B2 (ja) 情報処理装置、情報処理方法、及びコンピュータプログラム
CN109242135B (zh) 一种模型运营方法、装置、及业务服务器
US11115295B2 (en) Methods and systems for online monitoring using a variable data
JP6708203B2 (ja) 情報処理装置、情報処理方法、及び、プログラム
JP5854274B2 (ja) 情報処理装置および方法、並びにプログラム
JPWO2009090939A1 (ja) ネットワーク異常検出装置及び方法
KR102320706B1 (ko) 설비 모니터링 시스템의 모델 임계값 설정 방법
JP2013257251A (ja) 異常検知方法、プログラム及びシステム
US20160162759A1 (en) Abnormal pattern analysis method, abnormal pattern analysis apparatus performing the same and storage medium storing the same
JP2019159933A (ja) 探索点決定プログラム、探索点決定方法および探索点決定装置
JP2020027342A (ja) 情報処理装置、監視装置、及び情報処理方法
WO2016151620A1 (ja) シミュレートシステム、シミュレート方法およびシミュレート用プログラム
JPWO2020136859A1 (ja) 推定装置、推定方法、及びプログラム
JP6631540B2 (ja) 情報処理システム、変化点検出方法、およびプログラム
JP6950504B2 (ja) 異常候補抽出プログラム、異常候補抽出方法および異常候補抽出装置
EP2940585A1 (en) Response method creation program, response method creation method, and information processing device
JP7207540B2 (ja) 学習支援装置、学習支援方法、及びプログラム
Ardakani et al. Optimal features selection for designing a fault diagnosis system
JPWO2020148838A1 (ja) 推定装置、推定方法、及びプログラム
CN105608460A (zh) 多分类器融合方法和系统
Araujo et al. Hybrid intelligent design of morphological-rank-linear perceptrons for software development cost estimation
JP7259497B2 (ja) 情報処理装置、情報処理方法、プログラム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20190822

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20200722

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20200901

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20201030

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20210105

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20210303

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20210330

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20210427

R151 Written notification of patent or utility model registration

Ref document number: 6877245

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R151