JP2013175108A - クラスタリング装置及びクラスタリングプログラム - Google Patents

クラスタリング装置及びクラスタリングプログラム Download PDF

Info

Publication number
JP2013175108A
JP2013175108A JP2012040134A JP2012040134A JP2013175108A JP 2013175108 A JP2013175108 A JP 2013175108A JP 2012040134 A JP2012040134 A JP 2012040134A JP 2012040134 A JP2012040134 A JP 2012040134A JP 2013175108 A JP2013175108 A JP 2013175108A
Authority
JP
Japan
Prior art keywords
series data
time
local time
local
cluster
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2012040134A
Other languages
English (en)
Other versions
JP2013175108A5 (ja
JP5868216B2 (ja
Inventor
Makoto Imamura
誠 今村
Yutaka Saito
裕 齋藤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Mitsubishi Electric Corp
Original Assignee
Mitsubishi Electric Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Mitsubishi Electric Corp filed Critical Mitsubishi Electric Corp
Priority to JP2012040134A priority Critical patent/JP5868216B2/ja
Publication of JP2013175108A publication Critical patent/JP2013175108A/ja
Publication of JP2013175108A5 publication Critical patent/JP2013175108A5/ja
Application granted granted Critical
Publication of JP5868216B2 publication Critical patent/JP5868216B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Testing And Monitoring For Control Systems (AREA)

Abstract

【課題】計装システムの時系列データを活用し、プラント設備の故障等の異常予兆を検知する装置の検知精度を向上させる。
【解決手段】局所時系列データ抽出部102が、複数の時系列データの組を入力し、この組に対して所定の時間区分の手法を適用して複数の時系列データの組を時間で区分し、時間区分された各時系列データを局所時系列データを抽出し、局所時系列データモデル推定部103が、抽出された各局所時系列データを、所定のモデル推定手法を用いてモデル推定し、局所時系列データクラスタリング部104が、モデル推定された各局所時系列データを複数のクラスタに分割すると共にクラスタ毎にクラスタを代表する代表局所パラメータを求める。そして、外れ値検出部106が、代表局所パラメータに基づき、所定期間の評価対象データに対して、いずれかの代表局所パラメータとの距離として予め定義された値が閾値を超える外れ値かどうかを検出する。
【選択図】図1

Description

本発明は、プラントを構成する機器の故障や性能劣化等の異常の予兆を検知するためのプラントの異常検知装置に関する。
火力、水力、原子力などの発電プラント、化学プラント、鉄鋼プラント、上下水道プラントなどでは、プラントのプロセスを制御するための計装システムが導入されている。これらのプラントの計装システムでは、装置に取り付けられたセンサが取得した種々の時系列データが蓄積されている。この時系列データを用いて、プラントの監視や保守に役立てたいというニーズがある。
例えば、以下に示した特許文献1では、過去のプラントのセンサ信号のデータと、観測データとの類似度を計算することにより、観測データの外れ度合いを出力することにより、異常検知する方法が記載されている。しかし、プラントでは、起動、定常、停止などの運転モード、燃料の成分による発熱効率の差異、設備の劣化などにより、過去のプラントのセンサ信号のデータのばらつきが大きいため、学習の対象となるセンサ信号のデータを、運転条件毎に集める必要があり、この負荷が大きいという課題があった。
上記の課題を解決する方法として、以下に示した特許文献2では、時系列データを時間的な変化に基づいて、データ空間の軌跡を複数の軌跡区分に分割して、各々の軌跡区分毎に対象をモデル化することにより、プラントを構成する機器の性能劣化状態を定常的に評価する方法が記載されている。
特表2004−531815、「予測的状態監視のための診断システムおよび方法」 特開2010−92355「異常検知方法及びシステム」
上記の特許文献2の方法では、対象データを時間に沿ってデータ間の距離が定めたしきい値を超えれば、別のクラスタとし、しきい値を超えなければ、同じクラスタとして扱うという方法に分割している。このため、プラントの起動、定常、停止などの運転条件に起因する複数のセンサ信号間の関係を捉えることができるため、過去のデータを運転条件毎に集める作業を不要としている。しかし、異常の判定時には、過去に類似した分割区分があるかどうかで判定するので、その分割区分の異常がどの程度まれに生じるものかといった統計的な偏りについては、判定することができないという課題がある。したがって、収集したデータ中に、センサ故障等による異常データや、異常となる直前のデータが混入している場合には、そのデータに起因して、異常検知の精度が低下する可能性がある。
また、統計的な処理に基づく異常検知は、検知精度は100%にはならないので、プラントの保守員や監視員が対処をとる際には、異常とする判断の根拠をわかりやすく説明する機能が求められる。しかし、従来技術(特許文献2)では、区分された軌跡によりプラントシステムを部分空間法によりモデル化しているので、数学的に変換した結果に対する異常判定となっており、センサ信号間の関係や異常判断の根拠の説明が難しいという課題がある。
この発明は、計装システムが蓄積する時系列データを活用することにより、プラントを構成する設備や機器の故障や性能劣化等の異常の予兆を検知する装置の、異常検知の精度を向上させることを目的とする。
この発明のクラスタリング装置は、
種類の異なる複数の時系列データから、第1時間範囲から第N時間範囲の異なるN個(Nは2以上の整数)の時間範囲ごとにその時間範囲に属する時系列データを抽出し、その時間範囲における複数の時系列データの組からなるN個の局所時系列データを生成する局所時系列データ抽出部と、
前記局所時系列データ抽出部が抽出したN個の局所時系列データを、初期クラスタ分割の規則として予め設定された初期クラスタ分割規則に従って、予め設定された初期クラスタ数の初期クラスタに分割し、分割した初期クラスタごとに初期クラスタの特性を指標する代表情報を生成し、生成した代表情報ごとにN個の局所時系列データを再クラスタリングの規則として予め設定された再クラスタリング規則に従って分配することによりN個の局所時系列データをクラスタに分割する再クラスタリングを実行し、再クラスタリングしたクラスタごとに代表情報を再生成し、再生成した代表情報ごとに前記局所時系列データ抽出部が抽出したN個の局所時系列データを再クラスタリングし、
以降同様に、
N個の局所時系列データの再クラスタリングと、代表情報の再生成とを繰り返すと共に、代表情報を再生成するたびに、今回生成した代表情報が直前に生成した代表情報に対して変化があるかどうかを判定し、変化があるときには次回の代表情報の再生成処理を継続し、変化がないときには次回の代表情報の再生成処理を継続することなくN個の局所時系列データの再クラスタリングと代表情報の再生成との処理を終了する局所時系データクラスタリング部と
を備えたことを特徴とする。
この発明により、プラントを構成する設備や機器の故障や性能劣化等の異常の予兆を検知する装置において、検知精度を向上させることができる。
実施の形態1におけるプラント異常検知装置100の構成を示すブロック図。 実施の形態1における時系列データを説明する図。 実施の形態1における局所時系列データ抽出の説明図。 実施の形態1におけるセンサ信号間の相関関係の変化の一例(連続的な変化)を示す説明図。 実施の形態1におけるセンサ信号間の相関関係の変化の一例(不連続な変化)を示す説明図。 実施の形態1におけるセンサ信号間の相関関係の変化の一例(値の区間への依存性)を示す説明図。 実施の形態1における局所時系列データクラスタリングの一例を示す説明図。 実施の形態1における大域的時系列データモデルの推定の一例を示す説明図。 実施の形態1におけるプラント異常検知装置100の処理の全体の流れを説明するフロー。 実施の形態1における局所時系列データクラスタリング部104の処理の流れを説明するフロー。 実施の形態1におけるデータの値のレンジで区分する場合の局所時系列データを説明する図。 実施の形態1における局所時系列データモデル推定部103の処理を概念的に示す図。 実施の形態1における「N×K」個の局所構造S(Lki)を概念的に示す図。 実施の形態1における(式5)の意味を示す図。 図10のS1004の処理を概念的に示す図。 図10のS1005の処理を概念化した図。 図10の最初のS1006からS1004に戻った場合を説明する図。 図10のk=2、k=3の実行後を示す概念図。 図10のk=1〜Kの実行後を示す概念図。 図10の全体処理概要を示す図。 実施の形態1における大域的時系列データモデル推定部105の処理の流れを説明するフロー図。 実施の形態2におけるプラント異常検知装置100の外観の一例を示す図。 実施の形態2におけるプラント異常検知装置100のハードウェア構成例を示す図。
実施の形態1.
図1は、本実施の形態1に係るプラント異常検知装置100の一実施例の構成を示すブロック図である。各構成要素の機能概要を説明する。以下の実施の形態の説明では、tは時間を示す。
(1)プラント時系列データベース101は、異常検知の対象となるプラント機器等について、時間の経過に従って順次観測して得た複数の時系列データを格納するデータベースである。
(2)局所時系列データ抽出部102は、プラント時系列データベース101中の多次元時系列データを入力とする。例えば後述の図2のような、投入燃料に対する発熱量y(t)、燃料投入量x1(t)、及び温度x2(t)の組、(y(t)、x1(t)、x2(t))のような多次元時系列データを入力とする。局所時系列データ抽出部102は、その入力データの時間的な変化の仕方に従って、この入力データを「時間」や「データの値」で区分することにより、区分された時系列データを抽出する。この区分された時系列データを「局所時系列データ301」と呼ぶ。
(3)局所時系列データモデル推定部103は、局所時系列データ抽出部102が抽出した局所時系列データ301を、多変量解析、または、時系列解析手法によりモデル推定する。モデル推定とは、例えば、「局所時系列データ301」ごとに、回帰式を求める処理である。
(4)局所時系列データクラスタリング部104は、局所時系列データモデル推定部103が推定した局所時系列データ301の「モデルの集合」をクラスタに分割すると共に、クラスタ毎にクラスタを代表する「代表局所パラメータ」を推定(算出)する。
(5)大域的時系列データモデル推定部105は、局所時系列データクラスタリング部104が推定したモデルを接続することにより、大域的な代表時系列データモデルを推定する。
(6)外れ値検出部106は、別途与えられた区分データに対して、局所時系列データクラスタリング部104あるいは、大域的時系列データモデル推定部105により得られた代表局所時系列データモデルの集合における外れ値が大きいものを異常として検出する。
(多次元時系列データの例)
図2は、局所時系列データ抽出部102が入力する時系列データの説明図である。時系列データとは、時刻tに対して、時刻tのセンサ信号値を対応させる関数x(t)として表現できるものである。時刻tは、連続であってもよいし、サンプリングによって一定周期ごとに記録されるものであってもよい。本明細書では、上記のように、複数の時系列データの組み(多次元時系列データ)を扱う。
図2は、
(a)時系列データy(t)、
(b)時系列データx(t)、
(c)時系列データx(t)、
の三組の時系列データの例を示している。複数の時系列データの組は、時刻tのベクトル値関数(y(t),x(t),x(t))とみなすことができる。
(時系列データの区分けの例:その1)
図3は、局所時系列データ抽出部102による時系列データの区分けの例を示す図であり、局所時系列データ抽出部102の動作の一例を示す説明図である。
(a)は、プラント時系列データベース101に格納されている元データである時系列データx(t)の例である。
(b)は、局所時系列データ抽出部102が時系列データ(a)を平滑化することにより得られた「平滑化処理後の時系列データ」の例である。
(c)は、時系列データ(b)に対して、時間差分(x(ti+1)−x(t))をとった値をもつ時系列データの例である。つまり(c)はΔx/Δtを示す。
(d)は、(c)の値の絶対値がある閾値以上である時刻で、元信号データ(a)を区分することにより得られた、局所時系列データ301の例である。(d)では、元信号データ(a)が、8つの区分に分割されている。つまり、(d)では(a)の時系列データx(t)が、8つの局所時系列データ301に区分された場合を示している。
(時系列データの区分けの例:その2)
図4は、局所時系列データ抽出部102による時系列データの区分けの別の例を示す図であり、センサ信号間の相関関係の変化の一例(連続的な変化)を示す説明図である。(a)と(b)は、時系列データの例である。(a)をy(t)、(b)をx(t)とする。(c)は、y(t)とx(t)との相関関係を示す時系列データの例である。(c)の例では、相関関係を時系列データy(t)とx(t)を回帰分析した際の係数としてとらえており、時間の経過と共に少しずつ連続的に値が小さくなっている。設備の劣化などにより、設備の効率が少しずつ低下している場合には、このように連続的に値が変化する。例えば、y(t)を発熱量、x(t)を燃料投入量とすると、設備の劣化により、設備の効率が少しずつ低下していることを表している。局所時系列データ抽出部102は図4(c)の5つの区間を、それぞれ局所時系列データ301とすることができる。
(時系列データの区分けの例:その3)
図5は、局所時系列データ抽出部102による時系列データの区分けの別の例を示す図であり、センサ信号間の相関関係の変化の一例(不連続な変化)を示す説明図である。(a)と(b)は、時系列データの例である。各々、y(t)、x(t)とする。(c)は、y(t)とx(t)の相関関係を示す時系列データの例である。(c)の例では、相関関係を時系列データy(t)とx(t)を回帰分析した際の係数としてとらえており、時間の経過と共に、値が不連続に二つの値をとっている。区間1、区間2、区間5は、高い値であり、区間3、区間4、区間6は低い値になっている。例えば、y(t)を発熱量、x(t)を燃料投入量とすると、燃料の種別により、設備の効率が異なる場合には、このような相関関係になる。区間1、区間2、区間5のグループと、区間3、区間4、区間6のグループでは、燃料の種別が異なり、前者のグループは、後者のグループに対して、同じ燃料量での発熱効率がよいことを表している。局所時系列データ抽出部102は、(c)において、区間1,2、5からなる局所時系列データ301と、区間3,4、6からなる局所時系列データ301との二つの局所時系列データを区分けすることができる。
(時間で区分した時系列データを、さらに時系列データの値のレンジで区分する例)
図6は、局所時系列データ抽出部102による時系列データの区分けの別の例を示す図であり、センサ信号間の相関関係の変化の一例(値の区間への依存性)を示す説明図である。図6は、時間で区分した時系列データを、さらに時系列データの値のレンジで区分する場合を説明する。(a)と(b)は、時系列データの例である。各々、y(t)、x(t)とする。(c)は、y(t)とx(t)の相関関係を示す時系列データの例である。(c)の例では、相関関係を時系列データy(t)とx(t)とを回帰分析した際の係数としてとらえており、時間の経過に対して、相関値の変化傾向が変化している。区間1と区間3は、係数は一定の値であり、区間2では、係数がその一定の値の間を連続的に変化している。この相関関係の変化は、時刻に依存するのではなく、時系列データx(t)の値への依存性を表していると解釈することができる。例えば、y(t)を発熱量、x(t)を燃料投入量とするとき、設備の制御システムにより、燃料を多く投入しても、ある一定の発熱量以上にはあがらないように制御されている場合には、このような挙動を示す。このような挙動を示すセンサ信号間の関係をとらえるためには、時系列データ(y(t)あるいはx(t))を、値のレンジにより区分することが有効である。(d)に、相関値の値の変動する点を、値yの区分として抽出した場合の、局所信号データを示す。(d)では、時系列データyを値の区分A、区分B、および、区分Cに分割している。(d)では、区間1、2、3がそれぞれ局所時系列データ301となる。このとき局所時系列データ抽出部102は、時間で区分した得た局所時系列データ301を、さらに時系列データの値(この例では(a)のy(t)の値を採用している)のレンジで区分することで、区間2の局所時系列データ301については、局所時系列データ301を、さらに、区間2−1と区間2−2とのデータとに分けている。
(局所クラスタと大域クラスタ)
図7は、局所時系列データクラスタリングの一例を示す説明図である。図7は、局所時系列データモデル推定部103、局所時系列データクラスタリング部104、及び大域的時系列データモデル推定部105の処理結果を概念的に示す図である。図7のグラフは、縦軸を発熱量y、横軸を燃料投入量xとする散布図である。
「散布図」とは、ある時刻の時系列データx(t)とy(t)の組を点<x(t),y(t)>として、2次元のグラフにマッピングしたものである。図5に示したような信号間の関係がある場合には、散布図上の時系列データの組は、クラスタ701とクラスタ702との二つのクラスタに分類できる。以下に図7を説明する。
図7では、クラスタとして小さなクラスタ703、704と、大きなクラスタ701、702とを示した。小さなクラスタ703、704等を局所クラスタ(局所時系列クラスタともいう)と呼び、大きなクラスタ701、702等を大域クラスタと呼ぶこととする。大域クラスタ701は、効率のよい燃料を使用した場合のxとyの値の組に対応している。大域クラスタ702は、効率のよくない燃料を使用した場合のxとyの値の組に対応している。大域クラスタ701は上昇傾向が頭打ちになっているが、大域クラスタ702は直線になっている。これは、図6に示したような信号間の関係がなりたつ例を示している。
局所クラスタ703、704の範囲(枠線)は、局所時系列データクラスタリング部104による局所時系列データ301のクラスタリングの結果得られたクラスタの例である。時間区分と値のレンジの区分で分割された局所時系列データ301に対応している。この局所時系列データ301において、回帰分析やARモデル等により推定された回帰式(代表局所パラメータ)が各々回帰式705、706である。異常判定対象データ707、708は、異常判定対象の時系列データの例である。異常検知では、最も近い回帰式からの距離がある閾値以上であるものを異常と判定する。707は、最も近い回帰式704と近いため、正常と判定する。708は、最も近い回帰式704からある一定以上は離れているため、異常と判定する。
図8は、大域的時系列データモデルの推定の一例を示す説明図である。(a)の801、802、803、804は、局所時系列データ301の集合をクラスタリングすることにより得られた代表回帰式である。(b)の809は、(a)の801、802、803、804を接続して得られる大域的な代表回帰式である。同様に、(b)の810は、(a)の805、806、807、808を接続して得られる大域的な代表回帰式である。
(動作の説明)
以下、図9〜図21のフロー図を用いて、本実施の形態1の動作を説明する。図9は、プラント異常検知装置の処理の全体の流れを説明するフロー図である。図10は、局所時系列データクラスタリング部104の処理の流れを説明するフロー図である。図11〜図20は、図10の処理説明を補足する図である。
図21は、大域的時系列データモデル推定部105の処理の流れを説明するフロー図である。
(S901,S902:局所時系列データ抽出部102の処理)
S901は、局所時系列データ抽出部102が実行する局所時系列データ抽出処理である。S901では、複数の時系列データの組を入力として、入力データの時間的な変化の仕方に従って、入力データを区分する。入力区分を求める手順(所定の局所時系列データ生成規則)は、例えば、複数の入力データ中の一つを目的変数とし、それ以外を説明変数として、
(1)参考文献(河口至商著,多変量解析2pp.60〜64,森北出版)に記載の「区分的な回帰分析」や、
(2)参考文献(北川源四郎著,時系列解析入門,pp113−124,岩波書店)の局所定常ARモデルを用いる。
(3)あるいは、初等的に、図3に示すように、時系列データを平滑化処理と時間差分処理を作用させた後に、閾値で区分を抽出してもよい。S902も局所時系列データ抽出部102が実行する処理である。
S902では、局所時系列データ抽出部102は、S901で得られた局所区分時系列データを、データの値のレンジでさらに区分することにより、新たな時系列データを抽出する処理である。具体的には、時間で区分された時系列データの集合
Figure 2013175108
を入力として、区分として注目する変数yiの区間の分割
Figure 2013175108
により分割された時系列データの集合
Figure 2013175108
を抽出する。
但し、(Tis,,Tie]は、S901で得られた区間区分とする。
以下では、Lkiを局所時系列データ301として、局所時系列データLkiと呼ぶ。なお、以下では、Lkiを局所時系列データと呼んで説明するが、データ区分を含まない時間範囲のみで分割したものも局所時系列データ(広義)である。
図11を参照して、上記(式1)〜(式3)の意味を具体的に説明する。図11は、時系列データy(t)、時系列データx(t)、時系列データx(t)の3つの場合の例である。以下、時系列データy(t)を単にy(t)のように記載する場合もある。x(t)、x(t)と2つなので(式1)において「M=2」である。(式1)は時間区分を示すiに関する1〜NのN個の時系列データの集合を示すが、「i=1」の場合の(式1)の示す時系列データは、図11のT1s,<t≦T2eの範囲に含まれる
y(t)、x(t)、x(t)
である。
また(式2)のデータの値のレンジでの分割は、図11のy(t)の縦軸に関する、Y1〜Y2、Y2〜Y3のような分割を意味する。y(t)のY1〜Y2の範囲は、(式3)におけるk=1の場合に相当する。つまり(式3)において、
Y1<yi=1≦Y2
の場合である。
(式3)においてk=1、i=1の場合、つまりL11の例を以下に説明する。i=1の場合は図11のT1s,<t≦T2eの時間の帯(縦の帯)に含まれるy(t)、x(t)、x(t)のグラフ部分が対応する。またi=1の下でのk=1の場合は、y(t)のグラフのうち、Y1〜Y2のデータ範囲に属する部分のy(t)のグラフがL11に属する部分である。これを図11のy(t)の太線部分(時間範囲の両側のY左側、Y右側)として示した。またL11に属するx(t)、x(t)は、L11に属するy(t)決まり、図11ではそれぞれ、
左側、x右側、x左側、x右側である。
同様にして、k=2、i=1の場合のL21は、図11に示す斜線で示すグラフ部分である。
(S903:局所時系列データモデル推定部103の処理)
S903では、局所時系列データモデル推定部103(局所時系列データ回帰式生成部の一例)が、局所時系列データLkiを、多変量解析、または、時系列解析手法によりモデル推定する。「モデル推定」とは例えば、回帰式を求める処理である。例えば、S902でセンサ信号(注目変数y)の値のレンジで分割した区間k毎にN個存在する局所時系列データ301の要素である時系列データ
Figure 2013175108
のすべてに対して、多変量解析、または、時系列データによりモデル推定する。
以下では、多変量解析の例として線形回帰分析を用いて説明するが、因子分析、特異値分解、ARモデル、状態空間モデルなどでもよい。時系列データLki(t)に対して回帰分析を実施すると、
回帰式y(t)=Fki(x,x,…,x)と、残差の平方和Ekiを得る。
以下では、(x,x,…,x)をベクトルxとして記載し、
ki(x,x,…,x)をFki(x)と記載する。
以下では、
時系列データLki(t)、
yの区間(Yk,Yk+1]、
回帰式Fki(x)、
残差の平方和Eki
四つ組(Lki(t),(Yk,Yk+1],Fki(x),Eki)を、
局所時系列データ301の集合Lkiに対する局所構造S(Lki)と呼ぶ。
(局所構造)
つまり、
局所構造S(Lki)={Lki(t),(Yk,Yk+1],Fki(x),Eki
である。
図12は、上記で述べた局所時系列データモデル推定部103の処理を概念的に示す。局所時系列データモデル推定部103は、局所時系列データ抽出部102の抽出した、ある(k、i)の一つの局所時系列データLkiに、S(Lki)を対応させる。この場合、時間の区分数を示す「i」は(式1)に示すように1〜NまでのN個である。また、注目変数y(t)(指定時系列データ)についてのデータ区分数を示すkは1〜Kとする((式2)においてm=1〜Kに対応)。
つまり、i=1〜N、k=1〜K
であるので、局所時系列データLkiは「N×K」個できる。
よって、局所構造S(Lki)も「N×K」個できる。図13は、「N×K」個の局所構造S(Lki)を概念的に示す。図13は、横軸を時間の区分数「i」、縦軸をデータ区分数「k」とした。その場合、一つのセルが、あるS(Lki)に対応する。
(S904:局所時系列データクラスタリング部104の動作)
S904は、局所時系列データクラスタリング部104が実行する局所データクラスタリング処理である。S904では、局所時系列データモデル推定部103が推定した局所時系列データモデルの集合(つまりN・K個のS(Lki))をクラスタに分割すると共に、クラスタ毎にクラスタを代表する代表局所パラメータを推定する。
図10は、局所時系列データクラスタリング部104が実行する、S904の処理の流れの詳細を示すフローチャートである。図10の動作の主語は局所時系列データクラスタリング部104であるが、煩雑になるので省略する。S904は、S903により得られた局所構造
S(L)=(L(t),(Yk,Yk+1],F(x),E
の集合を入力とする。ただし、k毎(データ区分ごと)に実行するので、簡潔さのために、L,F,Eの添え字kは省略して説明する。また、大文字のNは、局所時系列データ(L)の数とし(つまり、時間範囲の数)、上記のようにデータ区分数「i」は、1からNの値をとるとする。
このことを図13で説明すれば、局所時系列データクラスタリング部104がk毎にS(L)を実行するとは、例えば「k=2」とする場合、図13の斜線部のデータである、S(L)〜S(L)を実行するという意味である。
(S1001)
S1001では、Sの中から、最小のEをもつSを探す。最小のEをもつSはSであるとする。k=2とすれば、図13において局所時系列データクラスタリング部104は、S〜Sの中から、最小のEをもつSを探す。
次に、代表局所パラメータの候補変数mにFを代入する。この場合は、最小のEをもつSに属するF(回帰式)を代表局所パラメータの候補変数mに代入する。
この場合、
=F
である。
次に、変数cに1を代入する。
つまり
c=1
である。
なお、後述のS1003で登場する局所クラスタ数の設定数を変数cとの区別するため「C*」とする。
(S1002)
Figure 2013175108
ここで、distlm(S(L),{m,・・mC*})はS(L)と{m,・・mC*}との距離を示し、また回帰式間の距離distは、回帰式の係数をベクトルとみなした場合のベクトル間の距離とする。距離dist(F(x),m)はFとmとの距離であるが、予め設定された計算式に基づき算出する。なお回帰式F(x)は簡略化してF(x)とも表記する。図14の「c=1」は、S1001でc=1となった場合の(式5)の意味を示している。
変数c=1の場合、
dist(F,m)〜dist(F,m)のN個の距離のなかから、最大の距離を探す。例えば、dist(F,m)が最大とする(i=5)。
つまり、
max=dist(F,m) 次に、mc+1に、F(x)を代入する。次に、cに、c+1を代入する。
この設例では、
1+1=m=F
c=1+1=2
となる。
(S1003)
S1003では、変数cが定数C*に等しいかどうかを判定する。
但し、上述のように定数C*は、局所クラスタ数を示す数として、あらかじめパラメータとして与えられているものとする。等しい場合は、S1004に進む。等しくない場合は、S1002に戻る。
この設例では、現在、c=2なのでS1002に戻るとする。
S1002に戻った状態では、
c=2、
=F
である。
また、S1001より、
=F
である。
そして、最初のS1002(c=1のとき)と同様に、(式5)に基づき、最大の距離を探す。
図14の「c=2」は、S1002でc=2の場合の(式5)の意味を示している。
変数c=2の場合、
「dist(F,m)+(F,m)」〜「dist(F,m)+(F,m)」のN個の距離の中から最大の距離を探す。
後の動作は前回のS1002と同じである。
そして、
c=C*となると、処理はS1004に進む。
この例では、c=20(局所クラスタ数)となった場合である。
以上のS1002、S1003の処理でC*個のmが求まるが、これを以下では、
mj、j=1,2,・・・,C*、
としている。
以下、後述するD,j=1,2,・・・,C*を、局所構造をクラスタリングすることにより得られたC*個のクラスタとする。
(S1004)
S1004では、クラスタDの初期化処理を実施する。例えば、図13(k=2)のN個のL(SはLを要素に持つ)に対して、C*個のdistlm(L,m)(所定の距離定義式)が最小となるmを探す。
次に、クラスタDに、Lを代入する。
図15はこの処理を概念的に示す図である。
例えばLを考える。Lと、m〜mc*のそれぞれとの距離distlm(L,m)を計算し、距離が最小となるmを探す。距離を求める式は、S1002で用いたように回帰式の係数をベクトルとみなした場合のベクトル間の距離とする方式でもよいし、それ以外の式でもよい。
この場合の距離distlm(L,m)は、
時系列データLと同一の局所構造Sに所属する回帰式Fを意味する。これは(式5)の距離式の場合と同様である。
つまり、
distlm(L,m)=distlm(F,m
であり、F,mとも回帰式であるから、回帰式どうしの距離が求まる。
ただし、クラスタリングの対象は時系列データであるのでLを用いて表現している。
例えば、L(F)はmとの距離が最小であったとすると、時系列データLはクラスタDに所属する。
同様に、図15のようにL(F)もmとの距離が最小であったとすると、時系列データLもクラスタDに所属する。
同様に、L(F)はmとの距離が最小であったとすると、時系列データLはクラスタDに所属する。
以下、L〜Lまで同様である。
以上のS1004の処理によって、L〜LはD〜Dc*のいずれかのクラスタDに所属することになる。
(S1005)
S1005以降(S1005,S1006、S1004のループ)は、S1003→S1004で設定された初期クラスタをもとに、局所時系列データLi(i=1〜N)を再クラスタリングする処理である。S1005では、C*個のDに対して、あるjであるクラスタDに属する局所時系列データLjk(この例ではk=2)の和集合∪Ljk∈Dに対して、回帰分析する。この回帰分析により、そのクラスタDの回帰式F(x)を求める。
次に、そのクラスタDの代表回帰式の候補mに、求めた回帰式F(x)を代入する。
図16はS1005の処理を概念化した図であり、再クラスタリング規則を示している。
最初のS1004の処理が終わった段階で、
クラスタDには局所時系列データL、Lが所属し、
クラスタDには局所時系列データL〜Lが所属し、
・・・とする。
その場合、
クラスタDについては、和集合L∪Lに対して回帰式Fj=1を求め、
クラスタDについては、和集合L∪L∪Lに対して回帰式Fj=2を求める。他のクラスタに関しても同様である。
この処理によって、クラスタD〜DC*のC*個の各クラスタに回帰式が定まる。
このC*個の回帰式を、図15(S1002,S1003)で求めたm〜mC*に対して、新たなm〜mC*とする。
S1006では、「C*個のmのすべてに変化がない」かどうかを判定する。
最初のS1006では、前回の「m〜mC*」はS1002、S1003のループで作成された、いわゆる初期値である。よって、通常、最初のS1005で求めた「m〜mC*」との間に変化がある。
変化がある場合は、S1004に戻る。
変化がない場合は、終了する。
終了した際のD,D,…,DC*のC*個のクラスタが、局所時系列クラスタである。終了時点での「m〜mC*」を大文字を用いて「M,M,…,MC*」と記載するが、これらが局所時系列クラスタ「D〜DC*」のそれぞれの代表局所パラメータである。
(複数回目のS1004)
最初のS1006からS1004に戻った場合を説明する。図17は、2回目(3回目以上も同様)の処理を示す概念図である。2回目が最初のS1004と異なるのは、「m〜mC*」が、S1005で求められた「新たなm〜mC*」になっている点のみある。つまり、複数回目のS1004では、直前のS1005で求められた「新たなm〜mC*」を使用し、「L〜L」のクラスタリングのやり直しを行う。つまり新たな「新たなm〜mC*」を使用し、「L〜L」の再クラスタリングを行う。
図10はk毎の処理であるので、k=2、k=3のような順に実行された場合、図18に示すように、k=2についてS(i:1〜N)が処理され、次にk=3についてS(i:1〜N)が処理される。したがって図18に示すように、k=2について局所クラスタD〜DC*が決まり、k=3について局所クラスタD〜DC*が決まる。よって、1〜Kについて実行すれば、図19に示すように、1〜Kのそれぞれに、局所クラスタD〜DC*が決まる。そして局所クラスタD〜DC*のそれぞれについて代表局所パラメータが定まっている。これを図示したものが図7であり、クラスタ703、704等が局所クラスタを示す。また、回帰式705,706が各局所クラスタの代表局所パラメータである。図19のk違いの場合は、図7において、kごとの局所クラスタ、代表局所パラメータとして表示されるが、図7にはk違いは表現していない。
(外れ値検出部106)
外れ値検出部106は、図7に示す局所クラスタ、代表局所パラメータを対象として、別途与えられた区分データが外れ値に該当するかどうかを判定する。即ち、外れ値検出部106は、局所時系列データクラスタリング部104が決定した代表局所パラメータに基づき、評価対象として別途与えられた評価対象データであって、局所時系列データの生成の元になる種類の異なる複数の時系列データと種類を同じくする複数の時系列データの組からなる所定期間の評価対象データに対して、距離として定義された値が、いずれかの代表局所パラメータとの間で閾値を超えるかどうかを検出する。外れ値検出部106は、閾値を超えた場合、その評価対象データ(図7で異常と判定されたで異常判定対象データ708)を外れ値と判定する。
なお、以上の局所クラスタリング(図10)の説明では注目変数をyとし、データ区分を考慮した場合を説明したが、データ区分を反映することは必須ではない。データ区分を反映しない場合(広義の局所時系列データ)は、例えば図13、図19等でk=1のみの場合に対応する。
なお、S1001、S1002、S1003は、局所時系列データクラスタリングの初期クラスタを設定する方法(初期クラスタ分割規則)の一例を示している。この初期クラスタの選択方法は、ランダムに選択するなど、クラスタリングの既知の選択方法に置き換えてもよい。
図20、及び図10のフローチャートを参照してランダムに選択する場合を説明する。
初期クラスタをD (0)(j=1〜C*)と表記する。
図10ではk=2とする。
説明の単純化のため、局所時系列データLiは10個とし、
局所クラスタの設定数C*は、3とする。
ランダムに選択する場合、局所時系列データクラスタリング部104は、
局所時系列データL1〜L10を、たとえば次のように初期クラスタに分割する(S01,S02)。
(0)=L1〜L
(0)=L〜L
(0)=L〜L10
これは、図10のS1004(1回目)の処理が終了した状態である。
つぎに、S1005(1回目)でD (0)〜D (0)の回帰式を求め、これを
「m (1)〜m (1)」(代表情報である第1回帰式)とする(S02)。
次にS1004(2回目)で各Lとの距離がS1004の定義式(所定の距離定義式)に基づき最小となるm (1)を特定する(S03)。
そして、S1005(2回目)で、特定したm (1)(第1回帰式)を同じくする「時系列データ回帰式(S(Lki)に属するF(x))」の元になる局所時系列データから構成されるクラスタである第1クラスタD (1)〜D (1)を、m (1)〜m (1)に対応させて生成する。
(1)=L〜L
(1)=L〜L
(1)=L〜L10、
とする。
そして、第1クラスタD (1)〜D (1)に対して回帰分析を実施することにより第1クラスタD (1)〜D (1)ごとにm (2)〜m (2)(代表情報である第2回帰式)を生成する(S04)。
そして、S1006において、今回生成のm (2)〜m (2)が前回生成のm (1)〜m (1)に対して変化があるかどうかを判定する。変化がなければ処理は終了し、変化があればS1004(3回目)に進む。
S1004(3回目)では、各Lについてm (2)〜m (2)との距離がS1004の定義式に基づき最小となるm (2)を特定する(S05)。
そして、S1005(3回目)で、特定したm (2)(第1回帰式)を同じくする「時系列データ回帰式(S(Lki)に属するF(x))」の元になる局所時系列データから構成されるクラスタである第2クラスタD (2)〜D (2)を、m (2)〜m (2)に対応させて生成する。
(2)=L〜L
(2)=L〜L
(2)=L〜L10、L〜L2、
とする。
そして、
第2クラスタD (2)〜D (2)に対して回帰分析を実施することにより第2クラスタD (2)〜D (2)ごとにm (3)〜m (3)(代表情報である第3回帰式)を生成する(S06)。
そして、S1006において、今回生成のm (3)〜m (3)が前回生成のm (2)〜m (2)に対して変化があるかどうかを判定する。変化がなければ処理は終了し、
変化があればS1004(4回目)に進む。
S1004(4回目)を経て(S07)、S1005(4回目)では、上記と同様にして、今回のm (4)〜m (4)が生成される(S08)。
そして、S1006において、今回生成のm (4)〜m (4)が前回生成のm (3)〜m (3)に対して変化がなければ処理は終了するが、m (4)〜m (4)は前回生成のm (3)〜m (3)に対して変化がないとする。この場合、処理は終了する。
この場合、処理が終了した時点の第3クラスタD (3)〜D (3)が局所クラスタであり、
(4)〜m (4)が各局所クラスタを代表する代表局所パラメータ(局所クラスタ代表情報)である。
図10のS1001、S1002、S1003、S1004、S1005は、回帰式を生成する回帰式生成処理であり、S1006は、新たな回帰式を生成するたびに前回生成した回帰式から変化があるかどうかを判定し、変化があるときには次の新たな回帰式の回帰式生成処理を継続し、変化がないときには次の新たな回帰式の回帰式生成処理を継続することなく、回帰式生成処理を終了する判定処理である。
また、S1002におけるdistlm(S(L),{m,…,m}の定義も一例を示している。この距離では、クラスタリング分野でいう誤差2乗和基準を用いたが、最小分散、散布基準、トレース基準、行列式基準、不変量基準などを用いてもよい(参考文献:Richard O.Duda他著、尾上守夫監訳,パターン識別,pp.543−548,株式会社新技術コミュニケーション)。
(S905:大域的時系列データモデル推定部105の動作)
S905は、大域的時系列データモデル推定部105が実行する大域的データモデル推定である。S905では、局所時系列データクラスタリング部104が推定したモデルを接続することにより大域的な代表時系列データモデルを推定する。
図21は、S905の処理の流れの詳細を示すフローチャートである。
S1101で、大域的時系列データ候補の初期集合Gを作り、S1102以降で集合の要素を併合しながら、最終的な大域的データ推定モデルを得る。S1101は、局所時系列データクラスタリングの結果得られるクラスタDiを順に取り出し、大域的時系列データ候補の初期集合Gを作る。初期集合Gは、S904の処理により得られたクラスタDiの局所構造S(Di)の
集合{S(D),S(D),…,S(D)}
とする。
局所時系列データクラスタは、Yの区間l毎にC個あり、
全部でN=ΣC個ある。以下では、S(Di)は、クラスタ併合後の局所構造を表現できるように、
目的変数の区間(yis,yie]、
クラスタの代表回帰式Fik(x)の集合、
残差の平方和Eil、
局所時系列データLi、
Liが定義されている時間区間Tilの
5つ組((yis,yie],{Fik(x)},{Eik},Li,{Til})とする。
ここで、目的変数の区間
(yis,yie]は、
is<y≦yieを示している。
Figure 2013175108
S1102では、大域的時系列推定処理における接続処理を終了するかどうかを判定する。接続処理は、目的変数の区分が隣り合っており、かつ、クラスタの要素である局所時系列データ301の時間区間と代表回帰関数が近い組み合わせを含むという条件を満たす場合に、実行する。
例えば、集合Gのすべての要素Di,Djの組に対して、
条件Dist(S(Di),S(Dj))<δ
を満たすかどうかを判定する。条件を満たす場合には、S1105に進む。条件を満たさない場合は、S1103に進む。
ここで、
Dist(S(Di),S(Dj))は、例えば、以下で定義する。
Figure 2013175108
但し、||x||は、ユークリッド距離とする。S(Di)には、複数の局所構造をもつので、代表回帰式Fikは複数存在するので、S(Di)とS(Dj)では、すべてikとjlの組を比較した際の最小値をとるように定義する。
S1103では、大域的時系列推定処理における併合処理を実行する。例えば、集合GのすべてのDi,Djの組に対して、Dist(S(Di),S(Dj))が最小となるDi,Djを求める。
S1104では、大域的時系列データの候補集合Gを更新する。集合Gから、S(Di)とS(Dj)を削除し、S(Di+Dj) を追加する。但し、S(Di+Dj)は、例えば、下記で定義する。
Figure 2013175108
Dist(S(Di),S(Dj))がyie=yjs
の場合にしか定義されないので、併合後のyの区間は連続した一つの区間
(yis,yje]になる。
S1105では、集合GのすべてのDiに対して、区分的な回帰分析を実施する。このときの区分数は、自由に選択してもよいし、クラスタDiの構成要素となるG初期化時のクラスタ数(すなわち、S(Di)に含まれる代表回帰式の数に等しい)としてもよい。S1105で得られた区分的な回帰式が、推定された大域的な時系列データモデルである。
(S906:外れ値検出部106の動作)
S906は、外れ値検出部106が実行する外れ値検出処理である。別途与えられた区分データに対して、大域的時系列データモデル推定部105により得られた代表局所時系列データモデルの集合における外れ値が大きいものを異常として検出する。
以上のように、実施の形態1のプラント異常検知装置100では、時間やセンサ信号の値で区分された局所時系列データの集合をクラスタリングするS904の処理により、頻度の少ない局所時系列データは代表局所パラメータにはあまり影響されてないため、収集したデータ中に、設備の劣化に起因するデータのばらつきや、異常となる直前のデータが混入している場合でも、それらの頻度が少ない場合には、異常検知の精度低下を防ぐ効果が得られる。
また、S904で得られた局所時系列データクラスタリング部104が推定したモデルを接続することにより大域的な代表時系列データモデルを生成することで、センサ信号間の大域的な関係式を求めることができるようになる。したがって、この大域的な関係グラフからの偏差により異常と判定したことをユーザに示すことで、異常判断の根拠の説明をわかりやすく説明することができるようになる。
この大域的な関係式を求める処理は、図8に示すように、信号間の関係があらかじめ不明である非線形な関係にある場合でも、局所的に線形で表現された関係を接続しているので、大域的な関係式を求めることができるという効果も持つ。
(1)本実施の形態のプラント異常検出装置は、時間区分に分割して得られた軌跡区分をクラスタリングすることにより、軌跡区分の中で頻度が多いという意味で代表的な軌跡区分を抽出する。これにより、まれにしか生じない軌跡区分の影響を小さくすることにより、異常検知の精度を向上させることができる。
(2)また、大域的時系列データモデル推定部105が、上記の代表的な軌跡区分を接続することにより、大域的な代表的な軌跡を生成する。従って、センサ信号間の大域的な関係グラフを求め、この大域的な関係グラフからの偏差により異常と判定したことをユーザに示すことができるため、異常判断の根拠の説明をユーザにわかりやすく説明することができる。
実施の形態2.
図22、図23を参照して実施の形態4を説明する。実施の形態2は、コンピュータであるプラント異常検知装置100のハードウェア構成を説明する。図22は、コンピュータであるプラント異常検知装置100の外観の一例を示す図である。図23は、実施の形態1で述べたCPU割当時間管理装置1000のハードウェア資源の一例を示す図である。
外観を示す図22において、プラント異常検知装置100は、システムユニット830、CRT(Cathode・Ray・Tube)やLCD(液晶)の表示画面を有する表示装置813、キーボード814(Key・Board:K/B)、マウス815、コンパクトディスク装置818(CDD:Compact Disk Drive)などのハードウェア資源を備え、これらはケーブルや信号線で接続されている。システムユニット830はネットワークに接続している。
またハードウェア資源を示す図23において、プラント異常検知装置100は、プログラムを実行するCPU810(Central Processing Unit)を備えている。CPU810は、バス825を介してROM(Read Only Memory)811、RAM(Random Access Memory)812、表示装置813、キーボード814、マウス815、通信ボード816、CDD818、磁気ディスク装置820と接続され、これらのハードウェアデバイスを制御する。磁気ディスク装置820の代わりに、光ディスク装置、フラッシュメモリなどの記憶装置でもよい。
RAM812は、揮発性メモリの一例である。ROM811、CDD818、磁気ディスク装置820等の記憶媒体は、不揮発性メモリの一例である。これらは、「記憶装置」あるいは記憶部、格納部、バッファの一例である。通信ボード816、キーボード814などは、入力部、入力装置の一例である。また、通信ボード816、表示装置813などは、出力部、出力装置の一例である。通信ボード816は、ネットワークに接続されている。
磁気ディスク装置820には、オペレーティングシステム821(OS)、ウィンドウシステム822、プログラム群823、ファイル群824が記憶されている。プログラム群823のプログラムは、CPU810、オペレーティングシステム821、ウィンドウシステム822により実行される。
上記OS821,プログラム群823には、以上の実施の形態の説明において「〜部」として説明した機能を実行するプログラムが記憶されている。プログラムは、CPU810により読み出され実行される。
ファイル群824には、以上の実施の形態の説明において、「〜の判定結果」、「〜の算出結果」、「〜の抽出結果」、「〜の生成結果」、「〜の処理結果」として説明した情報や、データや信号値や変数値やパラメータなどが、「〜ファイル」や「〜データベース」の各項目として記憶されている。「〜ファイル」や「〜データベース」(例えばプラント時系列データベース101)は、ディスクやメモリなどの記録媒体に記憶される。ディスクやメモリなどの記憶媒体に記憶された情報やデータや信号値や変数値やパラメータは、読み書き回路を介してCPU810によりメインメモリやキャッシュメモリに読み出され、抽出・検索・参照・比較・演算・計算・処理・出力・印刷・表示などのCPUの動作に用いられる。抽出・検索・参照・比較・演算・計算・処理・出力・印刷・表示のCPUの動作の間、情報やデータや信号値や変数値やパラメータは、メインメモリやキャッシュメモリやバッファメモリに一時的に記憶される。
また、以上に述べた実施の形態の説明において、データや信号値は、RAM812のメモリ、CDD818のコンパクトディスク、磁気ディスク装置820の磁気ディスク、その他光ディスク、ミニディスク、DVD(Digital・Versatile・Disk)等の記録媒体に記録される。また、データや信号は、バス825や信号線やケーブルその他の伝送媒体によりオンライン伝送される。
また、以上の実施の形態の説明において、「〜部」として説明したものは、「〜手段」、であってもよく、また、「〜ステップ」、「〜手順」、「〜処理」であってもよい。すなわち、「〜部」として説明したものは、ソフトウェアのみ、或いは、ソフトウェアとハードウェアとの組み合わせ、さらには、ファームウェアとの組み合わせで実施されても構わない。ファームウェアとソフトウェアは、プログラムとして、磁気ディスク、フレキシブルディスク、光ディスク、コンパクトディスク、ミニディスク、DVD等の記録媒体に記憶される。プログラムはCPU810により読み出され、CPU810により実行される。すなわち、プログラムは、以上に述べた「〜部」としてコンピュータを機能させるものである。あるいは、以上に述べた「〜部」の手順や方法をコンピュータに実行させるものである。
以上の実施の形態では、プラント異常検知装置100を説明したが、プラント異常検知装置100の動作を、コンピュータに実行させるためのプログラムとしても把握できることは以上の説明から当然である。また、以上の実施の形態で説明したプラント異常検知装置100の動作を、プラント異常検知装置100の各部が行う検出方法、検知方法と把握することも可能である。
以上の実施の形態では、
時間の経過に従って順次観測して得た複数の時系列データの組を入力データとして、入力データの時間的な変化の仕方に従って、前記入力データを時間で区分することにより、時間で区分された時系列データを抽出する局所時系列データ抽出部と、
前記の区分されたデータを、多変量解析、または、時系列解析手法によりモデル推定する局所時系列データモデル推定部と、
前記により推定された局所時系列データのモデルの集合をクラスタに分割すると共に、クラスタ毎にクラスタを代表する代表局所パラメータを推定する局所時系列データクラスタリング部と、
別途与えられた区分データに対して、前記により得られた代表局所時系列データモデルの集合における外れ値が大きいものを異常として検出する外れ値検出部
とを有するプラント異常検知装置を説明した。
以上の実施の形態では、
時間で区分された時系列データを、さらに、時系列データの値のレンジで区分することにより得られる時系列データを抽出することを特徴とする局所時系列データ抽出部を備えたプラント異常検知装置を説明した。
以上の実施の形態では、
代表局所時系列データの推定モデルを接続することにより得られる大域的な代表時系列データの候補を生成する大域的時系列データモデル推定部を備えたこプラント異常検知装置を説明した。
100 プラント異常検知装置、101 プラント時系列データベース、102 局所時系列データ抽出部、103 局所時系列データモデル推定部、104 局所時系列データクラスタリング部、105 大域的時系列データモデル推定部、106 外れ値検出部、301 局所時系列データ、701 クラスタ、702 クラスタ、703 クラスタ、704 クラスタ、705 回帰式(代表局所パラメータ)、706 回帰式(代表局所パラメータ)、707,708 異常判定対象データ、901,902 局所時系列データの対応範囲。

Claims (6)

  1. 種類の異なる複数の時系列データから、第1時間範囲から第N時間範囲の異なるN個(Nは2以上の整数)の時間範囲ごとにその時間範囲に属する時系列データを抽出し、その時間範囲における複数の時系列データの組からなるN個の局所時系列データを生成する局所時系列データ抽出部と、
    前記局所時系列データ抽出部が抽出したN個の局所時系列データを、初期クラスタ分割の規則として予め設定された初期クラスタ分割規則に従って、予め設定された初期クラスタ数の初期クラスタに分割し、分割した初期クラスタごとに初期クラスタの特性を指標する代表情報を生成し、生成した代表情報ごとにN個の局所時系列データを再クラスタリングの規則として予め設定された再クラスタリング規則に従って分配することによりN個の局所時系列データをクラスタに分割する再クラスタリングを実行し、再クラスタリングしたクラスタごとに代表情報を再生成し、再生成した代表情報ごとに前記局所時系列データ抽出部が抽出したN個の局所時系列データを再クラスタリングし、
    以降同様に、
    N個の局所時系列データの再クラスタリングと、代表情報の再生成とを繰り返すと共に、代表情報を再生成するたびに、今回生成した代表情報が直前に生成した代表情報に対して変化があるかどうかを判定し、変化があるときには次回の代表情報の再生成処理を継続し、変化がないときには次回の代表情報の再生成処理を継続することなくN個の局所時系列データの再クラスタリングと代表情報の再生成との処理を終了する局所時系データクラスタリング部と
    を備えたクラスタリング装置。
  2. 前記クラスタリング装置は、
    前記局所時系列データ抽出部が生成したN個の局所時系列データに対応する回帰式である局所時系列データ回帰式をN個の局所時系列データごとに生成する局所時系列データ回帰式生成部を備え、
    前記局所時系データクラスタリング部は、
    分割した各初期クラスタに所属する局所時系列データの和集合に対して回帰分析を実施することにより初期クラスタごとに代表情報として第1回帰式を生成し、N個の局所時系列データのそれぞれの時系列データ回帰式に対して初期クラスタごとに生成したそれぞれの第1回帰式のうち再クラスタリング規則である所定の距離定義式に従って計算した距離が最短になる第1回帰式を特定し、特定した第1回帰式を同じくする時系列データ回帰式の元になる局所時系列データから構成されるクラスタである第1クラスタを、互いに異なる第1回帰式に対応させて生成することで再クラスタリングし、各第1クラスタに所属する局所時系列データの和集合に対して回帰分析を実施することにより第1クラスタごとに代表情報である第2回帰式を生成する回帰式生成処理を実行し、
    以下同様にして、
    N個の局所時系列データのそれぞれの時系列データ回帰式に対して第pクラスタ(pは1以上の整数)ごとに生成した代表情報であるそれぞれの第p+1回帰式のうち前記所定の距離定義式に従って計算した距離が最短になる第p+1回帰式を特定し、特定された第p+1回帰式を同じくする時系列データ回帰式の元になる局所時系列データから構成されるクラスタである第p+1クラスタを、互いに異なる第p+1回帰式ごとに対応させて生成することで再クラスタリングし、各第p+1クラスタに所属する局所時系列データの和集合に対して回帰分析を実施することにより第p+1クラスタごとに代表情報である第p+2回帰式を生成する回帰式生成処理を実行すると共に、
    新たな第p+1回帰式を生成するたびに前回生成した第p回帰式から変化があるかどうかを判定し、変化があるときには次の新たな第p+2回帰式の回帰式生成処理を継続し、変化がないときには次の新たな第p+2回帰式の回帰式生成処理を継続することなく、回帰式生成処理を終了する判定処理を実行することを特徴とする請求項1記載のクラスタリング装置。
  3. 前記局所時系列データ抽出部は、
    種類の異なる複数の時系列データのうち予め指定されている指定時系列データのデータ値の範囲を、第1データ範囲から第K個データ範囲(Kは2以上の整数)の異なるK個のデータ範囲に区分し、区分したK個のデータ範囲ごとに、所定の局所時系列データ生成規則を用いてN個の局所時系列データを生成し、
    前記局所時系列データ回帰式生成部は、
    前記局所時系列データ抽出部が、区分されたK個のデータ範囲ごとに生成した総数K×Nの個数の局所時系列データに対応する局所時系列データ回帰式をK×Nの個数の局所時系列データごとに生成し、
    前記局所時系データクラスタリング部は、
    前記局所時系列データ抽出部が区分したK個のデータ範囲ごとに、回帰式生成処理と判定処理とを、前記局所時系列データ抽出部が生成したデータ範囲に対応する局所時系列データと、前記局所時系列データ回帰式生成部が生成した局所時系列データ回帰式であって前記局所時系列データ抽出部が生成したデータ範囲を局所時系列データと同じくする局所時系列データ回帰式とを用いて実行することを特徴とする請求項2記載のクラスタリング装置。
  4. 前記局所時系列データクラスタリング部は、
    判定処理において回帰式生成処理を終了すると判定したときは、最後に生成した回帰式の生成の元になるクラスタを局所クラスタと決定し、決定した局所クラスタに対応する回帰式を、そのクラスタを代表する局所クラスタ代表情報と決定することを特徴とする請求項2または3のいずれかに記載のクラスタリング装置。
  5. 前記クラスタリング装置は、
    前記局所時系列データクラスタリング部が決定した局所クラスタ代表情報に基づき、評価対象として別途与えられた評価対象データであって、局所時系列データの生成の元になる種類の異なる複数の時系列データと種類を同じくする複数の時系列データの組からなる所定期間の評価対象データに対して、距離として定義された値がいずれかの局所クラスタ代表情報との間で閾値を超えるかどうかを検出する外れ値検出部を備えたことを特徴とする請求項2〜4のいずれかに記載のクラスタリング装置。
  6. コンピュータを、
    種類の異なる複数の時系列データから、第1時間範囲から第N時間範囲の異なるN個(Nは2以上の整数)の時間範囲ごとにその時間範囲に属する時系列データを抽出し、その時間範囲における複数の時系列データの組からなるN個の局所時系列データを生成する局所時系列データ抽出部、
    前記局所時系列データ抽出部が抽出したN個の局所時系列データを、初期クラスタ分割の規則として予め設定された初期クラスタ分割規則に従って、予め設定された初期クラスタ数の初期クラスタに分割し、分割した初期クラスタごとに初期クラスタの特性を指標する代表情報を生成し、生成した代表情報ごとにN個の局所時系列データを再クラスタリングの規則として予め設定された再クラスタリング規則に従って分配することにより、N個の局所時系列データをクラスタに分割する再クラスタリングを実行し、再クラスタリングしたクラスタごとに代表情報を再生成し、再生成した代表情報ごとに前記局所時系列データ抽出部が抽出したN個の局所時系列データを再クラスタリングし、
    以降同様に、
    N個の局所時系列データの再クラスタリングと、代表情報の再生成とを繰り返すと共に、
    代表情報を再生成するたびに、今回生成した代表情報が直前に生成した代表情報に対して変化があるかどうかを判定し、変化があるときには次回の代表情報の再生成処理を継続し、変化がないときには次回の代表情報の再生成処理を継続することなくN個の局所時系列データの再クラスタリングと、代表情報の再生成との処理を終了する局所時系データクラスタリング部、
    として機能させるためのクラスタリングプログラム。
JP2012040134A 2012-02-27 2012-02-27 クラスタリング装置及びクラスタリングプログラム Active JP5868216B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2012040134A JP5868216B2 (ja) 2012-02-27 2012-02-27 クラスタリング装置及びクラスタリングプログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2012040134A JP5868216B2 (ja) 2012-02-27 2012-02-27 クラスタリング装置及びクラスタリングプログラム

Publications (3)

Publication Number Publication Date
JP2013175108A true JP2013175108A (ja) 2013-09-05
JP2013175108A5 JP2013175108A5 (ja) 2015-01-08
JP5868216B2 JP5868216B2 (ja) 2016-02-24

Family

ID=49267944

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2012040134A Active JP5868216B2 (ja) 2012-02-27 2012-02-27 クラスタリング装置及びクラスタリングプログラム

Country Status (1)

Country Link
JP (1) JP5868216B2 (ja)

Cited By (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2018036726A (ja) * 2016-08-29 2018-03-08 公立大学法人大阪府立大学 データ解析装置、制御装置、データ解析装置の制御方法、制御プログラム、および記録媒体
EP3301586A1 (en) 2016-09-30 2018-04-04 Hitachi Power Solutions Co., Ltd. Pre-processor and diagnosis device
JP2019021305A (ja) * 2017-07-14 2019-02-07 株式会社明電舎 監視システム
JP2019032807A (ja) * 2017-08-04 2019-02-28 富士電機株式会社 要因分析システム、要因分析方法およびプログラム
JP2019101777A (ja) * 2017-12-04 2019-06-24 株式会社明電舎 異常診断装置および異常診断方法
CN110134839A (zh) * 2019-03-27 2019-08-16 平安科技(深圳)有限公司 时序数据特征处理方法、装置及计算机可读存储介质
JP2020021502A (ja) * 2015-10-09 2020-02-06 フィッシャー−ローズマウント システムズ,インコーポレイテッド 分散型工業パフォーマンス監視及び分析
US20200143283A1 (en) * 2018-11-01 2020-05-07 Kabushiki Kaisha Toshiba Time-series feature extraction apparatus, time-series feature extraction method and recording medium
JP6765577B1 (ja) * 2019-11-20 2020-10-07 三菱電機株式会社 運用ノウハウ推定装置、運用ノウハウ推定方法
CN112136087A (zh) * 2018-05-31 2020-12-25 三菱电机株式会社 作业分析装置
US10956251B2 (en) 2015-10-09 2021-03-23 Hitachi, Ltd. Abnormality detection device
US11112925B2 (en) 2013-03-15 2021-09-07 Fisher-Rosemount Systems, Inc. Supervisor engine for process control
CN113657533A (zh) * 2021-08-24 2021-11-16 河海大学 一种面向时空场景构建的多元时间序列分割聚类方法
US11293989B2 (en) 2018-03-15 2022-04-05 Nec Corporation Anomaly detection device, anomaly detection method, and recording medium
US11385608B2 (en) 2013-03-04 2022-07-12 Fisher-Rosemount Systems, Inc. Big data in process control systems
US11657121B2 (en) 2018-06-14 2023-05-23 Mitsubishi Electric Corporation Abnormality detection device, abnormality detection method and computer readable medium
US11966218B2 (en) 2018-06-15 2024-04-23 Mitsubishi Electric Corporation Diagnosis device, diagnosis method and program

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2001016678A (ja) * 1999-06-29 2001-01-19 Alpine Electronics Inc オーディオ音キャンセル装置
JP2006350730A (ja) * 2005-06-16 2006-12-28 Toshiba Corp クラスタリング装置、クラスタリング方法およびプログラム
WO2009107805A1 (ja) * 2008-02-27 2009-09-03 三菱重工業株式会社 プラント状態監視方法、プラント状態監視用コンピュータプログラム、及びプラント状態監視装置
JP2010181188A (ja) * 2009-02-03 2010-08-19 Mitsubishi Heavy Ind Ltd プラント運転状態監視方法
JP2011081697A (ja) * 2009-10-09 2011-04-21 Hitachi Ltd 設備状態監視方法、監視システム及び監視プログラム
JP4832609B1 (ja) * 2011-06-22 2011-12-07 株式会社日立エンジニアリング・アンド・サービス 異常予兆診断装置および異常予兆診断方法

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2001016678A (ja) * 1999-06-29 2001-01-19 Alpine Electronics Inc オーディオ音キャンセル装置
JP2006350730A (ja) * 2005-06-16 2006-12-28 Toshiba Corp クラスタリング装置、クラスタリング方法およびプログラム
WO2009107805A1 (ja) * 2008-02-27 2009-09-03 三菱重工業株式会社 プラント状態監視方法、プラント状態監視用コンピュータプログラム、及びプラント状態監視装置
JP2010181188A (ja) * 2009-02-03 2010-08-19 Mitsubishi Heavy Ind Ltd プラント運転状態監視方法
JP2011081697A (ja) * 2009-10-09 2011-04-21 Hitachi Ltd 設備状態監視方法、監視システム及び監視プログラム
JP4832609B1 (ja) * 2011-06-22 2011-12-07 株式会社日立エンジニアリング・アンド・サービス 異常予兆診断装置および異常予兆診断方法

Cited By (26)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11385608B2 (en) 2013-03-04 2022-07-12 Fisher-Rosemount Systems, Inc. Big data in process control systems
US11112925B2 (en) 2013-03-15 2021-09-07 Fisher-Rosemount Systems, Inc. Supervisor engine for process control
JP2020021502A (ja) * 2015-10-09 2020-02-06 フィッシャー−ローズマウント システムズ,インコーポレイテッド 分散型工業パフォーマンス監視及び分析
US10956251B2 (en) 2015-10-09 2021-03-23 Hitachi, Ltd. Abnormality detection device
US11886155B2 (en) 2015-10-09 2024-01-30 Fisher-Rosemount Systems, Inc. Distributed industrial performance monitoring and analytics
JP2018036726A (ja) * 2016-08-29 2018-03-08 公立大学法人大阪府立大学 データ解析装置、制御装置、データ解析装置の制御方法、制御プログラム、および記録媒体
EP3301586A1 (en) 2016-09-30 2018-04-04 Hitachi Power Solutions Co., Ltd. Pre-processor and diagnosis device
JP2019021305A (ja) * 2017-07-14 2019-02-07 株式会社明電舎 監視システム
JP7035842B2 (ja) 2017-07-14 2022-03-15 株式会社明電舎 監視システム
JP7139625B2 (ja) 2017-08-04 2022-09-21 富士電機株式会社 要因分析システム、要因分析方法およびプログラム
JP2019032807A (ja) * 2017-08-04 2019-02-28 富士電機株式会社 要因分析システム、要因分析方法およびプログラム
JP7009961B2 (ja) 2017-12-04 2022-01-26 株式会社明電舎 異常診断装置および異常診断方法
JP2019101777A (ja) * 2017-12-04 2019-06-24 株式会社明電舎 異常診断装置および異常診断方法
US11293989B2 (en) 2018-03-15 2022-04-05 Nec Corporation Anomaly detection device, anomaly detection method, and recording medium
CN112136087A (zh) * 2018-05-31 2020-12-25 三菱电机株式会社 作业分析装置
CN112136087B (zh) * 2018-05-31 2024-05-28 三菱电机株式会社 作业分析装置
US11657121B2 (en) 2018-06-14 2023-05-23 Mitsubishi Electric Corporation Abnormality detection device, abnormality detection method and computer readable medium
US11966218B2 (en) 2018-06-15 2024-04-23 Mitsubishi Electric Corporation Diagnosis device, diagnosis method and program
US20200143283A1 (en) * 2018-11-01 2020-05-07 Kabushiki Kaisha Toshiba Time-series feature extraction apparatus, time-series feature extraction method and recording medium
US11710066B2 (en) * 2018-11-01 2023-07-25 Kabushiki Kaisha Toshiba Time-series feature extraction apparatus, time-series feature extraction method and recording medium
CN110134839A (zh) * 2019-03-27 2019-08-16 平安科技(深圳)有限公司 时序数据特征处理方法、装置及计算机可读存储介质
CN110134839B (zh) * 2019-03-27 2023-06-06 平安科技(深圳)有限公司 时序数据特征处理方法、装置及计算机可读存储介质
JP6765577B1 (ja) * 2019-11-20 2020-10-07 三菱電機株式会社 運用ノウハウ推定装置、運用ノウハウ推定方法
WO2021100148A1 (ja) * 2019-11-20 2021-05-27 三菱電機株式会社 運用ノウハウ推定装置、運用ノウハウ推定方法
CN113657533B (zh) * 2021-08-24 2023-11-14 河海大学 一种面向时空场景构建的多元时间序列分割聚类方法
CN113657533A (zh) * 2021-08-24 2021-11-16 河海大学 一种面向时空场景构建的多元时间序列分割聚类方法

Also Published As

Publication number Publication date
JP5868216B2 (ja) 2016-02-24

Similar Documents

Publication Publication Date Title
JP5868216B2 (ja) クラスタリング装置及びクラスタリングプログラム
JP5538597B2 (ja) 異常検知方法及び異常検知システム
JP6312630B2 (ja) 時系列データ内の異常を検出する方法
JP5301717B1 (ja) 設備状態監視方法およびその装置
JP5301310B2 (ja) 異常検知方法及び異常検知システム
US11796989B2 (en) Monitoring system and monitoring method
JP5342708B1 (ja) 異常検知方法及びその装置
JP6183450B2 (ja) システム分析装置、及び、システム分析方法
JP5498540B2 (ja) 異常検知方法及びシステム
US20120296605A1 (en) Method, computer program, and system for performing interpolation on sensor data for high system availability
JP5827425B1 (ja) 予兆診断システム及び予兆診断方法
Fujiwara et al. Development of correlation-based pattern recognition algorithm and adaptive soft-sensor design
Losi et al. Anomaly detection in gas turbine time series by means of Bayesian hierarchical models
JP2010092355A (ja) 異常検知方法及びシステム
JP5827426B1 (ja) 予兆診断システム及び予兆診断方法
JP5669553B2 (ja) 異常検知装置、異常検知方法及び異常検知プログラム
JPWO2018073955A1 (ja) システム分析方法、システム分析装置、および、プログラム
He et al. Dynamic mutual information similarity based transient process identification and fault detection
JP5771317B1 (ja) 異常診断装置及び異常診断方法
EP4160341A1 (en) Abnormal modulation cause identifying device, abnormal modulation cause identifying method, and abnormal modulation cause identifying program
JP6915693B2 (ja) システム分析方法、システム分析装置、および、プログラム
JP6615892B2 (ja) 物理システムの経時変化プロファイリングエンジン
Li et al. A recursively updated Map-Reduce based PCA for monitoring the time-varying fluorochemical engineering processes with big data
Wang et al. Multi‐block principal component analysis based on variable weight information and its application to multivariate process monitoring
Gatta et al. Capability of the Bayesian Forecasting Method to Predict Field Time Series

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20141118

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20141118

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20150916

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20150929

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20151104

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20151208

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20160105

R150 Certificate of patent or registration of utility model

Ref document number: 5868216

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250