WO2019092997A1

WO2019092997A1 - データ分類装置

Info

Publication number: WO2019092997A1
Application number: PCT/JP2018/035281
Authority: WO
Inventors: 林　喜治; 孝朗関合; 義幸黒羽; 政幸平塚
Original assignee: 株式会社日立製作所
Priority date: 2017-11-13
Filing date: 2018-09-25
Publication date: 2019-05-16
Also published as: EP3712777A1; EP3712777A4; PH12020550507A1; JP6951202B2; JP2019091128A; CN111108455A

Abstract

誤検知を低減することのできるデータ分類装置及び異常診断システムを提供することを目的とする。　上記課題を解決するため、本発明に係るデータ分類装置は、運転データを複数のカテゴリーに分類するデータ分類部３０と、データ分類部の出力を管理する分類結果データベース４０と、を有するデータ分類装置であって、データ分類部３０はカテゴリーが生成された順序を表す世代番号が小さいものを優先的にカテゴリー候補として選択して運転データのカテゴリー決定する。

Description

データ分類装置

本発明は、データ分類装置及び異常診断システムに関する。

　発電プラントや装置には、監視及び制御を目的として、温度計、圧力計及び流量計などの多くのセンサーが設置されている。また、近年では、橋梁や道路などのインフラ設備にも加速度センサー等のセンサーを設置し、設備の状態監視を監視することも実施されている。

　このようなセンサーデータの特徴は、複数の関連するセンサーデータがあり、ある時間周期で計測された、多次元の時系列データであるということである。このような多次元の時系列データを活用した状態監視方法には様々な方法が提案されている。最もシンプルなものは、多次元のデータ項目のうち、着目すべきデータ項目を選定し、データ項目の値が予め設定した閾値を超えるか否かで状態変化を検知する方法である。また、非特許文献１に示す方法では、多次元のデータをクラスタリングして、カテゴリーに分割することで異常を検知する。

　非特許文献１に示された方法について、図１を用いて説明する。本先行技術では、データクラスタリング技術の１つとして適応共鳴理論（以下、ARTと称す）を用いている。ARTでは、多次元データを類似度に応じて複数のカテゴリーに分類する機能を持つ。本検知方法では、この機能を利用して、学習フェーズと診断フェーズの２段階で設備の異常を検知する。

　学習フェーズでは、設備が正常な状態の運転データをARTに入力する。ARTはデータの類似度に応じて、運転データを複数のカテゴリーに分類するため、運転データが正常な場合に生成するカテゴリーを規定できる。

　診断フェーズでは、正常データを学習したARTに診断したい運転データ（診断データ）を入力する。その結果、学習データとの類似度が高いデータは、学習フェーズと同じカテゴリーに分類される。しかし、設備になんらかの異常が生じ、データの傾向が変わった場合には、学習データとは異なるカテゴリー（新規カテゴリー）に分類される。このように、ARTにより分類されたカテゴリーから設備の状態変化を判定することができる。

日本機械学会誌　Vol. 118 (2015) No. 1163 p. 624-627 G.A.Carpenter and Ｓ.Grossberg："ART2:Self-　　　　　　　　　　　　　　　　OrganizatioNo.f stable category recognition codes 　　　　　　　　for analog input patterns",Applied 　　　　　　　　　　　　　　　　Optics,Vol26,No.23,(1987)

　しかしながら、非特許文献１に記載の技術では、正常データに分類されていたデータの一部が新規カテゴリーに分類される場合があった。その例を図２、図３を用いて説明する。

　図２は、学習データの分類結果を模式的に示した図である。実践で囲まれた部分が学習時のカテゴリーの領域を示している。図３は、学習時のカテゴリーの領域の近傍にデータｍが入力され、新規カテゴリーが生成した場合の分類結果を模式的に表している。本図に示したように、学習データの近くに新規カテゴリーが生成した場合、学習時のカテゴリーに分類されていたデータkが新規カテゴリーに分類されることがある。ARTでは、どちらのカテゴリーの領域にも入るデータは、より近いカテゴリーに分類されるため、新規カテゴリーの発生位置によっては、上記のような事象が起こりうる。すなわち、新規カテゴリーの発生によってデータ分類特性が変化するため、検知精度については配慮されていない。

　本発明に代表的なものの一つについて示せば、運転データを複数のカテゴリーに分類するデータ分類部と、前記データ分類部の出力を管理する分類結果データベースと、を有するデータ分類装置であって、前記データ分類部は前記カテゴリーが生成された順序を表す世代番号が小さいものを優先的にカテゴリー候補として選択して前記運転データのカテゴリー決定するデータ分類装置。

　本発明によれば誤検知を低減することのできるデータ分類装置及び異常診断システムを提供することができる。

非特許文献１に示された方法でデータを分類する考え方を示す図。非特許文献１に示された方法で正常なデータを学習した例を示す図。非特許文献１に示された方法でデータを診断した例を示す図。本発明の第一の実施例の構成を示す図。運転データデータベースに格納されている運転データの例を示す図。本発明の実施例のデータ分類部の構成を示す図。カテゴリーの世代番号の考え方を示す図。本発明の実施例のデータ分類アルゴリズムを示す図。本発明の実施例で示した方法でデータを診断した例を示す図。本発明の実施例の分類結果データベースに記録された運転データの一例を示す図。本発明の実施例の分類結果データベースに記録された世代番号の一例を示す図。本発明の実施例の表示・操作部の条件設定画面の一例を示す図。本発明の実施例の表示・操作部の分類結果表示画面の一例を示す図。

　以下、本発明の実施形態について添付図面を参照しながら説明する。

　図４は本発明の実施形態にかかる第一の実施例を示す。本実施例は、本発明のデータ分類装置をプラントの異常診断システムに利用した例であり、プラント１０、運転データデータベース２０、データ分類部３０、分類結果データベース４０、および表示・操作部５０からなる。以下に各構成要素の概要を述べる。

　プラント１０には、流量計、温度計、圧力計などのセンサーが設置されており、プラントの制御及び監視のために利用している。

　運転データデータベース２０には、プラント１０のセンサーで計測されたデータが、１分毎の時系列データとして保存されている。保存されている運転データのうち、表示・操作部５０で指定された正常データが学習データとして切り出され、データ学習部３０に送られる。また、プラントでリアルタイムに計測されたデータも一時的に運転データデータベースに格納されたのち、診断データとして一定の周期でデータ分類部３０に送られる。

　データ分類部３０では、適応共鳴理論（ART: Adaptive Resonance Theory）をベースとしたクラスタリングアルゴリズム（以下、改良ARTと称す）を用いて、多次元の運転データを複数のカテゴリーに分類する。改良ARTでは、入力された多次元のデータが分類されるカテゴリー番号に加え、そのカテゴリー番号の生成順を示す世代番号を出力する。また、データを分類する際に、世代番号を考慮してカテゴリー番号を決定する。なお、カテゴリー番号を決定する詳細なアルゴリズムについては、後述する。

　分類結果データベース４０では、データ分類部３０から出力されたカテゴリー番号と各カテゴリーの世代番号を管理する。

　表示・操作部５０では、前述したように学習データ、診断データの条件設定をする。また、図１の下部に示したようなカテゴリー番号のトレンドグラフや診断結果を表示する。

　次に、本実施例について詳細に説明する。

　プラント１０は、機器とそれをつなぐ配管、バルブ等から構成されている。機器と配管には、プラントの状態の監視および制御のために、流量計、温度計、圧力計などのセンサーが設置されている。これらのセンサーには、例えば、温度計であれば、TIC001のようなタグがついている。このタグが各センサーのIDとなり、タグ情報により各センサーを識別する。

　運転データデータベース２０には、プラント１０のセンサーで計測されたデータが時系列データとして記録されている。運転データの一例を図５に示す。図１に示すように、プラント１０に設置されたセンサーデータが時間毎に保存されている。この時間間隔は任意に指定することが可能であるが、本実施例では、時間間隔を１分とした。

　データ分類部３０では、適応共鳴理論（ART）をベースとした改良ARTを用いてデータを分類する。データ分類部３０の詳細な構成を図６に示す。データ分類部３０は、データ前処理部３１と改良ART３２からなる。

　データ前処理部３１では、運転データを[0,1]の範囲に正規化し、補数を追加する。具体的には、ｎ次元の運転データxi(i=1,2,..n)があったとすると、まず、式（１）で正規化したデータXi(i=1,2,..n)を作成する。

　　Xi = (xi-xi_lower)/(xi_Upper-xi_lower)・・・・・・（１）
　ここで、xi_Upperは、正規化の上限値、xi_lowerの下限値である。

　次に、Xiの補数Xciを式（２）で求め、２ｎ次元のデータにする。

　　Xci =1-Xi・・・・・・（２）
　このように、n次元のデータを２ｎ次元にする前処理は、ARTでデータを分類する際に必要な前処理である。理由は、非特許文献２に記載されているため、ここでは説明を割愛する。

　次に、改良ART32について説明する。図６に示した改良ARTの構成は、従来のARTの構成と同じであるが、分類結果データベース４０に保存されている世代番号を活用してカテゴリーを選択する点が異なる点である。そこで、まず、従来のARTのアルゴリズムの概要を示した後、改良点について説明する。

　F0レイヤーでは，入力データベクトルの大きさを１にし，ノイズを除去する。F1 レイヤーでは，ノイズ除去された入力データを短期記憶として保持する。F2 レイヤーでは，カテゴリー毎に定義されている重み係数とF1レイヤーで保持された入力データから、入力データに最もよく一致するカテゴリーを選択する。選択サブシステムでは， F2 レイヤーで選択したカテゴリーが妥当であるかを判定し、妥当であれば、選択したカテゴリーを出力カテゴリーとして採用する。妥当でない場合は、選択したカテゴリーを不採用と判断し，リセット信号をF2 レイヤーに送信する。この処理を繰り返すことで適切なカテゴリーを選択するが、全てのカテゴリーが採用されない場合は，新規カテゴリーが生成する。

　次に、改良点について詳細に説明する。まず、本アルゴリズムで利用する世代番号について説明する。世代番号は、カテゴリーが生成した順序を表す番号として、新しく定義したものである。図７を用いて、世代番号の具体的例を説明する。本図は、学習データで学習後、診断データ1～診断データ4を順に診断した場合のカテゴリー番号のトレンドデータである。学習データで生成したカテゴリー0とカテゴリー１は、最も早く生成したカテゴリーであり、世代番号0となる。次に、診断データ１を入力して新たに生成したカテゴリー2は世代番号1となり、診断データ3で新たに生成したカテゴリー3およびカテゴリー4は、世代番号2となる。

　次に、世代番号を用いた改良アルゴリズムの処理について説明する。改良アルゴリズムでは、F2レイヤーでカテゴリーの候補を選択する際、世代番号が小さいものを優先的に選択する。すなわち、まず、世代番号0である学習時のカテゴリーの中で候補を選択し、全ての世代番号0のカテゴリーが不適切と判断された場合に、世代番号1のカテゴリーを候補として選択する。さらに、世代番号１のカテゴリーが全て不適切と判断された場合は、世代番号２のカテゴリーを候補として選択する。最終的に、全てのカテゴリーが不適切と判断された場合は、新しいカテゴリーを追加する。

　このアルゴリズムの詳細について、図８に示す。ステップ３２１は対象となる入力データが入力され、F0レイヤー、F1レイヤーで処理される。また、変数GNを初期値（0）に設定する。ステップ３２２はF2レイヤーにおいて、世代番号がGNであるカテゴリーから、対象データのカテゴリーとして、最も適切な候補カテゴリーを選択する。ステップ３２３は選択サブシステムにおいて、選択された候補カテゴリーが妥当か否かを判定する。妥当であれば、ステップ３２９に進み選択したカテゴリーが出力される。妥当でなければ、ステップ３２４に進む。ステップ３２４は選択した候補カテゴリーを不採用とする。なお、不採用となったカテゴリーは、対象となった入力データに対し、再度候補となることはない。ステップ３２５は世代番号がGNであり、不採用になっていないカテゴリーが残っているかを判定する。残っていれば、ステップ３２２に戻り、再度候補のカテゴリーを選択する。残っていなければ、ステップ３２６に進む。ステップ３２６はGNが世代番号の最大値になっているかを判定する。最大値になっていなければ、ステップ３２７に進み、最大値になっていればステップ３２８に進む。ステップ３２７はGNの値を１増加させ、ステップ３２２の処理に進む。この処理により、世代番号が１大きいカテゴリーの中から、再度候補カテゴリーを選択することになる。ステップ３２８はステップ３２６の結果より、全ての世代番号について、候補カテゴリーが不採用となっているため、新規カテゴリーを生成し、候補カテゴリーとし、ステップ３２９に進む。ステップ３２９は選択された候補カテゴリーを出力する。

　本アルゴリズムを用いてデータを分類した例を図９に示す。分類したデータは、図３に示したデータと同じである。図９より、従来のアルゴリズムではカテゴリー３に分類されたデータｋが、本アルゴリズムでは、カテゴリー２に分類されている。すなわち、このようなアルゴリズムとすることで、学習データとして用いたデータが正常データに分類されることを防ぐことができる。

　次に、分類結果データベース４０について説明する。分類結果データベースの一例を図１０と図１１に示す。図１０は、正規化された運転データと運転データが分類されたカテゴリー番号が記録されている。例えば、FIC001は、正規化の上限値が4.0、下限値が3.0として正規化されている。また、添付の例では、１０時１分のデータから１０時３分のデータは、全てカテゴリー２に分類されていることが分かる。

　図１１は、カテゴリーに関する情報が記録されている。本実施例では、各カテゴリーの世代番号と属性が記録されている。世代番号は、前述したようにカテゴリーの発生順序を表すものである。本図は、図７の結果に対応しており、学習データが分類されたカテゴリー１、２の世代番号は０、診断データ１を分類した際に出力されたカテゴリー３の世代番号は１とういように記録されている。また、属性とは、各カテゴリーが発生したときのプラントの状態を記録するためのものであり、必要であれば、ユーザが入力できる項目である。図１１の例では、カテゴリー番号４，５が発生した際に、機器の圧力に異常が見られたため、「圧力異常」と登録している。

　最後に、表示・操作部５０について説明する。表示・操作部５０では、前述したように学習データ、診断データの条件設定し、分類結果を表示する。

　条件設定画面の一例を図１２に示す。図１２の上部では、学習データの条件を期間と条件で設定している。期間は、開始時刻と終了時刻を指定し、その中に含まれるデータを抽出する。図１２の例では、2016/9/1の０時から2016/12/1の０時までの３ヶ月と、2017/1/1の０時から2017/3/1の０時までの２ヶ月の合計５ヶ月の期間を学習期間として設定している。ただし、その期間に含まれるデータを全て利用するわけではなく、「条件」欄で利用するデータの条件を指定する。ここでは、条件１：FIC002の値が2.5以上、条件２：FIC003の値が3.5以上という２つの条件のAND条件に合致するデータのみを学習データとして利用する。また、本実施例では、条件１と条件２のAND条件を指定した例を示したが、複合条件部分の数式を1+2とすることで、OR条件も指定することができる。このような条件を設定することで、例えば、プラントへの原料供給量が一定値以上となり、安定稼動しているデータのみを抽出することができる。

　次に、図１２の下部にある診断データの設定画面について説明する。診断時には、一定の診断周期でデータを診断するため、設定画面では、診断周期を設定する。サンプリング周期は、データの時刻データから自動的に判別する。本実施例では、サンプリング周期が１分の例を示している。診断周期は、サンプリング周期のN倍（N＝1,2,..）の値を設定する。本実施例では、N=10とし、１０分間隔で診断する。すなわち、１０分毎に、１０点の１分データをまとめてデータ分類部５０に入力し、１０点のデータのカテゴリーを判定する。

　図１３は、表示・操作部５０の分類結果表示画面の例である。ここでは、上部に運転データのトレンドグラフを表示し、下部には、トレンドグラフと同じ期間のカテゴリー番号の推移を示す。この結果グラフの表示により、新規カテゴリーが発生し、異常を検知した場合に、合わせて運転データの変化を確認することができる。本実施例では、カテゴリー番号が３以上が新規カテゴリーであり、新規カテゴリー発生時にPIC001の値が大きくなっていることがわかる。

　以上のように、本発明のデータ分類装置を用いることで、学習データとして用いたデータが正常データに分類されることを防ぐことができる。また、多次元の時系列データの状態を分類した場合に、過去のデータ分類結果の再現性が向上する。

１０：プラント
２０：運転データデータベース
３０：データ分類部
４０：分類結果データベース
５０：表示・操作部

Claims

　運転データを複数のカテゴリーに分類するデータ分類部と、
　前記データ分類部の出力を管理する分類結果データベースと、を有するデータ分類装置であって、
　前記データ分類部は前記カテゴリーが生成された順序を表す世代番号が小さいものを優先的にカテゴリー候補として選択して前記運転データのカテゴリー決定するデータ分類装置。
　請求項１に記載のデータ分類装置であって、
　前記カテゴリー候補の妥当性について判定を行い、妥当であれば前記カテゴリー候補を前記運転データのカテゴリーとし、妥当でない場合は前記カテゴリー候補を不採用とするデータ分類装置。
　請求項２に記載のデータ分類装置であって、
　前記不採用と判断した際に他の前記カテゴリー候補が存在する場合には他の前記カテゴリー候補を選択し、他の前記カテゴリー候補が存在しない場合には新規カテゴリーを生成し前記カテゴリー候補とするデータ分類装置。
　請求項１ないし３のいずれか１項に記載のデータ分類装置を備える異常診断システムであって、
　プラントと、
　前記プラントの前記運転データが保存される運転データデータベースと、
　前記運転データのうち正常データを選択する表示・操作部と、を備える異常診断システム。
　請求項４に記載の異常診断システムであって、
　前記表示・操作部は前記データ分類部のデータ分類期間又は閾値を設定する異常診断システム。
　請求項４に記載の異常診断システムであって、
　前記表示・操作部は前記分類結果データベースの分類結果を表示する異常診断システム。