JP2005258649A - データ分類方法及び装置 - Google Patents

データ分類方法及び装置 Download PDF

Info

Publication number
JP2005258649A
JP2005258649A JP2004067263A JP2004067263A JP2005258649A JP 2005258649 A JP2005258649 A JP 2005258649A JP 2004067263 A JP2004067263 A JP 2004067263A JP 2004067263 A JP2004067263 A JP 2004067263A JP 2005258649 A JP2005258649 A JP 2005258649A
Authority
JP
Japan
Prior art keywords
art
category
data
teacher
categories
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2004067263A
Other languages
English (en)
Other versions
JP4676149B2 (ja
JP2005258649A5 (ja
Inventor
Yoshinari Hori
嘉成 堀
Akihiko Yamada
昭彦 山田
Yoshiharu Hayashi
喜治 林
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Ltd
Original Assignee
Hitachi Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Ltd filed Critical Hitachi Ltd
Priority to JP2004067263A priority Critical patent/JP4676149B2/ja
Publication of JP2005258649A publication Critical patent/JP2005258649A/ja
Publication of JP2005258649A5 publication Critical patent/JP2005258649A5/ja
Application granted granted Critical
Publication of JP4676149B2 publication Critical patent/JP4676149B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Testing And Monitoring For Control Systems (AREA)

Abstract

【課題】
本発明の目的は、分類精度と汎化能力を維持しつつ、不必要にARTカテゴリーを増加させないデータ分類方法及び装置を提供することにある。
【解決手段】
教師付き学習型のARTネットワーク11は複数個の入力データを複数個の教師カテゴリーに分類する。入力データをARTネットワーク11により分類した結果であるARTカテゴリーのうち、任意のARTカテゴリーに属するデータの教師カテゴリーが複数個存在する場合に、重み係数ベクトルの修正操作を実施し、再度入力データをARTネットワーク11により分類する。
【選択図】 図1

Description

本発明は、データを与えた教師カテゴリーのとおりに分類する、教師付き学習型の適応共鳴理論(Adaptive Resonance Theory:ART)を用いたデータ分類方法および装置に関する。
適応共鳴理論(Adaptive Resonance Theory:ART)は1987年にG.A.CarpenterとS.Grossbergによって提案された教師なし学習ネットワークの一種であり、入力データを複数個のカテゴリーに分類する機能がある。ARTネットワークには、ART1、ART2、Fuzzy ARTなどいくつかの種類が提案されており、アナログデータの分類が可能なARTについては下記の非特許文献1に記載されている。
また、教師付き学習型ARTネットワークについてもARTMAPというアーキテクチャーが提案されており、下記の非特許文献2に記載されている。
教師付き学習型ARTネットワークについて説明する。教師付き学習型ARTネットワークはデータを教師なし学習によりデータを分類するART1と、ART1で分類したカテゴリー(以下、ARTカテゴリーと称する)と教師カテゴリーの対応づけを行うカテゴリー対応手段を用いて、データと教師カテゴリーの関係を学習する。データを教師カテゴリーと完全に一致させるためには、あるARTカテゴリーに分類されたデータが全て同じ教師カテゴリーである必要がある。
しかしながら、一般的には図2に示したARTカテゴリーJのように、1つのARTカテゴリーに分類されたデータには異なる教師カテゴリーが含まれる場合がある。非特許文献1は、図2に示したように1つのARTカテゴリーに異なる教師カテゴリーのデータが含まれる場合には、ART1の分類の詳細度を決定する警戒係数を大きくし、ARTカテゴリーをより細かく分類して再学習させるマッチトラッキングという手法を用いている。この手法を用いることにより図3のようにARTカテゴリーに分類されたデータが全て同じ教師カテゴリーになるように分類することが可能である。
しかし、この学習方法は、類似した未学習データの識別能力(汎化能力)を損なう場合がある。図3の各領域はデータを識別できる範囲を表しており、警戒係数を大きくしたことにより図2に比べて領域が狭くなっている。その結果、学習に用いたデータについては教師カテゴリーの通りに分類できるが、未学習データを入力した場合にはデータを教師カテゴリーに分類できなくなる。すなわち、汎化能力を低下させてしまうという問題がある。
この問題を解決するために、下記の特許文献1では 異なる教師カテゴリーが含まれるARTカテゴリーに含まれるデータのみを警戒係数を大きくして再学習し、再学習終了後には警戒係数を元の値に戻すようにすることが提案されている。このようにすると、分類結果は図4のようになり、汎化能力を維持したままARTカテゴリーに分類されたデータが全て同じ教師カテゴリーにすることができる。
G.A.Carpenter and S.Grossberg :"ART2:Self-Organization of stable categoryrecognition codes for analog input patterns",Applied Optics,Vol26,No23,(1987) Carpenter, G. A., S. Grossberg and J. H. Reynolds, "ARTMAP: A selr-orgallizillg ncural network architecture for fast supervised learning and pattern recognition,'' International Joint Conference on Neural Networks, 1, 863 - 868 (1991) 特開平9−147045
しかしながら、従来技術は、例えば、あるARTカテゴリーに含まれるデータの大半が教師カテゴリーAで、少数のデータが教師カテゴリーBであった場合、少数の教師カテゴリーBを分類するためには必要以上にARTカテゴリーの数を増加させなければならない。例えば、図5の例では、状態(b)のARTカテゴリー2'がそのような状態となっている。ARTカテゴリー2'から教師カテゴリーBのみを分類する場合、状態(c)〜状態(e)を経て、状態(f)のように分類され、不必要にARTカテゴリーの数が増加するという問題点を有する。
本発明の目的は、分類精度と汎化能力を維持しつつ、不必要にARTカテゴリーを増加させないデータ分類方法および装置を提供することにある。
本発明の特徴とするところは、複数個の入力データを複数個の教師カテゴリーに分類する教師付き学習型のARTネットワークを用いたデータ分類方法であって、入力データをARTネットワークにより分類した結果であるARTカテゴリーのうち、任意のARTカテゴリーに属するデータの教師カテゴリーが複数個存在する場合に、重み係数ベクトルの修正操作を実施し、再度入力データをARTネットワークにより分類するようにしたことにある。
本発明は不必要にARTカテゴリーを増加させないでデータを分類することが可能となり、データを格納するメモリー容量を小さくすることができる。従って、対象機器が非常に小さくデータ分類装置のハード的及びソフト的な大きさが制限される場合において、本発明は特に有効となる。
データ分類装置は複数個の入力データを複数個の教師パターンに分類するARTネットワークを用いている。カテゴリー対応手段はARTネットワークの分類結果を入力し、少なくとも1つ以上のARTカテゴリーに属するデータの教師カテゴリーが複数個存在することを判定する判定すると係数調整信号を出力する。警戒係数変更手段はARTカテゴリーに対応する警戒係数を設定値だけ増加させ、重み係数修正手段はARTカテゴリーに対応する重み係数を修正する。重み係数修正手段は、1つのARTカテゴリーに対応する重み係数が1つのARTカテゴリー以外で当該ARTカテゴリーに属する教師カテゴリーが含まれる他のARTカテゴリーの重み係数に近づけるように修正する。カテゴリー対応手段が係数調整信号を出力すると警戒係数変更手段の変更操作と重み係数修正手段の修正操作の少なくともいずれか一方を実施して入力データをARTネットワークにより再度分類する。
図1に本発明の一実施例を示す。
図1の実施例は、ARTネットワーク11、カテゴリー対応手段12及びARTネットワーク修正手段13から構成されている。ARTネットワーク修正手段13は警戒係数変更手段131と重み係数修正手段132を有する。
ARTネットワーク11はART2モジュールを用いている。ART2モジュールは入力データaを入力すると、ARTカテゴリーjを出力する。一般的なARTモジュールは、分類の詳細度を示す警戒係数ρがARTカテゴリーjによらず同じ値であるが、本実施例のARTネットワーク11はARTカテゴリーj毎に警戒係数ρ(j)が設定されている。従って、ARTカテゴリーjによって異なる値をとることが可能となる。
カテゴリー対応手段12はARTカテゴリーjと教師カテゴリーとの対応関係を記憶している。出力ARTカテゴリーjと教師カテゴリーkの対応関係は多対1となるように記憶する。カテゴリー対応手段12は同じARTカテゴリーjに対して複数の教師カテゴリーkが対応する場合、すなわち、対応関係が1対多または多対多となる場合にはARTネットワーク修正手段13に係数調整信号を与える。
ARTネットワーク修正手段13はカテゴリー対応手段12から係数調整信号が入力されると、ARTネットワーク11の警戒係数と重み係数のパラメータを修正する。
ARTネットワーク11はノイズ除去部111、入力パターン保持部112、カテゴリー出力部113及びパターン一致度判定部114で構成されている。これらの構成要素の上記非特許文献2に記載されている構成との対応関係は次の通りである。ノイズ除去部111はF0レイヤー、入力パターン保持部112はF1レイヤー、カテゴリー出力部113はF2レイヤー、パターン一致度判定部114はOrienting Subsystemに対応している。
入力パターン保持部112とカテゴリー出力部113は重み係数Wj及びZjを介して結合しており、重み係数は入力データが分類されるARTカテゴリーの代表ベクトルを表している。すなわち、例えば図2の例では、各ARTカテゴリーの領域の中心を規定するものである。
ARTネットワーク11における入力ベクトルaを入力した場合のアルゴリズムの概要は次のステップ1からステップ5のようになる。
ステップ1:ノイズ除去部111により入力ベクトルaの大きさが「1」になるように正規化され、また、ノイズが除去される。
ステップ2:入力パターン保持部112に入力された入力ベクトルaと重み係数Wjとの比較により、ふさわしいARTカテゴリーの候補が選択される。
ステップ3:パターン一致度判定部114で選択したARTカテゴリーの妥当性がパラメータρ(j)との比較により評価される。妥当と判断されれば、入力データaはそのARTカテゴリーに分類され、ステップ4に移行する。妥当と判断されなければ、そのカテゴリーはリセットされ、他のARTカテゴリーからふさわしいARTカテゴリーの候補が選択される(ステップ1の処理を繰り返す)。パラメータρ(j)の値を大きくするとARTカテゴリーの分類が細かくなり、ρ(j)を小さくすると分類が粗くなる。
ステップ4:ステップ2で全ての既存のARTカテゴリーがリセットされると、新規ARTカテゴリーと判断され、新規ARTカテゴリーの代表ベクトルを表す新しい重み係数を生成する。
ステップ5:入力データがARTカテゴリーJに分類されると、ARTカテゴリーJに対応する重み係数WJ (new),ZJ (new) は過去の重み係数WJ (old), ZJ (old) と入力ベクトルaから派生したベクトルpにより次式で更新される。
Figure 2005258649

Figure 2005258649

式1により新しい重み係数WJ (new) は 古い重み係数WJ (old)に入力ベクトルa
が反映されることになる。なお、Kwは学習率パラメータであり、入力データを新しい重み係数に反映させる度合いを決定する。式(2)についても式(1)と同様である。
ARTネットワーク11のデータ分類アルゴリズムの特徴はステップ4の処理にある。ステップ3の処理により、記憶しているパターンと異なる入力ベクトルaが入力された場合、記憶しているパターンは変更せず新しいパターンを記憶することができる。このため、過去に学習したパターンを記憶しながら、新たなパターンを記憶することが可能となる。
なお、ART2ネットワークの動作は上記した非特許文献2に詳細に記載されており、詳細説明を省略する。
次に、実施例1の全体の動作を説明する。
実施例1は入力ベクトルaと教師カテゴリーの関係を学習するモード(事前学習モード)と、学習後に未学習の入力ベクトルa’を入力すると、入力ベクトルa’が属するカテゴリーを推定するモード(推定モード)がある。以下、学習モードと推定モードの順に説明する。
まず、学習モードを図6に示す処理フローを参照して説明する。図6は入力ベクトルa及び教師カテゴリーがM組ある例を示している。
ステップS1:カテゴリー対応手段12のカテゴリー対応関係を初期化する。
ステップS2:ARTネットワーク11にM組の入力ベクトルaを順次入力し、各々に対するARTカテゴリーを計算する。ただし、ARTネットワーク11から出力されるARTカテゴリーはARTネットワーク11にM組の入力ベクトルを与える処理を何度か繰り返さないと一定とならない場合がある。すなわち、M組の入力ベクトルを1度与えた場合のARTカテゴリーは必ずしも正しく分類されたARTカテゴリーでないことが多い。
そこで、本実施例ではM組の入力ベクトルaをARTネットワーク11に与える処理を何度か繰り返し、ARTカテゴリーが変化しなくなった場合にARTカテゴリーが収束したと判断しステップS3に移行する。
ステップS3:m番目の入力データaのARTカテゴリーがj*で、教師カテゴリーk*とすると、ARTカテゴリーがj*と教師カテゴリーk*の対応関係を一時的に記憶する。
ステップS4:ステップS3で記憶した対応関係がm―1組目までの対応関係に矛盾がないかを判定する。過去の対応関係が、ARTカテゴリーがj*のときには教師カテゴリーk*であれば、j*→k*の対応関係に矛盾がないためステップS6に移行する。また、過去にARTカテゴリーがj*のときに教師カテゴリーk'(k'≠k*)であった場合には矛盾があり、ステップS5に移行する。
ステップS5:過去の対応関係と矛盾があった場合は、カテゴリーj*に分類されたデータ中に異なる教師カテゴリーが存在することを表しているため、式3で警戒係数ρ(j)を設定値Δρだけ変更し、また、式4及び式5で重み係数WJ 及びZJ を修正する。
Figure 2005258649

Figure 2005258649

Figure 2005258649
警戒係数の設定値Δρは、Δρ>0であり、式3により警戒係数ρ(j)は大きくなる。
また、式4及び式5の重み係数の修正値ΔWj及びΔZjは次のように決定している。
(1)ARTカテゴリーJに分類されたデータの教師カテゴリーの中で、ARTカテゴリーJ中の個数が最大のものを選択する(ここでは教師カテゴリーKとする)。
(2)ARTカテゴリーj(j≠J)の中で、教師カテゴリーKのデータが含まれ、かつARTカテゴリーJの最も近傍に位置するARTカテゴリーを選択する(ここではARTカテゴリーj*とする)。なお、該当するARTカテゴリーが見つからない場合は、上記(1)で別の教師カテゴリーK'を選択して同じ処理を繰り返す。
(3)重み係数修正値ΔWj及びΔZj を式6及び式7で決定する。
Figure 2005258649

Figure 2005258649
重み係数修正値ΔWj及びΔZjを式6及び式7のように決定することで、ARTカテゴリーJの重み係数WJはARTカテゴリーj*の重み係数Wj*に近づくように重み係数ベクトルが変更される。ステップS5の終了後にステップS1に戻り同様の処理を実行する。
ステップS6:全M組のデータについてマッチトラッキング処理(ステップS5)を通過せずに処理を終了できた場合、全M組のデータに関してARTカテゴリーと教師カテゴリーの関係を矛盾なく学習できたことになり、学習を終了する。
次に、推定モードについて説明する。推定モードは教師データがなく、M’組の入力データがある場合について以下にそのフローを示す。
ステップ1:重み係数ベクトル等の各種パラメータを学習終了時の値に設定する。
ステップ2:ARTネットワーク11にM’組の入力ベクトルa’を順に入力し、各々に対するARTカテゴリーを計算する。
ステップ3:m’番目の入力ベクトルa’のARTカテゴリーj’とカテゴリー対応手段12によって記憶しているARTカテゴリーと教師カテゴリーの対応関係を利用して、入力ベクトルa’が属するARTカテゴリーを(例えばk’であると)推定する。ただし、入力ベクトルa’が属するART出力カテゴリーがこれまでに出現したことのない新たなARTカテゴリーであった場合、カテゴリー対応手段12は対応関係を学習していない。したがって、その場合には入力ベクトルa’が属するARTカテゴリーを推定できず、不明となる。
以上が第一の実施例におけるデータ分類アルゴリズムである。
なお、上述の説明では学習モードにおける図6に示す処理フローのステップS5において、式3による警戒係数の修正操作と式4、式5による重み係数の修正操作を同時に実施しているが、いずれか一方だけを実施してもよいことは明らかなことである。また、式4と式5の修正操作を実施する確率をp1(0≦p1≦1)及びp2(0≦p2≦1)とし、確率的に両者を実施することもできる。
また、上述の実施例は、式6により、カテゴリーJの重み係数WJはカテゴリーj*の重み係数Wj*に近づくように重み係数ベクトルを変更しているが、乱数を用いて重み係数調整値ΔWjを発生し、ランダムに重み係数Wjを変更することもできる。重み係数調整値ΔZjについても同様である。
このように入力データを分類した結果について図7を用いて説明する。
図7(a)に示すようにARTカテゴリー1とARTカテゴリー2に分類されるところまでは従来技術の図5と同様である。しかし、本発明では、ARTカテゴリー2に教師カテゴリーAと教師カテゴリーBが存在するため、図6のステップS5において警戒係数ρ(j)と重み変数WJ 及びZJを修正し再分類している。その結果は図7(b)のようになる。
ARTカテゴリー2'の警戒係数は大きくなり、重み係数ベクトルがARTカテゴリー1側に移動したため、ARTカテゴリー2'の領域はやや小さくなり、ARTカテゴリー1側に移動している。その結果、ARTカテゴリー1'の領域はARTカテゴリー1に比べやや小さくなる。また、新たにARTカテゴリー3'が発生する。
ARTカテゴリー2'にはまだ異なる教師カテゴリーが混在するため、さらに警戒係数ρ(j)と重み変数WJ 及びZJを修正すると図7(c))のようになりカテゴリー2"は全て教師パターン1となり、分類は終了する。
このように、本発明ではデータが3つのARTカテゴリーに分類されたのみであり、図5に示した従来技術に比べてARTカテゴリー数を少なくできる。したがって、不必要にARTカテゴリーを増加させないでデータを分類することが可能となり、データ分類装置に用いるメモリー容量を小さくすることができる。
上記実施例においては、ARTネットワーク11はARTカテゴリー毎に警戒係数ρ(j)が設定されていたが、全てのARTカテゴリーが同一の警戒係数ρを持つARTネットワークでも良い。
このような全てのARTカテゴリーが同一の警戒係数ρを持つARTネットワークにおいて、ARTカテゴリーのうち、あるARTカテゴリーJに属するデータの教師カテゴリーが複数個存在する場合に、重み係数ベクトルの修正操作を施すことにより、ARTカテゴリーの領域は平行移動する。
従って、図5の(b)のARTカテゴリー2のように教師カテゴリーbのデータにわずかな教師カテゴリーAのデータが含まれる場合、データの分割数を増やすことなく教師カテゴリーAと教師カテゴリーBを分離することができる。すなわち、従来技術で実施されているように、警戒係数ρを変更してARTカテゴリーの領域の大きさのみを変更する方法に比べ、少ないARTカテゴリー数でデータを分類することが可能となる。
ただし、教師カテゴリーAと教師カテゴリーBの境界が複雑になると、重み係数ベクトルの修正操作のみでは教師カテゴリーAと教師カテゴリーBを分離することができない場合がある。この場合、ARTカテゴリーの領域を平行移動させる重みベクトル修正操作とARTカテゴリーの領域の大きさを変更する警戒係数ρの修正操作を組み合わせることにより、従来技術に比べ少ないARTカテゴリーでデータを分類することが可能となる。
さらに、実施例で示したようにARTカテゴリー毎に警戒係数ρ(j)が設定したARTネットワークを利用することで、領域の大きさを変更する必要があるARTカテゴリーのみ大きさを変更することができるため、さらに少ないARTカテゴリーでデータを分類することが可能となる。
図8に本発明の他の実施例を示す。実施例2は本発明のデータ分類技術を発電設備の遠隔診断システムに適用した例である。
図8において、発電設備3a〜3nと監視センタ1から構成され、機器設備3a〜3nと監視センタ1はネットワーク2により接続されている。
発電設備3a〜3nはガスタービン発電機31、制御装置32及びデータ送信装置33からなる。ガスタービン発電機31は圧縮機、燃焼器、タービン及び発電機から構成され、圧縮機による圧縮空気が燃焼器に送られ、燃料と混合されて燃焼器で燃焼する。燃焼により発生した高圧ガスによりタービンが回転し発電する。
制御装置32では電力需要に応じてガスタービン発電機31の出力を制御する。また、制御装置32はタービン発電機31に設置されたセンサー(図示せず)で計測した運転データが入力されている。運転データは吸気温度、燃料投入量、タービン排ガス温度、タービン回転数、発電機発電量等の状態量で、1秒間隔で計測している。データ送信装置33は制御装置32で計測した運転データをネットワーク2経由で監視センター1に送信する。
監視センター1はネットワーク2経由で発電設備3a〜3nの運転データを受信し、発電設備3a〜3nの状態を監視する。監視センター1は、データ受信装置20、運転データベース30、保守データベース40、データ制御装置50、データ分類装置10a〜10n及び操作端末装置60から構成されている。
データ受信装置20は受信した運転データを運転データベース30及びデータ制御装置50に送信する。また、保守員が携帯端末から入力した保守情報は保守データベース40に送信する。
運転データベース30はデータ受信装置20から送られた運転データを発電設備3a〜3n毎に格納する。運転データは図9のような形式で格納されている。計測項目は吸気温度、燃料投入量、タービン排ガス温度、タービン回転数、発電機発電量等の状態量であり、1秒間隔で記録されている。また、これらの計測データの他に運転モードが記録されている。運転モードは「起動運転」「定格運転」などに対応する数値で記録されており、図9の例では、「定格運転」に対応する「0」が記入されている。
さらに、運転データベース30にはデータ分類装置10a〜10nによる分類結果も格納されている。分類結果は2種類有り、一つはARTネットワーク11により分類したARTカテゴリーでARTカテゴリーの番号が記録され、もう一つは「正常」「異常A」などのような機器の状態であり同じく状態に対応する番号で記録されている。
保守データベース40はデータ受信装置20から送られた保守情報を格納する。保守データベース40には保守員が行った保守情報が記録されている。蓄積されている保守情報は、例えば図10のように記録されている。
図10の例では実際の保守作業は次ぎのようになる。時刻9:50にモニタリングによりアラームが発生し、異常が確認されている。時刻10:30に現地に保守員が到着し保守作業を開始している。時刻10:45に部品を交換したのち、ガスタービン発電機31の試運転を実施し、時刻11:300に異常が復旧したことを確認し、保守作業を終了している。
データ制御装置50は、運転データ及び保守データをサイト、運転モードで分類し、データ分類装置10a〜10nに入力可能な形式に加工する。このデータの分類・加工の詳細については後述する。また、データ分類装置10a〜10nは推定モード、学習モード及び準備モードがある。データ制御装置50はモードに合わせた入力データの制御を行う。
操作端末装置60はデータ制御装置50のモード切替え指令を入力する。また、運転データベース30や保守データベース40に記録された情報、あるいはデータ分類装置10a〜10nにより分類された結果をモニタ画面に出力する。
データ分類装置(診断装置)10a〜10nには前述したように、推定モード、学習モード及び準備モードがある。推定モードではデータ受信装置20から送られた運転データに基づき発電設備3a〜3nの状態を診断する。診断結果は運転データベース30に送られる。学習モードでは運転データベース30及び保守データベース40に格納された情報を用いて運転データと発電設備3a〜3nの状態の関係を学習する。
また、準備モードでは学習も推定も行わないようになっている。この準備モードは新規サイトが設置された場合などに学習に必要なデータがない場合のモードである。これらのモードはデータ分類装置10a〜10n毎に個別に設定可能である。モードの設定は操作端末装置60にて行う。
次に、監視センター1の動作について説明する。データ分類装置10a〜10nが実際に動作するモードは学習モード及び推定モードの2つであるため、学習モード、推定モードの順で説明する。なお、前述したように、学習モード、推定モードはサイト毎に個別に設定可能であるが、ここでは、複数のサイトが全て学習モードの場合および全て推定モードの場合を例に挙げ説明する。
学習モードでは運転データベース30及び保守データベース40に格納された情報を用いて運転データと発電設備3a〜3nの状態の関係を学習する。両データベース30,40に格納されている情報は直接データ分類装置10a〜10nに入力できないデータ形式になっている。データ制御装置50は運転データ及び保守情報をデータ分類装置10a〜10nに入力できるデータ形式に変換する。
図11にデータ制御装置50のアルゴリズムを示す。なお、以下の説明では、計測項目は前述した5項目(DATA1〜DATA5)とする。
データ制御装置50はステップS10において全運転データをサイトと運転モードでグループ分けし、各グループのデータのサンプリング間隔を決定する。グループ分けの例を次ぎに示す。例えば、「サイト1」〜「サイト3」の3つのサイトで運転モードが「起動運転」「定格運転」「停止運転」の3モードであったとすると、運転データは合計9つのグループにグループ分けられる。データのサンプリング間隔は運転モードによって異なる。例えば、運転データの変化が少ない「定格運転」では1分間隔とし、それ以外のモードでは1秒間隔とする。
ステップS11に移り、ステップS10で分類したグループのうち1つのグループを選択する。ステップS11からステップS12に移行してステップS11で選択したグループに該当するデータを用いてDATA1〜DATA5の計測項目毎に最大値及び最小値を計算する。例えば、「サイト1」の「定格運転」モードのデータが100時間分あったとすると、各項目のデータ数は6000個となる。最大値、最小値は6000個のデータから算出する。ステップS12で計算した最大値及び最小値はサイト毎にデータ制御装置50内に記憶される。
ステップS13ではステップS12で求めた最大値及び最小値を用いてデータを正規化する。その方法についてDATA1を例に説明する。DATA1のデータ数がM個でm番目の計測値をdata1(m)とする。また、M個のデータの最大値及び最小値をそれぞれMax_1,Min_1すると、正規化したデータNdata_1(m)は式8で計算する。
Ndata_1(m)=α+(1−α)×(data_1(m)−Min_1)/( Max_1−Min_1) …(式8)
定数αは(0≦α<0.5)であり、式8によりデータは[α,1−α]の範囲に正規化される。定数αは、例えば、α=0.2に設定される。
ステップS13からステップS14に移行して、ステップS13で正規化したデータの補数計算を行い入力データに加える。DATA1を例に説明すると、正規化データNdata_1(m)の補数C Ndata_1(m)を次式で計算する。
CNdata_1(m)=1− Ndata_1(m) …(式9)
ステップS13とステップS14で作成したデータNdata_1(m)〜Ndata_5(m)及び CNdata_1(m)〜CNdata_5(m)の10項目のデータが入力データaとなり、データ分類装置10a〜10nの構成要素であるARTネットワーク11に入力される。入力データaの一例を図12に示す。なお、図12に示した表の中で、項目名及び日付、時刻の値は説明のために図示したものであり、入力データとしては使用しない。
ステップS15では機器状態データを変換してカテゴリー対応手段12の入力データbを作成する。保守データベース40には機器の状態が記録されている。例えば、状態として「正常」「異常A」「異常B」の3種類があったとすると、それぞれを[1,0,0,…,0]、[0,1,0,…,0]、[0,0,1,…,0]のビット列で表現する。ただし、保守データベース40には決まった時間間隔で設備の状態が記録されているわけではない。したがって、入力データaの時間間隔に合わせてデータを加工する必要がある。
入力データbの一例を図13に示す。図10と図13を比較すると、図13のデータ間隔が1分間隔のデータに修正されている。このように時間間隔を修正することで、同一時刻の運転データとそのときの設備の状態が対応したデータが得られる。なお、図13においても日付、時刻のラベル及び値は説明のために図示したものであり、入力データとしては使用しない。
ステップS16に移りステップS10で分類した全てのグループに対してステップS12〜ステップS15の処理を実行したかを判定する。残っているグループがあればそれらのグループに対応するデータについてステップS12〜ステップS15の処理を実行する。全てのグループに対して処理が完了した場合は終了する。
以上の処理により、ステップS10で分類した個数だけ入力データaと入力データbのペアが作成される。これらはそれぞれ異なるデータ分類装置10a〜10nに入力される。
データ分類装置10a〜10nは、入力データaと入力データbの関係を学習する。入力データa、入力データbは共にM個あり、M組のデータを順にデータ分類装置10a〜10nに入力している。M組の入力データaと入力データbの関係を学習するアルゴリズムについては実施例1において詳細に説明しているので、再度の説明を省略する。
データ分類装置10a〜10nは学習が終了すると、学習の結果得られた重み係数をデータ分類装置10a〜10n内の記憶領域に保存する。本発明では上述したようにARTカテゴリーが必要以上に増加しないため、データ分類装置10a〜10n内の記憶容量を小さくすることが可能となる。
次に、推定モードでは、データ受信装置20から1分毎に送られる運転データに基づき発電設備3a〜3nの状態を診断する。データ受信装置20から送られた運転データはデータ制御装置50により加工され、データ分類装置10a〜10nに送られる。
データ制御装置50にはサイト毎にデータを正規化するための最大値及び最小値が記憶されている。従って、データ受信装置20から送られたデータは、学習モードの図11のステップS13及びステップS14の処理により瞬時にデータ変換され、データ分類装置10a〜10nに入力される。データ分類装置10a〜10nには学習モードで得られた重み係数が記憶されている。従って、実施例1の推定モードで説明した手順でARTカテゴリー及び発電設備3a〜3nの状態が推定される。推定されたARTカテゴリー及び発電設備3a〜3nの状態は操作端末60のモニタ画面に出力することができる。また、運転データベース30に保存することもできる。
本発明の一実施例を示す構成図である。 従来技術による分類結果の説明図である。 従来技術による分類結果の説明図である。 従来技術による分類結果の説明図である。 従来技術による課題の説明図である。 本発明の学習アルゴリズムを説明するフロー図である。 本発明による分類結果の一例を示す図である。 本発明の他の実施例を示す構成図である。 本発明の運転データの一例を示す図である。 本発明の保守データの一例を示す図である。 本発明のデータ変換アルゴリズムを説明するフロー図である。 本発明の入力データの一例を示す図である。 本発明の他の入力データの一例を示す図である。
符号の説明
1…監視センター、2…ネットワーク、3…発電設備、10…データ分類装置、11…ARTネットワーク、12…カテゴリー対応手段、13…ARTネットワーク修正手段、131…警戒係数変更手段、132…重み係数修正手段、20…データ受信装置、30…運転データベース、40…保守データベース、50…データ制御装置、60…操作端末装置。

Claims (7)

  1. 複数個の入力データを複数個の教師カテゴリーに分類する教師付き学習型の適応共鳴理論(以下ARTと称する)ネットワークを用いたデータ分類方法において、前記入力データを前記ARTネットワークにより分類した結果であるARTカテゴリーのうち、任意のARTカテゴリーに属するデータの教師カテゴリーが複数個存在する場合に、重み係数ベクトルの修正操作を実施し、再度前記入力データを前記ARTネットワークにより分類することを特徴とするデータ分類方法。
  2. 複数個の入力データを複数個の教師カテゴリーに分類する教師付き学習型のARTネットワークを用いたデータ分類方法において、前記入力データを前記ARTネットワークにより分類した結果であるARTカテゴリーのうち、任意のARTカテゴリーに属するデータの教師カテゴリーが複数個存在する場合に、重み係数ベクトルの修正操作と警戒係数の修正操作を実施し、再度前記入力データを前記ARTネットワークにより分類することを特徴とするデータ分類方法。
  3. 複数個の入力データを複数個の教師カテゴリーに分類する教師付き学習型のARTネットワークを用いたデータ分類方法において、
    前記ARTネットワークは、ARTカテゴリー毎に警戒係数を有し、前記入力データを前記ARTネットワークにより分類した結果であるARTカテゴリーのうち、任意のARTカテゴリーに属するデータの教師カテゴリーが複数個存在する場合に、当該ARTカテゴリーに対応する警戒係数の修正操作と、重み係数ベクトルの修正操作とを実施し、再度前記入力データを前記ARTネットワークにより分類することを特徴とするデータ分類方法。
  4. 複数個の入力データを複数個の教師カテゴリーに分類する教師付き学習型のARTネットワークを用いたデータ分類方法において、前記ARTネットワークは、ARTカテゴリー毎に警戒係数を有し、前記入力データを前記ARTネットワークにより分類した結果であるARTカテゴリーのうち、任意のARTカテゴリーに属するデータの教師カテゴリーが複数個存在する場合に、当該ARTカテゴリーに対応する警戒係数の修正操作と、当該ARTカテゴリーに対応する重み係数ベクトルを、前記教師カテゴリーが含まれる他のARTカテゴリーに対応する重み係数ベクトルに近づけるように修正する操作とを実施し、再度前記入力データを前記ARTネットワークにより分類することを特徴とするデータ分類方法。
  5. 複数個の入力データを複数個の教師カテゴリーに分類する教師付き学習型のARTネットワークを用いたデータ分類装置において、ARTカテゴリーと教師カテゴリーの対応関係を判定し、任意のARTカテゴリーに属するデータの教師カテゴリーが複数個存在すると係数修正信号を出力するカテゴリー対応手段と、重み係数ベクトルを修正する重み係数修正手段と、警戒係数を修正する警戒係数修正手段とを具備し、前記カテゴリー対応手段が係数修正信号を出力した場合に、前記重み係数修正手段及びまたは前記警戒係数修正手段による修正操作を実施し、再度前記入力データを前記ARTネットワークにより分類することを特徴とするデータ分類装置。
  6. 複数個の入力データを複数個の教師カテゴリーに分類する教師付き学習型のARTネットワークを用いたデータ分類装置において、前記ARTネットワークは、ARTカテゴリー毎に警戒係数を有し、ARTカテゴリーと教師カテゴリーの対応関係を判定し、任意のARTカテゴリーに属するデータの教師カテゴリーが複数個存在すると係数修正信号を出力するカテゴリー対応手段と、重み係数ベクトルを修正する重み係数修正手段と、警戒係数を修正する警戒係数修正手段とを具備し、前記カテゴリー対応手段が係数修正信号を出力した場合に、前記警戒係数修正手段により、当該ARTカテゴリーに対応する警戒係数の修正操作を実施し、前記重み係数修正手段により重み係数を修正し、再度前記入力データを前記ARTネットワークにより分類することを特徴とするデータ分類装置。
  7. 複数個の入力データを複数個の教師カテゴリーに分類する教師付き学習型のARTネットワークを用いたデータ分類装置において、前記ARTネットワークは、ARTカテゴリー毎に警戒係数を有し、ARTカテゴリーと教師カテゴリーの対応関係を判定し、任意のARTカテゴリーに属するデータの教師カテゴリーが複数個存在すると係数修正信号を出力するカテゴリー対応手段と、重み係数ベクトルを修正する重み係数修正手段と、警戒係数を修正する警戒係数修正手段とを具備し、前記カテゴリー対応手段が係数修正信号を出力した場合に、前記警戒係数修正手段により、当該ARTカテゴリーに対応する警戒係数の修正操作を実施し、前記重み係数修正手段により、当該ARTカテゴリーに対応する重み係数ベクトルを、前記教師カテゴリーが含まれる他のARTカテゴリーに対応する重み係数ベクトルに近づけるように修正する操作とを実施し、再度前記入力データを前記ARTネットワークにより分類することを特徴とするデータ分類装置。
JP2004067263A 2004-03-10 2004-03-10 データ分類装置 Expired - Lifetime JP4676149B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2004067263A JP4676149B2 (ja) 2004-03-10 2004-03-10 データ分類装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2004067263A JP4676149B2 (ja) 2004-03-10 2004-03-10 データ分類装置

Publications (3)

Publication Number Publication Date
JP2005258649A true JP2005258649A (ja) 2005-09-22
JP2005258649A5 JP2005258649A5 (ja) 2007-01-25
JP4676149B2 JP4676149B2 (ja) 2011-04-27

Family

ID=35084322

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2004067263A Expired - Lifetime JP4676149B2 (ja) 2004-03-10 2004-03-10 データ分類装置

Country Status (1)

Country Link
JP (1) JP4676149B2 (ja)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2011039823A1 (ja) * 2009-10-02 2011-04-07 株式会社日立製作所 プラント診断装置
CN102890495A (zh) * 2011-07-19 2013-01-23 株式会社日立制作所 成套设备的诊断方法以及装置
CN110826600A (zh) * 2019-10-18 2020-02-21 北京航空航天大学 基于自适应共振网络在线增量学习的发动机喘振预测方法
WO2020066124A1 (ja) * 2018-09-26 2020-04-02 株式会社日立製作所 プロセス状態解析装置及びプロセス状態表示方法
CN111108455A (zh) * 2017-11-13 2020-05-05 株式会社日立制作所 数据分类装置

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH09147045A (ja) * 1995-11-17 1997-06-06 Toyo Electric Mfg Co Ltd ニューラルネットワーク

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH09147045A (ja) * 1995-11-17 1997-06-06 Toyo Electric Mfg Co Ltd ニューラルネットワーク

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2011039823A1 (ja) * 2009-10-02 2011-04-07 株式会社日立製作所 プラント診断装置
JP5199478B2 (ja) * 2009-10-02 2013-05-15 株式会社日立製作所 プラント診断装置
CN102890495A (zh) * 2011-07-19 2013-01-23 株式会社日立制作所 成套设备的诊断方法以及装置
CN111108455A (zh) * 2017-11-13 2020-05-05 株式会社日立制作所 数据分类装置
WO2020066124A1 (ja) * 2018-09-26 2020-04-02 株式会社日立製作所 プロセス状態解析装置及びプロセス状態表示方法
US11393143B2 (en) 2018-09-26 2022-07-19 Hitachi, Ltd. Process state analysis device and process state display method
CN110826600A (zh) * 2019-10-18 2020-02-21 北京航空航天大学 基于自适应共振网络在线增量学习的发动机喘振预测方法

Also Published As

Publication number Publication date
JP4676149B2 (ja) 2011-04-27

Similar Documents

Publication Publication Date Title
US8036999B2 (en) Method for analyzing and classifying process data that operates a knowledge base in an open-book mode before defining any clusters
JP4641537B2 (ja) データ分類方法および装置
CN107111309B (zh) 利用监督式学习方法的燃气涡轮机故障预测
US20180231394A1 (en) Gas turbine sensor failure detection utilizing a sparse coding methodology
EP2410312A1 (en) A method for computer-assisted analyzing of a technical system
CN113111591B (zh) 基于模块化配电终端内部故障自动诊断方法、装置及设备
Pawełczyk et al. Industrial gas turbine operating parameters monitoring and data-driven prediction
JP2011070334A (ja) 異常診断装置及び異常診断方法
KR20190082715A (ko) 상관도를 고려한 데이터 분류 방법 및 이 방법을 수행하기 위한 프로그램이 저장된 컴퓨터 판독가능한 저장매체
JP4676149B2 (ja) データ分類装置
CN115510950A (zh) 基于时间卷积网络的飞行器遥测数据异常检测方法及系统
EP3982225A2 (en) Method and system for regime-based process optimization of industrial assets
CN112749744B (zh) 基于观测模块的贝叶斯网络轨道客车牵引系统故障诊断方法及系统
CN111814393B (zh) 基于生成对抗网络的apu退化参数生成方法
CN110826587B (zh) 基于改进的加权一类支持向量机的涡轴发动机故障检测方法
CN110826600B (zh) 基于自适应共振网络在线增量学习的发动机喘振预测方法
Chen et al. Application of a neural fuzzy system with rule extraction to fault detection and diagnosis
CN115618708A (zh) 基于增量式Informer算法的设备健康状态预测方法
JP2010244149A (ja) データ分類方法,データ分類装置,診断方法,診断装置
CN115017978A (zh) 一种基于加权概率神经网络的故障分类方法
Loskiewicz-Buczak et al. Aggregation of evidence by fuzzy set operations for vibration monitoring
Yélamos et al. Fault diagnosis based on support vector machines and systematic comparison to existing approaches
Sundaram et al. Aircraft engine health monitoring using density modelling and extreme value statistics
Benıtez-Pérez et al. The use of ARMAX strategy and self organizing maps for feature extraction and classification for fault diagnosis
Renström Condition monitoring system for wind turbines–based on deep autoencoders

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20061204

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20061204

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20100119

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20100318

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20100831

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20101028

A911 Transfer to examiner for re-examination before appeal (zenchi)

Free format text: JAPANESE INTERMEDIATE CODE: A911

Effective date: 20101108

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20110125

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20110127

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140204

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Ref document number: 4676149

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

EXPY Cancellation because of completion of term