JP2002015000A - 多変数時系列データ類似度判定装置 - Google Patents

多変数時系列データ類似度判定装置

Info

Publication number
JP2002015000A
JP2002015000A JP2000196814A JP2000196814A JP2002015000A JP 2002015000 A JP2002015000 A JP 2002015000A JP 2000196814 A JP2000196814 A JP 2000196814A JP 2000196814 A JP2000196814 A JP 2000196814A JP 2002015000 A JP2002015000 A JP 2002015000A
Authority
JP
Japan
Prior art keywords
data
time
similarity
series data
feature amount
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2000196814A
Other languages
English (en)
Inventor
Masanori Yukitomo
友 雅 徳 行
Akitomo Ueto
都 礼 智 上
Kazutaro Shinohara
原 和太郎 篠
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Original Assignee
Toshiba Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp filed Critical Toshiba Corp
Priority to JP2000196814A priority Critical patent/JP2002015000A/ja
Publication of JP2002015000A publication Critical patent/JP2002015000A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

(57)【要約】 【課題】 膨大のデータ量を有する多変数時系列データ
同士の類似度を高精度且つ高速に判定すること。 【解決手段】 特徴量変換部1AはデータセットA(第
1のデータセット)を入力して、これを第1の特徴量ベ
クトルに変換し、特徴量変換部1BはデータセットB
(第2のデータセット)を入力して、これを第2の特徴
量ベクトルに変換する。類似度演算部2は、これら変換
された第1及び第2の特徴量ベクトルの相互間の比較を
行い、データセットAとデータセットBとの類似性を表
す類似度を演算する。結果表示部3は、この演算結果を
表示する。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、産業プラント設備
における温度・流量等のプロセス値、あるいは金融証券
分野における株価や為替などの時々刻々変化する多変数
時系列データのそれぞれに相関関係がある場合に、これ
らの多変数時系列データにより構成されるデータセット
間の類似度について判定を行う多変数時系列データ類似
度判定装置に関するものである。
【0002】
【従来の技術】産業プラント設備では、膨大なデータ量
のプロセス値を収集すると共に、そのデータ内容を解析
することにより、設備の異常状態等の発生の有無につい
て監視を行っている。また、金融証券分野においても株
価や為替などについての多量のデータに対する解析を行
うことによりこれらの値の将来の変化について予測を行
っている。これらのプロセス値あるいは株価や為替など
のデータは、いずれも時間の経過と共に値が変化する時
系列データであり、同様の環境又は条件等によって同様
の変化パターンを示すことが多い。したがって、ある時
系列データが得られた場合に、これと類似する変化パタ
ーンを持つ過去の時系列データを見つければ、将来の変
化動向を予測することができ、また、異常が発生してい
る場合にはその異常原因等を推測することが可能とな
る。
【0003】従来から上記のような2つの時系列データ
間の類似性の判定は、主として、熟練したオペレータや
ディーラが行っているが、近年の情報システム技術の急
速な発展に伴って収集されるデータ量も増加の一途をた
どっているため、判定する者に対する負担も大きくなる
と共に、看過してしまうデータも多くなってきている。
そこで、例えば特開平5−204991号公報に開示さ
れているように、2つの時系列データ間の類似性の判定
を人手に頼らず、自動的に行うための技術がいくつか提
案されている。これは類似度を判定しようとする対象時
系列データと過去の登録時系列データとを照合する場合
に、時間スケールや振幅等を同一条件とし、更に照合開
始点をデータのサンプリング時間毎にずらすようにした
技術である。
【0004】
【発明が解決しようとする課題】ところで、ある事象同
士の関連性を総合的に判断するためには複数の変数すな
わち多変数の時系列データ同士の類似度について判定す
る必要がある。例えば、プラント設備において異常の有
無を判定するためには、ある個所の温度についての新た
な検出データと過去の登録データとの類似度を判定する
必要がある場合に、流量や圧力等の他の要素についての
新たな検出データと過去の登録データとの類似度に関し
ても判定した方がより総合的且つ正確な類似度の判定と
なる。
【0005】しかし、上記した従来の技術は、単一の変
数の時系列データ同士の類似度を判定しようとするもの
であり、多変数の時系列データ同士の類似度を判定する
ものではないために、ある事象同士の関連性を総合的に
判断することができなかった。また、上記の従来技術
は、時系列データ同士の照合開始点をサンプリング時間
毎にずらすようにしているが、照合する範囲が長期間に
わたる場合は照合時間が非常に長くなってしまうことに
なる。
【0006】本発明は上記事情に鑑みてなされたもので
あり、膨大のデータ量を有する多変数時系列データ同士
の類似度を高精度且つ高速に判定することが可能な多変
数時系列データ類似度判定装置を提供することを目的と
している。
【0007】
【課題を解決するための手段】上記課題を解決するため
の手段として、請求項1記載の発明は、多変数の時系列
データで構成される第1及び第2のデータセットを入力
し、これらデータセットをその特徴を表す第1及び第2
の特徴量ベクトルに変換する特徴量変換部と、前記特徴
量変換部により変換された第1及び第2の特徴量ベクト
ルの相互間の比較に基づき、前記第1及び第2のデータ
セット間の類似性を表す類似度を演算する類似度演算部
と、を備えたことを特徴とする。
【0008】上記構成によれば、2種類の多変数時系列
データセットが類似しているか否かを定量的に判断する
ことができる。
【0009】請求項2記載の発明は、請求項1記載の発
明において、前記特徴量ベクトルとして、前記データセ
ットの各変数毎の平均値により構成される平均値ベクト
ルを用いたこと、を特徴とする。
【0010】上記構成によれば、データセットに含まれ
る各変数毎の平均値に基づき2種類の多変数時系列デー
タセットが類似しているか否かを定量的に判断すること
ができる。
【0011】請求項3記載の発明は、請求項1記載の発
明において、前記特徴量ベクトルとして、前記データセ
ットの各変数毎の分散により構成される分散ベクトルを
用いたこと、を特徴とする。
【0012】上記構成によれば、データセットに含まれ
る各変数毎の分散に基づき2種類の多変数時系列データ
セットが類似しているか否かを定量的に判断することが
できる。
【0013】請求項4記載の発明は、請求項1記載の発
明において、前記特徴量ベクトルとして、前記データセ
ットに対する主成分分析により求めた主成分ローディン
グベクトルを用いたこと、を特徴とする。
【0014】上記構成によれば、主成分ローディングベ
クトルに基づき2種類の多変数時系列データセットに相
関関係がありこれらが類似しているか否かを定量的に判
断することができる。
【0015】請求項5記載の発明は、請求項1記載の発
明において、前記特徴量ベクトルとして、前記データセ
ットの各変数毎の平均値により構成される平均値ベクト
ル、前記データセットの各変数毎の分散により構成され
る分散ベクトル、前記データセットに対する主成分分析
により求めた主成分ローディングベクトルのうちの少な
くとも2種類以上のベクトルを用いたこと、を特徴とす
る。
【0016】上記構成によれば、複数の側面からデータ
セット間の類似度を評価することができ、単一の特徴量
で判断するよりも高精度な類似度の評価を行うことがで
きる。
【0017】請求項6記載の発明は、請求項1乃至5の
いずれかに記載の発明において、前記データセットを構
成している多変数時系列データを格納する時系列データ
ベースと、前記特徴量変換部が多変数時系列データを前
記時系列データベースから取り出し、この多変数時系列
データベースで構成される前記データセットについて変
換した前記特徴量ベクトルを格納する特徴量データベー
スと、前記類似度演算部が前記特徴量データベースから
前記特徴量ベクトルを取り出して前記類似度の演算を行
う場合に、その演算を行うデータについて指示する類似
データ検索指示部と、を備えたことを特徴とする。
【0018】上記構成によれば、現在発生中のデータと
過去のデータとの間の類似度の評価、あるいは過去に発
生した種々のデータ同士の類似度を評価することができ
る。そして、これらの評価をオフラインバッチ処理やバ
ックグラウンド処理により行うことができる。
【0019】請求項7記載の発明は、請求項6記載の発
明において、外部からのオンラインにより前記多変数の
時系列データを収集し、これを前記時系列データベース
に出力する時系列データ収集部と、前記類似度演算部の
演算結果が複数である場合に、所定レベル以上に類似性
の高いデータを選択する類似データ選択部と、を備え、
更に、前記類似データ検索指示部に代えて、前記特徴量
変換部に対してその変換動作の実行周期及び実行タイミ
ングを指示する検索実行指示部と、を備えたことを特徴
とする。
【0020】上記構成によれば、現在発生中のデータと
類似した過去のデータをデータベースから検索すること
ができるようになり、現在の状況がどのような状況であ
り、将来どのような状況になるのかを、過去のデータの
挙動から推測することができる。
【0021】請求項8記載の発明は、請求項6又は7記
載の発明において、前記特徴量データベースに格納され
る特徴量ベクトルに対して、そのデータの重要度につい
ての情報を付加する検索重要度指示部を、備えたことを
特徴とする。
【0022】上記構成によれば、重要度の高いデータに
ついてのみ類似度を演算することができ、不要な演算の
実行を回避することができるので検索時間を短縮するこ
とができる。
【0023】請求項9記載の発明は、請求項6乃至8の
いずれかに記載の発明において、実際に発生し得ると考
えられる種々のパターンの多変数時系列データを発生さ
せ、これを前記時系列データベース又は時系列データ収
集部に対して出力するシミュレータを、を備えたことを
特徴とする。
【0024】上記構成によれば、これまで実際に発生し
たことがない現象についても、その多変数時系列データ
をシミュレータにより生成することができ、より多様な
データに対する解析が可能となる。
【0025】請求項10記載の発明は、請求項1乃至9
のいずれかに記載の発明において、前記類似度演算部の
演算結果をトレンドグラフ表示することが可能な結果表
示部を、備えたことを特徴とする。
【0026】上記構成によれば、2種類のデータセット
の類似性を視覚的に容易に把握することができる。
【0027】請求項11記載の発明は、請求項10記載
の発明において、前記結果表示部は、前記多変数時系列
データの各時刻に発生したアラームイベント又は操作内
容についての情報を表示するものである、ことを特徴と
する。
【0028】上記構成によれば、異常事態が発生した場
合に過去にどのようなアラームが発生し、どのような操
作を行ったかを知ることができるので、今後同様の異常
事態が発生した場合にどのように対処すればよいかを知
ることができる。
【0029】
【発明の実施の形態】図1は本発明の第1の実施形態の
構成を示すブロック図である。特徴量変換部1Aはデー
タセットA(第1のデータセット)を入力して、これを
第1の特徴量ベクトルに変換し、特徴量変換部1Bはデ
ータセットB(第2のデータセット)を入力して、これ
を第2の特徴量ベクトルに変換するようになっている。
類似度演算部2は、これら変換された第1及び第2の特
徴量ベクトルの相互間の比較を行い、データセットAと
データセットBとの類似性を表す類似度を演算するよう
になっている。そして、結果表示部3は、この演算結果
を表示するようになっている。
【0030】この実施形態では、データセットAは下式
(1)に示すように、xa1,xa2,xa3の3つの変数の
データにより構成され、同様に、データセットBも下式
(2)に示すように、xb1,xb2,xb3の3つの変数の
データにより構成されるようになっている。xa1,xb1
は、例えば、プラント設備における所定個所の温度デー
タを示し、xa2,xb2は流量データを示し、xa3,xb3
は圧力データを示している。そして、かっこ内の数字は
サンプル番号を示している。したがって、例えば、xa1
(N)及びxb1(N)は、第N番目のサンプルの温度デー
タを表している。なお、(1),(2)式の例では、説
明をわかりやすくするためにデータセットA,Bのサン
プル数が共に同じNの場合を示しているが、これは必ず
しも必要な条件ではなく、それぞれのサンプル数が異な
るものであってもよい。但し、当然のことながら、それ
ぞれのデータセットの各変数の種類は同じものでなけれ
ばならない。
【0031】
【数1】 特徴量変換部1A,1Bは、上記の膨大なデータ量のデ
ータセットA,Bを、よりデータ量の少ない第1及び第
2の特徴量ベクトルへ変換する。この特徴量ベクトル
は、基本的には各変数の時間的変化の特徴を表すベクト
ル量であればよく、例えば、下式(3),(4)で示す
ような平均値ベクトル、あるいは下式(5),(6)で
示すような分散ベクトルが用いられる。なお、分散につ
いては、下式(5),(6)において、NをN−1で置
き換えた式も統計学では広く使われているが、本発明に
おいてはいずれの式を用いても差し支えない。
【0032】
【数2】 上記の平均値ベクトルは、データセットに含まれる各変
数がどのような値を中心にして変動しているかを表すも
のである。例えば、発電プラントでは、発電量により流
量や圧力が大きく変化する。それ故、流量や圧力等の平
均値が類似するものである場合は、プラントの発電量が
同じであり、プラント状態が類似している状態であると
判断することができる。
【0033】分散ベクトルは、データセットに含まれる
各変数のばらつきの度合いを表すものでり、標準偏差の
2乗の値である。つまり、各変数が平均値を中心として
どの程度の幅の中で変化しているかを表している。した
がって、データが同程度の振幅で変化している場合は、
これらのデータは互いに類似していると判断することが
できる。なお、特徴量ベクトルとして、分散でなく標準
偏差を使用しても同様の判断が可能である。
【0034】上記のように、多変数時系列データの変化
を表す特徴量として平均値ベクトル又は分散ベクトルを
用いることができるが、平均値ベクトルや分散ベクトル
は四則演算のみで簡単に求めることができるものであ
り、また、データ量がもとのデータセットの1/Nと非
常に小さくなっていることから、非常に高速に計算でき
るようになる。
【0035】更に、特徴量ベクトルとしては、上記の平
均値ベクトルや分散ベクトル以外に主成分分析の結果を
用いることもできる。主成分分析とは、複数の変数間の
相関に基づき相関の強い方向に新しい変数軸を設定し、
この新しい変数軸でのデータの振る舞いを解析する統計
解析手法の一つである。上述したデータセットA及びデ
ータセットBに対して主成分分析を行うと、「主成分ロ
ーディング行列」、「主成分スコア行列」、及び「主成
分」の3種類のデータを得ることができる。
【0036】主成分ローディング行列は、データセット
に対して新しい座標軸を与えるものであり、上記のデー
タセットの例では3変数であるため、そのサイズは3×
3行列となる。主成分スコア行列は、主成分ローディン
グ行列で与えられる新しい座標軸上に各変数値をプロッ
トしたときの新しい座標位置を示すものであり、そのサ
イズはN×3となる。また、主成分は、元々の変数が持
つ情報量を新しい変数軸において、どの程度保持してい
るのかを示すものであり、そのサイズは3である。そし
て、本発明の実施形態で用いる特徴量ベクトルの用い方
としては、主成分ローディング行列のみを使用する場
合、主成分ローディング行列及び主成分を組み合わせて
使用する場合の2通りが考えられる。主成分スコア行列
は、データセットに対して主成分分析を行えば必然的に
導き出されるものであり、本発明の実施形態では用いな
いことになる。
【0037】主成分ローディング行列の第1列は3変数
データの相関が最も強い方向を表しており、第2列の要
素は第1列と直交し且つ次に相関が強い方向を表してお
り、第3列は第1列及び第2列と直行する方向を表して
いる。いま、対象とする2つの変数間に相関がある場
合、そのデータセット間同士における相関の様子は類似
したものとなる。したがって、相関関係が同じであれ
ば、主成分ローディング行列が示す方向も同じものとな
る。それ故、この主成分ローディング行列が多変数時系
列データの特徴量として使用できることになる。
【0038】主成分ローディング行列は、「変数の数」
×「変数の数」のサイズを持つためにデータ量について
は平均値や分散よりも多くなるものの、データセットよ
りは充分に小さなものとなる。また、データの類似性を
判断する場合、相関の大きな部分の類似性を重要視する
べきである。したがって、全ての主成分ローディング行
列を使用する必要はなく、相関が強い方から数個を選択
すれば足りることが多い。この場合、主成分ローディン
グ行列の各列がどの程度の情報量を持つのかは上記の
「主成分」の値から判断することができる(主成分の値
が大きければそれだけ多くの情報を持っている)。そこ
で、下式(7)の演算を行い、この演算値が90%以上
となる程度の列までを使用すれば充分である。
【0039】 (「主成分の値が大きいものから数個の主成分の和」/「主成分の総和」) ×100 … (7) このように、主成分ローディング行列のみを特徴量ベク
トルとして用いてもデータ量を低減することができる
が、主成分ローディング行列及び主成分の双方を用いる
ことにより一層データ量を低減することができる。そし
て、特徴量ベクトルのサイズはデータの長さには無関係
であり、変数の数にのみ依存するという性質を持ってい
る。このような特徴量ベクトルを使用することで、デー
タの長さが異なるデータセット間の類似度をも判断する
ことが可能になる。
【0040】データセットA,Bが互いに類似している
か否かは、時系列データの時間的変化の特徴を保存して
いる上記の特徴量ベクトルがどの程度類似しているのか
を調べることにより間接的に求めることができる。そこ
で、類似度演算部2が2つのデータセットA,Bの各特
徴量ベクトル間の類似度を演算することとしている。こ
こで、特徴量ベクトル間の類似度を演算する手法として
は、ベクトルの同値性を定量的に求めることができるも
のであればどのような手法であってもよい。例えば、2
つのベクトルの個々の要素の差分を求め、その差の和、
差の絶対値和、差の二乗和、あるいはベクトルの示す方
向などに基づき類似度を演算することができる。この実
施形態では、一例として、以下に述べるようなベクトル
の示す方向に基づき類似度を演算する手法につき説明す
る。
【0041】いま、もしデータセットが全く同一のもの
であれば、それぞれのベクトルの示す方向は同じであ
り、各特徴量ベクトル間のなす角度は0となる。逆に、
2つのデータセットに含まれるデータの変化が全く反対
であれば、それぞれのベクトルの示す方向は正反対とな
り、各特徴量ベクトル間のなす角度は180度となる。
そこで、特徴量ベクトルのなす角度を求め、その角度が
ある程度0に近ければ2つのデータセットは互いに類似
しているものであると判断することができる。
【0042】2つのベクトル間の角度は次のようにして
求めることができる。例えば、2つの特徴量ベクトルを
x,yとし、これらx,yが下式(8),(9)で与え
られているものとする。なお、これらの特徴量ベクトル
は、その大きさが1となるように正規化されているもの
とする。また、式中のnはデータセットに含まれる変数
の数を示している。このとき、特徴量ベクトルx,yの
なす角度はarccos(逆余弦関数)を用いた下式(10)
により求めることができる。
【0043】
【数3】 既述したように、データセットから特徴量ベクトルを求
める方法は複数存在するので、単一の方法で求めた特徴
量ベクトルで類似度を演算するだけでなく、複数の方法
で求めた特徴量ベクトルを用いることができる。この場
合、それぞれの方法で求めた特徴量ベクトルから類似度
を示す角度を計算し、その角度全てが0に近いか否かを
判断する。例えば、データが同程度の値を中心に変化し
ているが、その変化の大きさが異なるような場合、平均
値としてみると同程度になるが、分散は大きく異なった
ものとなる。したがって、この場合、平均値ベクトルに
基づき求めた類似度は0に近くなるが、分散ベクトルに
基づき求めた類似度は0に近いものではないために、2
つのデータセットは類似していないと判断することがで
きる。このように、複数の方法で求めた特徴量ベクトル
から類似度を求め、それぞれの類似度を評価することに
より2つのデータセットの波形が類似しているかどうか
についての判断精度を向上させることが可能となる。な
お、特徴量ベクトルの組み合わせについてはプラント条
件等に応じて自由に設定することができる。上記の特徴
量ベクトルの例で言えば、平均値ベクトル、分散ベクト
ル、主成分ローディングベクトルのうちの少なくとも2
種類以上のベクトルを用いることが可能である。
【0044】従来手法では、応答波形を直接比較して差
分を求めたりしており、同じ応答がデータセットに含ま
れているか否かを評価するのに応答波形を少しずつずら
しながら差分を計算し、その最小値で評価するしかなか
ったために、類似度の評価に多くの演算時間を必要とし
ていた。しかし、本発明で用いる特徴量ベクトルは、デ
ータセットに含まれる応答の特徴を代表値として表して
いるものであり、時間に依存しない量である。したがっ
て、データセットに含まれる特徴的な応答が2つのデー
タセットで同じ時間帯に発生したのと同じ条件になるよ
うにデータを調整する作業を行う必要はなく、1回の計
算で類似度を求めることが可能である。したがって、非
常に短い計算時間で類似度を求めることが可能になる。
このように、多変数からなる時系列データのデータセッ
トを特徴量ベクトルに変換することで、2つのデータセ
ット間の類似度を簡単に求めることができる。
【0045】上記のように求められた類似度は、結果表
示部3において、数値やグラフ、あるいは関連する情報
と共に表示される。例えば、産業プラント等では、プラ
ントの各変数がある決められた範囲内になるように制御
しなくてはならない。そのため、運転オペレータは、常
時、それぞれのデータがどのような値であるのか、どの
ように変化しているのかを監視し、決められた範囲から
逸脱したり、外れそうになった場合は適切な操作を行う
必要がある。オペレータは、従来からこのような監視業
務を、図6に示すようなデータトレンドグラフを見て行
っていた。一般に、オペレータが監視しなくてはならな
いデータは数十から数百にもおよび、これら全てのデー
タを一度に見ることは不可能であるため、オペレータは
表示画面を切り換えながら複数のグラフの監視を行って
いる。しかし、図1の構成の装置によれば、このような
監視業務において、プラントが正常に運転されていると
きのデータセットと、現時刻付近のデータセットとの類
似度を類似度演算部2が演算し、この演算した類似度を
結果表示部3が表示するするようになっているので、オ
ペレータは類似度がある決められた値から外れていない
かどうかを監視することでプラントの状態を判断するこ
とができる。
【0046】図7は、結果表示部3により表示される監
視画面例を示す説明図である。この図7に示した類似度
の表示において、例えば、充分類似しているときには数
値を青色で、若干類似性が崩れてきたときには黄色で、
類似性が認められず調査が必要となったときには赤色で
表示するなどして、状況に応じて表示色を変化させるこ
とにより、オペレータがプラント状態の変化を看過しな
いようにすることもできる。なお、オペレータは、「ト
レンド表示」のボタンをクリックすることにより、いつ
でも図6の画面を表示させることができる。
【0047】このように、類似度演算部2が演算した類
似度を結果表示部3に表示させて監視業務を行う場合
に、複数データをまとめた一つの類似度データに基づく
監視が可能となり、オペレータは従来の数分の一から数
十分の一の量のデータを監視すればよいことになる。し
たがって、オペレータは、監視しなければならない全て
の類似度を1つの画面で見ることができ、画面の切換が
不要となるので、監視負荷を軽減することができる。そ
の結果、一人のオペレータがこれまでよりも多くの変数
を監視することができるようになり、オペレータの人数
を減らすことも可能となる。
【0048】また、図6に示した通常のトレンドデータ
の代わりに、図8に示したような横軸を時間とし縦軸を
類似度とした類似度トレンドグラフ型式で類似度を表示
することにより監視業務を行うこともできる。このよう
なトレンドグラフ表現を行うことにより、急激な変化だ
けでなく、徐々に類似度が変化していくような緩やかな
変化についても視覚的に捉えることが可能となる。そし
て、オペレータは、類似度監視中に類似度に変化が発生
した場合に、「トレンド表示」ボタンをクリックするこ
とで、現在のトレンドデータを呼び出して、どのような
問題が発生したのかを調査し、対処することができる。
このとき、正常運転時の典型的なデータを同時に表示
し、現在データをこの典型的なデータと比較することに
より、問題となっている異常発生個所を素早く発見する
ことが可能となる。
【0049】ところで、プラントの運転は多くのオペレ
ータが交代で行っているが、操作の技量には個人差があ
り、この操作技量を定量的に評価することは非常に困難
である。しかし、優秀なオペレータが操作を行ったとき
のプラントデータ変化と、他のオペレータが操作を行っ
たときのプラントデータ変化との類似度を評価すること
により、他のオペレータの操作技量を評価することが可
能となる。この結果、各オペレータの操作技量を定量的
に評価することができ、未熟と判断されたオペレータに
対しては教育を施す等の対策を取ることにより、オペレ
ータの操作技量の向上を図り、操作ミスを起こさないよ
うにすることができる。この場合、新人オペレータなど
が実プラント操作前の訓練で用いられる運転訓練シミュ
レータを用いることにより、優秀なオペレータと比較し
た各人の操作技量レベルを数値で表示することが可能と
なり、訓練レベルを判断する目安とすることができる。
このように、図1に示した構成の装置によれば、2つの
データセットの類似度を演算することで、監視業務の効
率化と共に、操作技量レベルの定量化を図ることができ
る。
【0050】図2は、本発明の第2の実施形態の構成を
示すブロック図である。この図2の構成は、図1の構成
に時系列データベース4、特徴量データベース5、及び
類似データ検索指示部6を追設し、更に、2つの特徴量
変換部1A,1Bの代わりに1つの特徴量変換部1を用
いている点である。
【0051】最近では、時系列データの収集だけでな
く、収集したデータを保管しておくデータベースも完備
されてきている。このように保管されているデータの中
から現状のデータと類似したデータを見つけることがで
きれば、現在の状況がどのような状況にあるかを過去の
データ及びそのデータに関連した情報から知ることがで
きる。また、過去の類似データがその後どのような変化
をしたかについて観察することで、現在のプラント状態
が今後どのように変化していくかを予測することが可能
になる。しかし、保管されているデータは膨大な量であ
り、類似データを人間が目視により発見することは非常
に多くの時間を要し、現実的ではない。また、応答デー
タを直接比較した場合も同じように多くの時間が必要で
ある。
【0052】そこで、この第2の実施形態では、まず、
特徴量変換部1が、オフラインのバッチ処理やバックグ
ラウンド処理により予め時系列データベース4に保管さ
れているデータを特徴量ベクトルに変換し、これを特徴
量データベース5に保管するようになっている。そし
て、オペレータが、時系列データベース4に含まれてい
る特定のデータを類似データ検索指示部6を介して類似
度演算部2に対して指定した場合、類似度演算部2は、
特徴量データベース5に含まれる特徴量ベクトルの組み
合わせの数だけ類似度を演算し、予め設定してある値よ
りも小さなものだけを結果表示部3に表示させるように
している。
【0053】図9は、図2における結果表示部3により
表示される類似データ検索結果の表示例を示す説明図で
ある。この図に示すように、表示画面には類似度及びそ
のデータ収集時刻が表示されるようになっている。ま
た、オペレータは、「関連情報」のボタンをクリックす
ることにより、そのデータが収集されたときに発生した
イベントを関連情報として表示することができるように
なっている。
【0054】図10は、この関連情報の表示例を示す説
明図である。この図に示すように、表示画面には、アラ
ームの発生状況やそのときの操作内容が表示されるよう
になっている。また、その他に、その操作を行ったオペ
レータの名前や日報及び週報など必要なものを表示させ
ることができる。また、対象データが金融証券分野にお
ける株価や為替データである場合は、データが収集され
た頃の経済関係の報道ニュース等を関連情報として表示
する構成とすることもできる。
【0055】上記のように、第2の実施形態によれば、
データベースに蓄えられているデータ間の類似性を評価
することができ、過去に同じような現象がどの程度発生
しているのか、あるいはそのような現象が発生したとき
にはどのようなイベントが発生していたかについて容易
に調査・解析等を行うことができる。
【0056】図3は、本発明の第3の実施形態の構成を
示すブロック図である。この図3の構成は、特徴量変換
部1、類似度演算部2、結果表示部3の他に、外部オン
ラインから収集した多変数時系列データを時系列データ
ベース4に対して出力する時系列データ収集部7と、類
似度演算部2からの演算結果を入力し、予め設定してあ
るレベル以上の類似データのみを結果表示部3に表示さ
せるようにする類似データ選択部8と、特徴量変換部1
に対して変換動作の実行周期及び実行タイミングを指示
する検索実行指示部9と、を備えたものである。
【0057】特徴量変換部1は、時系列データ収集部7
が収集した多変数時系列データを検索実行指示部9が指
示した周期又はタイミングにより取り出して、これを既
述した特徴量ベクトルに変換し、更にこの変換した特徴
量ベクトルを特徴量データベース5に格納する。
【0058】類似度演算部2は、特徴量変換部1から収
集されたばかりの現在データに係る特徴量ベクトルを入
力すると共に、特徴量データベース5から過去データに
係る特徴量ベクトルを入力し、両者の類似度を演算す
る。類似度演算部2は、現在データの特徴量ベクトルと
いくつかの過去データの特徴量ベクトルとの間の類似度
を演算するが、類似データ選択部8は所定の閾値よりも
小さな類似度のみを選択し、これに対応する過去の類似
データと現在データとを結果表示部3の画面に表示させ
るようにする。なお、図3では類似度演算部2が類似度
を演算する入力データが、特徴量変換部1から直接送ら
れてくる現在データの特徴量ベクトルと、特徴量データ
ベース5からの過去データの特徴量ベクトルとである場
合を図示したものとなっているが、類似度を演算する入
力データが双方共に特徴量データベース5からの過去デ
ータである場合も当然あり得ることになる。
【0059】図11は、図3における結果表示部3の表
示例を示す説明図である。この図に示すように、現在デ
ータのトレンドグラフと、類似データすなわち過去デー
タのトレンドグラフ及びその類似度とが表示画面に表示
されるようになっている。図11の表示例は、特徴量ベ
クトルを求めたデータセットに対応するトレンドのみを
表示したものであるが、図12に示したように、それ以
降の一定期間のトレンドグラフを表示させるようにする
こともできる。これによれば、過去のトレンドグラフの
変化を参考にすることにより、現在データが今後どのよ
うに変化していくのかを予測することができる。したが
って、例えば、株価の予測を行う場合に、現在と同様の
動きをした過去データを検索し、その過去データの動き
を見ることにより、今後その株価がどのように上昇しあ
るいはどのように下降するのかを予測することができ
る。
【0060】このように、第3の実施形態によれば、例
えば、産業プラントなどで何らかの異常が発生した場合
に、過去データの中から類似データを検索することで、
過去の同様な異常が発生したときに行った対応操作を参
考にして、現在発生している異常から迅速に復帰するこ
とができる。また、その場合に、日報等を参考に異常原
因をいち早く発見することができる。
【0061】図4は、本発明の第4の実施形態の構成を
示すブロック図である。この図4の構成は、図3におけ
る類似データ選択部8を削除すると共に、特徴量データ
ベース5に格納される特徴量ベクトルに対して、そのデ
ータの重要度についての情報を付加する検索重要度指示
部10を設けたものである。
【0062】すなわち、特徴量ベクトルは、時系列デー
タに比べると、そのデータ量は小さいものであるが、あ
る程度の期間が経過して収集されるデータが膨大になっ
た場合、特徴量データベース5に蓄えられるデータ量も
大きくなって類似データの検索にかなりの時間を要する
ことが予想される。そこで、この第4の実施形態では、
検索重要度指示部10により特徴量データベース5に格
納されているデータに対して予め重要度についての情報
を付加しておき、重要度の低いデータについては類似度
演算部2の演算対象とせず、重要度の高いデータのみを
類似度演算部2の演算対象とする構成としている。
【0063】例えば、データが大きく変動した時には何
らかの変化が発生していることが推測され、オペレータ
に対して注意を喚起しておく必要があるが、図4の構成
によればこのような時のデータについては必ず類似度の
演算の対象となるために、オペレータがこのようにデー
タが大きく変動したときのデータを看過することが防止
される。なお、上記の実施形態では、検索重要度指示部
10はデータの重要度についての情報を付加することと
して説明したが、データが重要であること、あるいは逆
に、データが重要でないことを示す簡単なマーキング行
うようにしてもよい。したがって、類似度演算部2は、
重要であることを示すマークが付されているデータのみ
を特徴量データベース5から取り出して類似度の演算を
行うことができ、あるいは逆に、重要でないことを示す
データを除外し、マークが付されていないデータのみを
特徴量データベース5から取り出して類似度の演算を行
うことができる。これにより、演算処理時間を一層短縮
することが可能になる。
【0064】図5は、図2乃至図4における時系列デー
タベース4の内容を充実させるための構成を示すブロッ
ク図である。図2乃至図4の装置を用いて現在データと
類似する過去データを検索しようとする場合、時系列デ
ータベース4に保存されているデータがあまり多くない
場合には、現在データと類似する過去データが見つから
ないことになる。また、時系列データベース4に充分に
多くのデータが保存されていたとしても、現在データの
内容が極めて稀にしか発生しない現象のデータである場
合には、やはりこの現在データと類似する過去データは
見つからないことになってしまう。
【0065】そこで、図5に示すように、理論上考えら
れる種々の条件の下でのデータをシミュレータ11によ
り発生させ、この発生させたデータを時系列データ収集
部7を介して時系列データベース4に保存させるように
している。これによれば、装置の稼働後あまり時間が経
過していないために時系列データベース4に蓄積されて
いる過去データが少ない場合、あるいは理論上は考えら
れるケースではあるがこれまでに発生したことがないよ
うなデータがある場合にも、上記のシミュレータ11を
用いて時系列データベース4の内容を充実させることが
できる。
【0066】上述した各実施形態によれば、多変数デー
タセットを原データセットより少ない情報からなる特徴
量に変換し、この特徴量を使用することで2種類のデー
タセット間の類似度を数値として表すことができる。こ
れにより、厖大な量のデータの中から類似したデータを
高速に検索することができる。また、この検索された類
似データから現在の状況を判断したり、類似データのそ
の後の変化から現在の状況が今後どのように変化するの
かを予測することができる。更に、典型的な状況のデー
タとの類似度合いを観察することで、現在の状況が典型
的な状況に近いのか、それとも、典型的な状況から離れ
つつある状態なのかを判断することができる。そして、
オペレータは、多数のデータの変化を総合的に判断する
必要はなくなり、1つの類似を観察すればよいので、オ
ペレータのデータ監視負荷が軽減されることになる。そ
の結果、一人のオペレータで監視可能なデータ数を増加
させることができ、監視に必要な人員を減少させること
ができる。
【0067】
【発明の効果】以上のように、本発明によれば、特徴量
変換部がデータセットを特徴量ベクトルに変換し、類似
度演算部がこの特徴量ベクトルの類似度を演算する構成
としているので、膨大のデータ量を有する多変数時系列
データ同士の類似度を高精度且つ高速に判定することが
可能になる。
【図面の簡単な説明】
【図1】本発明の第1の実施形態の構成を示すブロック
図。
【図2】本発明の第2の実施形態の構成を示すブロック
図。
【図3】本発明の第3の実施形態の構成を示すブロック
図。
【図4】本発明の第4の実施形態の構成を示すブロック
図。
【図5】図2乃至図4における時系列データベース4の
内容を充実させるための構成を示すブロック図。
【図6】図1における結果表示部3が表示する従来と同
様の監視画面例を示す説明図。
【図7】図1における結果表示部3が表示する、類似度
を用いた監視画面例を示す説明図。
【図8】図1における結果表示部3が表示する、類似度
を用いた監視画面例を示す説明図。
【図9】図2における結果表示部3が表示する類似デー
タ検索結果の表示例を示す説明図。
【図10】図9の表示例に対応する関連情報の表示例を
示す説明図。
【図11】図3における結果表示部3が表示する類似デ
ータ検索結果の表示例を示す説明図。
【図12】図3における結果表示部3が表示する類似デ
ータ検索結果の表示例を示す説明図。
【符号の説明】
1,1A,1B 特徴量変換部 2 類似度演算部 3 結果表示部 4 時系列データベース 5 特徴量データベース 6 類似データ検索指示部 7 時系列データ収集部 8 類似データ選択部 9 検索実行指示部 10 検索重要度指示部 11 シミュレータ
───────────────────────────────────────────────────── フロントページの続き (72)発明者 篠 原 和太郎 東京都府中市東芝町1番地 株式会社東芝 府中事業所内 Fターム(参考) 5B075 ND02 NK06 PQ02 PQ14 PR03 QM05

Claims (11)

    【特許請求の範囲】
  1. 【請求項1】多変数の時系列データで構成される第1及
    び第2のデータセットを入力し、これらデータセットを
    その特徴を表す第1及び第2の特徴量ベクトルに変換す
    る特徴量変換部と、 前記特徴量変換部により変換された第1及び第2の特徴
    量ベクトルの相互間の比較に基づき、前記第1及び第2
    のデータセット間の類似性を表す類似度を演算する類似
    度演算部と、 を備えたことを特徴とする多変数時系列データ類似度判
    定装置。
  2. 【請求項2】前記特徴量ベクトルとして、前記データセ
    ットの各変数毎の平均値により構成される平均値ベクト
    ルを用いたこと、 を特徴とする請求項1記載の多変数時系列データ類似度
    判定装置。
  3. 【請求項3】前記特徴量ベクトルとして、前記データセ
    ットの各変数毎の分散により構成される分散ベクトルを
    用いたこと、 を特徴とする請求項1記載の多変数時系列データ類似度
    判定装置。
  4. 【請求項4】前記特徴量ベクトルとして、前記データセ
    ットに対する主成分分析により求めた主成分ローディン
    グベクトルを用いたこと、 を特徴とする請求項1記載の多変数時系列データ類似度
    判定装置。
  5. 【請求項5】前記特徴量ベクトルとして、前記データセ
    ットの各変数毎の平均値により構成される平均値ベクト
    ル、前記データセットの各変数毎の分散により構成され
    る分散ベクトル、前記データセットに対する主成分分析
    により求めた主成分ローディングベクトルのうちの少な
    くとも2種類以上のベクトルを用いたこと、 を特徴とする請求項1記載の多変数時系列データ類似度
    判定装置。
  6. 【請求項6】前記データセットを構成している多変数時
    系列データを格納する時系列データベースと、 前記特徴量変換部が多変数時系列データを前記時系列デ
    ータベースから取り出し、この多変数時系列データベー
    スで構成される前記データセットについて変換した前記
    特徴量ベクトルを格納する特徴量データベースと、 前記類似度演算部が前記特徴量データベースから前記特
    徴量ベクトルを取り出して前記類似度の演算を行う場合
    に、その演算を行うデータについて指示する類似データ
    検索指示部と、 を備えたことを特徴とする請求項1乃至5のいずれかに
    記載の多変数時系列データ類似度判定装置。
  7. 【請求項7】外部からのオンラインにより前記多変数の
    時系列データを収集し、これを前記時系列データベース
    に出力する時系列データ収集部と、 前記類似度演算部の演算結果が複数である場合に、所定
    レベル以上に類似性の高いデータを選択する類似データ
    選択部と、 を備え、更に、 前記類似データ検索指示部に代えて、前記特徴量変換部
    に対してその変換動作の実行周期及び実行タイミングを
    指示する検索実行指示部と、 を備えたことを特徴とする請求項6記載の多変数時系列
    データ類似度判定装置。
  8. 【請求項8】前記特徴量データベースに格納される特徴
    量ベクトルに対して、そのデータの重要度についての情
    報を付加する検索重要度指示部を、 備えたことを特徴とする請求項6又は7記載の多変数時
    系列データ類似度判定装置。
  9. 【請求項9】実際に発生し得ると考えられる種々のパタ
    ーンの多変数時系列データを発生させ、これを前記時系
    列データベース又は時系列データ収集部に対して出力す
    るシミュレータを、 を備えたことを特徴とする請求項6乃至8のいずれかに
    記載の多変数時系列データ類似度判定装置。
  10. 【請求項10】前記類似度演算部の演算結果をトレンド
    グラフ表示することが可能な結果表示部を、 備えたことを特徴とする請求項1乃至9のいずれかに記
    載の多変数時系列データ類似度判定装置。
  11. 【請求項11】前記結果表示部は、前記多変数時系列デ
    ータの各時刻に発生したアラームイベント又は操作内容
    についての情報を表示するものである、 ことを特徴とする請求項10記載の多変数時系列データ
    類似度判定装置。
JP2000196814A 2000-06-29 2000-06-29 多変数時系列データ類似度判定装置 Pending JP2002015000A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2000196814A JP2002015000A (ja) 2000-06-29 2000-06-29 多変数時系列データ類似度判定装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2000196814A JP2002015000A (ja) 2000-06-29 2000-06-29 多変数時系列データ類似度判定装置

Publications (1)

Publication Number Publication Date
JP2002015000A true JP2002015000A (ja) 2002-01-18

Family

ID=18695251

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2000196814A Pending JP2002015000A (ja) 2000-06-29 2000-06-29 多変数時系列データ類似度判定装置

Country Status (1)

Country Link
JP (1) JP2002015000A (ja)

Cited By (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005257416A (ja) * 2004-03-10 2005-09-22 Internatl Business Mach Corp <Ibm> 診断装置、検出装置、制御方法、検出方法、プログラム、及び記録媒体
JP2008097361A (ja) * 2006-10-12 2008-04-24 Matsushita Electric Works Ltd 異常監視装置
WO2009125627A1 (ja) * 2008-04-11 2009-10-15 三菱電機株式会社 機器状態検出装置及び機器状態検出方法並びに生活者異常検知装置、生活者異常検知システム及び生活者異常検知方法
JP2011248923A (ja) * 2007-06-21 2011-12-08 Mitsubishi Electric Corp 生活行動推定装置
WO2013190627A1 (ja) * 2012-06-18 2013-12-27 株式会社日立製作所 相関分析装置及びその方法
WO2015033869A1 (ja) * 2013-09-06 2015-03-12 インターナショナル・ビジネス・マシーンズ・コーポレーション 検出装置、検出方法、およびプログラム
JP2018018359A (ja) * 2016-07-29 2018-02-01 公益財団法人鉄道総合技術研究所 プログラム、及び類否判定装置
WO2018079975A1 (ko) * 2016-10-31 2018-05-03 한국 한의학 연구원 데이터 유사도 평가 시스템
JP2020154950A (ja) * 2019-03-22 2020-09-24 株式会社 みずほ銀行 市場予兆管理システム、市場予兆管理方法及び市場予兆管理プログラム
WO2022107975A1 (ko) * 2020-11-23 2022-05-27 주식회사 리얼타임테크 시계열 데이터의 변화 추세를 고려한 유사도 분석 방법
KR20220147316A (ko) * 2021-04-27 2022-11-03 한국과학기술원 비접촉식 생체 정보 모니터링 내 사용자 행동 패턴을 기반으로 한 데이터 샘플링 주기 조절 방법 및 장치

Cited By (20)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005257416A (ja) * 2004-03-10 2005-09-22 Internatl Business Mach Corp <Ibm> 診断装置、検出装置、制御方法、検出方法、プログラム、及び記録媒体
US7720640B2 (en) 2004-03-10 2010-05-18 International Business Machines Corporation Diagnostic data detection and control
JP2008097361A (ja) * 2006-10-12 2008-04-24 Matsushita Electric Works Ltd 異常監視装置
JP2011248923A (ja) * 2007-06-21 2011-12-08 Mitsubishi Electric Corp 生活行動推定装置
WO2009125627A1 (ja) * 2008-04-11 2009-10-15 三菱電機株式会社 機器状態検出装置及び機器状態検出方法並びに生活者異常検知装置、生活者異常検知システム及び生活者異常検知方法
WO2009125659A1 (ja) * 2008-04-11 2009-10-15 三菱電機株式会社 機器状態検出装置、機器状態検出方法、機器状態検出サーバー及び機器状態検出システム、並びに生活者異常検知装置、生活者異常検知システム及び生活者異常検知方法、並びに機器状態データベース保守サーバー
JPWO2009125659A1 (ja) * 2008-04-11 2011-08-04 三菱電機株式会社 機器状態検出装置、機器状態検出方法、機器状態検出サーバー及び機器状態検出システム、並びに生活者異常検知装置、生活者異常検知システム及び生活者異常検知方法、並びに機器状態データベース保守サーバー
JP5084906B2 (ja) * 2008-04-11 2012-11-28 三菱電機株式会社 機器状態検出装置
US8930146B2 (en) 2008-04-11 2015-01-06 Mitsubishi Electric Corporation Apparatus state detector, method for detecting apparatus state, apparatus state detection server and apparatus state detection system; living persons' anomaly detector, living persons' anomaly detection system and method for detecting living persons' anomaly, and apparatus-state database maintenance server
WO2013190627A1 (ja) * 2012-06-18 2013-12-27 株式会社日立製作所 相関分析装置及びその方法
WO2015033869A1 (ja) * 2013-09-06 2015-03-12 インターナショナル・ビジネス・マシーンズ・コーポレーション 検出装置、検出方法、およびプログラム
CN105518432A (zh) * 2013-09-06 2016-04-20 国际商业机器公司 检测设备、检测方法以及程序
JPWO2015033869A1 (ja) * 2013-09-06 2017-03-02 インターナショナル・ビジネス・マシーンズ・コーポレーションInternational Business Machines Corporation 検出装置、検出方法、およびプログラム
US10584986B2 (en) 2013-09-06 2020-03-10 International Business Machines Corporation Detecting device, detecting method, and program
JP2018018359A (ja) * 2016-07-29 2018-02-01 公益財団法人鉄道総合技術研究所 プログラム、及び類否判定装置
WO2018079975A1 (ko) * 2016-10-31 2018-05-03 한국 한의학 연구원 데이터 유사도 평가 시스템
JP2020154950A (ja) * 2019-03-22 2020-09-24 株式会社 みずほ銀行 市場予兆管理システム、市場予兆管理方法及び市場予兆管理プログラム
WO2022107975A1 (ko) * 2020-11-23 2022-05-27 주식회사 리얼타임테크 시계열 데이터의 변화 추세를 고려한 유사도 분석 방법
KR20220147316A (ko) * 2021-04-27 2022-11-03 한국과학기술원 비접촉식 생체 정보 모니터링 내 사용자 행동 패턴을 기반으로 한 데이터 샘플링 주기 조절 방법 및 장치
KR102544798B1 (ko) 2021-04-27 2023-06-20 한국과학기술원 비접촉식 생체 정보 모니터링 내 사용자 행동 패턴을 기반으로 한 데이터 샘플링 주기 조절 방법 및 장치

Similar Documents

Publication Publication Date Title
Russell et al. Fault detection in industrial processes using canonical variate analysis and dynamic principal component analysis
CN103562810B (zh) 过程状态监视装置
JP3651693B2 (ja) プラント監視診断装置および方法
JP2000259223A (ja) プラント監視装置
Wikström et al. Multivariate process and quality monitoring applied to an electrolysis process: Part I. Process supervision with multivariate control charts
JP2002015000A (ja) 多変数時系列データ類似度判定装置
JP2007249997A (ja) 工業プロセスの監視方法及び監視システム
Zhu et al. Two-dimensional contribution map for fault identification [focus on education]
JP2014002579A (ja) プロセス監視システム及び方法
JP3980760B2 (ja) プラント監視装置
CN108036941A (zh) 一种基于相关性可视分析的汽轮机轴承振动异常分析方法
CN112859769B (zh) 一种智能生产设备中能耗监控装置及其运行方法
JP7203085B2 (ja) 異常監視装置、異常監視方法、プログラム、制御装置およびプラント
CN104317778A (zh) 基于海量监测数据的变电设备故障诊断方法
JP2017021282A (ja) 故障予兆シミュレーション装置、故障予兆シミュレーション方法、故障予兆シミュレーションシステム、及びプログラム
CN115640860A (zh) 一种工业云服务的机电设备远程维护方法及系统
JP2011209798A (ja) 運転状態解析システムおよび運転状態解析方法
CN113052475A (zh) 一种工程机械图标视觉绩效测试方法、装置及存储介质
CN116777114A (zh) 一种离散车间可视化生产管理方法
US11886831B2 (en) Data sorting device and method, and monitoring and diagnosis device
WO2007126026A1 (ja) 作業工程の中から改善すべき動作要素を自動抽出するシステム
JP2001075642A (ja) 多変量データ監視装置
JPH0552605A (ja) プロセス運用支援システム
JPH0217511A (ja) プラント監視装置
JP3176692B2 (ja) プロセス運用支援システム