JPH0934719A - データ分析装置 - Google Patents

データ分析装置

Info

Publication number
JPH0934719A
JPH0934719A JP18529895A JP18529895A JPH0934719A JP H0934719 A JPH0934719 A JP H0934719A JP 18529895 A JP18529895 A JP 18529895A JP 18529895 A JP18529895 A JP 18529895A JP H0934719 A JPH0934719 A JP H0934719A
Authority
JP
Japan
Prior art keywords
data
time
rule
case
series data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP18529895A
Other languages
English (en)
Other versions
JP3489279B2 (ja
Inventor
Yoshinori Sato
嘉則 佐藤
Akira Maeda
章 前田
Hideyuki Maki
牧  秀行
Katsumi Omori
勝美 大森
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Ltd
Original Assignee
Hitachi Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Ltd filed Critical Hitachi Ltd
Priority to JP18529895A priority Critical patent/JP3489279B2/ja
Priority to US08/684,392 priority patent/US5802254A/en
Publication of JPH0934719A publication Critical patent/JPH0934719A/ja
Application granted granted Critical
Publication of JP3489279B2 publication Critical patent/JP3489279B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N5/00Computing arrangements using knowledge-based models
    • G06N5/02Knowledge representation; Symbolic representation
    • G06N5/022Knowledge engineering; Knowledge acquisition
    • G06N5/025Extracting rules from data
    • GPHYSICS
    • G05CONTROLLING; REGULATING
    • G05BCONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
    • G05B23/00Testing or monitoring of control systems or parts thereof
    • G05B23/02Electric testing or monitoring
    • G05B23/0205Electric testing or monitoring by means of a monitoring system capable of detecting and responding to faults
    • G05B23/0218Electric testing or monitoring by means of a monitoring system capable of detecting and responding to faults characterised by the fault detection method dealing with either existing or incipient faults
    • G05B23/0224Process history based detection method, e.g. whereby history implies the availability of large amounts of data
    • G05B23/0227Qualitative history assessment, whereby the type of data acted upon, e.g. waveforms, images or patterns, is not relevant, e.g. rule based assessment; if-then decisions
    • G05B23/0229Qualitative history assessment, whereby the type of data acted upon, e.g. waveforms, images or patterns, is not relevant, e.g. rule based assessment; if-then decisions knowledge based, e.g. expert systems; genetic algorithms

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Computing Systems (AREA)
  • Computational Linguistics (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Computation (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Evolutionary Biology (AREA)
  • Automation & Control Theory (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

(57)【要約】 【課題】記号化した時系列データを事例単位で分析し、
データ構造を表すルールとしてデータ中に含まれる因果
関係を抽出する。 【解決手段】記号化データ管理装置100により時系列
データを記号と時刻のレコードとして保存し、事例作成
装置509、クラス分類装置510により分析の記述単
位を決定する。モデル抽出装置511はクラスに含まれ
るデータ構造を事例単位で抽出しルールとして出力す
る。また分析結果は、分析結果出力装置1100により
事例とルールの時間的関係、事例間の類似度として出力
される。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は工業プラント等の物理的
対象の計測データ、実験、自然現象等の計測データ等、
一般のデータ分析に関する。
【0002】
【従来の技術】時系列と呼ばれるデータには、工業、化
学プラント等の計測データ、気象観測等の自然観測によ
り得られるデータ、人口統計等の社会的現象の観測デー
タ、株価変動等の経済的現象の観測データ等がある。
【0003】これらの時系列データを分析する手法とし
ては、重回帰分析、相関分析、主成分分析などの多変量
解析の手法や、フーリエ変換よる周波数成分分析等の手
法が広く知られている。一方パターン認識の分野におい
ては、時系列のような1次元パターンについて、能率良
く整列化を行い、それに基づいてパターン間の類似度を
行う、DPマッチングと呼ばれる手法について「パター
ン認識と学習のアルゴリズム」(文一総合出版、1990)
に述べられている(これらを従来技術1と呼ぶ)。
【0004】また時系列データのパターン認識処理を容
易にする技術としては、時系列データの記号化と呼ばれ
る技術がある。これは時系列的な変化パターンに対し、
2次の特徴抽出フィルタを作用させ、時系列データの凸
凹を表す特徴量を抽出する。この特徴点で時系列データ
を分割することにより、元のデータの変化特徴を保存し
た折れ線ベクトルを得ることができる(以下従来技術2
と呼ぶ)。時系列データ記号化に関しては「日立評論」
1991年8月号,pp47-52にその応用例が紹介されてい
る。
【0005】また大量データから何らかの知識を取り出
す手法としては、相関分析、主成分分析、重回帰分析な
どの統計的手法があり、また最近はデータマイニングと
呼ばれる新しい技術が提案されている(以下従来技術1
と呼ぶ)。従来技術1は、大量の生データから隠れた情
報を自動的に見つけ出すもので、Christopher J.Matheu
s, et al.:Systems for Knowledge Discovery in Datab
ases,IEEE Trans,on Knowledge and Data Engineering,
Vol.5, No.6, December 1993, pp903-913 にその概要
が述べられている。
【0006】
【発明が解決しようとする課題】従来技術1では、時系
列データのある特徴に着目した単一の量を抽出したり、
この値に基づく定量的な分析は可能だが、非常に多くの
系列間の関係解析は難しい。また結果に対する原因をデ
ータそのもので記述する場合、全データ中の該当部分を
特定すると共に、特定したデータの構造解析が必要にな
るが、従来技術1はこのようなデータを構造的に解析す
る手段を直接は提供しない。また従来技術1の分析結果
解釈には専門的な知識が不可欠であるため、誰でも使え
るものではないという問題がある。
【0007】従来技術2は、時系列データの変化量を記
号として抽出する技術であり、記号間の関係把握、或は
複数系列間の関係解析についての手段を提供する技術で
はない。また抽出した記号化データを蓄積する形態や、
大量に蓄積した場合の利用手段を提供するわけではな
い。
【0008】従来技術3では特に表または関係として構
造を定義されたデータを対象として、帰納的学習の手法
により結論と関連が有る属性値を抽出する。しかし、属
性値同士の関係として時間的因果関係を扱うことは考慮
していない上、記号属性を処理の対象としているため、
連続値をとる時系列データを効率良く扱うことはできな
い。また、従来技術3では、抽出した特徴の解釈は利用
者に任されるので、データ構造理解を支援する表示方式
が不可欠だが、時系列データから抽出した特徴と、デー
タの関係を解りやすく表示する機能に関しては未検討で
ある。
【0009】
【課題を解決するための手段】本発明の望ましい第1の
実施形態においては、時系列データを記号化する手段
と、記号化した時系列データにデータ発生時刻を付加し
て手段と、データ発生時刻を付加した記号化データをレ
コードデータとして格納する手段を持つ。この構成のデ
ータ分析装置を便宜上第1のデータ分析装置と呼ぶ。
【0010】本発明の望ましい第2の実施形態において
は、記号化した時系列データにデータ発生時刻を付加し
レコードデータとして格納する手段と、格納した記号化
データを検索する手段と、検索の結果見つかるレコード
データの時間的情報を用いて、データの部分集合を事例
として構成する手段と、前記事例構成の指定を入力する
手段と、前記事例を1個以上のクラスに分類する手段
と、前記クラスの指定を入力する手段と、前記クラス中
の事例が含むデータを用いて、前記クラスを説明するモ
デルを抽出する手段と、分析結果を出力する手段とから
なる。この構成のデータ分析装置を便宜上第2のデータ
分析装置と呼ぶ。
【0011】本発明の望ましい第3の実施形態において
は、記号化した時系列データにデータ発生時刻を付加し
て格納されているレコードデータとして格納する手段
と、格納した記号化データを検索する手段と、検索の結
果見つかるレコードデータの時間的情報を用いて、デー
タの部分集合を事例として構成する手段と、前記事例構
成の指定を入力する手段と、前記事例を1個以上のクラ
スに分類する手段と、事例に基づいてクラス毎にデータ
の分析結果を行う手段と、前記分析結果を格納する手段
と、データの分析結果を結果を解析するする手段と、デ
ータ分析結果を表示する手段とからある。この構成のデ
ータ分析装置を便宜上第3の実施形態と呼ぶ。
【0012】本発明の第1の実施形態においては、時系
列データ記号化をレコードデータとして格納することに
より、特徴を保存したまま蓄積必要量を減らすことがで
き、且つ計算機による検索処理が容易になる。
【0013】本発明の第2の実施形態においては、記号
化されたデータをレコードとして格納することにより記
号値間の時間的関係を事例として指定する手段を持ち、
また格納したデータを効率よく検索する手段を持つた
め、記号値間の時間的関係をデータから抽出することが
できる。
【0014】本発明の第3の実施形態においては、抽出
したルールを事例の指定に関する情報を格納する手段
と、事例と記号値間の時間的関係を検索する手段を持つ
ため、ルールと事例の時間的関係を表示することが可能
である。
【0015】
【実施例】以下、図面を用いて本発明の第1の実施例を
説明する。図1は記号化データ管理装置100の構成と
データの流れを示している。図1において、101は記
号化指定入力装置、102は時系列データ管理装置、1
03は出力装置、104は検索指定装置である。105
はデータ記号化装置、106と時間管理装置107から
構成されているデータ変換装置であり、108はデータ
格納装置、109は記号化データを格納するデータ記憶
資源、112は時系列データを格納する記憶資源、11
0は検索装置である。
【0016】図2に変換対象データの例を示す。時系列
データ201は化学プラントに設置された圧力計のデー
タであり、データ202は圧力計の計測値を1秒おきに
サンプリングしている状態を表している。
【0017】図3に分析対象データと記号値の対応を格
納した記号化用辞書300を示す。記号化用辞書300
は分析の目的に応じて予め利用者が用意しておく。フィ
ールド301は記号化の対象となる時系列データの変化
パターンであり、フィールド301はフィールド302
の変化パターンに対応する記号値である。
【0018】まず利用者は予め記号化用辞書300を記
号化設定入力装置101へ入力しておく。時系列データ
管理装置101への入力データは時系列データ管理装置
102に与えられる。入力されるデータ図2に示すよう
に、計測値と計測値が発生した時刻からなる。本発明で
は必ずしも時系列データを蓄積する必要はないが、説明
の便宜上、入力データはデータ管理装置102によって
記憶資源112に格納されるものとする。また入力デー
タはデータ変換装置105に渡り、データ記号化装置1
06が起動される。データ記号化装置106は記号化用
辞書300を元に入力データを記号値に変換し、また記
号化用辞書に登録されている変化パターンとの類似性を
表す確信度を出力する。時刻付加装置107はデータ記
号化装置106によって検知された変化パターンの開始
時刻、終了時刻を出力する。データ変換装置105は変
換を行う度に開始時刻、終了時刻、記号値、確信度をデ
ータ格納装置108に出力し、データ格納装置108は
入力されたデータを開始時刻、終了時刻、記号値、確信
度のフィールドからなるレコードとしてデータ記憶資源
109に格納する。
【0019】図4に記号化データ管理装置の格納形式4
00を示す。フィールド401は変化パターンが発生し
た時刻、フィールド402は変換した記号値、フィール
ド403は入力データと辞書300に登録されている変
化パターンの類似性を評価する確信度である。格納形式
400はデータ格納装置108によりデータ記憶資源1
09に格納される。
【0020】検索指定装置104には検索指定として検
索キーとなるフィールド値が入力される。検索装置11
0は検索キーを満たすレコードをデータ記憶資源109
から検索し、結果を出力装置103に与え、出力装置1
03は検索結果を出力する。
【0021】第1の実施例では、データ記号化装置10
6と時間管理装置107から構成されるデータ変換装置
105を設けて、時系列データを計算機による検索が容
易な形式に変換し、且つデータをリアルタイムに逐次処
理する所に特徴がある。
【0022】以下図1に従って本実施例の詳細を説明す
るデータ201がデータ202の形式で時間順に時系列
データ管理装置102へ入力される。区間203のデー
タが入力されると、データ変換装置105はデータ記号
化装置106により区間203のデータと記号化用辞書
300を照合し、パターン302と確信度0.4を得る。
時間管理装置107は、区間203のデータとデータ変
換装置105の照合結果を受けて、得られたパターンの
開始時刻、終了時刻を計算する。データ変換装置は0、5
0、“上昇から下降”、0.4をそれぞれ、区間201の開
始時刻、終了時刻、適合した記号値、確信度として出力
する。データ格納装置108は0、50、“上昇から下
降”、0.4を1個のレコードデータとしてデータ記憶資
源109に格納する。区間204、205、206も区
間201の変換手続と同様に処理され、データ400を
得る。
【0023】時系列データをデータ400の格納形式で
管理することで、表計算アプリケーション、データベー
スソフト等で処理することが可能になる。検索指定装置
104、検索装置110が表計算アプリケーションであ
るとする。圧力データの“上昇し始め”時に化学プラン
トの異常発生が分かっているときに異常発生時刻に関し
て分析を行ないたい場合は、検索指定装置104に「記
号値=“上昇し始め」”を与えると、検索装置110は
レコード405を取り出し、出力装置103がレコード
405を出力する。
【0024】このように、時系列データを記号化するこ
とでデータの冗長性を取り除き、記号値とデータが発生
した時刻をレコード形式で格納することにより、計算機
よる検索処理が容易になる。従って大量時系列データか
ら目的のデータを短時間で探し出すこと可能である。
【0025】次に本発明の第2の実施例を説明する。図
5において、503はデータ分析装置、504は分析指
定装置、505は分析結果出力装置、507は記号化デ
ータ格納装置、508は表示指定入力装置、509は事
例作成装置、510はクラス分類装置、511はモデル
抽出装置である。記号化データ管理装置100は図1中
の装置100と同様である。また図9はデータ分析装置
503の詳細を示している。図6に分析対象データの例
を示す。時系列データ600はデータ201と同様に化
学プラントに設置された計測器のデータであり、それぞ
れのデータは計測値を10秒おきにサンプリングしてい
る状態を表している。データ601は圧力計の計測値、
データ602は温度計の計測値、データ603は流量計
の計測値をサンプリングしたものである。
【0026】図7に記号化データ管理装置100により
格納されたデータの例を示す。データ701はデータ6
01の変換結果、データ702はデータ602の変換結
果、データ703はデータ603の変換結果を表してい
る。これらの記号化データは時刻、記号値、確信度のフ
ィールドからなるレコードの集合として表現されている
が、記号値、確信度のフィールドはレコード中に複数並
んでいてもよい。これはある瞬間の時系列データが複数
の記号化可能である場合に相当する。またこれらの記号
化データのレコード集合を必ずしも計測器毎のファイル
として用意する必要はなく、各時系列データのサンプリ
ング周期は必ずしも同一である必要もないが、本実施例
では説明のため便宜上計測器毎にレコード集合を格納す
るファイルを用意し、計測器毎のサンプリング周期は同
一であるものとする。図8に分析結果の例を示す。分析
結果はif-thenルールの形で結論を導く条件として出力
される。本実施例において、データ構造を表すモデルと
は各クラス毎のルール集合を指す。クラスに関する説明
は後述する。“if 記号化パターン名”をルールの条件
部といい、条件部が含む条件節の数は1つ以上である。
また“thenクラス名”をルールの結論部という。分析結
果800は異常が発生する前1分間のデータ構造を表し
ており、ルール801は温度が上昇することを、ルール
802は温度がいったん上昇した後に下降することを、
ルール803は流量が下降し始め且つ圧力が下降中であ
ることを意味している。
【0027】データ分析装置503は分析指定装置50
4の指定に従って検索要求を記号化データ管理装置10
0に発行した後、検索結果を用いてデータの分析を行
う。事例作成装置509は検索結果がどの事例に含まれ
るかを判定する。クラス分類装置510は検索結果を含
んでいる事例がどのクラスに属するかを判定する。モデ
ル抽出装置511は、事例情報、クラス情報を用いてデ
ータ構造を表すモデルを構築する。データ分析結果出力
装置105はデータ分析装置104から分析結果を受け
取り、表示指定入力装置108に従って結果の表示を行
う。
【0028】第2の実施例では、時系列データを記号化
データ管理装置100によりレコード集合として格納
し、事例作成装置509により時系列データから事例を
作成し、クラス分類装置510により事例集合をクラス
に分類し、モデル抽出装置511により対象データを記
述するモデルとして時系列データから特徴抽出する点に
特徴がある。
【0029】以下、図5に従って本実施例の詳細を説明
する。まず利用者は分析指定装置504から事例作成指
定、並びにクラス設定を行う。ここで事例とは実世界の
ある表象を表すデータ集合のことであり、ユーザの着目
点により何を事例とするかは異なる。またクラスとは事
例を分類する単位であり、例えば正常事例と異常事例の
二つのクラスを指定する。このクラス指定は必須ではな
く、事例を複数のクラスに分類する必然性がない場合に
は、全ての事例が1つのクラスに属するものとして以下
の処理を続ける。本実施例ではプラントが異常を起こす
前の10秒間の計測器データから得られる記号化パター
ンの集合を事例とし、これらの事例異常クラスに属する
ものとする。また異常が起きていない時刻をランダムに
選択し、選択した時刻から10秒前までの記号化パター
ンの集合を正常事例する。これらの事例が属するクラス
を正常クラスとする。またそれぞれのクラスに含まれる
事例数は同じである。
【0030】また分析指定装置504では、ルール抽出
を行うクラスとルール抽出に与えるパラメータを指定す
る。ここで、ルールの良さを示す三つの指標を導入す
る。条件部の記号化パターンを含む事例数Aと全事例数
Nの割合A/Nを一つ目の指標とし、これをカバー率と
呼ぶことにする。カバー率はルールの一般性を示す指標
であり、カバー率が大きいほど、より多くの事例を説明
する一般的なルールである。逆にカバー率が小さいほ
ど、小数の事例のみを説明する特殊なルールであること
を示している。また、あるクラスにおいて、クラス内に
含まれる条件部の記号化パターンを含むクラス内事例数
をBに対して、B/Aを二つめの指標とし、これを精度
と呼ぶことにする。精度は条件部に適合した事例に対し
て正しく結論部に適合した事例の割合を表す。すなわ
ち、精度はルールの正確さを示す指標であり、精度が大
きいルールほど、クラス特有の条件を示しているといえ
る。一般的にはカバー率が大きいルールほど精度が減少
する傾向にあることから、満たすべきカバー率と精度、
またはカバー率と精度の優先度等を利用者がパラメータ
として指定する。
【0031】また、事例内の記号化パターンは元データ
との適合度を表す確信度をそれぞれ持っている。そこで
条件部の記号化パターンを含む事例において、条件部記
号化パターンの確信度の平均をルールの条件部自体の良
さを示す指標とし、平均確信度と呼ぶことにする。本実
施例ではルールを抽出する際にはカバー率、精度、平均
適合度の三つの指標に従ってルールの良さを評価する。
【0032】事例作成装置509は記号化データ管理装
置100に格納されているデータから、事例を検索し、
それぞれの事例がどのような記号値を含んでいるかを計
算する。クラス分類装置510は検索した事例のクラス
を判定し、モデル抽出装置511により分析指定を受け
ているクラスのデータ構造を表すルールを抽出する。
【0033】図10に分析過程処理の詳細を示す。処理
の概要は、n条件節のルールからn+1条件節の候補ルール
集合を構成し、この中からn+1条件節のルールを生成す
ることを繰り返す。まず処理1001ではルール1条件
節集合を生成する。具体的には、条件節に1個の記号値
を当てはめたときのカバー率、精度、平均確信度を計算
し、分析指定で定めた基準を越えるものをルールとして
採用する。
【0034】処理1002でn=1とし、多条件節のルー
ルを探索を開始する。処理1003ではn条件節集合に
記号化パターン名を1個追加した、n+1条件節候補集合
を生成する共に、以前のiteration ステップで切り捨て
られた記号化パターン名は初めから候補に入れないよう
にする。例えば、全ての記号化パターン名は{a,b,c}
で、処理1001で得られた1条件節集合が{a,b}であ
るとき 、n+1条件節候補集合は{{a,b},{b,c},{c,a}}と
なる。処理1004ではn+1条件節候補集合の要素のそ
れぞれについて、条件節を含む事例数を計算する。処理
1005ではn+1条件節候補集合の要素のそれぞれにつ
いて、条件節を含み且つモデル抽出の対象となるクラス
に属する事例の数を計算する。全てのn+1条件節候補集
合の要素について処理1003から処理1005までを
繰り返した後、処理1007に移る。処理1007では
処理1005で定めた基準に従い、n+1条件節ルールを
確定する。
【0035】分析結果出力装置505はデータ分析装置
503によって得られたルールを出力する。
【0036】このように、記号化データ管理装置100
により時系列データをレコードとして扱い、事例作成装
置509を用いて時間情報に基づいて事例を作成するこ
とにより、時系列データから利用者の理解が容易なデー
タ構造モデルを抽出することが可能になる。
【0037】次に本発明の第3の実施例を説明する。図
11において1101は分析結果格納装置、1102は
分析結果を格納する記憶資源、1103は表示指定装
置、1104は関連性検索装置、1105は事例表示装
置、1106は時系列データ表示装置、1107はモデ
ル表示装置、1108は記憶資源に格納された時系列デ
ータ、1108は記憶資源に格納された時系列データ、
1109は記憶資源に格納された記号化データである。
事例作成装置509、クラス分類装置510、モデル抽
出装置511、データ分析装置503は図5中の該当装
置と同様である。また記号化データ管理装置100は図
1の該当装置と同様である。
【0038】データ分析装置503によって得られた分
析結果は、分析結果格納装置1101により記憶資源1
102に蓄積される。利用者は表示指定装置1103か
ら表示するルール、事例を選択する。表示指定装置11
03からの要求に従い、関連性検索装置1104がルー
ル、事例、時系列データの関連性を記憶資源1102に
格納された分析結果から検索する。検索されたルール、
事例、記号化データ、時系列データ及びこれらの間の関
連性をそれぞれの表示装置が出力する。
【0039】第3の実施例では、記号化データ管理装置
100を用いて時系列データを記号値として蓄積し、デ
ータ分析装置503により前記の蓄積記号化データを事
例単位で解析し、関連性検索装置1104により事例と
ルールの時間的関係を解析することにより、時系列デー
タの時間的構造の変化を表示可能な点に特徴がある。
【0040】以下図11に従って本実施例の詳細を説明
する。表示指定装置1103から利用者がルールの一覧
表示を要求すると、モデル表示装置1107は格納デー
タ1202を用いて図13に示すようなルールの一覧を
表示する。分析結果格納装置1101には図12に示す
形式で分析結果が格納されている。1201は分析対象
に関する記述で、事例定義は事例を構成する基準、クラ
ス定義は分析を行なったクラスの基準、ルール数は抽出
されたルールの総数を示している。1202は抽出した
ルールの条件部、カバー率、精度、平均確信度、評価値
である。
【0041】ルールと事例の時間的関係に関する表示要
求を表示指定装置1103から与えると、格納データ1
202中のルール条件部、事例定義、クラス定義情報を
検索条件として記号化データ管理装置100に与え、ル
ール条件のみに適合する事例、ルール全体に適合する事
例を検索する。この検索結果を事例表示装置1105に
与えると、図14に示す結果が表示される。横軸140
2は時間軸であり事例が発生順に並んでいる。また縦軸
1401にはルールが並んでいる。
【0042】ルールを並べるには、以下の(1)〜
(3)の方法がある。
【0043】(1)条件節に順序関係を定義しておき、
条件部の辞書順によりルールを並べるもの (2)ルールのカバー率、精度、平均確信度のそれぞれ
に基づいて順序付けするもの (3)カバー率、精度、平均確信度の三つを考慮した評
価式に基づいて順序付けするもの ルールを並べるには、これらのものがあるがここでは説
明の便宜上ルールは評価値順に並んでいるものとする。
図14からはルール集合と事例集合の関係が解る。14
04はルールの条件部結論部共に事例と一致した場合の
点であり、1405はルールの条件部のみが事例に適合
した場合を示している。また1406はルールを抽出し
た事例クラスに属するが、どのルールにも適合しない場
合を示している。事例Aはルール3、4、5に適合し、
事例C、事例Dはルール2、3に適合する等のルールと
適合する事例の対応関係や、ルール5は早い時間に前に
発生した事例に適合するが、後になると適合していない
等の事例、或は異常の発生パターンが時間の推移と共に
変化していること等が分かる。
【0044】このように、ルールの集合による時系列デ
ータのモデルを表現する場合、事例集合とルール集合が
全射関係にある、即ち1つの事例が強い特徴を幾つか含
んでいる。図14のように構成した平面上にルールと事
例の関係をプロットすることで、事例に含まれる特徴と
事例の発生時刻に関する情報等を利用者が把握できる。
【0045】利用者がルール3の詳細表示要求を表示指
定装置1103から与えると、格納データ1202中の
ルール条件部、事例定義、クラス定義情報を検索条件と
して記号化データ管理装置100に与え、ルール条件
部、結論部共にに適合する事例を検索する。また時系列
データ管理装置1106に前記検索の結果を与え、記号
化データと時間的に対応する時系列データを検索する。
ルール3、ルール3に適合する事例、事例に適合する時
系列データを表示した例を図15に示す。1501は詳
細表示の対象となったルール、1502はルールの条件
部、1503は事例に対応する時系列データ、1504
は事例中のルール適合部を表している。
【0046】
【発明の効果】以上、本発明では時系列データを記号化
し、データの発生時間と共に蓄積することで計算機によ
るデータの検索処理が容易になり、記号値に付加したデ
ータ発生時間を用いて事例単位で分析を行うことで、1
つ以上の時系列データについても系列間の因果関係をデ
ータ構造を表現するルール形式で利用者に提供すること
ができるという効果がある。また取り出したルールと事
例の時間的関係を表示することで、事例が持つ複数の特
徴を把握する手段と、データの時間的構造を事例単位で
観測する手段を利用者に提供することができるという効
果がある。
【図面の簡単な説明】
【図1】記号化データを蓄積するデータ管理装置の全体
図である。
【図2】時系列データの例である。
【図3】データ記号化用辞書の例である。
【図4】記号化した時系列データの格納形式の例であ
る。
【図5】記号化データ管理装置を用いたデータ分析装置
の全体図である。
【図6】時系列データの例である。
【図7】記号化した時系列データの格納形式の例であ
る。
【図8】データ分析結果の例である。
【図9】データ分析装置の詳細図である。
【図10】データ分析処理のフローチャートである。
【図11】データ分析装置表示部の全体図である。
【図12】データ分析装置出力の格納例である。
【図13】データ分析装置出力の例である。
【図14】ルール−事例関係表示の例である。
【図15】記号化データと時系列データと事例情報にマ
ッピングしたルール表示の例である。
───────────────────────────────────────────────────── フロントページの続き (72)発明者 大森 勝美 茨城県日立市大みか町五丁目2番1号 株 式会社日立製作所大みか工場内

Claims (7)

    【特許請求の範囲】
  1. 【請求項1】1つ以上の時系列データを入力する手段
    と、 入力された時系列データが有する値に対応する記号化基
    準と記号値を格納する手段と、 格納された記号化基準に従い、該当時系列データを一個
    以上の記号値に変換する手段と、 変換された記号値と前記時系列データが発生した時刻で
    構成されるレコードデータを格納する手段とからなるこ
    とを特徴とするデータ分析装置。
  2. 【請求項2】1つ以上の時系列データを入力する手段
    と、 前記時系列データの値に対応する記号化基準と記号値を
    入力する手段と、 入力された記号化基準に従い、該当する前記時系列デー
    タを一個以上の記号値に変換する手段と、 変換された記号値および前記記号値に対応する時系列デ
    ータを関連づけて格納する手段と、 前記格納された時系列データを前記記号値を用いて検索
    する手段とからなることを特徴とするデータ分析装置。
  3. 【請求項3】請求項2に記載のデータ分析装置におい
    て、 前記格納する手段は、前記記号値を変換された記号値と
    ともに対応する前記時系列データが発生した時刻からな
    るレコードデータとして格納することを特徴とするデー
    タ分析装置。
  4. 【請求項4】請求項2に記載のデータ分析装置におい
    て、 前記レコードデータ中の記号値を用いてif then 形式の
    ルールを出力することを特徴とするデータ分析装置。
  5. 【請求項5】請求項2または4に記載のデータ分析装置
    において、 前記レコードデータ中の記号値の組合せ関係を条件部と
    する if then 形式のルールとして結果を出力すること
    を特徴とするデータ分析装置。
  6. 【請求項6】請求項2または4に記載のデータ分析装置
    において、 前記レコードデータ中の記号値の順序関係を条件部とす
    る if then 形式のルールを出力することを特徴とする
    データ分析装置。
  7. 【請求項7】請求項2または4に記載のデータ分析装置
    において、 入力された時系列データに時間的属性が含まれている場
    合、時間的属性を用いて前記時系列データを分析するこ
    とを特徴とするデータ分析装置。
JP18529895A 1995-07-21 1995-07-21 データ分析装置 Expired - Fee Related JP3489279B2 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP18529895A JP3489279B2 (ja) 1995-07-21 1995-07-21 データ分析装置
US08/684,392 US5802254A (en) 1995-07-21 1996-07-19 Data analysis apparatus

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP18529895A JP3489279B2 (ja) 1995-07-21 1995-07-21 データ分析装置
US08/684,392 US5802254A (en) 1995-07-21 1996-07-19 Data analysis apparatus

Publications (2)

Publication Number Publication Date
JPH0934719A true JPH0934719A (ja) 1997-02-07
JP3489279B2 JP3489279B2 (ja) 2004-01-19

Family

ID=26503020

Family Applications (1)

Application Number Title Priority Date Filing Date
JP18529895A Expired - Fee Related JP3489279B2 (ja) 1995-07-21 1995-07-21 データ分析装置

Country Status (2)

Country Link
US (1) US5802254A (ja)
JP (1) JP3489279B2 (ja)

Cited By (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH11338855A (ja) * 1998-05-21 1999-12-10 Fujitsu Ltd データ分解装置、その方法、及び記録媒体
JP2000132300A (ja) * 1998-10-21 2000-05-12 Nec Eng Ltd アラーム履歴記録装置
JP2001147937A (ja) * 1999-11-22 2001-05-29 Toshiba Corp 業務支援システム
JP2005257416A (ja) * 2004-03-10 2005-09-22 Internatl Business Mach Corp <Ibm> 診断装置、検出装置、制御方法、検出方法、プログラム、及び記録媒体
JP2007048200A (ja) * 2005-08-12 2007-02-22 Chugoku Electric Power Co Inc:The データ分析方法、データ分析システム、およびプログラム
WO2007088700A1 (ja) * 2006-02-01 2007-08-09 Kenichi Sasaki 経済データ処理システム
JP2011154586A (ja) * 2010-01-28 2011-08-11 Rakuten Inc 投稿文章分析装置、投稿文章分析方法、および、投稿文章分析装置用プログラム
JP2012243013A (ja) * 2011-05-18 2012-12-10 Hitachi Systems Ltd データ分析のデータ抽出システム、方法、及びプログラム
JP2016045556A (ja) * 2014-08-20 2016-04-04 日本電信電話株式会社 ログ間因果推定装置、システム異常検知装置、ログ分析システム、及びログ分析方法
JP2020013561A (ja) * 2018-07-17 2020-01-23 パロ アルト リサーチ センター インコーポレイテッド 予め選択されたシグネチャを使用して任意長の時系列を特徴付けるためのシステムおよび方法
JP2020021278A (ja) * 2018-07-31 2020-02-06 株式会社日立製作所 分析方法及び計算機
CN112527862A (zh) * 2020-12-10 2021-03-19 国网河北省电力有限公司雄安新区供电公司 一种时间序列数据的处理方法及装置

Families Citing this family (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6094650A (en) * 1997-12-15 2000-07-25 Manning & Napier Information Services Database analysis using a probabilistic ontology
US6393387B1 (en) * 1998-03-06 2002-05-21 Perot Systems Corporation System and method for model mining complex information technology systems
US6311175B1 (en) 1998-03-06 2001-10-30 Perot Systems Corp. System and method for generating performance models of complex information technology systems
EP1242932A4 (en) * 1999-07-15 2004-04-07 Ebidenergy Com USER INTERFACE TO FACILITATE, ANALYZE AND MANAGE RESOURCE CONSUMPTION
US20030187761A1 (en) * 2001-01-17 2003-10-02 Olsen Richard M. Method and system for storing and processing high-frequency data
US20020169735A1 (en) * 2001-03-07 2002-11-14 David Kil Automatic mapping from data to preprocessing algorithms
US20020129342A1 (en) * 2001-03-07 2002-09-12 David Kil Data mining apparatus and method with user interface based ground-truth tool and user algorithms
US7152068B2 (en) * 2001-12-21 2006-12-19 Honeywell International Inc. Method and apparatus for retrieving time series data related to an activity
US20030144978A1 (en) * 2002-01-17 2003-07-31 Zeine Hatem I. Automated learning parsing system
AU2003231176A1 (en) * 2002-04-29 2003-11-17 Laboratory For Computational Analytics And Semiotics, Llc Sequence miner
WO2005109244A1 (en) * 2004-05-11 2005-11-17 Angoss Software Corporation A method and system for interactive decision tree modification and visualization

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5313560A (en) * 1990-05-11 1994-05-17 Hitachi, Ltd. Method for determining a supplemental transaction changing a decided transaction to satisfy a target
US5701400A (en) * 1995-03-08 1997-12-23 Amado; Carlos Armando Method and apparatus for applying if-then-else rules to data sets in a relational data base and generating from the results of application of said rules a database of diagnostics linked to said data sets to aid executive analysis of financial data

Cited By (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH11338855A (ja) * 1998-05-21 1999-12-10 Fujitsu Ltd データ分解装置、その方法、及び記録媒体
JP2000132300A (ja) * 1998-10-21 2000-05-12 Nec Eng Ltd アラーム履歴記録装置
JP2001147937A (ja) * 1999-11-22 2001-05-29 Toshiba Corp 業務支援システム
US7720640B2 (en) 2004-03-10 2010-05-18 International Business Machines Corporation Diagnostic data detection and control
JP2005257416A (ja) * 2004-03-10 2005-09-22 Internatl Business Mach Corp <Ibm> 診断装置、検出装置、制御方法、検出方法、プログラム、及び記録媒体
JP2007048200A (ja) * 2005-08-12 2007-02-22 Chugoku Electric Power Co Inc:The データ分析方法、データ分析システム、およびプログラム
JP4698328B2 (ja) * 2005-08-12 2011-06-08 中国電力株式会社 データ分析方法、データ分析システム、およびプログラム
WO2007088700A1 (ja) * 2006-02-01 2007-08-09 Kenichi Sasaki 経済データ処理システム
JP2011154586A (ja) * 2010-01-28 2011-08-11 Rakuten Inc 投稿文章分析装置、投稿文章分析方法、および、投稿文章分析装置用プログラム
JP2012243013A (ja) * 2011-05-18 2012-12-10 Hitachi Systems Ltd データ分析のデータ抽出システム、方法、及びプログラム
JP2016045556A (ja) * 2014-08-20 2016-04-04 日本電信電話株式会社 ログ間因果推定装置、システム異常検知装置、ログ分析システム、及びログ分析方法
JP2020013561A (ja) * 2018-07-17 2020-01-23 パロ アルト リサーチ センター インコーポレイテッド 予め選択されたシグネチャを使用して任意長の時系列を特徴付けるためのシステムおよび方法
JP2020021278A (ja) * 2018-07-31 2020-02-06 株式会社日立製作所 分析方法及び計算機
CN112527862A (zh) * 2020-12-10 2021-03-19 国网河北省电力有限公司雄安新区供电公司 一种时间序列数据的处理方法及装置

Also Published As

Publication number Publication date
JP3489279B2 (ja) 2004-01-19
US5802254A (en) 1998-09-01

Similar Documents

Publication Publication Date Title
JP3489279B2 (ja) データ分析装置
CN111241241B (zh) 基于知识图谱的案件检索方法、装置、设备及存储介质
US8560531B2 (en) Search tool that utilizes scientific metadata matched against user-entered parameters
JP6601433B2 (ja) イベント解析装置、イベント解析システム、イベント解析方法、イベント解析プログラム及び記録媒体
JP2020500371A (ja) 意味的検索のための装置および方法
US20180341686A1 (en) System and method for data search based on top-to-bottom similarity analysis
CN109190051B (zh) 一种用户行为分析方法和基于该分析方法的资源推荐方法
CN111274267A (zh) 一种数据库查询方法、装置及计算机可读取存储介质
CA2377584C (en) Content-based retrieval of series data
JP2007219929A (ja) 感性評価システム及び方法
JP2012073812A (ja) データ分析支援システム及び方法
CN113379313A (zh) 一种具有智能化的预防性试验作业管控系统
KR970001907B1 (ko) 적합율 또는 일치율을 제공하는 데이타 검색 방법 및 장치
CN111694930A (zh) 一种动态知识热点演化及趋势分析方法
JP2003316819A (ja) オブジェクト分類検索装置及びそれを実行するためのプログラム
JP2005122509A (ja) 階層構造データ分析方法、分析装置および分析プログラム
JP3176692B2 (ja) プロセス運用支援システム
CN112214660A (zh) 工业信息标识与检索系统
JP5020274B2 (ja) 意味ドリフトの発生評価方法及び装置
US20220284061A1 (en) Search system and search method
US11941020B2 (en) Displaying query results using machine learning model-determined query results visualizations
CN117786182B (zh) 基于erp系统的业务数据存储系统及方法
JP3311778B2 (ja) 類似情報検索装置
Goethals A Framework for Pattern Mining and Anomaly Detection in Multi-dimensional Time Series and Event Logs
Djiroun et al. Search Approach for External Data Sources for Data Warehouse Enrichment in Business Intelligence Context

Legal Events

Date Code Title Description
FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20071107

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20081107

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20081107

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20091107

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20101107

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20101107

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20111107

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20111107

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20121107

Year of fee payment: 9

LAPS Cancellation because of no payment of annual fees