JP2017182378A - ルール抽出装置、該方法および該プログラム - Google Patents

ルール抽出装置、該方法および該プログラム Download PDF

Info

Publication number
JP2017182378A
JP2017182378A JP2016067320A JP2016067320A JP2017182378A JP 2017182378 A JP2017182378 A JP 2017182378A JP 2016067320 A JP2016067320 A JP 2016067320A JP 2016067320 A JP2016067320 A JP 2016067320A JP 2017182378 A JP2017182378 A JP 2017182378A
Authority
JP
Japan
Prior art keywords
rule
event
processing unit
extraction
predetermined
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2016067320A
Other languages
English (en)
Other versions
JP6698401B2 (ja
Inventor
友近 信行
Nobuyuki Tomochika
信行 友近
西田 吉晴
Yoshiharu Nishida
吉晴 西田
徹 江口
Toru Eguchi
徹 江口
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Kobe Steel Ltd
Original Assignee
Kobe Steel Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Kobe Steel Ltd filed Critical Kobe Steel Ltd
Priority to JP2016067320A priority Critical patent/JP6698401B2/ja
Publication of JP2017182378A publication Critical patent/JP2017182378A/ja
Application granted granted Critical
Publication of JP6698401B2 publication Critical patent/JP6698401B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

【課題】本発明は、支持度にかかわらず、優位なルールを抽出できるルール抽出装置、該方法および該プログラムを提供する。
【解決手段】本発明のルール抽出装置は、物に関わる所定の事象の成立を表す事象成立情報と前記物の使用開始から前記事象の成立までの累積使用量と対応付けた事象データを、1または複数の物について、かつ、互いに異なる複数の事象について、複数、記憶し、これら複数の事象データに基づいて、時系列アソシエーション分析でルール、確信度およびリフトを求め、このルールの中から、注目事象を結論部に持つルールを抽出し、この抽出されたルールの中から、確信度およびリフト値それぞれが確信度閾値およびリフト閾値それぞれ以上のルールを抽出し、この抽出されたルールの中から、前記累積使用量に基づいて所定の条件を満たすルールを抽出する。
【選択図】図1

Description

本発明は、所定の事象データの中から所定のルールを抽出するルール抽出装置、ルール抽出方法およびルール抽出プログラムに関する。
膨大な量のデータの中から事象間(イベント間)の関連性を分析する手法として、アソシエーション分析と呼ばれる手法が知られている(例えば、非特許文献1参照)。このアソシエーション分析は、マーケット・バスケット分析とも呼ばれ、データの中から、A事象の条件の下に、B事象が起こるルールを見つけ(抽出し)、前記ルールを分析する手法である。
アソシエーション分析では、この見つけられたルールは、アソシエーション・ルールと呼ばれ、上記の例では、通常、{A}⇒{B}と表記される。この表記の左辺は、条件部(left−hand−side;LHS)と呼ばれ、その右辺は、結論部(right−hand−side;RHS)と呼ばれる。なお、上記の例では、2個の事象間におけるアソシエーション・ルールが見つけられたが、アソシエーション・ルールは、任意の個数の事象間におけるルールであっても良い(例えば、{AかつB}⇒{C}等)。また、上記の例では、{A}⇒{B}におけるA事象とB事象との間には、他の事象が介在しないが、A事象とB事象との間に1または複数の他の事象が介在しても、{A}⇒{B}がルールとして見つけられても良い。
そして、アソシエーション分析では、このアソシエーション・ルールは、支持度(サポート、support)、確信度(confidence、信頼度)およびリフト(lift、改善度)と呼ばれる各指標で分析される。
支持度は、全データの中で、当該アソシエーション・ルールが出現する割合(発生確率)であり、(支持度)=(当該アソシエーション・ルールに合致するデータ数)/(全データ数)で表される。例えば、アソシエーション・ルール;{A}⇒{B}の支度度は、条件部Aと結論部Bとを共に含むデータ数を、全データ数で、除算することによって求められる。支持度は、0〜1(0〜100%)の値をとり、支持度が大きいアソシエーション・ルールは、前記全データの中でよく起こる、ありがちなルールと評価できる。
確信度は、条件部が出現する割合の中で、当該アソシエーション・ルールが出現する割合であり、(確信度)=(当該アソシエーション・ルールに合致するデータ数)/(条件部のデータ数)で表される。例えば、アソシエーション・ルール;{A}⇒{B}の支度度は、条件部Aと結論部Bとを共に含むデータ数を、条件部Aを含むデータ数で、除算することによって求められる。確信度は、0〜1(0〜100%)の値をとり、確信度が大きいアソシエーション・ルールは、当該アソシエーション・ルールに含まれる事象間の結びつきが強いことになり、上記の例では、A事象が起こればB事象が起こり易いことを示す。このことから確信度は、相関係数に近い意味を持っている。
リフトは、(リフト)=(当該アソシエーション・ルールの確信度)/(結論部の支持度)で表される。例えば、アソシエーション・ルール;{A}⇒{B}のリフトは、{A}⇒{B}の確信度を、結論部Bを含むデータ数で、除算することによって求められる。
確信度は、上述したように、事象間の結びつきの強さを表す指標であるが、そもそも、結論部がありふれたものである場合、これは、どの条件部の下でも起こり易い。このため、確信度だけでアソシエーション・ルールを評価すると、誤評価してしまう可能性がある。前記リフトは、この確信度を評価する指標であり、任意の値をとり、1が基準値となる。リフト値が1より大きい場合には、条件部の下に結論部が生じたものと考えられ、リフト値が1より大きいほど、条件部の下に結論部がより生じたものと考えられる。逆に、リフト値が1より小さい場合には、結論部特有の理由で結論部が生じたものと考えられる。
また、アソシエーション分析のうち、事象の発生順番も考慮してルールを抽出する方法として時系列アソシエーション分析(Frequent Sequence MiningやSequential Pattern Mining等とも呼ばれる)が知られている。
Agrawal R.andSrikant R.、"Fast algorithms for mining association rules in large database"、Proc. VLDB、pp487−499、Morgan Kaufmann(1994)
このような時系列アソシエーション分析では、通常、支持度が大きく、確信度が大きく、そして、リフト値が1より大きいルールが妥当なルール(信頼できるルール)とされる。すなわち、比較的よく生じ、条件部と結論部との結びつきが強く、そして、条件部の下に結論部が生じるルールが妥当なルールとされる。しかしながら、支持度が小さく、余り生じないルールであっても(たまに生じるルールであっても)、ルールとして認定して良い優位なルールである場合がある。特に、装置やシステムにおける不具合の発生等に関連したルールを見つける場合、このような優位なルールは、不具合の発生抑制や不具合の発生防止の観点から、重要である。このような優位なルールは、上述の従来の時系列アソシエーション分析では、見つけることが難しい。
本発明は、上述の事情に鑑みて為された発明であり、その目的は、支持度にかかわらず、優位なルールを抽出できるルール抽出装置、ルール抽出方法およびルール抽出プログラムを提供することである。
本発明者は、種々検討した結果、上記目的は、以下の本発明により達成されることを見出した。すなわち、本発明の一態様にかかるルール抽出装置は、物に関わる所定の事象の成立を表す事象成立情報と前記物の使用開始から前記事象の成立までの累積使用量と対応付けた事象データを、1または複数の物について、かつ、互いに異なる複数の事象について、複数、記憶する事象データ記憶部と、時系列アソシエーション分析を用いることによって前記事象データ記憶部に記憶された複数の事象データに基づいてルール、確信度およびリフトを求める分析処理部と、注目事象を入力するための入力部と、前記分析処理部で求められたルールの中から、前記入力部で入力された注目事象を結論部に持つルールを抽出する第1抽出処理を行う第1抽出処理部と、前記第1抽出処理部で抽出されたルールの中から、前記分析処理部で求められた確信度およびリフト値それぞれが所定の確信度閾値およびリフト閾値それぞれ以上のルールを抽出する第2抽出処理を行う第2抽出処理部と、前記第2抽出処理部で抽出されたルールの中から、前記累積使用量に基づいて所定の条件を満たすルールを抽出する第3抽出処理を行う第3抽出処理部とを備えることを特徴とする。好ましくは、上述のルール抽出装置において、前記累積使用量は、累積使用時間である。好ましくは、上述のルール抽出装置において、前記物は、動くものであって、前記累積使用量は、累積移動量である。好ましくは、上述のルール抽出装置において、前記確信度閾値は、0.1(=10%)である。好ましくは、上述のルール抽出装置において、前記リフト閾値は、1より大きな値である。好ましくは、上述のルール抽出装置において、前記リフト閾値は、2である。
このようなルール抽出装置は、時系列アソシエーション分析で求められたルールの中から、注目事象を結論部に持ち、確信度閾値以上の確信度を持ち、リフト閾値以上のリフト値を持つルールを抽出する。したがって、上記ルール抽出装置では、支持度にかかわらず、ルールが抽出される。そして、上記ルール抽出装置は、このように支持度にかかわらず抽出されたルールの中から、さらに、累積使用量に基づいて所定の条件を満たすルールを抽出する。累積使用量が所定の条件を満たすルールは、条件部と結論部との間に、一定の関連性のあるルールと考えられる。このため、上記ルール抽出装置は、このように支持度にかかわらず抽出されたルールの中から、優位なルールを抽出できる。よって、上記ルール抽出装置は、支持度にかかわらず、優位なルールを抽出できる。
また、他の一態様では、上述のルール抽出装置において、前記ルールにおける前記注目事象の1つ前の事象を直前事象とする場合に、前記第3抽出処理部は、前記第2抽出処理部で抽出されたルールに対し、前記直前事象の成立から前記注目事象の成立までの累積使用量のヒストグラムにおける標準偏差または前記標準偏差の定数倍が所定の標準偏差閾値以下であるルールを抽出する処理を前記第3抽出処理として行うことを特徴とする。
直前事象の成立から注目事象の成立までの累積使用量のヒストグラムにおける標準偏差が小さいことは、直前事象の成立から、その累積使用量後に、注目事象が相対的に高い割合で成立していることを意味している。このため、上記ルール抽出装置は、前記作成されたヒストグラムの標準偏差または前記標準偏差の定数倍が所定の標準偏差閾値以下であるルールを抽出することで、優位なルールを効果的に抽出できる。
また、他の一態様では、上述のルール抽出装置において、前記第3抽出処理部は、前記第2抽出処理部で抽出されたルールに対し、前記直前事象の成立から前記注目事象の成立までの累積使用量の平均値を求め、前記求められた平均値が所定の時間閾値以下であるルールをさらに抽出することを特徴とする。
直前事象の成立から注目事象の成立までの累積使用量が比較的大きい場合、注目事象と直前事象との関連性が薄いと考えられる。このため、上記ルール抽出装置は、前記求められた平均値が所定の時間閾値以下であるルールをさらに抽出することで、注目事象と直前事象との関連性が薄いルールを除くことができ、優位なルールをより効果的に抽出できる。
また、他の一態様では、これら上述のルール抽出装置において、前記分析処理部は、さらに、時系列アソシエーション分析の支持度を求め、前記第2抽出処理部は、前記第1抽出処理部で抽出されたルールの中から、前記分析処理部で求められた支持度が所定の支持度閾値以上のルールを抽出し、前記抽出されたルールの中から、前記分析処理部で求められた確信度およびリフト値それぞれが所定の確信度閾値およびリフト閾値それぞれ以上のルールを抽出する処理を前記第2抽出処理として行うことを特徴とする。
このようなルール抽出装置は、支持度も考慮してルールを効果的に抽出できる。
また、他の一態様では、これら上述のルール抽出装置において、前記第3抽出処理部は、前記第2抽出処理部で抽出されたルールに対し、当該ルールを前記分析処理部で求める基になった事象データの個数に対する、当該ルールを前記分析処理部で求める基になった事象データのうちの、前記直前事象の成立から前記注目事象の成立までの累積使用量が所定の範囲内である事象データの個数の比が、所定の比閾値以上であるルールをさらに抽出することを特徴とする。また、他の一態様では、これら上述のルール抽出装置において、前記分析処理部は、さらに、時系列アソシエーション分析の支持度を求め、前記第3抽出処理部は、前記第2抽出処理部で抽出されたルールに対し、当該ルールを前記分析処理部で求める基になった事象データの個数に対する、当該ルールを前記分析処理部で求める基になった事象データのうちの、前記直前事象の成立から前記注目事象の成立までの累積使用量が所定の第2範囲内である事象データの個数の比に、当該ルールの支持度を乗じた乗算結果が、所定の第2比閾値以上であるルールをさらに抽出することを特徴とする。また、他の一態様では、これら上述のルール抽出装置において、前記第3抽出処理部は、前記第2抽出処理部で抽出されたルールに対し、当該ルールを前記分析処理部で求める基になった事象データの個数に対する、当該ルールを前記分析処理部で求める基になった事象データのうちの、前記直前事象の成立から前記注目事象の成立までの累積使用量が所定の第3範囲内である事象データの個数の比に、当該ルールの確信度を乗じた第2乗算結果が、所定の第3比閾値以上であるルールをさらに抽出することを特徴とする。また、他の一態様では、これら上述のルール抽出装置において、前記第3抽出処理部は、前記第2抽出処理部で抽出されたルールに対し、当該ルールを前記分析処理部で求める基になった事象データの個数をNとし、前記N個の事象データのうちのJ個の事象データにおける前記直前事象の成立から前記注目事象の成立までの累積使用量のヒストグラムにおける標準偏差をσとする場合に、J/Nが所定の第4比閾値以上であって、かつ、σが所定の第2標準偏差閾値以下であるルール、または、J/Nに当該ルールの確信度を乗じた第3乗算結果が、所定の第5比閾値以上であって、かつ、σが所定の第2標準偏差閾値以下であるルールをさらに抽出することを特徴とする。また、他の一態様では、これら上述のルール抽出装置において、前記分析処理部は、さらに、時系列アソシエーション分析の支持度を求め、前記第3抽出処理部は、前記第2抽出処理部で抽出されたルールに対し、当該ルールを前記分析処理部で求める基になった事象データの個数をNとし、前記N個の事象データのうちのJ個の事象データにおける前記直前事象の成立から前記注目事象の成立までの累積使用量のヒストグラムにおける標準偏差をσとする場合に、J/Nに当該ルールの支持度を乗じた第4乗算結果が、所定の第6比閾値以上であって、かつ、σが所定の第3標準偏差閾値以下であるルールをさらに抽出することを特徴とする。
このようなルール抽出装置は、事象データに含まれるノイズ(外乱)を除外できるので、より精度良くルールを抽出できる。
また、他の一態様では、これら上述のルール抽出装置において、前記物は、所定の装置を構成する複数の部品の中の1または複数であり、前記事象は、前記部品の不具合であることを特徴とする。
このようなルール抽出装置は、複数の部品を備えて構成される装置の不具合に対する優位なルールを抽出できる。
また、他の一態様では、これら上述のルール抽出装置において、前記物は、所定のシステムを構成する複数の装置の中の1または複数であり、前記事象は、前記装置の不具合であることを特徴とする。
このようなルール抽出装置は、複数の装置を備えて構成されるシステムの不具合に対する優位なルールを抽出できる。
本発明の他の一態様にかかるルール抽出方法は、物に関わる所定の事象の成立を表す事象成立情報と前記物の使用開始から前記事象の成立までの累積使用量と対応付けた事象データを、1または複数の物について、かつ、互いに異なる複数の事象について、複数、事象データ記憶部に記憶する記憶工程と、時系列アソシエーション分析を用いることによって前記事象データ記憶部に記憶された複数の事象データに基づいてルール、確信度およびリフトを求める分析処理工程と、注目事象を入力部から受け付ける受付工程と、前記分析処理部で求められたルールの中から、前記受付工程で受け付けた注目事象を結論部に持つルールを抽出する第1抽出処理を行う第1抽出処理工程と、前記第1抽出処理工程で抽出されたルールの中から、前記分析処理工程で求められた確信度およびリフト値それぞれが所定の確信度閾値およびリフト閾値それぞれ以上のルールを抽出する第2抽出処理を行う第2抽出処理工程と、前記第2抽出処理工程で抽出されたルールの中から、前記累積使用量に基づいて所定の条件を満たすルールを抽出する第3抽出処理を行う第3抽出処理工程とを備えることを特徴とする。
このようなルール抽出方法は、時系列アソシエーション分析で求められたルールの中から、注目事象を結論部に持ち、確信度閾値以上の確信度を持ち、リフト閾値以上のリフト値を持つルールを抽出する。したがって、上記ルール抽出方法では、支持度にかかわらず、ルールが抽出される。そして、上記ルール抽出方法は、このように支持度にかかわらず抽出されたルールの中から、さらに、累積使用量に基づいて所定の条件を満たすルールを抽出する。このため、上記ルール抽出方法は、このように支持度にかかわらず抽出されたルールの中から、優位なルールを抽出できる。よって、上記ルール抽出方法は、支持度にかかわらず、優位なルールを抽出できる。
本発明の他の一態様にかかるルール抽出プログラムは、コンピュータを、物に関わる所定の事象の成立を表す事象成立情報と前記物の使用開始から前記事象の成立までの累積使用量と対応付けた事象データを、1または複数の物について、かつ、互いに異なる複数の事象について、複数、記憶する事象データ記憶部、時系列アソシエーション分析を用いることによって前記事象データ記憶部に記憶された複数の事象データに基づいてルール、確信度およびリフトを求める分析処理部、注目事象を入力するための入力部、前記分析処理部で求められたルールの中から、前記入力部で入力された注目事象を結論部に持つルールを抽出する第1抽出処理を行う第1抽出処理部、前記第1抽出処理部で抽出されたルールの中から、前記分析処理部で求められた確信度およびリフト値それぞれが所定の確信度閾値およびリフト閾値それぞれ以上のルールを抽出する第2抽出処理を行う第2抽出処理部、前記第2抽出処理部で抽出されたルールの中から、前記累積使用量に基づいて所定の条件を満たすルールを抽出する第3抽出処理を行う第3抽出処理部、として機能させるためのプログラムである。
このようなルール抽出プログラムは、支持度にかかわらず、優位なルールを抽出できる。
本発明にかかるルール抽出装置、ルール抽出方法およびルール抽出プログラムは、支持度にかかわらず、優位なルールを抽出できる。
実施形態におけるルール抽出装置の構成を示す図である。 図1に示すルール抽出装置の事象データ記憶部に記憶される事象データテーブルの構成を示す図である。 実施形態におけるルール抽出装置の動作を示すフローチャートである。 図1に示すルール抽出装置における分析処理部によって時系列アソシエーション分析で抽出される時系列アソシエーション・ルールの一例を説明するための図である。 図1に示すルール抽出装置における第2抽出処理部によって抽出されたルールに対する、直前事象の成立から注目事象の成立までの累積使用量(直前累積使用量)の一例を説明するための図である。 図1に示すルール抽出装置における第2抽出処理部によって抽出されたルールに対し作成された、直前事象の成立から注目事象の成立までの累積使用量(直前累積使用量)のヒストグラムの一例を示す図である。
以下、本発明にかかる実施の一形態を図面に基づいて説明する。なお、各図において同一の符号を付した構成は、同一の構成であることを示し、適宜、その説明を省略する。本明細書において、総称する場合には添え字を省略した参照符号で示し、個別の構成を指す場合には添え字を付した参照符号で示す。
図1は、実施形態におけるルール抽出装置の構成を示す図である。図2は、図1に示すルール抽出装置の事象データ記憶部に記憶される事象データテーブルの構成を示す図である。
実施形態におけるルール抽出装置は、複数の事象データに基づいて時系列アソシエーション分析を用いることによって事象間に見られるルールを抽出する装置である。このルール抽出装置Rは、例えば、図1に示すように、制御処理部1と、記憶部2と、入力部3と、出力部4と、インターフェース部(IF部)5とを備える。
入力部3は、制御処理部1に接続され、例えば、時系列アソシエーション・ルール(以下「ルール」と略記する。)の抽出開始を指示するコマンド等の各種コマンド、および、例えば注目事象等のルールを抽出する上で必要な各種データをルール抽出装置Rに入力する機器であり、例えば、所定の機能を割り付けられた複数の入力スイッチ、キーボードおよびマウス等である。注目事象は、後述の分析処理部12によって時系列アソシエーション分析で抽出されるルール(従来の時系列アソシエーション分析で抽出されるルール)の中から、求めたいルールの結論部の事象である。出力部4は、制御処理部1に接続され、制御処理部1の制御に従って、入力部3から入力されたコマンドやデータ、および、ルール抽出装置Rによって求められた支持度、確信度、リフト、ルールおよびヒストグラム等を出力する機器であり、例えばCRT(cathode ray tube)ディスプレイ、LCD(liquid crystal Display)および有機EL(electro luminescence)ディスプレイ等の表示装置やプリンタ等の印刷装置等である。
IF部5は、制御処理部1に接続され、制御処理部1の制御に従って、外部機器との間でデータの入出力を行う回路であり、例えば、シリアル通信方式であるRS−232Cのインターフェース回路、Bluetooth(登録商標)規格を用いたインターフェース回路、IrDA(Infrared Data Asscoiation)規格等の赤外線通信を行うインターフェース回路、および、USB(Universal Serial Bus)規格を用いたインターフェース回路等である。また例えば、IF部5は、所定の通信プロトコルに従って通信回線(ネットワーク)を介して外部機器との間で通信信号を送受信する通信インターフェース回路であっても良く、例えばLAN(Local Area Network)カードやデータ通信カード等であっても良い。
記憶部2は、制御処理部1に接続され、制御処理部1の制御に従って、各種の所定のプログラムおよび各種の所定のデータを記憶する回路である。前記各種の所定のプログラムには、例えば、ルール抽出装置Rの各部を当該各部の機能に応じてそれぞれ制御し当該ルール抽出装置R全体を制御する制御プログラムや、時系列アソシエーション分析を用いることによって、後述の事象データ記憶部21に記憶された複数の事象データに基づいてルール、確信度およびリフトを求める分析処理プログラムや、前記分析処理プログラムで求められたルールの中から、入力部3で入力された注目事象を結論部に持つルールを抽出する第1抽出処理プログラムや、前記第1抽出処理プログラムで抽出されたルールの中から、前記分析処理プログラムで求められた確信度およびリフト値それぞれが所定の確信度閾値および所定のリフト閾値それぞれ以上のルールを抽出する第2抽出処理プログラムや、前記第2抽出処理プログラムで抽出されたルールの中から、前記事象データにおける累積使用量に基づいて所定の条件を満たすルールを抽出する第3抽出処理プログラム等の制御処理プログラムが含まれる。なお、本実施形態では、前記分析処理プログラムは、支持度も求める。前記各種の所定のデータには、例えば事象データや、前記分析処理プログラムによって求められるルール、支持度、確信度およびリフトや、前記第1ないし第3抽出処理プログラムで抽出されるルール等の、前記各プログラムの実行に必要なデータや各処理結果のデータ等の、各データが含まれる。このような記憶部2は、例えば不揮発性の記憶素子であるROM(Read Only Memory)や書き換え可能な不揮発性の記憶素子であるEEPROM(Electrically Erasable Programmable Read Only Memory)等を備える。そして、記憶部2は、前記所定のプログラムの実行中に生じるデータ等を記憶するいわゆる制御処理部1のワーキングメモリとなるRAM(Random Access Memory)等を含む。
そして、記憶部2は、事象データ、前記分析処理プログラムによって求められるルール、支持度、確信度およびリフト、ならびに、前記第1ないし第3抽出処理プログラムで抽出されるルールそれぞれを記憶するために、事象データ記憶部21、ルール記憶部22および抽出ルール記憶部23を機能的に備える。
事象データ記憶部21は、前記事象データを記憶するものである。事象データは、所定の物に関わる所定の事象の成立を表す事象成立情報と前記物の使用開始から当該事象の成立までの累積使用量と対応付けたデータである。このような事象データは、1または複数の物について、かつ、互いに異なる複数の事象について、複数、事象データ記憶部21に記憶される。
前記物は、任意であって良く、求めたいルールに応じて適宜に予め設定される。例えば、所定の装置における不具合の発生に関するルールを求めたい場合、前記物は、前記所定の装置を構成する複数の部品の中の1または複数であり、前記事象は、前記部品の不具合であって良い。より具体的には、例えば、回転機における故障の発生に関するルールを求めたい場合、前記物は、前記回転機を構成する筐体、ロータ、ステータおよびコイル等であり、前記事象は、筐体に異常な振動、ロータの異常な高速回転、ステータの異常な高温、および、コイルの短絡等であり、前記事象成立情報は、筐体に異常な振動(例えば予め設定された閾値以上の大きな振幅の振動等)が発生したこと、ロータの回転が異常な高速回転(例えば予め設定された閾値以上の回転速度等)になったこと、ステータが異常な高温(例えば予め設定された閾値以上の温度等)になったこと、および、コイルが短絡したこと等である。また例えば、建設機械(建機)における故障の発生に関するルールを求めたい場合、前記物は、前記建機を構成する下部走行体、アッパーフレーム、キャブ室、エンジン、作業アタッチメント、油圧ポンプ、油圧配管、燃料タンク、バッテリおよびワイヤーハーネス等であり、前記事象は、キャブ室の異常な振動、エンジンの異常なブースト圧、エンジンの異常な冷却水温、油圧ポンプの異常な吐出量、油圧配管の異常な油圧、燃料消費量(あるいは燃料噴射量)の異常な増加、バッテリの取り外し、および、ワイヤーハーネスの断線等であり、前記事象成立情報は、キャブ室が異常な振動(例えば予め設定された閾値以上の振動)になったこと、エンジンのブースト圧が異常な低下(例えば予め設定された閾値以下の圧力)になったこと、エンジンの冷却水温が異常な高温(例えば予め設定された閾値以上の温度等)になったこと、油圧ポンプの吐出量が異常な増加または減少(例えば予め設定された閾値以上または以下の吐出量等)になったこと、油圧配管の油圧が異常な油圧(例えば予め設定された閾値以下の油圧等)になったこと、燃料消費量(あるいは燃料噴射量)が予め設定されたレベルに達したこと、バッテリが取り外されたこと、および、ワイヤーハーネスが断線したこと等である。
また例えば、前記物は、所定のシステムを構成する複数の装置の中の1または複数であり、前記事象は、前記装置の不具合であってあって良い。より具体的には、例えば、火力発電システムにおける不具合の発生に関するルールを求めたい場合、前記物は、前記火力発電システムを構成する燃料供給系統、燃焼系統、冷却系統、ボイラ系統、タービン系統、排ガス処理系統、排水処理系統、および電気系統等であり、前記事象は、燃料成分の異常な変動、燃焼温度の異常な変動、冷却水温の異常な上昇、ボイラ発生蒸気量の異常な変動、タービンの異常な効率低下や振動、排ガス処理フィルタの異常な差圧変動、排水処理装置の異常な効率低下、電気系統の地絡、電気系統の断線、電力系統の異常な電流等であり、前記事象成立情報は、燃料中の特性成分(例えば水分)の比率が異常な値(例えば予め設定された閾値以上の値等)になったこと、燃焼炉内の温度変化が異常な値(例えば予め設定された閾値以上の変化量等)になったこと、冷却水温の出側温度が入側温度に比べて異常な高温(例えば予め設定された閾値以上の温度等)になったこと、ボイラ発生蒸気量の変化が異常な量(例えば予め設定された閾値以上の変化量等)になったこと、タービンの効率低下幅や振動が異常な量(例えば予め設定された閾値以上の大きな低下幅や振幅の振動等)が発生したこと、排水処理装置の効率低下が異常な量(例えば予め設定された閾値以上の低下幅等)になったこと、電気系統が地絡したこと、電気系統が断線したこと、電力系統に異常な電流(例えば予め設定された閾値以上の電流値の電流等)が流れたこと等である。
このような事象データは、本実施形態では、テーブル形式で事象データ記憶部21に記憶されている。この事象データを登録する事象データテーブルTBは、例えば、図2に示すように、当該事象データテーブルTBにおける各レコードのシリアル番号を登録する番号フィールド211と、前記物を備える装置やシステムを特定し識別するための個体識別子(個体ID)を登録するIDフィールド212と、当該レコードにおけるIDフィールド212に登録された個体IDを持つ前記装置やシステムの事象成立情報を登録する事象フィールド213と、当該レコードにおけるIDフィールド212に登録された個体IDを持つ前記装置やシステムにおいて、使用開始から、当該レコードにおける事象フィールド213に登録された事象の成立までの累積使用量を登録する累積使用量フィールド214とを備え、複数の事象データごとにレコードを備える。
前記累積使用量は、前記物、前記物を含む装置および前記物を含むシステムの種類に応じて適宜な単位で計量される。例えば、前記累積使用量は、前記物、前記物を含む装置および前記物を含むシステムの使用時間(稼働時間)で計量され、累積使用時間(累積稼働時間)であって良い。また例えば、前記物、前記物を含む装置および前記物を含むシステムが動くものである場合、前記累積使用量は、累積移動量(累積走行距離等)であって良い。
事象データは、ルールを抽出する前に、事象データ記憶部21に予め記憶される。事象データは、例えば、入力部3から入力される。また例えば、事象データは、事象データを管理するサーバコンピュータから通信回線およびIF部5を介して入力される。また例えば、事象データは、事象データを記録(記憶)する媒体からIF部5を介して入力される。また例えば、事象データは、例えば振動センサ、温度センサ、回転速度計、油圧計、水量計および流量計等のセンサ(検出器)から通信回線およびIF部5を介して入力されても良い。
ルール記憶部22は、後述の分析処理部12によって求められたルール、支持度、確信度およびリフトを互いに対応付けて記憶するものである。
抽出ルール記憶部23は、後述の第1ないし第3抽出処理部13〜15それぞれで抽出された各ルールそれぞれを記憶するものである。
制御処理部1は、ルール抽出装置Rの各部を当該各部の機能に応じてそれぞれ制御し、所望のルールを求めるための回路である。制御処理部1は、例えば、CPU(Central Processing Unit)およびその周辺回路を備えて構成される。制御処理部1には、制御処理プログラムが実行されることによって、制御部11、分析処理部12、第1抽出処理部13、第2抽出処理部14および第3抽出処理部15が機能的に構成される。
制御部11は、ルール抽出装置Rの各部を当該各部の機能に応じてそれぞれ制御し当該ルール抽出装置Rの全体制御を司るものである。
分析処理部12は、時系列アソシエーション分析を用いることによって、事象データ記憶部21に記憶された複数の事象データに基づいてルール、支持度、確信度およびリフトを求めるものである。分析処理部12は、これら求めたルール、支持度、確信度およびリフトを互いに対応付けてルール記憶部22に記憶する。
前記時系列アソシエーション分析には、いくつかのアルゴリズムが知られている。その第1のアルゴリズムは、GSP Algorithmであり、例えばRamakrishnan Srikant and Rakesh Agrawel, mining Sequential Patterns:Generalization and Performance Improvements,In EDBT 1996,1996.に開示されている。その第2のアルゴリズムは、SPADEであり、例えばMohammed J.Zaki,SPADE:An Efficient Algorithm for Mining Frequenct Sequence,Machine Learning,42,2001.に開示されている。第3のアルゴリズムは、FreeSpanであり、例えば、Jiawei Han,Jian Pei,Behzad Mortazavi−Asl,Qiming Chen,Umeshwar Dayal and Mei−Chun Hsu,FreeSpan:Frequent Pattern−Projected Sequential Pattern Mining,In Proc.2000 Int.Conf.KDD,2000.に開示されている。第4のアルゴリズムは、PrefixSpanであり、例えば、Jian Pei,Jiawei Han,Behzad Mortazavi−Asl,and Helen Pinto,PerfixSpan:Mining Sequential Patterns Efficiently by Prefix−Projected Pattern Growth.In ICDE 2001,2001.に開示されている。一例として、本実施形態では、株式会社NTTデータ数理システム製のVisual Mining Studio(VMS)によって、分析処理部12が構成される。
第1抽出処理部13は、分析処理部12で求められたルールの中から、入力部3で入力された注目事象を結論部に持つルールを抽出する第1抽出処理を行うものである。第1抽出処理部13は、この抽出したルールを、第1抽出処理で抽出されたルールとして、抽出ルール記憶部23に記憶する。
第2抽出処理部14は、第1抽出処理部13で抽出されたルールの中から、分析処理部12で求められた確信度およびリフト値それぞれが所定の確信度閾値および所定のリフト閾値それぞれ以上のルールを抽出する第2抽出処理を行うものである。第2抽出処理部14は、この抽出したルールを、第2抽出処理で抽出されたルールとして、抽出ルール記憶部23に記憶する。確信度は、上述したように、事象間の結びつきの強さを表しており、確信度閾値は、求めたいルールにおいて、事象間の結びつきに求められる所望の強さ応じて適宜に予め設定される。確信度閾値は、例えば、0.1(=10%)や0.2(=20%)や0.3(=30%)等に設定される。リフトは、上述したように、確信度を評価する指標であり、1が基準値となる。リフト閾値は、求めたいルールにおいて、条件部に対して結論部(注目事象)に求められる依存の程度に応じて適宜に予め設定される。リフト閾値は、1より大きな値、例えば、1.5や2や2.5等に設定される。
第3抽出処理部15は、第2抽出処理分14で抽出されたルールの中から、事象データにおける累積使用量に基づいて所定の条件を満たすルールを抽出する第3抽出処理を行うものである。第3抽出処理部15は、この抽出したルールを、第3抽出処理で抽出されたルールとして、抽出ルール記憶部23に記憶する。より具体的には、例えば、本実施形態では、ルールにおける注目事象の1つ前の事象を直前事象とする場合に、第3抽出処理部15は、第2抽出処理部14で抽出されたルールに対し、直前事象の成立から注目事象の成立までの累積使用量のヒストグラムを作成し、この作成されたヒストグラムの標準偏差σまたは前記標準偏差の定数倍a×σが所定の標準偏差閾値以下であるルールを抽出する処理を前記第3抽出処理として行う。直前事象の成立から注目事象の成立までの累積使用量のヒストグラムにおける標準偏差が小さいことは、直前事象の成立から、その累積使用量後に、注目事象が相対的に高い割合で成立していることを意味している。このため、標準偏差閾値は、求めたいルールにおいて、直前事象と注目事象との間に求められる因果関係の程度に応じて適宜に予め設定される。標準偏差閾値は、例えば、1時間や20時間や50時間等に設定される。直前事象が発生してから注目事象が発生するまでの時間が比較的短時間であり、かつ、因果関係が強く、それらの時間が想定できる場合には小さな値に設定される。また、直前事象が発生してから、注目事象が発生するか否かが確率的なものであり、それらの時間のばらつきも大きい場合には、標準偏差閾値は大きな値に設定される。
このようなルール抽出装置Rは、例えば、デスクトップ型やノート型等のコンピュータによって構成可能である。
次に、本実施形態の動作について説明する。図3は、実施形態におけるルール抽出装置の動作を示すフローチャートである。図4は、図1に示すルール抽出装置における分析処理部によって時系列アソシエーション分析で抽出される時系列アソシエーション・ルールの一例を説明するための図である。図5は、図1に示すルール抽出装置における第2抽出処理部によって抽出されたルールに対する、直前事象の成立から注目事象の成立までの累積使用量(直前累積使用量)の一例を説明するための図である。図6は、図1に示すルール抽出装置における第2抽出処理部によって抽出されたルールに対し作成された、直前事象の成立から注目事象の成立までの累積使用量(直前累積使用量)のヒストグラムの一例を示す図である。図6Aは、ルール;{AかつBかつC}⇒{D}({A→B→C}⇒{D})のヒストグラムを示し、図6Bは、ルール;{AかつC}⇒{D}({A→C}⇒{D})のヒストグラムを示す。
このようなルール抽出装置Rでは、図略の電源スイッチの操作によって電源が投入されると、必要な各部の初期化を実行し、その稼働を始め、その制御処理プログラムの実行によって、制御処理部1には、制御部11、分析処理部12、第1抽出処理部13、第2抽出処理部14および第3抽出処理部15が機能的に構成される。
記憶部2の事象データ記憶部21に事象データが記憶され、ユーザ(オペレータ)によって、入力部3からルール抽出開始のコマンドが入力され、入力部3から注目事象が入力されると(注目事象が受け付けられると)(S1)、分析処理部12は、時系列アソシエーション分析を用いることによって、事象データ記憶部21に記憶された複数の事象データに基づいてルール、支持度、確信度およびリフトを求める分析処理を行い、この求めたルール、支持度、確信度およびリフトをルール記憶部22に記憶する(S2)。
例えば、図4に示すように、事象データ記憶部21に記憶された複数の事象データにおいて、時系列アソシエーション分析によって、或る個体IDの共通な複数の事象データに基づき、A事象、或る事象、B事象、C事象、他の事象、および、さらに他の事象が順次に成立した後にD事象の成立や、他の個体IDの共通な複数の事象データに基づき、A事象、B事象、さらに他の事象、C事象、および、さらに他の事象が順次に成立した後にD事象の成立や、さらに他の個体IDの共通な複数の事象データに基づき、A事象、さらに他の事象、さらに他の事象、さらに他の事象、B事象、および、C事象が順次に成立した後にD事象の成立等が見つけられた場合、ルールとして{AかつBかつC}⇒{D}({A→B→C}⇒{D})が抽出される。そして、このルールに対する支持度、確信度およびリフトが求められる。このように本実施形態では、例えば、装置やシステムにおける不具合の発生に関するルールを求めるために、個々の個体IDごとに、すなわち、個々の装置ごとや個々のシステムごとに、各事象の成立を時系列に並べた時系列アソシエーション分析が実施され、ルールが抽出される。
この分析処理S2によって、事象データ記憶部21に記憶された複数の事象データの個数に依るが、通常、複数のルールが抽出され、これら複数のルールそれぞれに対し、その支持度、信頼度およびリフトが求められる。
次に、第1抽出処理部13は、分析処理部12で求められたルールの中から、入力部3で入力された注目事象を結論部に持つルールを抽出する第1抽出処理を行い、この抽出したルールを、第1抽出処理で抽出されたルールとして、抽出ルール記憶部23に記憶する(S3)。
例えば、分析処理S2で、{A}⇒{B}、{C}⇒{D}、{AかつC}⇒{D}({A→C}⇒{D})、{BかつC}⇒{D}({B→C}⇒{D})、{AかつBかつC}⇒{D}({A→B→C}⇒{D})、{AかつB}⇒{E}({A→B}⇒{E})、{CかつD}⇒{E}({C→D}⇒{E})、{H}⇒{L}、{GかつI}⇒{K}({G→I}⇒{K})、{GかつHかつJ}⇒{K}({G→H→J}⇒{K})等のルールが求められ、処理S1で受け付けられた注目事象がD事象である場合、この第1抽出処理S3によって、{C}⇒{D}、{AかつC}⇒{D}({A→C}⇒{D})、{BかつC}⇒{D}({B→C}⇒{D})および{AかつBかつC}⇒{D}}({A→B→C}⇒{D})の4個のルールが抽出され、これら4個のルールが、第1抽出処理で抽出されたルールとして、その支持度、確信度およびリフトとともに、抽出ルール記憶部23に記憶される。
次に、第2抽出処理部14は、第1抽出処理部13で抽出されたルールの中から、分析処理部12で求められた確信度およびリフト値それぞれが前記確信度閾値および前記リフト閾値それぞれ以上のルールを抽出する第2抽出処理を行い、この抽出したルールを、第2抽出処理で抽出されたルールとして、抽出ルール記憶部23に記憶する(S4)。
例えば、上述の例では、第1抽出処理S3によって抽出された4個のルール;{C}⇒{D}、{AかつC}⇒{D}、{BかつC}⇒{D}および{AかつBかつC}⇒{D}}それぞれについて、その確信度およびリフト値それぞれが前記確信度閾値および前記リフト閾値それぞれ以上のルールであるか否かが判定される。この判定の結果、ルール;{C}⇒{D}の確信度およびリフト値それぞれが前記確信度閾値および前記リフト閾値それぞれ以上ではなく、ルール;{AかつC}⇒{D}の確信度およびリフト値それぞれが前記確信度閾値および前記リフト閾値それぞれ以上であり、ルール;{BかつC}⇒{D}の確信度およびリフト値それぞれが前記確信度閾値および前記リフト閾値それぞれ以上ではなく、ルール;{AかつBかつC}⇒{D}の確信度およびリフト値それぞれが前記確信度閾値および前記リフト閾値それぞれ以上である場合、これら2個のルール;{AかつC}⇒{D}、{AかつBかつC}⇒{D}が抽出される。そして、これら2個のルール;{AかつC}⇒{D}、{AかつBかつC}⇒{D}が、第2抽出処理で抽出されたルールとして、その支持度、確信度およびリフトとともに、抽出ルール記憶部23に記憶される。
次に、第3抽出処理部15は、第2抽出処理分14で抽出されたルールの中から、事象データにおける累積使用量に基づいて所定の条件を満たすルールを抽出する第3抽出処理を行い、この抽出したルールを、第3抽出処理で抽出されたルールとして、抽出ルール記憶部23に記憶する(S5)。より具体的には、第3抽出処理部15は、第2抽出処理部14で抽出されたルールに対し、直前事象の成立から注目事象の成立までの累積使用量のヒストグラムを作成し、この作成されたヒストグラムの標準偏差σまたは前記標準偏差の定数倍a×σが所定の標準偏差閾値以下であるルールを抽出する処理を前記第3抽出処理として行う。
例えば、上述の例において、ルール;{AかつBかつC}⇒{D}の場合、注目事象がD事象であり、その直前事象がC事象であるので、第3抽出処理部15は、事象データ記憶部21に記憶され、ルール;{AかつBかつC}⇒{D}を満たす事象データから、個々の個体IDごとに、C事象(=直前事象)の成立からD事象(=注目事象)の成立までの累積使用量(直前累積使用量)を求め、記憶部2に記憶する。例えば、図5に示す個体IDと直前累積使用量とを対応付けた直前累積使用量テーブルHTが作成され、記憶部2に記憶される。次に、第3抽出処理部15は、これら個体IDごとに求めたC事象(=直前事象)の成立からD事象(=注目事象)の成立までの累積使用量(直前累積使用量)のヒストグラムを作成する。これによって例えば、図6Aに示すヒストグラムが作成される。次に、第3抽出処理部15は、このヒストグラムの標準偏差σを求める。そして、第3抽出処理部15は、この求めた標準偏差σまたは前記標準偏差の定数倍a×σが所定の標準偏差閾値以下であるか否かを判定する。ルール;{AかつC}⇒{D}の場合も同様に処理が実行され、例えば、図6Bに示すヒストグラムが作成され、このヒストグラムの標準偏差σが求められ、この求めた標準偏差σまたは前記標準偏差の定数倍a×σが所定の標準偏差閾値以下であるか否かが、判定される。
この判定の結果、この求めた標準偏差σまたは前記標準偏差の定数倍a×σが所定の標準偏差閾値以下である場合には、第3抽出処理部15は、このヒストグラムのルールを、ルールとして抽出し、一方、この求めた標準偏差σまたは前記標準偏差の定数倍a×σが所定の標準偏差閾値以下ではない場合には、第3抽出処理部15は、このヒストグラムのルールを、ルールとして抽出しない。例えば、上述の例では、図6Aに示すルール;{AかつBかつC}⇒{D}のヒストグラムは、比較的急峻なピークを持ち、このヒストグラムにおける標準偏差σが所定の標準偏差閾値以下である一方、図6Bに示すルール;{AかつC}⇒{D}のヒストグラム、比較的緩やかなピークを持ち、このヒストグラムにおける標準偏差σが所定の標準偏差閾値以下ではない場合、ルール;{AかつBかつC}⇒{D}が第3抽出処理による処理結果のルールとして抽出される。
なお、ヒストグラムの標準偏差を求める場合において、棒グラフで表されたヒストグラムは、公知の常套手法によって、曲線で表されても良い。例えば、棒グラフで表されたヒストグラムの総面積を維持しつつ、階級の各区間における中央点にフィッティングする曲線を求めることによって、曲線で表されたヒストグラムが求められる。
そして、制御処理部1は、制御部11によって、第3抽出処理部15によって抽出されたルールを出力部4に出力する(S6)。なお、制御処理部1は、第3抽出処理部15によって抽出されたルールを、必要に応じてIF部5を介して外部の機器へ出力しても良い。
以上説明したように、本実施形態におけるルール抽出装置R、これに実装されたルール抽出方法およびルール抽出プログラムは、時系列アソシエーション分析で求められたルールの中から、注目事象を結論部に持ち、確信度閾値以上の確信度を持ち、リフト閾値以上のリフト値を持つルールを抽出する。したがって、上記ルール抽出装置R、ルール抽出方法およびルール抽出プログラムでは、支持度にかかわらず、ルールが抽出される。そして、上記ルール抽出装置R、ルール抽出方法およびルール抽出プログラムは、このように支持度にかかわらず抽出されたルールの中から、さらに、累積使用量に基づいて所定の条件を満たすルールを抽出する。累積使用量が所定の条件を満たすルールは、条件部と結論部との間に、一定の関連性のあるルールと考えられる。このため、上記ルール抽出装置R、ルール抽出方法およびルール抽出プログラムは、このように支持度にかかわらず抽出されたルールの中から、優位なルールを抽出できる。よって、上記ルール抽出装置R、ルール抽出方法およびルール抽出プログラムは、支持度にかかわらず、優位なルールを抽出できる。
また、上記ルール抽出装置R、ルール抽出方法およびルール抽出プログラムは、上述のように作成されたヒストグラムの標準偏差σまたは前記標準偏差の定数倍a×σが標準偏差閾値以下であるルールを抽出することで、優位なルールを効果的に抽出できる。
また、前記物が、所定の装置を構成する複数の部品の中の1または複数であり、前記事象が、前記部品の不具合である場合に、上記ルール抽出装置R、ルール抽出方法およびルール抽出プログラムは、複数の部品を備えて構成される装置の不具合に対する優位なルールを抽出できる。
また、前記物が、所定のシステムを構成する複数の装置の中の1または複数であり、前記事象が、前記装置の不具合である場合に、上記ルール抽出装置R、ルール抽出方法およびルール抽出プログラムは、複数の装置を備えて構成されるシステムの不具合に対する優位なルールを抽出できる。
なお、上述の実施形態において、第3抽出処理部15は、第2抽出処理部14で抽出されたルールに対し、直前事象の成立から注目事象の成立までの累積使用量の平均値を求め、この求められた平均値が所定の時間閾値以下であるルールをさらに抽出しても良い。直前事象の成立から注目事象の成立までの累積使用量が比較的大きい場合、注目事象と直前事象との関連性が薄いと考えられる。このため、このようなルール抽出装置R、ルール抽出方法およびルール抽出プログラムは、前記求められた平均値が所定の時間閾値以下であるルールをさらに抽出することで、前記求められた平均値が所定の時間閾値を越えるルールを除くことができるから、注目事象と直前事象との関連性が薄いルールを除くことができ、優位なルールをより効果的に抽出できる。
また、上述の実施形態において、第2抽出処理部14は、第1抽出処理部13で抽出されたルールの中から、分析処理部12で求められた支持度が所定の支持度閾値以上のルールを抽出し、前記抽出されたルールの中から、分析処理部12で求められた確信度およびリフト値それぞれが所定の確信度閾値およびリフト閾値それぞれ以上のルールを抽出する処理を前記第2抽出処理として行っても良い。このようなルール抽出装置R、ルール抽出方法およびルール抽出プログラムは、支持度も考慮してルールを効果的に抽出できる。
また、上述の実施形態において、第3抽出処理部15は、第2抽出処理部14で抽出されたルールに対し、当該ルールを分析処理部12で求める基になった事象データの個数Nに対する、当該ルールを分析処理部12で求める基になった事象データのうちの、前記直前事象の成立から前記注目事象の成立までの累積使用量が所定の範囲内である事象データの個数k1の比k1/Nが、予め設定された所定の比閾値(第1比閾値)以上であるルールをさらに抽出しても良い。例えば、第2抽出処理部14の第2抽出処理で抽出されたルール;{AかつC}⇒{D}を分析処理部12で求める基になった事象データの個数がN個であって、これらN個の事象データのうちの、事象Cが成立した時点の累積使用量と事象Dが成立した時点の累積使用量との差の絶対値が、予め設定された上下限値内に入っている事象データの個数がk1個である場合に、比k1/Nが、前記第1比閾値以上である場合、このルール;{AかつC}⇒{D}が抽出される。また、上述の実施形態において、第3抽出処理部15は、第2抽出処理部14で抽出されたルールに対し、当該ルールを分析処理部12で求める基になった事象データの個数Nに対する、当該ルールを分析処理部12で求める基になった事象データのうちの、前記直前事象の成立から前記注目事象の成立までの累積使用量が、予め設定された所定の第2範囲内である事象データの個数k2の比k2/Nに、当該ルールの支持度を乗じた乗算結果(=(k2/N)×(支持度))が、予め設定された所定の第2比閾値以上であるルールをさらに抽出しても良い。また、上述の実施形態において、第3抽出処理部15は、第2抽出処理部14で抽出されたルールに対し、当該ルールを分析処理部12で求める基になった事象データの個数Nに対する、当該ルールを分析処理部12で求める基になった事象データのうちの、前記直前事象の成立から前記注目事象の成立までの累積使用量が所定の第3範囲内である事象データの個数k3の比k3/Nに、当該ルールの確信度を乗じた第2乗算結果(=(k3/N)×(確信度))が、予め設定された所定の第3比閾値以上であるルールをさらに抽出しても良い。また、上述の実施形態において、第3抽出処理部15は、第2抽出処理部14で抽出されたルールに対し、当該ルールを分析処理部12で求める基になった事象データの個数をNとし、前記N個の事象データのうちの、予め設定された所定のJ個の事象データにおける前記直前事象の成立から前記注目事象の成立までの累積使用量のヒストグラムにおける標準偏差をσとする場合に、J/Nが予め設定された所定の第4比閾値以上であって、かつ、σが予め設定された所定の第2標準偏差閾値以下であるルールをさらに抽出しても良い。また、上述の実施形態において、第3抽出処理部15は、第2抽出処理部14で抽出されたルールに対し、J/Nに当該ルールの確信度を乗じた第3乗算結果が、予め設定された所定の第5比閾値以上であって、かつ、σが予め設定された所定の第2標準偏差閾値以下であるルールをさらに抽出しても良い。また、上述の実施形態において、第3抽出処理部15は、第2抽出処理部14で抽出されたルールに対し、J/Nに当該ルールの支持度を乗じた第4乗算結果が、予め設定された所定の第6比閾値以上であって、かつ、σが予め設定された所定の第3標準偏差閾値以下であるルールをさらに抽出しても良い。このようなルール抽出装置R[は、事象データに含まれるノイズ(外乱)を除外できるので、より精度良くルールを抽出できる。
また、上述では、ヒストグラムが作成されてから標準偏差や平均値等が求められたが、ヒストグラムを作成する元データから、ヒストグラムを作成せずに、これら標準偏差や平均値等が求められても良い。
本発明を表現するために、上述において図面を参照しながら実施形態を通して本発明を適切且つ十分に説明したが、当業者であれば上述の実施形態を変更および/または改良することは容易に為し得ることであると認識すべきである。したがって、当業者が実施する変更形態または改良形態が、請求の範囲に記載された請求項の権利範囲を離脱するレベルのものでない限り、当該変更形態または当該改良形態は、当該請求項の権利範囲に包括されると解釈される。
R ルール抽出装置
1 制御処理部
2 記憶部
3 入力部
4 出力部
12 分析処理部
13 第1抽出処理部
14 第2抽出処理部
15 第3抽出処理部
21 事象データ記憶部
22 ルール記憶部
23 抽出ルール記憶部

Claims (13)

  1. 物に関わる所定の事象の成立を表す事象成立情報と前記物の使用開始から当該事象の成立までの累積使用量と対応付けた事象データを、1または複数の物について、かつ、互いに異なる複数の事象について、複数、記憶する事象データ記憶部と、
    時系列アソシエーション分析を用いることによって前記事象データ記憶部に記憶された複数の事象データに基づいてルール、確信度およびリフトを求める分析処理部と、
    注目事象を入力するための入力部と、
    前記分析処理部で求められたルールの中から、前記入力部で入力された注目事象を結論部に持つルールを抽出する第1抽出処理を行う第1抽出処理部と、
    前記第1抽出処理部で抽出されたルールの中から、前記分析処理部で求められた確信度およびリフト値それぞれが所定の確信度閾値およびリフト閾値それぞれ以上のルールを抽出する第2抽出処理を行う第2抽出処理部と、
    前記第2抽出処理部で抽出されたルールの中から、前記累積使用量に基づいて所定の条件を満たすルールを抽出する第3抽出処理を行う第3抽出処理部とを備えること
    を特徴とするルール抽出装置。
  2. 前記ルールにおける前記注目事象の1つ前の事象を直前事象とする場合に、
    前記第3抽出処理部は、前記第2抽出処理部で抽出されたルールに対し、前記直前事象の成立から前記注目事象の成立までの累積使用量のヒストグラムにおける標準偏差または前記標準偏差の定数倍が所定の標準偏差閾値以下であるルールを抽出する処理を前記第3抽出処理として行うこと
    を特徴とする請求項1に記載のルール抽出装置。
  3. 前記第3抽出処理部は、前記第2抽出処理部で抽出されたルールに対し、前記直前事象の成立から前記注目事象の成立までの累積使用量の平均値を求め、前記求められた平均値が所定の時間閾値以下であるルールをさらに抽出すること
    を特徴とする請求項2に記載のルール抽出装置。
  4. 前記第3抽出処理部は、前記第2抽出処理部で抽出されたルールに対し、当該ルールを前記分析処理部で求める基になった事象データの個数に対する、当該ルールを前記分析処理部で求める基になった事象データのうちの、前記直前事象の成立から前記注目事象の成立までの累積使用量が所定の範囲内である事象データの個数の比が、所定の比閾値以上であるルールをさらに抽出すること
    を特徴とする請求項2または請求項3に記載のルール抽出装置。
  5. 前記分析処理部は、さらに、時系列アソシエーション分析の支持度を求め、
    前記第3抽出処理部は、前記第2抽出処理部で抽出されたルールに対し、当該ルールを前記分析処理部で求める基になった事象データの個数に対する、当該ルールを前記分析処理部で求める基になった事象データのうちの、前記直前事象の成立から前記注目事象の成立までの累積使用量が所定の第2範囲内である事象データの個数の比に、当該ルールの支持度を乗じた乗算結果が、所定の第2比閾値以上であるルールをさらに抽出すること
    を特徴とする請求項2または請求項3に記載のルール抽出装置。
  6. 前記第3抽出処理部は、前記第2抽出処理部で抽出されたルールに対し、当該ルールを前記分析処理部で求める基になった事象データの個数に対する、当該ルールを前記分析処理部で求める基になった事象データのうちの、前記直前事象の成立から前記注目事象の成立までの累積使用量が所定の第3範囲内である事象データの個数の比に、当該ルールの確信度を乗じた第2乗算結果が、所定の第3比閾値以上であるルールをさらに抽出すること
    を特徴とする請求項2または請求項3に記載のルール抽出装置。
  7. 前記第3抽出処理部は、前記第2抽出処理部で抽出されたルールに対し、当該ルールを前記分析処理部で求める基になった事象データの個数をNとし、前記N個の事象データのうちのJ個の事象データにおける前記直前事象の成立から前記注目事象の成立までの累積使用量のヒストグラムにおける標準偏差をσとする場合に、J/Nが所定の第4比閾値以上であって、かつ、σが所定の第2標準偏差閾値以下であるルール、または、J/Nに当該ルールの確信度を乗じた第3乗算結果が、所定の第5比閾値以上であって、かつ、σが所定の第2標準偏差閾値以下であるルールをさらに抽出すること
    を特徴とする請求項2または請求項3に記載のルール抽出装置。
  8. 前記分析処理部は、さらに、時系列アソシエーション分析の支持度を求め、
    前記第3抽出処理部は、前記第2抽出処理部で抽出されたルールに対し、当該ルールを前記分析処理部で求める基になった事象データの個数をNとし、前記N個の事象データのうちのJ個の事象データにおける前記直前事象の成立から前記注目事象の成立までの累積使用量のヒストグラムにおける標準偏差をσとする場合に、J/Nに当該ルールの支持度を乗じた第4乗算結果が、所定の第6比閾値以上であって、かつ、σが所定の第3標準偏差閾値以下であるルールをさらに抽出すること
    を特徴とする請求項2または請求項3に記載のルール抽出装置。
  9. 前記分析処理部は、さらに、時系列アソシエーション分析の支持度を求め、
    前記第2抽出処理部は、前記第1抽出処理部で抽出されたルールの中から、前記分析処理部で求められた支持度が所定の支持度閾値以上のルールを抽出し、前記抽出されたルールの中から、前記分析処理部で求められた確信度およびリフト値それぞれが所定の確信度閾値およびリフト閾値それぞれ以上のルールを抽出する処理を前記第2抽出処理として行うこと
    を特徴とする請求項1ないし請求項8のいずれか1項に記載のルール抽出装置。
  10. 前記物は、所定の装置を構成する複数の部品の中の1または複数であり、
    前記事象は、前記部品の不具合であること
    を特徴とする請求項1ないし請求項9のいずれか1項に記載のルール抽出装置。
  11. 前記物は、所定のシステムを構成する複数の装置の中の1または複数であり、
    前記事象は、前記装置の不具合であること
    を特徴とする請求項1ないし請求項9のいずれか1項に記載のルール抽出装置。
  12. 物に関わる所定の事象の成立を表す事象成立情報と前記物の使用開始から当該事象の成立までの累積使用量と対応付けた事象データを、1または複数の物について、かつ、互いに異なる複数の事象について、複数、事象データ記憶部に記憶する記憶工程と、
    時系列アソシエーション分析を用いることによって前記事象データ記憶部に記憶された複数の事象データに基づいてルール、確信度およびリフトを求める分析処理工程と、
    注目事象を入力部から受け付ける受付工程と、
    前記分析処理部で求められたルールの中から、前記受付工程で受け付けた注目事象を結論部に持つルールを抽出する第1抽出処理を行う第1抽出処理工程と、
    前記第1抽出処理工程で抽出されたルールの中から、前記分析処理工程で求められた確信度およびリフト値それぞれが所定の確信度閾値およびリフト閾値それぞれ以上のルールを抽出する第2抽出処理を行う第2抽出処理工程と、
    前記第2抽出処理工程で抽出されたルールの中から、前記累積使用量に基づいて所定の条件を満たすルールを抽出する第3抽出処理を行う第3抽出処理工程とを備えること
    を特徴とするルール抽出方法。
  13. コンピュータを、
    物に関わる所定の事象の成立を表す事象成立情報と前記物の使用開始から当該事象の成立までの累積使用量と対応付けた事象データを、1または複数の物について、かつ、互いに異なる複数の事象について、複数、記憶する事象データ記憶部、
    時系列アソシエーション分析を用いることによって前記事象データ記憶部に記憶された複数の事象データに基づいてルール、確信度およびリフトを求める分析処理部、
    注目事象を入力するための入力部、
    前記分析処理部で求められたルールの中から、前記入力部で入力された注目事象を結論部に持つルールを抽出する第1抽出処理を行う第1抽出処理部、
    前記第1抽出処理部で抽出されたルールの中から、前記分析処理部で求められた確信度およびリフト値それぞれが所定の確信度閾値およびリフト閾値それぞれ以上のルールを抽出する第2抽出処理を行う第2抽出処理部、
    前記第2抽出処理部で抽出されたルールの中から、前記累積使用量に基づいて所定の条件を満たすルールを抽出する第3抽出処理を行う第3抽出処理部、
    として機能させるためのルール抽出プログラム。
JP2016067320A 2016-03-30 2016-03-30 ルール抽出装置、該方法および該プログラム Expired - Fee Related JP6698401B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2016067320A JP6698401B2 (ja) 2016-03-30 2016-03-30 ルール抽出装置、該方法および該プログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2016067320A JP6698401B2 (ja) 2016-03-30 2016-03-30 ルール抽出装置、該方法および該プログラム

Publications (2)

Publication Number Publication Date
JP2017182378A true JP2017182378A (ja) 2017-10-05
JP6698401B2 JP6698401B2 (ja) 2020-05-27

Family

ID=60007358

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2016067320A Expired - Fee Related JP6698401B2 (ja) 2016-03-30 2016-03-30 ルール抽出装置、該方法および該プログラム

Country Status (1)

Country Link
JP (1) JP6698401B2 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP7439963B2 (ja) 2018-12-12 2024-02-28 株式会社オートネットワーク技術研究所 判定装置、判定プログラム、判定方法及びニューラルネットワークモデルの生成方法

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2013029987A (ja) * 2011-07-28 2013-02-07 Fuji Xerox Co Ltd 監視システム、プログラム
JP2013092981A (ja) * 2011-10-27 2013-05-16 Kddi Corp ソフトウェア検知ルール生成装置、ソフトウェア検知ルール生成方法およびソフトウェア検知ルール生成プログラム

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2013029987A (ja) * 2011-07-28 2013-02-07 Fuji Xerox Co Ltd 監視システム、プログラム
JP2013092981A (ja) * 2011-10-27 2013-05-16 Kddi Corp ソフトウェア検知ルール生成装置、ソフトウェア検知ルール生成方法およびソフトウェア検知ルール生成プログラム

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP7439963B2 (ja) 2018-12-12 2024-02-28 株式会社オートネットワーク技術研究所 判定装置、判定プログラム、判定方法及びニューラルネットワークモデルの生成方法

Also Published As

Publication number Publication date
JP6698401B2 (ja) 2020-05-27

Similar Documents

Publication Publication Date Title
KR102067344B1 (ko) 이상 진동데이터 감지 장치 및 방법
JP6280862B2 (ja) イベント分析システムおよび方法
CN111272454B (zh) 异常诊断装置及异常诊断方法
JP2013025367A (ja) 設備状態監視方法およびその装置
JP6472581B1 (ja) リスク評価装置、リスク評価方法、及び、リスク評価プログラム
JP7031743B2 (ja) 異常検知装置
JP6988304B2 (ja) 運用管理システム、監視サーバ、方法およびプログラム
EP3584657B1 (en) Risk assessment device, risk assessment method, and risk assessment program
JP6472327B2 (ja) 異常予兆診断装置及び異常予兆診断方法
KR102073537B1 (ko) 리스크 평가 장치, 리스크 평가 시스템, 리스크 평가 방법 및 리스크 평가 프로그램
JP6509001B2 (ja) 故障診断システム
JP2017182378A (ja) ルール抽出装置、該方法および該プログラム
JP6915693B2 (ja) システム分析方法、システム分析装置、および、プログラム
JP7179663B2 (ja) プラント監視装置、プラント監視方法、及びプログラム
KR20200009081A (ko) 리스크 평가 장치, 리스크 평가 시스템, 리스크 평가 방법, 리스크 평가 프로그램 및 데이터 구조
CN111237789A (zh) 锅炉吹灰方法、装置和计算机可读存储介质
US10372719B2 (en) Episode mining device, method and non-transitory computer readable medium of the same
JP7387325B2 (ja) プラント監視装置、プラント監視方法、及びプログラム
JP2007109139A (ja) 監視診断装置及び監視診断方法
JP6482742B1 (ja) リスク評価装置、リスク評価システム、リスク評価方法、及び、リスク評価プログラム
JP6454826B1 (ja) リスク評価装置、リスク評価方法、及び、リスク評価プログラム
CN112740131B (zh) 单位空间更新装置、单位空间更新方法及记录介质
JP7325219B2 (ja) プラント監視診断装置およびプラント監視診断方法
CN111008240A (zh) 矿场挖矿系统
JP2017182450A (ja) 管理装置、これを備える管理システム、及び、管理方法

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20181203

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20191126

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20191203

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20191210

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20200422

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20200428

R150 Certificate of patent or registration of utility model

Ref document number: 6698401

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

LAPS Cancellation because of no payment of annual fees