JP2003044280A - ルール表示方法および装置 - Google Patents

ルール表示方法および装置

Info

Publication number
JP2003044280A
JP2003044280A JP2001234754A JP2001234754A JP2003044280A JP 2003044280 A JP2003044280 A JP 2003044280A JP 2001234754 A JP2001234754 A JP 2001234754A JP 2001234754 A JP2001234754 A JP 2001234754A JP 2003044280 A JP2003044280 A JP 2003044280A
Authority
JP
Japan
Prior art keywords
rule
logical
logical expression
rules
key
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2001234754A
Other languages
English (en)
Inventor
Kazuya Okochi
一弥 大河内
Toyohisa Morita
豊久 森田
Yukiyasu Ito
幸康 伊藤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Ltd
Original Assignee
Hitachi Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Ltd filed Critical Hitachi Ltd
Priority to JP2001234754A priority Critical patent/JP2003044280A/ja
Publication of JP2003044280A publication Critical patent/JP2003044280A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

(57)【要約】 【課題】データの規則性を表したルールにおいて、どの
項目に注目したらよいかをわかりやすくするために、ル
ールを整理して表示する方法および装置を提供すること
を目的とする。また、データ中のあるレコードに着目し
て、関連するルールのみを表示する方法および装置を提
供することを目的とする。 【解決手段】ルール関連データベース114から1レコ
ードを指定し、ルール分割処理によってルール集合11
3を指定したレコードに関連するルールと関連しないル
ールに分割し、それらの一方を表示するか、もしくは両
方を分割して別々に表示する。ルール整形処理によっ
て、ルールの条件部に現れる論理式について、論理式ご
とにそれらの論理式を含む条件部を持つすべてのルール
の条件部を整理して、まとめて表示する。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、データベース中の
データ項目やその値に関する規則性を示すルールを表示
する方法および装置に関する。
【0002】
【従来の技術】従来より、大量のデータから自動的に知
識を抽出する技術として、「データマイニング」と呼ば
れる技術が知られている。データマイニングの技法とし
ては様々なものが知られているが、代表的なものの1つ
に「ルール生成」と呼ばれているものがある。一般に、
ルール生成では、例えば「IF 日用品購入金額=大き
い AND 来店頻度=週2回以上 THEN 顧客ランク
=優良顧客」のように「IF〜THEN」形式のルール
が出力される。この「IF〜」部分は条件部、「THE
N〜」部分は結論部と呼ばれる。
【0003】データマイニングを用いて抽出したか否か
にかかわらず、このようなルールを複数個表示すると
き、従来は、http://www.hitachi.co.jp/Prod/comp/sof
t1/datafront/chris.htm(「特徴ルール生成アルゴリズ
ム」)に記載されているように、一般性(あるルールが
どのくらい多くのデータに適用できるかを示す指標)や
精度(あるルールの条件部がどのくらい正確に結論部を
あらわしているかを示す指標)、またはその両者のトレ
ードオフを考えて計算した何らかのスコアを用いてルー
ルをランキングするのが一般的であった。また、表示方
法としては、抽出されたルールをそのまま表示するのが
一般的であった
【0004】
【発明が解決しようとする課題】しかし、上記従来技術
においては以下のような問題点があった。まず第1に
は、データの項目の様々な組み合わせを含む大量のルー
ルを見る際に、ルールは大量に提示されているにもかか
わらず、何ら整形などの処理はなされていないため、ど
のルールのどの項目に注目すれば良いのかがわかりにく
く、項目の組み合わせが色々と現れるルールを1つ1つ
全部チェックしなけらばならないという問題点があっ
た。
【0005】第2に、データ中のあるレコードに着目し
てそのデータに関係するルールのみを素早く参照できる
表示手段が提供されていない問題点があった。例えば、
データマイニングを用いて企業の分析担当者が顧客分析
を行う場合を考える。データの各レコードは顧客を表
し、顧客の属性の特徴がルールの条件部と結論部に現れ
るものとする。このようなとき、ある顧客に注目してそ
の顧客に関連するルールを見たいと思うときがあるが、
ある顧客(レコード)に着目して関連するルールを参照
するための表示手段が提供されていなかった。
【0006】本発明は、複数のルールの表示において、
どの項目に注目したらよいかをわかりやすくするために
ルールを整理して表示する方法および装置を提供するこ
とを目的とする。また、データ中のあるレコードを指定
して、そのデータに関係するルールを表示する方法およ
び装置を提供することを目的とする。
【0007】
【課題を解決するための手段】上記の目的を達成するた
め、本発明は、ルールの条件節が、1つの論理式、また
は2つ以上の論理式のAND結合で記述されており、ル
ールの結論部が固定されている複数のルールを表示する
方法であって、複数のルールを入力するステップと、入
力した前記複数のルールが真か偽かを判断するに足る情
報を持つレコードの集合から1つのレコードを指定する
ステップと、前記複数のルールについて、前記指定した
レコードに関連するルールと関連しないルールとに分割
するステップと、前記関連するルールの条件節の何れか
に少なくとも一度は出現する論理式について、それぞれ
の論理式をキー論理式とし、該キー論理式を含む前記関
連するルールの条件節から該キー論理式以外の論理式を
取り出し、取り出した論理式を該キー論理式に対応する
同時出現論理式とし、キー論理式ごとに同時出現論理式
をまとめて整形するステップと、整形したキー論理式間
の関係と同時出現論理式間の関係を表示するステップと
を備えたことを特徴とする。
【0008】また本発明は、ルールの条件節が、1つの
論理式、または2つ以上の論理式のAND結合で記述さ
れており、ルールの結論部が固定されている複数のルー
ルを表示する方法であって、複数のルールを入力するス
テップと、入力した前記複数のルールが真か偽かを判断
するに足る情報を持つレコードの集合から1つのレコー
ドを指定するステップと、前記複数のルールについて、
前記指定したレコードに関連するルールと関連しないル
ールとに分割するステップと、前記関連しないルールの
条件節の何れかに少なくとも一度は出現する論理式につ
いて、それぞれの論理式をキー論理式とし、該キー論理
式を含む前記関連しないルールの条件節から該キー論理
式以外の論理式を取り出し、取り出した論理式を該キー
論理式に対応する同時出現論理式とし、キー論理式ごと
に同時出現論理式をまとめて整形するステップと、整形
したキー論理式間の関係と同時出現論理式間の関係を表
示するステップとを備えたことを特徴とする。
【0009】また本発明は、ルールの条件節が、1つの
論理式、または2つ以上の論理式のAND結合で記述さ
れており、ルールの結論部が固定されている複数のルー
ルを表示する方法であって、複数のルールを入力するス
テップと、入力した前記複数のルールが真か偽かを判断
するに足る情報を持つレコードの集合から1つのレコー
ドを指定するステップと、前記複数のルールについて、
前記指定したレコードに関連するルールと関連しないル
ールとに分割するステップと、前記関連するルールの条
件節の何れかに少なくとも一度は出現する論理式につい
て、それぞれの論理式をキー論理式とし、該キー論理式
を含む前記関連するルールの条件節から該キー論理式以
外の論理式を取り出し、取り出した論理式を該キー論理
式に対応する同時出現論理式とし、キー論理式ごとに同
時出現論理式をまとめて整形するとともに、同様の処理
を前記関連しないルールに対しても施すステップと、前
記関連するルールについて整形したキー論理式間の関係
と同時出現論理式間の関係と、前記関連するルールにつ
いて整形したキー論理式間の関係と同時出現論理式間の
関係とを、区分けして表示するステップとを備えたこと
を特徴とする。
【0010】また本発明は、上述のルール表示方法にお
いて、前記指定したレコードに関連するルールは、前記
指定したレコードを条件節に当てはめたとき真となるル
ールであり、前記指定したレコードに関連しないルール
は、前記指定したレコードを条件節に当てはめたとき偽
となるルールであることを特徴とする。
【0011】また本発明は、上述のルール表示方法にお
いて、前記整形したキー論理式間の関係と同時出現論理
式間の関係を表示するステップは、全ての前記キー論理
式について、そのキー論理式と、そのキー論理式に対応
する同時出現論理式をORで接続した論理式とを、AN
Dで接続して得られた論理式を整形済み論理式とし、該
整形済み論理式の表示順序は、該整形済み論理式を用い
たルールの精度もしくは一般性または精度と一般性から
計算した尺度を評価値として用いて決定し、該整形済み
論理式に含まれる同時出現論理式の表示順序は、該同時
出現論理式が元に含まれていたルールの精度もしくは一
般性または精度と一般性から計算した尺度を評価値とし
て用いて決定することを特徴とする。
【0012】また本発明は、上述のルール表示方法にお
いて、前記整形したキー論理式間の関係と同時出現論理
式間の関係を表示するステップは、前記整形済み論理式
の表示順序と、前記整形済み論理式に含まれる同時出現
論理式の表示順序とを、それぞれ別々の評価値を基準と
して決定することを特徴とする。
【0013】また本発明は、上述のルール表示方法にお
いて、前記整形したキー論理式間の関係と同時出現論理
式間の関係を表示するステップは、前記整形済み論理式
のそれぞれについて、その整形済み論理式に含まれる同
時出現論理式が元に含まれていたルールの評価値の平均
値を求め、該平均値によって前記整形済み論理式の表示
順序を決定することを特徴とする。
【0014】また本発明は、上述のルール表示方法にお
いて、前記整形したキー論理式間の関係と同時出現論理
式間の関係を表示するステップは、前記表示順序を決定
するために使用した前記評価値の一部または全部を表示
するものであることを特徴とする。
【0015】また本発明は、上述のルール表示方法にお
いて、前記ルールを入力するステップは、データマイニ
ングのアルゴリズムによって抽出したルールを入力値と
することを特徴とする。
【0016】さらに本発明は、ルールの条件節が、1つ
の論理式、または2つ以上の論理式のAND結合で記述
されており、ルールの結論部が固定されている複数のル
ールを表示する方法であって、複数のルールのそれぞれ
の条件節に出現する論理式をすべて取り出し、取り出し
た論理式の中から決定したキー論理式と、該キー論理式
を含むルールの条件節から該キー論理式以外の論理式を
取り出した同時出現論理式とを、対応させて表示するこ
とを特徴とする。
【0017】さらに本発明は、ルールの条件節が、1つ
の論理式、または2つ以上の論理式のAND結合で記述
されており、ルールの結論部が固定されている複数のル
ールを表示する装置であって、複数のルールを入力する
手段と、入力した前記複数のルールが真か偽かを判断す
るに足る情報を持つレコードの集合から1つのレコード
を指定する手段と、前記複数のルールについて、前記指
定したレコードに関連するルールと関連しないルールと
に分割する手段と、前記関連するルールの条件節の何れ
かに少なくとも一度は出現する論理式について、それぞ
れの論理式をキー論理式とし、該キー論理式を含む前記
関連するルールの条件節から該キー論理式以外の論理式
を取り出し、取り出した論理式を該キー論理式に対応す
る同時出現論理式とし、キー論理式ごとに同時出現論理
式をまとめて整形する手段と、整形したキー論理式間の
関係と同時出現論理式間の関係を表示する手段とを備え
たことを特徴とする。
【0018】さらに本発明は、上述のルール表示方法を
計算機で実施するためのルール表示プログラムにある。
【0019】
【発明の実施の形態】以下、図面を用いて本発明の実施
の形態を説明する。
【0020】図1は、本発明の実施の形態に係るシステ
ムの構成図を示す。本システムは、処理装置101、外
部記憶装置102、入力装置103、および出力装置1
04を備え、それぞれが情報を伝達するバス105に接
続されている。メモリ106は、処理装置101に含ま
れているメモリであり、処理装置101が行う処理に必
要なプログラムやデータの一時的な格納場所として用い
られる。プログラム107は、メモリ106に格納され
ているプログラムであり、少なくともルール分割処理1
09とルール整形処理110を含んでいる。データ10
8は、メモリ106に格納されているデータであり、少
なくともルールリスト111と条件節リスト112を含
んでいる。
【0021】また、外部記憶装置102は、少なくとも
ルール集合113とルール関連データベース114を含
むものとする。入力装置103は、本システムを構成す
る装置と装置外部との情報のやり取りを仲立ちする装置
である。例えば、キーボード、マウス、およびLANな
どのネットワークに接続するための装置などが入力装置
103に相当する。出力装置104は、処理装置101
が行った処理の結果を表示するディスプレイなどの装置
である。
【0022】図2および図3を用いて、本実施形態で使
用するデータのデータ構造について説明する。
【0023】図2は、外部記憶装置102に含まれるル
ール集合113のデータ構造を示す。ルールID番号2
01は、それぞれのルールに割り当てられた番号であ
る。この番号は、ルール集合113に含まれるすべての
ルールについて一意である。条件節数202は、ルール
の条件部に含まれる条件節の数を表している。条件節リ
スト203には、ルール条件部を構成する条件節を表す
論理式を格納する。この条件節の数は可変であるため、
条件節リスト203は十分な大きさを持つ配列またはリ
スト構造によって実現される。図2では、配列を用いて
条件節リストを実現している。結論部204には、ルー
ルの結論部となる論理式を格納する。例えば、ルールI
D番号201が「1」で表されるルールは、条件節数2
02が「2」の「IF 住所=青葉区 & 年齢=40代
THEN 顧客ランク=優良」というルールである。本
システムで表示する対象のルールは、結論部が固定され
ているものである。したがって、図2のルール集合11
3に含まれるルールの結論部は、すべて「顧客ランク=
優良」である。
【0024】図3は、ルール関連データベース114の
データ構造を示す。データID番号301は、それぞれ
のデータに割り当てられた番号である。この番号は、ル
ール関連データベース114に含まれるすべてのデータ
について一意である。データ項目302は、データの属
性を表す項目である。図2に示したルール集合113の
条件節リスト203や結論部204の論理式に現れる項
目は、すべてデータ項目302に含まれている必要があ
る。ルール関連データベースは、例えば、図2のルール
を抽出する元になったレコードの集合である。
【0025】図4は、本実施形態全体の処理手順を示す
フローチャートである。ステップ401では、入力装置
103より複数のルールに関する情報を入力し、ルール
集合113に記憶する。ステップ402では、データI
D番号301を入力することにより、ルール関連データ
ベース114に格納されているデータの中から1つのレ
コードを指定する。ステップ403では、ルール集合1
13に含まれるルールについてルール分割処理を行う。
ステップ403のルール分割処理について、図5および
図6を用いて説明する。
【0026】図5は、図4のステップ403(ルール分
割処理)で用いるルールリスト111のデータ構造を示
す。ルールリスト111は、十分な大きさの配列を持
ち、ルールID番号を格納する。ルールリスト111に
格納されるルールID番号の数は可変であるため、この
データ構造は、十分な大きさを持つ配列やリスト構造な
どを用いて実現される。
【0027】図6は、図4のステップ403(ルール分
割処理)の詳細な処理手順を示すフローチャートであ
る。ステップ601では、ルール集合113に保持され
ているすべてのルールID番号を選択したか否かを判定
する。すべてのルールID番号が選択されたなら、本処
理を終了する。まだ選択されていないルールID番号が
ある場合は、ステップ602へ進む。ステップ602で
は、まだ選択されていないルールID番号を1つ選択す
る。ステップ603では、図4のステップ402(レコ
ード指定処理)で指定されたレコードが、ステップ60
2で選択されたルールID番号のルールの条件部に合致
するか否かを判定する。前記レコードが、ステップ60
2で選択されたルールID番号のルールの条件部を満た
すレコードである場合は、ステップ604に進み、ルー
ルリスト111に該ルールID番号を追加する。ステッ
プ603で、前記レコードが前記ルールID番号のルー
ルの条件部を満たさない場合は、ステップ601に戻
る。
【0028】図4に戻り、ステップ403の後、ステッ
プ404では、ルールリスト111に格納されたルール
ID番号のルールを整形する。ステップ404のルール
整形処理について、図7、図8、および図9を用いて説
明する。
【0029】図7は、図4のステップ404(ルール整
形処理)で用いる条件節リスト112のデータ構造を示
す。条件節リスト112は、キー条件節701と同時出
現条件節リスト702からなる。キー条件節701と同
時出現条件節リスト702には、ルールリスト111の
ルールに現れる条件節、または複数の条件節をAND演
算子で結んだ論理式を格納する。同時出現条件節リスト
702に含まれる条件節の数は可変であるため、同時出
現条件節リスト702は、十分な大きさを持つ配列やリ
スト構造などを用いて実現される。図7では、十分な大
きさを持つ配列を用いてデータ構造を実現している。
【0030】図8は、図4のステップ404(ルール整
形処理)の詳細な処理手順を示すフローチャートであ
る。ここでは、一例として図9(a)に示す4つのルー
ルを整形する過程を一例として説明する。すなわち、図
9(a)に示す4つのルールが、ルールリスト111に
登録されているものとする。
【0031】ステップ801では、ルールリスト111
中のルールIDで特定されるルールの条件部に現れる条
件節について、すべての種類の条件節を選択したか否か
を判定する。すべての種類の条件節が選択されたらステ
ップ806に進み、まだ選択されていない種類の条件節
がある場合はステップ802へ進む。図9(a)の例で
は、すべての種類の条件節とは「A=x」,「B=y」,
「C=x」,「D=y」の4種類である。なお、同じ条
件節が複数のルールに現れるときは、それを1種類に数
える。例えば、図9(a)の例では、「A=x」は複数
のルールに現れるが、1種類として数えるので、すべて
の種類の条件節は「A=x」,「B=y」,「C=x」,
「D=y」の4種類になる。ここでは、「A=x」がす
でに選択されて処理がなされたものとする。「B=
y」,「C=x」,「D=y」が未処理の条件節である。
【0032】ステップ802では、まだ選択されていな
い種類の条件節を1つ選択し、その条件節に関する情報
を格納するために、条件節リスト112のキー条件節7
01に、選択された条件節を追加する。ここでは、例と
して「B=y」が選択されたものとする。条件節リスト
112のキー条件節701に「B=y」が追加される
と、図9(b)のようになる。
【0033】ステップ803では、ルールリスト111
に含まれるルールID番号で一意に定まるルールの中か
らステップ802で選択された条件節が現れるルールを
すべて選択したか否かを判定する。まだ選択されていな
いルールがある場合はステップ804に進み、そのよう
なルールがすべて選択された場合はステップ801に戻
る。ここで選択されたか否かの判定は、キー条件節ごと
に行うものとする。すなわち、キー条件節が変われば、
すべてのルールはまだ選択されていないものとみなす。
図9(a)の例では、条件節「B=y」を含むルールは
ルール901とルール902であるが、いま「B=y」
をキー条件節に設定した段階であるので、まだどのルー
ルも選択されていない。
【0034】ステップ804では、まだ選択されていな
いルールの中から任意のルールを選択する。選択された
ルールの条件部全体を、指定された条件節(ステップ8
02で選択されたキー条件節)と、それ以外の条件節あ
るいは条件節を複数含む論理式とに、分割する。ここで
は、ルール901を選択したものとする。ルール901
の条件部は、現在のキー条件節「B=y」とそれ以外の
条件節「A=x」とに分割される。
【0035】ステップ805では、指定された条件節以
外の条件節を、指定された条件節をキー条件節701と
するレコードの同時出現条件節リスト702に、格納す
る。格納された様子を図9(c)に示す。「B=y」を
キー条件節とするレコード903に、同時出現条件節リ
ストとして「A=x」が格納されている。
【0036】ステップ803からステップ805までの
処理を、ルールリスト111中のルールのうちキー条件
節を含むすべてのルールに対して繰り返す。これによ
り、図9(a)の例では、「B=y」をキー条件節とす
るレコードに、「A=x」と「C=x」が格納される。
また、ステップ801からステップ805までの処理を
繰り返し行うことにより、すべての条件節「A=x」,
「B=y」,「C=x」,「D=y」をそれぞれキー条件
節とした場合について、キー条件節と同時に現れる条件
節(あるいは複数の条件節の組み合わせ)を条件節リス
ト112に格納できる。図9(a)の例で、最終的に条
件節リスト112に格納された様子を図9(d)に示
す。
【0037】ステップ806では、上述のステップ80
1〜805の処理によって整形され、条件節リスト11
2に格納されたルールについて、それぞれ「精度」を計
算することでルールのスコアを算出し、このスコアの高
い順にルールをソートしてランキングを作成する。ここ
で「精度」とは、ルールに関連するデータにおいて、ル
ールの条件部を満たすデータの数で、ルールの条件部と
結論部の両方を満たすデータの数を割った値である。な
お、条件節リスト112には条件節のみ格納されている
が、結論部は固定であるので、条件節リスト112の各
レコードはそれぞれが1つのルールと見なせる。
【0038】ここで、ルールのランキングには2種類が
考えられる。1つは、条件節リスト112に格納されて
いるすべてのレコードについてのランキングであり、こ
れは図9(d)の縦方向(すなわちレコード)のランキン
グに対応する。もう1つは、1つのレコードに格納され
ている同時出現条件節リストのエントリについてのラン
キングであり、これは図9(d)の横方向のランキング
に相当する。前者を「レコードについてのランキン
グ」、後者を「条件節についてのランキング」と呼ぶこ
とにする。
【0039】「レコードについてのランキング」は、各
レコードの同時出現条件節リスト内のエントリ(それぞ
れのエントリは論理式)をORで結び、それとキー条件
節とをANDで結んで1つの論理式とみなし、この論理
式を条件部とするルールについて「精度」を計算したも
のを各レコードのスコアとし、このスコアによってレコ
ードをソートしたものである。
【0040】また、「条件節についてのランキング」
は、キー条件節と同時出現条件節リスト内の各エントリ
(条件節)とをANDで結んだ論理式(つまり分割して
整形される前の元の条件部)を条件部とするルールの
「精度」を計算して各エントリのスコアとし、このスコ
アによって条件節をソートしたものである。
【0041】再び図4のフローチャートに戻り、ステッ
プ405では、整形されたルールを出力装置104に出
力する。
【0042】図10は、出力装置104としてディスプ
レイを用い、これに整形されたルールを表示した例を示
す図である。表示の順序は、レコードに関して、および
条件節に関して、ともに図8のステップ806でソート
されたものであるので、キー条件節についても、またそ
れぞれの同時出現条件節についても、スコアの評価値の
高いものから順に並んでいる。このため、この順序は、
整形されたルールを見るときの1つの指標を与えている
ものである。
【0043】以上の実施の形態によって、キー条件節と
同時出現条件節とを、それぞれランキングして表示する
ことが可能になる。これにより、まずレコードについて
のランキングによって、ルールに出現する全ての条件節
の中から、関連する全てのルールと合わせて考えて高い
精度を示すような1つの条件節に注目し、次にその条件
節と関連するルールの中から、高い精度を示すルールに
注目する、というように、まず注目すべき条件節、それ
から注目すべきルール、と2段階に分けてルールを検討
することが出来るようになる。最初の段階で、1つの条
件節(項目)と値の組み合わせに注目することが出来る
ので、どの項目に注目したらよいかわかりやすい、とい
う効果を得ることが可能である。
【0044】なお、上記実施の形態は、以下のように変
更して実施することも可能である。
【0045】第1に、図6のルール分割処理のフローチ
ャートにおいて、ステップ604で条件部に合致するル
ールではなく条件部に合致しないルールをルールリスト
111に加えるように変更して実施することが可能であ
る。これにより、あるレコードに関連しないルールのみ
を取り出して見ることが可能になる。
【0046】第2に、図6のルール分割処理のフローチ
ャートにおいて、ルールリストとして、条件部に合致す
るルールを格納する第1のルールリストと条件部に合致
しないルールを格納する第2のルールリストとの2つを
用意し、ステップ604では、これらのデータ構造にそ
れぞれの条件に合うルールを格納するようにし、図4の
ステップ404(ルール整形処理)では、それぞれのル
ールリストに格納されたルールを整形し、出力装置10
4に表示する際にはそれぞれのルールリストの表示の間
に例えば境界線を引いて区分けして表示するように、変
更して実施することも可能である。これにより、あるレ
コードに関連するルールと、関連しないルールとを、並
べて比較することが可能になる。
【0047】第3に、図8のステップ806における
「レコードについてのランキング」と「条件節について
のランキング」のスコアは、ルールの「精度」を基準に
算出するのではなく、ルールの「一般性」を基準に算出
するように変更して実施することが可能である。ここで
「一般性」とは、ルールに関連するデータにおいて、ル
ールの条件部を満たすデータの数をデータの総数で割っ
た値である。これにより、多くのデータに当てはまるル
ールから順にランキングすることが可能になる。
【0048】第4に、図8のステップ806における
「レコードについてのランキング」と「条件節について
のランキング」のスコアは、ルールの「精度」を基準に
算出するのではなく、ルールの「精度」と「一般性」の
トレードオフを取って算出するように変更して実施する
ことが可能である。このスコアには、例えば従来技術の
欄に示した「特徴ルール生成アルゴリズム」の「ルール
の評価尺度の計算」の項で示したような計算式を利用す
ることができる。これにより、ルールの「精度」と「一
般性」を考慮して、たくさんのデータに当てはまり、か
つ条件部が結論部を正確に表すようなルールから順にラ
ンキングすることが可能になる。
【0049】第5に、図8のステップ806における
「レコードについてのランキング」と「条件節について
のランキング」のスコアは、ルールの「精度」と「一般
性」とそれらのトレードオフを考えたそれぞれのスコア
を、レコードと条件節について別々に基準を設定し、そ
れぞれの基準でランキングすることが可能である。
【0050】第6に、図8のステップ806における
「レコードについてのランキング」のスコアは、そのレ
コードの同時出現条件節リストのエントリがもつスコア
の平均をそのレコードのスコアとするように変更して実
施することが可能である。これによりさらに柔軟な基準
を用いたルールのランキングが可能になる。
【0051】第7に、図4のステップ405(ルール表
示処理)では、レコードおよび同時出現条件節リストの
エントリが持つランキングの根拠となったスコアを、こ
れらのレコードおよび同時出現条件節リストのエントリ
の一部または全部について表示するように、変更して実
行することが可能である。これにより、それぞれのレコ
ードや同時出現条件節リストのエントリのスコアを数値
の違いで比較できるようになる。
【0052】第8に、図4のステップ405(ルール表
示処理)では、ランキングの根拠に関係なく、レコード
および同時出現条件節リストのエントリが持つ精度と一
般性の2つの値を算出し、これらの値をレコードおよび
同時出現条件節リストのエントリの一部または全部につ
いて表示するように、変更して実行することが可能であ
る。これにより、それぞれのレコードやエントリの詳細
な情報を出力装置104で確認することが可能になる。
【0053】第9に、図4のステップ401(ルール等
入力処理)では、入力装置104からルールを入力する
代わりに、メモリ106中にデータマイニングのルール
生成のプログラムを保持し、このプログラムによってル
ール関連データベース114からルールを抽出してルー
ル集合113に格納するように、変更して実施すること
が可能である。これにより、外部からルールを入力する
必要がなくなる。
【0054】第10に、図6のステップ603で選択さ
れたレコードがルールの条件部のみを満たしているか否
かを判定するのではなく、ルールの条件部および結論部
を満たしているか否かを判定するように、変更して実施
することが可能である。これにより、レコードに関連す
るルールを調べるときに、調べ方のバリエーションを与
えることができる。
【0055】
【発明の効果】以上述べたように、本発明によれば、ル
ールをあるレコードに関連するルールと関連しないルー
ルとに分割し、さらにそれぞれのルール集合を、ルール
集合に現れる論理式に着目して整理しているので、どの
項目に注目したらよいかが分かりやすく表示できる。ま
た、データ中のあるレコードを指定して、そのデータに
関係するルールを、系統立てて整理して表示することが
可能になる。
【図面の簡単な説明】
【図1】本発明の実施形態に係るシステム構成図。
【図2】外部記憶装置に含まれるルール集合のデータ構
造を示す図。
【図3】ルール関連データベースのデータ構造を示す
図。
【図4】本実施形態全体の処理手順を示すフローチャー
ト図。
【図5】ルールリストのデータ構造を示す図。
【図6】ルール分割処理の詳細な処理手順を示すフロー
チャート図。
【図7】条件節リストのデータ構造を示す図。
【図8】ルール整形処理の詳細な処理手順を示すフロー
チャート図。
【図9】ルール整形処理の様子を示す図。
【図10】整形されたルールを表示した画面例を示す
図。
【符号の説明】
101…処理装置、102…外部記憶装置、103…入
力装置、104…出力装置、105…バス、106…メ
モリ、107…プログラム、108…データ、109…
ルール分割処理、110…ルール整形処理、111…ル
ールリスト、112…条件節リスト、113…ルール集
合、114…ルール関連データベース、201…ルール
ID番号、202…条件節数、203…条件節リスト、
301…データID番号、302…データ項目、701
…キー条件節、702…同時出現条件節リスト。
───────────────────────────────────────────────────── フロントページの続き (72)発明者 伊藤 幸康 神奈川県横浜市戸塚区戸塚町5030番地 株 式会社日立製作所ソフトウェア事業部内 Fターム(参考) 5B075 NR10 NR15 PQ02 PQ22 QM05 5B082 GC03 GC04

Claims (12)

    【特許請求の範囲】
  1. 【請求項1】ルールの条件節が、1つの論理式、または
    2つ以上の論理式のAND結合で記述されており、ルー
    ルの結論部が固定されている複数のルールを表示する方
    法であって、 複数のルールを入力するステップと、 入力した前記複数のルールが真か偽かを判断するに足る
    情報を持つレコードの集合から1つのレコードを指定す
    るステップと、 前記複数のルールについて、前記指定したレコードに関
    連するルールと関連しないルールとに分割するステップ
    と、 前記関連するルールの条件節の何れかに少なくとも一度
    は出現する論理式について、それぞれの論理式をキー論
    理式とし、該キー論理式を含む前記関連するルールの条
    件節から該キー論理式以外の論理式を取り出し、取り出
    した論理式を該キー論理式に対応する同時出現論理式と
    し、キー論理式ごとに同時出現論理式をまとめて整形す
    るステップと、 整形したキー論理式間の関係と同時出現論理式間の関係
    を表示するステップとを備えたことを特徴とするルール
    表示方法。
  2. 【請求項2】ルールの条件節が、1つの論理式、または
    2つ以上の論理式のAND結合で記述されており、ルー
    ルの結論部が固定されている複数のルールを表示する方
    法であって、 複数のルールを入力するステップと、 入力した前記複数のルールが真か偽かを判断するに足る
    情報を持つレコードの集合から1つのレコードを指定す
    るステップと、 前記複数のルールについて、前記指定したレコードに関
    連するルールと関連しないルールとに分割するステップ
    と、 前記関連しないルールの条件節の何れかに少なくとも一
    度は出現する論理式について、それぞれの論理式をキー
    論理式とし、該キー論理式を含む前記関連しないルール
    の条件節から該キー論理式以外の論理式を取り出し、取
    り出した論理式を該キー論理式に対応する同時出現論理
    式とし、キー論理式ごとに同時出現論理式をまとめて整
    形するステップと、 整形したキー論理式間の関係と同時出現論理式間の関係
    を表示するステップとを備えたことを特徴とするルール
    表示方法。
  3. 【請求項3】ルールの条件節が、1つの論理式、または
    2つ以上の論理式のAND結合で記述されており、ルー
    ルの結論部が固定されている複数のルールを表示する方
    法であって、 複数のルールを入力するステップと、 入力した前記複数のルールが真か偽かを判断するに足る
    情報を持つレコードの集合から1つのレコードを指定す
    るステップと、 前記複数のルールについて、前記指定したレコードに関
    連するルールと関連しないルールとに分割するステップ
    と、 前記関連するルールの条件節の何れかに少なくとも一度
    は出現する論理式について、それぞれの論理式をキー論
    理式とし、該キー論理式を含む前記関連するルールの条
    件節から該キー論理式以外の論理式を取り出し、取り出
    した論理式を該キー論理式に対応する同時出現論理式と
    し、キー論理式ごとに同時出現論理式をまとめて整形す
    るとともに、同様の処理を前記関連しないルールに対し
    ても施すステップと、 前記関連するルールについて整形したキー論理式間の関
    係と同時出現論理式間の関係と、前記関連するルールに
    ついて整形したキー論理式間の関係と同時出現論理式間
    の関係とを、区分けして表示するステップとを備えたこ
    とを特徴とするルール表示方法。
  4. 【請求項4】請求項1から3の何れか1つに記載のルー
    ル表示方法において、 前記指定したレコードに関連するルールは、前記指定し
    たレコードを条件節に当てはめたとき真となるルールで
    あり、 前記指定したレコードに関連しないルールは、前記指定
    したレコードを条件節に当てはめたとき偽となるルール
    であることを特徴とするルール表示方法。
  5. 【請求項5】請求項1から4の何れか1つに記載のルー
    ル表示方法において、 前記整形したキー論理式間の関係と同時出現論理式間の
    関係を表示するステップは、 全ての前記キー論理式について、そのキー論理式と、そ
    のキー論理式に対応する同時出現論理式をORで接続し
    た論理式とを、ANDで接続して得られた論理式を整形
    済み論理式とし、 該整形済み論理式の表示順序は、該整形済み論理式を用
    いたルールの精度もしくは一般性または精度と一般性か
    ら計算した尺度を評価値として用いて決定し、 該整形済み論理式に含まれる同時出現論理式の表示順序
    は、該同時出現論理式が元に含まれていたルールの精度
    もしくは一般性または精度と一般性から計算した尺度を
    評価値として用いて決定することを特徴とするルール表
    示方法。
  6. 【請求項6】請求項5に記載のルール表示方法におい
    て、 前記整形したキー論理式間の関係と同時出現論理式間の
    関係を表示するステップは、 前記整形済み論理式の表示順序と、前記整形済み論理式
    に含まれる同時出現論理式の表示順序とを、それぞれ別
    々の評価値を基準として決定することを特徴とするルー
    ル表示方法。
  7. 【請求項7】請求項5に記載のルール表示方法におい
    て、 前記整形したキー論理式間の関係と同時出現論理式間の
    関係を表示するステップは、 前記整形済み論理式のそれぞれについて、その整形済み
    論理式に含まれる同時出現論理式が元に含まれていたル
    ールの評価値の平均値を求め、該平均値によって前記整
    形済み論理式の表示順序を決定することを特徴とするル
    ール表示方法。
  8. 【請求項8】請求項5から7の何れか1つに記載のルー
    ル表示方法において、 前記整形したキー論理式間の関係と同時出現論理式間の
    関係を表示するステップは、前記表示順序を決定するた
    めに使用した前記評価値の一部または全部を表示するも
    のであることを特徴とするルール表示方法。
  9. 【請求項9】請求項1から8の何れか1つに記載のルー
    ル表示方法において、 前記ルールを入力するステップは、データマイニングの
    アルゴリズムによって抽出したルールを入力値とするこ
    とを特徴とするルール表示方法。
  10. 【請求項10】ルールの条件節が、1つの論理式、また
    は2つ以上の論理式のAND結合で記述されており、ル
    ールの結論部が固定されている複数のルールを表示する
    方法であって、 複数のルールのそれぞれの条件節に出現する論理式をす
    べて取り出し、 取り出した論理式の中から決定したキー論理式と、該キ
    ー論理式を含むルールの条件節から該キー論理式以外の
    論理式を取り出した同時出現論理式とを、対応させて表
    示することを特徴とするルール表示方法。
  11. 【請求項11】ルールの条件節が、1つの論理式、また
    は2つ以上の論理式のAND結合で記述されており、ル
    ールの結論部が固定されている複数のルールを表示する
    装置であって、 複数のルールを入力する手段と、 入力した前記複数のルールが真か偽かを判断するに足る
    情報を持つレコードの集合から1つのレコードを指定す
    る手段と、 前記複数のルールについて、前記指定したレコードに関
    連するルールと関連しないルールとに分割する手段と、 前記関連するルールの条件節の何れかに少なくとも一度
    は出現する論理式について、それぞれの論理式をキー論
    理式とし、該キー論理式を含む前記関連するルールの条
    件節から該キー論理式以外の論理式を取り出し、取り出
    した論理式を該キー論理式に対応する同時出現論理式と
    し、キー論理式ごとに同時出現論理式をまとめて整形す
    る手段と、 整形したキー論理式間の関係と同時出現論理式間の関係
    を表示する手段とを備えたことを特徴とするルール表示
    装置。
  12. 【請求項12】請求項1から9の何れか1つに記載のル
    ール表示方法を計算機で実施するためのルール表示プロ
    グラム。
JP2001234754A 2001-08-02 2001-08-02 ルール表示方法および装置 Pending JP2003044280A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2001234754A JP2003044280A (ja) 2001-08-02 2001-08-02 ルール表示方法および装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2001234754A JP2003044280A (ja) 2001-08-02 2001-08-02 ルール表示方法および装置

Publications (1)

Publication Number Publication Date
JP2003044280A true JP2003044280A (ja) 2003-02-14

Family

ID=19066305

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2001234754A Pending JP2003044280A (ja) 2001-08-02 2001-08-02 ルール表示方法および装置

Country Status (1)

Country Link
JP (1) JP2003044280A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2020187384A (ja) * 2019-05-09 2020-11-19 富士通株式会社 ルール提示方法、ルール提示プログラムおよびルール提示装置

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2020187384A (ja) * 2019-05-09 2020-11-19 富士通株式会社 ルール提示方法、ルール提示プログラムおよびルール提示装置

Similar Documents

Publication Publication Date Title
US11106626B2 (en) Managing changes to one or more files via linked mapping records
US11409782B2 (en) Computer-aided extraction of semantics from keywords to confirm match of buyer offers to seller bids
US20110119273A1 (en) Apparatus and method for assessing relevant categories and measures for use in data analyses
JP2004005742A (ja) 文書全文検索用ユーザインタフェース
JP2002092305A (ja) スコア算出方法及びスコア提供方法
JP2009259284A (ja) 圧縮データの構造を問い合わせる方法
JP6431055B2 (ja) 文献のテキストマイニングのシステムおよび方法
JP2009169541A (ja) Webページ検索サーバ及びクエリ推薦方法
JP4973503B2 (ja) ファイル検索プログラム、方法及び装置
JP4059970B2 (ja) 情報源推薦装置
US20140136152A1 (en) Analyzing hardware designs based on component re-use
JP3908634B2 (ja) 検索支援方法および検索支援装置
JP3552339B2 (ja) データベースシステム
US20070255746A1 (en) Method for Processing Associated Software Data
JP2003044280A (ja) ルール表示方法および装置
JP2004145509A (ja) ドキュメント閲覧ナビゲート方法及びドキュメント閲覧ナビゲート装置
JP2008519358A (ja) Kストア(KStore)からのデータのグラフィックディスプレイのインターフェイスの方法および装置
JP2001229171A (ja) 商品検索システム
JP4568320B2 (ja) 処理手順生成装置及び処理手順生成方法
JPH1011469A (ja) 多段表処理方式
JP5505207B2 (ja) 情報検索装置、情報検索方法及び情報検索プログラム
JP2012099078A (ja) 商品検索装置及び商品検索方法
JP4260702B2 (ja) 対象関連表示装置および対象関連表示プログラム
JP2004302722A (ja) 事業評価システム
KR20090073809A (ko) 파일검색 방법 및 그 시스템