JP2002197098A - データマイニング装置 - Google Patents

データマイニング装置

Info

Publication number
JP2002197098A
JP2002197098A JP2000397990A JP2000397990A JP2002197098A JP 2002197098 A JP2002197098 A JP 2002197098A JP 2000397990 A JP2000397990 A JP 2000397990A JP 2000397990 A JP2000397990 A JP 2000397990A JP 2002197098 A JP2002197098 A JP 2002197098A
Authority
JP
Japan
Prior art keywords
attribute
correlation
correlation coefficient
inter
rule
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Abandoned
Application number
JP2000397990A
Other languages
English (en)
Inventor
Akisumi Mitsuishi
彰純 三石
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Mitsubishi Electric Corp
Original Assignee
Mitsubishi Electric Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Mitsubishi Electric Corp filed Critical Mitsubishi Electric Corp
Priority to JP2000397990A priority Critical patent/JP2002197098A/ja
Publication of JP2002197098A publication Critical patent/JP2002197098A/ja
Abandoned legal-status Critical Current

Links

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

(57)【要約】 【課題】 従来、真に有用なルールを見出すことが困難
な作業であるとともに、同一属性に関する他の属性値が
どのように関係しているのかについて理解することが難
しいという課題があった。 【解決手段】 名義尺度もしくは順序尺度属性の値から
なる複数のレコードを記憶したデータベース1からマイ
ニング条件に基いて属性間相関ルールの集合6を抽出す
る属性間相関ルール抽出部31と、前記属性間相関ルー
ルの集合から指定された属性間相関ルールを取り出し、
そのルールを構成する属性の全属性値を列挙する属性値
列挙処理部32と、前記列挙された属性値の間の相関係
数を算出する属性値間相関係数算出部33と、前記属性
値間相関係数を所定の表示形式の一覧に変換する相関係
数記号化処理部34とを備えた。 【効果】 ユーザは属性間の相関関係を容易に理解でき
る。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】この発明は、データベースに
おけるデータ相関の解析に関し、特に名義尺度もしくは
順序尺度で与えられる大量データの中からデータ項目間
の規則性を発見するデータマイニング技術に関するもの
である。
【0002】ここで尺度の定義は、『田中 豊、脇本 和
昌著、「多変量統計解析法」、現代数学社、pp138
−139』に述べられている定義に従っている。すなわ
ち、『名義尺度』とは、数値の大きさや大小関係には意
味を持たない尺度であり、『順序尺度』とは、数値の大
小関係は意味を持つが、数値の大きさには意味がない尺
度のことを言う。これに対して、数値の大きさに意味が
あり、絶対原点の存在する尺度を『比率尺度』、絶対原
点の存在しない尺度を『間隔尺度』と呼ぶ。
【0003】
【従来の技術】例えば、小売店における売上情報データ
ベースから、顧客がどのような商品を同時に購入するか
を分析する手法として、結合ルール(Association Rul
e)の生成がある。この結合ルールは、A→Bという形
をしており、支持度(s)と確信度(c)の2つの指標
を持つ。
【0004】例えば、売上情報データベースから生成し
たA→B(s、c)という結合ルールは、商品Aと商品
Bを同時に購入した顧客が全顧客のs%であり、商品A
を購入した顧客のc%が商品Bも同時に購入したことを
示している。この結合ルールを効率的に生成する手法
は、例えば、『R. Agrawal and R. Sricant, "Fast alg
orithms for mining association rules" In Proceedin
gs of the 20th VLDB Conference, 1994.』などに示さ
れている(これを従来技術1とする)。
【0005】また、上記の結合ルールとは異なる指標で
ルールを生成するデータマイニング手法もある。例え
ば、特開平11−328186号公報記載の発明では、
結合ルールで用いる“確信度”に代えて "χ(カイ)二
乗値”を指標として相関ルール(Correlation Rule)を
生成する。この相関ルールA⇔Bは、商品Aを購入する
という事象と、商品Bを購入するという事象の独立性検
定(χ二乗検定)を行って、独立性を棄却できる場合
に、相関ルールとして出力する(これを従来技術2とす
る)。
【0006】更に、データの属性に着目した属性間相関
ルールを抽出するデータマイニング手法もある。例え
ば、特開平12−072295号公報記載の発明では、
属性間の相関係数を用いて属性間の相関ルールを抽出す
る(これを従来技術3とする)。
【0007】上記の従来技術1及び2は、データベース
内のレコードに記録されている属性の値に着目して、ル
ールの生成が行われている。例えば、図3に示すよう
な、健康診断結果のデータベースを考える。このデータ
ベースには、「年齢」、「身長」、「体重」、「血
圧」、「視力」、などの属性がある。ここで例示した属
性には、本来比率尺度、あるいは間隔尺度で与えられる
ものもあるが、一方で、例えば性別、職業、趣味など、
本来的に名義尺度である属性もある。全ての尺度の属性
について、相互の関係を調べるために、ここでは比率尺
度あるいは間隔尺度の属性が、その値を名義尺度あるい
は順序尺度に変換されているものとしている。
【0008】図3に示したデータベースに対して、従来
技術1を適用して得られる結合ルールの例を図4に示
す。一般的には、多数の結合ルールが生成されるが、説
明のために図4では6個のルールのみを例示している。
ここで、ルール(1)と(2)、(3)と(4)、
(5)と(6)の3組の対について考える。各対の右辺
および左辺は、同じ属性の属性値であり、ルールとして
は同等の意味を持っている。
【0009】
【発明が解決しようとする課題】上述したような従来技
術1及び2では、属性値間の結合ルールもしくは相関ル
ールを自動的に抽出して利用者に提示するが、上記のよ
うに、これらの技術では属性値間の関係に着目している
ため、同一の属性間に関するルールが複数出力されるこ
とが往々にして発生する。そのため、真に有用なルール
を見出すことが困難な作業であるとともに、同一属性に
関する他の属性値がどのように関係しているのかについ
て理解することが難しいという問題点があった。
【0010】一方、従来技術3は、同一属性に関する相
関ルールが複数出力される問題を解決するためになされ
たものであり、属性間の相関関係のみを利用者に提示す
ることで、真に有用な相関ルールの発見を容易にしてい
る。しかし、このことによって、逆に属性値間の関係が
見えにくくなくなってしまうという問題点があった。
【0011】この発明は、前述した問題点を解決するた
めになされたもので、属性値間の相関関係を容易に把握
できる出力を提供することができるデータマイニング装
置を得ることを目的とする。
【0012】また、この発明は、属性値間の相関関係を
直感的に把握できる出力を提供することができるデータ
マイニング装置を得ることを目的とする。
【0013】さらに、この発明は、属性間の相関関係一
覧表作成を簡便な方法で指示できる機能を提供すること
ができるデータマイニング装置を得ることを目的とす
る。
【0014】
【課題を解決するための手段】この発明の請求項1に係
るデータマイニング装置は、名義尺度もしくは順序尺度
属性の値からなる複数のレコードを記憶したデータベー
スからマイニング条件に基いて属性間相関ルールの集合
を抽出する属性間相関ルール抽出部と、前記属性間相関
ルールの集合から指定された属性間相関ルールを取り出
し、そのルールを構成する属性の全属性値を列挙する属
性値列挙処理部と、前記列挙された属性値の間の相関係
数を算出する属性値間相関係数算出部と、前記属性値間
相関係数を所定の表示形式の一覧に変換する相関係数記
号化処理部とを備えたものである。
【0015】この発明の請求項2に係るデータマイニン
グ装置は、名義尺度もしくは順序尺度属性の値からなる
複数のレコードを記憶したデータベースからマイニング
条件に基いて属性値間相関ルールの集合を抽出する属性
値間相関ルール抽出部と、前記属性値間相関ルールの集
合から指定された属性値間相関ルールを取り出し、その
ルールを構成する属性の全属性値を列挙する属性抽出属
性値列挙処理部と、前記列挙された属性値の間の相関係
数を算出する属性値間相関係数算出部と、前記属性値間
相関係数を所定の表示形式の一覧に変換する相関係数記
号化処理部とを備えたものである。
【0016】この発明の請求項3に係るデータマイニン
グ装置は、入力された属性集合の各属性の属性値の間の
相関係数を算出する属性値間相関係数算出部と、前記属
性値間相関係数を所定の表示形式の一覧に変換する相関
係数記号化処理部とを備えたものである。
【0017】この発明の請求項4に係るデータマイニン
グ装置は、名義尺度もしくは順序尺度属性の値からなる
複数のレコードを記憶したデータベースからマイニング
条件に基いて属性間相関ルールの集合を抽出する属性間
相関ルール抽出部と、前記属性間相関ルールの集合を属
性間相関ルール表示部に表示させてユーザにより選択さ
れた属性間相関ルールを出力する相関ルール表示選択処
理部と、前記相関ルール表示選択処理部から出力された
属性間相関ルールを構成する属性の全属性値を列挙する
属性値列挙処理部と、前記列挙された属性値の間の相関
係数を算出する属性値間相関係数算出部と、前記属性値
間相関係数を所定の表示形式の一覧に変換する相関係数
記号化処理部とを備えたものである。
【0018】この発明の請求項5に係るデータマイニン
グ装置は、前記相関係数記号化処理部が、前記属性値間
相関係数を所定の文字列に変換して属性間相関関係表示
部に表示させるものである。
【0019】この発明の請求項6に係るデータマイニン
グ装置は、前記相関係数記号化処理部が、前記属性値間
相関係数を所定の表形式に変換して属性間相関関係表示
部に表示させるものである。
【0020】この発明の請求項7に係るデータマイニン
グ装置は、前記相関係数記号化処理部が、前記属性値間
相関係数を所定の記号に変換して属性間相関関係表示部
に表示させるものである。
【0021】この発明の請求項8に係るデータマイニン
グ装置は、前記相関係数記号化処理部が、前記属性値間
相関係数を所定の色情報に変換して属性間相関関係表示
部に表示させるものである。
【0022】この発明の請求項9に係るデータマイニン
グ装置は、前記相関係数記号化処理部が、前記属性値間
相関係数を所定の3次元グラフに変換して属性間相関関
係表示部に表示させるものである。
【0023】
【発明の実施の形態】実施の形態1.この発明の実施の
形態1に係るデータマイニング装置について図面を参照
しながら説明する。図1は、この発明の実施の形態1に
係るデータマイニング装置の構成を示す図である。な
お、各図中、同一符号は同一又は相当部分を示す。
【0024】図1において、1はデータマイニングの対
象となるデータベース、2はマイニング条件を入力する
ユーザ入力部、3は本実施の形態1に係るデータマイニ
ング装置、6は属性間相関ルールの集合、9は本実施の
形態1の処理結果を表示する属性間相関関係表示部であ
る。
【0025】また、同図において、31、32、33は
データマイニング装置3を構成する要素であって、31
はデータベース1から属性間相関ルールの集合6を抽出
する属性間相関ルール抽出部、32は属性間相関ルール
の集合6から、ユーザ入力部2によって指定された属性
間相関ルールを取り出して、そのルールを構成する属性
の全属性値を列挙する属性値列挙処理部、33はこの属
性値列挙処理部32によって列挙された属性値の間の相
関係数を算出して出力する属性値間相関係数算出部、3
4は属性値間相関係数を、その値に応じた記号や色に変
換する相関係数記号化処理部である。
【0026】このデータマイニング装置は、属性間相関
関係図を生成する。ここで、『属性間相関関係図』と
は、属性値間相関係数の一覧のことを言う。
【0027】つぎに、この実施の形態1に係るデータマ
イニング装置の動作について図面を参照しながら説明す
る。図2は、この発明の実施の形態1に係るデータマイ
ニング装置の動作を示すフローチャートである。
【0028】まず、ステップ101において、ユーザ入
力部2により、属性間相関ルール抽出部31がデータベ
ース1から属性間相関ルールの集合6を抽出する時に必
要なマイニング条件をユーザから得る。
【0029】次に、ステップ102において、属性間相
関ルール抽出部31は、前のステップ101で得たマイ
ニング条件に従って、データベース1から属性間相関ル
ールの集合6を抽出する。以下では、例として図3に示
すデータベースから図5に示す属性間相関ルールの集合
が得られたものとして説明を進める。
【0030】次に、ステップ103において、ユーザ入
力部2により、属性間相関ルールの集合6からユーザに
とって関心のある属性間相関ルールを1つ選択する。
【0031】次に、ステップ104において、属性間相
関ルールが選択されかを判断し、ユーザが属性間相関ル
ールを選択しなかった場合には、このステップ104の
判断で処理を終了する。選択した場合には、次のステッ
プ105へ進む。ここでは、図5に示す属性間相関ルー
ルから、図中(3)の「身長、体重⇔血圧」を選択した
とする。
【0032】次に、ステップ105において、ユーザが
選択した属性間相関ルールの左辺、右辺それぞれを構成
する属性がとりうる値(属性値)をすべて列挙する。
【0033】「身長、体重⇔血圧」の例の場合、「身
長」という属性が採りうる属性値は「高い」、「中」、
「低い」の3種類、「体重」という属性が採りうる属性
値は「重い」、「中」、「軽い」の3種類、「血圧」と
いう属性が採りうる属性値は「高い」、「正常」、「低
い」の3種類であるとする。
【0034】「身長」、「体重」、「血圧」が採りうる
属性値はデータベース1を網羅的に調べれば分かること
であるが、データベース1から、予め図6に示すような
属性値一覧表を作成しておくと高速に処理することがで
きる。
【0035】ここで、上記例の右辺「血圧」の採りうる
属性値は「高い」、「正常」、「低い」の3種類である
ことは、上記処理で判明した。
【0036】一方、左辺「身長、体重」の採りうる属性
値は、「身長」及び「体重」それぞれが採りうる属性値
の直積で求める。
【0037】すなわち、左辺の属性値は、「身長:低
い、体重:軽い」、「身長:低い、体重:中」、「身
長:低い、体重:重い」、「身長:中、体重:軽い」、
「身長:中、体重:中」、「身長:中、体重:重い」、
「身長:高い、体重:軽い」、「身長:高い、体重:
中」、「身長:高い、体重:重い」、の9種類となる。
【0038】同様に、右辺の属性値も属性名と対にし
て、「血圧:高い」、「血圧:正常」、「血圧:低い」
としておく。
【0039】次に、ステップ106において、列挙され
た右辺、左辺の属性値の全ての組合わせについて相関係
数を算出し、属性間相関関係表示部9へ出力する。例の
場合、右辺3種類と左辺9種類の全組合わせは3×9=
27種類であり、27種類の組合わせについて、属性値
間の相関係数を算出する。
【0040】次に、ステップ107において、ユーザ入
力部2により属性値間相関係数の表示方法をユーザから
入力し、その方法に応じて、ステップ108〜112の
処理へ分岐する。
【0041】表示方法が“テキスト”の場合は、ステッ
プ108へ進み、相関係数記号化処理部34は、ステッ
プ106の出力を文字列に変換し、属性間相関関係表示
部9は、例えば図7のように、属性値間相関係数を文字
列で表示する。
【0042】表示方法が“表”の場合は、ステップ10
9へ進み、相関係数記号化処理部34は、ステップ10
6の出力を表形式に変換し、属性間相関関係表示部9
は、例えば図8のように、属性値間相関係数を表で表示
する。
【0043】表示方法が“記号”の場合、ステップ11
0へ進み、相関係数記号化処理部34は、ステップ10
6の出力を記号に変換し、属性間相関関係表示部9は、
例えば図9のように、属性値間相関係数を記号で表示す
る。
【0044】表示方法が“色”の場合、ステップ111
へ進み、相関係数記号化処理部34は、ステップ106
の出力を色情報に変換し、属性間相関関係表示部9は、
例えば図10のように、属性値間相関係数を色で表示す
る。
【0045】表示方法が“3次元グラフ”の場合には、
ステップ112へ進み、相関係数記号化処理部34は、
ステップ106の出力を3次元グラフに変換し、属性間
相関関係表示部9は、例えば図11のように、属性値間
相関係数を3次元グラフで表示する。
【0046】以上のように、この実施の形態1に係るデ
ータマイニング装置によれば、ユーザが指定した属性間
相関ルールの全ての属性値間相関係数を見ることができ
るので、ユーザは属性間の相関関係を容易に理解できる
という効果がある。
【0047】なお、ここでは属性値間相関係数として、
後述する式(1)を用いることを想定しているが、式
(1)に限定する必要はなく、例えば確信度のような指
標であってもよい。
【0048】 相関係数=(nc−ab)/√{ab(n−a)(n−b)}・・・式(1)
【0049】ここで、aは右辺の属性値が出現する度
数、bは左辺の属性値が出現する度数、cは右辺、左辺
の属性値が同時に出現する度数、nは全レコード数を表
す。
【0050】実施の形態2.この発明の実施の形態2に
係るデータマイニング装置について図面を参照しながら
説明する。図12は、この発明の実施の形態2に係るデ
ータマイニング装置の構成を示す図である。
【0051】図12において、7は属性値間相関ルール
の集合、4は本実施の形態2に係るデータマイニング装
置である。また、41及び42はデータマイニング装置
4を構成する要素であって、41はデータベース1から
属性値間相関ルールの集合7を抽出する属性値間相関ル
ール抽出部、42は属性値間相関ルールの集合7から、
ユーザ入力部2によって指定された属性値間相関ルール
を属性値間相関ルールの集合7から取り出して、そのル
ールを構成する属性の全属性値を列挙する属性抽出属性
値列挙処理部である。
【0052】上記の実施の形態1では、データベース1
から属性間相関ルールを抽出し、ユーザが選択した属性
間相関ルールの右辺、左辺に着目して、属性間相関関係
を表示する。これに対して、この実施の形態2では、デ
ータベース1から属性値間相関ルールを抽出し、その中
からユーザが選択した属性値間相関ルールに着目して属
性間相関関係を表示することもできる。この実施の形態
2は、属性値間相関ルールをもとに属性間相関関係表示
を行う。
【0053】つぎに、この実施の形態2に係るデータマ
イニング装置の動作について図面を参照しながら説明す
る。図13は、この発明の実施の形態2に係るデータマ
イニング装置の動作を示すフローチャートである。
【0054】まず、ステップ201において、ユーザ入
力部2により、属性値間相関ルール抽出部41がデータ
ベース1から属性値間相関ルールの集合7を抽出する時
に必要なマイニング条件をユーザから得る。
【0055】次に、ステップ202において、属性値間
相関ルール抽出部41は、前のステップ201で得たマ
イニング条件に従って、データベース1から属性値間相
関ルールの集合7を抽出する。以下では、例として図3
に示すデータベースから図14に示す属性値間相関ルー
ルの集合が得られたものとして説明を進める。
【0056】次に、ステップ203において、ユーザ入
力部2により、属性値間相関ルールの集合7からユーザ
にとって関心のある属性値間相関ルールを1つ選択す
る。
【0057】次に、ステップ204において、属性値間
相関ルールが選択されたかを判断し、ユーザが属性値間
相関ルールを選択しなかった場合は、このステップ20
4の判断で処理を終了する。選択した場合には、次のス
テップ205へ進む。ここでは、図14に示す属性値間
相関ルールの集合から、図中(5)の「身長:低い、体
重:重い⇔血圧:高い」を選択したとする。
【0058】次に、ステップ205において、ユーザが
選択した属性間相関ルールの右辺、左辺それぞれを構成
する属性値が属する属性を抽出する。図14に示す
(5)の属性値間相関ルールの場合、左辺は「身長」と
「体重」、右辺は「血圧」という属性が抽出される。
【0059】そして、図2に示した上記実施の形態1の
処理と同様、ステップ105でルールの右辺、左辺それ
ぞれを構成する属性がとりうる値(属性値)をすべて列
挙し、ステップ106で、列挙された右辺、左辺の属性
値の全ての組合わせについて相関係数を算出して、ステ
ップ107〜112を経て、結果を属性間相関関係表示
部9へ出力する。
【0060】以上のように、この実施の形態2に係るデ
ータマイニング装置によれば、ユーザが指定した属性値
間相関ルールに係わる属性の全ての属性値間相関係数を
見ることができるので、ユーザは属性間の相関関係を容
易に理解できるという効果がある。
【0061】実施の形態3.この発明の実施の形態3に
係るデータマイニング装置について図面を参照しながら
説明する。図15は、この発明の実施の形態3に係るデ
ータマイニング装置の構成を示す図である。
【0062】図15に示すデータマイニング装置は、ユ
ーザが指定した任意の属性(もしくは属性の集合)間相
関関係図を生成する。本実施の形態3を構成する要素
は、全て図1に含まれるため、要素の説明は省略する。
【0063】上記の実施の形態1及び2では、データベ
ース1から抽出した属性間相関ルール6、もしくは属性
値間相関ルール7をもとに、属性値間相関係数を算出す
る属性(あるいは属性の集合)をユーザが選択してい
た。属性間相関ルールや属性値間相関ルールによらず、
ユーザが指定する任意の属性(あるいは属性の集合)間
の属性値間相関係数一覧を算出することもできる。ここ
では、ユーザが指定した任意の属性(もしくは属性の集
合)間の属性値間相関係数を算出する。
【0064】つぎに、この実施の形態3に係るデータマ
イニング装置の動作について図面を参照しながら説明す
る。図16は、この発明の実施の形態3に係るデータマ
イニング装置の動作を示すフローチャートである。
【0065】まず、ステップ301において、ユーザ入
力部2により、属性間相関ルールの右辺、左辺に相当す
る属性集合(1つ以上の属性)を入力する。
【0066】次に、ステップ302において、入力を確
認し、属性集合の指定がなされていなければ処理を終了
し、指定がなされていれば、続くステップ105〜11
2の処理を行って、属性間相関関係図を属性間相関関係
表示部9で表示する。
【0067】以上のように、この実施の形態3に係るデ
ータマイニング装置によれば、ユーザが任意に指定した
属性集合間の全ての属性値間相関係数を見ることができ
るので、ユーザは属性間の相関関係を容易に理解できる
という効果がある。
【0068】実施の形態4.この発明の実施の形態4に
係るデータマイニング装置について図面を参照しながら
説明する。図17は、この発明の実施の形態4に係るデ
ータマイニング装置の構成を示す図である。
【0069】図17において、11は本実施の形態4に
係るデータマイニング装置、12は属性間相関ルールの
集合6を出力し、ユーザからの選択情報を得る相関ルー
ル表示選択処理部、13は属性間相関ルールを表示し、
ユーザに選択させる属性間相関ルール表示部である。
【0070】上記の実施形態1、2では、データベース
1から抽出した属性間相関ルール6もしくは属性値間相
関ルール7からユーザが選択したルールをもとに、属性
間の属性値間相関係数一覧を算出している。この実施の
形態4では、ユーザによる選択を容易にせしめるもので
ある。
【0071】つぎに、この実施の形態4に係るデータマ
イニング装置の動作について図面を参照しながら説明す
る。図18は、この発明の実施の形態4に係るデータマ
イニング装置の動作を示すフローチャートである。
【0072】この実施の形態4の処理の流れは、ステッ
プ403を除いて図2に示す実施の形態1の処理の流れ
と同じである。ステップ403では、相関ルール表示選
択処理部12が、属性間相関ルールの集合6の内容を属
性間相関ルール表示部13へ送り、この属性間相関ルー
ル表示部13は、ルールの一覧を画面上に表示する。
【0073】次に、表示された一覧表から、ユーザが任
意のルールをクリックすると、属性間相関ルール表示部
13は、クリックされたルールを示す識別情報を相関ル
ール表示選択処理部12へ送る。
【0074】次に、相関ルール表示選択処理部12は、
その情報をもとに選択されたルールの情報を属性値列挙
処理部32へ送って、ステップ104から105以降へ
進んで属性間相関関係図作成の処理を行う。ユーザが属
性間相関関係図作成を行わない旨の入力を行った場合に
は、ステップ104経由で処理を終了する。
【0075】以上のように、この実施の形態4に係るデ
ータマイニング装置によれば、ユーザによるルールの選
択が容易となり、操作性を向上させる効果がある。
【0076】
【発明の効果】この発明の請求項1に係るデータマイニ
ング装置は、以上説明したとおり、名義尺度もしくは順
序尺度属性の値からなる複数のレコードを記憶したデー
タベースからマイニング条件に基いて属性間相関ルール
の集合を抽出する属性間相関ルール抽出部と、前記属性
間相関ルールの集合から指定された属性間相関ルールを
取り出し、そのルールを構成する属性の全属性値を列挙
する属性値列挙処理部と、前記列挙された属性値の間の
相関係数を算出する属性値間相関係数算出部と、前記属
性値間相関係数を所定の表示形式の一覧に変換する相関
係数記号化処理部とを備えたので、ユーザは属性間の相
関関係を容易に理解できるという効果を奏する。
【0077】この発明の請求項2に係るデータマイニン
グ装置は、以上説明したとおり、名義尺度もしくは順序
尺度属性の値からなる複数のレコードを記憶したデータ
ベースからマイニング条件に基いて属性値間相関ルール
の集合を抽出する属性値間相関ルール抽出部と、前記属
性値間相関ルールの集合から指定された属性値間相関ル
ールを取り出し、そのルールを構成する属性の全属性値
を列挙する属性抽出属性値列挙処理部と、前記列挙され
た属性値の間の相関係数を算出する属性値間相関係数算
出部と、前記属性値間相関係数を所定の表示形式の一覧
に変換する相関係数記号化処理部とを備えたので、ユー
ザは属性間の相関関係を容易に理解できるという効果を
奏する。
【0078】この発明の請求項3に係るデータマイニン
グ装置は、以上説明したとおり、入力された属性集合の
各属性の属性値の間の相関係数を算出する属性値間相関
係数算出部と、前記属性値間相関係数を所定の表示形式
の一覧に変換する相関係数記号化処理部とを備えたの
で、ユーザは属性間の相関関係を容易に理解できるとい
う効果を奏する。
【0079】この発明の請求項4に係るデータマイニン
グ装置は、以上説明したとおり、名義尺度もしくは順序
尺度属性の値からなる複数のレコードを記憶したデータ
ベースからマイニング条件に基いて属性間相関ルールの
集合を抽出する属性間相関ルール抽出部と、前記属性間
相関ルールの集合を属性間相関ルール表示部に表示させ
てユーザにより選択された属性間相関ルールを出力する
相関ルール表示選択処理部と、前記相関ルール表示選択
処理部から出力された属性間相関ルールを構成する属性
の全属性値を列挙する属性値列挙処理部と、前記列挙さ
れた属性値の間の相関係数を算出する属性値間相関係数
算出部と、前記属性値間相関係数を所定の表示形式の一
覧に変換する相関係数記号化処理部とを備えたので、ユ
ーザによるルールの選択が容易となり、操作性を向上す
ることができるという効果を奏する。
【0080】この発明の請求項5に係るデータマイニン
グ装置は、以上説明したとおり、前記相関係数記号化処
理部が、前記属性値間相関係数を所定の文字列に変換し
て属性間相関関係表示部に表示させるので、ユーザは属
性間の相関関係を容易に理解できるという効果を奏す
る。
【0081】この発明の請求項6に係るデータマイニン
グ装置は、以上説明したとおり、前記相関係数記号化処
理部が、前記属性値間相関係数を所定の表形式に変換し
て属性間相関関係表示部に表示させるので、ユーザは属
性間の相関関係を容易に理解できるという効果を奏す
る。
【0082】この発明の請求項7に係るデータマイニン
グ装置は、以上説明したとおり、前記相関係数記号化処
理部が、前記属性値間相関係数を所定の記号に変換して
属性間相関関係表示部に表示させるので、ユーザは属性
間の相関関係を容易に理解できるという効果を奏する。
【0083】この発明の請求項8に係るデータマイニン
グ装置は、以上説明したとおり、前記相関係数記号化処
理部が、前記属性値間相関係数を所定の色情報に変換し
て属性間相関関係表示部に表示させるので、ユーザは属
性間の相関関係を容易に理解できるという効果を奏す
る。
【0084】この発明の請求項9に係るデータマイニン
グ装置は、以上説明したとおり、前記相関係数記号化処
理部が、前記属性値間相関係数を所定の3次元グラフに
変換して属性間相関関係表示部に表示させるので、ユー
ザは属性間の相関関係を容易に理解できるという効果を
奏する。
【図面の簡単な説明】
【図1】 この発明の実施の形態1に係るデータマイニ
ング装置の構成を示す図である。
【図2】 この発明の実施の形態1に係るデータマイニ
ング装置の動作を示すフローチャートである。
【図3】 この発明の実施の形態1に係るデータマイニ
ング装置の健康診断結果のデータベース例を示す図であ
る。
【図4】 従来のデータマイニング方法による属性間結
合ルールの例を示す図である。
【図5】 この発明の実施の形態1に係るデータマイニ
ング装置の属性間相関ルールの例を示す図である。
【図6】 この発明の実施の形態1に係るデータマイニ
ング装置の属性値一覧表の例を示す図である。
【図7】 この発明の実施の形態1に係るデータマイニ
ング装置の属性間相関関係図(テキストによる表示)の
例を示す図である。
【図8】 この発明の実施の形態1に係るデータマイニ
ング装置の属性間相関関係図(表による表示)の例を示
す図である。
【図9】 この発明の実施の形態1に係るデータマイニ
ング装置の属性間相関関係図(記号による表示)の例を
示す図である。
【図10】 この発明の実施の形態1に係るデータマイ
ニング装置の属性間相関関係図(色による表示)の例を
示す図である。
【図11】 この発明の実施の形態1に係るデータマイ
ニング装置の属性間相関関係図(3次元グラフによる表
示)の例を示す図である。
【図12】 この発明の実施の形態2に係るデータマイ
ニング装置の構成を示す図である。
【図13】 この発明の実施の形態2に係るデータマイ
ニング装置の動作を示すフローチャートである。
【図14】 この発明の実施の形態2に係るデータマイ
ニング装置の属性値間相関ルールの例を示す図である。
【図15】 この発明の実施の形態3に係るデータマイ
ニング装置の構成を示す図である。
【図16】 この発明の実施の形態3に係るデータマイ
ニング装置の動作を示すフローチャートである。
【図17】 この発明の実施の形態4に係るデータマイ
ニング装置の構成を示す図である。
【図18】 この発明の実施の形態4に係るデータマイ
ニング装置の動作を示すフローチャートである。
【符号の説明】 1 データベース、2 ユーザ入力部、3 データマイ
ニング装置(実施の形態1)、4 データマイニング装
置(実施の形態2)、5 データマイニング装置(実施
の形態3)、6 属性間相関ルール、7 属性値間相関
ルール、9 属性間相関関係表示部、11 データマイ
ニング装置、12 相関ルール表示選択処理部、13
属性間相関ルール表示部、31 属性間相関ルール抽出
部、32属性値列挙処理部、33 属性値間相関係数算
出部、34 相関係数記号化処理部、41 属性値間相
関ルール抽出部、42 属性抽出属性値列挙処理部。

Claims (9)

    【特許請求の範囲】
  1. 【請求項1】 名義尺度もしくは順序尺度属性の値から
    なる複数のレコードを記憶したデータベースからマイニ
    ング条件に基いて属性間相関ルールの集合を抽出する属
    性間相関ルール抽出部と、 前記属性間相関ルールの集合から指定された属性間相関
    ルールを取り出し、そのルールを構成する属性の全属性
    値を列挙する属性値列挙処理部と、 前記列挙された属性値の間の相関係数を算出する属性値
    間相関係数算出部と、 前記属性値間相関係数を所定の表示形式の一覧に変換す
    る相関係数記号化処理部とを備えたことを特徴とするデ
    ータマイニング装置。
  2. 【請求項2】 名義尺度もしくは順序尺度属性の値から
    なる複数のレコードを記憶したデータベースからマイニ
    ング条件に基いて属性値間相関ルールの集合を抽出する
    属性値間相関ルール抽出部と、 前記属性値間相関ルールの集合から指定された属性値間
    相関ルールを取り出し、そのルールを構成する属性の全
    属性値を列挙する属性抽出属性値列挙処理部と、 前記列挙された属性値の間の相関係数を算出する属性値
    間相関係数算出部と、 前記属性値間相関係数を所定の表示形式の一覧に変換す
    る相関係数記号化処理部とを備えたことを特徴とするデ
    ータマイニング装置。
  3. 【請求項3】 入力された属性集合の各属性の属性値の
    間の相関係数を算出する属性値間相関係数算出部と、 前記属性値間相関係数を所定の表示形式の一覧に変換す
    る相関係数記号化処理部とを備えたことを特徴とするデ
    ータマイニング装置。
  4. 【請求項4】 名義尺度もしくは順序尺度属性の値から
    なる複数のレコードを記憶したデータベースからマイニ
    ング条件に基いて属性間相関ルールの集合を抽出する属
    性間相関ルール抽出部と、 前記属性間相関ルールの集合を属性間相関ルール表示部
    に表示させてユーザにより選択された属性間相関ルール
    を出力する相関ルール表示選択処理部と、 前記相関ルール表示選択処理部から出力された属性間相
    関ルールを構成する属性の全属性値を列挙する属性値列
    挙処理部と、 前記列挙された属性値の間の相関係数を算出する属性値
    間相関係数算出部と、 前記属性値間相関係数を所定の表示形式の一覧に変換す
    る相関係数記号化処理部とを備えたことを特徴とするデ
    ータマイニング装置。
  5. 【請求項5】 前記相関係数記号化処理部は、前記属性
    値間相関係数を所定の文字列に変換して属性間相関関係
    表示部に表示させることを特徴とする請求項1から請求
    項4までのいずれかに記載のデータマイニング装置。
  6. 【請求項6】 前記相関係数記号化処理部は、前記属性
    値間相関係数を所定の表形式に変換して属性間相関関係
    表示部に表示させることを特徴とする請求項1から請求
    項4までのいずれかに記載のデータマイニング装置。
  7. 【請求項7】 前記相関係数記号化処理部は、前記属性
    値間相関係数を所定の記号に変換して属性間相関関係表
    示部に表示させることを特徴とする請求項1から請求項
    4までのいずれかに記載のデータマイニング装置。
  8. 【請求項8】 前記相関係数記号化処理部は、前記属性
    値間相関係数を所定の色情報に変換して属性間相関関係
    表示部に表示させることを特徴とする請求項1から請求
    項4までのいずれかに記載のデータマイニング装置。
  9. 【請求項9】 前記相関係数記号化処理部は、前記属性
    値間相関係数を所定の3次元グラフに変換して属性間相
    関関係表示部に表示させることを特徴とする請求項1か
    ら請求項4までのいずれかに記載のデータマイニング装
    置。
JP2000397990A 2000-12-27 2000-12-27 データマイニング装置 Abandoned JP2002197098A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2000397990A JP2002197098A (ja) 2000-12-27 2000-12-27 データマイニング装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2000397990A JP2002197098A (ja) 2000-12-27 2000-12-27 データマイニング装置

Publications (1)

Publication Number Publication Date
JP2002197098A true JP2002197098A (ja) 2002-07-12

Family

ID=18863045

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2000397990A Abandoned JP2002197098A (ja) 2000-12-27 2000-12-27 データマイニング装置

Country Status (1)

Country Link
JP (1) JP2002197098A (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2004126780A (ja) * 2002-09-30 2004-04-22 Toshiba Corp 分析用データ作成方法、データ分析方法、データ分析装置、データ作成プログラムおよびデータ分析プログラム
CN100388281C (zh) * 2004-10-29 2008-05-14 富士通株式会社 规则发现方法和规则发现装置
JP2013080375A (ja) * 2011-10-04 2013-05-02 Hitachi Ltd 個人情報匿名化装置及び方法

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2004126780A (ja) * 2002-09-30 2004-04-22 Toshiba Corp 分析用データ作成方法、データ分析方法、データ分析装置、データ作成プログラムおよびデータ分析プログラム
CN100388281C (zh) * 2004-10-29 2008-05-14 富士通株式会社 规则发现方法和规则发现装置
JP2013080375A (ja) * 2011-10-04 2013-05-02 Hitachi Ltd 個人情報匿名化装置及び方法

Similar Documents

Publication Publication Date Title
ElSayed et al. Situated analytics
US6230064B1 (en) Apparatus and a method for analyzing time series data for a plurality of items
JP4249674B2 (ja) 多次元データ表示方法および表示装置
JPH1115842A (ja) データマイニング装置
WO2014041699A1 (ja) データ分析方法、データ分析装置及びその処理プログラムを格納した記憶媒体
US20110015966A1 (en) Displaying data for a physical retail environment on a virtual illustration of the physical retail environment
JPWO2015162719A1 (ja) 情報提供装置、情報提供方法、プログラム、及び記録媒体
Lim et al. The consumer choice of e-channels as a purchasing avenue: an empirical investigation of the communicative aspects of information quality
JP2021530827A (ja) 品物関連性の決定
JP6066791B2 (ja) 商品情報提供システムおよび商品情報提供用プログラム
AU2013251190B2 (en) Information processing device, node extraction program, and node extraction method
CA3138745A1 (en) Method and device for circling and creating target population
JP5265414B2 (ja) ネットショッピング管理装置
JP2001188796A (ja) データ分析システム及びデータ分析方法並びにプログラムを記録したコンピュータ読み取り可能な記録媒体
JP2002197098A (ja) データマイニング装置
Sampaio et al. Loyalty in retailing: multidimensional approach to customer perceived value
US20060253486A1 (en) Method and apparatus to assist in the manipulation and understanding of marketing data
JP2011128748A (ja) グラフ作成装置、グラフ作成方法およびグラフ作成プログラム
Sumeisey The effect of visual merchandising on consumer impulse buying behavior at the executive store manado
Pal Factors affecting impulse buying on online shopping amongst youth: a structural equation modeling approach
JP4629280B2 (ja) 知識発見支援装置および支援方法
JP2002269423A (ja) ポイント変換サービスシステム
JP2006092384A (ja) データ処理方法および装置
NZ506083A (en) Warranty data visualisation system and method
JP7471602B2 (ja) 情報処理装置及び情報処理方法

Legal Events

Date Code Title Description
A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20060404

A762 Written abandonment of application

Free format text: JAPANESE INTERMEDIATE CODE: A762

Effective date: 20060428