JPH1115842A - データマイニング装置 - Google Patents
データマイニング装置Info
- Publication number
- JPH1115842A JPH1115842A JP16707097A JP16707097A JPH1115842A JP H1115842 A JPH1115842 A JP H1115842A JP 16707097 A JP16707097 A JP 16707097A JP 16707097 A JP16707097 A JP 16707097A JP H1115842 A JPH1115842 A JP H1115842A
- Authority
- JP
- Japan
- Prior art keywords
- rule
- association rule
- evaluation
- correlation
- data mining
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000007418 data mining Methods 0.000 title claims abstract description 58
- 238000011156 evaluation Methods 0.000 claims abstract description 129
- 230000014509 gene expression Effects 0.000 claims description 13
- 238000000034 method Methods 0.000 claims description 8
- 238000010219 correlation analysis Methods 0.000 claims description 5
- 230000001174 ascending effect Effects 0.000 claims description 4
- 238000004364 calculation method Methods 0.000 claims description 3
- 238000012545 processing Methods 0.000 abstract description 5
- 230000008707 rearrangement Effects 0.000 abstract 1
- 239000008267 milk Substances 0.000 description 21
- 235000013336 milk Nutrition 0.000 description 18
- 210000004080 milk Anatomy 0.000 description 18
- 235000008429 bread Nutrition 0.000 description 13
- 230000000694 effects Effects 0.000 description 8
- 238000004458 analytical method Methods 0.000 description 6
- 235000014121 butter Nutrition 0.000 description 5
- 238000010586 diagram Methods 0.000 description 5
- 235000011389 fruit/vegetable juice Nutrition 0.000 description 3
- 239000000284 extract Substances 0.000 description 2
- 238000013518 transcription Methods 0.000 description 2
- 230000035897 transcription Effects 0.000 description 2
- 125000002066 L-histidyl group Chemical group [H]N1C([H])=NC(C([H])([H])[C@](C(=O)[*])([H])N([H])[H])=C1[H] 0.000 description 1
- 230000003321 amplification Effects 0.000 description 1
- 230000001364 causal effect Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 235000015243 ice cream Nutrition 0.000 description 1
- 238000005065 mining Methods 0.000 description 1
- 238000003199 nucleic acid amplification method Methods 0.000 description 1
- 238000013138 pruning Methods 0.000 description 1
- 238000000528 statistical test Methods 0.000 description 1
- 230000004936 stimulating effect Effects 0.000 description 1
- 238000012795 verification Methods 0.000 description 1
- 238000012800 visualization Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/24—Querying
- G06F16/245—Query processing
- G06F16/2458—Special types of queries, e.g. statistical queries, fuzzy queries or distributed queries
- G06F16/2465—Query processing support for facilitating data mining operations in structured databases
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F2216/00—Indexing scheme relating to additional aspects of information retrieval not explicitly covered by G06F16/00 and subgroups
- G06F2216/03—Data mining
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y10—TECHNICAL SUBJECTS COVERED BY FORMER USPC
- Y10S—TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y10S707/00—Data processing: database and file management or data structures
- Y10S707/99931—Database or file accessing
- Y10S707/99933—Query processing, i.e. searching
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y10—TECHNICAL SUBJECTS COVERED BY FORMER USPC
- Y10S—TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y10S707/00—Data processing: database and file management or data structures
- Y10S707/99931—Database or file accessing
- Y10S707/99933—Query processing, i.e. searching
- Y10S707/99936—Pattern matching access
Landscapes
- Engineering & Computer Science (AREA)
- Databases & Information Systems (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Software Systems (AREA)
- Probability & Statistics with Applications (AREA)
- Mathematical Physics (AREA)
- Computational Linguistics (AREA)
- Data Mining & Analysis (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Fuzzy Systems (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
(57)【要約】
【課題】 ユーザの使用目的毎に異なる相関ルールの評
価尺度を設定できるようにすることにより、データマイ
ニングの結果抽出された大量の相関ルールの中から、ユ
ーザが自分の目的に役立つ有効な相関ルールを見つけ出
す作業を容易に行えるデータマイニング装置を得ること
を目的とする。 【解決手段】 相関ルール生成手段12はデータベース
16を基に相関ルールファイル17を生成し出力する。
評価尺度指定手段13は、ユーザが指定した評価尺度に
基づき評価尺度ファイル18を出力する。相関ルール評
価手段14は、評価尺度ファイル18の基づいて評価値
を算出し、相関ルールファイル17中の相関ルールの価
値に関する情報を更新する。実行結果表示手段15は、
相関ルールファイル17に基づいて、再評価された相関
ルールの価値情報を表示すると共に、表示順序の並び替
えや、表示する相関ルールの限定処理を行った上で相関
ルールを表示する。
価尺度を設定できるようにすることにより、データマイ
ニングの結果抽出された大量の相関ルールの中から、ユ
ーザが自分の目的に役立つ有効な相関ルールを見つけ出
す作業を容易に行えるデータマイニング装置を得ること
を目的とする。 【解決手段】 相関ルール生成手段12はデータベース
16を基に相関ルールファイル17を生成し出力する。
評価尺度指定手段13は、ユーザが指定した評価尺度に
基づき評価尺度ファイル18を出力する。相関ルール評
価手段14は、評価尺度ファイル18の基づいて評価値
を算出し、相関ルールファイル17中の相関ルールの価
値に関する情報を更新する。実行結果表示手段15は、
相関ルールファイル17に基づいて、再評価された相関
ルールの価値情報を表示すると共に、表示順序の並び替
えや、表示する相関ルールの限定処理を行った上で相関
ルールを表示する。
Description
【0001】
【発明の属する技術分野】この発明は、データベース中
の大量データを分析し、データの属性間に存在する相関
ルールを抽出するデータマイニング装置に関するもので
ある。
の大量データを分析し、データの属性間に存在する相関
ルールを抽出するデータマイニング装置に関するもので
ある。
【0002】
【従来の技術】データマイニングとは、大規模データベ
ース中の大量データから、そのデータに含まれるデータ
項目間に存在する規則性や因果関係を発掘することをい
うが、その代表的なものとして、相関分析がある。これ
は、相関ルールと呼ばれる相関ルールを抽出するもので
ある。相関ルールとは、データ項目間に存在する相関関
係を相関ルールの形で表現したものであり、具体例とし
て、たとえば「データ項目(部分集合)Aとデータ項目
(部分集合)Bが同一トランザクションに存在する時に
は、高頻度でデータ項目(部分集合)Cも同時に存在す
る」といったような規則性(相関関係)を「A,B→
C」などと表現したものを言う。代表的な相関分析の例
としてバスケット分析と呼ばれるものがある。これは、
小売業において、客が同時にバスケット(=買い物か
ご)に入れる商品の相関関係を求めるもので、同時購買
分析とも呼ばれる。バスケット分析では、蓄積されたレ
シートデータを用いた相関分析により、たとえば「パン
→牛乳」(パンを買う客は、同時に牛乳も買う)という
相関ルールが求められる。
ース中の大量データから、そのデータに含まれるデータ
項目間に存在する規則性や因果関係を発掘することをい
うが、その代表的なものとして、相関分析がある。これ
は、相関ルールと呼ばれる相関ルールを抽出するもので
ある。相関ルールとは、データ項目間に存在する相関関
係を相関ルールの形で表現したものであり、具体例とし
て、たとえば「データ項目(部分集合)Aとデータ項目
(部分集合)Bが同一トランザクションに存在する時に
は、高頻度でデータ項目(部分集合)Cも同時に存在す
る」といったような規則性(相関関係)を「A,B→
C」などと表現したものを言う。代表的な相関分析の例
としてバスケット分析と呼ばれるものがある。これは、
小売業において、客が同時にバスケット(=買い物か
ご)に入れる商品の相関関係を求めるもので、同時購買
分析とも呼ばれる。バスケット分析では、蓄積されたレ
シートデータを用いた相関分析により、たとえば「パン
→牛乳」(パンを買う客は、同時に牛乳も買う)という
相関ルールが求められる。
【0003】データマイニングにおける相関分析の基本
的な処理は、相関ルールの候補の生成とその検証であ
る。つまり、相関ルールの候補を全てのデータ項目の組
み合わせから生成し、この候補一つ一つについて、実際
に成り立っているかどうかをデータベース検索による数
え上げによって調べるという方法である。しかし、これ
では効率が悪いので、従来のデータマイニングでは、有
効な相関ルールを効率よく発見するため、この処理の中
で支持度と確信度という足切り基準によって、相関相関
ルールの候補の数をしぼる枝刈りを行いながら処理を行
っている。
的な処理は、相関ルールの候補の生成とその検証であ
る。つまり、相関ルールの候補を全てのデータ項目の組
み合わせから生成し、この候補一つ一つについて、実際
に成り立っているかどうかをデータベース検索による数
え上げによって調べるという方法である。しかし、これ
では効率が悪いので、従来のデータマイニングでは、有
効な相関ルールを効率よく発見するため、この処理の中
で支持度と確信度という足切り基準によって、相関相関
ルールの候補の数をしぼる枝刈りを行いながら処理を行
っている。
【0004】支持度とは、その相関ルールの一般性を表
わす尺度であり、確信度とは、その相関ルールの正確さ
を表わす尺度である。相関ルールは一般に、この支持度
と確信度と呼ばれる値を伴って、「A→B」という形の
論理式で表わされる(但し、AとBはそれぞれ空でない
データ項目の集合であり、交わらないものとする)。こ
の場合、支持度は、全レコードのうち部分集合Aと部分
集合Bの両方に属する要素の集合「AUB」を含むレコ
ードの占める割合で表わされ、確信度は、Aを含むレコ
ードのうち、Bも同時に含むレコードの割合で表わされ
る。たとえば、前述の「パン→牛乳」の例で言えば、全
レシート件数(レコード件数)のうち、パンを購入した
客の割合が20%で、パンと牛乳両方を購入した客の割
合が12%だとすると、相関ルール「パン→牛乳」の支
持度は12%、確信度は60%(=12%/20%)と
いうことになる。
わす尺度であり、確信度とは、その相関ルールの正確さ
を表わす尺度である。相関ルールは一般に、この支持度
と確信度と呼ばれる値を伴って、「A→B」という形の
論理式で表わされる(但し、AとBはそれぞれ空でない
データ項目の集合であり、交わらないものとする)。こ
の場合、支持度は、全レコードのうち部分集合Aと部分
集合Bの両方に属する要素の集合「AUB」を含むレコ
ードの占める割合で表わされ、確信度は、Aを含むレコ
ードのうち、Bも同時に含むレコードの割合で表わされ
る。たとえば、前述の「パン→牛乳」の例で言えば、全
レシート件数(レコード件数)のうち、パンを購入した
客の割合が20%で、パンと牛乳両方を購入した客の割
合が12%だとすると、相関ルール「パン→牛乳」の支
持度は12%、確信度は60%(=12%/20%)と
いうことになる。
【0005】従来のデータマイニング装置では、相関ル
ールを生成する時に、支持度と確信度の下限値をそれぞ
れ設定し、この下限値をともに上回るすべての相関ルー
ルを抽出する。相関ルールを抽出する方法については、
例えば特開平8−263346号公報、あるいは特開平
8−287106号公報に詳しく述べられているよう
に、まず支持度が下限値を上回る相関ルールの候補を生
成する。この相関ルールの候補生成については、特に特
開平8−263346号公報に詳しく述べられている。
その後にその相関ルールの候補の確信度を調べて下限値
を上回る候補を採用して、最終的な相関ルールとして出
力する。すなわち、この方法で得られる相関ルールは支
持度と確信度の2つの指標のみによって抽出されたもの
であり、その他の評価、例えばユーザにとって興味のあ
る売り上げへの寄与や、ユーザの意思等の評価は一切加
わっていない。
ールを生成する時に、支持度と確信度の下限値をそれぞ
れ設定し、この下限値をともに上回るすべての相関ルー
ルを抽出する。相関ルールを抽出する方法については、
例えば特開平8−263346号公報、あるいは特開平
8−287106号公報に詳しく述べられているよう
に、まず支持度が下限値を上回る相関ルールの候補を生
成する。この相関ルールの候補生成については、特に特
開平8−263346号公報に詳しく述べられている。
その後にその相関ルールの候補の確信度を調べて下限値
を上回る候補を採用して、最終的な相関ルールとして出
力する。すなわち、この方法で得られる相関ルールは支
持度と確信度の2つの指標のみによって抽出されたもの
であり、その他の評価、例えばユーザにとって興味のあ
る売り上げへの寄与や、ユーザの意思等の評価は一切加
わっていない。
【0006】このようなデータマイニングの結果得られ
る相関ルールは、大抵の場合、大量である。しかもその
うちのほとんどは、ユーザが求めているものではなく、
既に陳腐化したものであったり、意味のない相関であっ
たりする。ユーザは、この無数の相関ルールの中から、
それぞれ自分の目的に役立つ有効な相関ルールを見つけ
出す作業を行わなければならない。
る相関ルールは、大抵の場合、大量である。しかもその
うちのほとんどは、ユーザが求めているものではなく、
既に陳腐化したものであったり、意味のない相関であっ
たりする。ユーザは、この無数の相関ルールの中から、
それぞれ自分の目的に役立つ有効な相関ルールを見つけ
出す作業を行わなければならない。
【0007】この問題を解決し、ユーザにとって有効な
相関ルールだけを抽出するためには、相関ルールの有効
度を評価する尺度が必要となる。たとえば、特開平8−
77010号公報では、相関ルールが対象とするレコー
ド数で表現されるカバー率(前述の支持度に相当)と、
相関ルールの正解率で表現されるヒット率(前述の確信
度に相当)から相関ルールの評価尺度を算出している。
相関ルールだけを抽出するためには、相関ルールの有効
度を評価する尺度が必要となる。たとえば、特開平8−
77010号公報では、相関ルールが対象とするレコー
ド数で表現されるカバー率(前述の支持度に相当)と、
相関ルールの正解率で表現されるヒット率(前述の確信
度に相当)から相関ルールの評価尺度を算出している。
【0008】また、電気情報通信学会信学技報、199
5−05、41頁−48頁の福田剛志、森下真一両氏に
よる「相関ルールの可視化について」なる文献では、統
計的検定を用いて支持度、確信度の評価を行うことによ
り、「面白くない相関ルール」すなわち有効でない相関
ルールをふるいにかけるという方法が解説されている。
5−05、41頁−48頁の福田剛志、森下真一両氏に
よる「相関ルールの可視化について」なる文献では、統
計的検定を用いて支持度、確信度の評価を行うことによ
り、「面白くない相関ルール」すなわち有効でない相関
ルールをふるいにかけるという方法が解説されている。
【0009】
【発明が解決しようとする課題】従来のデータマイニン
グ装置では、相関ルールの有効性の評価尺度を、確信度
と支持度に基づいて定めている。つまり、一般性が高く
(支持度が高く)、精度の高い(確信度の高い)相関ル
ールが有効な相関ルールとして評価される。このような
評価尺度は、データの特徴を精度よく表現することを目
的としたデータマイニングにおいては、相関ルールの価
値を評価するひとつの基準として有効である。
グ装置では、相関ルールの有効性の評価尺度を、確信度
と支持度に基づいて定めている。つまり、一般性が高く
(支持度が高く)、精度の高い(確信度の高い)相関ル
ールが有効な相関ルールとして評価される。このような
評価尺度は、データの特徴を精度よく表現することを目
的としたデータマイニングにおいては、相関ルールの価
値を評価するひとつの基準として有効である。
【0010】しかし、データマイニングは上記のような
目的のみに使用されるものではなく、むしろデータマイ
ニングの結果得られた相関ルールを意思決定支援、戦略
立案等、何かに役立てたいという要求のもとに行われる
のが普通である。データマイニングによって得られた相
関ルールを何かの目的に応用しようとする時、たとえ
ば、前述のバスケット分析の結果得られた相関ルールを
販売促進による売上げ増のための戦略立案に役立てたい
と考えた場合、支持度、確信度によって高く評価された
相関ルールが、必ずしもユーザの目的(この場合は売上
げ増)に対して有効性の高い相関ルールであるとは限ら
ない。この場合、ユーザの目的に対して有効性の高い相
関ルールとは、たとえば大幅な売上げ増を見込める相関
ルールである。
目的のみに使用されるものではなく、むしろデータマイ
ニングの結果得られた相関ルールを意思決定支援、戦略
立案等、何かに役立てたいという要求のもとに行われる
のが普通である。データマイニングによって得られた相
関ルールを何かの目的に応用しようとする時、たとえ
ば、前述のバスケット分析の結果得られた相関ルールを
販売促進による売上げ増のための戦略立案に役立てたい
と考えた場合、支持度、確信度によって高く評価された
相関ルールが、必ずしもユーザの目的(この場合は売上
げ増)に対して有効性の高い相関ルールであるとは限ら
ない。この場合、ユーザの目的に対して有効性の高い相
関ルールとは、たとえば大幅な売上げ増を見込める相関
ルールである。
【0011】このように、一般的に相関ルールの価値と
いうものは、その相関ルールをどのように使用するか、
というユーザの目的によって異なるものであるが、従来
のような支持度、確信度による画一的な評価尺度では、
必ずしもユーザの目的に関して適正に評価できないとい
う問題点がある。すなわち、従来の技術では、支持度、
確信度のみで相関ルールの価値を判断しているので、
「その相関ルールを適用した場合、どの位の利益が見込
めるか」ということを知りたい、「利益の大きな相関ル
ールを強調して表示したい」という目的でデータマイニ
ングを行なっている場合、支持度、確信度は利益の見込
みとは無関係であるので、この目的に沿って相関ルール
を評価できないという問題点がある。
いうものは、その相関ルールをどのように使用するか、
というユーザの目的によって異なるものであるが、従来
のような支持度、確信度による画一的な評価尺度では、
必ずしもユーザの目的に関して適正に評価できないとい
う問題点がある。すなわち、従来の技術では、支持度、
確信度のみで相関ルールの価値を判断しているので、
「その相関ルールを適用した場合、どの位の利益が見込
めるか」ということを知りたい、「利益の大きな相関ル
ールを強調して表示したい」という目的でデータマイニ
ングを行なっている場合、支持度、確信度は利益の見込
みとは無関係であるので、この目的に沿って相関ルール
を評価できないという問題点がある。
【0012】この発明は上記のような問題点を解消する
ためになされたもので、ユーザの使用目的毎に異なる相
関ルールの評価尺度を適用することのできるデータマイ
ニング装置を得ることを目的としており、これにより、
データマイニングの結果抽出された大量の相関ルールの
中から、ユーザが自分の目的に役立つ有効な相関ルール
を見つけ出す作業を容易に行えるデータマイニング装置
を得ることを目的としている。
ためになされたもので、ユーザの使用目的毎に異なる相
関ルールの評価尺度を適用することのできるデータマイ
ニング装置を得ることを目的としており、これにより、
データマイニングの結果抽出された大量の相関ルールの
中から、ユーザが自分の目的に役立つ有効な相関ルール
を見つけ出す作業を容易に行えるデータマイニング装置
を得ることを目的としている。
【0013】
【課題を解決するための手段】本発明の第1の発明のデ
ータマイニング装置は、データベースからデータを受
け、データ項目間の相関ルールを生成する相関ルール生
成手段と、ユーザが、その使用目的毎に異なる相関ルー
ルの評価尺度を指定できる評価尺度指定手段と、上記評
価尺度指定手段においてユーザが指定した評価尺度を用
いて上記相関ルール生成手段によって生成された相関ル
ールの価値を算出する相関ルール評価手段と、上記相関
ルール生成手段によって生成された相関ルールを上記相
関ルール評価手段が算出した相関ルールの価値に基づい
て表示する実行結果表示手段を備えたるように構成され
る。
ータマイニング装置は、データベースからデータを受
け、データ項目間の相関ルールを生成する相関ルール生
成手段と、ユーザが、その使用目的毎に異なる相関ルー
ルの評価尺度を指定できる評価尺度指定手段と、上記評
価尺度指定手段においてユーザが指定した評価尺度を用
いて上記相関ルール生成手段によって生成された相関ル
ールの価値を算出する相関ルール評価手段と、上記相関
ルール生成手段によって生成された相関ルールを上記相
関ルール評価手段が算出した相関ルールの価値に基づい
て表示する実行結果表示手段を備えたるように構成され
る。
【0014】また、本発明の第2の発明のデータマイニ
ング装置における評価尺度指定手段は、ユーザが相関ル
ールを利用した場合に発生する損失値または利益値(以
下、相関ルール適用時のコスト)と、その相関ルールが
成立した場合に発生する利益値または損失値(以下、相
関ルール成立時の利益)を指定することにより評価尺度
の指定を行うように構成される。
ング装置における評価尺度指定手段は、ユーザが相関ル
ールを利用した場合に発生する損失値または利益値(以
下、相関ルール適用時のコスト)と、その相関ルールが
成立した場合に発生する利益値または損失値(以下、相
関ルール成立時の利益)を指定することにより評価尺度
の指定を行うように構成される。
【0015】また、本発明の第3の発明のデータマイニ
ング装置における評価尺度指定手段において、相関ルー
ル適用時のコストおよび相関ルール成立時の利益は、デ
ータ項目毎に各種項目について値が定義されたデータ辞
書中に定義された項目、または定数値、またはその両方
を項とする四則演算式を用いて記述されるように構成さ
れる。
ング装置における評価尺度指定手段において、相関ルー
ル適用時のコストおよび相関ルール成立時の利益は、デ
ータ項目毎に各種項目について値が定義されたデータ辞
書中に定義された項目、または定数値、またはその両方
を項とする四則演算式を用いて記述されるように構成さ
れる。
【0016】また、本発明の第4の発明のデータマイニ
ング装置における評価尺度指定手段は、指定した相関ル
ール適用時のコストおよび相関ルール成立時の利益に関
する情報を記憶装置に保存し、後でこれを読み込んで再
利用する機能を持つように構成される。
ング装置における評価尺度指定手段は、指定した相関ル
ール適用時のコストおよび相関ルール成立時の利益に関
する情報を記憶装置に保存し、後でこれを読み込んで再
利用する機能を持つように構成される。
【0017】また、本発明の第5の発明のデータマイニ
ング装置における相関ルール評価手段は、前記評価尺度
指定手段によって指定された相関ルール適用時のコスト
および相関ルール成立時の利益、前記データベース中で
の相関ルールの精度(正解率)を示す確信度、並びに前
記データベース中でその相関ルールが成立しているレコ
ード数の全レコード件数に対する割合を表す支持度に基
づいて評価値を算出するように構成される。
ング装置における相関ルール評価手段は、前記評価尺度
指定手段によって指定された相関ルール適用時のコスト
および相関ルール成立時の利益、前記データベース中で
の相関ルールの精度(正解率)を示す確信度、並びに前
記データベース中でその相関ルールが成立しているレコ
ード数の全レコード件数に対する割合を表す支持度に基
づいて評価値を算出するように構成される。
【0018】また、本発明の第6の発明のデータマイニ
ング装置における相関ルール評価手段は、相関ルール適
用時のコストおよび相関ルール成立時の利益を記述した
四則演算式を計算する際に、データ辞書中に定義された
項目の値を参照するように構成される。
ング装置における相関ルール評価手段は、相関ルール適
用時のコストおよび相関ルール成立時の利益を記述した
四則演算式を計算する際に、データ辞書中に定義された
項目の値を参照するように構成される。
【0019】また、本発明の第7の発明のデータマイニ
ング装置における実行結果表示手段は、演算の結果得ら
れた相関ルールのうち、相関ルール評価手段が算出した
評価値がユーザによって指定された基準値以上である相
関ルールのみを表示する機能を持つように構成される。
ング装置における実行結果表示手段は、演算の結果得ら
れた相関ルールのうち、相関ルール評価手段が算出した
評価値がユーザによって指定された基準値以上である相
関ルールのみを表示する機能を持つように構成される。
【0020】また、本発明の第8の発明のデータマイニ
ング装置における実行結果表示手段は、演算の結果得ら
れた相関ルールを、相関ルール評価手段が算出した評価
値に基づき、昇順または降順の並べ替え処理を行った上
で表示する機能を持つように構成される。
ング装置における実行結果表示手段は、演算の結果得ら
れた相関ルールを、相関ルール評価手段が算出した評価
値に基づき、昇順または降順の並べ替え処理を行った上
で表示する機能を持つように構成される。
【0021】
実施の形態1.以下、この発明の一実施の形態を図1を
用いて説明する。図1において、12はデータベース中
のデータ項目間に存在する相関ルールを生成する相関ル
ール生成手段、15は、上記相関ルール生成手段が生成
した相関ルールの表示を行い、さらにこの表示順序の並
べ替えや表示内容の限定(絞り込み)等の操作を行う実
行結果表示手段、13は上記相関ルール生成手段が生成
した相関ルールの価値の評価尺度をユーザが指定するた
めの評価尺度指定手段、14は上記評価尺度指定手段1
3において指定された評価尺度に基づいて上記相関ルー
ル生成手段12が生成した相関ルールの価値を算出する
相関ルール評価手段である。11は、上記相関ルール生
成手段12に対して、ユーザが情報を与え、上記相関ル
ール生成手段12を起動するユーザインタフェースであ
る。16は、本発明のデータマイニング装置で処理すべ
きデータを保存するデータベースである。17は相関ル
ール生成手段12で生成された相関ルールに関する相関
ルールファイルである。18は、評価尺度指定手段13
によって生成された評価尺度ファイル18である。評価
尺度ファイル18は記憶装置に記憶しておき、必要に応
じて必要することができる。19は評価尺度指定手段1
3によって評価尺度を指定する際に参照されるデータ辞
書である。
用いて説明する。図1において、12はデータベース中
のデータ項目間に存在する相関ルールを生成する相関ル
ール生成手段、15は、上記相関ルール生成手段が生成
した相関ルールの表示を行い、さらにこの表示順序の並
べ替えや表示内容の限定(絞り込み)等の操作を行う実
行結果表示手段、13は上記相関ルール生成手段が生成
した相関ルールの価値の評価尺度をユーザが指定するた
めの評価尺度指定手段、14は上記評価尺度指定手段1
3において指定された評価尺度に基づいて上記相関ルー
ル生成手段12が生成した相関ルールの価値を算出する
相関ルール評価手段である。11は、上記相関ルール生
成手段12に対して、ユーザが情報を与え、上記相関ル
ール生成手段12を起動するユーザインタフェースであ
る。16は、本発明のデータマイニング装置で処理すべ
きデータを保存するデータベースである。17は相関ル
ール生成手段12で生成された相関ルールに関する相関
ルールファイルである。18は、評価尺度指定手段13
によって生成された評価尺度ファイル18である。評価
尺度ファイル18は記憶装置に記憶しておき、必要に応
じて必要することができる。19は評価尺度指定手段1
3によって評価尺度を指定する際に参照されるデータ辞
書である。
【0022】次に、本発明のデータマイニング装置の動
作について説明する。ユーザはコマンド等によって、ユ
ーザインタフェース11を介して相関ルール生成手段1
2を起動し、データベース16に保存されたデータを相
関ルール生成手段12に入力する。相関ルール生成手段
12はデータベース16からのデータを処理して相関ル
ールファイル17を出力する。たとえば、上述の例によ
れば、データベース16には、データ項目(パン)Aと
データ項目(牛乳)Bが保存されており、ユーザからの
コマンドによって、「パン→牛乳」(パンを買う客は、
同時に牛乳も買うという相関ルール)という相関ルール
が相関ルール生成手段12から相関ルールファイル17
として出力される。この相関ルールファイル17は実行
結果表示手段15に入力される。実行結果表示手段15
は、相関ルールファイル17中の相関ルールを表示す
る。評価尺度指定手段13は評価尺度ファイル18を作
成するものであり、たとえば、図3に示すようなディス
プレイ画面を用いて、ユーザに相関ルールの評価尺度を
入力させ、ユーザが入力したその評価尺度を評価尺度フ
ァイル18に出力する。この評価尺度指定手段13は実
行結果表示手段15によって起動される。相関ルール評
価手段14は、相関ルールファイル17と評価尺度ファ
イル18とデータ辞書19を基に、相関ルールファイル
17に格納された個々の相関ルールに対して相関ルール
の価値を算出し、相関ルールファイル17中の個々の相
関ルールについて、相関ルールの価値に関する情報を更
新する。実行結果表示手段15は、この相関ルールファ
イル17に格納された相関ルールを表示する。
作について説明する。ユーザはコマンド等によって、ユ
ーザインタフェース11を介して相関ルール生成手段1
2を起動し、データベース16に保存されたデータを相
関ルール生成手段12に入力する。相関ルール生成手段
12はデータベース16からのデータを処理して相関ル
ールファイル17を出力する。たとえば、上述の例によ
れば、データベース16には、データ項目(パン)Aと
データ項目(牛乳)Bが保存されており、ユーザからの
コマンドによって、「パン→牛乳」(パンを買う客は、
同時に牛乳も買うという相関ルール)という相関ルール
が相関ルール生成手段12から相関ルールファイル17
として出力される。この相関ルールファイル17は実行
結果表示手段15に入力される。実行結果表示手段15
は、相関ルールファイル17中の相関ルールを表示す
る。評価尺度指定手段13は評価尺度ファイル18を作
成するものであり、たとえば、図3に示すようなディス
プレイ画面を用いて、ユーザに相関ルールの評価尺度を
入力させ、ユーザが入力したその評価尺度を評価尺度フ
ァイル18に出力する。この評価尺度指定手段13は実
行結果表示手段15によって起動される。相関ルール評
価手段14は、相関ルールファイル17と評価尺度ファ
イル18とデータ辞書19を基に、相関ルールファイル
17に格納された個々の相関ルールに対して相関ルール
の価値を算出し、相関ルールファイル17中の個々の相
関ルールについて、相関ルールの価値に関する情報を更
新する。実行結果表示手段15は、この相関ルールファ
イル17に格納された相関ルールを表示する。
【0023】次に、図2のフローチャートを用いて、図
1の各手段における処理の流れを説明する。まず、ステ
ップ21において、相関ルール生成手段12は、データ
ベース16からのデータに基づいて、相関ルールファイ
ル17を生成する。この相関ルール生成手段12は公知
の手段、たとえば、従来の技術として述べた特開平8−
263346号公報、あるいは特開平8−287106
号公報を用いるものとする。この場合、このアルゴリズ
ムにおいて使用される「支持度」と「確信度」の2つの
情報は、ユーザインタフェース11を介してユーザから
与えられる。
1の各手段における処理の流れを説明する。まず、ステ
ップ21において、相関ルール生成手段12は、データ
ベース16からのデータに基づいて、相関ルールファイ
ル17を生成する。この相関ルール生成手段12は公知
の手段、たとえば、従来の技術として述べた特開平8−
263346号公報、あるいは特開平8−287106
号公報を用いるものとする。この場合、このアルゴリズ
ムにおいて使用される「支持度」と「確信度」の2つの
情報は、ユーザインタフェース11を介してユーザから
与えられる。
【0024】次に、ステップ22において、実行結果表
示手段15は、相関ルール生成手段12が出力した相関
ルールファイル17を入力し、相関ルールファイル17
に格納された相関ルールを実行結果として表示する。こ
こで、相関ルール生成手段12が生成した相関ルールフ
ァイル17は、指定された支持度、確信度以上の相関ル
ールを全て格納している。しかし、この段階では、まだ
相関ルールの評価尺度としては、その相関ルールの支持
度および確信度のみが計算されており、各相関ルールに
ついて利益等の他の評価基準はこの段階では計算されて
いない。必要ならば、実行結果表示手段15は、この支
持度、確信度の大きさに基づいて表示順の並び替えや表
示する相関ルールの絞り込みをすることもできる。
示手段15は、相関ルール生成手段12が出力した相関
ルールファイル17を入力し、相関ルールファイル17
に格納された相関ルールを実行結果として表示する。こ
こで、相関ルール生成手段12が生成した相関ルールフ
ァイル17は、指定された支持度、確信度以上の相関ル
ールを全て格納している。しかし、この段階では、まだ
相関ルールの評価尺度としては、その相関ルールの支持
度および確信度のみが計算されており、各相関ルールに
ついて利益等の他の評価基準はこの段階では計算されて
いない。必要ならば、実行結果表示手段15は、この支
持度、確信度の大きさに基づいて表示順の並び替えや表
示する相関ルールの絞り込みをすることもできる。
【0025】次にステップ23において、ユーザは、評
価尺度指定手段13を用いて、評価尺度の設定を行う。
この評価尺度の設定は、以下に述べるように、相関ルー
ル適用時のコストと、相関ルール成立時の利益を指定す
ることにより行う。相関ルール適用時のコストおよび相
関ルール成立時の利益は、それぞれ数式の形で指定す
る。数式は、相関ルールの左辺(条件部)と右辺(結論
部)それぞれに現れるデータ項目についての各種定義情
報が格納されたデータ辞書19中の項目か定数値を項と
する四則演算式の形式をとる。
価尺度指定手段13を用いて、評価尺度の設定を行う。
この評価尺度の設定は、以下に述べるように、相関ルー
ル適用時のコストと、相関ルール成立時の利益を指定す
ることにより行う。相関ルール適用時のコストおよび相
関ルール成立時の利益は、それぞれ数式の形で指定す
る。数式は、相関ルールの左辺(条件部)と右辺(結論
部)それぞれに現れるデータ項目についての各種定義情
報が格納されたデータ辞書19中の項目か定数値を項と
する四則演算式の形式をとる。
【0026】図3に、この数式で評価尺度を指定するた
めの評価尺度指定画面を示す。前記相関ルール適用時の
コストは、相関ルール適用時コストエディットコントロ
ール32に入力し、また前記相関ルール成立時の利益
は、相関ルール成立時利益エディットコントロール33
に、それぞれ数式の形式で入力する。数式は、「右辺<
項目名>」または「左辺<項目名>」という2パターンの
変数と、定数を項とする四則演算式でそれぞれエディッ
トコントロール32およびエディットコントロール33
で指定する。ここで、「右辺<項目名>」は、相関ルール
の右辺(=結論部)に現れるデータ項目について、デー
タ辞書中で、カッコ<>内に指定された項目に対して定
義されている値、「左辺<項目名>」は、相関ルールの左
辺(=条件部)に現れるデータ項目について、データ辞
書中で、カッコ<>内に指定された項目に対して定義さ
れている値、という意味である。
めの評価尺度指定画面を示す。前記相関ルール適用時の
コストは、相関ルール適用時コストエディットコントロ
ール32に入力し、また前記相関ルール成立時の利益
は、相関ルール成立時利益エディットコントロール33
に、それぞれ数式の形式で入力する。数式は、「右辺<
項目名>」または「左辺<項目名>」という2パターンの
変数と、定数を項とする四則演算式でそれぞれエディッ
トコントロール32およびエディットコントロール33
で指定する。ここで、「右辺<項目名>」は、相関ルール
の右辺(=結論部)に現れるデータ項目について、デー
タ辞書中で、カッコ<>内に指定された項目に対して定
義されている値、「左辺<項目名>」は、相関ルールの左
辺(=条件部)に現れるデータ項目について、データ辞
書中で、カッコ<>内に指定された項目に対して定義さ
れている値、という意味である。
【0027】簡単な例をあげて説明する。図4は、デー
タ辞書の一例を示すイメージである。この例では、デー
タ辞書には、パン、バター、ミルクなどの各データ項目
毎に、「定価」「売値」「仕入値」などの項目について
の値が定義されている。ここで、たとえば、「パン、バ
ター→ミルク(パン、バターを購入する人はミルクを購
入することを意味する)」という相関ルールがあったと
する。この相関ルールにおいて、たとえば「右辺<売値>
−右辺<仕入値>」という数式は、相関ルールの右辺のデ
ータ項目が「ミルク」であるので、この数式は「ミルク
<売値>−ミルク<仕入値>」となる。従って、「ミルク」
というデータ項目について、データ辞書中で定義されて
いる「売値」の値(この例では120)から、同じく
「ミルク」についてデータ辞書中で定義されている「仕
入値」の値(この例では80)をひいた結果、という意
味になる。さらに、詳細に記述すると、「ミルク<売値>
−ミルク<仕入値>」=120−80=40となる。
タ辞書の一例を示すイメージである。この例では、デー
タ辞書には、パン、バター、ミルクなどの各データ項目
毎に、「定価」「売値」「仕入値」などの項目について
の値が定義されている。ここで、たとえば、「パン、バ
ター→ミルク(パン、バターを購入する人はミルクを購
入することを意味する)」という相関ルールがあったと
する。この相関ルールにおいて、たとえば「右辺<売値>
−右辺<仕入値>」という数式は、相関ルールの右辺のデ
ータ項目が「ミルク」であるので、この数式は「ミルク
<売値>−ミルク<仕入値>」となる。従って、「ミルク」
というデータ項目について、データ辞書中で定義されて
いる「売値」の値(この例では120)から、同じく
「ミルク」についてデータ辞書中で定義されている「仕
入値」の値(この例では80)をひいた結果、という意
味になる。さらに、詳細に記述すると、「ミルク<売値>
−ミルク<仕入値>」=120−80=40となる。
【0028】同様に、「−(左辺<売値>×0.2+10
0)」という式は、上記相関ルールの左辺に現れている
データ項目について、データ辞書中で定義されている
「売値」の値を0.2倍し、100を加えた結果のマイ
ナス値、という意味になる。この相関ルールの左辺は複
数のデータ項目を含んでいるが、このような場合、「左
辺<売値>」は、左辺のデータ項目それぞれの売値を足し
あわせたもの、として考える。つまりこの例では、デー
タ項目「パン」の「売値」とデータ項目「バター」の
「売値」を足したものが「左辺<売値>」である。
0)」という式は、上記相関ルールの左辺に現れている
データ項目について、データ辞書中で定義されている
「売値」の値を0.2倍し、100を加えた結果のマイ
ナス値、という意味になる。この相関ルールの左辺は複
数のデータ項目を含んでいるが、このような場合、「左
辺<売値>」は、左辺のデータ項目それぞれの売値を足し
あわせたもの、として考える。つまりこの例では、デー
タ項目「パン」の「売値」とデータ項目「バター」の
「売値」を足したものが「左辺<売値>」である。
【0029】エディットコントロール32および33へ
の数式の入力はキーボードから直接行えるが、ボタン3
4、ボタン35をクリックすると、それぞれ、図5に示
すように、データ辞書に定義されている項目が一覧表示
されたリストボックス40が現れるので、その中に表示
された項目をクリックすることにより選択することもで
きる。
の数式の入力はキーボードから直接行えるが、ボタン3
4、ボタン35をクリックすると、それぞれ、図5に示
すように、データ辞書に定義されている項目が一覧表示
されたリストボックス40が現れるので、その中に表示
された項目をクリックすることにより選択することもで
きる。
【0030】たとえば、エディットコントロール32を
クリックしてフォーカスをあらかじめエディットコント
ロール32に設定しておき、コントロールボタン35を
クリックすると、図5のようにリストボックス40があ
らわれるので、この中からたとえば「売値」をクリック
すると、「左辺<売値>」という文字がエディットコント
ロール32に転記される。エディットコントロール32
をクリックしてフォーカスをあらかじめエディットコン
トロール32に設定しておき、コントロールボタン34
で同様の操作を行った場合には、「右辺<売値>」という
文字がエディットコントロール32に転記される。上記
の例ではフォーカスがエディットコントロール32に設
定された例を示したが、この転記については、エディッ
トコントロール32、または33のどちらがフォーカス
を持っているかによって決まる。フォーカスをあらかじ
めエディットコントロール33に設定しておくと、転記
はフォーカスの当たっているエディットコントロール3
3に対して行われる。
クリックしてフォーカスをあらかじめエディットコント
ロール32に設定しておき、コントロールボタン35を
クリックすると、図5のようにリストボックス40があ
らわれるので、この中からたとえば「売値」をクリック
すると、「左辺<売値>」という文字がエディットコント
ロール32に転記される。エディットコントロール32
をクリックしてフォーカスをあらかじめエディットコン
トロール32に設定しておき、コントロールボタン34
で同様の操作を行った場合には、「右辺<売値>」という
文字がエディットコントロール32に転記される。上記
の例ではフォーカスがエディットコントロール32に設
定された例を示したが、この転記については、エディッ
トコントロール32、または33のどちらがフォーカス
を持っているかによって決まる。フォーカスをあらかじ
めエディットコントロール33に設定しておくと、転記
はフォーカスの当たっているエディットコントロール3
3に対して行われる。
【0031】ボタン38は、評価尺度指定画面で指定し
た評価尺度に名前を付けて保存しておくためのボタンで
ある。エディットコントロール31に評価尺度の名前を
入力し、ボタン38をクリックすると、指定した評価尺
度を保存しておくこともできる。このようにして保存し
た評価尺度は、後で読み込んで再利用することが可能で
ある。ボタン39をクリックすると、現在保存されてい
る評価尺度の名前の一覧が表示されるので、この中から
使用する評価尺度を選択する。ボタン37をクリックす
ると評価尺度の指定は中止される。ボタン36をクリッ
クするとエディットコントロール32、33で指定され
た数式で評価尺度が確定され、評価尺度の指定を終了す
る。
た評価尺度に名前を付けて保存しておくためのボタンで
ある。エディットコントロール31に評価尺度の名前を
入力し、ボタン38をクリックすると、指定した評価尺
度を保存しておくこともできる。このようにして保存し
た評価尺度は、後で読み込んで再利用することが可能で
ある。ボタン39をクリックすると、現在保存されてい
る評価尺度の名前の一覧が表示されるので、この中から
使用する評価尺度を選択する。ボタン37をクリックす
ると評価尺度の指定は中止される。ボタン36をクリッ
クするとエディットコントロール32、33で指定され
た数式で評価尺度が確定され、評価尺度の指定を終了す
る。
【0032】再び図2に戻る。ステップ24では、相関
ルール評価手段14は、ステップ23でユーザが指定し
た評価尺度を用いて相関ルールの価値の算出を行い、相
関ルールファイル17中の相関ルールの価値に関する情
報を更新する。このステップ24における相関ルールの
価値の算出は、次のように行う。 相関ルールの価値=相関ルール成立時の利益×(相関ル
ールの支持度×相関ルールの確信度)+相関ルール適用
時のコスト×相関ルールの支持度 この式で相関ルール成立時の利益とは、図3のエディッ
トコントロール33で指定された数式によって、相関ル
ール毎に求められる値であり、相関ルール適用時のコス
トとは、同じく図3のエディットコントロール32で指
定された数式によって、相関ルール毎に求められる値で
ある。たとえば、「右辺<売値>−右辺<仕入値>」が32
で指定されているとします。相関ルール「パン、バター
→ミルク」では、「ミルクの売値−ミルクの仕入値」
が、相関ルール「アイスクリーム→ジュース」では、
「ジュースの売値−ジュースの仕入値」という様に、相
関相関ルール毎に計算されます。この数式を評価する
(計算する)際、式中で使用されている変数、たとえ
ば、上述の計算では「ミルクの売値と仕入値」、「ジュ
ースの売値と仕入値」については、データ辞書中で定義
されている値を参照して使用する。
ルール評価手段14は、ステップ23でユーザが指定し
た評価尺度を用いて相関ルールの価値の算出を行い、相
関ルールファイル17中の相関ルールの価値に関する情
報を更新する。このステップ24における相関ルールの
価値の算出は、次のように行う。 相関ルールの価値=相関ルール成立時の利益×(相関ル
ールの支持度×相関ルールの確信度)+相関ルール適用
時のコスト×相関ルールの支持度 この式で相関ルール成立時の利益とは、図3のエディッ
トコントロール33で指定された数式によって、相関ル
ール毎に求められる値であり、相関ルール適用時のコス
トとは、同じく図3のエディットコントロール32で指
定された数式によって、相関ルール毎に求められる値で
ある。たとえば、「右辺<売値>−右辺<仕入値>」が32
で指定されているとします。相関ルール「パン、バター
→ミルク」では、「ミルクの売値−ミルクの仕入値」
が、相関ルール「アイスクリーム→ジュース」では、
「ジュースの売値−ジュースの仕入値」という様に、相
関相関ルール毎に計算されます。この数式を評価する
(計算する)際、式中で使用されている変数、たとえ
ば、上述の計算では「ミルクの売値と仕入値」、「ジュ
ースの売値と仕入値」については、データ辞書中で定義
されている値を参照して使用する。
【0033】従来技術のところでも説明したように、相
関ルールの支持度は、その相関ルールの一般性を表す数
値であり、相関ルールを利用する際に、支持度が大きい
ほど適用できる場面が多いと考えることができる。ま
た、確信度はその相関ルールが成立する確率であり、そ
の相関ルールを利用した場合に、ユーザが期待した結果
(つまり利益)を得られる期待度と考えることができ
る。この式は、このような前提に基づいて定めたもので
ある。
関ルールの支持度は、その相関ルールの一般性を表す数
値であり、相関ルールを利用する際に、支持度が大きい
ほど適用できる場面が多いと考えることができる。ま
た、確信度はその相関ルールが成立する確率であり、そ
の相関ルールを利用した場合に、ユーザが期待した結果
(つまり利益)を得られる期待度と考えることができ
る。この式は、このような前提に基づいて定めたもので
ある。
【0034】最後にステップ25において、実行結果表
示手段15は、ステップ24において相関ルールの評価
値が更新された相関ルールファイル17を取り込み、ユ
ーザの必要性に応じ、ステップ24で算出された相関ル
ールの評価値に基づいた相関ルールを並べ替え表示(昇
順/降順)し、またはある基準以上(または以下)の評
価値をもつ相関ルールのみを表示する表示内容の絞り込
み等の操作を行う。たとえば、ユーザの目的が「大きな
利益が見込める相関ルールを抽出したい」というもので
あった場合、その利益の見込みを評価基準として全ての
相関ルールについて計算すれば、その値がある一定のし
きい値以上の相関ルールのみを表示したり、値の大きい
順に相関ルールを並べて表示したりすることができま
す。これによって、データマイニング装置は、利益の大
きな相関ルールを強調して表示する等、ユーザの目的に
応じた有効な相関ルールの洗い出し作業を容易に支援す
ることが可能である。
示手段15は、ステップ24において相関ルールの評価
値が更新された相関ルールファイル17を取り込み、ユ
ーザの必要性に応じ、ステップ24で算出された相関ル
ールの評価値に基づいた相関ルールを並べ替え表示(昇
順/降順)し、またはある基準以上(または以下)の評
価値をもつ相関ルールのみを表示する表示内容の絞り込
み等の操作を行う。たとえば、ユーザの目的が「大きな
利益が見込める相関ルールを抽出したい」というもので
あった場合、その利益の見込みを評価基準として全ての
相関ルールについて計算すれば、その値がある一定のし
きい値以上の相関ルールのみを表示したり、値の大きい
順に相関ルールを並べて表示したりすることができま
す。これによって、データマイニング装置は、利益の大
きな相関ルールを強調して表示する等、ユーザの目的に
応じた有効な相関ルールの洗い出し作業を容易に支援す
ることが可能である。
【0035】ここで、上記について、簡単な適用例を想
定して説明する。ある店主が前述のバスケット分析を行
い、その結果得られた相関ルールを利用してダイレクト
メールマーケティングを実施することによって、業績の
向上を考えているものとする。その店主は、データマイ
ニングに用いるデータを入手し、そのデータを用いてバ
スケット分析を行った結果、大量の相関ルールを抽出し
た。さて、この大量の相関ルールの中から今回ダイレク
トメールマーケティングに役立てることのできる相関ル
ールを探し出すケースを考える。
定して説明する。ある店主が前述のバスケット分析を行
い、その結果得られた相関ルールを利用してダイレクト
メールマーケティングを実施することによって、業績の
向上を考えているものとする。その店主は、データマイ
ニングに用いるデータを入手し、そのデータを用いてバ
スケット分析を行った結果、大量の相関ルールを抽出し
た。さて、この大量の相関ルールの中から今回ダイレク
トメールマーケティングに役立てることのできる相関ル
ールを探し出すケースを考える。
【0036】ダイレクトメールマーケティングは、顧客
にダイレクトメールを送り付けることにより、それを見
て商品を買ってくれるお客によって売上げ向上を図るも
のである。当然、ダイレクトメールに反応して商品を購
入してくれる客と、そうでない客がいるわけだが、ダイ
レクトメールを出すのにもコストがかかるので、もし、
ダイレクトメールに反応してくれる確率の高い客層とい
うものがわかれば、効率のよいダイレクトメールマーケ
ティングを展開することができる。たとえば、「商品A
→商品B」という相関ルールによって「商品Aを買うお
客は同時に商品Bを購入する」という傾向を知ることが
できれば、商品Aを買ったお客に対し、商品Bに関する
広告をダイレクトメールで送ることによって、潜在的購
買層に対し、商品Bの購買欲を刺激する、といった販売
促進戦略を立てることが可能である。
にダイレクトメールを送り付けることにより、それを見
て商品を買ってくれるお客によって売上げ向上を図るも
のである。当然、ダイレクトメールに反応して商品を購
入してくれる客と、そうでない客がいるわけだが、ダイ
レクトメールを出すのにもコストがかかるので、もし、
ダイレクトメールに反応してくれる確率の高い客層とい
うものがわかれば、効率のよいダイレクトメールマーケ
ティングを展開することができる。たとえば、「商品A
→商品B」という相関ルールによって「商品Aを買うお
客は同時に商品Bを購入する」という傾向を知ることが
できれば、商品Aを買ったお客に対し、商品Bに関する
広告をダイレクトメールで送ることによって、潜在的購
買層に対し、商品Bの購買欲を刺激する、といった販売
促進戦略を立てることが可能である。
【0037】まず、この例では、ダイレクトメールを一
通出すのに、100円のコストがかかるとする。ダイレ
クトメールに反応し、実際に商品を買ってくれた場合の
利益は、相関ルールの右辺にくる商品が売れた場合の利
益である。データ辞書には先の例の図4と同様、「定
価」「売値」「仕入値」といった項目が定義されている
とする。図2のステップ23において、ユーザが3の評
価尺度指定画面で指定すべき評価尺度は、 相関ルール適用時のコスト:−100 相関ルール成立時の利益:右辺<売値>−右辺<仕入値> となる。
通出すのに、100円のコストがかかるとする。ダイレ
クトメールに反応し、実際に商品を買ってくれた場合の
利益は、相関ルールの右辺にくる商品が売れた場合の利
益である。データ辞書には先の例の図4と同様、「定
価」「売値」「仕入値」といった項目が定義されている
とする。図2のステップ23において、ユーザが3の評
価尺度指定画面で指定すべき評価尺度は、 相関ルール適用時のコスト:−100 相関ルール成立時の利益:右辺<売値>−右辺<仕入値> となる。
【0038】このような評価尺度で相関ルールの評価値
を算出すると、その相関ルールが示す内容を利用してダ
イレクトメールを出した場合(たとえば、相関ルール
「商品A→商品B」ならば、商品Aを購入した客に対し
て商品Bの広告を送った場合)に期待できる利益増幅の
大きさが相関ルールの評価値となる。たとえば、「商品
A→商品B」という相関ルールでは、利益−コストが評
価値となる。利益は(商品Bの売値−商品Bの仕入
値)、コストは100と仮定しているので、評価値=
(商品Bの売値−商品Bの仕入値)−100となる。
を算出すると、その相関ルールが示す内容を利用してダ
イレクトメールを出した場合(たとえば、相関ルール
「商品A→商品B」ならば、商品Aを購入した客に対し
て商品Bの広告を送った場合)に期待できる利益増幅の
大きさが相関ルールの評価値となる。たとえば、「商品
A→商品B」という相関ルールでは、利益−コストが評
価値となる。利益は(商品Bの売値−商品Bの仕入
値)、コストは100と仮定しているので、評価値=
(商品Bの売値−商品Bの仕入値)−100となる。
【0039】数は売れないが、1つ売れると多大な利潤
の得られるような商品Dがあったとする。データマイニ
ングの結果、そのような商品が右辺に来る相関ルールと
して、「商品C→商品D」(商品Cを買う客は商品Dも
買う)という相関ルールが抽出されたとする。この商品
Dは、前述の通り、数は売れないものなので、当然、こ
の相関ルールの支持度は低い。さらに、この相関ルール
の確信度も低かった場合、この相関ルールを確信度と支
持度で評価すると、価値の低い相関ルールということに
なる。しかし、この例のような評価尺度を用いた場合、
1つ売れた場合の利潤が大きいために、支持度、確信度
が共に低くても、高い価値が算出される場合がある。こ
のように、確信度、支持度によって画一的に評価してし
まうと他の相関ルールに埋もれてしまうような有効相関
ルールを、この方法によって洗い出すことができる。
の得られるような商品Dがあったとする。データマイニ
ングの結果、そのような商品が右辺に来る相関ルールと
して、「商品C→商品D」(商品Cを買う客は商品Dも
買う)という相関ルールが抽出されたとする。この商品
Dは、前述の通り、数は売れないものなので、当然、こ
の相関ルールの支持度は低い。さらに、この相関ルール
の確信度も低かった場合、この相関ルールを確信度と支
持度で評価すると、価値の低い相関ルールということに
なる。しかし、この例のような評価尺度を用いた場合、
1つ売れた場合の利潤が大きいために、支持度、確信度
が共に低くても、高い価値が算出される場合がある。こ
のように、確信度、支持度によって画一的に評価してし
まうと他の相関ルールに埋もれてしまうような有効相関
ルールを、この方法によって洗い出すことができる。
【0040】たとえば、新しい評価基準「利益の見込
み」を設け、もしこの基準が大きな相関ルールがあり、
その相関ルールの支持度、確信度が低いと仮定すると、
相関ルール生成手段12は支持度、確信度のしきい値を
小さくすればする程、膨大な数の相関ルールを抽出する
ことになる。もし、「利益の見込み」という評価基準が
なければ、ユーザはどの相関ルールを適用すればよいの
か(大きな利益が見込めるか)、その選択に困ることに
なる。そこでこの評価基準の値を全ての相関ルールにつ
いて計算し、ある一定のしきい値以上の相関ルールを表
示したり、評価基準の順に表示したりすることによって
大きな利益の見込める相関ルールがユーザの目に止り易
くなる。
み」を設け、もしこの基準が大きな相関ルールがあり、
その相関ルールの支持度、確信度が低いと仮定すると、
相関ルール生成手段12は支持度、確信度のしきい値を
小さくすればする程、膨大な数の相関ルールを抽出する
ことになる。もし、「利益の見込み」という評価基準が
なければ、ユーザはどの相関ルールを適用すればよいの
か(大きな利益が見込めるか)、その選択に困ることに
なる。そこでこの評価基準の値を全ての相関ルールにつ
いて計算し、ある一定のしきい値以上の相関ルールを表
示したり、評価基準の順に表示したりすることによって
大きな利益の見込める相関ルールがユーザの目に止り易
くなる。
【0041】
【発明の効果】この発明におけるデータマイニング装置
は、評価尺度指定手段によって、データマイニングを行
うユーザの目的にあった相関ルールの評価尺度をユーザ
自身が指定し、その評価尺度に基づいて相関ルール評価
手段が相関ルールの価値を算出し、実行結果表示手段
は、この相関ルールの価値によって、出力する相関ルー
ルの限定や並び替えを行うので、ユーザは、データマイ
ニングの結果得られた大量の相関ルールの中から、自分
の設定した評価尺度を満足する、すなわち自分の目的に
適合した相関ルールのみを抽出することが可能となる効
果がある。
は、評価尺度指定手段によって、データマイニングを行
うユーザの目的にあった相関ルールの評価尺度をユーザ
自身が指定し、その評価尺度に基づいて相関ルール評価
手段が相関ルールの価値を算出し、実行結果表示手段
は、この相関ルールの価値によって、出力する相関ルー
ルの限定や並び替えを行うので、ユーザは、データマイ
ニングの結果得られた大量の相関ルールの中から、自分
の設定した評価尺度を満足する、すなわち自分の目的に
適合した相関ルールのみを抽出することが可能となる効
果がある。
【0042】また、本発明の第2の発明のデータマイニ
ング装置における評価尺度指定手段は、ユーザが相関ル
ールを利用した場合に発生する損失値または利益値(以
下、相関ルール適用時のコスト)と、その相関ルールが
成立した場合に発生する利益値または損失値(以下、相
関ルール成立時の利益)を指定することにより評価尺度
の指定を行うように構成されるので、ユーザにとっての
メリット(利益値)とデメリット(損失値)を分けて入
力することができ、評価尺度の設定が容易になる効果が
ある。
ング装置における評価尺度指定手段は、ユーザが相関ル
ールを利用した場合に発生する損失値または利益値(以
下、相関ルール適用時のコスト)と、その相関ルールが
成立した場合に発生する利益値または損失値(以下、相
関ルール成立時の利益)を指定することにより評価尺度
の指定を行うように構成されるので、ユーザにとっての
メリット(利益値)とデメリット(損失値)を分けて入
力することができ、評価尺度の設定が容易になる効果が
ある。
【0043】また、本発明の第3の発明のデータマイニ
ング装置における評価尺度指定手段において、相関ルー
ル適用時のコストおよび相関ルール成立時の利益は、デ
ータ項目毎に各種項目について値が定義されたデータ辞
書中に定義された項目、または定数値、またはその両方
を項とする、四則演算式を用いて述されるように構成さ
れるので、ユーザは複雑な評価尺度を設定することが可
能となり、ユーザが希望する評価尺度を柔軟に設定でき
る効果がある。
ング装置における評価尺度指定手段において、相関ルー
ル適用時のコストおよび相関ルール成立時の利益は、デ
ータ項目毎に各種項目について値が定義されたデータ辞
書中に定義された項目、または定数値、またはその両方
を項とする、四則演算式を用いて述されるように構成さ
れるので、ユーザは複雑な評価尺度を設定することが可
能となり、ユーザが希望する評価尺度を柔軟に設定でき
る効果がある。
【0044】た、本発明の第4の発明のデータマイニン
グ装置における評価尺度指定手段は、指定した相関ルー
ル適用時のコストおよび相関ルール成立時の利益に関す
る情報を記憶装置に保存し、後でこれを読み込ん再利用
する機能を持つように構成されるので、一度設定した評
価尺度を別のデータをマイニングするときにも適用する
ことができるようになり、ユーザの利便性が向上する効
果がある。
グ装置における評価尺度指定手段は、指定した相関ルー
ル適用時のコストおよび相関ルール成立時の利益に関す
る情報を記憶装置に保存し、後でこれを読み込ん再利用
する機能を持つように構成されるので、一度設定した評
価尺度を別のデータをマイニングするときにも適用する
ことができるようになり、ユーザの利便性が向上する効
果がある。
【0045】また、本発明の第5の発明のデータマイニ
ング装置における相関ルール評価手段は、前記評価尺度
指定手段によって指定された相関ルール適用時のコスト
および相関ルール成立時の利益、前記データベース中で
の相関ルールの精度(正解率)を示す確信度、並びに前
記データベース中でその相関ルールが成立しているレコ
ード数の全レコード件数に対する割合を表す支持度に基
づいて評価値を算出するように構成されるので、利益値
および損失値の設定が容易となる効果がある。
ング装置における相関ルール評価手段は、前記評価尺度
指定手段によって指定された相関ルール適用時のコスト
および相関ルール成立時の利益、前記データベース中で
の相関ルールの精度(正解率)を示す確信度、並びに前
記データベース中でその相関ルールが成立しているレコ
ード数の全レコード件数に対する割合を表す支持度に基
づいて評価値を算出するように構成されるので、利益値
および損失値の設定が容易となる効果がある。
【0046】また、本発明の第6の発明のデータマイニ
ング装置における相関ルール評価手段は、相関ルール適
用時のコストおよび相関ルール成立時の利益を記述した
四則演算式を計算する際に、データ辞書中に定義された
項目の値を参照するように構成されるので、評価尺度
を、より一般的な形式で記述することが可能となる。た
とえば、売り値や仕入れ値が変動した場合、データ辞書
の変更のみで再度相関ルールの評価を行うことができ、
評価尺度に変更を加える必要がない。その結果、評価尺
度の普遍性が向上する効果がある。
ング装置における相関ルール評価手段は、相関ルール適
用時のコストおよび相関ルール成立時の利益を記述した
四則演算式を計算する際に、データ辞書中に定義された
項目の値を参照するように構成されるので、評価尺度
を、より一般的な形式で記述することが可能となる。た
とえば、売り値や仕入れ値が変動した場合、データ辞書
の変更のみで再度相関ルールの評価を行うことができ、
評価尺度に変更を加える必要がない。その結果、評価尺
度の普遍性が向上する効果がある。
【0047】また、本発明の第7の発明のデータマイニ
ング装置における実行結果表示手段は、演算の結果得ら
れた相関ルールのうち、相関ルール評価手段が算出した
評価値がユーザによって指定された基準値以上である相
関ルールのみを表示する機能を持つように構成されるの
で、ユーザが設定した評価尺度に照らし合わせて価値の
低い相関ルールを除外できる効果がある。
ング装置における実行結果表示手段は、演算の結果得ら
れた相関ルールのうち、相関ルール評価手段が算出した
評価値がユーザによって指定された基準値以上である相
関ルールのみを表示する機能を持つように構成されるの
で、ユーザが設定した評価尺度に照らし合わせて価値の
低い相関ルールを除外できる効果がある。
【0048】また、本発明の第8の発明のデータマイニ
ング装置における実行結果表示手段は、演算の結果得ら
れた相関ルールを、相関ルール評価手段が算出した評価
値に基づき、昇順または降順の並べ替え処理を行った上
で表示する機能を持つように構成されるので、ユーザが
設定した評価尺度に照らし合わせて価値の高い相関ルー
ルから参照することができる効果がある。
ング装置における実行結果表示手段は、演算の結果得ら
れた相関ルールを、相関ルール評価手段が算出した評価
値に基づき、昇順または降順の並べ替え処理を行った上
で表示する機能を持つように構成されるので、ユーザが
設定した評価尺度に照らし合わせて価値の高い相関ルー
ルから参照することができる効果がある。
【図1】 この発明の実施の形態におけるデータマイニ
ング装置の構成図である。
ング装置の構成図である。
【図2】 この発明の実施の形態におけるデータマイニ
ング装置の処理の流れを示す図である。
ング装置の処理の流れを示す図である。
【図3】 この発明の実施の形態における評価尺度の指
定を行う画面の図である。
定を行う画面の図である。
【図4】 この発明の実施の形態の具体例を説明するた
めのデータ辞書のイメージを示した図である。
めのデータ辞書のイメージを示した図である。
【図5】 この発明の実施の形態における評価尺度の指
定を行う画面の図である。
定を行う画面の図である。
11 ユーザインタフェース、 12 相関ルール生成
手段、 13 評価尺度指定手段、 14 相関ルール
評価手段、 15 実行結果表示手段、 16データベ
ース、 17 相関ルールファイル、 18 評価尺度
ファイル、19 データ辞書
手段、 13 評価尺度指定手段、 14 相関ルール
評価手段、 15 実行結果表示手段、 16データベ
ース、 17 相関ルールファイル、 18 評価尺度
ファイル、19 データ辞書
Claims (8)
- 【請求項1】 データベース中のデータ属性間に存在す
る相関ルールの相関分析を行うデータマイニング装置に
おいて:データベースからデータを受け、データ項目間
の相関ルールを生成する相関ルール生成手段と、 ユーザが、その使用目的毎に異なる相関ルールの評価尺
度を指定できる評価尺度指定手段と、 前記評価尺度指定手段においてユーザが指定した評価尺
度を用いて前記相関ルール生成手段によって生成された
相関ルールの価値を算出する相関ルール評価手段と、 前記相関ルール生成手段によって生成された相関ルール
を前記相関ルール評価手段が算出した相関ルールの価値
に基づいて表示する実行結果表示手段を備えたことを特
徴とするデータマイニング装置。 - 【請求項2】 請求項1記載のデータマイニング装置に
おいて:前記評価尺度指定手段は、ユーザによって指定
された、相関ルールを利用した場合に発生する損失値ま
たは利益値(以下、相関ルール適用時のコスト)と、そ
の相関ルールが成立した場合に発生する利益値または損
失値(以下、相関ルール成立時の利益)とにより評価尺
度の指定を行うことを特徴とするデータマイニング装
置。 - 【請求項3】 請求項2記載のデータマイニング装置に
おいて:前記の相関ルール適用時のコストおよび相関ル
ール成立時の利益は、データ項目毎に各種項目について
値が定義されたデータ辞書中に定義された項目、または
定数値、またはその両方を項とする四則演算式を用いて
記述されることを特徴とするデータマイニング装置。 - 【請求項4】 請求項2記載のデータマイニング装置に
おいて:前記評価尺度指定手段は、指定した相関ルール
適用時のコストおよび相関ルール成立時の利益に関する
情報を記憶装置に保存し、後でこれを読み込んで再利用
する機能を持つことを特徴とするデータマイニング装
置。 - 【請求項5】 請求項1記載のデータマイニング装置に
おいて:前記相関ルール評価手段は、前記評価尺度指定
手段によって指定された相関ルール適用時のコストおよ
び相関ルール成立時の利益、前記データベース中での相
関ルールの精度(正解率)を示す確信度、並びに前記デ
ータベース中でその相関ルールが成立しているレコード
数の全レコード件数に対する割合を表す支持度に基づい
て評価値を算出することを特徴とするデータマイニング
装置。 - 【請求項6】 請求項5記載のデータマイニング装置に
おいて:前記相関ルール評価手段は、前記相関ルール適
用時のコストおよび相関ルール成立時の利益を記述した
四則演算式を計算する際に、前記データ辞書中に定義さ
れた項目の値を参照することを特徴とするデータマイニ
ング装置。 - 【請求項7】 請求項1記載のデータマイニング装置に
おいて:前記実行結果表示手段は、演算の結果得られた
相関ルールのうち、前記相関ルール評価手段が算出した
評価値がユーザによって指定された基準値以上である相
関ルールのみを表示する機能を持つことを特徴とするデ
ータマイニング装置。 - 【請求項8】 請求項1に記載のデータマイニング装置
において:前記実行結果表示手段は、演算の結果得られ
た相関ルールを、前記相関ルール評価手段が算出した評
価値に基づき、昇順または降順の並べ替え処理を行った
上で表示する機能を持つことを特徴とするデータマイニ
ング装置。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP16707097A JPH1115842A (ja) | 1997-06-24 | 1997-06-24 | データマイニング装置 |
US09/001,942 US6272478B1 (en) | 1997-06-24 | 1997-12-31 | Data mining apparatus for discovering association rules existing between attributes of data |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP16707097A JPH1115842A (ja) | 1997-06-24 | 1997-06-24 | データマイニング装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
JPH1115842A true JPH1115842A (ja) | 1999-01-22 |
Family
ID=15842855
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP16707097A Pending JPH1115842A (ja) | 1997-06-24 | 1997-06-24 | データマイニング装置 |
Country Status (2)
Country | Link |
---|---|
US (1) | US6272478B1 (ja) |
JP (1) | JPH1115842A (ja) |
Cited By (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2000353163A (ja) * | 1999-06-11 | 2000-12-19 | Just Syst Corp | データベース処理装置、及びデータベース処理のためのプログラムが記憶された記憶媒体 |
KR20020018777A (ko) * | 2000-09-04 | 2002-03-09 | 박대희 | 패턴 분류를 위한 점증적 갱신의 데이터 마이닝 방법 |
JP2002183201A (ja) * | 2000-12-14 | 2002-06-28 | Victor Co Of Japan Ltd | 情報提供サーバ |
JP2002259889A (ja) * | 2001-03-01 | 2002-09-13 | Toshiba Corp | ダイレクトメール発送支援システム |
KR100497212B1 (ko) * | 2002-03-02 | 2005-06-23 | (주)비엘시스템스 | 데이터 마이닝에서의 앙상블 기법에 적용되는 연관성 규칙생성 장치 및 그 방법 |
KR100500329B1 (ko) * | 2001-10-18 | 2005-07-11 | 주식회사 핸디소프트 | 워크플로우 마이닝 시스템 및 방법 |
WO2016016934A1 (ja) * | 2014-07-29 | 2016-02-04 | 株式会社日立製作所 | 嗜好分析システム |
JP2016045901A (ja) * | 2014-08-26 | 2016-04-04 | アスクル株式会社 | 電子商取引装置、電子商取引方法および電子商取引プログラム |
WO2022137386A1 (ja) | 2020-12-23 | 2022-06-30 | 富士通株式会社 | ルール更新プログラム、ルール更新方法およびルール更新装置 |
Families Citing this family (72)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6389416B1 (en) * | 1999-02-19 | 2002-05-14 | International Business Machines Corporation | Depth first method for generating itemsets |
US6651049B1 (en) * | 1999-10-22 | 2003-11-18 | International Business Machines Corporation | Interactive mining of most interesting rules |
US6671680B1 (en) * | 2000-01-28 | 2003-12-30 | Fujitsu Limited | Data mining apparatus and storage medium storing therein data mining processing program |
US7299194B1 (en) * | 2000-02-22 | 2007-11-20 | International Business Machines Corporation | Method and system for researching sales effects of advertising using association analysis |
US7007020B1 (en) * | 2000-03-10 | 2006-02-28 | Hewlett-Packard Development Company, L.P. | Distributed OLAP-based association rule generation method and system |
US7069231B1 (en) * | 2000-07-20 | 2006-06-27 | Oracle International Corporation | Methods and systems for defining, applying and executing customer care relationship plans |
US20020128858A1 (en) * | 2001-01-06 | 2002-09-12 | Fuller Douglas Neal | Method and system for population classification |
US6952693B2 (en) * | 2001-02-23 | 2005-10-04 | Ran Wolff | Distributed mining of association rules |
US6907426B2 (en) * | 2001-05-17 | 2005-06-14 | International Business Machines Corporation | Systems and methods for identifying and counting instances of temporal patterns |
US20030088491A1 (en) * | 2001-11-07 | 2003-05-08 | International Business Machines Corporation | Method and apparatus for identifying cross-selling opportunities based on profitability analysis |
US6763354B2 (en) * | 2002-05-10 | 2004-07-13 | Agentarts, Inc. | Mining emergent weighted association rules utilizing backlinking reinforcement analysis |
US7813951B2 (en) * | 2002-06-04 | 2010-10-12 | Sap Ag | Managing customer loss using a graphical user interface |
US20040039593A1 (en) * | 2002-06-04 | 2004-02-26 | Ramine Eskandari | Managing customer loss using customer value |
US7813952B2 (en) | 2002-06-04 | 2010-10-12 | Sap Ag | Managing customer loss using customer groups |
WO2004027671A1 (en) * | 2002-09-18 | 2004-04-01 | United States Postal Service | Methods, systems, and computer readable media containing instructions for evaluating the return on direct mail marketing |
US7636709B1 (en) | 2002-10-03 | 2009-12-22 | Teradata Us, Inc. | Methods and systems for locating related reports |
US20040122711A1 (en) * | 2002-12-20 | 2004-06-24 | Mediware Information Systems Inc. | System and method for the optimization of the delivery of hospital services |
US20040215656A1 (en) * | 2003-04-25 | 2004-10-28 | Marcus Dill | Automated data mining runs |
US7243100B2 (en) * | 2003-07-30 | 2007-07-10 | International Business Machines Corporation | Methods and apparatus for mining attribute associations |
US7979334B2 (en) * | 2003-09-08 | 2011-07-12 | Blackrock, Inc. | System and method for determining the buying power of an investment portfolio |
US7426520B2 (en) | 2003-09-10 | 2008-09-16 | Exeros, Inc. | Method and apparatus for semantic discovery and mapping between data sources |
US7277873B2 (en) * | 2003-10-31 | 2007-10-02 | International Business Machines Corporaton | Method for discovering undeclared and fuzzy rules in databases |
US7379608B2 (en) * | 2003-12-04 | 2008-05-27 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung, E.V. | Arithmetic coding for transforming video and picture data units |
US7447666B2 (en) | 2004-04-09 | 2008-11-04 | The Boeing Company | System and method for analyzing a pattern in a time-stamped event sequence |
US20060112048A1 (en) * | 2004-10-29 | 2006-05-25 | Talbot Patrick J | System and method for the automated discovery of unknown unknowns |
US8078559B2 (en) | 2004-06-30 | 2011-12-13 | Northrop Grumman Systems Corporation | System and method for the automated discovery of unknown unknowns |
US7823169B1 (en) | 2004-10-28 | 2010-10-26 | Wheeler Thomas T | Performing operations by a first functionality within a second functionality in a same or in a different programming language |
US8266631B1 (en) | 2004-10-28 | 2012-09-11 | Curen Software Enterprises, L.L.C. | Calling a second functionality by a first functionality |
US7774789B1 (en) | 2004-10-28 | 2010-08-10 | Wheeler Thomas T | Creating a proxy object and providing information related to a proxy object |
US7797688B1 (en) | 2005-03-22 | 2010-09-14 | Dubagunta Saikumar V | Integrating applications in multiple languages |
US7861212B1 (en) | 2005-03-22 | 2010-12-28 | Dubagunta Saikumar V | System, method, and computer readable medium for integrating an original application with a remote application |
US8578349B1 (en) | 2005-03-23 | 2013-11-05 | Curen Software Enterprises, L.L.C. | System, method, and computer readable medium for integrating an original language application with a target language application |
US7533095B2 (en) * | 2005-04-19 | 2009-05-12 | International Business Machines Corporation | Data mining within a message handling system |
US7810140B1 (en) | 2006-05-23 | 2010-10-05 | Lipari Paul A | System, method, and computer readable medium for processing a message in a transport |
WO2008044242A2 (en) * | 2006-07-28 | 2008-04-17 | Persistent Systems Private Limited | Gene expression analysis using genotype-pheontype based programming |
US7844759B1 (en) | 2006-07-28 | 2010-11-30 | Cowin Gregory L | System, method, and computer readable medium for processing a message queue |
US7836004B2 (en) * | 2006-12-11 | 2010-11-16 | International Business Machines Corporation | Using data mining algorithms including association rules and tree classifications to discover data rules |
WO2008075663A1 (ja) * | 2006-12-21 | 2008-06-26 | Ajinomoto Co., Inc. | 大腸癌の評価方法、ならびに大腸癌評価装置、大腸癌評価方法、大腸癌評価システム、大腸癌評価プログラムおよび記録媒体 |
US7660780B1 (en) | 2006-12-22 | 2010-02-09 | Patoskie John P | Moving an agent from a first execution environment to a second execution environment |
US7698243B1 (en) | 2006-12-22 | 2010-04-13 | Hauser Robert R | Constructing an agent in a first execution environment using canonical rules |
US7702604B1 (en) | 2006-12-22 | 2010-04-20 | Hauser Robert R | Constructing an agent that utilizes supplied rules and rules resident in an execution environment |
US7664721B1 (en) | 2006-12-22 | 2010-02-16 | Hauser Robert R | Moving an agent from a first execution environment to a second execution environment using supplied and resident rules |
US9311141B2 (en) | 2006-12-22 | 2016-04-12 | Callahan Cellular L.L.C. | Survival rule usage by software agents |
US7860517B1 (en) | 2006-12-22 | 2010-12-28 | Patoskie John P | Mobile device tracking using mobile agent location breadcrumbs |
US7949626B1 (en) | 2006-12-22 | 2011-05-24 | Curen Software Enterprises, L.L.C. | Movement of an agent that utilizes a compiled set of canonical rules |
US8132179B1 (en) | 2006-12-22 | 2012-03-06 | Curen Software Enterprises, L.L.C. | Web service interface for mobile agents |
US7660777B1 (en) * | 2006-12-22 | 2010-02-09 | Hauser Robert R | Using data narrowing rule for data packaging requirement of an agent |
US7970724B1 (en) | 2006-12-22 | 2011-06-28 | Curen Software Enterprises, L.L.C. | Execution of a canonical rules based agent |
US7702603B1 (en) | 2006-12-22 | 2010-04-20 | Hauser Robert R | Constructing an agent that utilizes a compiled set of canonical rules |
US8423496B1 (en) | 2006-12-22 | 2013-04-16 | Curen Software Enterprises, L.L.C. | Dynamic determination of needed agent rules |
US8200603B1 (en) | 2006-12-22 | 2012-06-12 | Curen Software Enterprises, L.L.C. | Construction of an agent that utilizes as-needed canonical rules |
US7702602B1 (en) | 2006-12-22 | 2010-04-20 | Hauser Robert R | Moving and agent with a canonical rule from one device to a second device |
US8171001B2 (en) * | 2007-06-27 | 2012-05-01 | International Business Machines Corporation | Using a data mining algorithm to generate rules used to validate a selected region of a predicted column |
US8166000B2 (en) * | 2007-06-27 | 2012-04-24 | International Business Machines Corporation | Using a data mining algorithm to generate format rules used to validate data sets |
US7899776B2 (en) * | 2007-07-02 | 2011-03-01 | Microsoft Corporation | Explaining changes in measures thru data mining |
US8401987B2 (en) * | 2007-07-17 | 2013-03-19 | International Business Machines Corporation | Managing validation models and rules to apply to data sets |
US8046322B2 (en) * | 2007-08-07 | 2011-10-25 | The Boeing Company | Methods and framework for constraint-based activity mining (CMAP) |
US7805330B2 (en) * | 2007-09-18 | 2010-09-28 | Zoot Enterprises, Inc. | System and method for cross-selling products and services across an enterprise |
US9720971B2 (en) * | 2008-06-30 | 2017-08-01 | International Business Machines Corporation | Discovering transformations applied to a source table to generate a target table |
CN101599072B (zh) * | 2009-07-03 | 2011-07-27 | 南开大学 | 基于信息推理的智能计算机系统构造方法 |
US8930303B2 (en) | 2012-03-30 | 2015-01-06 | International Business Machines Corporation | Discovering pivot type relationships between database objects |
US9043255B2 (en) | 2012-05-09 | 2015-05-26 | International Business Machines Corporation | Optimally configuring an information landscape |
US9092734B2 (en) * | 2012-09-21 | 2015-07-28 | Sas Institute Inc. | Systems and methods for interactive displays based on associations for machine-guided rule creation |
US9117174B2 (en) * | 2012-09-21 | 2015-08-25 | Sas Institute Inc. | System for efficiently generating K-maximally predictive association rules with a given consequent |
US9582761B2 (en) | 2012-09-21 | 2017-02-28 | Sas Institute Inc. | Generating and displaying canonical rule sets with dimensional targets |
CN103593454A (zh) * | 2013-11-21 | 2014-02-19 | 中国科学院深圳先进技术研究院 | 面向微博文本分类的挖掘方法及系统 |
CN104020396A (zh) * | 2014-06-12 | 2014-09-03 | 国家电网公司 | 一种基于数据挖掘的电网故障诊断方法 |
JP6244274B2 (ja) * | 2014-07-01 | 2017-12-06 | 株式会社日立製作所 | 相関ルール分析装置および相関ルール分析方法 |
CN104731966A (zh) * | 2015-04-07 | 2015-06-24 | 河海大学 | 一种基于数据挖掘的地铁故障诊断方法 |
CN106021851A (zh) * | 2016-05-05 | 2016-10-12 | 北京快马互联科技有限公司 | 用于临床用药风险智能评估的方法 |
CN106846170B (zh) * | 2016-12-22 | 2020-12-25 | 国网上海市电力公司 | 一种发电机组跳闸监测方法及其监测装置 |
CN116664172B (zh) * | 2023-08-02 | 2023-11-21 | 同心县启胜新能源科技有限公司 | 基于大数据的食品销售数据挖掘分析方法 |
Family Cites Families (14)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH0877010A (ja) | 1994-09-07 | 1996-03-22 | Hitachi Ltd | データ分析方法および装置 |
US5819266A (en) * | 1995-03-03 | 1998-10-06 | International Business Machines Corporation | System and method for mining sequential patterns in a large database |
US5794209A (en) | 1995-03-31 | 1998-08-11 | International Business Machines Corporation | System and method for quickly mining association rules in databases |
US5615341A (en) * | 1995-05-08 | 1997-03-25 | International Business Machines Corporation | System and method for mining generalized association rules in databases |
US5842200A (en) * | 1995-03-31 | 1998-11-24 | International Business Machines Corporation | System and method for parallel mining of association rules in databases |
US5742811A (en) * | 1995-10-10 | 1998-04-21 | International Business Machines Corporation | Method and system for mining generalized sequential patterns in a large database |
JP3072708B2 (ja) * | 1995-11-01 | 2000-08-07 | インターナショナル・ビジネス・マシーンズ・コーポレ−ション | データベース検索方法及び装置 |
US5970482A (en) * | 1996-02-12 | 1999-10-19 | Datamind Corporation | System for data mining using neuroagents |
US5875285A (en) * | 1996-11-22 | 1999-02-23 | Chang; Hou-Mei Henry | Object-oriented data mining and decision making system |
JP3193658B2 (ja) * | 1997-02-19 | 2001-07-30 | インターナショナル・ビジネス・マシーンズ・コーポレ−ション | データ間結合ルール導出方法及び装置、及び直交凸領域切出方法及び装置 |
US5920855A (en) * | 1997-06-03 | 1999-07-06 | International Business Machines Corporation | On-line mining of association rules |
US5884305A (en) * | 1997-06-13 | 1999-03-16 | International Business Machines Corporation | System and method for data mining from relational data by sieving through iterated relational reinforcement |
US6061682A (en) * | 1997-08-12 | 2000-05-09 | International Business Machine Corporation | Method and apparatus for mining association rules having item constraints |
US6182070B1 (en) * | 1998-08-21 | 2001-01-30 | International Business Machines Corporation | System and method for discovering predictive association rules |
-
1997
- 1997-06-24 JP JP16707097A patent/JPH1115842A/ja active Pending
- 1997-12-31 US US09/001,942 patent/US6272478B1/en not_active Expired - Fee Related
Cited By (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2000353163A (ja) * | 1999-06-11 | 2000-12-19 | Just Syst Corp | データベース処理装置、及びデータベース処理のためのプログラムが記憶された記憶媒体 |
KR20020018777A (ko) * | 2000-09-04 | 2002-03-09 | 박대희 | 패턴 분류를 위한 점증적 갱신의 데이터 마이닝 방법 |
JP2002183201A (ja) * | 2000-12-14 | 2002-06-28 | Victor Co Of Japan Ltd | 情報提供サーバ |
JP2002259889A (ja) * | 2001-03-01 | 2002-09-13 | Toshiba Corp | ダイレクトメール発送支援システム |
KR100500329B1 (ko) * | 2001-10-18 | 2005-07-11 | 주식회사 핸디소프트 | 워크플로우 마이닝 시스템 및 방법 |
US7069179B2 (en) | 2001-10-18 | 2006-06-27 | Handysoft Co., Ltd. | Workflow mining system and method |
KR100497212B1 (ko) * | 2002-03-02 | 2005-06-23 | (주)비엘시스템스 | 데이터 마이닝에서의 앙상블 기법에 적용되는 연관성 규칙생성 장치 및 그 방법 |
WO2016016934A1 (ja) * | 2014-07-29 | 2016-02-04 | 株式会社日立製作所 | 嗜好分析システム |
JPWO2016016934A1 (ja) * | 2014-07-29 | 2017-04-27 | 株式会社日立製作所 | 嗜好分析システム |
JP2016045901A (ja) * | 2014-08-26 | 2016-04-04 | アスクル株式会社 | 電子商取引装置、電子商取引方法および電子商取引プログラム |
WO2022137386A1 (ja) | 2020-12-23 | 2022-06-30 | 富士通株式会社 | ルール更新プログラム、ルール更新方法およびルール更新装置 |
Also Published As
Publication number | Publication date |
---|---|
US6272478B1 (en) | 2001-08-07 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JPH1115842A (ja) | データマイニング装置 | |
JP4360759B2 (ja) | 相関分析を用いて広告の販売効果を調査する方法およびシステム | |
JP6352798B2 (ja) | マーケティング施策最適化装置、方法、及びプログラム | |
JP2002279279A (ja) | 商品推薦装置、商品推薦方法、及び商品推薦プログラム | |
JP2002189597A (ja) | 顧客データ分析方法 | |
JP6837411B2 (ja) | 販売促進装置、販売促進方法及び販売促進プログラム | |
JPWO2005024689A1 (ja) | 消費者の購買行動分析方法及び装置 | |
Gangurde et al. | Building prediction model using market basket analysis | |
US20180357699A1 (en) | Purchase management device, purchase management method, program, and recording medium | |
WO2020142837A1 (en) | Smart basket for online shopping | |
KR20190018369A (ko) | 상품기획서버를 이용한 상품 기획 시스템 및 방법. | |
US8738459B2 (en) | Product recommendation | |
JPH06119309A (ja) | 購入見込み度合予測方法及び顧客管理システム | |
CA3138745A1 (en) | Method and device for circling and creating target population | |
Pratama et al. | Web-Based Used Clothes Sales | |
JP6682585B2 (ja) | 情報処理装置及び情報処理方法 | |
JP6360625B2 (ja) | 検証支援システム及び方法 | |
US20090319330A1 (en) | Techniques for evaluating recommendation systems | |
TWI569220B (zh) | A management device, a management method, and a non-temporary recording medium | |
WO2018144695A1 (en) | In-store display with selective display of products based on visibility metric | |
CN114358871A (zh) | 商品推荐方法及电子设备 | |
JP5467096B2 (ja) | 商品情報補完方法,商品情報補完装置,および商品情報補完プログラム | |
Wulandari et al. | Increasing Product Promotion by Implementing Association Rules in The Web-Based Second_Oldshoes Store Sales System | |
US20240338600A1 (en) | System and method for automatically generating and presenting insight data in form of natural language | |
KR102714646B1 (ko) | 전이학습 기반 마케팅 퍼널 전환 예측 시스템 및 그 제어방법 |