JPH11259567A - 関連度探求装置、関連度探求方法および記録媒体 - Google Patents

関連度探求装置、関連度探求方法および記録媒体

Info

Publication number
JPH11259567A
JPH11259567A JP6025198A JP6025198A JPH11259567A JP H11259567 A JPH11259567 A JP H11259567A JP 6025198 A JP6025198 A JP 6025198A JP 6025198 A JP6025198 A JP 6025198A JP H11259567 A JPH11259567 A JP H11259567A
Authority
JP
Japan
Prior art keywords
ratio
strength
searching
expected
index
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP6025198A
Other languages
English (en)
Inventor
Keitarou Nakanishi
慶多郎 中西
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nomura Research Institute Ltd
Original Assignee
Nomura Research Institute Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nomura Research Institute Ltd filed Critical Nomura Research Institute Ltd
Priority to JP6025198A priority Critical patent/JPH11259567A/ja
Publication of JPH11259567A publication Critical patent/JPH11259567A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)
  • Cash Registers Or Receiving Machines (AREA)
  • Complex Calculations (AREA)

Abstract

(57)【要約】 【目的】 競合する事象のデータセットを抽出でき、発
生比率が低くても関連性が強いというデータセットを探
索できる技術を提供する。 【構成】 各事象(a,b,c,d,e,…)が発生する比率(Sa,S
b,Sc,Sd,Se,…)を求める比率探求手段と、その比率探求
手段によって求められた比率(Sa,Sb,Sc,Sd,Se,…)か
ら、最大期待できる関連の強さを期待関連指数(f(Sa,S
b),f(Sb,Sc),f(Sc,Sd),f(Sd,sa),f(Sa,Sc),f(Sb,Sd),
…)として求める期待関連強さ探求手段と、その期待関
連強さ探求手段によって求められた関連の事象の組み合
わせ(ab,bc,cd,ac,…)が同時に発生する比率(Sab,Sbc,S
cd,Sac,…)を求める同時発生比率探求手段と、その同時
発生比率探求手段によって求められた同時発生比率(Sa
b,Sbc,Scd,Sac,…)から関連強さ指数(g(a,b),g(b,c),g
(c,d),g(a,c),…)を求める関連強さ探求手段とを備え
た。

Description

【発明の詳細な説明】
【0001】
【発明が属する技術分野】この発明は、関連情報の探索
において、比率の関連の強さを表す指標を用いること
で、稀少であっても関連の強い情報の組み合わせを探索
できる技術に関するものである。
【0002】
【先行技術】バスケット分析という分析手法は、トラン
ザクションデータ(業務処理データ)の中から、組み合
わせて存在するデータセットを数え上げ、その割合を算
出するという「関連情報」の分析手法である。米国ウォ
ールマートのデータハウスによる事例、「紙おむつとビ
ールが一緒に売れる」という唱い文句によって有名にな
った。関連買い分析(Association Rule Analysis)と
も言う。POS(販売時情報)システムのデータを用い
て、以下のような例を挙げる。
【0003】お茶と弁当とを一緒に買う購入者の割合
は、 1)店の全購入者の15%である(支持度=15%) 2)お茶の購入者の40%である(確信度=40%) 3)弁当の購入者の25%である(確信度=25%) バスケット分析は、単純な組み合わせの集計に過ぎな
い。しかし、AID 分析などの従来の統計的手法や表集計
手法では、要素(上記の事例で言えば商品)の種類が多
くなったり、組み合わせ数(例えば、5つの商品を一緒
に買う割合)が多くなったりすると、計算処理速度が指
数的に増えてしまう。そのため、計算リソース(CPU
能力、メモリ)が莫大であるコンピュータを使用しなけ
ればならなくなる。そこで、IBMの研究者(Agrawal)
が、計算リソースを効率よく使用できる組み合わせ集計
する手法を開発し、その手法がバスケット分析の標準と
なるに至っている。
【0004】一般的には、上のように商品の購入分析で
あれば、商品の二種類の組み合わせは、支持度を得られ
そうな組み合わせに予想を付けてマトリクスを組み、関
連係数を計算する。バスケット分析は、統計的手法によ
らないため大量の業務処理に向いており、組み合わせの
要因を動的に決定するため要因データに対する数や種類
の制限が緩い、といった利点がある。このため、様々な
分野、例えば、顧客情報分析(商品の組み合わせ販売、
商品と顧客層との関連分析、販売時間帯と顧客層との関
連分析など)やログ解析(通信量が多いノードの組み合
わせなど)、アンケート分析などの分野で利用されてい
る。
【0005】
【発明が解決しようとする課題】しかし、上記した「バ
スケット分析」には、以下のような問題点があった。ま
ず、データセットそのものの発生する比率によって関連
情報を探索しているので、競合する事象のデータセット
を抽出することはできなかった。また、支持度のデータ
が大量に集まってしまう場合には、その大量のデータを
篩い分ける判断基準として、発生比率が低いとデータセ
ットを捨象するという篩い分けを行う。すると、発生比
率が低いとデータセットにおける関連が強いというデー
タセットを抽出できないのである。
【0006】更に具体的に説明するため、前述したPO
Sシステムにて考える。例えば、ドーナツとミルクとを
一緒に買う購入者の割合が非常に高いとしても、ドーナ
ツまたはミルクの購入者が全購入者の中での割合が低い
とする。すると、通常のバスケット分析では、ハードウ
エアへの負担を軽減するため、全購入者の中での割合が
低いデータセットはあらかじめ捨象する。そのため、全
購入者の中での割合が低いデータセットについて、「関
連性が強い」というデータセットとして抽出するには、
Agrawalの手法でも、ハードウエアの性能が極めて高か
ったり、処理時間を極めて長く取ったりしないとできな
いのである。
【0007】本発明が解決すべき課題は、競合する事象
のデータセットを抽出でき、発生比率が低くても関連性
が強いというデータセットを探索できる技術を提供する
ことにある。ここで、請求項1記載の発明の目的は、競
合する事象のデータセットを抽出できる関連度探求装置
を提供することである。
【0008】また、請求項2ないし請求項4記載の発明
の目的は、更に、発生比率が低くても関連性が強いとい
うデータセットを探索できる技術を提供することであ
る。また、請求項5記載の発明の目的は、更に、発生比
率が低くても関連性が強いというデータセットを、後の
処理を行いやすいように探索して出力できる技術を提供
することである。
【0009】請求項6記載の発明の目的は、競合する事
象のデータセットを抽出できる関連度探求方法を提供す
ることである。請求項7記載の発明の目的は、競合する
事象のデータセットを抽出できる関連度探求ソフトウエ
アを、記録媒体を介して提供することである。
【0010】
【課題を解決するための手段】本発明は、上記した目的
を達成するためのものであり、従来のバスケット分析の
指標(支持度および確信度)に対し、組み合わせの関連
係数に類する「関連度」を、新たな指標として採用す
る。 (請求項1)請求項1記載の発明は、各事象(a,b,c,d,
e,…)が発生する比率(Sa,Sb,Sc,Sd,Se,…)を求める比率
探求手段と、その比率探求手段によって求められた比率
(Sa,Sb,Sc,Sd,Se,…)から、最大期待できる関連の強さ
を期待関連指数(f(Sa,Sb),f(Sb,Sc),f(Sc,Sd),f(Sd,s
a),f(Sa,Sc),f(Sb,Sd),…)として求める期待関連強さ探
求手段と、その期待関連強さ探求手段によって求められ
た関連の事象の組み合わせ(ab,bc,cd,ac,…)が同時に発
生する比率(Sab,Sbc,Scd,Sac,…)を求める同時発生比率
探求手段と、その同時発生比率探求手段によって求めら
れた同時発生比率(Sab,Sbc,Scd,Sac,…)から関連強さ指
数(g(a,b),g(b,c),g(c,d),g(a,c),…)を求める関連強さ
探求手段とを備えたことを特徴とする関連度探求装置で
ある。
【0011】(用語説明)「期待関連指数」とは、例え
ば、二つの事象a,bで考える場合、 F(x,y) = { min(Sa,Sb) - Sa × Sb } が挙げられる。ここで、「Sa」や「Sb」とは、事象aま
たは事象bが発生する比率である。
【0012】また、「min(Sa,Sb)」とは、SaまたはSbの
うち、いずれか小さい方ということである。また、他の
「期待関連指数」としては、例えば、上述のF(x,y)を √{ Sa × (1-Sa) × Sb × (1-Sb) } で除したもの、すなわち f(x,y) = F(x,y) / √{ Sa × (1-Sa) × Sb ×
(1-Sb) } などである。
【0013】「関連強さ指数」とは、例えば、 G(x,y) = Sab - Sa × Sb が挙げられる。ここで、「Sab」とは、事象aと事象bと
が同時に発生する比率である。また、他の「関連強さ指
数」としては、例えば、上述のG(x,y)を √{ Sa × (1-Sa) × Sb × (1-Sb) } で除したもの、すなわち、 g(x,y) =G(x,y) / √{ Sa × (1-Sa) × Sb × (1
-Sb) } などである。
【0014】「関連強さ指数」は、一定値以上が「関連
が強い」ということができる。また、マイナスの値も一
定値以上は「負の関連が強い」ということができる。こ
れは、競合関係である場合にマイナスの値が大きくな
る。 (作用)まず、比率探求手段が、各事象(a,b,c,d,e,…)
が発生する比率(Sa,Sb,Sc,Sd,Se,…)を求める。そし
て、期待関連強さ探求手段が、その比率(Sa,Sb,Sc,Sd,S
e,…)から、最大期待できる関連の強さを期待関連指数
(f(Sa,Sb),f(Sb,Sc),f(Sc,Sd),f(Sd,sa),f(Sa,Sc),f(S
b,Sd),…)として求める。
【0015】次に、同時発生比率探求手段が、期待関連
強さ探求手段によって求められた関連の事象の組み合わ
せ(ab,bc,cd,ac,…)が同時に発生する比率(Sab,Sbc,Sc
d,Sac,…)を求める。そして、関連強さ探求手段が、そ
の同時発生比率(Sab,Sbc,Scd,Sac,…)から、関連強さ指
数(g(a,b),g(b,c),g(c,d),g(a,c),…)を求める。この関
連強さ指数は、絶対値が大きければ関連が強いというこ
とがわかる。すなわち、プラスの値が大きければ、関連
が大きい事情であることが判明し、マイナスの値が大き
ければ、競合関係の事象であることが判明する。
【0016】(請求項2)請求項2記載の関連度探求装
置は、請求項1記載の関連度探求装置を限定したもので
あり、比率探求手段によって求められた比率(Sa,Sb)が
所定比率(Sm)に達しない事象(例えば、Sd未満のもの)を
捨象し、所定比率(Sm)以上の比率の事象のみ(a,b,c,d)
を残して選別情報(Sa,Sb,Sc,Sd)とする情報選別手段を
備え、期待関連強さ探求手段は、前記情報選別手段によ
って選別された各選別情報(Sa,Sb,Sc,Sd)から最大期待
できる関連の強さを期待関連指数(f(Sa,Sb),f(Sb,Sc),f
(Sc,Sd),f(Sd,sa),f(Sa,Sc),f(Sb,Sd))として求めるこ
とを特徴とする。
【0017】(用語説明)所定比率は、標準値を予め設
定してもよいし、関連指数の計算結果、あるいは計算経
過を見ながら再設定できるようにしておいてもよい。 (作用)情報選別手段によって、ある所定比率(Sm)に達
しない事象を捨象するので、期待関連強さ探求手段、同
時発生比率探求手段、および関連強さ探求手段における
ハードウエア的な負担を低減しつつ、発生比率が低くて
も関連性が強いというデータセットを探索できる。
【0018】(請求項3)請求項3記載の関連度探求装
置は、請求項1または請求項2記載の関連度探求装置を
限定したものであり、期待関連強さ探求手段によって求
められた期待関連指数が、所定指数(fm)に達しない関連
の事象を捨象し、所定指数(fm)以上の事象のみを残して
期待関連強さ情報(f(Sa,Sb),f(Sb,Sc),f(Sc,Sd),f(Sa,S
c))とする期待関連強さ選別手段を備え、同時発生比率
探求手段は、前記期待関連強さ選別手段によって選別さ
れた関連の事象の組み合わせ(ab,bc,cd,ac)が同時に発
生する比率(Sab,Sbc,Scd,Sac)を求めることを特徴とす
る。
【0019】(用語説明)所定指数は、標準値を予め設
定してもよいし、関連指数の計算結果、あるいは計算経
過を見ながら再設定できるようにしておいてもよい。 (作用)期待関連強さ選別手段によって、ある所定指数
(fm)に達しない関連の事象を捨象するので、同時発生比
率探求手段、および関連強さ探求手段におけるハードウ
エア的な負担を低減しつつ、発生比率が低くても関連性
が強いというデータセットを探索できる。
【0020】(請求項4)請求項4記載の関連度探求装
置は、請求項1、請求項2または請求項3記載の関連度
探求装置を限定したものであり、関連強さ探求手段は、
関連強さ指数が、所定指数絶対値|gm|に達しない関連の
事象を捨象し、所定指数絶対値|gm|以上の事象の関連強
さ指数を抽出することを特徴とする。
【0021】(用語説明)所定指数絶対値|gm|は、プラ
スの値とマイナスの値とでは、別々に決定できるもので
あることが望ましいが、プラスとマイナスとで同じ値を
決定するものを除外する趣旨ではない。所定指数絶対値
は、標準値を予め設定してもよいし、関連指数の計算結
果、あるいは計算経過を見ながら再設定できるようにし
ておいてもよい。
【0022】(作用)予め決定してある所定指数絶対値
|gm|に達しない関連の事象を捨象するので、関連強さ探
求手段におけるハードウエア的な負担を低減しつつ、発
生比率が低くても関連性が強いというデータセットを探
索できる。 (請求項5)請求項5記載の関連度探求装置は、請求項
1、請求項2、請求項3または請求項4記載の関連度探
求装置を限定したものであり、関連強さ探求手段が求め
た関連強さ指数を、強さ順に並べ替えて出力する並べ替
え出力手段を備えたことを特徴とする。
【0023】(用語説明)「並べ替え出力手段」が並べ
替える強さ順とは、プラスからゼロに向かい、その後に
マイナスに向かう並べ替え順、絶対値が大きい順、など
を含む。また、出力の手段としては、モニタや液晶への
出力、プリントアウトなど、さまざまな出力手段を含む
趣旨である。出力の形式も、単なる表形式を含むほか、
ネットワーク図と数字との組み合わせをグラフィック表
示できるものまでを含む趣旨である。
【0024】なお、並べ替え出力手段を持たない装置の
場合には、上位のいくつかを差別化して出力するような
工夫をさせてもよい。 (作用)並べ替え出力手段が、関連強さ指数を強さ順に
並べ替えて出力してくれるので、関連の強い事象をすば
やく把握できる。また、後の情報処理を行いやすい。
【0025】(請求項6)請求項6記載の発明は、各事
象(a,b,c,d,e,…)が発生する比率(Sa,Sb,Sc,Sd,Se,…)
を求める比率探求工程と、その比率探求工程によって求
められた比率(Sa,Sb,Sc,Sd,Se,…)から、最大期待でき
る関連の強さを期待関連指数(f(Sa,Sb),f(Sb,Sc),f(Sc,
Sd),f(Sd,sa),f(Sa,Sc),f(Sb,Sd),…)として求める期待
関連強さ探求工程と、その期待関連強さ探求工程によっ
て求められた関連の事象の組み合わせ(ab,bc,cd,ac,…)
が同時に発生する比率(Sab,Sbc,Scd,Sac,…)を求める同
時発生比率探求工程と、その同時発生比率探求工程によ
って求められた同時発生比率(Sab,Sbc,Scd,Sac,…)から
関連強さ指数(g(a,b),g(b,c),g(c,d),g(a,c),…)を求め
る関連強さ探求工程とを備えたことを特徴とする関連度
探求方法である。
【0026】(請求項7)各事象(a,b,c,d,e,…)が発生
する比率(Sa,Sb,Sc,Sd,Se,…)を求める比率探求工程
と、その比率探求工程によって求められた比率(Sa,Sb,S
c,Sd,Se,…)から、最大期待できる関連の強さを期待関
連指数(f(Sa,Sb),f(Sb,Sc),f(Sc,Sd),f(Sd,sa),f(Sa,S
c),f(Sb,Sd),…)として求める期待関連強さ探求工程
と、その期待関連強さ探求工程によって求められた関連
の事象の組み合わせ(ab,bc,cd,ac,…)が同時に発生する
比率(Sab,Sbc,Scd,Sac,…)を求める同時発生比率探求工
程と、その同時発生比率探求工程によって求められた同
時発生比率(Sab,Sbc,Scd,Sac,…)から関連強さ指数(g
(a,b),g(b,c),g(c,d),g(a,c),…)を求める関連強さ探求
工程とを、機能させるためのプログラムを記録したコン
ピュータ読み取り可能な記録媒体である。
【0027】(用語説明)ここで、記録媒体とは、フレ
キシブルディスク、ハードディスク、CD−ROM、光
磁気ディスク、通信媒体などを含む。
【0028】
【発明の実施の形態】以下、本発明を実施の形態及び図
面に基づいて、更に詳しく説明する。ここで使用する図
面は、図1であり、図1は、本願発明の実施の形態を示
す概念図である。 (図1に基づく説明)この実施の形態では、顧客情報分
析、特に二商品の組み合わせ販売の分析を行うシステム
例として説明する。
【0029】まず、POS情報を貯えたデータベースが
ある。そこに、関連付けられたデータ群として、以下の
ようなデータが貯えられているとする。Aさんは、おに
ぎりとジュースとを買った。Bさんは、おにぎり、パ
ン、ジュースを買った。Cさんは、パンと缶コーヒーと
を買った。
【0030】… … … ・ ・このようなデータ群か
ら、比率探求手段によって、各事象の比率を求める。こ
こでは、各商品を買った人数の比率である。 ジュースa = Sa = 50% おにぎりb = Sb = 40% パンc = Sc = 30% 缶コーヒーd = Sd = 10% … … … ・ 老眼鏡e = Se = 1% 次に、情報選別手段によって、シキイ値、所定比率以下
の事象を捨てる。ここでは、10%未満の比率の商品に
ついては、捨象することとした。すなわち、上記の例で
は老眼鏡eを捨象する。なお、捨象する所定比率は、本
システムのユーザが、条件、状況に応じて簡単に変えら
れるようにしてある。
【0031】次に、以下に記す式(3)によって、最大
期待できる関連の強さたる期待関連指数を求める。 F(x,y) = { min(Sa,Sb) - Sa × Sb } …(1) ここで、「min(Sa,Sb)」とは、SaまたはSbのうち、いず
れか小さい方ということである。
【0032】 d1 = √{ Sa × (1-Sa) × Sb × (1-Sb) } …(2) f(x,y) = F(x,y) / d1 …(3) たとえば、ジュースaとおにぎりbという組み合わせか
ら順番に求める。本実施の形態では、強さ順に並べ替え
る機能を付加しているので、以下のようになる。
【0033】ジュースa&おにぎりb = 81.6% おにぎりb&パンc = 80.2% ジュースa&パンc = 65.5% パンc&缶コーヒーd = 50.9% おにぎりb&缶コーヒーd = 40.8% ジュースa&缶コーヒーd = 33.3% 次に、上記の最大期待できる関連の強さに対しても、シ
キイ値を設定し、所定指数未満の組み合わせとなる事象
を捨象する。ここでは、50%未満の組み合わせを捨象
することとした。すなわち、上位4パターンの組み合わ
せを残し、おにぎりbと缶コーヒーdとの組み合わせ、お
よびジュースaと缶コーヒーdとの組み合わせは、次の段
階へはもって行かないこととした。
【0034】一方、POS情報を貯えたデータベースの
データから、最大期待できる関連強さの上位4つの組み
合わせが同時に発生する比率を求める。その同時発生比
率は、以下のようなデータであるとする。 ジュースa&おにぎりb = Sab = 22% おにぎりb&パンc = Sbc = 10% ジュースa&パンc = Sac = 18% パンc&缶コーヒーd = Scd = 5% この同時発生比率と、各事象の発生比率とによって、式
(6)で与えられる関連の強さを求める。
【0035】 G(x,y) = Sab - Sa × Sb …(4) d2 = √{ Sa × (1-Sa) × Sb × (1-Sb) } …(5) g(x,y) = G(x,y) / d2 …(6) たとえば、ジュースaとおにぎりbという組み合わせか
ら、関連強さ指数を順番に求める。本実施の形態では、
関連強さ指数のプラスの値が順に並べ替える機能を付加
しているので、以下のようになる。
【0036】パンc&缶コーヒーd = 14.5% ジュースa&パンc = 13.1% ジュースa&おにぎりb = 8.2% おにぎりb&パンc = ―8.9% 上記のような関連強さに関する計算結果から、以下のよ
うな関連情報を取り出すことができる。
【0037】第一に、最も強い関連は、パンcと缶コー
ヒーdとの組み合わせであるということが判明する。従
来のバスケット分析の手法によっては、パンcと缶コー
ヒーdとが同時に購入される確率が他の組み合わせより
も低かったので、関連が強いという結論は導き出せなか
ったと予想される。仮に従来のバスケット分析の手法に
て導き出すには、ハードウエアに非常な高性能が要求さ
れたり、膨大な時間がかかったりすると予想される。
【0038】また第二に、おにぎりbとパンcとはマイ
ナスの値が大きく、競合商品の関係にあるということが
判明する。従来のバスケット分析の手法によっては、競
合関係を導き出すことはできなかった。なお、図示は省
略するが、上記4つのデータセットに関し、本実施の形
態に係る装置は、ネットワーク図と数字との組み合わせ
をグラフィック表示できる。
【0039】(バリエーション1)関連付けられた情報
群として、顧客情報を採択した場合について簡単に説明
する。顧客情報を貯えたデータベースがある。そこに、
関連付けられたデータ群として、以下のようなデータが
貯えられているとする。
【0040】 Aさん = 男性、25〜29歳、年収500万円、未婚 Bさん = 女性、30〜34歳 年収550万円、未婚 Cさん = 男性、35〜39歳 年収800万円、既婚 ・ ・ ・ ・ ・ ・ ・ ・ ・ ・ ・ ・ ・ ・ 図1に基づいて説明した第一の実施の形態において、ジ
ュースやおにぎりという商品に関するデータの代わり
に、性別a'と年齢b'という組み合わせを使用し、関連
情報を取り出すことができる。
【0041】(バリエーション2)事象がa,b,cの
3つである場合、最大期待できる関連強さを求めるため
の式(1),(2),(3)は、以下のようになる。 F(x,y,z)={ min(Sa,Sb,Sc) - Sa × Sb × Sc } …(7) ここで、「min(Sa,Sb,Sc)」とは、Sa、SbまたはScのう
ち、最小のものということである。
【0042】 d3=√{Sa×(1-Sb×Sc)×Sb×(1-Sa×Sc)×Sc×(1-Sa×Sb)} …(8) f(x,y,z) = F(x,y,z)/d3 …(9) また、関連強さを求めるための式(4),(5),
(6)は、以下のようになる。 G(x,y,z) = Sabc − Sa×Sb×Sc …(10) ここで、「」とは、事象a,b,cが同時に発生する比
率である。
【0043】 d4=√{Sa×(1-Sb×Sc)×Sb×(1-Sa×Sc)×Sc×(1-Sa×Sb)} …(11) g(x,y,z) = G(x,y,z)/d4 …(12) (バリエーション3)事象の組み合わせが4つ以上とな
っても、上記の規則性に従う。 (バリエーション4)上記のシステムは、コンピュー
タ、モニタ、プリンタなどのハードウエア以外のソフト
ウエア部分を、プログラムとして作成し、記録媒体に記
録して配布、販売したり、通信手段による配布、販売が
可能である。
【0044】また、このプログラムは、関連度探求の処
理をするハードウエアの性能により、以下のような工程
を含んだプログラムとしてもよい。第一に、比率探求手
段によって求められた比率が所定比率に達しない事象を
捨象し、所定比率以上の比率の事象のみを残して選別情
報とする情報選別工程である。第二に、期待関連強さ探
求手段によって求められた期待関連指数が、所定指数に
達しない関連の事象を捨象し、所定指数以上の事象のみ
を残して期待関連強さ情報とする期待関連強さ選別工程
である。第三に、関連強さ探求手段は、関連強さ指数
が、所定指数絶対値に達しない関連の事象を捨象し、所
定指数絶対値以上の事象の関連強さ指数を抽出する工程
である。いずれも、単独で含ませてもよいし、二つある
いは三つを組み合わせて含ませてもよい。また、いずれ
も標準値を予め設定してもよいし、関連指数の計算結
果、あるいは計算経過を見ながら再設定できるようにし
ておく。
【0045】
【発明の効果】請求項1記載の発明によれば、競合する
事象のデータセットを抽出できる関連度探求装置を提供
することができた。また、請求項2ないし請求項4記載
の発明によれば、更に、発生比率が低くても関連性が強
いというデータセットを探索できる技術を提供すること
ができた。
【0046】また、請求項5記載の発明によれば、更
に、発生比率が低くても関連性が強いというデータセッ
トを、後の処理を行いやすいように探索して出力できる
技術を提供することができた。請求項6記載の発明によ
れば、競合する事象のデータセットを抽出できる関連度
探求方法を提供することができた。
【0047】請求項7記載の発明によれば、競合する事
象のデータセットを抽出できる関連度探求ソフトウエア
を、記録媒体を介して提供することができた。
【図面の簡単な説明】
【図1】本願発明の実施の形態を示す概念図である。

Claims (7)

    【特許請求の範囲】
  1. 【請求項1】各事象が発生する比率を求める比率探求手
    段と、 その比率探求手段によって求められた比率から、最大期
    待できる関連の強さを期待関連指数として求める期待関
    連強さ探求手段と、 その期待関連強さ探求手段によって求められた関連の事
    象の組み合わせが同時に発生する比率を求める同時発生
    比率探求手段と、 その同時発生比率探求手段によって求められた同時発生
    比率から関連強さ指数を求める関連強さ探求手段とを備
    えたことを特徴とする関連度探求装置。
  2. 【請求項2】比率探求手段によって求められた比率が所
    定比率に達しない事象を捨象し、所定比率以上の比率の
    事象のみを残して選別情報とする情報選別手段を備え、 期待関連強さ探求手段は、前記情報選別手段によって選
    別された各選別情報から最大期待できる関連の強さを期
    待関連指数として求めることを特徴とする請求項1記載
    の関連度探求装置。
  3. 【請求項3】期待関連強さ探求手段によって求められた
    期待関連指数が、所定指数に達しない関連の事象を捨象
    し、所定指数以上の事象のみを残して期待関連強さ情報
    とする期待関連強さ選別手段を備え、同時発生比率探求
    手段は、前記期待関連強さ選別手段によって選別された
    関連の事象の組み合わせが同時に発生する比率を求める
    ことを特徴とする請求項1または請求項2記載の関連度
    探求装置。
  4. 【請求項4】関連強さ探求手段は、関連強さ指数が、所
    定指数絶対値に達しない関連の事象を捨象し、所定指数
    絶対値以上の事象の関連強さ指数を抽出することを特徴
    とする請求項1、請求項2または請求項3記載の関連度
    探求装置。
  5. 【請求項5】関連強さ探求手段が求めた関連強さ指数
    を、強さ順に並べ替えて出力する並べ替え出力手段を備
    えたことを特徴とする請求項1、請求項2、請求項3ま
    たは請求項4記載の関連度探求装置。
  6. 【請求項6】各事象が発生する比率を求める比率探求工
    程と、 その比率探求工程によって求められた比率から、最大期
    待できる関連の強さを期待関連指数として求める期待関
    連強さ探求工程と、 その期待関連強さ探求工程によって求められた関連の事
    象の組み合わせが同時に発生する比率を求める同時発生
    比率探求工程と、 その同時発生比率探求工程によって求められた同時発生
    比率から関連強さ指数を求める関連強さ探求工程とを備
    えたことを特徴とする関連度探求方法。
  7. 【請求項7】各事象が発生する比率を求める比率探求工
    程と、 その比率探求工程によって求められた比率から、最大期
    待できる関連の強さを期待関連指数として求める期待関
    連強さ探求工程と、 その期待関連強さ探求工程によって求められた関連の事
    象の組み合わせが同時に発生する比率を求める同時発生
    比率探求工程と、 その同時発生比率探求工程によって求められた同時発生
    比率から関連強さ指数を求める関連強さ探求工程とを、
    機能させるためのプログラムを記録したコンピュータ読
    み取り可能な記録媒体。
JP6025198A 1998-03-12 1998-03-12 関連度探求装置、関連度探求方法および記録媒体 Pending JPH11259567A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP6025198A JPH11259567A (ja) 1998-03-12 1998-03-12 関連度探求装置、関連度探求方法および記録媒体

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP6025198A JPH11259567A (ja) 1998-03-12 1998-03-12 関連度探求装置、関連度探求方法および記録媒体

Publications (1)

Publication Number Publication Date
JPH11259567A true JPH11259567A (ja) 1999-09-24

Family

ID=13136782

Family Applications (1)

Application Number Title Priority Date Filing Date
JP6025198A Pending JPH11259567A (ja) 1998-03-12 1998-03-12 関連度探求装置、関連度探求方法および記録媒体

Country Status (1)

Country Link
JP (1) JPH11259567A (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007094592A (ja) * 2005-09-27 2007-04-12 Fusion Kk マーケティングデータ収集分析システム、サーバシステム及びマーケティングデータ収集分析プログラム
JP2016026344A (ja) * 2008-05-21 2016-02-12 グーグル インコーポレイテッド オンライン環境における、主たる製品ドキュメント情報からの補充的製品コンテンツの決定及び主たる製品ドキュメント情報に関連する補充的製品コンテンツの提供
JP6017693B2 (ja) * 2013-08-02 2016-11-02 株式会社日立製作所 物流管理装置、物流管理方法及び物流管理プログラム

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007094592A (ja) * 2005-09-27 2007-04-12 Fusion Kk マーケティングデータ収集分析システム、サーバシステム及びマーケティングデータ収集分析プログラム
JP2016026344A (ja) * 2008-05-21 2016-02-12 グーグル インコーポレイテッド オンライン環境における、主たる製品ドキュメント情報からの補充的製品コンテンツの決定及び主たる製品ドキュメント情報に関連する補充的製品コンテンツの提供
JP6017693B2 (ja) * 2013-08-02 2016-11-02 株式会社日立製作所 物流管理装置、物流管理方法及び物流管理プログラム

Similar Documents

Publication Publication Date Title
Hossain et al. Market basket analysis using apriori and FP growth algorithm
Brijs et al. Building an association rules framework to improve product assortment decisions
US8676829B2 (en) Methods and apparatus for generating a data dictionary
US11263222B2 (en) System for calculating competitive interrelationships in item-pairs
CN107562818A (zh) 信息推荐系统及方法
JP2002092305A (ja) スコア算出方法及びスコア提供方法
KR101897080B1 (ko) 의료 기록 문서에서의 의료 단어의 연관 규칙 생성 방법 및 그 장치
Setiabudi et al. Data mining market basket analysis' using hybrid-dimension association rules, case study in Minimarket X
US9110969B2 (en) Association acceleration for transaction databases
JPH1125169A (ja) 相関関係抽出方法
JP2002328937A (ja) 大量蓄積データの解析方法
US20190324979A1 (en) System, method, and non-transitory computer-readable storage media for generating synonyms of a search query
US20120330807A1 (en) Systems and methods for consumer price index determination using panel-based and point-of-sale market research data
WO2017159402A1 (ja) 共クラスタリングシステム、方法およびプログラム
JP6003637B2 (ja) 情報処理装置、ノード抽出プログラムおよびノード抽出方法
US20130066827A1 (en) Information processing apparatus and element extraction method
JP7261095B2 (ja) ビジネスマッチング支援装置、及びビジネスマッチング支援方法
JPH11259567A (ja) 関連度探求装置、関連度探求方法および記録媒体
Dubey et al. Comparative analysis of market basket analysis through data mining techniques
JP2002082967A (ja) データ抽出方法および情報処理装置および記録媒体
Yang et al. Sequential clustering and classification approach to analyze sales performance of retail stores based on point-of-sale data
CN111091416A (zh) 一种预测酒店购买机器人的概率的方法和装置
US7756853B2 (en) Frequent itemset counting using subsets of bitmaps
JP2016197332A (ja) 情報処理システム、情報処理方法、およびコンピュータプログラム
CN112819404A (zh) 数据处理方法、装置、电子设备和存储介质