JP2014109899A - クラスタリングプログラム、クラスタリング方法、およびクラスタリング装置 - Google Patents

クラスタリングプログラム、クラスタリング方法、およびクラスタリング装置 Download PDF

Info

Publication number
JP2014109899A
JP2014109899A JP2012263726A JP2012263726A JP2014109899A JP 2014109899 A JP2014109899 A JP 2014109899A JP 2012263726 A JP2012263726 A JP 2012263726A JP 2012263726 A JP2012263726 A JP 2012263726A JP 2014109899 A JP2014109899 A JP 2014109899A
Authority
JP
Japan
Prior art keywords
purchase
clustering
groups
group
purchasing
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2012263726A
Other languages
English (en)
Other versions
JP5974868B2 (ja
Inventor
Ryuichi Okubo
龍一 大久保
Masaki Fujinaka
正樹 藤中
Kayoko Hosobe
佳代子 細部
Hiryu Suzuki
飛龍 鈴木
Toshihito Nakano
利仁 中野
Hayato Yoshikawa
勇人 吉川
Hiroshi Sasaki
博 佐々木
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP2012263726A priority Critical patent/JP5974868B2/ja
Publication of JP2014109899A publication Critical patent/JP2014109899A/ja
Application granted granted Critical
Publication of JP5974868B2 publication Critical patent/JP5974868B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

【課題】より多くの消費者を特徴ごとに分類することを可能とすること。
【解決手段】クラスタリング装置100は、複数の消費者のそれぞれの購買履歴に基づいて、該複数の消費者のそれぞれが購入した商品と購入商品の購買数の多少と、に応じて第1のクラスタリング処理を行う。第1のクラスタリング処理により複数の購買グループが生成されるが、複数の購買グループの中に、その他グループのような特徴不明瞭な購買グループが含まれる場合がある。特徴不明瞭な購買グループは、消費者の購買行動の傾向が不明確である購買グループを示す。クラスタリング装置100は、特徴不明瞭な購買グループについて、購買回数を考慮せずに、購買の有無に応じた第2のクラスタリング処理を行って、該少なくとも1つの購買グループに含まれる要素について複数の購買グループを生成する。
【選択図】図1

Description

本発明は、クラスタリングプログラム、クラスタリング方法、およびクラスタリング装置に関する。
従来、店舗での購買における消費者の購買行動を調査する技術が知られている(たとえば、下記特許文献1〜5を参照。)。具体的には、たとえば、クラスタリングを用いて、消費者や商品をいくつかのグループに分類するクラスタリング技術がある。
特開2009−169698号公報 特開2008−152321号公報 特開2002−140502号公報 特開2002−117212号公報 特開2001−142902号公報
しかしながら、従来では、クラスタリングの結果、一部の消費者について特徴のあるグループに分類できない場合がある。
1つの側面では、本発明は、より多くの消費者を特徴ごとに分類することを可能とすることを目的とする。
本発明の一側面によれば、複数の消費者のそれぞれの購買履歴に基づいて、該複数の消費者のそれぞれの購買回数の多少を反映させた第1のクラスタリング処理を行って生成した複数の購買グループのうち、少なくとも1つの購買グループについて、購買の有無に応じた第2のクラスタリング処理を行って、該少なくとも1つの購買グループに含まれる要素について複数の購買グループを生成するクラスタリングプログラム、クラスタリング方法、およびクラスタリング装置が提案される。
本発明の一態様によれば、より多くの消費者を特徴ごとに分類することを可能とする。
図1は、クラスタリング装置による一動作例を示す説明図である。 図2は、クラスタリング装置の適用例を示す説明図である。 図3は、クラスタリング装置のハードウェア構成例を示すブロック図である。 図4は、購買履歴情報の一例を示す説明図である。 図5は、クラスタリング装置の機能的構成を示すブロック図である。 図6は、実施の形態1におけるクラスタリング装置の一処理例を示す説明図である。 図7は、特徴不明瞭な購買グループの判断例1を示す説明図である。 図8は、特徴不明瞭な購買グループの判断例2を示す説明図である。 図9は、特徴不明瞭な購買グループの判断例3を示す説明図である。 図10は、第2のクラスタリング処理によって生成される購買グループ例を示す説明図である。 図11は、実施の形態1にかかるクラスタリング装置が行う処理手順例を示すフローチャートである。 図12は、クラスタリング装置が行う特徴不明瞭な購買グループの判断処理手順例を示すフローチャートである。 図13は、実施の形態2におけるクラスタリング装置の一処理例を示す説明図である。 図14は、実施の形態2にかかるクラスタリング装置が行う処理手順例を示すフローチャートである。 図15は、実施の形態3におけるクラスタリング装置の一処理例を示す説明図である。 図16は、実施の形態3にかかるクラスタリング装置が行う処理手順例を示すフローチャートである。
以下に添付図面を参照して、本発明にかかるクラスタリングプログラム、クラスタリング方法、およびクラスタリング装置の実施の形態を詳細に説明する。
図1は、クラスタリング装置による一動作例を示す説明図である。クラスタリング装置100は、複数の消費者の購買履歴に基づいて、複数の購買グループを生成するコンピュータである。
まず、クラスタリング装置100は、複数の消費者のそれぞれの購買履歴に基づいて、該複数の消費者のそれぞれが購買した商品の購買回数の多少を反映させた第1のクラスタリング処理を行う。第1のクラスタリング処理では、商品の識別情報と、商品の購買数と、の組みをクラスタリングの特徴情報として、複数の消費者をクラスタリングする。これにより、同一商品を購買した消費者同士であっても、その商品の購買数の相違が大きければ、別の購買グループに分類される。たとえば、第1のクラスタリング処理は、消費者xと消費者yが商品Aと商品Bを購買していても、消費者xと消費者yとの間で商品Aの購買数と商品Bの購買数の少なくともいずれかが所定数以上異なれば、異なる購買グループに分類されるような処理である。これにより、複数の購買グループが生成されるが、複数の購買グループの中に特徴不明瞭な購買グループGmが含まれる場合がある。特徴不明瞭な購買グループGmは、「その他グループ」のような消費者の購買行動の傾向が不明瞭である購買グループを示す。
そこで、クラスタリング装置100は、特徴不明瞭な購買グループGmに属する消費者について、購買の有無に応じた第2のクラスタリング処理を行うことにより、複数の購買グループGm−1〜Gm−3を生成する。第2のクラスタリング処理では、特徴不明瞭な購買グループGmに属する複数の消費者の各々が購買した商品の識別情報をクラスタリングの特徴情報として、特徴不明瞭な購買グループGmに属する複数の消費者をクラスタリングする。これにより、同一商品を購買した消費者同士が同一の購買グループに分類される。たとえば、第2のクラスタリング処理は、消費者xと消費者yとがいずれも商品Aと商品Bとを購買しているため、同一の購買グループに分類されるような処理である。そのため、第2のクラスタリング処理では、消費者xと消費者yとの間における商品Aや商品Bの購買数の相違については考慮されない。
第2のクラスタリング処理は第1のクラスタリング処理よりも特徴情報の条件が少ない。そのため、購買商品と商品購買数を含めた第1のクラスタリング処理では、特徴のあるグループに分類できなかった消費者群であっても、商品購買数を含めない第2のクラスタリング処理によって特徴のあるグループに分類できる場合がある。これにより、より多くの消費者を特徴ごとに分類することを可能とし、消費者の購買行動の傾向の分析の容易化を図ることができる。
また、分析者は、購買グループ間の属する人数を比較してもよいし、各購買グループについて詳細に分析を行ってもよい。
図2は、クラスタリング装置の適用例を示す説明図である。インターネットやテレビなどを利用した販売や実際の店舗を利用した販売などによって消費者の購買履歴情報400が得られる。クラスタリング装置100は、購買履歴情報400に基づいて複数の消費者をクラスタリングする。そして、たとえば、クラスタリング装置100は、分析者が操作可能な装置200にクラスタリング結果を出力してもよい。分析者は、クラスタリング結果に基づいて、各消費者の購買行動の傾向を分析することができる。
(クラスタリング装置100のハードウェア構成例)
図3は、クラスタリング装置のハードウェア構成例を示すブロック図である。図3において、クラスタリング装置100は、CPU(Central Processing Unit)301と、ROM(Read−Only Memory)302と、RAM(Random Access Memory)303と、ディスクドライブ304と、ディスク305と、ネットワークI/F(InterFace)306と、を有する。また、各部はバス300によってそれぞれ接続されている。
ここで、CPU301は、クラスタリング装置100の全体の制御を司る。ROM302は、ブートプログラムなどのプログラムを記憶する。RAM303は、CPU301のワークエリアとして使用される。ディスクドライブ304は、CPU301の制御にしたがってディスク305に対するデータのリード/ライトを制御する。ディスク305は、ディスクドライブ304の制御で書き込まれたデータを記憶する。
ネットワークI/F306は、通信回線を通じてLAN(Local Area Network)、WAN(Wide Area Network)、インターネットなどのネットワークNETに接続され、このネットワークNETを介して分析者が操作可能な装置200などの他の装置に接続される。そして、ネットワークI/F306は、ネットワークNETと内部のインターフェースを司り、外部装置からのデータの入出力を制御する。ネットワークI/F306は、たとえば、モデムやLANアダプタなどを採用することができる。
また、クラスタリング装置100がサーバのようなプロセッサの性能が高い例を挙げているが、これに限らず、PC(Personal Computer)などであってもよい。そのため、クラスタリング装置100は、キーボードやマウスなどの入力装置やディスプレイなどの出力装置を有していてもよい。
図4は、購買履歴情報の一例を示す説明図である。購買履歴情報400は、たとえば、会員番号、商品名、年齢、その他のフィールドを有する。各フィールドに情報が設定されることにより、レコードが記憶される。購買履歴情報400は、RAM303、ディスク305などの記憶装置によって実現される。
会員番号のフィールドには、消費者の識別情報として分析対象となる店舗の会員番号が登録される。ここでは、消費者の識別情報を会員番号としているが、これに限らず、たとえば、消費者の氏名などであってもよい。商品名のフィールドには、購買された商品の識別情報として商品名が登録される。ここでは、商品の識別情報を商品名としているが、これに限らず、たとえば、商品に付された番号などであってもよい。年齢のフィールドには、会員番号が示す消費者の年齢が登録される。その他のフィールドには、会員番号が示す消費者についての性別や職業などの消費者を示すその他の情報が登録される。
(クラスタリング装置100の機能的構成例)
図5は、クラスタリング装置の機能的構成を示すブロック図である。クラスタリング装置100は、第1の生成部501と、判断部502と、第2の生成部503と、を有する。各部の処理は、たとえば、CPU301がアクセス可能なRAM303、ディスク305などの記憶装置に記憶されたクラスタリングプログラムにコーディングされている。そして、CPU301が記憶装置からクラスタリングプログラムを読み出して、クラスタリングプログラムにコーディングされている処理を実行する。これにより、各部の処理が実現される。また、各部の処理結果は、たとえば、RAM303、ディスク305などの記憶装置に記憶される。
ここで、本実施の形態では、各部について実施の形態1から実施の形態3を用いて詳細に説明する。実施の形態1では、購買商品と商品購買数によるクラスタリングでは特徴のある購買グループに分類できなかった消費者群を購買商品だけで再クラスタリングする。実施の形態2では、特徴のある購買グループに分類できなかった消費者群を除いて、特徴のある購買グループに分類できた消費者群だけで再度クラスタリングを行う。実施の形態3では、特徴のある購買グループに分類できなかった消費者群を特徴明瞭な購買グループに振り分ける。
(実施の形態1)
実施の形態1では、購買商品と商品購買数によるクラスタリングでは特徴のあるグループに分類できなかった消費者群を購買商品だけで再クラスタリングする。購買数を含めた場合には特徴情報の条件が多いために分類できなくとも、特徴情報の条件を減らすことにより、消費者を特徴に応じて分類できる場合がある。これにより、より多くの消費者を特徴に応じて分類でき、消費者の購買行動の傾向の分析の容易化を図ることができる。
図6は、実施の形態1におけるクラスタリング装置の一処理例を示す説明図である。第1の生成部501は、複数の消費者のそれぞれの購買履歴に基づいて、該複数の消費者のそれぞれの購買回数の多少を反映させた第1のクラスタリング処理を行う。これにより、図6に示すように購買グループG1〜G4が生成される。
第2の生成部503は、第1の生成部501によって複数の購買グループのうち、少なくとも1つの購買グループについて、購買の有無に応じた第2のクラスタリング処理を行う。これにより、第2の生成部503は、該少なくとも1つの購買グループに含まれる要素について複数の購買グループを生成する。
また、第1の生成部501によって複数の購買グループのうちの少なくとも1つの購買グループについては、特徴不明瞭な購買グループであると判断部502によって判断される購買グループとする。判断部502による判断例を図7から図9を用いて説明する。判断部502は、図7から図9に示す判断について、いずれかを行う、または判断を組み合わせてもよい。
図7は、特徴不明瞭な購買グループの判断例1を示す説明図である。判断部502は、第1の生成部501によって生成された購買グループについて、共通する特徴を有する購買グループとしての他の購買グループのいずれにも属さない要素を構成要素としているか否かを判断する。構成要素とは、商品名である。具体的には、判断部502は、各購買グループについて、購買グループに属する会員番号の間に、購買商品の共通性があるか否かを判断する。
図7では、購買グループG4に属する会員番号「001」,「002」がいずれも商品Aと商品Bを購買し、購買グループG4に属する会員番号「003」,「004」がいずれも商品Cと商品Dを購買した例である。そのため、会員番号「001」,「002」と、会員番号「003」,「004」との間では、購買商品に共通性がないと判断される。したがって、判断部502は、購買グループG4を特徴不明瞭な購買グループであると判断する。
図8は、特徴不明瞭な購買グループの判断例2を示す説明図である。判断部502は、第1の生成部501によって生成された購買グループの各々について、該購買グループに会員番号が属する消費者の数が閾値を超える購買グループであるか否かを判断する。閾値については、たとえば、予め利用者によって定義され、RAM303やディスク305などの記憶装置に記憶されることとする。
また、判断部502は、第1の生成部501によって生成された購買グループの各々について、他の購買グループと比較して相対的に属する消費者の識別情報の数が大きい購買グループであるか否かを判断する。相対的な数については、たとえば、全体の消費者の人数と購買グループに識別情報が属する消費者の人数との比率が所定比率以上であるか否かが判断されてもよい。所定比率については、たとえば、予め利用者によって定義され、RAM303やディスク305などの記憶装置に記憶されることとする。
たとえば、所定比率が50[%]とすると、購買グループG4に属する会員番号の数は、全体の会員番号の数の50[%]以上であるため、判断部502は、購買グループG4を特徴不明瞭な購買グループであると判断する。
図9は、特徴不明瞭な購買グループの判断例3を示す説明図である。判断部502は、第1の生成部501によって生成された複数の購買グループの各々について、購買グループに属する消費者間の非共通性を表す指標が所定条件を満たすか否かを判断する。図9の例では、購買グループに属する消費者間の非共通性を表す指標を、各会員番号が示す消費者の年齢層の分布としているが、これに限らず、性別の割合や職業分類などであってもよい。また、所定条件については、利用者によって予め定められRAM303、ディスク305などの記憶装置に記憶されていることとする。たとえば、判断部502が、購買履歴情報400に含まれる各消費者の年齢から年齢層を特定し、特定した各消費者の年齢層に基づいて年齢層の分布を生成する。
たとえば、判断部502は、第1の生成部501によって生成された複数の購買グループの各々について、購買グループに属する各会員番号が示す消費者の年齢の分布の中にピークが2以上あるか否かを判断する。たとえば、判断部502は、2以上ある場合、特徴不明瞭な購買グループであると判断し、2未満である場合、特徴明瞭な購買グループであると判断する。図9の左側が特徴明瞭な分布d1であり、図9の右側が特徴不明瞭な分布d2である。
第2の生成部503は、購買の有無に応じた第2のクラスタリング処理を行って、少なくとも1つの購買グループに含まれる要素について複数の購買グループを生成する。第2の生成部503は、生成した複数の購買グループをRAM303、ディスク305などの記憶装置に記憶する。
図10は、第2のクラスタリング処理によって生成される購買グループ例を示す説明図である。図10の上部分では、購買グループG4に属する会員番号が示す消費者が購買した商品の商品名と、商品名を囲う円の大きさによって購買回数と、を表す。図10の中央部分では、再度、特徴が不明瞭な購買グループG4について、第1のクラスタリング処理のように、購買回数に基づくクラスタリングが行われた場合の例を示す。この場合、商品Aを多く購買した消費者が属する購買グループ、商品Bを多く購買した消費者が属する購買グループや商品Aと商品Bとを同程度の購買数である消費者が属する購買グループなどでグループ化される。このグループ化であると、購買グループに属する消費者の人数が極端に少なくなってしまうなどが発生する可能性がある。
そこで、第2の生成部503は、各商品の購買回数については考慮せずに、購買グループG4に属する会員番号について、各商品の購買の有無に基づき第2のクラスタリング処理を行う。図10の下部分では、購買グループG4−1〜G4−3が生成される。たとえば、購買グループG4−1には、購買グループG4に属する消費者のうち、商品A,Bを購買した消費者が分類される。購買グループG4−2には、購買グループG4に属する消費者のうち、商品C,Dを購買した消費者が分類される。購買グループG4−3には、購買グループG4に属する消費者のうち、商品E,Fを購買した消費者が分類される。これにより、各購買グループに属する消費者が購買した商品の繋がりが明確となる。
また、クラスタリング装置100は、第1の生成部501によって生成された特徴明瞭な購買グループと、第2の生成部503によって生成された購買グループと、を併せて出力してもよい。出力形式としては、RAM303、ディスク305などの記憶装置への出力や、ネットワークNETを介して分析者が操作可能な装置200などのディスプレイへの表示などが挙げられる。
(実施の形態1にかかるクラスタリング装置100が行う処理手順例)
図11は、実施の形態1にかかるクラスタリング装置が行う処理手順例を示すフローチャートである。まず、クラスタリング装置100は、購買履歴情報400を取得し(ステップS1101)、購買履歴情報400に含まれる複数の会員番号について、購買商品名と購入商品の購買数とに応じて第1のクラスタリング処理を行う(ステップS1102)。
クラスタリング装置100は、特徴不明瞭な購買グループが存在するか否かを判断する(ステップS1103)。特徴不明瞭な購買グループが存在する場合(ステップS1103:Yes)、クラスタリング装置100は、特徴不明瞭な購買グループのうち、未選択な購買グループがあるか否かを判断する(ステップS1104)。ステップS1104の詳細な判断処理手順については、図12を用いて説明する。特徴不明瞭な購買グループのうち、未選択な購買グループがある場合(ステップS1104:Yes)、クラスタリング装置100は、未選択な購買グループから1つの購買グループを選択する(ステップS1105)。
クラスタリング装置100は、購買履歴情報400から、選択した購買グループに属する会員番号のレコードを取得する(ステップS1106)。クラスタリング装置100は、選択した購買グループに属する会員番号を含む取得したレコードに基づき、購買商品名に応じた第2のクラスタリング処理を行う(ステップS1107)。
特徴不明瞭な購買グループのうち、未選択な購買グループがない場合(ステップS1104:No)、クラスタリング装置100は、第1および第2のクラスタリング結果を併せて出力し(ステップS1108)、一連の処理を終了する。特徴不明瞭な購買グループが存在しない場合(ステップS1103:No)、クラスタリング装置100は、第1のクラスタリング結果を出力し(ステップS1109)、一連の処理を終了する。
図12は、クラスタリング装置が行う特徴不明瞭な購買グループの判断処理手順例を示すフローチャートである。クラスタリング装置100は、未選択な購買グループがあるか否かを判断する(ステップS1201)。未選択な購買グループがある場合(ステップS1201:Yes)、クラスタリング装置100は、未選択の購買グループから1つの購買グループを選択する(ステップS1202)。
クラスタリング装置100は、選択した購買グループに会員番号が属する消費者の購買商品の間に共通性があるか否かを判断する(ステップS1203)。選択した購買グループに識別情報が属する消費者の間に購買商品に共通性がない場合(ステップS1203:No)、ステップS1208へ移行する。
選択した購買グループに識別情報が属する消費者の間に購買商品に共通性がある場合(ステップS1203:Yes)、クラスタリング装置100は、全体の人数と選択した購買グループの人数との比率が所定比率以上か否かを判断する(ステップS1204)。所定比率以上である場合(ステップS1204:Yes)、ステップS1208へ移行する。
所定比率以上でない場合(ステップS1204:No)、クラスタリング装置100は、選択した購買グループに属する会員番号が示す消費者の属性分布を特定し(ステップS1205)、属性分布のピークの数が所定数以上であるか否かを判断する(ステップS1206)。属性分布とは、上述した非共通性を示す指標である。属性分布のピークの数が所定数以上である場合(ステップS1206:Yes)、ステップS1208へ移行する。
属性分布のピークの数が所定数未満である場合(ステップS1206:No)、クラスタリング装置100は、選択した購買グループは特徴明瞭な購買グループと判断し(ステップS1207)、ステップS1201へ戻る。ステップS1203のNoの場合、ステップS1204のYesの場合、またはステップS1206のYesの場合のつぎに、クラスタリング装置100は、選択した購買グループは特徴不明瞭な購買グループと判断し(ステップS1208)、ステップS1201へ戻る。
ステップS1201において、未選択な購買グループがない場合(ステップS1201:No)、一連の処理を終了する。
また、ステップS1203と、ステップS1204と、ステップS1205およびステップS1206と、の判断順序については、特に定まっていない。また、ここでは、クラスタリング装置100は、ステップS1203と、ステップS1204と、ステップS1205およびステップS1206とのすべてを判断しているが、いずれか一つを判断してもよい。
以上実施の形態1で説明したように、クラスタリング装置100は、購買商品と商品購買数によるクラスタリングでは特徴のあるグループに分類できなかった消費者群を購買商品だけで再クラスタリングする。購買数を含めた場合には特徴情報の条件が多いために分類できなくとも、特徴情報の条件を減らすことにより、消費者を特徴に応じて分類できる場合がある。これにより、より多くの消費者を特徴に応じて分類でき、消費者の購買行動の傾向の分析の容易化を図ることができる。
また、クラスタリング装置100は、消費者の購買商品に共通性がない購買グループを特徴不明瞭な購買グループとする。
また、クラスタリング装置100は、閾値以上の消費者が属する購買グループまたは他の購買グループと比較して相対的に人数の多い購買グループを特徴不明瞭な購買グループとする。
また、クラスタリング装置100は、購買グループに属する要素間の共通性を表す指標が所定条件を満たす購買グループを特徴不明瞭な購買グループとする。たとえば、クラスタリング装置100は、購買グループに属する消費者に基づいて年齢層の分布を特定した場合に、分布のピークが複数あると、年齢層が複数に跨っているため、特徴不明瞭であると判断することができる。
(実施の形態2)
実施の形態2では、特徴のある購買グループに分類できなかった消費者群を除いて、特徴のある購買グループに分類できた消費者群だけで再度クラスタリングを行う。これにより、消費者の購買行動の傾向を分析する際に、他の消費者と比較して不明瞭な購買行動である消費者を除いて分析を行うことができる。したがって、消費者の購買行動の傾向の分析の容易化を図ることができる。
図13は、実施の形態2におけるクラスタリング装置の一処理例を示す説明図である。第1の生成部501は、複数の消費者のそれぞれの購買履歴に基づいて、第1のクラスタリング処理を行う。たとえば、第1の生成部501は、購買履歴情報400に基づいて、複数の消費者の各々が購買した商品の識別情報と、商品の購買数と、を特徴情報として第1のクラスタリング処理を行う。ここでは、商品の識別情報と、商品の購買数と、を特徴情報としているが、これに限定しない。
第2の生成部503は、生成された複数の購買グループのうち、少なくとも1つの購買グループを除く1又は複数の購買グループに含まれる要素をクラスタリング対象の全要素として第2のクラスタリング処理を行って複数の購買グループを生成する。たとえば、第2の生成部503は、購買履歴情報400から、購買グループG4に属する会員番号以外の会員番号を含むレコードを取得する。そして、第2の生成部503は、取得したレコードに基づいて、購買グループG4に属する会員番号以外の会員番号について第2のクラスタリング処理を行う。ここでの第2のクラスタリング処理は、商品の識別情報と、商品の購買数と、を特徴情報としてもよいが、特に限定しない。
また、クラスタリング装置100は、第2の生成部503によって生成された購買グループを出力してもよい。出力形式としては、RAM303、ディスク305などの記憶装置への出力や、ネットワークNETを介して分析者が操作可能な装置200などのディスプレイへの表示などが挙げられる。
(実施の形態2にかかるクラスタリング装置100が行う処理手順例)
図14は、実施の形態2にかかるクラスタリング装置が行う処理手順例を示すフローチャートである。まず、クラスタリング装置100は、購買履歴情報400を取得し(ステップS1401)、購買履歴情報400に含まれる複数の会員番号について、購買商品名と購入商品の購買数とに応じて第1のクラスタリング処理を行う(ステップS1402)。
クラスタリング装置100は、特徴不明瞭な購買グループが存在するか否かを判断する(ステップS1403)。特徴不明瞭な購買グループが存在する場合(ステップS1403:Yes)、クラスタリング装置100は、購買履歴情報400から、特徴不明瞭な購買グループに属する会員番号以外のレコードを取得する(ステップS1404)。クラスタリング装置100は、選択した購買グループに属する会員番号以外の会員番号を特徴明瞭な購買グループに振り分ける第2のクラスタリング処理を行う(ステップS1405)。クラスタリング装置100は、第2のクラスタリング結果を出力し(ステップS1406)、一連の処理を終了する。
ステップS1403において、特徴不明瞭な購買グループが存在しない場合(ステップS1403:No)、クラスタリング装置100は、第1のクラスタリング結果を出力し(ステップS1407)、一連の処理を終了する。
以上実施の形態2で説明したように、クラスタリング装置100は、特徴不明瞭な購買グループに属する消費者を除いて、特徴明瞭な購買グループに属する消費者でクラスタリングを行う。これにより、消費者の購買行動の傾向を分析する際に、他の消費者と比較して不明瞭な購買行動である消費者を除いて分析を行うことができる。したがって、消費者の購買行動の傾向の分析の容易化を図ることができる。
(実施の形態3)
実施の形態3では、特徴のある購買グループに分類できなかった消費者群を特徴明瞭な購買グループに振り分ける。これにより、特徴不明瞭な購買グループそのものを無くすことができ、より多くの消費者を特徴ごとに分類することを可能とする。したがって、消費者の購買行動の傾向の分析の容易化を図ることができる。
図15は、実施の形態3におけるクラスタリング装置の一処理例を示す説明図である。第1の生成部501は、複数の消費者のそれぞれの購買履歴に基づいて、第1のクラスタリング処理を行う。たとえば、第1の生成部501は、購買履歴情報400に基づいて、複数の消費者の各々が購買した商品の識別情報と、商品の購買数と、を特徴情報として第1のクラスタリング処理を行う。ここでは、商品の識別情報と、商品の購買数と、を特徴情報としているが、これに限定しない。
そして、第2の生成部503は、生成された複数の購買グループのうち、少なくとも1つの購買グループに属する消費者を、該少なくとも1つの購買グループ以外の他の購買グループのいずれかに振り分ける第2のクラスタリング処理を行う。少なくとも1つの購買グループは、実施の形態1と同様に、判断部502によって特徴不明瞭な購買グループであると判断された購買グループである。判断部502による処理は、実施の形態1と同様であるため、ここでは詳細な説明を省略する。
また、たとえば、第2のクラスタリング処理では、商品の識別情報だけを特徴情報としてもよいが、特に限定しない。具体的に、たとえば、第2のクラスタリング処理では、特徴不明瞭なグループに属する消費者を同一の商品名を特徴情報としてより多く含む購買グループに分類させるようにクラスタリングしてもよい。
図15の例では、第2の生成部503は、購買グループG4に属する会員番号をあらたに購買グループG1〜G3のいずれかに振り分ける。
また、クラスタリング装置100は、第2の生成部503によって生成された購買グループを出力してもよい。出力形式としては、RAM303、ディスク305などの記憶装置への出力や、ネットワークNETを介して分析者が操作可能な装置200などのディスプレイへの表示などが挙げられる。
(実施の形態3にかかるクラスタリング装置100が行う処理手順例)
図16は、実施の形態3にかかるクラスタリング装置が行う処理手順例を示すフローチャートである。まず、クラスタリング装置100は、購買履歴情報400を取得し(ステップS1601)、購買履歴情報400に含まれる複数の会員番号について、購買商品名と購入商品の購買数とに応じて第1のクラスタリング処理を行う(ステップS1602)。
クラスタリング装置100は、特徴不明瞭な購買グループが存在するか否かを判断する(ステップS1603)。特徴不明瞭な購買グループが存在する場合(ステップS1603:Yes)、クラスタリング装置100は、購買履歴情報400から、特徴不明瞭な購買グループに属する会員番号のレコードを取得する(ステップS1604)。クラスタリング装置100は、選択した購買グループに属する会員番号の取得したレコードに基づき、選択した購買グループに属する会員番号を特徴明瞭な購買グループに振り分ける第2のクラスタリング処理を行う(ステップS1605)。クラスタリング装置100は、第2のクラスタリング結果を出力し(ステップS1606)、一連の処理を終了する。
ステップS1603において、特徴不明瞭な購買グループが存在しない場合(ステップS1603:No)、第1のクラスタリング結果を出力し(ステップS1607)、一連の処理を終了する。
以上実施の形態3で説明したように、クラスタリング装置は、特徴不明瞭なグループに属する消費者を、特徴明瞭なグループに振り分ける。これにより、特徴不明瞭な購買グループそのものを無くすことができ、より多くの消費者を特徴ごとに分類することを可能とする。したがって、消費者の購買行動の傾向の分析の容易化を図ることができる。
なお、本実施の形態で説明したクラスタリング方法は、予め用意されたクラスタリングプログラムをPCやワークステーション等のコンピュータで実行することにより実現することができる。本クラスタリングプログラムは、フラッシュメモリやディスク等のコンピュータで読み取り可能な記録媒体に記録され、コンピュータによって記録媒体から読み出されることによって実行される。また、本クラスタリングプログラムは、インターネット等のネットワークNETを介して配布されてもよい。
100 クラスタリング装置
301 CPU
400 購買履歴情報
501 第1の生成部
502 判断部
503 第2の生成部
G1〜G4,Gm 購買グループ

Claims (12)

  1. 複数の消費者の購買履歴に基づいて、複数の購買グループを生成するクラスタリングプログラムにおいて、
    前記複数の消費者のそれぞれの購買履歴に基づいて、該複数の消費者のそれぞれの購買回数の多少を反映させた第1のクラスタリング処理を行って生成した複数の購買グループのうち、少なくとも1つの購買グループについて、購買の有無に応じた第2のクラスタリング処理を行って、該少なくとも1つの購買グループに含まれる要素について複数の購買グループを生成する、
    処理をコンピュータに実行させることを特徴とするクラスタリングプログラム。
  2. 前記少なくとも1つの購買グループは、前記第1のクラスタリング処理によって生成された前記複数の購買グループのうち、購買グループ内に含まれる要素の数が閾値を超えるか又は他の購買グループと比較して相対的に数が大きい購買グループである、
    ことを特徴とする請求項1に記載のクラスタリングプログラム。
  3. 前記少なくとも1つの購買グループは、前記第1のクラスタリング処理により、共通する特徴を有する購買グループとしての他の購買グループのいずれにも属さない要素を構成要素とする、
    ことを特徴とする請求項1または2に記載のクラスタリングプログラム。
  4. 前記少なくとも1つの購買グループは、前記第1のクラスタリング処理によって生成された前記複数の購買グループのうち、前記購買グループに属する消費者間の非共通性を表す指標が所定条件を満たす購買グループである、
    ことを特徴とする請求項1〜3のいずれか一つに記載のクラスタリングプログラム。
  5. 複数の購買グループを生成するクラスタリングプログラムにおいて、
    複数の消費者のそれぞれの購買履歴に基づいて、第1のクラスタリング処理を行って生成した複数の購買グループのうち、少なくとも1つの購買グループを除く1又は複数の購買グループに含まれる要素をクラスタリング対象の全要素として第2のクラスタリング処理を行って複数の購買グループを生成する、
    処理をコンピュータに実行させることを特徴とするクラスタリングプログラム。
  6. 複数の購買グループを生成するクラスタリングプログラムにおいて、
    複数の消費者のそれぞれの購買履歴に基づいて、第1のクラスタリング処理を行って生成した複数の購買グループのうち、少なくとも1つの購買グループに含まれる要素を、該少なくとも1つの購買グループ以外の他の購買グループのいずれかに振り分ける第2のクラスタリング処理を行う、
    処理をコンピュータに実行させることを特徴とするクラスタリングプログラム。
  7. 複数の消費者の購買履歴に基づいて、複数の購買グループを生成するクラスタリング方法において、
    前記複数の消費者のそれぞれの購買履歴に基づいて、該複数の消費者のそれぞれの購買回数の多少を反映させた第1のクラスタリング処理を行って生成した複数の購買グループのうち、少なくとも1つの購買グループについて、購買の有無に応じた第2のクラスタリング処理を行って、該少なくとも1つの購買グループに含まれる要素について複数の購買グループを生成する、
    処理をコンピュータが実行することを特徴とするクラスタリング方法。
  8. 複数の購買グループを生成するクラスタリング方法において、
    複数の消費者のそれぞれの購買履歴に基づいて、第1のクラスタリング処理を行って生成した複数の購買グループのうち、少なくとも1つの購買グループを除く1又は複数の購買グループに含まれる要素をクラスタリング対象の全要素として第2のクラスタリング処理を行って複数の購買グループを生成する、
    処理をコンピュータが実行することを特徴とするクラスタリング方法。
  9. 複数の購買グループを生成するクラスタリング方法において、
    複数の消費者のそれぞれの購買履歴に基づいて、第1のクラスタリング処理を行って生成した複数の購買グループのうち、少なくとも1つの購買グループに含まれる要素を、該少なくとも1つの購買グループ以外の他の購買グループのいずれかに振り分ける第2のクラスタリング処理を行う、
    処理をコンピュータが実行することを特徴とするクラスタリング方法。
  10. 複数の消費者の購買履歴に基づいて、複数の購買グループを生成するクラスタリング装置において、
    前記複数の消費者のそれぞれの購買履歴に基づいて、該複数の消費者のそれぞれの購買回数の多少を反映させた第1のクラスタリング処理を行って生成した複数の購買グループのうち、少なくとも1つの購買グループについて、購買の有無に応じた第2のクラスタリング処理を行って、該少なくとも1つの購買グループに含まれる要素について複数の購買グループを生成する生成部を有することを特徴とするクラスタリング装置。
  11. 複数の購買グループを生成するクラスタリング装置において、
    複数の消費者のそれぞれの購買履歴に基づいて、第1のクラスタリング処理を行って生成した複数の購買グループのうち、少なくとも1つの購買グループを除く1又は複数の購買グループに含まれる要素をクラスタリング対象の全要素として第2のクラスタリング処理を行って複数の購買グループを生成する生成部を有することを特徴とするクラスタリング装置。
  12. 複数の購買グループを生成するクラスタリング装置において、
    複数の消費者のそれぞれの購買履歴に基づいて、第1のクラスタリング処理を行って生成した複数の購買グループのうち、少なくとも1つの購買グループに含まれる要素を、該少なくとも1つの購買グループ以外の他の購買グループのいずれかに振り分ける第2のクラスタリング処理を行う生成部を有することを特徴とするクラスタリング装置。
JP2012263726A 2012-11-30 2012-11-30 クラスタリングプログラム、クラスタリング方法、およびクラスタリング装置 Active JP5974868B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2012263726A JP5974868B2 (ja) 2012-11-30 2012-11-30 クラスタリングプログラム、クラスタリング方法、およびクラスタリング装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2012263726A JP5974868B2 (ja) 2012-11-30 2012-11-30 クラスタリングプログラム、クラスタリング方法、およびクラスタリング装置

Publications (2)

Publication Number Publication Date
JP2014109899A true JP2014109899A (ja) 2014-06-12
JP5974868B2 JP5974868B2 (ja) 2016-08-23

Family

ID=51030494

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2012263726A Active JP5974868B2 (ja) 2012-11-30 2012-11-30 クラスタリングプログラム、クラスタリング方法、およびクラスタリング装置

Country Status (1)

Country Link
JP (1) JP5974868B2 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5973051B1 (ja) * 2015-12-14 2016-08-23 株式会社リクルートホールディングス 営業支援システム、その制御方法、及び営業支援用コンピュータプログラム

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002358402A (ja) * 2001-05-31 2002-12-13 Dentsu Tec Inc 3指標軸による顧客価値を基準とした売上予測方法
JP2008210010A (ja) * 2007-02-23 2008-09-11 Kddi Corp コンテンツ配信方法およびシステム
JP2009087057A (ja) * 2007-09-28 2009-04-23 Sharp Corp ベクトルデータをクラスタリングするクラスタリング装置、クラスタリング方法、プログラムおよび記録媒体
JP2010224757A (ja) * 2009-03-23 2010-10-07 Brother Ind Ltd 商品推奨方法及び商品推奨システム
JP2011158938A (ja) * 2010-01-29 2011-08-18 Sky Co Ltd グループ編成支援システム及びグループ編成支援プログラム

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002358402A (ja) * 2001-05-31 2002-12-13 Dentsu Tec Inc 3指標軸による顧客価値を基準とした売上予測方法
JP2008210010A (ja) * 2007-02-23 2008-09-11 Kddi Corp コンテンツ配信方法およびシステム
JP2009087057A (ja) * 2007-09-28 2009-04-23 Sharp Corp ベクトルデータをクラスタリングするクラスタリング装置、クラスタリング方法、プログラムおよび記録媒体
JP2010224757A (ja) * 2009-03-23 2010-10-07 Brother Ind Ltd 商品推奨方法及び商品推奨システム
JP2011158938A (ja) * 2010-01-29 2011-08-18 Sky Co Ltd グループ編成支援システム及びグループ編成支援プログラム

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5973051B1 (ja) * 2015-12-14 2016-08-23 株式会社リクルートホールディングス 営業支援システム、その制御方法、及び営業支援用コンピュータプログラム

Also Published As

Publication number Publication date
JP5974868B2 (ja) 2016-08-23

Similar Documents

Publication Publication Date Title
US10860634B2 (en) Artificial intelligence system and method for generating a hierarchical data structure
LaPlante et al. Evaluation of bank branch growth potential using data envelopment analysis
Ishaq et al. Role of corporate image, product quality and customer value in customer loyalty: Intervening effect of customer satisfaction
US9916594B2 (en) Multidimensional personal behavioral tomography
Yin et al. A systematic review on business analytics
JP7210958B2 (ja) 商品推薦装置及びプログラム
JPWO2015049797A1 (ja) データ管理方法、データ管理装置及び記憶媒体
US20170193538A1 (en) System and method for determining the priority of mixed-type attributes for customer segmentation
CN112200601A (zh) 物品推荐方法、装置及可读存储介质
WO2017100155A1 (en) System and method for segmenting customers with mixed attribute types using a targeted clustering approach
JP6696568B2 (ja) アイテム推奨方法、アイテム推奨プログラムおよびアイテム推奨装置
Chmielarz et al. The selection and comparison of the methods used to evaluate the quality of e-banking websites: The perspective of individual clients
Jamjoom The use of knowledge extraction in predicting customer churn in B2B
Akhyani et al. New approach based on proximity/remoteness measurement for customer classification
JP5391637B2 (ja) データ類似度計算システム、データ類似度計算方法およびデータ類似度計算プログラム
JP6003586B2 (ja) クラスタリングプログラム、クラスタリング方法、およびクラスタリング装置
JP2001216369A (ja) 商品購入データ処理システム及び商品購入データ処理方法
JP2001188796A (ja) データ分析システム及びデータ分析方法並びにプログラムを記録したコンピュータ読み取り可能な記録媒体
JP5974868B2 (ja) クラスタリングプログラム、クラスタリング方法、およびクラスタリング装置
JP7261095B2 (ja) ビジネスマッチング支援装置、及びビジネスマッチング支援方法
US20240062264A1 (en) Ai- backed e-commerce for all the top rated products on a single platform
JP6178480B1 (ja) データ分析システム、その制御方法、プログラム、及び、記録媒体
Mittal et al. Principal component analysis based feature selection driving store choice: A data mining approach
Mahalle et al. Data Acquisition and Preparation
Suresh Application of Retail Analytics Using Association Rule Mining In Data Mining Techniques With Respect To Retail Supermarket* A. Pappu Rajan

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20150706

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20160526

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20160621

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20160704

R150 Certificate of patent or registration of utility model

Ref document number: 5974868

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150