JP6237790B2 - 情報処理方法、プログラムおよび装置 - Google Patents

情報処理方法、プログラムおよび装置 Download PDF

Info

Publication number
JP6237790B2
JP6237790B2 JP2015554486A JP2015554486A JP6237790B2 JP 6237790 B2 JP6237790 B2 JP 6237790B2 JP 2015554486 A JP2015554486 A JP 2015554486A JP 2015554486 A JP2015554486 A JP 2015554486A JP 6237790 B2 JP6237790 B2 JP 6237790B2
Authority
JP
Japan
Prior art keywords
data
principal component
information processing
class
customer
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2015554486A
Other languages
English (en)
Other versions
JPWO2015097914A1 (ja
Inventor
健 小副川
健 小副川
廣瀬 淳一
淳一 廣瀬
安藤 剛寿
剛寿 安藤
岡本 青史
青史 岡本
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Publication of JPWO2015097914A1 publication Critical patent/JPWO2015097914A1/ja
Application granted granted Critical
Publication of JP6237790B2 publication Critical patent/JP6237790B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0201Market modelling; Market analysis; Collecting market data
    • G06Q30/0203Market surveys; Market polls
    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0201Market modelling; Market analysis; Collecting market data

Landscapes

  • Business, Economics & Management (AREA)
  • Strategic Management (AREA)
  • Engineering & Computer Science (AREA)
  • Accounting & Taxation (AREA)
  • Development Economics (AREA)
  • Finance (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Game Theory and Decision Science (AREA)
  • Data Mining & Analysis (AREA)
  • Economics (AREA)
  • Marketing (AREA)
  • Physics & Mathematics (AREA)
  • General Business, Economics & Management (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Description

本発明は、情報処理方法等に関する。
顧客の購買履歴を収集することで作成された顧客データベースを用いて顧客の購買傾向を把握するマーケティングリサーチがある。マーケティングリサーチにおいては、顧客の購買傾向を把握するために購買傾向が類似する顧客をグループ化することによって顧客層が分類される。そして、分類された顧客層毎に行動を分析することで各顧客層の購買傾向が把握される。
例えば、ロイヤルカスタマーに分類された顧客層の購買傾向を分析することで、ロイヤルカスタマー全体の行動が把握される。ロイヤルカスタマーとは、利益率が高い商品を高頻度で購入する等の行動をとったことにより優良顧客と認定された顧客のことである。そして、ロイヤルカスタマーがとった行動が他の客層でもとられるように促すことにより、ロイヤルカスタマーの増大が図れる。一方、店を利用しなくなった顧客層を特定することにより、顧客離れを起こす予兆がある顧客に対してサービスを提供することができる。これにより、顧客離れを未然に防ぐことが可能となる。すなわち、顧客をグループ化することで顧客の行動パターンが把握しやすくなるので、マーケティングアクションへの動機付けにつながる場合がある。
顧客をグループ化する方法には、例えば、クラスター分析がある。クラスター分析とは、異なる対象の中から類似するものを集めてグループを作成することで対象を分類する分析方法である。クラスター分析を用いることで客観的な基準で顧客層が分類される。
特開2008−152321号公報
しかしながら、ある期間だけに見られる購買傾向を加味して顧客をグルーピングすることができないという問題がある。
クラスター分析を用いた場合、顧客をグループ化する際に季節商品等の期間的に販売される商品の購買傾向が失われる可能性がある。これはクラスター分析が、四半期、月単位等の期間毎に購買傾向を分析するのに不向きであるためである。
客により購買された商品の履歴データであって大型店舗等で取り扱われる多数の商品を含む購買履歴データを基にしてクラスター分析をおこなう場合、ある客が実際に購入した商品数よりも店舗で取り扱われている商品数の方が圧倒的に多いので、購買データの大半が購入されていない商品を表すデータとなる。このため、購買データを商品毎にベクトルで表記させた場合、その商品を購入していないことを示す原点付近にベクトルが集中することになる。その結果、顧客をグループ化するのが困難となる。
一つの側面では、ある期間だけに見られる購買傾向を加味して顧客をグルーピングできる情報処理方法、プログラムおよび装置を提供することを目的とする。
第1の案では、コンピュータが下記の情報処理方法を実行する。情報処理方法は、記憶部に記憶された、ある期間内に複数の人のそれぞれについて検出された行動を示すデータである処理対象のデータを、該データに含まれる時間に関する情報を参照して、所定の期間長に分割し、前記分割した期間長毎に別箇に主成分分析を実行する。さらに、情報処理方法は、それぞれの主成分分析の結果算出された軸につき、時間的に隣り合う分析期間どうしで、平行により近い軸同士を組み合わせて対応する軸を特定する処理を実行する。さらに、情報処理方法は、前記処理対象のデータ全体を通じ、時間的に隣り合う期間どうしでそれぞれ対応付けた軸どうしを同一の軸とみなし、当該同一の軸方向にかかる主成分の値に基づき前記複数の人を複数にグルーピングする処理を実行する。
本発明の1実施態様によれば、ある期間だけに見られる購買傾向を加味して顧客をグルーピングできるという効果を奏する。
図1は、実施例1に係る情報処理装置のシステム構成の一例を示す図である。 図2は、購買履歴データのデータ構造を説明するための図である。 図3は、購買データのデータ構造を説明するための図である。 図4は、顧客層データのデータ構造を説明するための図である。 図5は、顧客の購買履歴の主成分分析を説明するための図である。 図6は、期毎に算出された各主成分の固有ベクトルを示す図である。 図7は、各ベクトルを並び替えた場合の一例を示す図である。 図8は、固有ベクトルの向きの調整を説明するための図である。 図9は、固有ベクトル方向の高さを算出することを説明するための図である。 図10は、情報処理装置の処理を説明するための図である。 図11は、クラス毎の各期における遷移の第1の例を示す図である。 図12は、クラス毎の各期における遷移の第2の例を示す図である。 図13は、情報処理装置のハードウェア構成を示す図である。
以下に、本願の開示する情報処理方法、プログラムおよび装置の実施例を図面に基づいて詳細に説明する。なお、この実施例によりこの権利範囲が限定されるものではない。
図1を用いて、情報処理装置100のシステム構成について説明する。図1は、実施例1に係る情報処理装置のシステム構成の一例を示す図である。図1の例に示すように、情報処理装置100は、入力部101、出力部102、制御部110および記憶部120を有する。記憶部120は、購買履歴データ121、購買データ122および顧客層データ123を含む。記憶部120は例えば、RAM(Random Access Memory)、ROM(Read Only Memory)、フラッシュメモリ(Flash Memory)などの半導体メモリ素子、ハードディスクや光ディスクなどの記憶装置に対応する。
記憶部120に記憶されている各データについて説明する。購買履歴データ121は、日付毎に各顧客の商品の購買履歴を記憶したデータである。図2を用いて、購買履歴データ121のデータ構造について説明する。図2は、購買履歴データのデータ構造を説明するための図である。図2に示される例のように、購買履歴データ121は、日付毎に商品を購入したユーザ、購入した商品名、および購入数を対応付ける。例えば、第1のレコードには、「2013/5/21」に「ユーザA」が商品名「牛乳」を「1」個購入したことが記憶される。また、第2のレコードには、「2013/5/21」に「ユーザA」が商品名「卵」を「2」個購入したことが記憶される。また、第3のレコードには、「2013/5/21」に「ユーザD」が商品名「人参」を「3」個購入したことが記憶される。なお、購買履歴データ121は、他のレコードにおいても、日付毎に商品を購入したユーザ、購入した商品名、および購入数を対応付ける。なお、ユーザは、分類対象である顧客と同意である。
購買データ122は、各顧客に関し、期毎に各商品を購入した合計数を集計したデータである。図3を用いて、購買データ122のデータ構造について説明する。図3は、購買データ122のデータ構造を説明するための図である。図3に示される例のように、購買データ122は、例えば、2013年の春期のデータ10a、夏期のデータ10b、秋期のデータ10cおよび冬期のデータ10dを含む。各期のデータ10a〜10dには、顧客A〜Zの各顧客に関し、商品毎に購入数の合計数を対応付ける。
例えば、冬期のデータ10dは、顧客Aが、牛乳を「20」個、卵を「15」個、レタスを「0」個、人参を「0」個、新じゃがを「0」個、きゅうりを「0」個、アイスを「0」個および衣料品を「0」個購入したことを対応付ける。また、冬期のデータ10dは、顧客Zが、牛乳を「0」個、卵を「0」個、レタスを「0」個、人参を「0」個、新じゃがを「0」個、きゅうりを「0」個、アイスを「0」個および衣料品を「20」個購入したことを対応付ける。なお、冬期のデータ10dは、他のユーザに関しても、商品毎に購入数の合計数を対応付ける。また、冬期のデータ10dは、他に購入数の合計数を対応付ける商品を含んでもよい。また、購買データ122は、他の期においても、顧客A〜Zの各顧客に関し、商品毎に購入数の合計数を対応付ける。
顧客層データ123は、顧客層を決定する際に使用されるデータである。図4を用いて、顧客層データ123のデータ構造について説明する。図4は、顧客層データ123のデータ構造を説明するための図である。図4に示される例のように、顧客層データ123は、各顧客について、期毎にクラスデータを対応付ける。クラスデータとは、クラス決定関数を用いて算出されたクラスを設定する際に使用されるデータである。クラスとは、情報処理装置100によって決定される顧客層に対応する。
例えば、顧客層データ123の第1のレコードには、顧客Aの2013年春期のクラスデータ「c−1,1,−1」と、2013年夏期のクラスデータ「c−1,1,−1」と、2013年秋期のクラスデータ「c−1,1,−1」とが含まれる。さらに、第1のレコードには、2013年冬期のクラスデータ「c−1,1,−1」が含まれる。また、顧客層データ123の第2のレコードには、顧客Bの2013年春期のクラスデータ「c−1,−1,−1」と、2013年夏期のクラスデータ「c−1,1,−1」と、2013年秋期のクラスデータ「c−1,1,−1」とが含まれる。さらに、第2のレコードには、2013年冬期のクラスデータ「c−1,1,1」が含まれる。なお、顧客層データ123は、他の顧客についても、期毎にクラスデータを対応付ける。
次に、制御部110に含まれる各処理部について説明する。制御部110は、実行部111、特定部112および分類部113を有する。制御部110の機能は例えば、ASIC(Application Specific Integrated Circuit)やFPGA(Field Programmable Gate Array)などの集積回路により実現することができる。また、制御部110の機能は例えば、CPU(Central Processing Unit)が所定のプログラムを実行することで実現することができる。
実行部111は、ある期間内に複数の人のそれぞれについて検出された行動を示すデータである処理対象のデータを、該データに含まれる時間に関する情報を参照して、所定の期間長に分割する。さらに、実行部111は、分割した期間長毎に別箇に主成分分析を実行する。
例えば、実行部111は、以下の処理をおこなう。まず、実行部111は、購買履歴データ121を基に各顧客に関し、期毎に各商品を購入した合計数を集計して購買データ122を生成する。例えば、購買履歴データ121は、図2に対応する。また、購買データ122は、図3に対応する。
実行部111は、生成された購買データ122に基づいて期毎に各ユーザの行動を要約したベクトルxk,jを取得する。図3を用いて、ベクトルxk,jを取得する処理について説明する。すなわち、実行部111は、ある期における購買データ122に関し、各商品に次元を割り当て、各商品の購買数を各々の次元の値とすることで、一ユーザに対して期毎に一つのベクトルxk,jを設定する。したがって、実行部111は、購買データ122が四半期で作成された場合、一ユーザ当たり春期、夏期、秋期および冬期の4つのベクトルxk,jを取得することになる。
例えば、実行部111は、顧客Aの冬期のデータ10dに関してベクトルxk,jを設定する場合、第1次元の値を牛乳の購入数「20」とし、第2次元の値を卵の購入数「15」とする。実行部111は、他の次元に関しても、各商品の購入数を各々の次元の値とする。そして、実行部111は、各次元の値に基づいてベクトルxk,jを設定する。
なお、「k」は、各ユーザを示す。「k」は、1から総ユーザ数であるnまでの範囲をとる。また、「j」は、分割された期を示す。期とは、例えば、2013年の春期、夏期、秋期および冬期等である。「j」は、1から最後の期であるtまでの範囲をとる。
実行部111は、購買データ122の各期のデータに対して主成分分析をおこなう。実行部111は、購買データ122に含まれる商品の種類数をdとした場合、第1主成分から第d主成分まで算出する。実行部111は、各商品にそれぞれ次元を割り当て、主成分分析の結果を基に、主成分毎に各商品の値を設定して主成分データを作成する。実行部111によって作成された主成分データは、例えば、図5に対応する。
図5を用いて、実行部111により顧客の購買履歴に対してなされた主成分分析について説明する。図5は、顧客の購買履歴の主成分分析を説明するための図である。まず、実行部111は、商品の種類数がd個であった場合、2013年冬期の購買データ10dから第1主成分〜第d主成分までを算出する。実行部111は、算出された各主成分から固有ベクトルを生成する。次いで、実行部111は、生成された固有ベクトルから、主成分毎の各商品の値のそれぞれを各商品に対応づける。なお、以下では、主成分分析された各期のデータを主成分データとよぶ。
例えば、実行部111は、冬期の主成分データ11dにおいて第1主成分のレコードに、牛乳の値「-0.44910」、卵の値「-0.35920」、レタスの値「-0.02441」、人参の値「-0.00902」、新じゃがの値「0」を対応付ける。さらに、実行部111は、第1主成分のレコードに、きゅうりの値「-0.02513」、アイスの値「-0.06313」および衣料品の値「0.00495」を対応付ける。
また、実行部111は、冬期の主成分データ11dにおいて第d主成分のレコードに、牛乳の値「-0.000024」、卵の値「-0.00007」、レタスの値「-0.000009」、人参の値「-0.00006」、新じゃがの値「0」を対応付ける。さらに、実行部111は、第d主成分のレコードに、きゅうりの値「-0.00009」、アイスの値「-0.00001」および衣料品の値「0.00001」を対応付ける。なお、実行部111は、2013年冬期の他の主成分に関しても、主成分毎に算出された値のそれぞれを各商品に対応づける。また、実行部111は、2013年冬期以外の期に関しても、同様に主成分分析をおこない、各々の主成分データを作成する。
特定部112は、それぞれの主成分分析の結果算出された軸につき、時間的に隣り合う分析期間どうしで、対応する軸を特定する。例えば、特定部112は、以下の処理を行う。まず、特定部112は、実行部111によって生成された各主成分の固有ベクトルを、期毎に列挙する。次いで、特定部112は、隣接する期にそれぞれ含まれる固有ベクトルどうしの内積が最も大きい組を選択して、選択された組が隣り合うように各期の固有ベクトルを並び替える。これにより、特定部112は、対応する固有ベクトルが各列に並ぶように並び替え、期毎の固有ベクトルの同定をおこなう。すなわち、特定部112は、隣接する期の固有ベクトルの軸が平行に近い組を選択して、選択された組が隣り合うように各期の固有ベクトルを並び替える。
図6を用いて、特定部112によっておこなわれる各期の固有ベクトルの並び替えについて説明する。図6は、期毎に算出された各主成分の固有ベクトルを示す図である。図6に示される例のように、特定部112は、2013年の春期、夏期、秋期および冬期の各期において、第1主成分から第5主成分までの固有ベクトルを各行に列挙する。各列には1から5までの値が付される。図6において、各固有ベクトルは「vi,j」の形式で表され、「i」は主成分で、「j」は期である。
例えば、2013年春期の第1主成分は「v1,1」、第2主成分は「v2,1」、第3主成分は「v3,1」、第4主成分は「v4,1」、第5主成分は「v5,1」で表される。また、2013年夏期の第1主成分は「v1,2」、第2主成分は「v2,2」、第3主成分は「v3,2」、第4主成分は「v4,2」、第5主成分は「v5,2」で表される。なお、特定部112は、他の期に係る行においても、第1主成分から第5主成分までの固有ベクトルを列挙する。
次いで、特定部112は、隣接する期にそれぞれ含まれる固有ベクトルどうしの内積が最も大きい組を選択して、選択された組が隣り合うように各期の固有ベクトルを並び替える。例えば、特定部112は、2013年春期の固有ベクトル「v1,1」と、2013年夏期の固有ベクトル「v1,2」、「v2,2」、「v3,2」、「v4,2」および「v5,2」との内積をそれぞれ算出する。次いで、特定部112は、固有ベクトル「v1,1」との内積値が最も大きい固有ベクトル「v3,2」を選択する。そして、特定部112は、選択された固有ベクトル「v3,2」が固有ベクトル「v1,1」と同じ「1」の列に来るように、2013年夏期の各ベクトルを並び替える。
次いで、特定部112は、2013年春期の固有ベクトル「v2,1」と、2013年夏期の固有ベクトル「v1,2」、「v2,2」、「v4,2」および「v5,2」との内積をそれぞれ算出する。次いで、特定部112は、固有ベクトル「v2,1」との内積値が最も大きい固有ベクトル「v4,2」を選択する。そして、特定部112は、選択された固有ベクトル「v4,2」が固有ベクトル「v2,1」と同じ「2」の列に来るように、2013年夏期の各ベクトルを並び替える。
次いで、特定部112は、2013年春期の固有ベクトル「v3,1」と、2013年夏期の固有ベクトル「v1,2」、「v2,2」および「v5,2」との内積をそれぞれ算出する。次いで、特定部112は、固有ベクトル「v3,1」との内積値が最も大きい固有ベクトル「v2,2」を選択する。そして、特定部112は、選択された固有ベクトル「v2,2」が固有ベクトル「v3,1」と同じ「3」の列に来るように、2013年夏期の各ベクトルを並び替える。
次いで、特定部112は、2013年春期の固有ベクトル「v4,1」と、2013年夏期の固有ベクトル「v1,2」および「v5,2」との内積をそれぞれ算出する。次いで、特定部112は、固有ベクトル「v4,1」との内積値が最も大きい固有ベクトル「v5,2」を選択する。そして、特定部112は、選択された固有ベクトル「v5,2」が固有ベクトル「v4,1」と同じ「4」の列に来るように、2013年夏期の各固有ベクトルを並び替える。
このようにして、特定部112は、2013年夏期の各ベクトルを並び替える。図7に並び替え後の固有ベクトルの例を示す。図7は、各ベクトルを並び替えた場合の一例を示す図である。図7に示される例のように、2013年夏期、秋期および冬期に含まれる各ベクトルが並び替えられる。これにより、特定部112は、2013年春期、夏期、秋期および冬期において、対応する固有ベクトルが各列に並ぶように並び替える。
すなわち、特定部112は、期j={1,…,t-1}に対して、「vi,j+1」が式(1)を満たすように並び替える。なお、「i'」は、{i+1,…,d}を含むものとする。また、「t」は、最後の期である。
|vi,j・vi',j+1|≦|vi,j・vi,j+1| ・・・(1)
また、特定部112は、同様にして、2013年夏期に隣接する2013年秋期にそれぞれ含まれる固有ベクトルどうしの内積が最も大きい組を選択して、選択された組が隣り合うように各期の固有ベクトルを並び替える。さらに、特定部112は、同様にして、2013年秋期に隣接する2013年冬期にそれぞれ含まれる固有ベクトルどうしの内積が最も大きい組を選択して、選択された組が隣り合うように各期の固有ベクトルを並び替える。
分類部113は、処理対象のデータ全体を通じ、時間的に隣り合う期間どうしでそれぞれ対応付けた軸どうしを同一の軸とみなし、複数の人を複数にグルーピングする。例えば、分類部113は、以下の処理を行う。まず、分類部113は、並び替え後の固有ベクトルに関し、隣接する期どうしのベクトルの内積が負の場合に、一方の固有ベクトルに「-1」を乗じることにより固有ベクトルの向きを揃える。
例えば、分類部113は、2013年夏期の固有ベクトル「v4,2」と、2013年秋期の固有ベクトル「v1,3」との内積が負である場合、固有ベクトル「v1,3」に「-1」を乗じて「-v1,3」とする。すなわち、分類部113は、期j={1,…,t-1}、商品i={1,…,d}としたとき、「vi,j・vi,j+1<0」である場合に「vi,j+1」を「-vi,j+1」にすることにより、固有ベクトル方向の向きを揃える。
図8は、固有ベクトルの向きの調整を説明するための図である。図8に示される例のように、2013年春期の主成分データ11a、夏期の主成分データ11b、秋期の主成分データ11cおよび冬期の主成分データ11dが示される。固有ベクトル「v1,3」は、2013年秋期の主成分データ11cの第1主成分のレコードに「-v1,3」とした場合の各商品の値を格納する。すなわち、図5の例に示される主成分データ11cの第1主成分のレコードに含まれる各商品の値に「-1」を乗じる。この場合の主成分データ11cの第1主成分のレコードは、図8の例に示される主成分データ11cの第1主成分のレコードに対応する。
次いで、分類部113は、固有ベクトル方向の高さを算出する。例えば、分類部113は、向きが調整された後の各固有ベクトル「vd,j」に対して、実行部111によって取得された期毎に各ユーザの行動を要約したベクトル「xk,j」のそれぞれを乗じることにより固有ベクトル方向の高さを算出する。
すなわち、分類部113は、式(2)により固有ベクトル方向の高さを算出する。
yk,j=(xk,j・v1,j, … ,xk,j・vd,j) ・・・(2)
図9を用いて、固有ベクトル方向の高さの算出について説明する。図9は、固有ベクトル方向の高さを算出することを説明するための図である。図9に示される例のように、固有ベクトル方向の高さを反映させた2013年春期の主成分の高さデータ12aと、夏期の主成分の高さデータ12bと、秋期の主成分の高さデータ12cと、冬期の主成分の高さデータ12dとが示される。各期の主成分の高さデータには、第1主成分〜第d主成分までそれぞれの主成分に固有ベクトル方向の高さが格納される。
例えば、2013年冬期の主成分データ12dにおいて、顧客Aの第1主成分に「-130.4013」、第2主成分に「60.5697」、第3主成分に「-36.3569」、第4主成分に「51.2404」、第d主成分に「11.67611」が格納される。また、2013年冬期の主成分データ12dにおいて、顧客Bの第1主成分に「-157.5104」、第2主成分に「71.3389」、第3主成分に「4.50123」、第4主成分に「5.78115」、第d主成分に「0.000013」が格納される。また、2013年冬期の主成分データ12dにおいて、顧客Zの第1主成分に「6.03269」、第2主成分に「-2.4325」、第3主成分に「-1.42352」、第4主成分に「30.4156」、第d主成分に「-0.02145」が格納される。なお、2013年冬期の他の顧客に関しても、主成分毎に固有ベクトル方向の高さが格納される。また、2013年の春期、夏期および秋期の他の期に関しても、顧客毎に各主成分に係る固有ベクトル方向の高さが格納される。
次いで、分類部113は、期毎に各ユーザが所属するクラスを決定する。分類部113は、算出された固有ベクトル方向の高さ「yk,j」をクラス決定関数「f(yk,j)」にそれぞれ代入することにより、各ユーザが所属するクラスを決定する。例えば、クラス決定関数「f(yk,j)」は、式(3)のようなものである。
f(yk,j)=1(0<y)
f(yk,j)=0(y=0)
f(yk,j)=−1(y<0) ・・・(3)
式(3)のクラス決定関数は一例であり、他のクラス決定関数を使用してもよい。例えば、分類部113は、以下の式(4)のクラス決定関数「f(yk,j)」を使用してもよい。
f(yk,j)=1(50<y)
f(yk,j)=0(y=50)
f(yk,j)=−1(y<50) ・・・(4)
すなわち、分類部113は、期毎に各主成分について算出された固有ベクトル方向の高さが50より大きいか、50であるか、もしくは50未満であるかに基づき、各ユーザのクラスを決定してもよい。なお、分類部113は、上記以外のクラス決定関数を使用してもよい。そして、分類部113は、決定された各顧客のクラスを顧客層データに格納する。
分類部113が固有ベクトル方向の高さをクラス決定関数「f(yk,j)」に代入することで決定されたクラスの一例は、図4である。図4を用いて、分類部113による各ユーザが所属するクラスの決定に関して説明する。図4に示される例のように、顧客層データ123によると、顧客Aの2013年春期のクラスは「c−1,1,−1」である。また、顧客Aの2013年夏期のクラスは「c−1,1,−1」である。また、顧客Aの2013年秋期のクラスは「c−1,1,−1」である。また、顧客Aの2013年冬期のクラスは「c−1,1,−1」である。
なお、上記の例において、分類部113は、クラス決定関数「f(yk,j)」に第1〜第3主成分に対応する固有ベクトル方向の高さを代入している。分類部113は、第1〜第3主成分以外の主成分に対応する固有ベクトル方向の高さを選択してもよい。
一方、顧客Bの2013年春期のクラスは「c−1,−1,−1」である。また、顧客Bの2013年夏期のクラスは「c−1,1,−1」である。また、顧客Bの2013年秋期のクラスは「c−1,1,−1」である。また、顧客Bの2013年冬期のクラスは「c−1,1,1」である。
例えば、分類部113は、顧客Aが春期、夏期、秋期および冬期を通じてクラスが「c−1,1,−1」であったと判定する。また、分類部113は、顧客Bが春期に顧客Aとは別のクラス「c−1,−1,−1」に所属していたが、夏期および秋期に顧客Aと同じクラス「c−1,1,−1」に所属したと判定する。また、分類部113は、顧客Bが冬期に顧客Aとは別のクラス「c−1,1,1」に所属したと判定する。なお、分類部113は、他の顧客に関しても、所属するクラスを決定してもよい。
なお、分類部113は、クラス決定関数に代入する固有ベクトル方向の高さの数を増やしても減らしてもよい。例えば、分類部113は、クラス決定関数に代入する固有ベクトル方向の高さの数を「4」とした場合、クラスは例えば「c−1,1,−1,−1」のように表される。また、分類部113は、固有ベクトル方向の高さの数を「2」とした場合、クラスは例えば「c−1,1」のように表される。
また、分類部113は、顧客の総数、顧客を分類する目的などに応じて分類するクラス数を設定してもよい。例えば、分類部113は、クラス決定関数に代入する固有ベクトル方向の高さの数が「3」の場合、クラス決定関数は3つの返り値を有するので、最大で「27」種類のクラスに分類することになる。また、分類部113は、クラス決定関数に代入する固有ベクトル方向の高さの数が「4」の場合、最大で「81」種類のクラスに分類することになる。また、分類部113は、クラス決定関数に代入する固有ベクトル方向の高さの数が「2」の場合、最大で「9」種類のクラスに分類することになる。
図10を用いて、情報処理装置の処理のフローを説明する。図10は、情報処理装置の処理を説明するための図である。まず、実行部111は、購買履歴データ121を基に各顧客に関し、期毎に各商品を購入した合計数を集計する(ステップS10)。実行部111は、集計結果をまとめた購買データ122を生成する。また、実行部111は、生成された購買データ122に基づいて期毎に各ユーザの行動を要約したベクトル「xk,j」を取得する。
次いで、実行部111は、分割された期毎の主成分分析を実行する(ステップS11)。例えば、実行部111は、商品の種類数dとした場合、各期の第1主成分〜第d主成分までを算出する。実行部111は、算出された第1主成分〜第d主成分に対応する固有ベクトルを生成する。そして、実行部111は、各期において、主成分毎に各商品の値を対応付けた主成分データを作成する。
特定部112は、隣接する期どうしで対応する固有ベクトルを同定する(ステップS12)。例えば、特定部112は、実行部111によって生成された各主成分の固有ベクトルを期毎に列挙する。次いで、特定部112は、隣接する期にそれぞれ含まれる固有ベクトルどうしの内積が最も大きい組を選択して、選択された組が隣り合うように各期の固有ベクトルを並び替える。これにより、特定部112は、対応する固有ベクトルが各列に並ぶように並び替える。
分類部113は、固有ベクトルの向きを調整する(ステップS13)。すなわち、分類部113は、並び替え後の固有ベクトルに関し、隣接する期どうしのベクトルの内積が負の場合に、一方の固有ベクトルに−1を乗じることにより固有ベクトルの向きを揃える。
分類部113は、固有ベクトル方向の高さを算出する(ステップS14)。すなわち、分類部113は、実行部111によって取得された各ユーザの行動を要約したベクトル「xk,j」と、固有ベクトル「vd,j」とを乗じることにより算出する。
分類部113は、期毎に各顧客のクラスを決定する(ステップS15)。すなわち、分類部113は、算出された固有ベクトル方向の高さ「yk,j」をクラス決定関数「f(yk,j)」に代入することにより、各ユーザが所属するクラスを決定する。なお、分類部113は、クラス決定関数に代入する高さに関しては、どの主成分に対応する固有ベクトル方向の高さを採用するかを選択してもよい。
すなわち、情報処理装置100は、以下の処理部を有する。情報処理装置100は、ある期間内に複数の人のそれぞれについて検出された行動を示すデータである処理対象のデータを、該データに含まれる時間に関する情報を参照して、所定の期間長に分割し、分割した期間長毎に別箇に主成分分析を実行する実行部111を有する。情報処理装置100は、それぞれの主成分分析の結果算出された軸につき、時間的に隣り合う分析期間どうしで、対応する軸を特定する特定部112を有する。情報処理装置100は、処理対象のデータ全体を通じ、時間的に隣り合う期間どうしでそれぞれ対応付けた軸どうしを同一の軸とみなし、複数の人を複数にグルーピングする分類部113を有する。これにより、情報処理装置100は、ある期間だけに見られる購買傾向を加味して顧客をグルーピングできる。
また、特定部112は、時間的に隣り合うベクトルのうち、内積値が大きいベクトルを対応付けることにより、対応するベクトルに特定する。これにより、隣接する期において平行に近いベクトルの組を特定できる。
また、分類部113は、時間的に隣り合うベクトルの内積値が負となる場合に、一方のベクトルの向きを反対にする。これにより、隣接する期のベクトルの向きを揃えることができる。
また、分類部113は、各ベクトル方向の高さに基づいて、複数の人を複数にグルーピングする。これにより、各ベクトル方向の高さを加味して複数の人を各クラスに分類することができる。
次に、図11を用いて、各クラスの遷移について説明する。図11は、クラス毎の各期における遷移の第1の例を示す図である。図11に示される例のように、クラスは、「入会」「A」「B」「C」「D」「休眠」の6個のクラスに分類される。「入会」クラスは、入会した時期が直近の顧客のクラスである。「A」「B」「C」「D」の各クラスは、分類部113によってクラス決定関数に基づいて決定された顧客のクラスである。「休眠」クラスは、所定期間、購買履歴がない顧客のクラスである。隣接する期の間における顧客の遷移量は、隣接する期をつなぐ帯状の領域で表示される。
なお、上述したように、情報処理装置100は、すべてのクラスをクラス決定関数に基づいて決定するのに限らず、他の基準でクラスを決定してもよい。例えば、情報処理装置100は、入会した時期が直近の顧客のクラス、所定期間、購買履歴がない顧客のクラスなどのように、ユーザに他の条件を設定して各ユーザのクラスを決定してもよい。
出力部102は、隣接する期の間における顧客の遷移量を、隣接する期をつなぐ帯状の領域で表示する。点線で示される「A」クラスおよび「B」クラスがロイヤルカスタマーのグループである。図11に示される例においては、「A」クラスおよび「B」クラスが他のクラスに遷移する量が少ない。したがって、図11からロイヤルカスタマーが多い状態で安定していることが読み取れる。
図12を用いて、各クラスの遷移について説明する。図12は、クラス毎の各期における遷移の第2の例を示す図である。「A」クラスが乳幼児向けの商品を購入する顧客のグループである。図12に示される例のように、「A」クラスは、休眠クラスに移行していない。このため、図12から乳幼児向けの商品を購入する顧客は、休眠しない傾向が読み取れる。一方、図12から「入会」クラスの約半数が「休眠」クラスに遷移する傾向も読み取れる。
すなわち、情報処理装置100は、全期間を通じて共通のクラスラベルを用いることで、クラス毎の顧客の流出、流入を捉えることができ、特定のクラスに向けた施策案など、きめ細かい対応ができるようになる。
上述したように、情報処理装置100は、購入傾向を最も強調する方向に固有ベクトルを設定するので、全体の購買傾向を失うことなくサンプルの疎性を緩和することができる。例えば、クラスター分析では、商品の代わりに商品分類などを用いて次元をまとめることが考えられるが、その分類がユーザの感じ方と異なる場合に、購買傾向の特徴を失ってしまう可能性がある。一方、情報処理装置100は、主成分分析により各顧客の購買傾向を把握するので、全体の購買傾向の特徴が失われるのを防止できる。
また、情報処理装置100は、購買データ122を主成分分析することで得られた固有ベクトルに基づき、商品毎に因子負荷量を算出してもよい。因子負荷量とは、各商品の購入数が与える主成分への影響の度合いを表す指標である。そして、情報処理装置100は、商品毎に因子負荷量を算出したものを提示することにより、各主成分に影響の強い商品を特定しやすくし、クラス毎の嗜好の解析をおこなうことができる。
また、情報処理装置100は、期毎に主成分分析をおこなうことで、季節性のある商品等の影響を自然に取り込むことができる。例えば、情報処理装置100は、夏期にのみ多く購入される季節商品があり、夏期の主成分データに対して当該季節商品の影響が大きかった場合にも、当該季節商品の購入を加味して顧客をグルーピングすることが可能となる。これにより、情報処理装置100は、ある期にのみ見られる購買の傾向を各顧客のクラスを決定する際に使用することができる。
また、情報処理装置100は、期毎の商品の因子負荷量を比較することによって、商品の季節性やトレンドを捉えることができ、施策立案につなげることも可能である。例えば、情報処理装置100は、商品毎の因子負荷量を、期をまたいで比較することによって、ある季節にのみ因子負荷量が大きくなっている商品を把握させることができる。これにより、購買データ122に含まれる多数の商品の中から、季節性を有する商品を検出しやすくできる。
一方、情報処理装置100は、ある季節にのみ因子負荷量が大きくなっている商品の購買傾向を避けて顧客をグルーピングすることによって、季節変動の影響を小さくして顧客をグループ化することもできる。
また、情報処理装置100は、商品毎の因子負荷量を、期をまたいで比較することによって、因子負荷量が徐々に大きくなっている商品もしくは徐々に小さくなっている商品を把握させることができる。これにより、ある商品の購買数の変化をトレンドとして把握させやすくすることができる。
以下、上述の実施形態における変形例の一部を説明する。下記の変形例のみでなく、本発明の本旨を逸脱しない範囲の設計変更は適宜行われうる。
実施例1において、分類部113は、クラス決定関数「f(yk,j)」に第1〜第3主成分までの固有ベクトル方向の高さを代入する旨を説明したが、これに限定されない。例えば、分類部113は、第1〜第3主成分以外の主成分を選択してもよい。
実施例1において、情報処理装置100は、2013年春期、夏期、秋期および冬期の購買履歴データ121を使用する旨を説明したが、これに限定されない。例えば、購買履歴データ121は、他の年度の購買履歴データを使用してもよい。
実施例1において、情報処理装置100は、2013年春期、夏期、秋期および冬期の4半期の各期に設定して、期毎に各処理を実行する旨を説明したが、これに限定されない。例えば、情報処理装置100は、月毎に各処理を実行してもよい。
実施例1において、情報処理装置100は、すべてのクラスをクラス決定関数に基づいて決定する旨を説明したが、これに限定されない。例えば、情報処理装置100は、入会した時期が直近の顧客のクラス、所定期間、購買履歴がない顧客のクラスなどのように、ユーザに他の条件を設定して各ユーザのクラスを決定してもよい。
上述した情報処理装置100は、1台のコンピュータに実装されてもよく、また、複数台のコンピュータによるクラウドに実装されてもよい。例えば、情報処理装置100は、クラウドシステムに含まれる複数台のコンピュータが、図1に示した実行部111、特定部112および分類部113と同様の機能を発揮する。
また、実施例1に示した処理手順、制御手順、具体的名称、各種のデータやパラメータを含む情報については、特記する場合を除いて任意に変更することができる。
(情報処理装置のハードウェア構成)
図13は、情報処理装置のハードウェア構成を示す図である。図13が示すように、コンピュータ200は、各種演算処理を実行するCPU201と、ユーザからのデータ入力を受け付ける入力装置202と、モニタ203とを有する。また、コンピュータ200は、記憶媒体からプログラム等を読み取る媒体読取装置204と、他の装置と接続するためのインターフェース装置205と、他の装置と無線により接続するための無線通信装置206とを有する。また、コンピュータ200は、各種情報を一時記憶するRAM(Random Access Memory)207と、ハードディスク装置208とを有する。また、各装置201〜208は、バス209に接続される。
ハードディスク装置208には、例えば、図1に示した制御部110の実行部111、特定部112および分類部113と同様の機能を有する情報処理プログラムが記憶される。また、ハードディスク装置208には、情報処理プログラムを実現するための各種データが記憶される。
CPU201は、ハードディスク装置208に記憶された各プログラムを読み出して、RAM207に展開して実行することで、各種の処理を行う。これらのプログラムは、コンピュータ200を図1に示した制御部110の実行部111、特定部112および分類部113として機能させることができる。
なお、上記の情報処理プログラムは、必ずしもハードディスク装置208に記憶されている必要はない。例えば、コンピュータ200が読み取り可能な記憶媒体に記憶されたプログラムを、コンピュータ200が読み出して実行するようにしてもよい。コンピュータ200が読み取り可能な記憶媒体は、例えば、CD−ROMやDVDディスク、USB(Universal Serial Bus)メモリ等の可搬型記録媒体、フラッシュメモリ等の半導体メモリ、ハードディスクドライブ等が対応する。また、公衆回線、インターネット、LAN(Local Area Network)等に接続された装置にこのプログラムを記憶させておき、コンピュータ200がこれらからプログラムを読み出して実行するようにしてもよい。
100 情報処理装置
101 入力部
102 出力部
110 制御部
111 実行部
112 特定部
113 分類部
120 記憶部
121 購買履歴データ
122 購買データ
123 顧客層データ

Claims (7)

  1. コンピュータが
    記憶部に記憶された、ある期間内に複数の人のそれぞれについて検出された行動を示すデータである処理対象のデータを、該データに含まれる時間に関する情報を参照して、所定の期間長に分割し、前記分割した期間長毎に別箇に主成分分析を実行し、
    それぞれの主成分分析の結果算出された軸につき、時間的に隣り合う分析期間どうしで、平行により近い軸同士を組み合わせて対応する軸を特定し、
    前記処理対象のデータ全体を通じ、時間的に隣り合う期間どうしでそれぞれ対応付けた軸どうしを同一の軸とみなし、当該同一の軸方向にかかる主成分の値に基づき前記複数の人を複数にグルーピングする
    処理を実行することを特徴とする情報処理方法。
  2. 前記軸を特定する処理は、時間的に隣り合うベクトルのうち、内積値が大きいベクトルを対応付けることにより、対応するベクトルを特定することを特徴とする請求項1に記載の情報処理方法。
  3. 前記グルーピングする処理は、時間的に隣り合うベクトルの内積値が負となる場合に、一方のベクトルの向きを反対にすることを特徴とする請求項1に記載の情報処理方法。
  4. 前記グルーピングする処理は、各ベクトル方向の高さに基づいて、前記複数の人を複数にグルーピングすることを特徴とする請求項1に記載の情報処理方法。
  5. 前記所定の期間長ごとに、グループ別に積み上げた棒グラフに、時間的に隣り合う期間どうしで、グルーピングが変更になった人数に応じた幅で、変更前後のグループをつなぐ帯を出力する処理を、さらにコンピュータが実行することを特徴とする請求項1に記載の情報処理方法。
  6. 記憶部に記憶された、ある期間内に複数の人のそれぞれについて検出された行動を示すデータである処理対象のデータを、該データに含まれる時間に関する情報を参照して、所定の期間長に分割し、前記分割した期間長毎に別箇に主成分分析を実行し、
    それぞれの主成分分析の結果算出された軸につき、時間的に隣り合う分析期間どうしで、平行により近い軸同士を組み合わせて対応する軸を特定し、
    前記処理対象のデータ全体を通じ、時間的に隣り合う期間どうしでそれぞれ対応付けた軸どうしを同一の軸とみなし、当該同一の軸方向にかかる主成分の値に基づき前記複数の人を複数にグルーピングする
    処理をコンピュータに実行させることを特徴とする情報処理プログラム。
  7. 記憶部に記憶された、ある期間内に複数の人のそれぞれについて検出された行動を示すデータである処理対象のデータを、該データに含まれる時間に関する情報を参照して、所定の期間長に分割し、前記分割した期間長毎に別箇に主成分分析を実行する実行部と、
    それぞれの主成分分析の結果算出された軸につき、時間的に隣り合う分析期間どうしで、平行により近い軸同士を組み合わせて対応する軸を特定する特定部と、
    前記処理対象のデータ全体を通じ、時間的に隣り合う期間どうしでそれぞれ対応付けた軸どうしを同一の軸とみなし、当該同一の軸方向にかかる主成分の値に基づき前記複数の人を複数にグルーピングする分類部と
    を有することを特徴とする情報処理装置。
JP2015554486A 2013-12-27 2013-12-27 情報処理方法、プログラムおよび装置 Expired - Fee Related JP6237790B2 (ja)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
PCT/JP2013/085273 WO2015097914A1 (ja) 2013-12-27 2013-12-27 情報処理方法、プログラムおよび装置

Publications (2)

Publication Number Publication Date
JPWO2015097914A1 JPWO2015097914A1 (ja) 2017-03-23
JP6237790B2 true JP6237790B2 (ja) 2017-11-29

Family

ID=53477840

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2015554486A Expired - Fee Related JP6237790B2 (ja) 2013-12-27 2013-12-27 情報処理方法、プログラムおよび装置

Country Status (3)

Country Link
US (1) US20160307222A1 (ja)
JP (1) JP6237790B2 (ja)
WO (1) WO2015097914A1 (ja)

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002083110A (ja) * 2000-09-06 2002-03-22 Dentsu Inc 顧客行動パターンの予測を支援する方法、及びこれを用いたマーケティング支援システム
JP2002117212A (ja) * 2000-10-10 2002-04-19 Dainippon Printing Co Ltd 顧客分析システムおよび顧客管理方法
US20100049538A1 (en) * 2008-08-22 2010-02-25 Durban Frazer Method and apparatus for selecting next action
JP2010079418A (ja) * 2008-09-24 2010-04-08 Nec Electronics Corp 統計spiceモデルパラメータ算出方法、統計spiceモデルパラメータ算出装置及びプログラム
US9589271B2 (en) * 2011-08-05 2017-03-07 American Express Travel Related Services Company, Inc. Systems and methods for determining ad impression utility
US20150263925A1 (en) * 2012-10-05 2015-09-17 Telefonaktiebolaget L M Ericsson (Publ) Method and apparatus for ranking users within a network

Also Published As

Publication number Publication date
JPWO2015097914A1 (ja) 2017-03-23
WO2015097914A1 (ja) 2015-07-02
US20160307222A1 (en) 2016-10-20

Similar Documents

Publication Publication Date Title
JP5963709B2 (ja) 計算機、予測方法、及び、予測プログラム
CN105612516B (zh) 属性冗余去除
US20200043022A1 (en) Artificial intelligence system and method for generating a hierarchical data structure
KR102591481B1 (ko) 인공지능 기반 트렌드에 기초한 판매제품 추천 시스템
US20140067476A1 (en) Marketing device, marketing method, program and recording medium
JP6125627B2 (ja) 消費者ディシジョンツリー生成システム
US20140278778A1 (en) Method, apparatus, and computer-readable medium for predicting sales volume
JP7107222B2 (ja) 商品需要予測システム、商品需要予測方法および商品需要予測プログラム
CN111695023A (zh) 信息推荐方法、装置、存储介质及设备
WO2017012406A1 (zh) 一种商品推荐方法及系统
JP6694901B2 (ja) データ管理装置およびデータ管理システム
CA2990433A1 (en) Integrated meal plan generation and supply chain management
US11301763B2 (en) Prediction model generation system, method, and program
JP6696568B2 (ja) アイテム推奨方法、アイテム推奨プログラムおよびアイテム推奨装置
JP6932919B2 (ja) プログラムおよび商品抽出システム
JP6003586B2 (ja) クラスタリングプログラム、クラスタリング方法、およびクラスタリング装置
US11188568B2 (en) Prediction model generation system, method, and program
JP6237790B2 (ja) 情報処理方法、プログラムおよび装置
KR101879829B1 (ko) 클릭 로그 데이터를 이용하여 이상 사용자를 검출하는 방법 및 장치
JP6962888B2 (ja) 特徴抽出装置
Yeo The rise of niche consumption: A shopping basket similarity approach
US20210065276A1 (en) Information processing apparatus and non-transitory computer readable medium
JP7201001B2 (ja) 品揃え支援装置、品揃え支援方法、及びプログラム
CN111507780A (zh) 提高客单价的方法及装置
JP2019179509A (ja) 顧客グループ抽出装置、顧客グループ抽出方法、およびプログラム

Legal Events

Date Code Title Description
A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20170711

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20170904

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20171003

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20171016

R150 Certificate of patent or registration of utility model

Ref document number: 6237790

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

LAPS Cancellation because of no payment of annual fees