JP6745343B2 - 顧客意思決定ツリー生成システム - Google Patents

顧客意思決定ツリー生成システム Download PDF

Info

Publication number
JP6745343B2
JP6745343B2 JP2018535405A JP2018535405A JP6745343B2 JP 6745343 B2 JP6745343 B2 JP 6745343B2 JP 2018535405 A JP2018535405 A JP 2018535405A JP 2018535405 A JP2018535405 A JP 2018535405A JP 6745343 B2 JP6745343 B2 JP 6745343B2
Authority
JP
Japan
Prior art keywords
attribute
similarity
product
sales
value
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2018535405A
Other languages
English (en)
Other versions
JP2019501464A5 (ja
JP2019501464A (ja
Inventor
ウー,ス−ミン
シン,ジョン
パンチャンガム,キラン・ベンカタ
Original Assignee
オラクル・インターナショナル・コーポレイション
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by オラクル・インターナショナル・コーポレイション filed Critical オラクル・インターナショナル・コーポレイション
Publication of JP2019501464A publication Critical patent/JP2019501464A/ja
Publication of JP2019501464A5 publication Critical patent/JP2019501464A5/ja
Application granted granted Critical
Publication of JP6745343B2 publication Critical patent/JP6745343B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0201Market modelling; Market analysis; Collecting market data
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N5/00Computing arrangements using knowledge-based models
    • G06N5/01Dynamic search techniques; Heuristics; Dynamic trees; Branch-and-bound
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N5/00Computing arrangements using knowledge-based models
    • G06N5/02Knowledge representation; Symbolic representation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/06Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
    • G06Q10/067Enterprise or organisation modelling

Description

分野
一実施形態は、全体的に、コンピュータシステムを対象とし、特に、顧客意思決定ツリーを生成するコンピュータシステムを対象とする。
背景情報
購買意思決定プロセスは、商品またはサービスの購入前、購入中、および購入後に消費者が行う潜在的な市場取引についての意思決定プロセスである。より一般的には、意思決定は、複数の選択肢の中から行動方針を選択する認知過程である。よくある例に、買い物や、何を食べるかを決めることなどがある。
一般に、消費者の購買意思決定を分析する3つの方法がある。(1)経済的モデル。このモデルは、非常に定量的であり、合理性の仮定およびほぼ完全な知識に基づく。消費者は、自身の効用を最重要視すると見られる。(2)心理的モデル。このモデルは、モチベーションおよびニーズの認識など、心理的および認知過程に重点を置く。このモデルは、定量的というよりむしろ定性的であり、文化的影響および家族の影響のような社会学的要因に基づく。(3)顧客行動モデル。これは、マーケターが利用する実用的なモデルである。このモデルは、通常、経済的モデルと心理的モデルとを組み合わせたモデルである。
顧客行動モデルの1つのタイプが「顧客意思決定ツリー」(「CDT」)として知られている。CDTは、所定のカテゴリーのアイテムの購入に関する商品属性空間における、顧客の意思決定の階層を図に表したものである。CDTは、顧客が、欲しいアイテムに絞り込む前に、あるカテゴリー内の互いに異なる選択肢(属性に基づく)についてどう考えるかをモデル化し、顧客の購買意思決定を理解するのに役立つ。また、これは、「商品セグメンテーションおよびカテゴリー構造」としても一般的に知られている。CDTは、従来、市場調査のサーベイおよびその他のツールに基づいて、ブランドメーカーまたは第三者の市場調査会社によって作成される。しかしながら、これらの方法は、正確さに欠け、且つ、ブランドメーカーが提供するバイアスのかかったデータに基づくことがあるため、信憑性に欠ける可能性がある。
概要
一実施形態は、顧客意思決定ツリーを生成するシステムである。システムは、小売アイテム取引売上データを受け付ける。システムは、売上データをアイテム/店舗/期間レベルに集成し、売上データを属性値/店舗/期間レベルに集成する。システムは、期間の売上シェアを判定し、属性値ペア間の相関関係に基づいて、属性値ペアについての類似度を判定する。次に、システムは、判定された類似度に基づいて、最上位属性を判定する。
本発明の実施形態に係る、コンピュータサーバ/システムのブロック図である。 一実施形態に係る、小売店の取引データに基づいて自動的に生成されるヨーグルト商品カテゴリーについての例示的なCDTを示す図である。 一実施形態に係るCDTを生成する際の図1のCDT生成モジュールの機能のフロー図である。 一実施形態に係る、類似度を判定する際の図1のCDT生成モジュールの機能のフロー図である。 一実施形態に係る、類似度に基づいてCDTを生成する際の図1のCDT生成モジュールの機能のフロー図である。 一実施形態に係る、CDT生成モジュールが生成するCDTを示す図である。
詳細な説明
一実施形態は、アイテムの類似度を判定するために、小売店の取引データ、具体的には、アイテム‐店舗‐週を集成した売上数量データを利用して、顧客意思決定ツリー(「CDT」)を自動的に生成する。そのため、CDTを生成するために、ポイントプログラムを利用していない小さな小売店も入手可能な取引データを使用することができる。さらに、実施形態は、小売店のどのアイテム同士が1つのカテゴリーにおいて同類であるかについての判定を行う。
図1は、本発明の実施形態に係る、コンピュータサーバ/システム10のブロック図である。1つのシステムとして図示しているが、システム10の機能は、分散システムとして実装することができる。さらに、本明細書に開示の機能は、互いにネットワークを通じて接続され得る別々のサーバまたは装置上に実装することができる。さらに、システム10の1つ以上の構成要素が備えられなくてもよい。たとえば、サーバの機能について、システム10は、プロセッサおよびメモリを備える必要があってもよいが、キーボードまたはディスプレイなど、図1に示すその他の構成要素のうちの1つ以上は備えなくてもよい。
システム10は、情報を通信するためのバス12またはその他の通信機構と、情報を処理するための、バス12に接続されたプロセッサ22とを含む。プロセッサ22は、任意の種類の汎用プロセッサまたは特定用途向けプロセッサであってもよい。システム10は、さらに、プロセッサ22によって実行される情報および命令を格納するためのメモリ14を備える。メモリ14は、Random Access Memory(「RAM」)、Read Only Memory(「ROM」)、磁気もしくは光ディスク、またはその他の種類のコンピュータ読み取り可能な媒体などの静的記憶装置、のうちの任意の組み合わせから構成できる。システム10は、さらに、ネットワークにアクセスできるようにするために、ネットワークインターフェースカードなどの通信装置20を含む。そのため、ユーザは、システム10と直接インターフェース接続する、またはネットワークもしくは任意のその他の方法を通じて間接的にインターフェース接続することができる。
コンピュータ読み取り可能な媒体は、プロセッサ22がアクセスできる任意の入手可能な媒体であってもよく、揮発性および不揮発性媒体の両方、リムーバブルおよびソリッドステートメディア、ならびに通信媒体を含む。通信媒体は、コンピュータ読み取り可能な命令、データ構造、プログラムモジュール、または搬送波もしくはその他の移送機構などの変調データ信号に含まれるその他のデータを含み得、任意の情報配信媒体を含む。
プロセッサ22は、さらに、バス12を介して液晶ディスプレイ(「LCD」)などのディスプレイ24に接続される。さらに、ユーザがシステム10とインターフェース接続できるようにするために、キーボード26、およびコンピュータマウスなどのカーソル制御デバイス28がバス12に接続される。
一実施形態において、メモリ14は、プロセッサ22によって実行されたときに機能を提供するソフトウェアモジュールを格納する。モジュールは、システム10のためのオペレーティングシステム機能を提供するオペレーティングシステム15を含む。モジュールは、さらに、小売店の消費者データからCDTを自動的に生成する顧客意思決定ツリー生成モジュール16、および本明細書に開示のすべてのその他の機能を含む。システム10は、より大きなシステムの一部であることができる。そのため、システム10は、追加機能を含むために、小売管理システム(たとえば、「オラクル社製のOracle Retail Merchandising System」または「Oracle Retail Advanced Science Engine」(「ORASE」))または(統合基幹業務「ERP」)システムなど、1つ以上の追加の機能モジュール18を含めることができる。データベース17は、モジュール16および18用の集中ストレージを提供するためにバス12に接続され、顧客データ、商品データ、取引データなどを格納する。一実施形態において、データベース17は、格納されたデータを管理するために構造化照会言語(「SQL」)を使用できるリレーショナルデータベース管理システム(「RDBMS」)である。一実施形態において、販売時点情報管理(「POS」)端末100は、CDTを生成するために使用される取引データ(たとえば、アイテム‐店舗‐週を集成した売上数量データ)を生成する。POS端末100自体が、一実施形態に係るCDTを生成するための追加の処理機能を含めることができる。
説明したように、CDTは、小売業界における基準の図であり、小売店が販売する商品の属性に起因すると顧客が考える重要度を示す。小売店の商品の各カテゴリーは、当該カテゴリーから商品を購入する顧客の行動を記述した独自の顧客意思決定ツリーを有してもよい。カテゴリーの属性は、ツリー状に配置され、「最も重要」な属性がツリーの根にあり、残りの属性がツリーの枝に沿って配置される。「最も重要」な属性は、カテゴリーから商品を購入する際に、カテゴリーの顧客がまず注目するカテゴリーの属性を示す。次に、枝は、カテゴリーの顧客が残りの属性を考慮する順序を示す。
図2は、一実施形態に係る、小売店の取引データに基づいてシステム10が自動的に生成するヨーグルト商品カテゴリーの例示的なCDT200である。図2に示すように、ヨーグルト商品カテゴリーの商品属性は、大きさ、ブランド、フレーバー(flavor)、生産方法などを含む。商品属性「サイズ」の属性値には、小、中、大が含まれる。商品属性「ブランド」の属性値には、主流ブランドおよびニッチブランドが含まれる。商品属性「生産方法」の属性値には、オーガニックおよび非オーガニックが含まれる。商品属性「フレーバー」の属性値には、フレーバー無し、主流フレーバー、および特別フレーバーが含まれる。
CDT200は、ヨーグルトを購入する際の顧客の意思決定過程への見解を小売店に提供する。たとえば、サイズはヨーグルトのカテゴリー下で第1レベル属性値であるため、CDT200は、意思決定過程の間、ヨーグルト商品202のサイズ204〜206は、顧客の中で、概ね、最も重要な要因であることを示す。次に、好みのサイズによっては、ブランドまたは生産方法が2番目に重要な要因であると考えられる。たとえば、小サイズを好む顧客にとって、生産方法(たとえば、オーガニック210または非オーガニック211)は、2番目に重要な要因である。しかしながら、中サイズまたは大サイズのアイテムを好む顧客にとっては、ブランドが2番目に重要な要因であり、生産方法は、意思決定過程に何ら影響を与えない。また、フレーバーは、主流ブランドが販売する中サイズまたは大サイズのヨーグルト商品を好む顧客の中では考慮されるが、小サイズのヨーグルト商品を好む顧客の意思決定過程には何ら影響を与えない。
これまで、CDT生成は、自動プロセスではなかった。CDT生成へのこれまでの取り組みは、顧客にインタビューする業界の専門家を雇って、店内での顧客の行動を調べる必要がある場合が多く、専門家は、その後、CDTを手作業で抽出していた。1つの既知の自動式の解決策が米国特許第8,874,499号に記載されており、これは、小売店のカテゴリーのこれまでの取引データを利用することによって、カテゴリーごとのCDTを抽出する。しかしながら、この既知の解決策は、たとえば、顧客ポイントカードを利用して、小売店がカテゴリーのこれまでの取引を顧客ごとに分けることができることを必要とする。また、同じ顧客が比較的短期間のうちにカテゴリーにおいて複数回買い物をしていることも必要とする。取引データ上のこれらの必要条件によって、システムは、カテゴリーの顧客の「スイッチ行動」を調べることによって、属性の重要度、つまり、顧客がカテゴリーの1つの商品に常にこだわらないときに、カテゴリーの他のどの商品を顧客が購入したかを算出できるようになる。この既知の解決策は、このような「スイッチ行動」を調べるため、これまでの取引データが顧客ごとに特定でき、且つ、顧客が普段複数回買い物をするカテゴリーのCDTしか算出できない。そうでない場合、調べるスイッチ行動が存在しない。
そのため、状況によっては、これらの既知の解決策に適していない多くのカテゴリーおよび多くの小売店がある。たとえば、多くの小売店、特に小さな小売店は、その費用の高さからポイントカードプログラムを実施していない。さらに、多くの小売店は、同じ顧客による常習的な購入の可能性が極めて少ないカテゴリーを販売している。これは、たとえば、ほとんどの電子機器カテゴリーを説明している。食料雑貨店など、多くの妥当なカテゴリーを有する小売店でさえ、食料雑貨店の鍋やフライパンなど、不適当なカテゴリーを有することになる可能性がある。
対照的に、本発明の実施形態は、顧客ポイントプログラムがなくても事実上すべての小売店によって生成されるデータである、アイテム‐店舗‐週を集成した売上数量データを利用する。そのため、実施形態は、費用のかかるポイントカードプログラムを実施する金銭的な余裕がない比較的小さな小売店を含むさまざまな小売店が利用することができる。さらに、実施形態は、携帯電話およびテレビなど、頻繁に購入されない商品のカテゴリーについてのCDTを判定できる。
さらに、実施形態は、カテゴリーにおいてどのアイテム同士が同類であるかを判定できる。食料雑貨店でのヨーグルトカテゴリーなど、カテゴリーがどのアイテムから構成されているかが明確である場合が多いが、カテゴリーがあまり明確ではない多くの小売店がある。たとえば、ディズニーストアにおいて、顧客、特に子供が店舗で何かを買うとき、アイテムに特定のディズニーキャラクターが付されていれば、アイテムの機能が実際何であるかは気にしないことが多いため、カテゴリーが何であるかがはっきりしない可能性がある。そのため、たとえば、ペンが実際にマグカップの売上げを減らしてしまう可能性がある。よって、ペンとマグカップは、通常、異なるカテゴリーのアイテムであるにもかかわらず、ディズニーストアでは異なるカテゴリーでない方がよい。さらに、ペットのグルーミング商品については、異なる種類の犬のグルーミング用具は、同じ機能を果たすことができるため、用具自体は実際異なるとはいえ、互いの売上げを減らしてしまう可能性がある。
図3は、一実施形態に係るCDTを生成するときの、図1のCDT生成モジュール16の機能のフロー図である。一実施形態において、図3(および下記の図4および図5)のフロー図の機能は、メモリまたはその他のコンピュータ読み取り可能な媒体または有形の媒体に格納されたソフトウェアによって実装され、プロセッサによって実行される。その他の実施形態において、機能は、(たとえば、特定用途向け集積回路(「ASIC」)、プログラマブル・ゲート・アレイ(「PGA」)、フィールド・プログラマブル・ゲート・アレイ(「FPGA」)などを使用して)ハードウェアによって実行され得、またはハードウェアとソフトウェアとの任意の組み合わせによって実行され得る。
図3において、310において、CDT生成モジュール16は、各商品ペアと各属性値ペアとの類似度を算出する。次に、320において、CDT生成モジュール16は、310から得られた類似度に基づいて、CDTを生成する。
図4は、一実施形態に係る、図3の310において類似度を判定するときの、図1のCDT生成モジュール16の機能のフロー図である。310において類似度を算出する際、所定のカテゴリーについての各商品ペアと属性値ペアとの類似度を判定する。一般に、実施形態は、まず、たとえば、POS端末100から売上データの形でデータ要素を受け付ける。次に、データを集成して、週単位の売上シェアを算出する。次に、属性値ペアについての類似度算出を行う。
データ要素については、402において、売上データを取引レベル(つまり、取引ID/顧客ID/店舗/日付/アイテム)レベルで受け付ける。取引とは、顧客識別情報(「ID」(customer_id))、取引ID(transaction_id)、店舗ID(store_id)、日付、および購入されたアイテムの、アイテムの売上数量、ドルでの売上高、および販売価格など、付随する情報との組み合わせによって特定される売上げの発生である。この情報は、個々の小売店舗用のほとんどのPOSシステムで容易に入手可能である。下記の表1は、取引データを例示し、所定の日に所定の店舗(つまり、店舗IDが142)で同じアイテム(つまり、アイテムID(item_id)が2345)を購入した互いに異なる顧客を示している。
次に、404において、データをアイテム/週レベルに集成する。その他の実施形態において、週以外の異なる期間/測定値を使用できる(たとえば、日、月など)。一実施形態において、当該所定のアイテム/店舗/週に関するすべての取引IDおよび顧客IDの取引レベルデータが、アイテム/店舗/週レベルに集成される。ここで、このレベルが売上数量およびドルで示される。ここで、販売価格が、重み付けされた平均価格:ドル売上の総額/売上総数量、として明示される。表1の上記例を使用して、2015年5月16日で終わる週について集成されたアイテム/店舗/週レベルデータは、ここで表2に示す次のようになる。
さらに、404において、データを属性値/店舗/週レベルに集成する。その他の実施形態において、週以外の異なる期間/測定値を使用できる(たとえば、日、月など)。一実施形態において、各アイテムは、商品属性タイプと、値とを有し、このレベルで総売上が示される。属性タイプの例として、フレーバー(たとえば、「ストロベリー」または「バニラ」という値)、サイズ(たとえば、「小」、「中」、または「大」という値)、ブランド(たとえば、「コーラ」または「ペプシ」という値)などがある。下記の表3は、フレーバー属性についての売上高を示す例である。
次に、集成データを使用して、実施形態は、406において、週単位の売上シェア、週単位でない場合、相応の時間測定の間の売上シェアを判定する。一実施形態において、週単位の売上シェアとは、属性値/店舗/週に属する売上の、同じ店舗/週の同じ属性タイプについての他のすべての属性値に対する割合である。所定の店舗/週について、所定の属性タイプの売上シェアの合計は、合算すると100%になる。実施形態は、データ履歴におけるすべての属性タイプ/店舗/週についての週単位の売上シェアを判定する。
上記例を引き続き使用すると、下記の表4は、2015年5月16日の週についての、売上シェア=フレーバーの売上数量/週全体の売上数量、を示す。
また、週単位の売上シェアを、1店舗/週全体のすべてのアイテムについて演算する。下記の表5は、一例を示す。
次に、408において、実施形態は、属性値ペアについての類似度を判定する。一実施形態において、類似度は、その売上シェア履歴を横断して属性タイプ内で演算し、フレーバーペア(X,Y)について、XおよびYは、フレーバーXおよびYの店舗/週のシェア値をそれぞれ表し、nは、フレーバーXおよびYのシェアがある店舗/週の総数を表すピアソン相関式を用いて、以下のように演算する。
実施形態は、すべてのフレーバー(X,Y)ペアについてのSIM(X,Y)を算出する。これらの類似度によって「フレーバー類似度」が構成される。SIMについての上記式は、−1と1との間の数を常に出す。属性値XおよびYについて、−1に近いSIMは、XのシェアとYのシェアとが「反相関」であることを意味し、Xのシェアが増加するとYのシェアが減少する、および、その逆の場合を意味する。したがって、顧客はXをたくさん買えば買うほどYを買わなくなる(およびその逆)ため、顧客にとって、XおよびYは互いの代用品であるという点で類似しているに違いない。−1に近づけば近づくほど、XとYとは互いの代用品になる。また、同じ方法で、実施形態は、すべてのその他の属性についての類似度も算出するため、たとえば、「ブランド類似度」、「サイズ類似度」などが得られる。
一実施形態において、上述の相関関係は、以下の擬似コードを利用したSQLの組み込み関数「corr」を使用して算出され、
下記の表6に示す結果が得られる。
(上記の属性値の代わりに)XとYが2つの異なるアイテムを表すアイテムペアについて同様の処理を繰り返す。よって、XおよびYは、特定の店舗/週におけるアイテムXおよびアイテムYのアイテムシェアをそれぞれ表す。そのため、ちょうど属性の属性値ペアごとに上記のSIM(X,Y)を算出したように、実施形態は、アイテムのペア(X,Y)ごとにSIM(X,Y)を算出し、下記の表7に示す以下の例示的な結果が得られる。
さらに、408において、実施形態は、バイナリ属性についての類似度の算出を行う。バイナリ属性とは、2つの値しか持たない属性である。これらの値はごく一般的であり、通常、ある特性の有無を示す。下記に用いる一例は、「オーガニック」(つまり、食品アイテムがオーガニックであるかそうではないか)である。上記のSIMを求める式を単純にバイナリ属性に適用すると、結果は常にSIM=−1となる。これでは買い物客が属性をどのように扱っているかについての情報を提供できないため、バイナリ属性は特別な処理を必要とする。
バイナリ属性についての類似度を実行するために、以下のSQL擬似コードを用いることができる。
バイナリ属性についての類似度算出の例示的な結果を下記の表8に示す。
410において、次に、実施形態は、SIM値の後処理を行う。属性ペアおよびアイテムペアの両方のSIM値において、実施形態は、SIM値を次のように変更する。SIM値が正である場合は0に設定し、負の場合は正にする。残りの開示について、使用されるSIM値は、後処理されたSIM値である。410における後処理ステップは、バイナリ属性タイプの類似度には用いられない。バイナリ属性タイプは負ではないことが上記の式2によってすでに保証されているためである。
412において、次に、実施形態は、各属性のSIM値をアイテムのSIM値と比較することによって「最上位属性」を求める。実施形態は、どの属性が顧客のアイテムレベルの購買行動を最もよく示しているのかを判定する。アイテムレベルのSIM値を各属性のSIM値と比較し、SIM値がアイテムレベルの値に最も「一致」(後述する)する属性を求める。
フレーバーなど特定の属性について、実施形態は、アイテムおよび属性のSIM値を、下記の表9に示すように1つの表に編集する。flavor_x列は、item_xのフレーバーであり、同様に、flavor_yは、item_yのフレーバーである。flavor_similarityは、flavor_xとflavor_yとのSIM値である。なお、(item_xとitem_yとが同じフレーバーであるために)flavor_xとflavor_yとが同じである場合、フレーバーが同じであるので、flavor_similarityは、1に等しい。そうでない場合、flavor_similarityは、単に、前述したように算出されたflavor_xとflavor_yとのSIM値である。
次に、実施形態は、次のSQL擬似コードを利用して、アイテム類似度および属性類似度(表9の例において、これは、item_similarity値およびflavor_similarity値を指す)に対して相関計算処理を実行する。これは、item_similarity列およびflavor_similarity列に対して相関を実行することを意味し、
下記の表10に示す例示的な結果が得られる。
次に、実施形態は、すべての属性について繰り返し、その結果を下記の表11の例のように編集する。
最大値を有する属性は、CDTにおいて最上位を有すると考えられるため、図3の320において生成されるCDTの最上位レベル属性となる。CDTに追加するために、CDTのその他のレベルおよび枝を生成するために図4の機能を繰り返す。たとえば、「ブランド」が最上位属性であると判定されると、ブランド属性におけるブランドごとに、特定ブランド内である402において受け付けられたデータ要素のサブセットのみを用いて図4の機能を実行する。
図5は、一実施形態に係る、類似度に基づいてCDTを生成する(図3の320)際の図1のCDT生成モジュール16の機能のフロー図である。510において、同一商品カテゴリーの商品において、機能適合属性(functional−fit attribute)があるかどうかを判定する。機能適合属性とは、その値を別の値に置き換えることがまずない商品属性である。たとえば、ワイパーブレードを買い物中の顧客は、車に合う対応するブレードを購入する必要がある。そのため、ワイパーブレード商品カテゴリーにおいて、商品属性「サイズ」が機能適合属性として判定される。商品属性「サイズ」は、たとえば、タイヤ、エアフィルタ、集塵袋、プリンターのカートリッジなどのその他の商品カテゴリーの機能適合属性にもなり得る。しかしながら、同一商品属性「サイズ」は、たとえば、フルーツ、ソフトドリンクなどのその他の商品カテゴリーの機能適合属性にはならないだろう。一般に、機能適合属性は、通常、アクセサリなどの非食料品アイテムに存在する。一実施形態における機能適合属性は、生成された顧客データから直接得ることができ、通常、算出しなくてよい。たとえば、小売店は、ワイパーブレードの場合、サイズが機能適合属性であるとはっきりと示すなど、通常、「機能適合」属性が何であるかをはっきりと特定する。
すべての機能適合属性が特定されると、機能適合属性は、CDTの商品カテゴリー直下の最上位レベルに自動的に配置される。図6は、一実施形態に係る、CDT生成モジュール16が生成するCDT600を示す。CDT600は、商品カテゴリーを特定するカテゴリーレベル610を有する。図2に示すように、ヨーグルト商品カテゴリーについては、カテゴリーレベル610に「ヨーグルト」が表示されることになる。別の例において、「コーヒー」カテゴリーについては、カテゴリーレベル610に「コーヒー」が表示される。次に、機能適合属性がCDT600の最上位レベル620に配置される。図6は、最上位レベル620の2つの機能適合属性(FA1、FA2)622、624を示す。しかしながら、ヨーグルトまたはコーヒーについては、機能適合属性がないと考えられる。
次に、図5の520において、最上位属性または分割属性を特定する。最上位属性は、図4の機能に従って判定される。
530において、アイテムを下位区分に分割する。下位区分は、520において特定された属性の特定の属性値に対応する。たとえば、520において、「形態」商品属性がコーヒーについての最上位属性であると判定された場合、「形態」商品属性は、コーヒーについての形態:「豆」、「挽き豆」、および「インスタント」の特定の値に各々が対応する3つの下位区分に分割される。下位区分は、図6の次のレベル630を形成する。下位区分は、最上位レベル620の下である。たとえば、図6は、機能適合属性622から枝分かれしたレベル630の2つの下位区分(A1a、A1b)632、634を示す。520および530を下位区分ごとに繰り返し、下位区分ごとの終端ノードに到達するまでCDT600を展開する(540においてNo)。最終的に下位区分ごとの終端ノードに到達すると(540においてYes)、プロセスは終了する。
開示したように、ツリーは、終端ノードが特定されるまで展開される。一実施形態において、ノードが終端であると宣言するための基準は、以下の通りである。
1.有効属性が特定されない。
2.ノードのアイテム数<商品カテゴリーの総アイテムのx%。ここで、「x」は、ツリーの大きさの上限を定める調整パラメータである。一実施形態において、xのデフォルト値は、10である。
3.子ノードの平均非類似度(「AD」)(つまり、ノードにおける商品のすべての可能性のペアの平均)が、親ノードよりも大きい。2つの起こり得る下位のケースは、以下の通りである。
a.すべての子ノードが親ノードよりも大きいAD値を有する場合、親ノードは、終端ノードであると宣言される。
b.子ノードのうちのいくつかが親ノードよりも大きいAD値を有する場合、これらのノードは閉じられ、その他の子ノードは、通常通り展開される。
開示したように、実施形態は、アイテム‐店舗‐週を集成した売上数量データに頼ってCDTを生成する。アイテム‐店舗‐週を集成した売上数量データは、各店舗での各アイテムの週ごとの売上げ総数量にすぎないため、このようなデータは、カテゴリーに関係なく、概して、すべての小売店から入手可能である。そのため、顧客の識別情報など、取得することがより困難または費用のかかるデータは必要ない。
さらに、集成されたデータからCDTを生成する既知のシステムは、一般に、よりスタンダードな統計学的手法に頼るが、これらはスタンダードであるにもかかわらずCDTを算出する際に使用するには欠点がある。これらの既知の手法は、非常に大量の計算能力を必要とする可能性があり、実装することは難しいだろう。対照的に、実施形態は、standard SQL クエリを用いて実装することができ、大きな顧客データセット上であっても非常に速く動く。
さらに、実施形態は、2つの値(Boolean属性として知られる)しか有さない属性を処理する。このような属性は、カテゴリーのアイテムにおける一定の特性の有無(たとえば、ヨーグルトがギリシャヨーグルトであるかどうか、またはシャンプーが低刺激性であるかどうか)を伝えるので、多くのカテゴリーにおいてとても一般的である。
いくつかの実施形態を本明細書において具体的に例示および/または説明した。しかしながら、開示の実施形態の変更例および変形例は、上記教示に包含され、意図する本発明の範囲の趣旨から逸脱することなく、添付の請求の範囲に含まれることがわかる。

Claims (14)

  1. コンピュータによって実現され1つ以上のプロセッサによって実行される、顧客意思決定ツリー(CDT)を商品カテゴリーに対して生成する方法であって、前記商品カテゴリーは複数の商品属性を含み、各商品属性は対応する複数の属性値を有し、前記方法は、
    小売アイテム取引売上データを受け付けるステップと、
    前記売上データを全ての顧客にわたってアイテム/店舗/期間レベル集成することにより、対応する店舗識別子(ID)について、対応する商品IDと前記期間内の前記商品IDの売上数量とを含む第1の集成データを生成するステップと、
    前記売上データを全ての顧客にわたって属性値/店舗/期間レベル集成することにより、対応する店舗IDについて前記複数の属性値の各々に対する前記期間内の当該属性値の売上数量を含む第2の集成データを生成するステップと、
    前記第1の集成データおよび前記第2の集成データを用いて、前記期間の第1の売上シェアおよび第2の売上シェアを判定するステップとを含み
    前記第1の売上シェアは、商品属性の他の全ての属性値に対する当該商品属性の各属性値についての売上の割合を含み、前記第2の売上シェアは、前記期間内に販売された他の全ての商品に対する各商品の売上の割合を含み、前記方法は、さらに、
    前記第1の売上シェアを用いて商品属性ごとに全ての可能な属性値ペア間の相関値を計算することにより、属性値ペアについての類似度を判定するステップと、
    前記第2の売上シェアを用いて全ての可能な商品ペア間の相関値を計算することにより、商品ペアについての類似度を判定するステップと、
    各商品属性ごとに、前記属性値ペアについての類似度と前記商品ペアについての類似度との相関値を計算して最も高い相関値を有する商品属性を決定することにより、最上位属性を判定するステップとを含む、方法。
  2. 前記期間は、週単位を含む、請求項1に記載の方法。
  3. バイナリ属性についての類似度を判定するステップをさらに含む、請求項1または2に記載の方法。
  4. 正の値を0にするステップと負の値を対応する正の値に変更するステップとを含む、前記属性値ペアについての類似度および前記商品ペアについての類似度を後処理するステップをさらに含む、請求項1〜3のいずれか1項に記載の方法。
  5. 前記属性値ペアについての類似度を判定するステップは、属性値ペア(X,Y)について、XおよびYは、前記属性Xおよび前記属性Yの店舗/時間シェア値を表し、nは、XおよびYの属性シェアがある店舗/期間の総数を表す、

    から構成されるSIMの値を判定するステップを含む、請求項1〜4のいずれか1項に記載の方法。
  6. 前記バイナリ属性についての類似度を判定するステップは、

    を含む、請求項3に記載の方法
  7. 前記最上位属性を前記CDTの第1レベルとして割り当てるステップと、
    前記CDTの第2レベルを、各々が前記最上位属性の属性値に対応する複数の下位区分に分割するステップと、
    前記下位区分ごとに、前記下位区分値について、
    前記小売アイテム取引売上データを受け付けるステップ、
    前記売上データを前記アイテム/店舗/期間レベル集成するステップ、
    前記売上データを前記属性値/店舗/期間レベル集成するステップ、
    前記期間の第1の売上シェアおよび第2の売上シェアを判定するステップ、
    属性値ペア間の相関値を計算することにより、属性値ペアについての類似度を判定するステップ、
    商品ペア間の相関値を計算することにより、商品ペアについての類似度を判定するステップ、および
    前記属性値ペアについての類似度および前記商品ペアについての類似度に基づいて、前記最上位属性を判定するステップ、
    を繰り返すステップとをさらに含む、請求項1〜6のいずれか1項に記載の方法。
  8. 顧客意思決定ツリー(CDT)を商品カテゴリーごとに生成するCDT生成システムであって、前記商品カテゴリーは複数の商品属性を含み、各商品属性は対応する複数の属性値を有し、
    前記システムは、
    集成モジュールと、
    類似度モジュールとを備え、
    前記集成モジュールは、小売アイテム取引売上データを受け付けることに応答して、前記売上データを全ての顧客にわたってアイテム/店舗/期間レベル集成することにより、対応する店舗識別子(ID)について、対応する商品IDと前記期間内の前記商品IDの売上数量とを含む第1の集成データを生成し前記集成モジュールは、前記売上データを全ての顧客にわたって属性値/店舗/期間レベル集成することにより、対応する店舗IDについて前記複数の属性値の各々に対する前記期間内の当該属性値の売上数量を含む第2の集成データを生成し、
    前記類似度モジュールは、前記第1の集成データおよび前記第2の集成データを用いて、前記期間の第1の売上シェアおよび第2の売上シェアを判定し、前記第1の売上シェアは、商品属性の他の全ての属性値に対する当該商品属性の各属性値についての売上の割合を含み、前記第2の売上シェアは、前記期間内に販売された他の全ての商品に対する各商品の売上の割合を含み、前記類似度モジュールは、前記第1の売上シェアを用いて商品属性ごとに全ての可能な属性値ペア間の相関値を計算することにより、属性値ペアについての類似度を判定し、前記類似度モジュールは、前記第2の売上シェアを用いて全ての可能な商品ペア間の相関値を計算することにより、商品ペアについての類似度を判定し、前記類似度モジュールは、各商品属性ごとに、前記属性値ペアについての類似度と前記商品ペアについての類似度との相関値を計算して最も高い相関値を有する商品属性を決定することにより、最上位属性を判定する、顧客意思決定ツリー(CDT)生成システム。
  9. 前記属性値ペアについての類似度を判定することは、属性値ペア(X,Y)について、XおよびYは、前記属性Xおよび前記属性Yの店舗/時間シェア値を表し、nは、XおよびYの属性シェアがある店舗/期間の総数を表す、

    から構成されるSIMの値を判定することを含む、請求項8に記載のシステム。
  10. 前記類似度モジュールは、さらに、

    から構成される、バイナリ属性についての類似度を判定する、請求項8または9に記載のシステム。
  11. 前記期間は、週単位を含む、請求項8〜10のいずれか1項に記載のシステム。
  12. 前記類似度モジュールは、さらに、正の値を0にすることと負の値を対応する正の値に変更することとを含む、前記前記属性値ペアについての類似度および前記商品ペアについて類似度の後処理を行う、請求項8〜11のいずれか1項に記載のシステム。
  13. レベル生成モジュールをさらに備え、
    前記レベル生成モジュールは、
    前記最上位属性を前記CDTの第1レベルとして割り当て、
    前記CDTの第2レベルを、各々が前記最上位属性の属性値に対応する複数の下位区分に分割し、
    前記下位区分ごとに、前記下位区分値について、
    前記小売アイテム取引売上データを受け付けることと、
    前記売上データを前記アイテム/店舗/期間レベルに集成することと、
    前記売上データを前記属性値/店舗/期間レベルに集成することと、
    前記期間の第1の売上シェアよび第2の売上シェアを判定することとと、
    属性値ペア間の相関値を計算することにより、属性値ペアについての類似度を判定することと、
    商品ペア間の相関値を計算することにより、商品ペアについての類似度を判定することと、
    前記属性値ペアについての類似度および前記商品ペアについての類似度に基づいて、前記最上位属性を判定することとを繰り返す、請求項8〜12のいずれか1項に記載のシステム。
  14. 命令を含むコンピュータプログラムであって、前記命令は、1つ以上のプロセッサによって実行されると、前記1つ以上のプロセッサに請求項1〜7のいずれか1項に記載の方法を実行させる、コンピュータプログラム。
JP2018535405A 2016-01-08 2016-11-15 顧客意思決定ツリー生成システム Active JP6745343B2 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US14/990,834 2016-01-08
US14/990,834 US20170200172A1 (en) 2016-01-08 2016-01-08 Consumer decision tree generation system
PCT/US2016/062032 WO2017119952A1 (en) 2016-01-08 2016-11-15 Consumer decision tree generation system

Publications (3)

Publication Number Publication Date
JP2019501464A JP2019501464A (ja) 2019-01-17
JP2019501464A5 JP2019501464A5 (ja) 2019-12-26
JP6745343B2 true JP6745343B2 (ja) 2020-08-26

Family

ID=59274292

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2018535405A Active JP6745343B2 (ja) 2016-01-08 2016-11-15 顧客意思決定ツリー生成システム

Country Status (5)

Country Link
US (1) US20170200172A1 (ja)
EP (1) EP3400571A4 (ja)
JP (1) JP6745343B2 (ja)
CN (1) CN108292409B (ja)
WO (1) WO2017119952A1 (ja)

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11599894B2 (en) * 2018-06-29 2023-03-07 Tata Consultancy Services Limited Method and system for generating customer decision tree through machine learning
US10860634B2 (en) * 2018-08-06 2020-12-08 Walmart Apollo, Llc Artificial intelligence system and method for generating a hierarchical data structure
WO2020033559A1 (en) * 2018-08-07 2020-02-13 Walmart Apollo, Llc System and method for structure and attribute based graph partitioning
US11188934B2 (en) * 2019-06-28 2021-11-30 Tata Consultancy Services Limited Dynamic demand transfer estimation for online retailing using machine learning
CN110727659B (zh) * 2019-10-24 2023-08-18 深圳前海微众银行股份有限公司 基于sql语句的决策树模型生成方法、装置、设备及介质
CN117151829B (zh) * 2023-10-31 2024-02-13 阿里健康科技(中国)有限公司 导购决策树的构建方法、装置、设备和存储介质

Family Cites Families (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CA2380895A1 (en) * 1999-08-19 2001-02-22 Robert David Piotrowski Method and apparatus for the selection of coffee
US9785953B2 (en) * 2000-12-20 2017-10-10 International Business Machines Corporation System and method for generating demand groups
US20090006156A1 (en) * 2007-01-26 2009-01-01 Herbert Dennis Hunt Associating a granting matrix with an analytic platform
CA2601776A1 (en) * 2005-05-18 2006-11-23 Steven J. Greenfield Data structure and architecture for processing transaction data
AU2006283553B9 (en) * 2005-08-19 2012-12-06 Fourthwall Media, Inc. System and method for recommending items of interest to a user
US20080270363A1 (en) * 2007-01-26 2008-10-30 Herbert Dennis Hunt Cluster processing of a core information matrix
US8335714B2 (en) * 2007-05-31 2012-12-18 International Business Machines Corporation Identification of users for advertising using data with missing values
US10176483B2 (en) * 2007-12-21 2019-01-08 Blue Nile, Inc. User interface for displaying purchase concentration data for unique items based on consumer-specified constraints
US20110295655A1 (en) * 2008-11-04 2011-12-01 Hitachi, Ltd. Information processing system and information processing device
US8463666B2 (en) * 2008-11-25 2013-06-11 Sap Ag Managing consistent interfaces for merchandise and assortment planning business objects across heterogeneous systems
US8412656B1 (en) * 2009-08-13 2013-04-02 Videomining Corporation Method and system for building a consumer decision tree in a hierarchical decision tree structure based on in-store behavior analysis
US8874499B2 (en) * 2012-06-21 2014-10-28 Oracle International Corporation Consumer decision tree generation system
JP6161992B2 (ja) * 2013-08-20 2017-07-12 株式会社日立製作所 販売予測システム及び販売予測方法
US20150127419A1 (en) * 2013-11-04 2015-05-07 Oracle International Corporation Item-to-item similarity generation
CN105095522B (zh) * 2015-09-22 2018-09-25 南开大学 基于最近邻搜索的关系表集合外键识别方法

Also Published As

Publication number Publication date
EP3400571A4 (en) 2019-06-26
EP3400571A1 (en) 2018-11-14
CN108292409B (zh) 2022-05-17
JP2019501464A (ja) 2019-01-17
CN108292409A (zh) 2018-07-17
US20170200172A1 (en) 2017-07-13
WO2017119952A1 (en) 2017-07-13

Similar Documents

Publication Publication Date Title
JP6745343B2 (ja) 顧客意思決定ツリー生成システム
US8117061B2 (en) System and method of using demand model to generate forecast and confidence interval for control of commerce system
US9262503B2 (en) Similarity matching of products based on multiple classification schemes
US8160984B2 (en) Similarity matching of a competitor's products
US20200320600A1 (en) Virtual Marketplace Enabling Machine-to-Machine Commerce
US10176508B2 (en) System, method, and non-transitory computer-readable storage media for evaluating search results for online grocery personalization
US20200065750A1 (en) Inventory management system and method thereof
US20180005302A1 (en) Commerce System and Method of Controlling the Commerce System Using Budgets for Personalized Shopping Lists
JP6125627B2 (ja) 消費者ディシジョンツリー生成システム
US10430854B2 (en) System, method, and non-transitory computer-readable storage media for evaluating search results for personalized product substitutions
US7438227B2 (en) System and method to determine the prices and order quantities that maximize a retailer's total profit
US20100114663A1 (en) Hybrid prediction model for a sales prospector
CN106651418A (zh) 针对电商满减活动的凑单商品推荐的方法
US20130325554A1 (en) Commerce System and Method of Optimizing Profit for Retailer from Price Elasticity of Other Retailers
US20200005209A1 (en) Method and system for optimizing an item assortment
JP2018139036A (ja) 分析装置
US10417688B2 (en) System, method, and non-transitory computer-readable storage media for evaluating search results for matching ingredients to products
US11868945B1 (en) Systems and methods for seller category determination and providing tailored fulfillment management services
Richards A discrete/continuous model of fruit promotion, advertising, and response segmentation
US20140074752A1 (en) Commerce System and Method of Providing Access to an Investment Signal Based on Product Information
US11282126B1 (en) Learning staple goods for a user
CN117649256B (zh) 一种适用于喀斯特地区生态产品销售信息分析方法
JP2002230386A (ja) 利益還元方法及びシステム
JP6857200B2 (ja) データ管理システム、データ管理方法、およびデータ管理プログラム
Gunglin et al. Recommendation System for Retail Business Using Customer Segmentation: Case Study of Tuenjai Company in Surat Thani, Thailand

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20191113

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20191113

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20200221

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20200317

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20200615

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20200707

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20200803

R150 Certificate of patent or registration of utility model

Ref document number: 6745343

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250