JP5424989B2 - POS data analysis apparatus, method and program - Google Patents
POS data analysis apparatus, method and program Download PDFInfo
- Publication number
- JP5424989B2 JP5424989B2 JP2010132401A JP2010132401A JP5424989B2 JP 5424989 B2 JP5424989 B2 JP 5424989B2 JP 2010132401 A JP2010132401 A JP 2010132401A JP 2010132401 A JP2010132401 A JP 2010132401A JP 5424989 B2 JP5424989 B2 JP 5424989B2
- Authority
- JP
- Japan
- Prior art keywords
- product
- genre
- pos data
- sale
- feature information
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Description
本発明は、POSデータ分析装置及び方法及びプログラムに係り、特に、顧客の購買履歴が管理されるPOS管理(販売時点情報管理)において、特徴的な併売状況(今まで把握していなかった併売状況)の発見を支援するPOSデータ分析装置及び方法及びプログラムに関する。 The present invention relates to a POS data analysis apparatus, method and program, and in particular, in a POS management (point-of-sales information management) in which a customer's purchase history is managed, POS data analysis apparatus, method, and program for supporting discovery.
POSシステムが普及し、「どんな顧客が」「どの商品を」「どの店舗で」「いつ」「何個」「いくらで」購入したのかを記録することができるようになっている。これらのPOSシステムにより、発注/在庫管理を効率化することができる。 POS systems have become popular, and it is now possible to record “what customers”, “what products”, “at which store”, “when”, “how many”, and “how much”. These POS systems can make ordering / inventory management more efficient.
また、計算機およびデータベースの処理能力の向上により、売れ筋商品や併売状況などを分析し、商品間や属性間の相関ルールを発見することが可能になった。得られた相関ルールを考慮し、店舗における商品棚構成の変更・仕入商品の変更などを行い、売上を向上させることができる。 In addition, by improving the processing power of computers and databases, it has become possible to analyze popular products and the situation of side-selling and find correlation rules between products and attributes. Considering the obtained correlation rules, it is possible to improve the sales by changing the product shelf configuration in the store, changing the purchased product, or the like.
しかし、上記の相関ルールの抽出には、以下のような問題がある。 However, the extraction of the above association rules has the following problems.
(1)抽出される相関ルールは大量である;
(2)既知の相関ルールが存在する;
上記の(1)に対して、Aprioriアルゴリズム(例えば、非特許文献1参照)やFP-growthアルゴリズム(例えば、非特許文献2参照)などが提案されてきた。また、これらのアルゴリズムの利点を組み合わせたことにより計算量を削減するアルゴリズム(例えば、非特許文献3参照)や、並列処理により計算時間を短縮する手法(例えば、非特許文献4参照)なども提案されている。
(1) A large number of association rules are extracted;
(2) there is a known association rule;
For the above (1), an Apriori algorithm (for example, see Non-Patent Document 1), an FP-growth algorithm (for example, see Non-Patent Document 2), and the like have been proposed. In addition, an algorithm that reduces the amount of calculation by combining the advantages of these algorithms (for example, see Non-Patent Document 3) and a method for shortening the calculation time by parallel processing (for example, see Non-Patent Document 4) are also proposed. Has been.
また、面白くない相関ルールを排除する手法(例えば、非特許文献5参照)が提案されている。この手法は、統計的検定により相関ルールを評価しているに過ぎず、課題(2)を解決するのには有効ではない。 In addition, a method of eliminating association rules that are not interesting has been proposed (for example, see Non-Patent Document 5). This method only evaluates the association rule by a statistical test and is not effective in solving the problem (2).
しかしながら、上記の非特許文献1〜4の手法は、相関ルールを高速に抽出することを目的としており、上記の課題(2)の既知の相関ルールが存在するという問題は解決しない。
However, the methods of
本発明は、上記の点に鑑みなされたもので、POSデータ分析において、大量に存在する相関ルールの中から、あまり知られていないと思われる併売情報を抽出することが可能なPOS分析装置及び方法及びプログラムを提供することを目的とする。 The present invention has been made in view of the above points. In POS data analysis, a POS analysis apparatus capable of extracting side-by-side information that seems to be less known from a large number of association rules, and An object is to provide a method and a program.
上記の課題を解決するため、本発明(請求項1)は、POSデータ分析装置であって、
POSデータを蓄積するPOSデータ記憶手段と、
前記POSデータ記憶手段からPOSデータを読み込んで、該POSデータから商品ジャンル情報を抽出する商品ジャンル管理手段と、
前記POSデータ記憶手段のPOSデータの各商品の併売特徴を示す併売特徴情報を生成し、商品併売特徴情報記憶手段に格納する商品併売特徴情報生成手段と、
前記商品ジャンル管理手段で抽出された前記商品ジャンル情報に基づいて、前記商品併売特徴情報記憶手段の商品の間の類似度を算出し、該類似度に基づいて商品ジャンル毎に商品をクラスタリングし、該類似度と共にクラスタリング結果を商品クラスタリング結果記憶手段に格納する商品クラスタ分析手段と、
前記商品クラスタリング結果記憶手段を参照し、各クラスタに存在する商品数をカウントし、1クラスタあたりの平均商品数と標準偏差により求められた値が所定の範囲外となる商品数を持つクラスタがある場合は商品のばらつきが大きい商品ジャンルであると判定する特徴的商品ジャンル発見支援手段と、
を有する。
In order to solve the above-mentioned problem, the present invention (Claim 1) is a POS data analyzer,
POS data storage means for storing POS data;
Product genre management means for reading POS data from the POS data storage means and extracting product genre information from the POS data;
Commodity co-sale feature information generating means for generating co-sale feature information indicating the co-sale characteristics of each product of the POS data in the POS data storage means, and storing in the product co-sale feature information storage means,
Based on the product genre information extracted by the product genre management means, calculate the similarity between the products in the product parallel feature information storage means, cluster the products for each product genre based on the similarity, Product cluster analysis means for storing a clustering result together with the similarity in a product clustering result storage means;
By referring to the product clustering result storage unit, the number of products existing in each cluster is counted, and there is a cluster having the number of products for which the value obtained by the average number of products per one cluster and the standard deviation is out of a predetermined range. A characteristic product genre discovery support means for determining that the product genre has a large variation in products,
Have
また、本発明(請求項2)は、POSデータ分析装置であって、
POSデータを蓄積するPOSデータ記憶手段と、
前記POSデータ記憶手段からPOSデータを読み込んで、該POSデータから商品ジャンル情報を抽出する商品ジャンル管理手段と、
前記POSデータ記憶手段のPOSデータの各商品の併売特徴を示す併売特徴情報を生成し、商品併売特徴情報記憶手段に格納する商品併売特徴情報生成手段と、
前記商品ジャンル管理手段で抽出された前記商品ジャンル情報に基づいて、前記商品併売特徴情報記憶手段の商品の間の類似度を算出し、該類似度に基づいて商品ジャンル毎に商品をクラスタリングし、該類似度と共にクラスタリング結果を商品クラスタリング結果記憶手段に格納する商品クラスタ分析手段と、
前記POSデータ記憶手段の商品間の併売情報を参照し、各商品ジャンルの併売状況の特徴量を含む商品ジャンル併売特徴情報を生成し、商品ジャンル併売特徴情報記憶手段に格納する商品ジャンル併売特徴情報生成手段と、
前記商品併売特徴情報記憶手段から併売情報を取得し、該併売情報に基づいて各商品の商品ジャンルを取得して、該商品ジャンルに基づいて前記商品ジャンル併売特徴情報記憶手段を参照し、2つの商品ジャンル間の特徴量に基づいて計算された値により、併売関係の有無を判定する特徴的商品発見支援手段と、を有する。
The present invention (Claim 2 ) is a POS data analysis device,
POS data storage means for storing POS data;
Product genre management means for reading POS data from the POS data storage means and extracting product genre information from the POS data;
Commodity co-sale feature information generating means for generating co-sale feature information indicating the co-sale characteristics of each product of the POS data in the POS data storage means, and storing in the product co-sale feature information storage means,
Based on the product genre information extracted by the product genre management means, calculate the similarity between the products in the product parallel feature information storage means, cluster the products for each product genre based on the similarity, Product cluster analysis means for storing a clustering result together with the similarity in a product clustering result storage means;
Commodity genre sale feature information that refers to the sale information between products in the POS data storage means, generates product genre sale feature information including the feature quantity of the sale status of each product genre, and stores it in the product genre sale feature information storage means. Generating means;
Acquires the co-sale information from the product co-sale feature information storage unit, acquires the product genre of each product based on the co-sale information, refers to the product genre co-sale feature information storage unit based on the product genre, and the calculated value based on the feature quantity between the product category has a characteristic product discovery support unit determines the presence or absence of Heibai relationship, a.
また、本発明(請求項3)は、POSデータ分析装置であって、
POSデータを蓄積するPOSデータ記憶手段と、
前記POSデータ記憶手段からPOSデータを読み込んで、該POSデータから商品ジャンル情報を抽出する商品ジャンル管理手段と、
前記POSデータ記憶手段のPOSデータの各商品の併売特徴を示す併売特徴情報を生成し、商品併売特徴情報記憶手段に格納する商品併売特徴情報生成手段と、
前記商品ジャンル管理手段で抽出された前記商品ジャンル情報に基づいて、前記商品併売特徴情報記憶手段の商品の間の類似度を算出し、該類似度に基づいて商品ジャンル毎に商品をクラスタリングし、該類似度と共にクラスタリング結果を商品クラスタリング結果記憶手段に格納する商品クラスタ分析手段と、
前記POSデータ記憶手段の商品間の併売情報を参照し、各商品ジャンルの併売状況の特徴量を含む商品ジャンル併売特徴情報を生成し、商品ジャンル併売特徴情報記憶手段に格納する商品ジャンル併売特徴情報生成手段と、
前記商品クラスタリング結果記憶手段を参照し、各クラスタに存在する商品数をカウントし、1クラスタあたりの平均商品数と標準偏差により求められた値が所定の範囲外となる商品数を持つクラスタがある場合は商品のばらつきが大きい商品ジャンルを抽出する特徴的商品ジャンル発見支援手段と、
前記特徴的商品ジャンル発見支援手段で抽出された前記商品ジャンルに対してクラスタから外れた商品を選択し、該商品に基づいて前記POSデータ記憶手段を参照して、該商品の併売情報を取得し、該商品の併売情報に基づいて各商品の商品ジャンルを取得して、該商品ジャンルに基づいて前記商品ジャンル併売特徴情報記憶手段を参照し、2つの商品ジャンル間の特徴量に基づいて計算された値により、併売関係の有無を判定する特徴的商品発見支援手段と、有する。
The present invention (Claim 3 ) is a POS data analyzer,
POS data storage means for storing POS data;
Product genre management means for reading POS data from the POS data storage means and extracting product genre information from the POS data;
Commodity co-sale feature information generating means for generating co-sale feature information indicating the co-sale characteristics of each product of the POS data in the POS data storage means, and storing in the product co-sale feature information storage means,
Based on the product genre information extracted by the product genre management means, calculate the similarity between the products in the product parallel feature information storage means, cluster the products for each product genre based on the similarity, Product cluster analysis means for storing a clustering result together with the similarity in a product clustering result storage means;
Commodity genre sale feature information that refers to the sale information between products in the POS data storage means, generates product genre sale feature information including the feature quantity of the sale status of each product genre, and stores it in the product genre sale feature information storage means. Generating means;
By referring to the product clustering result storage unit, the number of products existing in each cluster is counted, and there is a cluster having the number of products for which the value obtained by the average number of products per one cluster and the standard deviation is out of a predetermined range. In this case, characteristic product genre discovery support means for extracting product genres with large variations in products,
Select a product out of the cluster with respect to the product genre extracted by the characteristic product genre discovery support means, refer to the POS data storage means based on the product, and acquire the co-sale information of the product The product genre of each product is acquired based on the product sales information, the product genre combined feature information storage unit is referred to based on the product genre, and calculated based on the feature quantity between the two product genres. the values, the characteristic items found support unit determines the presence or absence of Heibai relationship has.
また、本発明(請求項4)は、POSデータ分析方法であって、
POSデータを蓄積するPOSデータ記憶手段と、商品併売特徴情報記憶手段、商品併売特徴情報生成手段、商品クラスタリング結果記憶手段、商品ジャンル併売特徴情報記憶手段を有する装置において、
商品ジャンル管理手段が、前記POSデータ記憶手段からPOSデータを読み込んで、該POSデータから商品ジャンル情報を抽出する商品ジャンル管理ステップと、
商品併売特徴情報生成手段が、前記POSデータ記憶手段のPOSデータの各商品の併売特徴を示す併売特徴情報を生成し、前記商品併売特徴情報記憶手段に格納する商品併売特徴情報生成ステップと、
商品クラスタ分析手段が、前記商品ジャンル管理ステップで抽出された前記商品ジャンル情報に基づいて、前記商品併売特徴情報記憶手段の商品の間の類似度を算出し、該類似度に基づいて商品ジャンル毎に商品をクラスタリングし、該類似度と共にクラスタリング結果を前記商品クラスタリング結果記憶手段に格納する商品クラスタ分析ステップと、
特徴的商品ジャンル発見支援手段が、前記商品クラスタリング結果記憶手段を参照し、各クラスタに存在する商品数をカウントし、1クラスタあたりの平均商品数と標準偏差により求められた値が所定の範囲外となる商品数を持つクラスタがある場合は商品のばらつきが大きい商品ジャンルであると判定する特徴的商品ジャンル発見支援ステップと、
を行う。
The present invention (Claim 4 ) is a POS data analysis method,
In an apparatus having POS data storage means for storing POS data, product co-sale feature information storage unit, product co-sale feature information generation unit, product clustering result storage unit, product genre co-sale feature information storage unit,
A product genre management means for reading POS data from the POS data storage means and extracting product genre information from the POS data;
Commodity co-sale feature information generating means generates co-sale feature information indicating the co-sale characteristics of each product of the POS data of the POS data storage unit, and stores the product co-sale feature information information in the product co-sale feature information storage unit;
The product cluster analysis means calculates the similarity between the products in the product co-sale feature information storage means based on the product genre information extracted in the product genre management step, and each product genre based on the similarity A product cluster analysis step of clustering products into the product clustering results and storing the clustering results together with the similarity in the product clustering result storage means;
The characteristic product genre discovery support means refers to the product clustering result storage means, counts the number of products existing in each cluster, and the value obtained from the average number of products per cluster and the standard deviation is out of a predetermined range. A characteristic product genre discovery support step for determining that the product genre has a large product variation when there is a cluster having a product number of
I do.
また、本発明(請求項5)は、POSデータ分析方法であって、
POSデータを蓄積するPOSデータ記憶手段と、商品併売特徴情報記憶手段、商品併売特徴情報生成手段、商品クラスタリング結果記憶手段、商品ジャンル併売特徴情報記憶手段を有する装置において、
商品ジャンル管理手段が、前記POSデータ記憶手段からPOSデータを読み込んで、該POSデータから商品ジャンル情報を抽出する商品ジャンル管理ステップと、
商品併売特徴情報生成手段が、前記POSデータ記憶手段のPOSデータの各商品の併売特徴を示す併売特徴情報を生成し、前記商品併売特徴情報記憶手段に格納する商品併売特徴情報生成ステップと、
商品クラスタ分析手段が、前記商品ジャンル管理ステップで抽出された前記商品ジャンル情報に基づいて、前記商品併売特徴情報記憶手段の商品の間の類似度を算出し、該類似度に基づいて商品ジャンル毎に商品をクラスタリングし、該類似度と共にクラスタリング結果を前記商品クラスタリング結果記憶手段に格納する商品クラスタ分析ステップと、
商品ジャンル併売特徴情報生成手段が、前記POSデータ記憶手段の商品間の併売情報を参照し、各商品ジャンルの併売状況の特徴量を含む商品ジャンル併売特徴情報を生成し、商品ジャンル併売特徴情報記憶手段に格納する商品ジャンル併売特徴情報生成ステップと、
特徴的商品発見支援手段が、前記商品併売特徴情報記憶手段から併売情報を取得し、該併売情報に基づいて各商品の商品ジャンルを取得して、該商品ジャンルに基づいて前記商品ジャンル併売特徴情報記憶手段を参照し、2つの商品ジャンル間の特徴量に基づいて計算された値により、併売関係の有無を判定する特徴的商品発見支援ステップと、を行う。
The present invention (Claim 5 ) is a POS data analysis method,
In an apparatus having POS data storage means for storing POS data, product co-sale feature information storage unit, product co-sale feature information generation unit, product clustering result storage unit, product genre co-sale feature information storage unit,
A product genre management means for reading POS data from the POS data storage means and extracting product genre information from the POS data;
Commodity co-sale feature information generating means generates co-sale feature information indicating the co-sale characteristics of each product of the POS data of the POS data storage unit, and stores the product co-sale feature information information in the product co-sale feature information storage unit;
The product cluster analysis means calculates the similarity between the products in the product co-sale feature information storage means based on the product genre information extracted in the product genre management step, and each product genre based on the similarity A product cluster analysis step of clustering products into the product clustering results and storing the clustering results together with the similarity in the product clustering result storage means;
Is commodity genre Heibai characteristic information generating means, the reference to Heibai information between items POS data storage unit, generates a product genre Heibai characteristic information containing a characteristic parameter of Heibai status of each product category, product genre Heibai feature information A product genre sales feature information generation step stored in the storage means;
FEATURES merchandise discovery support means, said product Heibai acquires Heibai information from the characteristic information storing means, to obtain a product genre of each product on the basis of said combination sales information, the product genre Heibai features based on the product category referring to the information storage means, the calculated value based on the feature quantity between the two product genre, intends row and characteristic product discovery assistance determining whether, of Heibai relationship.
また、本発明(請求項6)は、POSデータ分析方法であって、
POSデータを蓄積するPOSデータ記憶手段と、商品併売特徴情報記憶手段、商品併売特徴情報生成手段、商品クラスタリング結果記憶手段、商品ジャンル併売特徴情報記憶手段を有する装置において、
商品ジャンル管理手段が、前記POSデータ記憶手段からPOSデータを読み込んで、該POSデータから商品ジャンル情報を抽出する商品ジャンル管理ステップと、
商品併売特徴情報生成手段が、前記POSデータ記憶手段のPOSデータの各商品の併売特徴を示す併売特徴情報を生成し、前記商品併売特徴情報記憶手段に格納する商品併売特徴情報生成ステップと、
商品クラスタ分析手段が、前記商品ジャンル管理ステップで抽出された前記商品ジャンル情報に基づいて、前記商品併売特徴情報記憶手段の商品の間の類似度を算出し、該類似度に基づいて商品ジャンル毎に商品をクラスタリングし、該類似度と共にクラスタリング結果を前記商品クラスタリング結果記憶手段に格納する商品クラスタ分析ステップと、
商品ジャンル併売特徴情報生成手段が、前記POSデータ記憶手段の商品間の併売情報を参照し、各商品ジャンルの併売状況の特徴量を含む商品ジャンル併売特徴情報を生成し、商品ジャンル併売特徴情報記憶手段に格納する商品ジャンル併売特徴情報生成ステップと、
特徴的商品ジャンル発見支援手段が、前記商品クラスタリング結果記憶手段を参照し、各クラスタに存在する商品数をカウントし、1クラスタあたりの平均商品数と標準偏差により求められた値が所定の範囲外となる商品数を持つクラスタがある場合は商品のばらつきが大きい商品ジャンルを抽出する特徴的商品ジャンル発見支援ステップと、
特徴的商品発見支援手段が、前記特徴的商品ジャンル発見支援ステップで抽出された前記商品ジャンルに対してクラスタから外れた商品を選択し、該商品に基づいて前記POSデータ記憶手段を参照して、該商品の併売情報を取得し、該商品の併売情報に基づいて各商品の商品ジャンルを取得して、該商品ジャンルに基づいて前記商品ジャンル併売特徴情報記憶手段を参照し、2つの商品ジャンル間の特徴量に基づいて計算された値により、併売関係の有無を判定する特徴的商品発見支援ステップと、を行う。
The present invention (Claim 6 ) is a POS data analysis method,
In an apparatus having POS data storage means for storing POS data, product co-sale feature information storage unit, product co-sale feature information generation unit, product clustering result storage unit, product genre co-sale feature information storage unit,
A product genre management means for reading POS data from the POS data storage means and extracting product genre information from the POS data;
Commodity co-sale feature information generating means generates co-sale feature information indicating the co-sale characteristics of each product of the POS data of the POS data storage unit, and stores the product co-sale feature information information in the product co-sale feature information storage unit;
The product cluster analysis means calculates the similarity between the products in the product co-sale feature information storage means based on the product genre information extracted in the product genre management step, and each product genre based on the similarity A product cluster analysis step of clustering products into the product clustering results and storing the clustering results together with the similarity in the product clustering result storage means;
Is commodity genre Heibai characteristic information generating means, the reference to Heibai information between items POS data storage unit, generates a product genre Heibai characteristic information containing a characteristic parameter of Heibai status of each product category, product genre Heibai feature information A product genre sales feature information generation step stored in the storage means;
FEATURES merchandise genre discovery support means, by referring to the commodity clustering result storage means, and counting the items that exist in each cluster, a range value determined is given by the average items and the standard deviation per cluster A characteristic product genre discovery support step for extracting a product genre having a large variation in products when there is a cluster having the number of products outside,
The characteristic product discovery support means selects a product out of the cluster for the product genre extracted in the characteristic product genre discovery support step, and refers to the POS data storage means based on the product, Acquiring the product co-sale information, obtaining the product genre of each product based on the product co-sale information, referring to the product genre co-sale feature information storage means based on the product genre, between the two product genres of the calculated value based on the feature amount, intends row and characteristic product discovery assistance determining whether, of Heibai relationship.
また、本発明(請求項7)は、請求項1乃至3のいずれか1項に記載のPOSデータ分析装置を構成する各手段としてコンピュータを機能させるためのPOSデータ分析プログラムである。
Further, the present invention (Claim 7 ) is a POS data analysis program for causing a computer to function as each means constituting the POS data analysis apparatus according to any one of
本発明は、商品の併売状況に応じて、併売度合いが高いほど商品間の距離を小さく定義することで、商品をクラスタリングし、そのクラスタリングの階層構造をユーザに提示することにより、大量に存在する相関ルールの中から、あまり知られていないと思われる(思いがけない)併売情報を抽出することが容易になる。 The present invention exists in a large amount by clustering products and presenting the hierarchical structure of the clustering to the user by defining the distance between the products to be smaller as the degree of concurrent sales is higher in accordance with the status of product sales. From the association rules, it becomes easy to extract side sale information that seems to be less known (unexpected).
また、本発明によれば、分析対象として推奨する商品ジャンルを提示することにより、
大量に存在する相関ルールの中から思いがけない併売情報を抽出することが容易になる。
Moreover, according to the present invention, by presenting the recommended product genre as an analysis target,
It is easy to extract unexpected sales information from a large number of association rules.
また、本発明によれば、特徴的な併売であると思われる併売情報を提示することで、大量に存在する相関ルールの中から思いがけない併売情報を抽出することが容易になる。 Further, according to the present invention, it is possible to easily extract unexpected sales information from among a large number of correlation rules by presenting sales information that is considered to be characteristic sales.
さらに、分析対象を併売のバラツキが大きい商品ジャンルに絞り、その中から特徴的な併売情報を見つけることで、大量に存在する相関ルールの中から、高速かつ効率的に思いがけない併売情報を抽出することが容易になる。 Furthermore, by narrowing down the analysis target to product genres with large variation in parallel sales and finding characteristic parallel sales information from the genre, it extracts unexpected simultaneous sales information from a large number of association rules at high speed and efficiently. It becomes easy.
以下図面と共に、本発明の実施の形態を説明する。 Embodiments of the present invention will be described below with reference to the drawings.
[第1の実施の形態]
本発明は、それぞれの商品ジャンルにおける商品の併売状況をクラスタリングし、その商品ジャンルで特徴的な商品を浮き彫りにすることで、特徴的な併売を発見することを支援するPOSデータ分析装置である。これは「同一商品ジャンルの商品は、似た併売状況になるだろう」という推測に基づき、その併売状況が他商品とは大きく異なる商品を見つけることを特徴とする。
[First Embodiment]
The present invention is a POS data analysis device that supports the discovery of a characteristic parallel sale by clustering the sales situation of the commodity in each commodity genre and highlighting the characteristic commodity in the commodity genre. This is based on the assumption that “a product of the same product genre will have a similar side-by-side sales situation”, and is characterized by finding a product whose sales situation is significantly different from other products.
図1は、本発明の第1の実施の形態におけるPOSデータ分析装置の構成を示す。 FIG. 1 shows the configuration of a POS data analysis apparatus according to the first embodiment of the present invention.
POSデータ分析装置100Aは、POSデータ管理部110、商品ジャンル管理部120、商品管理部130、商品併売特徴情報生成部140、商品クラスタ分析部150、商品クラスタ表示部160、併売状況表示部170と、5つのデータベース(POS DB101、商品ジャンルDB102、商品DB103、商品併売特徴情報DB104、商品クラスタDB105)から構成される。
The POS
併売状況表示部160と商品クラスタ表示部170は、利用者端末10のユーザインタフェース管理部11(以下「UI管理部」と記す)と接続されている。
The co-sale
図2は、本発明の第1の実施の形態におけるPOSデータ分析処理のフローの一例を示す。 FIG. 2 shows an example of the flow of POS data analysis processing in the first embodiment of the present invention.
ステップ101) POSデータ管理部110は、各店舗のPOS端末などから入力されるPOSデータを、ネットワーク経由などで受け取り、POS DB101に記録する。図3にPOS DB101に格納されるPOSデータの例を示す。POSデータは、レシート番号、店舗タイプ、販売年月日、曜日、顧客性別、顧客年齢、商品名、商品コード、単価、販売個数、売上金額、製造メーカ、商品ジャンル名、ジャンルコードを含む。
Step 101) The POS
ステップ102) 商品ジャンル管理部120は、POSデータに含まれる商品ジャンル情報(売上/併売に関連しない商品ジャンル自身の情報)を抽出し、商品ジャンルDB102に記録する。図4に商品ジャンルDB102の登録例を示す。商品ジャンルDB102には、商品ジャンルID、ジャンルコード、商品ジャンル名が登録される。
Step 102) The merchandise
ステップ103) 商品管理部130は、商品ジャンル管理部120と同様に、POSデータに含まれる商品情報(売上/併売に関連しない商品自身の情報)を抽出し、商品DB103に記録する。図5に商品DB103の登録例を示す。商品DB103には、商品ID,商品コード、商品名、単価、製造メーカ、商品ジャンルIDが登録される。
Step 103) Similar to the product
ステップ104) 商品併売特徴情報生成部140は、POSデータを分析することで、各商品の併売状況の特徴を示す併売特徴情報を生成し、その併売特徴情報を商品併売特徴情報DB104に記録する。併売特徴情報の一例として、その商品が購入されたレシート番号の集合情報が考えられる。例えば、図3のPOSデータにおいて、レシート番号の集合を併売特徴情報とした場合の一例を図6に示す。図6より、IDが"3040"の商品は、レシート番号「162747」、「182432」、「192334」の3枚のレシートで購入されたことが分かる。併売特徴情報の別の例としては、どの商品と併売されているかを示すベクトル情報も考えられる。図6と同様の情報をベクトル情報として表現した場合の一例を図7に示す。
Step 104) The product co-sale feature
ステップ105) 商品クラスタ分析部150は、商品DB103と商品併売特徴情報DB104にアクセスして取得した、併売特徴情報により商品間の類似度(併売度)を計算し、それらの情報を用いて、それぞれの商品ジャンルごとに商品をクラスタリングし、そのクラスタリング結果を商品クラスタDB105に記録する。併売特徴情報として図6のような集合を用いる場合は、類似度計算としてはシンプソン係数やジャカード係数などがある。図7のようにベクトル情報を用いる場合は、コサイン類似度やピアソンの相関係数などで類似度を計算することができる。また、このときのクラスタリングの方法として、例えば、凝集型階層的クラスタリング手法を用いることができる。
Step 105) The product
次に、上記の処理が完了した後の利用シーンについて説明する。 Next, a usage scene after the above processing is completed will be described.
図8は、本発明の第1の実施の形態における利用シーンのシーケンスチャートの一例である。 FIG. 8 is an example of a usage scene sequence chart according to the first embodiment of the present invention.
POSデータ分析の利用者(以下、分析者)は、利用端末10のUI管理部11にアクセスし、ある商品ジャンルのクラスタリング結果の表示をリクエストする。UI管理部11は、POSデータ分析装置100Aの商品クラスタ表示部170に、リクエストされた商品ジャンルを伝える(ステップ201)。
A user of POS data analysis (hereinafter referred to as an analyst) accesses the
商品クラスタ表示部170は、商品クラスタDB105にアクセスし、リクエストされた商品ジャンルのクラスタリング結果である階層構造を図として表現し(ステップ202)、それをUI管理部11に返す。UI管理部11は、受け取った図を分析者画面に表示する(ステップ203)。このとき、分析者は、別の商品ジャンルのクラスタリング結果を、再リクエストすることも可能である。図9にクラスタリング結果の一例を示す。
The product
ここで、分析者は、表示されたクラスタリング結果により、クラスタから外れている商品を見つけることができる。例えば、図9においては、商品Iが、クラスタから外れている商品である。クラスタから外れている商品は、他の商品と併売状況が異なることを意味する。つまり、この商品の併売状況が特徴的であり、思いがけない併売状況である可能性がある。 Here, the analyst can find a product out of the cluster based on the displayed clustering result. For example, in FIG. 9, the product I is a product that is out of the cluster. A product that is out of the cluster means that the sales situation is different from other products. In other words, this product sales situation is characteristic, and there is a possibility that it is an unexpected sales situation.
クラスタから外れた商品を見つけた分析者は、その商品の併売商品の表示をリクエストする(ステップ204)。リクエストを受け取ったUI管理部11は、POS分析装置100Aの併売状況表示部160に、リクエストされた商品を伝える。併売状況表示部160は、商品併売特徴情報DB104と商品DB103にアクセスし、併売されている商品情報を入手し、それをUI管理部11に返す(ステップ205)。UI管理部11は、受け取った商品情報を分析者画面に表示する(ステップ206)。
The analyst who finds a product out of the cluster requests display of the co-sold product of the product (step 204). Upon receiving the request, the
上記のように、本実施の形態によれば、図9に示すクラスタリング結果の図を見ることにより、ある商品ジャンルにおいて特徴的な併売状況を持つ商品を発見できることができる。発見した商品の併売状況を確認することで、思いがけない併売状況を見つけることができる。 As described above, according to the present embodiment, by looking at the clustering result diagram shown in FIG. By confirming the sales situation of the discovered product, it is possible to find an unexpected sales situation.
[第2の実施の形態]
図10は、本発明の第2の実施の形態におけるPOSデータ分析装置の構成図である。同図において、図1と同一構成部分には同一符号を付し、その説明を省略する。
[Second Embodiment]
FIG. 10 is a configuration diagram of a POS data analysis apparatus according to the second embodiment of the present invention. In the figure, the same components as those in FIG.
図10に示すPOSデータ分析装置100Bは、図1に示した第1の実施の形態におけるPOSデータ分析装置100Aにおける既存の部の他に、特徴的商品ジャンル発見支援部210を有する。
A POS data analysis device 100B shown in FIG. 10 includes a characteristic product genre
特徴的商品ジャンル発見支援部210は、商品クラスタDB105にアクセスし、商品のバラツキが大きい商品ジャンルを1つもしくは複数個抽出し、それらをUI管理部11に伝える。UI管理部11は、受け取った商品ジャンルを分析者に提示する。これにより、分析者は分析対象とすべき商品ジャンルを効率的に見つけることができる。
The characteristic product genre
なお、ある商品ジャンルが商品のバラツキが大きいか否かを調べる手法の一例としては、以下の手順が考えられる。 In addition, the following procedure can be considered as an example of a method for examining whether or not a certain product genre has a large variation in products.
1)ある商品ジャンルにおけるクラスタリング結果を調べる(予め設定してある類似度をチェックし、その類似度でクラスタリングした結果を調べる)。 1) A clustering result in a certain product genre is examined (a similarity degree set in advance is checked, and a result of clustering based on the similarity degree is examined).
2)各クラスタに存在する商品の数をカウントし、1クラスタあたりの平均商品数μと標準偏差σを計算する。 2) Count the number of products present in each cluster and calculate the average number of products μ per cluster and the standard deviation σ.
3)「μ−3σ以下」もしくは「μ+3σ以上」の商品数を持つクラスタの有無を調べる。 3) Check whether there is a cluster having the number of products of “μ−3σ or less” or “μ + 3σ or more”.
4)上記の3)の条件に該当するクラスタが存在する場合は、該当商品ジャンルは商品のバラツキが大きいと判断する。 4) If there is a cluster corresponding to the above condition 3), it is determined that the corresponding product genre has a large variation in the product.
これにより、分析者は、自分自身で気になる商品ジャンルをゼロから探すことなく、商品のバラツキが大きいと商品ジャンルの中から、分析する商品ジャンルを選択することができる。 Thus, the analyst can select the product genre to be analyzed from the product genres when the product variation is large, without searching for the product genre that he / she is interested in from zero.
本実施の形態によれば、図8に示す第1の実施の形態における利用シーンでは、利用者が分析する商品ジャンルを指定する必要がある。例えば、コンビニエンスストアの商品ジャンルは数百になるが、これらの中から、分析する商品ジャンルを指定することは非常に難しい。この課題を解決するのが、第2の実施の形態における特徴的商品ジャンル発見支援部210による、分析対象として推奨する商品ジャンルの提示である。
According to the present embodiment, in the usage scene in the first embodiment shown in FIG. 8, it is necessary to specify the product genre to be analyzed by the user. For example, although there are hundreds of merchandise genres in a convenience store, it is very difficult to specify the merchandise genre to be analyzed from these. What solves this problem is the presentation of the product genre recommended as the analysis target by the characteristic product genre
[第3の実施の形態]
図11は、本発明の第3の実施の形態におけるPOSデータ分析装置の構成図である。
[Third Embodiment]
FIG. 11 is a configuration diagram of a POS data analysis apparatus according to the third embodiment of the present invention.
同図において、図1と同一構成部分には同一符号を付し、その説明を省略する。 In the figure, the same components as those in FIG.
図11に示すPOSデータ分析装置100Cは、図1に示した第1の実施の形態におけるPOSデータ分析装置100Aの既存の構成の他に、商品ジャンル併売特徴情報生成部320と、特徴的商品発見支援部310、商品ジャンル併売特徴情報DB301を有する。
In addition to the existing configuration of the POS
商品ジャンル併売特徴情報生成部320は、POS DB101にアクセスし、商品間の併売情報を参照することにより、商品ジャンル間の併売状況を調べ、各商品ジャンルの併売状況の特徴を示す商品ジャンル併売特徴情報を生成する。商品ジャンル併売特徴情報の一例として、その商品ジャンルが購入されたレシート番号の集合情報が考えられる。この場合の商品ジャンル併売特徴情報の例としては、商品併売特徴情報と同様に図6が考えられる。また、別の例としては、併売された商品ジャンルを示すベクトル情報も考えられる。ベクトル情報の例は、商品併売特徴情報と同様に図7である。商品ジャンル併売特徴情報生成部320は、生成した特徴情報を、商品ジャンル併売特徴情報DB301に記録する。
The product genre co-sale feature
特徴的商品発見支援部310は、例えば以下の手順により、特徴的な併売と思われる商品を提示する。処理のイメージを図12に示す。
The characteristic product
1)商品併売特徴情報DB104にアクセスし、すべての併売情報を抽出する。
1) Access to the product co-sale feature
2)商品ジャンルDB102と商品DB103にアクセスし、併売情報における各商品の商品ジャンルを調べる。
2) The
3)2)で取得した商品ジャンルに基づいて、商品ジャンル併売特徴情報DB104にアクセスし、2つの商品ジャンル間で、併売関係があるかどうかを調べる。
3) Based on the product genre acquired in 2), the product genre side sale
4)併売関係がない場合は、その併売関係は思いがけない併売である可能性があると判断する。 4) If there is no side-by-side relationship, determine that the side-to-side relationship may be unexpected.
5)1)で取得したすべての併売情報に対して、2)〜4)を繰り返す。 5) Repeat steps 2) to 4) for all the co-sale information acquired in 1).
また、上記の手順1)3)で必要となる商品の併売情報/商品ジャンルの併売情報の抽出方法の一例を以下に示す。なお、ここでは、特徴情報としてレシート集合が記録されているとする。処理のイメージを図13に示す。 In addition, an example of a method for extracting the product sales information / product genre sales information required in the above steps 1) and 3) will be described below. Here, it is assumed that a receipt set is recorded as the feature information. An image of the processing is shown in FIG.
1)商品併売特徴情報DB104の最初に登録されている商品を選択する。
1) Select the first registered product in the combined product
2)予め設定された支持度のしきい値を参照し、該当商品の支持度と比較する。 2) Refer to a preset support level threshold value and compare with the support level of the corresponding product.
→ しきい値よりも大きい場合は、処理3)へ移行する。 → If greater than the threshold value, proceed to process 3).
→ しきい値よりも小さい場合は、処理1)に戻り次の商品を選択する。 → If it is smaller than the threshold value, return to process 1) and select the next product.
3)POS DB101にアクセスし、その商品と併売されているすべての商品を調べる。
3) Access the
4)併売商品に対する併売度(確信度)と、該当併売の有意確率を計算する。併売度の計算方法には、集合の類似度計算法ではシンプソン係数やジャカード係数が、その他にもコサイン類似度など様々な手法が考えられる。有意確率の計算方法には、カイ二乗法やフィッシャーの正確確率検定などがある。 4) Calculate the degree of co-sale (confidence) for the co-sold product and the significance of the co-sale. As the method of calculating the degree of parallel sales, various methods such as the Simpson coefficient and the Jacquard coefficient in the set similarity calculation method, and the cosine similarity can be considered. Significance probability calculation methods include chi-square method and Fisher's exact test.
5)予め設定された併売度と有意確率のしきい値を参照し、該当商品と比較する。 5) Refer to the preset sales degree and threshold of significance, and compare with the corresponding product.
→ 両値がしきい値をクリアーする場合は、該当する併売を抽出する。 → If both values clear the threshold, extract the corresponding co-sale.
→ どちらかがしきい値をクリアーできない場合は、処理1)に戻り次の商品を選択する。 → If either cannot clear the threshold, return to process 1) and select the next product.
6)処理1)に戻り、次の商品を選択する。 6) Return to process 1) and select the next product.
図8に示す第1の実施の形態における利用シーンでは、利用者が分析する商品ジャンルを指定する必要がある。例えば、コンビニエンスストアの商品ジャンルは数百になるが、これらの中から、分析する商品ジャンルを指定することは非常に難しい。この課題に対して、本実施の形態によれば、図12に示すとおり、思いがけない併売情報(図12におけるケースbの「ビールA−ケーキF」の併売)を提示することが可能となる。 In the usage scene in the first embodiment shown in FIG. 8, it is necessary to specify the product genre to be analyzed by the user. For example, although there are hundreds of merchandise genres in a convenience store, it is very difficult to specify the merchandise genre to be analyzed from these. With respect to this problem, according to the present embodiment, as shown in FIG. 12, it is possible to present unexpected side-by-side sales information (both side sales of “beer A-cake F” in case b in FIG. 12).
[第4の実施の形態]
図14は、本発明の第4の実施の形態におけるPOSデータ分析装置の構成図である。同図において、図1、図10、図11と同一構成部分には同一符号を付し、その説明を省略する。
[Fourth Embodiment]
FIG. 14 is a configuration diagram of a POS data analysis apparatus according to the fourth embodiment of the present invention. In this figure, the same components as those in FIGS. 1, 10, and 11 are denoted by the same reference numerals, and description thereof is omitted.
図14に示す本実施の形態におけるPOSデータ分析装置100Dは、図1に示した第1の実施の形態のPOSデータ分析装置100Aにおける既存の部の他に、特徴的商品発見支援部310と、商品ジャンル併売特徴情報生成部320、特徴的商品ジャンル発見支援部210、商品ジャンル併売特徴情報DB301を有する。つまり、第2の実施の形態と第3の実施の形態のPOSデータ分析装置100B,100Cの構成を組み合わせた構成である。
The POS data analysis device 100D in the present embodiment shown in FIG. 14 includes a characteristic product
第3の実施の形態では、商品間のすべての併売情報に対して、該当商品ジャンル間の併売関係の有無を調べている。これは、処理量が多く、処理時間がかかると思われる。そこで、本実施の形態では、第2の実施の形態に示した特徴的商品ジャンル発見支援部210の利用により分析対象となる併売情報を削減することで、処理を高速化しつつ、第3の実施の形態よりも、より特徴的な併売を見つけることを支援することが特徴である。
In the third embodiment, the presence / absence of a parallel sales relationship between corresponding product genres is examined for all the parallel sales information between products. This seems to require a large amount of processing and processing time. Therefore, in the present embodiment, the third implementation is performed while speeding up the processing by reducing the concurrent sales information to be analyzed by using the characteristic product genre
本実施の形態における処理フローを以下に示す。なお、予め、前述の第3の実施の形態の商品ジャンル併売特徴情報生成部320により商品ジャンル併売特徴情報DB301に商品ジャンル併売特徴情報が格納されているものとする。
The processing flow in the present embodiment is shown below. It is assumed that product genre combined feature information is stored in the product genre combined
1)特徴的商品ジャンル発見支援部210は、商品クラスタDB105にアクセスし、商品のバラつきが大きい商品ジャンルを1つもしくは複数個ほど抽出する(第2の実施の形態の処理と同様)。
1) The characteristic product genre
2)特徴的商品発見支援部310は、商品クラスタDB105にアクセスし、抽出した商品ジャンルに対して、クラスタから外れた商品を選択する(第4の実施の形態の新しい処理内容)。
2) The characteristic product
3)特徴的商品発見支援部310は、POS DB101にアクセスし、選択した商品に関する併売情報を参照する(第4の実施の形態の新しい処理内容)。
3) The characteristic product
4)該当する併売情報に対して、それが特徴的か否かを判定する(第3の実施の形態の図12の処理と同様)。 4) It is determined whether or not the corresponding co-sale information is characteristic (similar to the processing of FIG. 12 of the third embodiment).
なお、上記の第1〜第4の実施の形態における各構成要素の動作をプログラムとして構築し、POSデータ分析装置として利用されるコンピュータにインストールして実行させる、または、ネットワークを介して流通させることが可能である。 In addition, the operation | movement of each component in said 1st-4th embodiment is constructed | assembled as a program, installed in the computer utilized as a POS data analysis apparatus, made to run, or distribute | circulates via a network. Is possible.
また、構築したプログラムをハードディスクやフレキシブルディスク、CD−ROM等の可搬記憶媒体に格納し、コンピュータにインストールする、または、配布することが可能である。 Further, the constructed program can be stored in a portable storage medium such as a hard disk, a flexible disk, or a CD-ROM, and can be installed or distributed in a computer.
本発明は、上記の実施の形態に限定されることなく、特許請求の範囲内において、種々変更・応用が可能である。 The present invention is not limited to the above-described embodiments, and various modifications and applications are possible within the scope of the claims.
10 利用者端末
11 ユーザインタフェース管理部
100A,100B,100C POSデータ分析装置
101 POS DB
102 商品ジャンルDB
103 商品DB
104 商品併売特徴情報DB
105 商品クラスタDB
110 POSデータ管理部
120 商品ジャンル管理部
130 商品管理部
140 商品併売特徴情報生成部
150 商品クラスタ分析部
160 併売状況表示部
170 商品クラスタ表示部
210 特徴的商品ジャンル発見支援部
301 商品ジャンル併売特徴情報DB
310 特徴的商品発見支援部
320 商品ジャンル併売特徴情報生成部
10
102 Product Genre DB
103 Product DB
104 Commodity sale feature information DB
105 Product Cluster DB
110 POS
310 characteristic product
Claims (7)
POSデータを蓄積するPOSデータ記憶手段と、
前記POSデータ記憶手段からPOSデータを読み込んで、該POSデータから商品ジャンル情報を抽出する商品ジャンル管理手段と、
前記POSデータ記憶手段のPOSデータの各商品の併売特徴を示す併売特徴情報を生成し、商品併売特徴情報記憶手段に格納する商品併売特徴情報生成手段と、
前記商品ジャンル管理手段で抽出された前記商品ジャンル情報に基づいて、前記商品併売特徴情報記憶手段の商品の間の類似度を算出し、該類似度に基づいて商品ジャンル毎に商品をクラスタリングし、該類似度と共にクラスタリング結果を商品クラスタリング結果記憶手段に格納する商品クラスタ分析手段と、
前記商品クラスタリング結果記憶手段を参照し、各クラスタに存在する商品数をカウントし、1クラスタあたりの平均商品数と標準偏差により求められた値が所定の範囲外となる商品数を持つクラスタがある場合は、商品のばらつきが大きい商品ジャンルであると判定する特徴的商品ジャンル発見支援手段と、
を有することを特徴とするPOSデータ分析装置。 POS data analyzer,
POS data storage means for storing POS data;
Product genre management means for reading POS data from the POS data storage means and extracting product genre information from the POS data;
Commodity co-sale feature information generating means for generating co-sale feature information indicating the co-sale characteristics of each product of the POS data in the POS data storage means, and storing in the product co-sale feature information storage means,
Based on the product genre information extracted by the product genre management means, calculate the similarity between the products in the product parallel feature information storage means, cluster the products for each product genre based on the similarity, Product cluster analysis means for storing a clustering result together with the similarity in a product clustering result storage means;
By referring to the product clustering result storage unit, the number of products existing in each cluster is counted, and there is a cluster having the number of products for which the value obtained by the average number of products per one cluster and the standard deviation is out of a predetermined range. A characteristic product genre discovery support means for determining that the product genre has a large variation in product,
A POS data analysis device characterized by comprising:
POSデータを蓄積するPOSデータ記憶手段と、
前記POSデータ記憶手段からPOSデータを読み込んで、該POSデータから商品ジャンル情報を抽出する商品ジャンル管理手段と、
前記POSデータ記憶手段のPOSデータの各商品の併売特徴を示す併売特徴情報を生成し、商品併売特徴情報記憶手段に格納する商品併売特徴情報生成手段と、
前記商品ジャンル管理手段で抽出された前記商品ジャンル情報に基づいて、前記商品併売特徴情報記憶手段の商品の間の類似度を算出し、該類似度に基づいて商品ジャンル毎に商品をクラスタリングし、該類似度と共にクラスタリング結果を商品クラスタリング結果記憶手段に格納する商品クラスタ分析手段と、
前記POSデータ記憶手段の商品間の併売情報を参照し、各商品ジャンルの併売状況の特徴量を含む商品ジャンル併売特徴情報を生成し、商品ジャンル併売特徴情報記憶手段に格納する商品ジャンル併売特徴情報生成手段と、
前記商品併売特徴情報記憶手段から併売情報を取得し、該併売情報に基づいて各商品の商品ジャンルを取得して、該商品ジャンルに基づいて前記商品ジャンル併売特徴情報記憶手段を参照し、2つの商品ジャンル間の特徴量に基づいて計算された値により、併売関係の有無を判定する特徴的商品発見支援手段と、
を有することを特徴とするPOSデータ分析装置。 POS data analyzer,
POS data storage means for storing POS data;
Product genre management means for reading POS data from the POS data storage means and extracting product genre information from the POS data;
Commodity co-sale feature information generating means for generating co-sale feature information indicating the co-sale characteristics of each product of the POS data in the POS data storage means, and storing in the product co-sale feature information storage means,
Based on the product genre information extracted by the product genre management means, calculate the similarity between the products in the product parallel feature information storage means, cluster the products for each product genre based on the similarity, Product cluster analysis means for storing a clustering result together with the similarity in a product clustering result storage means;
Commodity genre sale feature information that refers to the sale information between products in the POS data storage means, generates product genre sale feature information including the feature quantity of the sale status of each product genre, and stores it in the product genre sale feature information storage means. Generating means;
Acquires the co-sale information from the product co-sale feature information storage unit, acquires the product genre of each product based on the co-sale information, refers to the product genre co-sale feature information storage unit based on the product genre, and A characteristic product discovery support means for determining whether or not there is a co-sale relationship based on a value calculated based on a feature quantity between product genres;
POS data analysis device, characterized by have a.
POSデータを蓄積するPOSデータ記憶手段と、
前記POSデータ記憶手段からPOSデータを読み込んで、該POSデータから商品ジャンル情報を抽出する商品ジャンル管理手段と、
前記POSデータ記憶手段のPOSデータの各商品の併売特徴を示す併売特徴情報を生成し、商品併売特徴情報記憶手段に格納する商品併売特徴情報生成手段と、
前記商品ジャンル管理手段で抽出された前記商品ジャンル情報に基づいて、前記商品併売特徴情報記憶手段の商品の間の類似度を算出し、該類似度に基づいて商品ジャンル毎に商品をクラスタリングし、該類似度と共にクラスタリング結果を商品クラスタリング結果記憶手段に格納する商品クラスタ分析手段と、
前記POSデータ記憶手段の商品間の併売情報を参照し、各商品ジャンルの併売状況の特徴量を含む商品ジャンル併売特徴情報を生成し、商品ジャンル併売特徴情報記憶手段に格納する商品ジャンル併売特徴情報生成手段と、
前記商品クラスタリング結果記憶手段を参照し、各クラスタに存在する商品数をカウントし、1クラスタあたりの平均商品数と標準偏差により求められた値が所定の範囲外となる商品数を持つクラスタがある場合は商品のばらつきが大きい商品ジャンルを抽出する特徴的商品ジャンル発見支援手段と、
前記特徴的商品ジャンル発見支援手段で抽出された前記商品ジャンルに対してクラスタから外れた商品を選択し、該商品に基づいて前記POSデータ記憶手段を参照して、該商品の併売情報を取得し、該商品の併売情報に基づいて各商品の商品ジャンルを取得して、該商品ジャンルに基づいて前記商品ジャンル併売特徴情報記憶手段を参照し、2つの商品ジャンル間の特徴量に基づいて計算された値により、併売関係の有無を判定する特徴的商品発見支援手段と、
を有することを特徴とするPOSデータ分析装置。 POS data analyzer,
POS data storage means for storing POS data;
Product genre management means for reading POS data from the POS data storage means and extracting product genre information from the POS data;
Commodity co-sale feature information generating means for generating co-sale feature information indicating the co-sale characteristics of each product of the POS data in the POS data storage means, and storing in the product co-sale feature information storage means
Based on the product genre information extracted by the product genre management means, calculate the similarity between the products in the product parallel feature information storage means, cluster the products for each product genre based on the similarity, Product cluster analysis means for storing a clustering result together with the similarity in a product clustering result storage means;
Commodity genre sale feature information that refers to the sale information between products in the POS data storage means, generates product genre sale feature information including the feature quantity of the sale status of each product genre, and stores it in the product genre sale feature information storage means. Generating means;
By referring to the product clustering result storage unit, the number of products existing in each cluster is counted, and there is a cluster having the number of products for which the value obtained by the average number of products per one cluster and the standard deviation is out of a predetermined range. In this case, characteristic product genre discovery support means for extracting product genres with large variations in products,
Select a product out of the cluster with respect to the product genre extracted by the characteristic product genre discovery support means, refer to the POS data storage means based on the product, and acquire the co-sale information of the product The product genre of each product is acquired based on the product sales information, the product genre combined feature information storage unit is referred to based on the product genre, and calculated based on the feature quantity between the two product genres. Characteristic product discovery support means for determining the presence or absence of a co-sale relationship according to the value,
POS data analysis device, characterized by have a.
POSデータを蓄積するPOSデータ記憶手段と、商品併売特徴情報記憶手段、商品併売特徴情報生成手段、商品クラスタリング結果記憶手段、商品ジャンル併売特徴情報記憶手段を有する装置において、
商品ジャンル管理手段が、前記POSデータ記憶手段からPOSデータを読み込んで、該POSデータから商品ジャンル情報を抽出する商品ジャンル管理ステップと、
商品併売特徴情報生成手段が、前記POSデータ記憶手段のPOSデータの各商品の併売特徴を示す併売特徴情報を生成し、前記商品併売特徴情報記憶手段に格納する商品併売特徴情報生成ステップと、
商品クラスタ分析手段が、前記商品ジャンル管理ステップで抽出された前記商品ジャンル情報に基づいて、前記商品併売特徴情報記憶手段の商品の間の類似度を算出し、該類似度に基づいて商品ジャンル毎に商品をクラスタリングし、該類似度と共にクラスタリング結果を前記商品クラスタリング結果記憶手段に格納する商品クラスタ分析ステップと、
特徴的商品ジャンル発見支援手段が、前記商品クラスタリング結果記憶手段を参照し、各クラスタに存在する商品数をカウントし、1クラスタあたりの平均商品数と標準偏差により求められた値が所定の範囲外となる商品数を持つクラスタがある場合は、商品のばらつきが大きい商品ジャンルであると判定する特徴的商品ジャンル発見支援ステップと、
を行うことを特徴とするPOSデータ分析方法。 POS data analysis method,
In an apparatus having POS data storage means for storing POS data, product co-sale feature information storage unit, product co-sale feature information generation unit, product clustering result storage unit, product genre co-sale feature information storage unit,
A product genre management means for reading POS data from the POS data storage means and extracting product genre information from the POS data;
Commodity co-sale feature information generating means generates co-sale feature information indicating the co-sale characteristics of each product of the POS data of the POS data storage unit, and stores the product co-sale feature information information in the product co-sale feature information storage unit;
The product cluster analysis means calculates the similarity between the products in the product co-sale feature information storage means based on the product genre information extracted in the product genre management step, and each product genre based on the similarity A product cluster analysis step of clustering products into the product clustering results and storing the clustering results together with the similarity in the product clustering result storage means;
The characteristic product genre discovery support means refers to the product clustering result storage means, counts the number of products existing in each cluster, and the value obtained from the average number of products per cluster and the standard deviation is out of a predetermined range. If there is a cluster having the number of products to be a characteristic product genre discovery support step for determining that the product genre has a large variation in products,
POS data analysis method characterized by
POSデータを蓄積するPOSデータ記憶手段と、商品併売特徴情報記憶手段、商品併売特徴情報生成手段、商品クラスタリング結果記憶手段、商品ジャンル併売特徴情報記憶手段を有する装置において、
商品ジャンル管理手段が、前記POSデータ記憶手段からPOSデータを読み込んで、該POSデータから商品ジャンル情報を抽出する商品ジャンル管理ステップと、
商品併売特徴情報生成手段が、前記POSデータ記憶手段のPOSデータの各商品の併売特徴を示す併売特徴情報を生成し、前記商品併売特徴情報記憶手段に格納する商品併売特徴情報生成ステップと、
商品クラスタ分析手段が、前記商品ジャンル管理ステップで抽出された前記商品ジャンル情報に基づいて、前記商品併売特徴情報記憶手段の商品の間の類似度を算出し、該類似度に基づいて商品ジャンル毎に商品をクラスタリングし、該類似度と共にクラスタリング結果を前記商品クラスタリング結果記憶手段に格納する商品クラスタ分析ステップと、
商品ジャンル併売特徴情報生成手段が、前記POSデータ記憶手段の商品間の併売情報を参照し、各商品ジャンルの併売状況の特徴量を含む商品ジャンル併売特徴情報を生成し、商品ジャンル併売特徴情報記憶手段に格納する商品ジャンル併売特徴情報生成ステップと、
特徴的商品発見支援手段が、前記商品併売特徴情報記憶手段から併売情報を取得し、該併売情報に基づいて各商品の商品ジャンルを取得して、該商品ジャンルに基づいて前記商品ジャンル併売特徴情報記憶手段を参照し、2つの商品ジャンル間の特徴量に基づいて計算された値により、併売関係の有無を判定する特徴的商品発見支援ステップと、
を行うことを特徴とするPOSデータ分析方法。 POS data analysis method,
In an apparatus having POS data storage means for storing POS data, product co-sale feature information storage unit, product co-sale feature information generation unit, product clustering result storage unit, product genre co-sale feature information storage unit,
A product genre management means for reading POS data from the POS data storage means and extracting product genre information from the POS data;
Commodity co-sale feature information generating means generates co-sale feature information indicating the co-sale characteristics of each product of the POS data of the POS data storage unit, and stores the product co-sale feature information information in the product co-sale feature information storage unit;
The product cluster analysis means calculates the similarity between the products in the product co-sale feature information storage means based on the product genre information extracted in the product genre management step, and each product genre based on the similarity A product cluster analysis step of clustering products into the product clustering results and storing the clustering results together with the similarity in the product clustering result storage means;
Is commodity genre Heibai characteristic information generating means, the reference to Heibai information between items POS data storage unit, generates a product genre Heibai characteristic information containing a characteristic parameter of Heibai status of each product category, product genre Heibai feature information A product genre sales feature information generation step stored in the storage means;
FEATURES merchandise discovery support means, said product Heibai acquires Heibai information from the characteristic information storing means, to obtain a product genre of each product on the basis of said combination sales information, the product genre Heibai features based on the product category A characteristic product discovery support step of referring to the information storage means and determining the presence / absence of a co-sale relationship based on a value calculated based on a feature quantity between two product genres;
POS data analysis wherein the intends rows.
POSデータを蓄積するPOSデータ記憶手段と、商品併売特徴情報記憶手段、商品併売特徴情報生成手段、商品クラスタリング結果記憶手段、商品ジャンル併売特徴情報記憶手段を有する装置において、
商品ジャンル管理手段が、前記POSデータ記憶手段からPOSデータを読み込んで、該POSデータから商品ジャンル情報を抽出する商品ジャンル管理ステップと、
商品併売特徴情報生成手段が、前記POSデータ記憶手段のPOSデータの各商品の併売特徴を示す併売特徴情報を生成し、前記商品併売特徴情報記憶手段に格納する商品併売特徴情報生成ステップと、
商品クラスタ分析手段が、前記商品ジャンル管理ステップで抽出された前記商品ジャンル情報に基づいて、前記商品併売特徴情報記憶手段の商品の間の類似度を算出し、該類似度に基づいて商品ジャンル毎に商品をクラスタリングし、該類似度と共にクラスタリング結果を前記商品クラスタリング結果記憶手段に格納する商品クラスタ分析ステップと、
商品ジャンル併売特徴情報生成手段が、前記POSデータ記憶手段の商品間の併売情報を参照し、各商品ジャンルの併売状況の特徴量を含む商品ジャンル併売特徴情報を生成し、商品ジャンル併売特徴情報記憶手段に格納する商品ジャンル併売特徴情報生成ステップと、
特徴的商品ジャンル発見支援手段が、前記商品クラスタリング結果記憶手段を参照し、各クラスタに存在する商品数をカウントし、1クラスタあたりの平均商品数と標準偏差により求められた値が所定の範囲外となる商品数を持つクラスタがある場合は商品のばらつきが大きい商品ジャンルを抽出する特徴的商品ジャンル発見支援ステップと、
特徴的商品発見支援手段が、前記特徴的商品ジャンル発見支援ステップで抽出された前記商品ジャンルに対してクラスタから外れた商品を選択し、該商品に基づいて前記POSデータ記憶手段を参照して、該商品の併売情報を取得し、該商品の併売情報に基づいて各商品の商品ジャンルを取得して、該商品ジャンルに基づいて前記商品ジャンル併売特徴情報記憶手段を参照し、2つの商品ジャンル間の特徴量に基づいて計算された値により、併売関係の有無を判定する特徴的商品発見支援ステップと、
を行うことを特徴とするPOSデータ分析方法。 POS data analysis method,
In an apparatus having POS data storage means for storing POS data, product co-sale feature information storage unit, product co-sale feature information generation unit, product clustering result storage unit, product genre co-sale feature information storage unit,
A product genre management means for reading POS data from the POS data storage means and extracting product genre information from the POS data;
Commodity co-sale feature information generating means generates co-sale feature information indicating the co-sale characteristics of each product of the POS data of the POS data storage unit, and stores the product co-sale feature information information in the product co-sale feature information storage unit;
The product cluster analysis means calculates the similarity between the products in the product co-sale feature information storage means based on the product genre information extracted in the product genre management step, and each product genre based on the similarity A product cluster analysis step of clustering products into the product clustering results and storing the clustering results together with the similarity in the product clustering result storage means;
Is commodity genre Heibai characteristic information generating means, the reference to Heibai information between items POS data storage unit, generates a product genre Heibai characteristic information containing a characteristic parameter of Heibai status of each product category, product genre Heibai feature information A product genre sales feature information generation step stored in the storage means;
FEATURES merchandise genre discovery support means, by referring to the commodity clustering result storage means, and counting the items that exist in each cluster, a range value determined is given by the average items and the standard deviation per cluster A characteristic product genre discovery support step for extracting a product genre having a large variation in products when there is a cluster having the number of products outside,
The characteristic product discovery support means selects a product out of the cluster for the product genre extracted in the characteristic product genre discovery support step, and refers to the POS data storage means based on the product, Acquiring the product co-sale information, obtaining the product genre of each product based on the product co-sale information, referring to the product genre co-sale feature information storage means based on the product genre, between the two product genres A characteristic product discovery support step for determining whether or not there is a co-sale relationship based on a value calculated based on the feature amount of
POS data analysis wherein the intends rows.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2010132401A JP5424989B2 (en) | 2010-06-09 | 2010-06-09 | POS data analysis apparatus, method and program |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2010132401A JP5424989B2 (en) | 2010-06-09 | 2010-06-09 | POS data analysis apparatus, method and program |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2011258023A JP2011258023A (en) | 2011-12-22 |
JP5424989B2 true JP5424989B2 (en) | 2014-02-26 |
Family
ID=45474125
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2010132401A Expired - Fee Related JP5424989B2 (en) | 2010-06-09 | 2010-06-09 | POS data analysis apparatus, method and program |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP5424989B2 (en) |
Families Citing this family (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP6710913B2 (en) * | 2015-08-24 | 2020-06-17 | 富士電機株式会社 | Information providing apparatus, information providing method, and program |
CN110689383B (en) * | 2019-10-12 | 2023-08-22 | 腾讯科技(深圳)有限公司 | Information pushing method, device, server and storage medium |
CN111340601B (en) * | 2020-03-30 | 2023-10-03 | 贝壳技术有限公司 | Commodity information recommendation method and device, electronic equipment and storage medium |
Family Cites Families (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2007094592A (en) * | 2005-09-27 | 2007-04-12 | Fusion Kk | Marketing data collection and analysis system, server system, and marketing data collection and analysis program |
JP4987499B2 (en) * | 2007-01-31 | 2012-07-25 | 株式会社エヌ・ティ・ティ・データ | Demand forecasting device, demand forecasting method, and demand forecasting program |
-
2010
- 2010-06-09 JP JP2010132401A patent/JP5424989B2/en not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
JP2011258023A (en) | 2011-12-22 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US9811851B2 (en) | Automatic product groupings for merchandising | |
US9088811B2 (en) | Information providing system, information providing method, information providing device, program, and information storage medium | |
EP2410446A1 (en) | Personal music recommendation mapping | |
US9082086B2 (en) | Adaptively learning a similarity model | |
TWI559158B (en) | Method, computer system and computer program product for relationship discovery in business analytics | |
Hu et al. | A modeling framework to accelerate food-borne outbreak investigations | |
US20120296776A1 (en) | Adaptive interactive search | |
US20140032514A1 (en) | Association acceleration for transaction databases | |
EP2526479A1 (en) | Accessing large collection object tables in a database | |
CN110363604A (en) | Page generation method and device | |
Vlachos et al. | Improving co-cluster quality with application to product recommendations | |
Glavic et al. | Provenance for data mining | |
JP5424989B2 (en) | POS data analysis apparatus, method and program | |
KR20140031416A (en) | Item recommend system based on a collaborative filtering and method thereof, apparatus supporting the same | |
Webga et al. | Discovery of rating fraud with real-time streaming visual analytics | |
US10509800B2 (en) | Visually interactive identification of a cohort of data objects similar to a query based on domain knowledge | |
JP2020107269A (en) | Information processing device, information processing method, and information processing program | |
US10810626B2 (en) | Automated lists | |
US7899776B2 (en) | Explaining changes in measures thru data mining | |
JP6676993B2 (en) | Information providing apparatus, information providing method, and program | |
JP6356774B2 (en) | Selection device, selection method, and selection program | |
JP2010277571A (en) | Commodity selection system and method, and commodity selection computer program | |
CN113076322A (en) | Commodity search processing method and device | |
US20170255691A1 (en) | Information processing system, information processing method, and program | |
US10157209B1 (en) | Memory analytics |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20120830 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20130822 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20130903 |
|
RD02 | Notification of acceptance of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7422 Effective date: 20131004 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20131101 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20131119 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20131126 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 Ref document number: 5424989 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
S531 | Written request for registration of change of domicile |
Free format text: JAPANESE INTERMEDIATE CODE: R313531 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
LAPS | Cancellation because of no payment of annual fees |