JP6840446B2 - Data processing device and data processing method - Google Patents

Data processing device and data processing method Download PDF

Info

Publication number
JP6840446B2
JP6840446B2 JP2019058494A JP2019058494A JP6840446B2 JP 6840446 B2 JP6840446 B2 JP 6840446B2 JP 2019058494 A JP2019058494 A JP 2019058494A JP 2019058494 A JP2019058494 A JP 2019058494A JP 6840446 B2 JP6840446 B2 JP 6840446B2
Authority
JP
Japan
Prior art keywords
index
data
purchase
customer
group
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2019058494A
Other languages
Japanese (ja)
Other versions
JP2020160710A (en
Inventor
正彦 烏谷
正彦 烏谷
京子 大坂
京子 大坂
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
True Data
Original Assignee
True Data
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by True Data filed Critical True Data
Priority to JP2019058494A priority Critical patent/JP6840446B2/en
Publication of JP2020160710A publication Critical patent/JP2020160710A/en
Application granted granted Critical
Publication of JP6840446B2 publication Critical patent/JP6840446B2/en
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Description

本発明は、顧客の購買データを処理するためのデータ処理装置及びデータ処理方法に関する。 The present invention relates to a data processing apparatus and a data processing method for processing customer purchase data.

近年、顧客の購買行動を分析することが注目されている。顧客の購買行動の分析には、様々な種類の大量のデータ(いわゆるビッグデータ)が有用である。特許文献1には、異なる提供元によって提供された複数のデータベースにおいて、特徴が類似するデータ同士を結合することによって、1つの巨大なデータベースを生成するシステムが記載されている。 In recent years, attention has been focused on analyzing customer purchasing behavior. Various types of large amounts of data (so-called big data) are useful for analyzing customer purchasing behavior. Patent Document 1 describes a system that generates one huge database by combining data having similar characteristics in a plurality of databases provided by different providers.

特許第5649756号Patent No. 5649756

特許文献1は、複数のデータベースを結合して1つの巨大なデータベースを生成する方法を開示している。一方で、巨大なデータベースに含まれる大量の購買データに基づいて顧客の購買行動を分析することは容易でなく、巨大なデータベースを用いて顧客の購買行動を分析する手法の確立が求められている。 Patent Document 1 discloses a method of combining a plurality of databases to generate one huge database. On the other hand, it is not easy to analyze customer purchasing behavior based on a large amount of purchasing data contained in a huge database, and it is required to establish a method for analyzing customer purchasing behavior using a huge database. ..

本発明は上述の点に鑑みてなされたものであり、顧客の購買データに基づいて顧客の購買行動を分析可能にするための情報を出力することを目的とする。 The present invention has been made in view of the above points, and an object of the present invention is to output information for making it possible to analyze a customer's purchasing behavior based on the customer's purchasing data.

本発明の第1の態様のデータ処理装置は、顧客の属性を示す顧客属性データと、前記顧客による商品の購入に関する情報を示す購買データとを関連付けて取得するデータ取得部と、前記データ取得部が取得した前記購買データに基づいて、前記顧客の購買傾向を示す指数を前記顧客ごとに算出する指数算出部と、前記データ取得部が取得した前記顧客属性データを用いて前記顧客を分類することによって、それぞれ1人以上の前記顧客を含む一以上のグループを生成するグループ生成部と、前記一以上のグループそれぞれに属する1人以上の前記顧客の前記指数に関する統計量を、前記一以上のグループそれぞれのグループ指数として、前記一以上のグループそれぞれと関連付けて出力する出力部と、を有する。 The data processing device according to the first aspect of the present invention includes a data acquisition unit that acquires customer attribute data indicating customer attributes in association with purchase data indicating information regarding the purchase of a product by the customer, and the data acquisition unit. Classify the customer using the index calculation unit that calculates an index indicating the purchase tendency of the customer for each customer based on the purchase data acquired by the data acquisition unit and the customer attribute data acquired by the data acquisition unit. A group generation unit that generates one or more groups including one or more customers, respectively, and statistics on the index of one or more customers belonging to each of the one or more groups are obtained by the one or more groups. Each group index has an output unit that outputs data in association with each of the one or more groups.

前記指数算出部は、前記データ取得部が取得した前記購買データに基づいて、異なる複数の前記指数を前記顧客ごとに算出し、前記出力部は、複数の前記指数に関する複数の前記統計量を、異なる複数の前記グループ指数として出力してもよい。 The index calculation unit calculates a plurality of different indexes for each customer based on the purchase data acquired by the data acquisition unit, and the output unit calculates a plurality of the statistics related to the plurality of indexes. It may be output as a plurality of different group indices.

前記グループ生成部は、異なる複数の前記指数の組み合わせが類似する1人以上の前記顧客を含む前記グループを生成してもよい。 The group generation unit may generate the group including one or more customers who are similar in combination of a plurality of different indices.

前記データ処理装置は、複数の前記指数のうち一部の指数が算出できない場合に、当該一部の指数以外の指数を用いて当該一部の指数を推定する推定部をさらに有してもよい。 The data processing device may further have an estimation unit that estimates a part of the indexes by using an index other than the part of the indexes when a part of the indexes cannot be calculated. ..

前記グループ生成部は、前記顧客属性データが含む前記顧客の性別、年齢層及び居住地のうち少なくとも1つが共通する1人以上の前記顧客を含む前記グループを生成してもよい。 The group generation unit may generate the group including one or more customers who share at least one of the customer's gender, age group, and place of residence included in the customer attribute data.

前記指数算出部は、店舗による前記商品の販売に関する情報を示す販売データと前記購買データとの間の関係に基づいて、前記指数を算出してもよい。 The index calculation unit may calculate the index based on the relationship between the sales data indicating information on the sale of the product by the store and the purchase data.

前記指数算出部は、前記販売データが含む前記商品の発売日から前記購買データが含む前記商品の購入日までの経過時間を用いて、前記指数を算出してもよい。 The index calculation unit may calculate the index by using the elapsed time from the release date of the product included in the sales data to the purchase date of the product included in the purchase data.

前記指数算出部は、前記販売データが含む前記商品の通常価格と、前記購買データが含む前記商品の購入価格との間の差を用いて、前記指数を算出してもよい。 The index calculation unit may calculate the index by using the difference between the normal price of the product included in the sales data and the purchase price of the product included in the purchase data.

前記指数算出部は、前記商品の中で前記販売データに基づいて特定の属性を有する特定属性商品を抽出し、前記購買データが含む前記特定属性商品の購入金額を用いて、前記指数を算出してもよい。 The index calculation unit extracts a specific attribute product having a specific attribute from the product based on the sales data, and calculates the index using the purchase amount of the specific attribute product included in the purchase data. You may.

前記指数算出部は、予め設定された基準日と、前記購買データが含む前記商品の購入日との間の関係に基づいて、前記指数を算出してもよい。 The index calculation unit may calculate the index based on the relationship between the preset reference date and the purchase date of the product included in the purchase data.

前記出力部は、前記グループ指数と、前記グループ指数とは異なる前記グループに関する値との間の関係を表す2次元の平面上に、前記グループを表してもよい。 The output unit may represent the group on a two-dimensional plane that represents the relationship between the group index and a value for the group that is different from the group index.

本発明の第2の態様のデータ処理方法は、プロセッサが実行する、顧客の属性を示す顧客属性データと、前記顧客による商品の購入に関する情報を示す購買データとを関連付けて記憶する記憶部から、前記顧客属性データ及び前記購買データを取得するステップと、前記取得するステップが取得した前記購買データに基づいて、前記顧客の購買傾向を示す指数を前記顧客ごとに算出するステップと、前記取得するステップが取得した前記顧客属性データを用いて前記顧客を分類することによって、それぞれ1人以上の前記顧客を含む一以上のグループを生成するステップと、前記一以上のグループそれぞれに属する1人以上の前記顧客の前記指数に関する統計量を、前記一以上のグループそれぞれのグループ指数として、前記一以上のグループそれぞれと関連付けて出力するステップと、を有する。 The data processing method of the second aspect of the present invention is performed from a storage unit that stores the customer attribute data indicating the customer attributes executed by the processor and the purchase data indicating the information regarding the purchase of the product by the customer in association with each other. A step of acquiring the customer attribute data and the purchase data, a step of calculating an index indicating the purchasing tendency of the customer for each customer based on the purchase data acquired by the acquisition step, and a step of acquiring the customer. By classifying the customers using the customer attribute data acquired by the customer, a step of generating one or more groups including one or more customers, and one or more groups belonging to each of the one or more groups. It has a step of outputting a statistic of a customer regarding the index as a group index of each of the one or more groups in association with each of the one or more groups.

本発明の第3の態様のデータ処理装置は、顧客による商品の購入に関する情報を示す購買データを取得するデータ取得部と、前記データ取得部が取得した前記購買データに基づいて、前記顧客の購買傾向を示す異なる複数の指数を前記顧客ごとに算出する指数算出部と、異なる複数の前記指数の組み合わせが類似する1人以上の前記顧客を含む一以上のグループを生成するグループ生成部と、前記一以上のグループそれぞれに属する1人以上の前記顧客の複数の前記指数に関する複数の統計量を、前記一以上のグループそれぞれの異なる複数のグループ指数として、前記一以上のグループそれぞれと関連付けて出力する出力部と、を有する。 The data processing device of the third aspect of the present invention is a data acquisition unit that acquires purchase data indicating information regarding the purchase of a product by a customer, and the purchase of the customer based on the purchase data acquired by the data acquisition unit. An index calculation unit that calculates a plurality of different indexes showing a tendency for each customer, a group generation unit that generates one or more groups including one or more customers whose combinations of different indexes are similar, and the above. A plurality of statistics on a plurality of the indexes of one or more customers belonging to each of the one or more groups are output as a plurality of different group indexes of the one or more groups in association with each of the one or more groups. It has an output unit.

本発明によれば、顧客の購買データに基づいて顧客の購買行動を分析可能にするための情報を出力できるという効果を奏する。 According to the present invention, there is an effect that information for enabling analysis of a customer's purchasing behavior can be output based on the customer's purchasing data.

実施形態に係るデータ処理システムの模式図である。It is a schematic diagram of the data processing system which concerns on embodiment. 実施形態に係るデータ処理システムのブロック図である。It is a block diagram of the data processing system which concerns on embodiment. 購買データ、商品データ及び顧客属性データの模式図である。It is a schematic diagram of purchase data, product data and customer attribute data. 実施形態に係るデータ処理システムが実行するデータ処理方法全体のフローチャートを示す図である。It is a figure which shows the flowchart of the whole data processing method executed by the data processing system which concerns on embodiment. 実施形態に係るデータ処理システムが実行する指数算出処理のフローチャートを示す図である。It is a figure which shows the flowchart of the exponential calculation process executed by the data processing system which concerns on embodiment. アーリーアダプター指数、価格センシティブ指数、限定商品購入指数、健康関連商品購入指数及びプレミアム商品購入指数を説明するための模式図である。It is a schematic diagram for explaining an early adopter index, a price sensitive index, a limited product purchase index, a health-related product purchase index, and a premium product purchase index. 優待日購入指数及び給料日後購入指数を説明するための模式図である。It is a schematic diagram for demonstrating the preferential day purchase index and the payday after-payment purchase index. 指数推定部による指数推定処理の模式図である。It is a schematic diagram of the exponential estimation processing by the exponential estimation part. 実施形態に係るデータ処理システムが実行するグループ指数出力処理のフローチャートを示す図である。It is a figure which shows the flowchart of the group index output processing executed by the data processing system which concerns on embodiment. グループ生成部がグループを生成する方法の模式図である。It is a schematic diagram of the method in which a group generation part generates a group. 指数一覧画面を表示している情報端末の正面図である。It is a front view of the information terminal which displays the index list screen. 指数分布画面を表示している情報端末の正面図である。It is a front view of the information terminal which displays the exponential distribution screen.

[データ処理システムSの概要]
図1は、本実施形態に係るデータ処理システムS(情報処理システム)の模式図である。データ処理システムSは、データ処理装置1(情報処理装置)と、情報端末2とを含む。データ処理システムSは、その他のサーバ、端末等の機器を含んでもよい。
[Overview of data processing system S]
FIG. 1 is a schematic diagram of a data processing system S (information processing system) according to the present embodiment. The data processing system S includes a data processing device 1 (information processing device) and an information terminal 2. The data processing system S may include other devices such as servers and terminals.

データ処理装置1は、顧客の購買データに基づいて、顧客の購買行動を分析可能にするための情報を出力するコンピュータである。データ処理装置1は、インターネット、ローカルエリアネットワーク等のネットワークを介して、情報端末2と通信可能である。 The data processing device 1 is a computer that outputs information for making it possible to analyze a customer's purchasing behavior based on the customer's purchasing data. The data processing device 1 can communicate with the information terminal 2 via a network such as the Internet or a local area network.

情報端末2は、データ処理装置1によって出力された情報を表示するコンピュータである。情報端末2は、例えばスマートフォン、タブレット端末等の携帯端末、又はパーソナルコンピュータである。情報端末2は、情報を表示するための液晶ディスプレイ等の表示部を有する。 The information terminal 2 is a computer that displays information output by the data processing device 1. The information terminal 2 is, for example, a mobile terminal such as a smartphone or a tablet terminal, or a personal computer. The information terminal 2 has a display unit such as a liquid crystal display for displaying information.

本実施形態に係るデータ処理システムSが購買データに基づいて顧客の購買行動を分析可能にするための情報を出力する処理の概要を以下に説明する。データ処理装置1は、顧客の属性を示す顧客属性データと、顧客による商品の購入に関する情報を示す購買データとを、記憶部に予め記憶している。商品は、顧客が購入する物品及びサービスを含む。顧客属性データは、例えば顧客の性別、年齢、居住地等を含む。購買データは、例えば商品を識別可能な情報(商品ID)、購入日、購入金額等を含む。データ処理装置1は、1つ又は複数の提供元から、顧客属性データ及び購買データを取得して記憶部に記憶させる。 The outline of the process in which the data processing system S according to the present embodiment outputs information for enabling the analysis of the customer's purchasing behavior based on the purchasing data will be described below. The data processing device 1 stores in advance customer attribute data indicating the attributes of the customer and purchase data indicating information regarding the purchase of the product by the customer in the storage unit. Goods include goods and services purchased by customers. The customer attribute data includes, for example, the customer's gender, age, place of residence, and the like. The purchase data includes, for example, information that can identify the product (product ID), a purchase date, a purchase price, and the like. The data processing device 1 acquires customer attribute data and purchase data from one or more providers and stores them in a storage unit.

データ処理装置1は、記憶部に記憶された購買データに基づいて、顧客の購買傾向を示す指数を、顧客ごとに算出する。指数は、後述するアーリーアダプター指数、価格センシティブ指数、限定商品購入指数、健康関連商品購入指数、プレミアム商品購入指数、優待日購入指数及び給料日後購入指数のうち少なくとも1つであり、顧客が商品を購買する傾向の指標となる値である。 The data processing device 1 calculates an index indicating a customer's purchasing tendency for each customer based on the purchasing data stored in the storage unit. The index is at least one of the early adopter index, price sensitive index, limited product purchase index, health-related product purchase index, premium product purchase index, preferential day purchase index, and payday purchase index, which will be described later, and the customer purchases the product. It is a value that is an indicator of purchasing tendency.

また、データ処理装置1は、記憶部に記憶された顧客属性データを用いて顧客を分類することによって、又は顧客ごとに算出した複数の指数の組み合わせに基づいて顧客を分類することによって、それぞれ1人以上の顧客を含む一以上のグループを生成する。そしてデータ処理装置1は、グループに属する1人以上の顧客の指数に関する統計量を、該グループ指数として算出する。 Further, the data processing device 1 classifies the customers by using the customer attribute data stored in the storage unit, or by classifying the customers based on the combination of a plurality of indexes calculated for each customer. Generate one or more groups that contain more than one customer. Then, the data processing device 1 calculates a statistic regarding the index of one or more customers belonging to the group as the group index.

データ処理装置1は、算出したグループ指数を、グループと関連付けて表示するための情報を情報端末2へ送信する。データ処理装置1は、これに限られず、プリンタを用いて紙に印刷すること、記憶媒体に記憶すること、又は通信により外部へ送信することによって、グループ指数を出力してもよい。 The data processing device 1 transmits information for displaying the calculated group index in association with the group to the information terminal 2. The data processing device 1 is not limited to this, and may output the group index by printing on paper using a printer, storing in a storage medium, or transmitting to the outside by communication.

このように本実施形態に係るデータ処理システムSは、顧客の購買傾向を示す指数を顧客のグループごとに統計化したグループ指数を出力する。そのため、データ処理システムSを利用するユーザ(分析者)は、グループ指数を参照することによって、顧客のグループごとに購買傾向を把握し、顧客の購買行動を効率的に分析できる。 As described above, the data processing system S according to the present embodiment outputs a group index in which the index indicating the customer's purchasing tendency is statistic for each customer group. Therefore, the user (analyst) who uses the data processing system S can grasp the purchasing tendency for each group of customers by referring to the group index, and can efficiently analyze the purchasing behavior of the customers.

[データ処理システムSの構成]
図2は、本実施形態に係るデータ処理システムSのブロック図である。図2において、矢印は主なデータの流れを示しており、図2に示したもの以外のデータの流れがあってよい。図2において、各ブロックはハードウェア(装置)単位の構成ではなく、機能単位の構成を示している。そのため、図2に示すブロックは単一の装置内に実装されてよく、あるいは複数の装置内に分かれて実装されてよい。ブロック間のデータの授受は、データバス、ネットワーク、可搬記憶媒体等、任意の手段を介して行われてよい。
[Configuration of data processing system S]
FIG. 2 is a block diagram of the data processing system S according to the present embodiment. In FIG. 2, the arrows indicate the main data flows, and there may be data flows other than those shown in FIG. In FIG. 2, each block shows not a hardware (device) unit configuration but a functional unit configuration. Therefore, the block shown in FIG. 2 may be mounted in a single device, or may be mounted separately in a plurality of devices. Data can be exchanged between blocks via any means such as a data bus, a network, or a portable storage medium.

データ処理装置1は、制御部11と、記憶部12とを有する。制御部11は、データ取得部111と、指数算出部112と、指数推定部113と、グループ生成部114と、グループ指数算出部115と、出力部116とを有する。記憶部12は、購買データ記憶部121と、商品データ記憶部122と、顧客属性データ記憶部123と、算出結果記憶部124とを有する。 The data processing device 1 has a control unit 11 and a storage unit 12. The control unit 11 includes a data acquisition unit 111, an index calculation unit 112, an index estimation unit 113, a group generation unit 114, a group index calculation unit 115, and an output unit 116. The storage unit 12 includes a purchase data storage unit 121, a product data storage unit 122, a customer attribute data storage unit 123, and a calculation result storage unit 124.

記憶部12は、ROM(Read Only Memory)、RAM(Random Access Memory)、ハードディスクドライブ等を含む記憶媒体である。記憶部12は、制御部11が実行するプログラムを予め記憶している。記憶部12は、データ処理装置1の外部に設けられてもよく、その場合にネットワークを介して制御部11との間でデータの授受を行ってもよい。 The storage unit 12 is a storage medium including a ROM (Read Only Memory), a RAM (Random Access Memory), a hard disk drive, and the like. The storage unit 12 stores in advance the program executed by the control unit 11. The storage unit 12 may be provided outside the data processing device 1, and in that case, data may be exchanged with the control unit 11 via a network.

購買データ記憶部121は、購買データを記憶する。商品データ記憶部122は、商品データを記憶する。顧客属性データ記憶部123は、顧客属性データを記憶する。算出結果記憶部124は、データ処理装置1による指数及びグループ指数の算出結果を記憶する。購買データ記憶部121、商品データ記憶部122、顧客属性データ記憶部123及び算出結果記憶部124は、それぞれ記憶部12上の記憶領域であってもよく、あるいは記憶部12上で構成されたデータベースであってもよい。 The purchase data storage unit 121 stores purchase data. The product data storage unit 122 stores the product data. The customer attribute data storage unit 123 stores customer attribute data. The calculation result storage unit 124 stores the calculation results of the index and the group index by the data processing device 1. The purchase data storage unit 121, the product data storage unit 122, the customer attribute data storage unit 123, and the calculation result storage unit 124 may each be a storage area on the storage unit 12, or a database configured on the storage unit 12. It may be.

制御部11は、例えばCPU(Central Processing Unit)等のプロセッサであり、記憶部12に記憶されたプログラムを実行することにより、データ取得部111、指数算出部112、指数推定部113、グループ生成部114、グループ指数算出部115及び出力部116として機能する。制御部11の機能の少なくとも一部は電気回路によって実行されてもよい。また、制御部11の機能の少なくとも一部はネットワーク経由で実行されるプログラムによって実行されてもよい。 The control unit 11 is, for example, a processor such as a CPU (Central Processing Unit), and by executing a program stored in the storage unit 12, the data acquisition unit 111, the index calculation unit 112, the index estimation unit 113, and the group generation unit It functions as 114, a group index calculation unit 115, and an output unit 116. At least a part of the function of the control unit 11 may be executed by an electric circuit. Further, at least a part of the functions of the control unit 11 may be executed by a program executed via the network.

本実施形態に係るデータ処理システムSは、図2に示す具体的な構成に限定されない。データ処理装置1及び情報端末2は、それぞれ2つ以上の物理的に分離した装置が有線又は無線で接続されることにより構成されてもよい。 The data processing system S according to the present embodiment is not limited to the specific configuration shown in FIG. The data processing device 1 and the information terminal 2 may be configured by connecting two or more physically separated devices, respectively, by wire or wirelessly.

[データ処理方法の説明]
以下、本実施形態に係るデータ処理システムSが実行するデータ処理方法を詳細に説明する。データ処理装置1において、購買データ記憶部121は、顧客による商品の購入に関する情報を示す購買データを予め記憶している。商品データ記憶部122は、商品に関する情報を示す商品データを予め記憶している。顧客属性データ記憶部123は、顧客の属性を示す顧客属性データを予め記憶している。
[Explanation of data processing method]
Hereinafter, the data processing method executed by the data processing system S according to the present embodiment will be described in detail. In the data processing device 1, the purchase data storage unit 121 stores in advance purchase data indicating information regarding the purchase of goods by the customer. The product data storage unit 122 stores in advance product data indicating information about the product. The customer attribute data storage unit 123 stores in advance customer attribute data indicating customer attributes.

図3(a)は、購買データ記憶部121が記憶する購買データD1の模式図である。図3(b)は、商品データ記憶部122が記憶する商品データD2の模式図である。図3(c)は、顧客属性データ記憶部123が記憶する顧客属性データD3の模式図である。 FIG. 3A is a schematic diagram of the purchase data D1 stored in the purchase data storage unit 121. FIG. 3B is a schematic diagram of the product data D2 stored in the product data storage unit 122. FIG. 3C is a schematic diagram of the customer attribute data D3 stored in the customer attribute data storage unit 123.

購買データD1は、互いに関連付けられた、購買ID(購買識別情報)と、顧客ID(顧客識別情報)と、商品ID(商品識別情報)と、購入日と、購入金額とを含む。購買データD1は、例えば店舗において記録されたレシート情報、商品代金の決済時にクレジットカード事業者において記録されたクレジットカード決済情報、又は商品代金の決済時に電子決済事業者において記録された電子決済情報である。購買データD1は、さらに顧客が購買を行った店舗を識別するための店舗ID(店舗識別情報)を含んでもよい。本明細書において、店舗は、現実世界において商品を販売している実店舗と、EC(Electronic Commerce)サイト等の仮想的な店舗との両方を含む。 The purchase data D1 includes a purchase ID (purchase identification information), a customer ID (customer identification information), a product ID (product identification information), a purchase date, and a purchase amount associated with each other. The purchase data D1 is, for example, receipt information recorded at a store, credit card payment information recorded by a credit card business operator at the time of payment of a product price, or electronic payment information recorded by an electronic payment business operator at the time of payment of a product price. is there. The purchase data D1 may further include a store ID (store identification information) for identifying the store where the customer made a purchase. In the present specification, the store includes both a physical store that sells products in the real world and a virtual store such as an EC (Electronic Commerce) site.

購買IDは、1回の購買を識別するための識別情報である。購買IDは、データ処理装置1によって自動的に購買に割り振られてもよく、あるいはデータの提供元によって購買に割り振られてもよい。顧客IDは、購買を行った顧客を識別するための識別情報であり、例えば顧客の会員番号、又は顧客に対して自動的に割り当てられた識別番号である。 The purchase ID is identification information for identifying one purchase. The purchase ID may be automatically assigned to the purchase by the data processing device 1 or may be assigned to the purchase by the data provider. The customer ID is identification information for identifying the customer who made the purchase, for example, a customer membership number or an identification number automatically assigned to the customer.

商品IDは、顧客が購入した商品を識別するための識別情報であり、例えば商品ごとに割り振られた商品コード、又は商品の品目(種類)を示す品目コードである。商品は、例えば小売店で顧客が購入する物品、又はスポーツクラブ、旅行会社、保険会社等で顧客が契約するサービス(プラン)である。購買データD1において、1つの購買IDに、複数の商品IDが関連付けられてもよい。 The product ID is identification information for identifying a product purchased by a customer, and is, for example, a product code assigned to each product or an item code indicating an item (type) of the product. A product is, for example, an article purchased by a customer at a retail store, or a service (plan) contracted by a customer at a sports club, a travel agency, an insurance company, or the like. In the purchase data D1, a plurality of product IDs may be associated with one purchase ID.

購入日は、顧客が商品を購入した日付である。購入日は、商品に関する契約を行った日付であってもよい。購入日は、日付だけでなく時刻を含んでもよい。購入金額は、顧客が商品を購入するために支払った金額である。購入金額は、商品ごとの金額であってもよく、あるいは複数の商品の合計金額であってもよい。 The purchase date is the date on which the customer purchased the item. The purchase date may be the date on which the contract for the product is made. The purchase date may include the time as well as the date. The purchase price is the price paid by the customer to purchase the goods. The purchase price may be the price of each product or the total price of a plurality of products.

商品データD2は、互いに関連付けられた、商品IDと、発売日と、終売日と、通常価格と、商品説明とを含む。商品IDは、購買データD1の商品IDと同様である。発売日は、商品が発売された日付である。終売日は、商品の販売が終了した日付である。通常価格は、商品が販売される際の通常の価格(例えば定価)である。商品データD2の通常価格は、値引き等により、購買データD1の購入金額とは異なり得る。商品説明は、商品の属性を示す文字列である。商品説明は、商品の名称であってもよく、あるいは商品の説明文であってもよい。 The product data D2 includes a product ID, a release date, a sold-out date, a normal price, and a product description associated with each other. The product ID is the same as the product ID of the purchase data D1. The release date is the date on which the product was released. The end-of-sale date is the date when the sale of the product ends. The normal price is a normal price (for example, a fixed price) when a product is sold. The normal price of the product data D2 may be different from the purchase price of the purchase data D1 due to a discount or the like. The product description is a character string indicating the attributes of the product. The product description may be the name of the product or the description of the product.

顧客属性データD3は、顧客IDと、性別と、年齢と、居住地とを含む。顧客IDは、購買データD1の顧客IDと同様である。性別は、顧客の性別である。年齢は、顧客の年齢である。顧客属性データD3の年齢には、年齢に代えて年齢層が設定されてもよい。居住地は、顧客が居住する場所である。居住地の粒度は任意に定められ、都道府県を含んでもよく、町丁目を含んでもよく、あるいは住居番号を含んでもよい。顧客属性データD3は、顧客自身によって登録された情報であってもよく、あるいは顧客の外観や店舗の場所から推定された情報であってもよい。 The customer attribute data D3 includes a customer ID, a gender, an age, and a place of residence. The customer ID is the same as the customer ID of the purchase data D1. Gender is the gender of the customer. Age is the age of the customer. For the age of the customer attribute data D3, an age group may be set instead of the age. The place of residence is the place where the customer resides. The particle size of the place of residence is arbitrarily determined and may include prefectures, towns and streets, or house numbers. The customer attribute data D3 may be information registered by the customer himself / herself, or may be information estimated from the appearance of the customer or the location of the store.

図3(a)〜図3(c)において購買データD1、商品データD2及び顧客属性データD3は視認性のために文字列の表で表されているが、各データは任意の形式で記録されてもよく、例えば文字列データ、数値データおよびバイナリデータのいずれでもよい。購買データD1、商品データD2及び顧客属性データD3は、データベースとして記録されてもよく、あるいはデータを列挙したリストとして記録されてもよい。 In FIGS. 3A to 3C, the purchase data D1, the product data D2, and the customer attribute data D3 are represented by a character string table for visibility, but each data is recorded in an arbitrary format. It may be, for example, any of character string data, numerical data and binary data. The purchase data D1, the product data D2, and the customer attribute data D3 may be recorded as a database, or may be recorded as a list listing the data.

図3(a)〜図3(c)に示す購買データD1、商品データD2及び顧客属性データD3が含むデータは一例であり、一部の情報を含まなくてもよく、その他の情報を含んでもよい。購買データD1、商品データD2及び顧客属性データD3のうち2つ以上が予め結合され、1つのデータとして記憶部12に記憶されてもよい。その場合に、以下では結合されたデータのうち、購買データD1に対応する部分を購買データと呼び、商品データD2に対応する部分を商品データと呼び、顧客属性データD3に対応する部分を顧客属性データと呼ぶ。 The data included in the purchase data D1, the product data D2, and the customer attribute data D3 shown in FIGS. 3 (a) to 3 (c) is an example, and may not include some information or may include other information. Good. Two or more of the purchase data D1, the product data D2, and the customer attribute data D3 may be combined in advance and stored in the storage unit 12 as one data. In that case, in the following, of the combined data, the part corresponding to the purchase data D1 is called the purchase data, the part corresponding to the product data D2 is called the product data, and the part corresponding to the customer attribute data D3 is called the customer attribute. Called data.

図4は、本実施形態に係るデータ処理システムSが実行するデータ処理方法全体のフローチャートを示す図である。図4のフローチャートは、例えばデータ処理装置1において所定の開始操作が行われることによって開始される。まずデータ処理装置1は、購買データに基づいて顧客の購買傾向を示す指数を顧客ごとに算出する指数算出処理を行う(S1)。 FIG. 4 is a diagram showing a flowchart of the entire data processing method executed by the data processing system S according to the present embodiment. The flowchart of FIG. 4 is started by, for example, performing a predetermined start operation in the data processing device 1. First, the data processing device 1 performs an index calculation process for calculating an index indicating a customer's purchasing tendency for each customer based on the purchase data (S1).

次にデータ処理装置1は、1人以上の顧客を含むグループについて、指数算出処理で算出された指数に関する統計量を算出し、グループ指数として出力するグループ指数出力処理を行う(S2)。以下では図5〜図12を用いて、指数算出処理及びグループ指数出力処理を詳細に説明する。 Next, the data processing device 1 performs a group index output process of calculating a statistic related to the index calculated by the index calculation process and outputting it as a group index for a group including one or more customers (S2). Hereinafter, the index calculation process and the group index output process will be described in detail with reference to FIGS. 5 to 12.

図5は、本実施形態に係るデータ処理システムSが実行する指数算出処理S1のフローチャートを示す図である。指数算出処理S1は、購買データ記憶部121に購買データが記憶されている複数の顧客それぞれを対象として行われる。まずデータ取得部111は、指数算出の対象とする1人の顧客の顧客IDに関連付けられた1つ又は複数の購買データを、購買データ記憶部121から取得する(S11)。また、データ取得部111は、該顧客IDに関連付けられた顧客属性データを、顧客属性データ記憶部123から取得する。データ取得部111は、ユーザによって指定された期間内の購入日を含む購買データのみを取得してもよい。 FIG. 5 is a diagram showing a flowchart of the index calculation process S1 executed by the data processing system S according to the present embodiment. The index calculation process S1 is performed for each of a plurality of customers whose purchase data is stored in the purchase data storage unit 121. First, the data acquisition unit 111 acquires one or more purchase data associated with the customer ID of one customer whose index is to be calculated from the purchase data storage unit 121 (S11). Further, the data acquisition unit 111 acquires the customer attribute data associated with the customer ID from the customer attribute data storage unit 123. The data acquisition unit 111 may acquire only the purchase data including the purchase date within the period specified by the user.

次にデータ取得部111は、購買データが含む商品IDの商品の、店舗による販売に関する情報を示す販売データを特定する(S12)。販売データは、後述の各指数の算出のために用いられる情報であり、商品の発売日、終売日、通常価格及び商品属性を含む。販売データを特定するために、データ取得部111は、商品データ記憶部122において、購買データが含む商品IDに関連付けられた商品データが含む発売日、終売日、通常価格及び商品説明を取得する。 Next, the data acquisition unit 111 specifies sales data indicating information regarding sales by the store of the product with the product ID included in the purchase data (S12). The sales data is information used for calculating each index described later, and includes a product release date, a sale date, a normal price, and a product attribute. In order to specify the sales data, the data acquisition unit 111 acquires the release date, the end date, the normal price, and the product description included in the product data associated with the product ID included in the purchase data in the product data storage unit 122. ..

商品データが発売日を含まない場合に、データ取得部111は、購買データ記憶部121において1つの商品IDに関連付けられた全ての購買データの中で、最も早い購入日を発売日として決定してもよい。商品データが終売日を含まない場合に、データ取得部111は、購買データ記憶部121において1つの商品IDに関連付けられた全ての購買データの中で、最も遅い購入日を終売日として決定してもよい。商品データが通常価格を含まない場合に、データ取得部111は、購買データ記憶部121において1つの商品IDに関連付けられた全ての購買データの中で、購入金額の最頻値を通常価格として決定してもよい。 When the product data does not include the release date, the data acquisition unit 111 determines the earliest purchase date as the release date among all the purchase data associated with one product ID in the purchase data storage unit 121. May be good. When the product data does not include the end date, the data acquisition unit 111 determines the latest purchase date as the end date among all the purchase data associated with one product ID in the purchase data storage unit 121. You may. When the product data does not include the normal price, the data acquisition unit 111 determines the mode of the purchase price as the normal price among all the purchase data associated with one product ID in the purchase data storage unit 121. You may.

また、データ取得部111は、購買データが含む商品IDの商品の属性を示す商品属性を決定する。具体的には、データ取得部111は、商品の発売日から終売日までの時間が所定値以内(例えば1年以内)である場合に、商品の商品属性を限定商品と決定する。データ取得部111は、商品の通常価格が同じ種類の商品の平均価格に比べて所定割合以上高い場合に、商品の商品属性をプレミアム商品と決定する。この場合には、商品データは、商品の種類(品目)を含む。データ取得部111は、購買データが含む商品IDの商品の種類を商品データから特定し、購買データ記憶部121において、特定した種類の商品の全ての購買データを抽出し、抽出した購買データが含む購入金額の平均値を、平均価格として算出する。商品の種類ごとの平均価格は、記憶部12に予め記憶されてもよい。 In addition, the data acquisition unit 111 determines the product attribute indicating the product attribute of the product ID included in the purchase data. Specifically, the data acquisition unit 111 determines the product attribute of the product as a limited product when the time from the release date of the product to the end date is within a predetermined value (for example, within one year). The data acquisition unit 111 determines the product attribute of the product as a premium product when the normal price of the product is higher than the average price of the products of the same type by a predetermined ratio or more. In this case, the product data includes the product type (item). The data acquisition unit 111 specifies the product type of the product ID included in the purchase data from the product data, the purchase data storage unit 121 extracts all the purchase data of the specified type of product, and the extracted purchase data includes the product type. The average purchase price is calculated as the average price. The average price for each type of product may be stored in advance in the storage unit 12.

データ取得部111は、商品の商品説明が健康に関する所定のキーワード(例えば「グルコサミン」、「青汁」等)を含む場合に、商品の商品属性を健康関連商品と決定する。データ取得部111は、記憶部12において購買データが含む商品IDに予め関連付けられた商品属性を取得してもよい。データ取得部111は、上述のように取得した発売日、終売日、通常価格及び商品説明を、販売データとして特定する。 The data acquisition unit 111 determines the product attribute of the product as a health-related product when the product description of the product includes a predetermined keyword related to health (for example, "glucosamine", "green juice", etc.). The data acquisition unit 111 may acquire the product attribute associated with the product ID included in the purchase data in the storage unit 12. The data acquisition unit 111 specifies the release date, the end date, the normal price, and the product description acquired as described above as sales data.

また、データ取得部111は、指数の算出に用いられる基準日を特定する(S13)。基準日は、店舗の優待日(例えばポイントアップ日や割引日)と、顧客の給料日(給与支給日)とを含む。データ取得部111は、購買データの取得元に基づいて優待日を特定してもよく、あるいは記憶部12において購買データが含む店舗IDに予め関連付けられた優待日を取得してもよい。データ取得部111は、予め設定された一般的な給料日(例えば毎月25日)を特定してもよく、あるいは記憶部12において購買データが含む顧客IDに予め関連付けられた給料日を取得してもよい。 Further, the data acquisition unit 111 specifies a reference date used for calculating the index (S13). The base date includes a store preferential date (for example, a point-up date or a discount date) and a customer's payday (salary payment date). The data acquisition unit 111 may specify the preferential date based on the acquisition source of the purchase data, or the storage unit 12 may acquire the preferential date associated with the store ID included in the purchase data in advance. The data acquisition unit 111 may specify a preset general payday (for example, the 25th of every month), or the storage unit 12 acquires the payday associated with the customer ID included in the purchase data in advance. May be good.

次に指数算出部112は、データ取得部111が購買データ記憶部121から取得した購買データに基づいて、顧客の購買傾向を示す指数を顧客ごとに算出する。指数算出部112は、1人の顧客について、以下に説明する複数の指数のうち、1つの指数を算出してもよく、異なる複数の指数を算出してもよい。すなわち、図5のフローチャートにおいて、ステップS14〜S18のうち、算出対象の指数に対応するステップが行われる。また、ステップS14〜S18の順序は変更されてもよく、ステップS14〜S18のうち少なくとも一部が並行して行われてもよい。 Next, the index calculation unit 112 calculates an index indicating the customer's purchasing tendency for each customer based on the purchase data acquired by the data acquisition unit 111 from the purchase data storage unit 121. The index calculation unit 112 may calculate one index among the plurality of indexes described below for one customer, or may calculate a plurality of different indexes. That is, in the flowchart of FIG. 5, of steps S14 to S18, the step corresponding to the index to be calculated is performed. Further, the order of steps S14 to S18 may be changed, and at least a part of steps S14 to S18 may be performed in parallel.

第1に、指数算出部112は、販売データと購買データとの間の関係に基づいて、アーリーアダプター指数、価格センシティブ指数、限定商品購入指数、健康関連商品購入指数、及びプレミアム商品購入指数を算出する。 First, the index calculation unit 112 calculates the early adopter index, the price sensitive index, the limited product purchase index, the health-related product purchase index, and the premium product purchase index based on the relationship between the sales data and the purchase data. To do.

図6(a)は、アーリーアダプター指数を説明するための模式図である。指数算出部112は、販売データが含む商品の発売日から購買データが含む商品の購入日までの経過時間を用いて、アーリーアダプター指数を算出する(S14)。具体的には、指数算出部112は、購買データ記憶部121から、データ取得部111が取得した購入データ(すなわち指数算出の対象の1人の顧客の購入データ)が含む商品IDに関連付けられた、商品の発売日から所定期間内(例えば1年以内)の購入日を含む購入データ(すなわち全ての顧客の購入データ)を取得する。 FIG. 6A is a schematic diagram for explaining the early adopter index. The index calculation unit 112 calculates an early adopter index using the elapsed time from the release date of the product included in the sales data to the purchase date of the product included in the purchase data (S14). Specifically, the index calculation unit 112 is associated with the product ID included in the purchase data acquired by the data acquisition unit 111 (that is, the purchase data of one customer whose index is calculated) from the purchase data storage unit 121. , Acquire purchase data (that is, purchase data of all customers) including a purchase date within a predetermined period (for example, within one year) from the release date of the product.

次に指数算出部112は、取得した全ての顧客の購入データを、商品の発売日から購入日までの経過時間が短い順に並べる。指数算出部112は、経過時間が短い順に購入データの累計件数をカウントし、全ての顧客の購入データの全件数に対する累計件数の割合が所定値以内(例えば16%以内)の購入データを、早期購入の購入データとして特定する。このような早期購入の購買データは、イノベーター理論におけるイノベーター及びアーリーアダプターに対応しており、商品の購入が早い順に所定割合の購買データを示している。 Next, the index calculation unit 112 arranges the acquired purchase data of all the customers in ascending order of the elapsed time from the release date of the product to the purchase date. The index calculation unit 112 counts the cumulative number of purchase data in ascending order of elapsed time, and early purchase data in which the ratio of the cumulative number to the total number of purchase data of all customers is within a predetermined value (for example, within 16%). Identify as purchase data for the purchase. Such early purchase purchase data corresponds to innovators and early adopters in the innovator theory, and shows a predetermined percentage of purchase data in order of earliest purchase of goods.

次に指数算出部112は、データ取得部111が取得した1人の顧客の購買データが含む購入金額を合計した合計購入金額を算出する。また、指数算出部112は、該購買データの中で、上述の早期購入として特定された購買データを抽出する。指数算出部112は、抽出した早期購入の購買データが含む購入金額の合計値を、算出した合計購入金額で除算した割合を算出する。そして指数算出部112は、算出した割合を対数変換した上で偏差値化した値を、アーリーアダプター指数として算出する。指数算出部112は、算出した割合に対して、平方根変換した上で偏差値化すること等、その他の処理を行った値を、アーリーアダプター指数としてもよい。したがって、ユーザは、アーリーアダプター指数を参照することによって、顧客が新商品の発売時に早く購入する傾向にあるか否かを容易に把握できる。 Next, the index calculation unit 112 calculates the total purchase amount, which is the sum of the purchase amounts included in the purchase data of one customer acquired by the data acquisition unit 111. In addition, the index calculation unit 112 extracts the purchase data specified as the above-mentioned early purchase from the purchase data. The index calculation unit 112 calculates the ratio obtained by dividing the total value of the purchase amount included in the extracted early purchase purchase data by the calculated total purchase amount. Then, the index calculation unit 112 calculates the value obtained by logarithmically converting the calculated ratio and converting it into an early adopter index as an early adopter index. The index calculation unit 112 may use an early adopter index as a value obtained by performing other processing such as converting the calculated ratio into a deviation value after converting it to a square root. Therefore, by referring to the early adopter index, the user can easily grasp whether or not the customer tends to purchase early when the new product is launched.

図6(b)は、価格センシティブ指数を説明するための模式図である。指数算出部112は、販売データが含む商品の通常価格と、購買データが含む商品の購入価格との間の差を用いて、価格センシティブ指数を算出する(S15)。具体的には、指数算出部112は、データ取得部111が取得した1人の顧客の購買データが含む購入金額を合計した合計購入金額を算出する。また、指数算出部112は、該購買データそれぞれが含む商品IDの商品について、販売データが含む商品の通常価格から、該購買データが含む購入金額を減算した値引き金額を算出する。指数算出部112は、算出した値引き金額の合計値を、算出した合計購入金額で除算した割合を算出する。 FIG. 6B is a schematic diagram for explaining the price-sensitive index. The index calculation unit 112 calculates the price-sensitive index by using the difference between the normal price of the product included in the sales data and the purchase price of the product included in the purchase data (S15). Specifically, the index calculation unit 112 calculates the total purchase amount, which is the sum of the purchase amounts included in the purchase data of one customer acquired by the data acquisition unit 111. In addition, the index calculation unit 112 calculates a discount amount obtained by subtracting the purchase amount included in the purchase data from the normal price of the product included in the sales data for the product with the product ID included in each of the purchase data. The index calculation unit 112 calculates the ratio obtained by dividing the total value of the calculated discount amounts by the calculated total purchase amount.

そして指数算出部112は、算出した割合を対数変換した上で偏差値化した値を、価格センシティブ指数として算出する。指数算出部112は、算出した割合に対して、平方根変換した上で偏差値化すること等、その他の処理を行った値を、価格センシティブ指数としてもよい。したがって、ユーザは、価格センシティブ指数を参照することによって、顧客が値引きされた商品を購入する傾向にあるか否かを容易に把握できる。 Then, the index calculation unit 112 calculates a value obtained by logarithmically converting the calculated ratio and converting it into a deviation value as a price-sensitive index. The index calculation unit 112 may use a value that has undergone other processing, such as converting the calculated ratio into a deviation value after performing square root conversion, as a price-sensitive index. Therefore, the user can easily grasp whether or not the customer tends to purchase the discounted product by referring to the price sensitive index.

図6(c)は、限定商品購入指数、健康関連商品購入指数及びプレミアム商品購入指数を説明するための模式図である。指数算出部112は、購買データが含む商品IDの商品の中で、販売データに基づいて特定の属性を有する特定属性商品を抽出し、特定属性商品の購入金額を用いて、限定商品購入指数、健康関連商品購入指数及びプレミアム商品購入指数を算出する(S16)。 FIG. 6C is a schematic diagram for explaining a limited product purchase index, a health-related product purchase index, and a premium product purchase index. The index calculation unit 112 extracts a specific attribute product having a specific attribute from the products with the product ID included in the purchase data based on the sales data, and uses the purchase price of the specific attribute product to obtain a limited product purchase index. The health-related product purchase index and the premium product purchase index are calculated (S16).

具体的には、指数算出部112は、データ取得部111が取得した1人の顧客の購買データが含む購入金額を合計した合計購入金額を算出する。また、指数算出部112は、該購買データそれぞれが含む商品IDの商品の中で、販売データが含む商品属性が限定商品である商品を抽出する。指数算出部112は、抽出した限定商品の購入金額の合計値を、算出した合計購入金額で除算した割合を算出する。そして指数算出部112は、算出した割合を対数変換した上で偏差値化した値を、限定商品購入指数として算出する。指数算出部112は、算出した割合に対して、平方根変換した上で偏差値化すること等、その他の処理を行った値を、限定商品購入指数としてもよい。したがって、ユーザは、限定商品購入指数を参照することによって、顧客が販売期間又は販売数が限定された商品を購入する傾向にあるか否かを容易に把握できる。 Specifically, the index calculation unit 112 calculates the total purchase amount, which is the sum of the purchase amounts included in the purchase data of one customer acquired by the data acquisition unit 111. Further, the index calculation unit 112 extracts a product whose product attribute included in the sales data is a limited product from the products having the product ID included in each of the purchase data. The index calculation unit 112 calculates a ratio obtained by dividing the total purchase price of the extracted limited products by the calculated total purchase price. Then, the index calculation unit 112 calculates a value obtained by logarithmically converting the calculated ratio and converting it into a deviation value as a limited product purchase index. The index calculation unit 112 may use a value obtained by performing other processing such as converting the calculated ratio into a deviation value after converting it to a square root as a limited product purchase index. Therefore, the user can easily grasp whether or not the customer tends to purchase a product having a limited sales period or a limited number of sales by referring to the limited product purchase index.

また、指数算出部112は、該購買データそれぞれが含む商品IDの商品の中で、販売データが含む商品属性が健康関連商品である商品を抽出する。指数算出部112は、抽出した健康関連商品の購入金額の合計値を、算出した合計購入金額で除算した割合を算出する。そして指数算出部112は、算出した割合を対数変換した上で偏差値化した値を、健康関連商品購入指数として算出する。指数算出部112は、算出した割合に対して、平方根変換した上で偏差値化すること等、その他の処理を行った値を、健康関連商品購入指数としてもよい。したがって、ユーザは、健康関連商品購入指数を参照することによって、顧客が健康に関する商品を購入する傾向にあるか否かを容易に把握できる。 Further, the index calculation unit 112 extracts a product whose product attribute included in the sales data is a health-related product from the products having the product ID included in each of the purchase data. The index calculation unit 112 calculates a ratio obtained by dividing the total purchase price of the extracted health-related products by the calculated total purchase price. Then, the index calculation unit 112 calculates a value obtained by logarithmically converting the calculated ratio and converting it into a deviation value as a health-related product purchase index. The index calculation unit 112 may use a value obtained by performing other processing such as converting the calculated ratio into a deviation value after converting it to a square root as a health-related product purchase index. Therefore, the user can easily grasp whether or not the customer tends to purchase the health-related product by referring to the health-related product purchase index.

また、指数算出部112は、該購買データそれぞれが含む商品IDの商品の中で、販売データが含む商品属性がプレミアム商品である商品を抽出する。指数算出部112は、抽出したプレミアム商品の購入金額の合計値を、算出した合計購入金額で除算した割合を算出する。そして指数算出部112は、算出した購入割合を対数変換した上で偏差値化した値を、プレミアム商品購入指数として算出する。指数算出部112は、算出した割合に対して、平方根変換した上で偏差値化すること等、その他の処理を行った値を、プレミアム商品購入指数としてもよい。したがって、ユーザは、プレミアム商品購入指数を参照することによって、顧客が同じ種類の商品の中で高級なプレミアム商品を購入する傾向にあるか否かを容易に把握できる。 Further, the index calculation unit 112 extracts a product whose product attribute included in the sales data is a premium product from the products having the product ID included in each of the purchase data. The index calculation unit 112 calculates the ratio of the total purchase price of the extracted premium products divided by the calculated total purchase price. Then, the index calculation unit 112 calculates the calculated purchase ratio as a premium product purchase index after logarithmically converting the value into a deviation value. The index calculation unit 112 may use a value obtained by performing other processing such as converting the calculated ratio into a deviation value after converting it to a square root as a premium product purchase index. Therefore, the user can easily grasp whether or not the customer tends to purchase a high-class premium product among the same type of products by referring to the premium product purchase index.

第2に、指数算出部112は、基準日と購入日との間の関係に基づいて、優待日購入指数及び給料日後購入指数を算出する。図7(a)は、優待日購入指数を説明するための模式図である。指数算出部112は、データ取得部111が特定した基準日が示す店舗の優待日と、購買データが含む商品の購入日との間の関係に基づいて、優待日購入指数を算出する(S17)。 Second, the index calculation unit 112 calculates the preferential day purchase index and the payday after-payment purchase index based on the relationship between the base date and the purchase date. FIG. 7A is a schematic diagram for explaining the preferential day purchase index. The index calculation unit 112 calculates the preferential day purchase index based on the relationship between the preferential date of the store indicated by the reference date specified by the data acquisition unit 111 and the purchase date of the product included in the purchase data (S17). ..

具体的には、指数算出部112は、データ取得部111が取得した1人の顧客の購買データが含む購入金額を合計した合計購入金額を算出する。また、指数算出部112は、該購買データの中で、基準日が示す優待日に購入日が含まれている購買データを抽出する。指数算出部112は、抽出した優待日の購買データが含む購入金額の合計値を、算出した合計購入金額で除算した割合を算出する。そして指数算出部112は、算出した割合を対数変換した上で偏差値化した値を、優待日購入指数として算出する。指数算出部112は、算出した割合に対して、平方根変換した上で偏差値化すること等、その他の処理を行った値を、優待日購入指数としてもよい。したがって、ユーザは、優待日購入指数を参照することによって、顧客がポイントアップ日や割引日等の優待日に商品を購入する傾向にあるか否かを容易に把握できる。 Specifically, the index calculation unit 112 calculates the total purchase amount, which is the sum of the purchase amounts included in the purchase data of one customer acquired by the data acquisition unit 111. Further, the index calculation unit 112 extracts the purchase data including the purchase date from the purchase data on the preferential date indicated by the base date. The index calculation unit 112 calculates a ratio obtained by dividing the total value of the purchase amount included in the extracted purchase data on the preferential day by the calculated total purchase amount. Then, the index calculation unit 112 calculates a value obtained by logarithmically converting the calculated ratio and converting it into a deviation value as a preferential day purchase index. The index calculation unit 112 may use a value obtained by performing other processing such as converting the calculated ratio into a deviation value after converting it to a square root as a preferential day purchase index. Therefore, the user can easily grasp whether or not the customer tends to purchase the product on the preferential day such as the point-up date or the discount date by referring to the preferential day purchase index.

図7(b)は、給料日後購入指数を説明するための模式図である。指数算出部112は、データ取得部111が特定した基準日が示す顧客の給料日と、購買データが含む商品の購入日との間の関係に基づいて、給料日後購入指数を算出する(S18)。 FIG. 7B is a schematic diagram for explaining the post-payday purchase index. The index calculation unit 112 calculates the post-payday purchase index based on the relationship between the customer's payday indicated by the reference date specified by the data acquisition unit 111 and the purchase date of the product included in the purchase data (S18). ..

具体的には、指数算出部112は、データ取得部111が取得した1人の顧客の購買データの中で、基準日が示す給料日より前の所定期間(例えば給料日前の1週間)に購入日が含まれている購買データを抽出する。また指数算出部112は、データ取得部111が取得した1人の顧客の購買データの中で、基準日が示す給料日より後の所定期間(例えば給料日後の1週間)に購入日が含まれている購買データを抽出する。指数算出部112は、抽出した給料日前の購買データが含む購入金額の合計値に対する、抽出した給料日後の購買データが含む購入金額の合計値の比率を算出する。そして指数算出部112は、算出した比率を平方根変換した上で偏差値化した値を、給料日後購入指数として算出する。指数算出部112は、算出した比率に対して、対数変換した上で偏差値化すること等、その他の処理を行った値を、給料日後購入指数としてもよい。したがって、ユーザは、給料日後購入指数を参照することによって、顧客が給料日の後に商品を多く購入する傾向にあるか否かを容易に把握できる。 Specifically, the index calculation unit 112 purchases in the purchase data of one customer acquired by the data acquisition unit 111 during a predetermined period (for example, one week before the payday) before the payday indicated by the base date. Extract purchase data that includes days. Further, the index calculation unit 112 includes the purchase date in a predetermined period (for example, one week after the payday) after the payday indicated by the base date in the purchase data of one customer acquired by the data acquisition unit 111. Extract purchasing data. The index calculation unit 112 calculates the ratio of the total value of the purchase amount included in the extracted purchase data after the payday to the total value of the purchase amount included in the extracted purchase data before the payday. Then, the index calculation unit 112 calculates a value obtained by converting the calculated ratio into a square root and converting it into a deviation value as a post-payday purchase index. The index calculation unit 112 may use a value that has undergone other processing, such as logarithmically converting the calculated ratio and then converting it into a deviation value, as a post-payday purchase index. Therefore, the user can easily grasp whether or not the customer tends to purchase more products after the payday by referring to the payday purchase index.

購買データ及び商品データは、データの提供元によって、図3(a)、図3(b)に示した情報の一部を含まない場合がある。このような場合に、指数算出部112は、上述のアーリーアダプター指数、価格センシティブ指数、限定商品購入指数、健康関連商品購入指数、及びプレミアム商品購入指数のうち一部の指数を算出できない。そこで指数推定部113は、指数算出部112が複数の指数のうち一部の指数を算出できない場合に、当該一部の指数以外の指数を用いて当該一部の指数を推定する(S19)。換言すると、複数の指数が含むそれぞれの指数について、購買データ及び商品データが当該指数を算出するための全ての情報を含む場合(すなわち、指数算出部112が当該指数を算出できる場合)に、指数算出部112は当該指数を算出し、指数推定部113は当該指数を推定しない。一方、複数の指数が含むそれぞれの指数について、購買データ及び商品データが当該指数を算出するための少なくとも一部の情報を含まない場合(すなわち、指数算出部112が当該指数を算出できない場合)に、指数算出部112は当該指数を算出せず、指数推定部113は当該指数を推定する。 The purchase data and the product data may not include a part of the information shown in FIGS. 3 (a) and 3 (b) depending on the data provider. In such a case, the index calculation unit 112 cannot calculate some of the above-mentioned early adopter index, price sensitive index, limited product purchase index, health-related product purchase index, and premium product purchase index. Therefore, when the index calculation unit 112 cannot calculate a part of the indexes among the plurality of indexes, the index estimation unit 113 estimates the part of the index by using an index other than the part of the index (S19). In other words, for each index contained in the plurality of indexes, when the purchase data and the product data include all the information for calculating the index (that is, when the index calculation unit 112 can calculate the index), the index The calculation unit 112 calculates the index, and the index estimation unit 113 does not estimate the index. On the other hand, for each index included in the plurality of indexes, when the purchase data and the product data do not include at least a part of information for calculating the index (that is, when the index calculation unit 112 cannot calculate the index). , The index calculation unit 112 does not calculate the index, and the index estimation unit 113 estimates the index.

図8は、指数推定部113による指数推定処理の模式図である。図8は、顧客の顧客属性データと、指数算出部112が該顧客に対して算出した複数の指数とを関連付けて表している。図8の例は、顧客IDがC001及びC002の顧客と、顧客IDがD001の顧客とのデータの提供元が異なっているため、指数算出部112は、顧客IDがD001の顧客について指数γが算出できない状態を表している。 FIG. 8 is a schematic diagram of the index estimation process by the index estimation unit 113. FIG. 8 shows the customer attribute data of the customer and the plurality of indexes calculated by the index calculation unit 112 for the customer in association with each other. In the example of FIG. 8, since the data providers of the customers whose customer IDs are C001 and C002 and the customers whose customer IDs are D001 are different, the index calculation unit 112 has an index γ for the customers whose customer IDs are D001. It represents a state that cannot be calculated.

指数推定部113は、顧客IDがD001の顧客と顧客属性データが類似している顧客IDがC001の顧客に対して算出された指数に基づいて、複数の指数の間の関係を示すモデルを生成する。顧客の顧客属性データが類似していることは、例えば顧客属性データ記憶部123に記憶されている顧客属性データの少なくとも一部が同一又は近似していることである。例えばモデルは、図8における指数α及び指数βが入力されることによって指数γを出力する数式である。モデルは、複数の顧客の指数を用いて生成されてもよい。モデルは、複数の顧客の複数の指数に基づいて予め生成されて記憶部12に記憶されてもよい。 The index estimation unit 113 generates a model showing the relationship between a plurality of indexes based on the index calculated for the customer whose customer ID is D001 and the customer whose customer ID is similar to the customer attribute data C001. To do. The similarity of the customer attribute data of the customer means that, for example, at least a part of the customer attribute data stored in the customer attribute data storage unit 123 is the same or similar. For example, the model is a mathematical formula that outputs the exponent γ by inputting the exponent α and the exponent β in FIG. The model may be generated using the indices of multiple customers. The model may be pre-generated and stored in the storage unit 12 based on a plurality of indices of the plurality of customers.

指数推定部113は、生成したモデルに、顧客IDがD001の顧客に対して指数算出部112が算出した指数α、βを入力することによって、指数算出部112が算出できなかった指数γを推定する。別の方法として、指数推定部113は、顧客IDがC001の顧客の指数α、βと、顧客IDがD001の顧客の指数α、βとの間の類似度(ユークリッド距離等)を算出し、算出した類似度を用いて顧客IDがC001の顧客の指数γから顧客IDがD001の顧客の指数γを推定してもよい。 The index estimation unit 113 estimates the index γ that the index calculation unit 112 could not calculate by inputting the indexes α and β calculated by the index calculation unit 112 into the generated model for the customer whose customer ID is D001. To do. Alternatively, the index estimation unit 113 calculates the degree of similarity (Euclidean distance, etc.) between the indexes α and β of the customer whose customer ID is C001 and the indexes α and β of the customer whose customer ID is D001. Using the calculated similarity, the index γ of the customer with the customer ID of D001 may be estimated from the index γ of the customer with the customer ID of C001.

これにより、データの提供元により一部の指数が算出できない場合であっても、指数推定部113が指数を推定し、以降の処理を行うことができる。指数算出部112及び指数推定部113は、算出した指数及び推定した指数を、顧客IDと関連付けて算出結果記憶部124に記憶させる。 As a result, even if a part of the index cannot be calculated by the data provider, the index estimation unit 113 can estimate the index and perform the subsequent processing. The index calculation unit 112 and the index estimation unit 113 store the calculated index and the estimated index in the calculation result storage unit 124 in association with the customer ID.

図9は、本実施形態に係るデータ処理システムSが実行するグループ指数出力処理S2のフローチャートを示す図である。グループ生成部114は、顧客を分類することによって、それぞれ1人以上の顧客を含む一以上のグループを生成する(S21)。 FIG. 9 is a diagram showing a flowchart of the group index output process S2 executed by the data processing system S according to the present embodiment. The group generation unit 114 generates one or more groups including one or more customers by classifying the customers (S21).

図10(a)、図10(b)は、グループ生成部114がグループを生成する方法の模式図である。グループ生成部114は、データ取得部111が顧客属性データ記憶部123から取得した顧客属性データを用いて、又は指数算出部112及び指数推定部113が算出及び推定した複数の指数の組み合わせを用いて、又はそれらの両方を用いて、顧客のグループを生成する。 10 (a) and 10 (b) are schematic views of a method in which the group generation unit 114 generates a group. The group generation unit 114 uses the customer attribute data acquired by the data acquisition unit 111 from the customer attribute data storage unit 123, or uses a combination of a plurality of indexes calculated and estimated by the index calculation unit 112 and the index estimation unit 113. , Or both of them to generate a group of customers.

図10(a)は、顧客属性データに基づいて生成されたグループG1を表している。グループ生成部114は、顧客属性データ記憶部123に記憶された顧客属性データが含む顧客の性別、年齢層及び居住地のうち少なくとも1つが共通する1人以上の顧客を含むグループG1を生成する。図10(a)の例では、グループ生成部114は、性別、年齢層及び居住地の全てが共通する顧客のグループG1を生成しているが、性別、年齢層及び居住地のうち一部のみが共通する顧客のグループG1を生成してもよい。 FIG. 10A shows the group G1 generated based on the customer attribute data. The group generation unit 114 generates a group G1 including one or more customers having at least one of the customer's gender, age group, and place of residence common to the customer attribute data stored in the customer attribute data storage unit 123. In the example of FIG. 10A, the group generation unit 114 generates a group G1 of customers having the same gender, age group, and place of residence, but only a part of the gender, age group, and place of residence. May generate a group G1 of customers in common.

このようにデータ処理装置1は、顧客属性データに基づいて顧客のグループG1を生成することによって、性別、年齢及び居住地等の顧客の属性ごとに顧客を分類し、顧客のグループごとに購買傾向を示す指数を出力できる。 In this way, the data processing device 1 generates the customer group G1 based on the customer attribute data, thereby classifying the customers according to the customer attributes such as gender, age, and place of residence, and the purchasing tendency for each customer group. Can output an index indicating.

図10(b)は、複数の指数の組み合わせに基づいて生成されたグループG2を表している。グループ生成部114は、指数算出部112又は指数推定部113が算出した複数の指数のうち、所定の2つ以上の指数(例えばアーリーアダプター指数及び価格センシティブ指数)の組み合わせが類似する1人以上の顧客を含むグループG2を生成する。例えばグループ生成部114は、顧客の複数の指数それぞれが所定の基準値以上であるか否かによって、顧客をいずれかのグループG2に分類する。図10(b)の例では、指数αが基準値以上であるか否か、及び指数βが基準値以上であるか否かの組み合わせごとに、グループG2が生成されている。 FIG. 10B represents a group G2 generated based on a combination of a plurality of indices. The group generation unit 114 is one or more persons having a similar combination of two or more predetermined indexes (for example, an early adopter index and a price sensitive index) among a plurality of indexes calculated by the index calculation unit 112 or the index estimation unit 113. Generate group G2 including customers. For example, the group generation unit 114 classifies a customer into one of the group G2 depending on whether or not each of the plurality of indexes of the customer is equal to or higher than a predetermined reference value. In the example of FIG. 10B, the group G2 is generated for each combination of whether or not the index α is equal to or greater than the reference value and whether or not the index β is equal to or greater than the reference value.

グループ生成部114は、ここに示した方法に限られず、複数の顧客の複数の指数に対して既知のクラスタリング処理を行うことによって、グループG2を生成してもよい。このようにデータ処理装置1は、複数の指数の組み合わせに基づいて顧客のグループG2を生成することによって、顧客を購買傾向(性格)ごとに分類し、さらに顧客のグループごとに購買傾向を示す指数を出力できる。 The group generation unit 114 is not limited to the method shown here, and may generate the group G2 by performing a known clustering process on a plurality of indices of a plurality of customers. In this way, the data processing device 1 classifies customers by purchasing tendency (personality) by generating a group G2 of customers based on a combination of a plurality of indexes, and further, an index showing a purchasing tendency for each group of customers. Can be output.

グループ生成部114は、生成したグループG1、G2それぞれに対して、グループを特定するためのグループ特定情報を付与する。グループ特定情報は、グループを生成するために用いた顧客属性データ又は指数の組み合わせを示す情報である。図10(a)の例ではグループG1のグループ特定情報は年齢、性別及び居住地であり、図10(b)の例ではグループG2のグループ特定情報は複数の指数の高低である。 The group generation unit 114 assigns group identification information for identifying the group to each of the generated groups G1 and G2. The group specific information is information indicating a combination of customer attribute data or an index used to generate a group. In the example of FIG. 10A, the group-specific information of group G1 is age, gender, and place of residence, and in the example of FIG. 10B, the group-specific information of group G2 is high or low of a plurality of indexes.

グループ指数算出部115は、グループ生成部114が生成した一以上のグループそれぞれに属する1人以上の顧客の指数に関する統計量を、該一以上のグループそれぞれのグループ指数として算出する(S22)。指数に関する統計量は、例えばグループに属する1人以上の顧客について指数算出部112が算出した指数の平均値、中央値、最頻値等である。 The group index calculation unit 115 calculates a statistic regarding the index of one or more customers belonging to each of the one or more groups generated by the group generation unit 114 as the group index of each of the one or more groups (S22). The statistics related to the index are, for example, the average value, the median value, the mode value, and the like of the index calculated by the index calculation unit 112 for one or more customers belonging to the group.

指数算出部112が異なる複数の指数を算出した場合に、グループ指数算出部115は、複数の指数それぞれについての統計量を、異なる複数のグループ指数として算出する。すなわち、グループ指数算出部115は、アーリーアダプター指数、価格センシティブ指数、限定商品購入指数、健康関連商品購入指数、プレミアム商品購入指数、優待日購入指数及び給料日後購入指数それぞれについて、グループごとにグループ指数を算出する。グループ指数算出部115は、算出したグループ指数を、グループ特定情報と関連付けて算出結果記憶部124に記憶させる。 When the index calculation unit 112 calculates a plurality of different indexes, the group index calculation unit 115 calculates the statistics for each of the plurality of indexes as a plurality of different group indexes. That is, the group index calculation unit 115 sets the group index for each group for each of the early adopter index, the price sensitive index, the limited product purchase index, the health-related product purchase index, the premium product purchase index, the preferential day purchase index, and the payday after-sales purchase index. Is calculated. The group index calculation unit 115 stores the calculated group index in the calculation result storage unit 124 in association with the group specific information.

出力部116は、グループ指数算出部115は算出したグループ指数を、グループ生成部114が生成した一以上のグループそれぞれと関連付けて出力する(S23)。具体的には、出力部116は、グループ指数とグループとを関連付けて表示するための表示情報を、情報端末2へ送信する。情報端末2は、データ処理装置1から受信した表示情報に従って、グループごとのグループ指数を示す指数一覧画面を表示部に表示させる。 The output unit 116 outputs the calculated group index by the group index calculation unit 115 in association with each of the one or more groups generated by the group generation unit 114 (S23). Specifically, the output unit 116 transmits the display information for displaying the group index and the group in association with each other to the information terminal 2. The information terminal 2 causes the display unit to display an index list screen showing the group index for each group according to the display information received from the data processing device 1.

図11は、指数一覧画面を表示している情報端末2の正面図である。指数一覧画面は、グループ(グループ特定情報)に関連付けられた、グループ指数21を含む。グループ指数21は、グループ指数算出部115がグループごとに算出した1つ又は複数のグループ指数を含む。ユーザは、指数一覧画面を参照することによって、性別、年齢及び居住地等の顧客属性データが類似する顧客のグループごと、又は複数の指数の組み合わせが類似する顧客のグループごとに購買傾向を把握し、顧客の購買行動を効率的に分析できる。 FIG. 11 is a front view of the information terminal 2 displaying the index list screen. The index list screen includes the group index 21 associated with the group (group specific information). The group index 21 includes one or a plurality of group indexes calculated for each group by the group index calculation unit 115. By referring to the index list screen, the user can grasp the purchasing tendency for each group of customers who have similar customer attribute data such as gender, age, and place of residence, or for each group of customers who have similar combinations of multiple indexes. , Can efficiently analyze customer purchasing behavior.

図11の例において、情報端末2は、グループとグループ指数とを関連付けた情報を表示しているが、顧客の顧客属性データと該顧客が属するグループとを関連付けた情報を表示してもよい。これにより、ユーザは、各顧客がいずれのグループに属するかを把握できる。 In the example of FIG. 11, the information terminal 2 displays the information associating the group with the group index, but may display the information associating the customer attribute data of the customer with the group to which the customer belongs. This allows the user to know which group each customer belongs to.

また、出力部116は、グループ指数と、グループ指数とは異なるグループに関する値との間の関係を表示するための表示情報を、情報端末2へ送信する。表示情報は、グループ指数及びグループに関する値の間の回帰直線(相関係数)と、グループごとのグループ指数及びグループに関する値とを含む。 Further, the output unit 116 transmits the display information for displaying the relationship between the group index and the value related to the group different from the group index to the information terminal 2. The display information includes a regression line (correlation coefficient) between the group index and the value related to the group, and the group index and the value related to the group for each group.

グループに関する値は、購買データとは別に収集され、記憶部12に予め記憶される。例えばグループに関する値は、グループごとの施策反応率であり、特定の商品や特定の店舗においてキャンペーン等の施策が行われた後の所定期間内に、グループ内で購買金額、購買頻度等が向上した顧客の比率である。情報端末2は、データ処理装置1から受信した表示情報に従って、グループ指数及びグループに関する値の関係を示す指数分布画面を表示部に表示させる。 The value related to the group is collected separately from the purchase data and stored in the storage unit 12 in advance. For example, the value related to a group is the measure response rate for each group, and the purchase amount, purchase frequency, etc. within the group have improved within a predetermined period after measures such as campaigns have been taken at a specific product or a specific store. The ratio of customers. The information terminal 2 causes the display unit to display an exponential distribution screen showing the relationship between the group index and the value related to the group according to the display information received from the data processing device 1.

図12は、指数分布画面を表示している情報端末2の正面図である。指数分布画面は、グループ指数及びグループに関する値の間の関係を示す2次元の平面22と、グループ指数及びグループに関する値の間の回帰直線23とを含む。さらに情報端末2は、平面22上でグループ指数及びグループに関する値の位置に、グループ24(グループ特定情報)を表示する。ユーザは、指数分布画面を参照することによって、グループ指数及びグループに関する値の関係をグループごとに容易に把握して分析できる。例えばユーザは、図12の指数分布画面を参照すると、XXX町一丁目の30代男性のグループに対して重点的に施策を行うことによって、効果的に施策への反応を得られる可能性があると判断できる。 FIG. 12 is a front view of the information terminal 2 displaying the exponential distribution screen. The exponential distribution screen includes a two-dimensional plane 22 showing the relationship between the group exponent and the values for the group, and a regression line 23 between the group exponent and the values for the group. Further, the information terminal 2 displays the group 24 (group specific information) at the position of the group index and the value related to the group on the plane 22. By referring to the exponential distribution screen, the user can easily grasp and analyze the relationship between the group index and the values related to the group for each group. For example, referring to the exponential distribution screen of FIG. 12, the user may be able to effectively obtain a response to the measure by focusing on the group of men in their thirties in 1-chome, XXX-cho. Can be judged.

出力部116は、情報端末2上の表示に限られず、プリンタを用いて紙に印刷すること、記憶媒体に記憶すること、又は通信により外部へ送信することによって、グループ指数を出力してもよい。 The output unit 116 is not limited to the display on the information terminal 2, and may output the group index by printing on paper using a printer, storing in a storage medium, or transmitting to the outside by communication. ..

[実施形態の効果]
本実施形態に係るデータ処理システムSは、顧客の購買傾向を示す指数を顧客のグループごとに統計化したグループ指数を出力する。そのため、データ処理システムSを利用するユーザは、グループ指数を参照することによって、顧客のグループごとに購買傾向を把握し、顧客の購買行動を効率的に分析できる。
[Effect of Embodiment]
The data processing system S according to the present embodiment outputs a group index in which an index indicating a customer's purchasing tendency is statistic for each customer group. Therefore, the user who uses the data processing system S can grasp the purchasing tendency for each group of customers by referring to the group index, and can efficiently analyze the purchasing behavior of the customers.

以上、本発明を実施の形態を用いて説明したが、本発明の技術的範囲は上記実施の形態に記載の範囲には限定されず、その要旨の範囲内で種々の変形及び変更が可能である。例えば、装置の分散・統合の具体的な実施の形態は、以上の実施の形態に限られず、その全部又は一部について、任意の単位で機能的又は物理的に分散・統合して構成することができる。また、複数の実施の形態の任意の組み合わせによって生じる新たな実施の形態も、本発明の実施の形態に含まれる。組み合わせによって生じる新たな実施の形態の効果は、もとの実施の形態の効果を合わせ持つ。 Although the present invention has been described above using the embodiments, the technical scope of the present invention is not limited to the scope described in the above embodiments, and various modifications and changes can be made within the scope of the gist thereof. is there. For example, the specific embodiment of the distribution / integration of the device is not limited to the above embodiment, and all or a part thereof may be functionally or physically distributed / integrated in any unit. Can be done. Also included in the embodiments of the present invention are new embodiments resulting from any combination of the plurality of embodiments. The effect of the new embodiment produced by the combination has the effect of the original embodiment together.

データ処理装置1のプロセッサは、図4、図5及び図9に示すデータ処理方法に含まれる各ステップ(工程)の主体となる。すなわち、データ処理装置1のプロセッサは、図4、図5及び図9に示すデータ処理方法を実行するためのプログラムを記憶部から読み出し、該プログラムを実行してデータ処理装置1の各部を制御することによって、図4、図5及び図9に示すデータ処理方法を実行する。図4、図5及び図9に示すデータ処理方法に含まれるステップは一部省略されてもよく、ステップ間の順番が変更されてもよく、複数のステップが並行して行われてもよい。 The processor of the data processing device 1 is the main body of each step included in the data processing methods shown in FIGS. 4, 5 and 9. That is, the processor of the data processing device 1 reads a program for executing the data processing methods shown in FIGS. 4, 5 and 9 from the storage unit, executes the program, and controls each part of the data processing device 1. By doing so, the data processing methods shown in FIGS. 4, 5 and 9 are executed. Some of the steps included in the data processing methods shown in FIGS. 4, 5 and 9 may be omitted, the order between the steps may be changed, and a plurality of steps may be performed in parallel.

S データ処理システム
1 データ処理装置
11 制御部
112 指数算出部
113 指数推定部
114 グループ生成部
115 グループ指数算出部
116 出力部
12 記憶部
121 購買データ記憶部
122 商品データ記憶部
123 顧客属性データ記憶部

S Data processing system 1 Data processing device 11 Control unit 112 Index calculation unit 113 Index estimation unit 114 Group generation unit 115 Group index calculation unit 116 Output unit 12 Storage unit 121 Purchase data storage unit 122 Product data storage unit 123 Customer attribute data storage unit

Claims (11)

顧客の属性を示す顧客属性データと、前記顧客による商品の購入に関する情報を示す購買データとを関連付けて取得するデータ取得部と、
前記データ取得部が取得した前記購買データに基づいて、前記顧客の購買傾向を示す指数を前記顧客ごとに算出する指数算出部と、
第1顧客に対して複数の前記指数のうち一部の指数が算出できない場合に、当該一部の指数以外の指数と、前記第1顧客と前記顧客属性データが類似している第2顧客に対して算出された前記指数に基づいて生成された、複数の前記指数の間の関係を示すモデルとを用いて当該一部の指数を推定する推定部と、
前記データ取得部が取得した前記顧客属性データを用いて前記顧客を分類することによって、それぞれ1人以上の前記顧客を含む一以上のグループを生成するグループ生成部と、
前記一以上のグループそれぞれに属する1人以上の前記顧客の前記指数に関する統計量を、前記一以上のグループそれぞれのグループ指数として、前記一以上のグループそれぞれと関連付けて出力する出力部と、
を有する、データ処理装置。
A data acquisition unit that acquires customer attribute data indicating customer attributes in association with purchase data indicating information regarding the purchase of products by the customer, and a data acquisition unit.
An index calculation unit that calculates an index indicating the purchasing tendency of the customer for each customer based on the purchase data acquired by the data acquisition unit.
When a part of the indexes cannot be calculated for the first customer, the index other than the part of the indexes and the second customer whose customer attribute data are similar to those of the first customer are selected. An estimation unit that estimates a part of the exponents using a model showing the relationship between the plurality of the exponents generated based on the exponents calculated on the index.
A group generation unit that generates one or more groups including one or more customers by classifying the customers using the customer attribute data acquired by the data acquisition unit.
An output unit that outputs statistics on the index of one or more customers belonging to each of the one or more groups as a group index of each of the one or more groups in association with each of the one or more groups.
A data processing device that has.
前記指数算出部は、前記データ取得部が取得した前記購買データに基づいて、異なる複数の前記指数を前記顧客ごとに算出し、
前記出力部は、複数の前記指数に関する複数の前記統計量を、異なる複数の前記グループ指数として出力する、請求項1に記載のデータ処理装置。
The index calculation unit calculates a plurality of different indexes for each customer based on the purchase data acquired by the data acquisition unit.
The data processing apparatus according to claim 1, wherein the output unit outputs a plurality of the statistics relating to the plurality of the indexes as a plurality of different group indexes.
前記グループ生成部は、異なる複数の前記指数の組み合わせが類似する1人以上の前記顧客を含む前記グループを生成する、請求項2に記載のデータ処理装置。 The data processing apparatus according to claim 2, wherein the group generation unit generates the group including one or more customers having a similar combination of a plurality of different indices. 前記グループ生成部は、前記顧客属性データが含む前記顧客の性別、年齢層及び居住地のうち少なくとも1つが共通する1人以上の前記顧客を含む前記グループを生成する、請求項1からのいずれか一項に記載のデータ処理装置。 Any of claims 1 to 3 , wherein the group generation unit generates the group including one or more customers who share at least one of the customer's gender, age group, and place of residence included in the customer attribute data. The data processing apparatus according to one item. 前記指数算出部は、店舗による前記商品の販売に関する情報を示す販売データと前記購買データとの間の関係に基づいて、前記指数を算出する、請求項1からのいずれか一項に記載のデータ処理装置。 The index calculation unit according to any one of claims 1 to 4 , wherein the index calculation unit calculates the index based on the relationship between the sales data indicating information on the sale of the product by the store and the purchase data. Data processing device. 前記指数算出部は、前記販売データが含む前記商品の発売日から前記購買データが含む前記商品の購入日までの経過時間を用いて、前記指数を算出する、請求項に記載のデータ処理装置。 The data processing device according to claim 5 , wherein the index calculation unit calculates the index using the elapsed time from the release date of the product included in the sales data to the purchase date of the product included in the purchase data. .. 前記指数算出部は、前記販売データが含む前記商品の通常価格と、前記購買データが含む前記商品の購入価格との間の差を用いて、前記指数を算出する、請求項又はに記載のデータ処理装置。 The index calculation unit calculates the index by using the difference between the normal price of the product included in the sales data and the purchase price of the product included in the purchase data, according to claim 5 or 6 . Data processing equipment. 前記指数算出部は、前記商品の中で前記販売データに基づいて特定の属性を有する特定属性商品を抽出し、前記購買データが含む前記特定属性商品の購入金額を用いて、前記指数を算出する、請求項からのいずれか一項に記載のデータ処理装置。 The index calculation unit extracts a specific attribute product having a specific attribute from the product based on the sales data, and calculates the index using the purchase price of the specific attribute product included in the purchase data. , The data processing apparatus according to any one of claims 5 to 7. 前記指数算出部は、予め設定された基準日と、前記購買データが含む前記商品の購入日との間の関係に基づいて、前記指数を算出する、請求項1からのいずれか一項に記載のデータ処理装置。 The index calculation unit calculates the index based on the relationship between the preset reference date and the purchase date of the product included in the purchase data, according to any one of claims 1 to 8. The data processing device described. 前記出力部は、前記グループ指数と、前記グループ指数とは異なる前記グループに関する値との間の関係を表す2次元の平面上に、前記グループを表す、請求項1からのいずれか一項に記載のデータ処理装置。 The output unit corresponds to any one of claims 1 to 9 representing the group on a two-dimensional plane representing the relationship between the group index and a value related to the group different from the group index. The data processing device described. プロセッサが実行する、
顧客の属性を示す顧客属性データと、前記顧客による商品の購入に関する情報を示す購買データとを関連付けて記憶する記憶部から、前記顧客属性データ及び前記購買データを取得するステップと、
前記取得するステップが取得した前記購買データに基づいて、前記顧客の購買傾向を示す指数を前記顧客ごとに算出するステップと、
第1顧客に対して複数の前記指数のうち一部の指数が算出できない場合に、当該一部の指数以外の指数と、前記第1顧客と前記顧客属性データが類似している第2顧客に対して算出された前記指数に基づいて生成された、複数の前記指数の間の関係を示すモデルとを用いて当該一部の指数を推定するステップと、
前記取得するステップが取得した前記顧客属性データを用いて前記顧客を分類することによって、それぞれ1人以上の前記顧客を含む一以上のグループを生成するステップと、
前記一以上のグループそれぞれに属する1人以上の前記顧客の前記指数に関する統計量を、前記一以上のグループそれぞれのグループ指数として、前記一以上のグループそれぞれと関連付けて出力するステップと、
を有する、データ処理方法。
The processor runs,
A step of acquiring the customer attribute data and the purchase data from a storage unit that stores the customer attribute data indicating the customer attributes and the purchase data indicating the information regarding the purchase of the product by the customer in association with each other.
Based on the purchase data acquired by the acquisition step, an index indicating the purchasing tendency of the customer is calculated for each customer, and
When a part of the indexes cannot be calculated for the first customer, the index other than the part of the indexes and the second customer whose customer attribute data are similar to those of the first customer are selected. A step of estimating a part of the exponents using a model showing the relationship between the plurality of the exponents generated based on the exponents calculated on the index.
A step of generating one or more groups including one or more customers by classifying the customers using the customer attribute data acquired by the acquisition step.
A step of outputting statistics on the index of one or more customers belonging to each of the one or more groups as a group index of each of the one or more groups in association with each of the one or more groups.
A data processing method that has.
JP2019058494A 2019-03-26 2019-03-26 Data processing device and data processing method Active JP6840446B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2019058494A JP6840446B2 (en) 2019-03-26 2019-03-26 Data processing device and data processing method

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2019058494A JP6840446B2 (en) 2019-03-26 2019-03-26 Data processing device and data processing method

Publications (2)

Publication Number Publication Date
JP2020160710A JP2020160710A (en) 2020-10-01
JP6840446B2 true JP6840446B2 (en) 2021-03-10

Family

ID=72643421

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2019058494A Active JP6840446B2 (en) 2019-03-26 2019-03-26 Data processing device and data processing method

Country Status (1)

Country Link
JP (1) JP6840446B2 (en)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2022239181A1 (en) * 2021-05-13 2022-11-17 日本電気株式会社 Customer classification device, customer classification system, customer classification method, and recording medium storing customer classification program
KR102537900B1 (en) * 2022-02-23 2023-05-31 현대카드 주식회사 Apparatus, method and recording medium storing commands for generating tags that indicate user characteristics
JP7300789B1 (en) 2023-03-09 2023-06-30 株式会社フェズ Program, method, and information processing device

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH09153094A (en) * 1995-12-01 1997-06-10 Hitachi Ltd Method for analyzing sale promotion effect and system for its implementation
JP2001216369A (en) * 2000-01-31 2001-08-10 Sony Corp System and method for article purchase data processing
JP2002342360A (en) * 2001-05-18 2002-11-29 Sharp Corp Device, method and computer program for providing information and recording medium with the program recorded thereon
JP5831204B2 (en) * 2011-12-21 2015-12-09 大日本印刷株式会社 Information providing system, information providing method, and program
JP6181360B2 (en) * 2012-08-30 2017-08-16 アクセンチュア グローバル サービシズ リミテッド Marketing device, marketing method, program, and recording medium
JP2015146126A (en) * 2014-02-03 2015-08-13 富士通株式会社 Customer analyzing program, customer analyzing method and customer analyzer

Also Published As

Publication number Publication date
JP2020160710A (en) 2020-10-01

Similar Documents

Publication Publication Date Title
CN109284413A (en) Method of Commodity Recommendation, device, equipment and storage medium based on recognition of face
JP6840446B2 (en) Data processing device and data processing method
US20140156449A1 (en) Method and apparatus for item recommendation
CN108805598B (en) Similarity information determination method, server and computer-readable storage medium
US20160217509A1 (en) Apparatus and method for management of electronic receipts and evaluation of the fair market value of goods based on free-form descriptions of goods and shoppers buying habits
US20140289006A1 (en) Method and System For Social Media Sales
JP6435017B1 (en) Receipt analysis system, method, and program for project using receipt
US20120330807A1 (en) Systems and methods for consumer price index determination using panel-based and point-of-sale market research data
US20220180379A1 (en) Transaction-based information processing system, method, and article
JP2021056643A (en) Information processor, information processing method and information processing system
KR20180059167A (en) Combined Qualitative and Quantitative Marketing Platform method and apparatus thereof
CN110807691B (en) Cross-commodity-class commodity recommendation method and device
CN111429214A (en) Transaction data-based buyer and seller matching method and device
CN114185954A (en) Member management method, member management platform, member management system and storage medium
CN106919609B (en) Product information pushing method and device
CN110781399A (en) Cross-platform information pushing method and device
CN116127184A (en) Product recommendation method and device, nonvolatile storage medium and electronic equipment
CN114187029A (en) Method and system for verifying commodity price parameters
WO2017168487A1 (en) Customer service evaluation assistance system and customer service evaluation assistance method
CN113781171A (en) Information pushing method, device, equipment and storage medium
CN109272373B (en) Brand recommendation method based on computer
JP6968355B1 (en) Information processing equipment, information processing methods and programs
JP7097031B1 (en) Salesperson evaluation device, salesperson evaluation method and salesperson evaluation program
JP7458879B2 (en) Information processing device, information processing method, and information processing program
US20220108373A1 (en) Information processing apparatus and non-transitory computer readable medium

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20190326

A80 Written request to apply exceptions to lack of novelty of invention

Free format text: JAPANESE INTERMEDIATE CODE: A80

Effective date: 20190412

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20200721

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20200910

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20210216

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20210216

R150 Certificate of patent or registration of utility model

Ref document number: 6840446

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150